Text
                    El ГТ] FI ГГ1 Ffl ГЗ НАРОДНЫЙ УНИВЕРСИТЕТ • 1985
Ы ULl LaJ UlI Ltl L3 естественнонаучный факультет
ЧИСЛО
и мысль
выпуск

Народный университет Естественнонаучный факультет Издается с 1961 года Д. Б. ЮДИН, доктор технических наук А, Д. ЮДИН, кандидат экономических наук число и мысль выпуск 8 (Математики измеряют сложность) ИЗДАТЕЛЬСТВО «ЗНАНИЕ» Москва 1985
ББК 65.9(2)23 Ю16 ЮДИН Давид Борисович — доктор технических наук» профес- сор МГУ имени Ломоносова, автор 15 монографий и многих работ по математическим методам планирования, управления и проектирования, лауреат Международной премии по дискретной математике. ЮДИН Александр Давидович — кандидат экономических наук, старший научный сотрудник ВНИИКС, автор ряда работ по методам обработки статистической информации. - Рецензент: доктор философских наук Б. В. Бирюков. ' * Юдин Д. Б., Юдин А. Д. Ю16 Число и мысль. Вып. 8. (Математики измеряют сложность).— М.: .Знание, 1985.— 192 с. (Нар. ун-т. Естественнонаучный фак.) 55 к. 40000 экз. В книге рассматриваются проблемы и методы применения математи- ки ® планировании, управлении, проектировании с позиций теории, сложности. Книга может служить пособием для слушателей народных универ- ситетов естественнонаучных знаний, а также будет полезна веем, кто интересуется современными проблемами естествознания. 0604020100—065 Ю 073(02)—85 ,4—85 ББК 65.9 (2) 23 ззсз Издательство «Звание», 1985 г.
ПРЕДИСЛОВИЕ В послевоенные годы в различных областях науки — в автоматическом регулировании, математической эконо- мике, биологии и ряде инженерных дисциплин — возникла проблема исследования феномена сложности. Проектиро- вание современной.тех ники, планирование на разных уров- нях, управление системами, объяснений и прогнозирование эволюционных процессов сталкиваются с трудностями одной и той же природы. Во всех этих целенаправленных операциях требуется установить принципиальную разре- шимость появляющихся здесь задач, а для алгоритмиче- ски разрешимых задач — выяснить, насколько они физи- чески осуществимы. Другими словами, необходимо оценить минимальные объемы тех или иных ресурсов, требуемых для реализации решения. Анализ этих проблей и состав- ляет сущность формирующейся в последние десятилетия дисциплины — теории сложности. Теория сложности стоит на стыке философии, логики и различных разделов естественных, технических и общест- венных наук. В разработке категории сложности, в изуче- нии свойств компонент сложности и в совершенствовании методов оценки составляющих сложности заинтересованы специалисты самых различных дисциплин. И с ростом масштабов производства и уровней управления, с расши- рением горизонтов исследований эта заинтересованность все возрастает. Трудно переоценить значение своевремен- ного ответа на вопрос, в какой мере реально достижение той или иной цели и какие для этого необходимы ресурсы. Советские ученые, и в первую очередь академик А. Н. Колмогоров и его ученики, первыми проложили пути к формированию категории сложности, к исследованию ее свойств и перспектив ее приложений. В последующем стало ясно, что логическое понятие алгоритмической сложно- сти является важной, но не единственной характеристикой категории сложности. Появились и другие направления исследований, связанные с вычислительной сложностью, информационной сложностью, энергетической сложно- стью, сложностью схем, сложностью обработки информации 3
и др. Различные компоненты сложности оценивают разные аспекты трудоемкости и ресурсоемкое™ достижения тех или иных целей. Среди работ по различным составляющим сложности фигурируют и работы авторов настоящей книги. . Несмотря на интенсивные исследования в этой области, теория сложности еще не вступила в пору зрелости, когда ее результаты и приложения стали бы доступными для мно- гих заинтересованных в них специалистов. Тем не менее влияние, которое могут оказать уже установленные поло- жения теории сложности на методологию постановки и под- ходы к решению современных крупномасштабных задач, требует ознакомления широкого круга специалистов — экономистов и философов, инженеров и биологов — с сов- ременным состоянием теории и с перспективами ее разви- тия и применения. Предлагаемая вниманию читателей книга представляет собой достаточно популярное изложение этой отнюдь не эле- ментарной проблематики, написанное специалистами для неспециалистов. Здесь охвачены различные разделы теории сложности и обсуждается достаточно широкий диапазон ее возможных приложений. Авторы, как они сами об этом заявляют, вынуждены были в угоду доступности изложения несколько поступиться формальной строгостью формули- ровок. Это, однако, никоим образом не повлияло на позна- вательную ценность авторской аргументации. Следует все же отметить, что не все приведенные в книге истолкования перспектив теории сложности могут быть безоговорочно вос- приняты критически настроенным читателем. Но ведь по- становка острых вопросов и выявление и обсуждение прав- доподобных гипотез стимулируют целеустремленное дви- жение к истине. Уместно вспомнить замечание В. Райгли о том, что из двух искателей истины, придерживающихся одного и того же мнения, по крайней мере один лишний. Представляется, что настоящая книга дает основание для цолезных дискуссий по одной из кардинальных проблем современной науки. Член-корреспондент АН СССР fl. 3. Цыпкин ~
что такое категория «сложность» И ЗАЧЕМ ОНА НУЖНА? Интуитивные определения сложности В толковом словаре Владимира Даля (т. IV, с. 216) приведено следующее определение термина «сложность»: «Сложность — свойство и состояние «сложенного»; сово- купность, весь состав, общность составного». Далее следуют пояснительные примеры. «Сложность машины затрудняет приложение к делу. По сложности дела этого следователи спутали его». Вряд ли можно определение и пояснения Даля принять за образец формальной четкости и строгости. Однако в раз- говорной речи и в художественной литературе, при обсуж- дении повседневных дел и многих производственных во- просов использование термина «сложность», как правило, не вызывает недоразумений. В зависимости от контекста, в котором фигурирует термин «сложный», его истолковыва- ют как «большой», «трудоемкий», «запутанный», «непред- сказуемый» и т. д. Большее внимание определению понятия «сложность» должно быть, естественно, уделено в науке, технике, эко- номике. Нетрудно представить себе ситуации, в которых сложность систем, явлений, процессов следует измерять и сравнивать. Тем не менее в работах, в которых подчерки- вается необходимость и важность категории сложности в задачах управления, проектирования и организации, обыч- но не уточняется и не формализуется это понятие. Молча- - ' 5
ливо предполагается, что специалисты, занимающиеся од- ним и тем же кругом проблем, одинаково понимают и ис- толковывают этот термин. Так, инженеры на эвристическом уровне подразумевают под сложной системой систему из большого числа взаимосвязанных элементов, поведение которой трудно предсказуемо. Специалисты по теории принятия решений называют сложной систему, цели пове- дения которой противоречивы и не всегда поддаются фор- мализации. Математики-прикладники под сложной про- блемой понимают труднорешаемую задачу, анализ которой связан с чрезмерно большим количеством вычислений. Био- логи связывают понятие «сложность организма» со сте- пенью его организации. До последних лет отсутствие четких определений понятий «сложная система», «сложная задача», «сложный процесс» обычно не мешало их распознаванию и исследованию. Но уже сейчас можно указать математические и прикладные проблемы, для постановки и решения которых недостаточ- но смутных эвристических представлений. Все настоятель- ней ощущается необходимость в четком определении кате- гории «сложность» и уточнении различных ее аспектов при- менительно к разным системам и задачам. Подчеркнем с самого начала, что сложность систол, явлений, прЬцессов вряд ли может быть охарактеризована единым показателем. Сложность—категория многогранная. В различных проблемах проявляются различные состав- ляющие сложности. Системы или процессы, сложные в одних отношениях и в определенных ситуациях, могут оказаться несложными в других отношениях и в другой обстановке. Целесообразно рассматривать статическую и динамическую сложность, сложность объекта и сложность функционирования, внутреннюю сложность системы и сложность управления ею. В зависимости от класса ис- следуемых систем (от их назначения и условий функцио- нирования) системы сравниваются и оцениваются по таким компонентам, как сложность описания (моделирования), алгоритмическая сложность, энергетическая сложность, информационная сложность и др. Обсуждаются и другие характеристики сложности, предназначенные для иссле- дования и оценки биологических, экономических и со- циальных систем. Эти работы относятся к наиболее труд- ным разделам теории сложности. Они еще недостаточно формализованы и по ним среди специалистов еще не до- стигнуто единого мнения. 6
В настоящей работе кратко излагаются результаты сов- ременной теории сложности, представляющие, с нашей точ- ки зрения, интерес для исследования закономерностей целеустремленных систем и целенаправленных процессов. Особое внимание уделяется аспектам теории сложности, важным для постановки и анализа задач принятия реше- ний, с которыми так или иначе связаны основные пробле- мы планирования, управления, проектирования и органи- зации, Естественно, что мы не можем претендовать на сколь-нибудь полное изложение основных результатов и перспектив этой новой интенсивно развивающейся дисцип- лины. Оговоримся с самого начала, что по необходимости мы будем пренебрегать формальной строгостью изложения в угоду доступности и отдадим предпочтение качественному обсуждению материала по сравнению с формальным ана- лизом. Сложность и неформальные проблемы Приведем неформальные высказывания некоторых вид- ных ученых о роли понятия «сложность» в познании зако- номерностей реального мира. Известные советские философы Б. В. Бирюков и В. С. Тю- хтин пишут: «С понятием о сложности и сложных систе- мах мы встречаемся фактически во всех — или почти во всех — науках; сложность — это общенаучное понятие, приближающееся по своему «статусу» к философской ка- тегории» [2, с. 2191. Это заключение отражает реальную динамику познавательного процесса последних десятиле- тий. Один из величайших математиков XX века Джон фон Нейман говорил, что теория сложности является «предпо- сылкой к пониманию процессов обучения и развития» и что «понятие сложности, несмотря на его prima facie ко- личественный характер, может в действительности выра- жать нечто качественное— иметь принципиальное зна- чение» [32, с. 92]. Специалист по прикладной математике Дж. Каста в мо- нографии из серии, основанной Международным институ- том прикладного системного анализа в Вене, приводит следующее определение одной из важных компонент слож- ности. «Сложность управляемых систем, по существу, яв- 7
льется мерой вычислительных возможностей, необходи- мых для.реализации заданного поведения. В идеале мате- матическая теория сложности должна достигнуть уровня, аналогичного уровню развития теории вероятностей. В то время как вероятность можно рассматривать как меру неопределенности в данной ситуации, сложность можно трактовать как меру понимания поведения системы» 118, с. 57—58]. Стаффорд Бир — бывший президент Британского об- щества по исследованию операций — называет сложность основным; свойством реального мира. Он говорит: «Слож- ность становится проблемой века, точно так же, как уме- ние обрабатывать природные материалы было проблемой жизни и смерти для наших праотцов» [1, с. 8]. Обилие ин- формации, порождаемое сложностью современной жизни, представляет собой разновидность загрязнения окружающей среды. Слова-паразиты, понятия-паразиты, бесчисленные, ни о чем не говорящие данные, ложные посылки, органи- зационные структуры, не соответствующие объективным условиям времени и места, обезоруживают человечество в борьбе со «сложностью мира». Основной способ преодо- ления сложности, по Биру,— создание и изменение ме- тасистемных^ управляющих механизмов. Отсюда задача теории сложности — разработка емких и экономных по- нятий, отражающих различные аспекты категории «слож- ность», облегчающих обмен информацией и побуждаю- щих к изменению образа мышления в соответствии с раз- витием объективной реальности. Математические задачи теории сложности В современной математической логике исследуются важные и трудные задачи, решение которых может иметь далеко идущие практические последствия. Это задачи, связанные с одной из наиболее интересных особенностей математического творчества — с доказательством невоз- можности определенных построений. Пожалуй, наиболее значительными результатами такого рода стали получен- ные в тридцатые годы А. Черчем, а затем в сороковые и пятидесятые годы А. А. Марковым, Э. Постом, П. С. Но- виковым и в 1969 г. Ю. В. Матиясевичем доказательства алгоритмической неразрешимости некоторых массовых про- блем (классов задач) математической логики и алгебры. 8
Позже было показано, что для некоторых достаточно общих алгоритмически неразрешийых массовых проблем отказ от решения относительно небольшой доли индивидуальных задач, входящих в массовую проблему, может сделать ее алгоритмически разрешимой. Таким образом, удалось су- щественно расширить класс массовых проблем, для кото- рых доказана алгоритмическая разрешимость. Однако «чи- стое» доказательство алгоритмической разрешимости про- блемы,. т. е. доказательство существования алгоритма, позволяющего решать все индивидуальные задачи класса, еще не достаточно для того, чтобы говорить о физической возможности реализации решения. Помимо алгоритмической неразрешимости, существует еще, если можно так выразиться, физическая неразреши- мость, т. е. невозможность решения, связанная не с от- сутствием разрешающего алгоритма, а с ограниченностью наших временных и материальных ресурсов. Минимальную величину времени, памяти, энергии и других ресурсов, гарантирующую решение требуемого качества любой зада- чи исследуемого класса (любой индивидуальной задачи рассматриваемой массовой проблемы), естественно при- нять за определение соответствующей компоненты слож- ности массовой проблемы. Аналогичные рассуждения поз- воляют получить умозрительные представления о состав- ляющих сложности различных систем. Эти величины характеризуют, в частности, степень физической реализуе- мости постижения закономерностей состояния и поведения системы. Пренебрежение к физической реализуемости решения алгоритмически разрешимых проблем отнюдь не способ- ствует взаимопониманию теоретиков и практиков. Многие логически безупречные построения не воспринимаются ин- женерами, экономистами и физиками в силу их предель- ной абстрактности. Абстракция потенциальной осущест- вимости, которая, по А. А. Маркову [29], состоит в отвле- чении от реальных границ наших конструктивных возмож- ностей, обусловленных ограниченностью нащрй жизни в пространстве и времени, приемлема для построения осно- ваний математики, но не приемлема для анализа практи- ческих задач. Существуют убедительные доводы в пользу того, что фи- зические процессы или материальные объекты не могут характеризоваться такими числами, как 10100 и более. Реалиста-прикладника не интересует различие между чис- 9
лами 10м* и 1О100!. За тем и другим числом ничего реаль- ного нет. Поэтому глубокие формальные исследования, которые связывают характеристики систем с числами по- добного порядка, не способствуют сокращению разрыва между теорией и практикой. Важная задача теории сложности — дополнить дока- зательства принципиальной реализуемости алгоритмов или систем оценкой их физической реализуемости — оценкой минимальных величин различных ресурсов, необходимых для этого. Сложность и прикладные проблемы 1. Роль теории сложности в прикладных проблемах, связанных с проектированием будущего, трудно переоце- нить. Между желаемым и реализуемым большая дистан- ция. Эта дистанция измеряется, грубо говоря, компонен- тами сложности, представляющими собой минимальные ресурсы, необходимые для достижения цели при наиболее экономном использовании ресурсов. Можно полагать, что уже полученные результаты теории сложности имеют большое методологическое значение и должны помочь выявлять различие между реальными и ложными ориен- тирами. Проблемы сложности приобрели особую актуальность в наш век, когда результаты рукотворной деятельности человека все больше влияют на будущее человечества. Миллионы лет биологической эволюции, обкатанной на миллиардах организмов, отшлифовали и упростили ме- ханизмы вваимодействия элементов живой материи. Эво- люция обеспечила сложнейшие биологические системы простейшими принципами управления, содействующими развитию и совершенствованию жизни. Украинский фи- лософ XVIII века Г. С. Сковорода (1722—1792), пантеист по своим философским взглядам *, выразил эту мысль сле- дующим образом: «Слава тебе, Господи, что ты создал все нужное нетрудным, а все трудное—ненужным». «Трудное — нетрудное» Сковороды — это, конечно, то, что мы в этой книге называем «сложным», «менее сложным», «простым» и т. п. . .1 Пантеизм — философская концепция, отождествляющая природу и бога. Пантеистические представления нередко служили путем к мате- риализму. 10
В век научно-технической революции ситуация суще- ственно меняется. Возможности управления все больше отстают от бурного роста сложности общества, экономики, производства, техники. Слишком мало времени прошло после внедрения современных достижений науки и тех- ники, чтобы уточнились цели (отдаленные и ближайшие) и упростились механизмы их достижения. Наука, сокраща- ющая опыт быстротекущей жизни, играет в известном смы- сле роль катализатора эволюции. Новые научные поня- тия и категории призваны упростить восприятие сложного мира, отделить постоянно действующие факторы от пре- ходящих, прогрессивные направления — от бесперспек- тивных, достижимое — от нереального. Представляется, что в такого рода исследованиях ведущую роль будет иг- рать теория сложности. 2. Приведем несколько примеров. Интуитивно ясно, что централизованное планирование работы сложной системы обладает преимуществами перед автономным. В планировании из единого центра привле- кает возможность исходить из интересов целого. При та- кого рода планировании можно маневрировать ресурсами и повысить, таким образом, эффективность функциони- рования системы. Но всегда ли реализуемы достоинства централизации, все ли ее принципиальные преимущества достижимы? Оказывается, нет. Все зависит от размернос- ти системы. Во многих случаях, оптимизация (в любом зара- нее заданном смысле) плана при реальном количестве фак- торов, подлежащем учету,—неподъемная задача при любом предвидимом состоянии вычислительной техники. Даже составление сбалансированного (не обязательно оптималь- ного, пусть только допустимого) плана, определяемого сотнями тысяч и более номенклатур,— задача колоссаль- ной вычислительной сложности. Практика планирования давно пришла к тому, что сохранение принципов цент- рализации требует, по крайней мере, агрегирования эле- ментов системы, создания иерархических структур, охва- тывающих относительно самостоятельные подсистемы уп- равления по территориальному или отраслевому принци- пу. Однако организация процедур, упрощающих планиро- вание и стимулирующих выполнение планов, не всегда основана на достаточно серьезной методической (логиче- ской и экономической) базе и всестороннем анализе и обобщении опыта. Нередко, к сожалению, стремление сок- ратить трудоемкость планирования приводит к изданию Д1
всякого рода инструкций, указаний, директив, основанных на эвристических, подчас субъективных и не всегда убе- дительных соображенйях. В итоге эффект от принципи- альных преимуществ централизованного управления ре- сурсами может в значительной мере смазываться. Из зарубежной практики известны случаи, когда слож- ность управления заставляла крупные фирмы делиться на филиалы и допускать конкуренцию между дочерними предприятиями. Правление фирмы, объединяющее филиалы, регулировало лишь ограниченное число факторов техниче- ской и коммерческой политики. Разумеется, конкуренция чужда нашему обществу. Отработанные в нашей стране механизмы повышения эф- фективности хозяйственной деятельности предполагают.не- антагонистическое соревнование предприятий, трудовых коллективов, рядовых тружеников и лиц, ответственных за принимаемые решения. Намеченные в ходе экономиче- ского строительства различные- формы хозрасчета, пред- ставляющие определенную хозяйственную самостоятель- ность промышленным и сельскохозяйственным объедине- ниям при сохранении основных рычагов управления в цент- ре, безусловно, упрощают процедуру планирования и по- вышают качество выполнения планов. Выбор эффективных и реализуемых хозяйственных механизмов и отработка их структуры требуют исследования и сопоставления различных компонент их сложности. Представляется, что логические и вычислительные основы рациональной орга- низации централизованного планирования и выбора меха- низмов управления хозяйством — одно из важных, хотя и весьма трудоемких приложений теории сложности. 3. В качестве второго примера рассмотрим задачу ав- томатизации проектирования радиоэлектронной аппарату- ры. Это одна из наиболее актуальных задач современной техники, от качества решения которой кардинальным обра- зом; зависят возможности радиоэлектронной промышленно- сти и, стало быть, уровень автоматизации ведущих отрас- лей производства. Одна из типичных задач в этой области формулируется следующим образом. На небольшой площади — на плате или на поверхности кристалла (размером меньше чем 5 X 5 мм) — требуется разместить десятки, сотни, а то и тысячи и десятки ты- сяч (а может быть, и больше) элементов и соединить их связями в соответствии с заданной схемой. В формальных 12
терминах это обычно задачи целочисленного программи- рования с огромным числом переменных и ограничений. Оценка трудоемкости решения таких задач — одна из важных проблем теории вычислительной сложности. Сов- ременное состояние теории приводит к выводу, что для схем достаточно широких классов нет и вряд ли будут раз- работаны методы точного или приближенного (с гаран- тированной точностью) решения задач размещения и трас- сировки за приемлемое время. Где же выход? Один из подходов к проблеме автоматизации разработ- ки радиоэлектронной аппаратуры заключается в организа- ции интерактивного (диалогового — человеко-машинного) проектирования, при котором могут быть эффективно ис- пользованы вычислительная мощь машины и опыт и ин- туиция проектанта. Задача упрощается, если удается, кроме того, выделить естественные содержательные приз- наки схем, позволяющие разделить класс схем на узкие подклассы. Чем уже класс схем, тем больше оснований ожидать создания эффективных методов проектирования, учитывающих специфику класса. Постановки обеих задач — рационального разделения функций между оператором й машиной и классификация схем — и подходы к их реше- нию непосредственно связаны со сложностными оценками' Здесь существенную роль играют оценки сложности опи- сания схем, сложности решения соответствующих экстре- мальных задач, сложности вычислений. Можно, например, ожидать, что поддаются анализу и проектированию в при- емлемые сроки БИСы и СБИСы (большие интегральные схемы и сверхбольшие интегральные схемы), которые, несмотря на огромное число элементов, имеют относитель- но невысокую сложность описания, т. е. обладают в не- котором смысле регулярной структурой. Такие схемы могут быть закодированы так, что их описание задается отно- сительно простой программой. Практика создания БИСов и идет по этому пути. Так называемые матричные БИСы представляют собой иерархические блочные структуры, в которых повторяемость и стандартизация существенно снижают трудоемкость проектирования. Дальнейшее уве- личение числа элементов в СБИСах, по-видимому, приве- дет к увеличению числа ступеней иерархии. Те же слож- ностные соображения показывают, что регулярность струк- туры БИСов упрощает и другие крайне трудоемкие задачи автоматизации проектирования — диагностику и контроль работоспособности сложных схем. ДЗ
Представляется, что по мере усложнения радиоэлектрон- ной аппаратуры роль различных разделов теории сложно- сти в выявлении рациональных методов проектирования будет все возрастать. Возможно ли путешествие по телеграфу? В заключение вводной главы приведем пример, иллю- стрирующий различие между потенциальной осущест- вимостью и физической реализуемостью процесса. Мы рассчитываем на чувство юмора читателя и надеемся, что он оценит условность примера и не предъявит нам боль- ше претензий, чал автору фабулы примера — основопо- ложнику кибернетики Норберту Винеру. В книге «Кибернетика и общество» Н. Винер пишет: «Мы рассматриваем два типа связи, а именно: материальные перевозки и передачу лишь одной информации, но в настоя- щее время человек может переезжать с одного места на дру- гое только посредством первого типа связи, а не в качестве сигнала. Однако даже сейчас передача сигналов помогает распространять человеческие чувства и человеческие спо- собности сводного конца света на другой». И далее: «различие между материальной транспортировкой и тран- спортировкой сигналов теоретически никак не является постоянным и непереходимым» [7, с. 106]. Игнорируя ка- тегорию «сложность», Н. Винер далее говорит о «путе- шествии по телеграфу» как об идее, «весьма близкой к истине», реализации которой мешают лишь «технические трудности». Оценка минимальных ресурсов, необходимых для теле- графирования человека, свидетельствует, однако, что дело здесь отнюдь не только в «технических трудностях». Приведем некоторые правдоподобные рассуждения на эту тему. Представляются возможными два подхода к реализации идеи путешествия по телеграфу, например, через Атланти- ческий океан. Строительный материал (элементарные ча- стицы, атомы, молекулы), из которого составлен орга- низм человека, имеется и по ту и по другую сторону океана. Потенциальные путешественники различаются взаимным расположением и взаимосвязями элементарных «кирпи- чиков» в их организме. Пересечь океан можно, в частности, - если передать по телеграфу, информацию о «структуре» U
путешественника — информацию О: взаимном, расположе- нии и о взаимосвязях «кирпичиков», составляющих его ор- ганизм. Так, архитектор в Европе может по телеграфу руководить постройкой здания в Америке. «Физическая транспортировка архитектора и его документов может быть весьма эффективно заменена передачей сигналов, что не влечет за собой передвижения ни одной крупицы материи с одного конца линии на другой» [7, с. 106]. Таким образом, первый подход к реализации идеи пу- тешествия по телеграфу связан с развертыванием челове- ческого организма — с последовательным прохождением луча передатчика через все частицы, составляющие орга- низм путешественника,— и с восстановлением организму (в соответствии с переданной по телеграфу информацией) из набора запасенных у приемника элементарных «кир- пичиков». Реализация такого подхода к путешествию по телегра- фу требует преодоления по крайней мере двух препятствий. Первое из них указано самим Н. Винером; «Сохранение устойчивости организма, в то время как часть его медлен- но разрушается в целях пересоздания ее на другом мате- риале где-нибудь в другом месте, повлечет за собой пони- жение степени деятельности организма, что в большинстве случаев разрушало бы жизнь в ткани» [7, с. Ш]. Правда, Н. Винер тут же добавляет, что проблема сохранения жиз- ни организма во время его радикальной перестройки, необходимой для телеграфной передачи строения челове- ка, связана, по-видимому, лишь с техническими трудно- стями — реализуется же гораздо более радикальная пе- рестройка организма бабочки на стадии куколки. Второе препятствие для путешествия по телеграфу — это ограниченная пропускная способность телеграфного канала и огромный объем-информации, подлежащий пере- даче. Г. Дж. Бремерман [3] оценивает снизу количество информации, необходимое для передачи структуры чело- веческого мозга. Это величина порядка 1012—1018 бит. Ясно, что количество информации, определяемое разверткой все- го человеческого организма, а не только мозга,— сущест- венно большая (по порядку) величина. С другой сторо- ны, пропускная способность телеграфного канала равна 50-4-200 бит/с. Это значит, что объем информации, отвечаю- щий развертке человеческого организма, столь велик, что передача его по телеграфу займет неизмеримо больше вре- мени, чем путешествие морем или тем более по воздуху. 16
Больше того, это время (порядка' 1000 лет) существенно превышает продолжительность человеческой жизни. Таким образом, рассуждения, оставляющие в стороне понятие «сложность», игнорируют и различие между потенциально осуществимым, и физически реализуемым. Второй подход к путешествию по телеграфу связан с пе- редачей неизмеримо меньшего объема информации. Речь идет о передаче генетической информации — хромосомной организации индивида, определяющей его генотип. Одна- ко таким образом через океан переправится информация, недостаточная даже для восстановления зиготы. Для фи- зической реализации путешествия по телеграфу нужно еще на приемном пункте получить по информации о гено- типе информацию об организме. По закону Геккеля фи- логенез повторяется в онтогенезе, т. е. каждый эмбрион повторяет до некоторой .степени эволюцию, которая приве- ла к его появлению. Генетический контроль не может ох- ватить все связи между отдельными нейронами мозга. Большинство связей должно быть в какой-то степени слу- чайными или построенными по некоторому фиксированйбму образцу. Уже указывалось, что для детального уста- новления структуры человеческого мозга требуется как минимум 1(F* бит информации. С другой стороны, при изу- чении дрозофилы установлено, что максимальная оценка информации, переносимой генами, равна 104—105, бит. Таким образом, для идентификации личности (для восста- новления фенотипа) необходим дополнительный источник информации о связях между нейронами, установившихся в процессе развития и обучения организма. Это означает, что для восстановления фенотипа следует передать и* вос- произвести информацию о среде и последовательности ситуаций, в которых развивался и обучался «путешествен- ник». По-видимому, время, потребное для этого, сущест- венно превышает продолжительность человеческой жизни. Путешествие по телеграфу можно связывать, таким обра- зом, только с путешествием в будущее. К аналогичному выводу приводят и оценки других компонент сложности путешествия по телеграфу. 16
АЛГОРИТМИЧЕСКАЯ СЛОЖНОСТЬ Что такое алгоритм?. 1. Понятию «алгоритм» уже более тысячи лет. В течение' длительного времени это понятие использовали только ма- тематики и истолковывали как последовательность правил' решения задач того или иного класса или правил вычис- ления функции, заданной тем иди иным образом. Такое ин- туитивное толкование алгоритма обычно устраивало поль- зователей. Наличие алгоритма для задач некоторого класса отождествляется с возможностью «механического» решения любой задачи класса (если, конечно, решение существует) и установления, ее неразрешимости, если задача не имеет решения. Алгоритм вычисления функции позволяет «автоматиче- ски» находить значения функции для любого набора аргу- ментов, на котором она определена. Алгоритм для решения задач класса или вычисления значений функций избавляет пользователя от необходимости в изобретательности или творческом подходе при решении каждой конкретной зада- чи класса или при вычислении функции в любой точке области ее определения. . = , Многие великие математики прошлого верили в то, что для любого класса задач (и не только математических) можно (по крайней мере в принципе) создать алгоритм. Другими словами, предполагалось, что для каждого класса задач можно придумать автоматически работающую ма- шину, которая в соответствии с алгоритмом решит любую задачу класса. . ! Почти тысячу лет не возникало необходимости в уточне- нии и формализации понятия «алгоритм». Среди ученых царила уверенность в том, что любая математическая за- дача может быть алгоритмически решена. Вера в возмож- ность создания алгоритмических методов решения различ- ных классов задач перекочевала из математики в другие разделы естествознания. Однако в тридцатые и последую- щие годы нашего века интуитивная уверенность в неог- раниченных возможностях алгоритмических методов была поколеблена. В 1931 г. знаменитый австрийский математик Курт Гедель доказал алгоритмическую неразрешимость неко- торой известной математической проблемы с помощью общих алгоритмов определенным образом формализован- ного класса. Необходимо было выяснить, совпадают ли 17
эти, алгоритмы со всеми мыслимыми алгоритмами. А для этого следовало уточнить и формализовать интуитивное определение алгоритма. Актуальность задачи возросла в связи с появлением и развитием вычислительной техники и автоматизацией различных процессов. Сейчас понятие «алгоритм» интересует не только фор- малиста-логика, но и вычислителя, составляющего про- грамму для ЭВМ, химика, описывающего течение реакции, генетика, изучающего процесс развития организма, эко- номиста, планирующего хозяйственную деятельность, диспетчера, управляющего движением, лингвиста, интере- сующегося проблемами перевода, и т. д. Существует много путей достижения одного и того же результата, и можно многими способами вмешиваться в управляемый процесс и направлять его течение. Возникает естественное желание сформировать в каком-то смысле лучшие, наиболее эконом- ные инструкции по организаций целенаправленного про- цесса. Для этого необходимо перейти от интуитивного понятия алгоритма к четкому формальному. 2. После работы К. Геделя был предложен ряд уточне- ний понятия «алгоритм». Уточнения формулировались в различных терминах применительно к различным доступ- ным воздействию объектам (к так называемым конструк- тивным объектам). Конструктивные объекты можно пере- нумеровать и, таким образом, всегда можно считать члены натурального ряда объектами, которыми оперирует ал- горитм. Это позволяет сводить любой, алгоритм к процес- су детерминированных вычислений и сопоставлять между собой различные определения и уточнения понятия «ал- горитм». Все известные формализации и уточнения алгоритма, независимо от того, сформулированы ли они в терминах функций или^устройств для вычисления функции, исходят из следующей модели детерминированных вычислений. Вычислительный процесс может быть представлен в виде последовательных итераций, в которых на каждом шаге используются операции из некоторого конечного набора раз навсегда заданных операций. Такой вычислительный процесс является алгоритмическим, если функции, вы- численные детерминированным итеративным образом с помощью соответствующих элементарных шагов, исчер- пывают функции, допускающие вычисление любым дру- гим вычислительным процессом, который интуитивно яв- ляется алгоритмическим. - 18
Различные конкретизации- определения алгоритма в терминах машин или итеративных процессов связаны с име- нами А. М. Тьюринга, & Л. Поста, А. Черча, Дж. фон Ней- мана, А. А. Маркова, С. К. Клини, А. Н. Колмогорова, В. А. Успенского, Р. Петер. Все известные формальные оп- ределения алгоритма эквивалентны между собой. В настоя- щее время существует убеждение, что все упомянутые определения алгоритма адекватно отражают смысл, интуи- тивно вкладываемый в термин «алгоритм». Это так называе- мый тезис Черча, который отождествляет интуитивное по- нятие «алгоритм» с любым из эквивалентных между собой точных определений. Тезис Черча представляет собой естественнонаучную ги- потезу. Он не может быть формально доказан, поскольку не существует точного определения понятия «алгоритм» в ин- туитивном смысле. Однако тезис Черча выдержал все про- верки на соответствие интуитивным представлениям об ал- горитме. Можно сказать, что тезис Черча — это экспери- ментальный факт, подтверждающийся по крайней мере сле- дующими свидетельствами: а) все известные в теории и на практике алгоритмы могут быть «промоделированы» любым из алгоритмов в точном определении; б) указаны подходящие нумерации входов и выходов схем переработки информации, соответствующих известным определениям алгоритмов, при которых все схемы обработ- ки информации приводят к одному и тому же результату; в) в литературе имеется огромный набор описаний раз- личных вычислительных процессов в терминах различных определений алгоритма, в частности в терминах частично- рекурсивных функций. Ниже будут приведены две формализации понятия «ал- горитм» — в терминах функций (частично-рекурсивных функций) и в терминах вычислительного устройства (ма- шины Тьюринга). 9 Уточнение и конкретизация понятия «алгоритм» поз- волят далее четко поставить вопрос о сложности алгоритма. Частично-рекурсивные функции 1. Опишем вычислительный процесс, который может быть принят в качестве формального определения алгорит- ма. Процесс итеративным образом использует набор из трех базовых функций и трех элементарных операций. 19
Введем предварительно несколько Определений. Пусть X й Y два произвольных множества. 'Отобра- жение . f-.X—^Y называется частичной функцией, если область определения / Df s X. Понятие частичной функ- ции вводится для того, чтобы подчеркнуть, что далеко не всякий осмысленный вычислительный процесс приво- дит в соответствие каждому значению аргумента х£Х значение функции f(x)£Y. На множестве X\Df, если оно не пусто, значение f не определено; В дальнейшем мы будем рассматривать частичные фун- кций из X = Z? в Y = Z", vjifi Z+ = {1, 2... ^—множест- во натуральных чисел, а 2%—-т—кратное декартово про- изведение Z+ на само себя—множество^упорядоченных наборов целых положительных чисел (х1( ..., хт), Xj£Z+, 1 = 1, В теории алгоритмов члены натурального ряда часто представляют в двоичном коде—словами в алфавите {0, 1}, т. ё. конечными последовательностями из нулей и единиц. Иногда нам будет удобно обращаться к двоичному кодированию входа и выхода вычислительного процесса. Дальше мы будем вынуждены несколько поступиться строгостью изложения и пользоваться термином «програм- ма», понимая, под ним программу для универсальной вы- числительной машины, построенную без учета ограничений на время счета и потребную память. Будем называть частичную функцию / из Z1? в Z% вычислимой, если существует программа, которая за ко- нечное время сопоставляет входу x^Z1? выход f(x)^ Zl в случае, когда x£Df, и не останавливается (или останав- ливается при для всякого x£Z™\Df. В против- ном случае частичная функция f называется невычислимой. В качестве частичных функций можно, в частности, рас- сматривать классы задач. Значения аргументов такой функ- ции— условия индивидуальных задач класса. Соответ- ствующие значения функции — решения этих задач. ~ Вычислимые функции, как видно из их определения, как раз и являются теми функциями, для которых могут быть построены вычислительные процессы (программы, алгоритмы), позволяющие «автоматически» за конечное вре- мя установить значение функции в любой точке, в которой она определена, или сообщить о том, что это невозможно сделать. На первый взгляд может показаться, что все мыслимые частичные функции вычислимы. Действительно, постро- 20
ить и описать невычислимую функцию отнюдь не просто. Способы их задания непривычны-для неспециалиста. Тем не менее невычислимые функции существуют. Каждая программа — это- конечный текст в конечном алфавите. Следовательно,, множество вычислимых функций, как и множество программ, счетно, в то время как множество всех функций из Z+ в Z+ несчетно. Это нестрогая аргумен- тация. Ее уязвимость подчеркнута в [281. Тем не менее высказанное утверждение верно. В [28] приведены при- меры невычислимых функций. Алгоритмическая сложность K'(ylx) — предмет изучения настоящей главы — невычис- лимая функция х. 2. Приведем конструктивное описание вычислимых функций. Оказывается, можно указать всего три простейшие (ба- зовые) функции и три элементарные операции над ними, с помощью которых удается итеративным путем получить любую вычислимую функцию. Базовые функции и элемен- тарные операции над ними и используются для уточнения и формализации понятия «алгоритм». Назовем базовыми функциями следующие три функции: а) функция следования СР(х): ZJ. —>Zl+, С1 (х)=х+1— функция одного целочисленного переменного, определяю- щая натуральное число, непосредственно следующее за значением аргумента; б) тождественная (нулевая) функция 0"(х1, ..., х„): Z" —>ZJ_, 0"(х1, ...,х„) = 0—функция п независимых пе- ременных, тождественно равная нулю; в) функция проектирования Pr" (xlt . ..,х„): ZJ—►Z’, Pr? (хп ..., х„) = Х[—функция <п независимых перемен- ных, значение которой при любом наборе аргументов равно значению i-ro переменного. Введем три элементарные операции над базовыми функ- циями и результатами оперирования с ними. 1) Композиция (суперпозиция или подстановка) h. Оператор композиции ставит в соответствие паре частич- ных фуцкций f :ZJ* -н- Z? и g:Z% —► Z£ частичную функцию Л = go f:Z” Zp, h (х) = (gof) x = g (f (x)). 2) Рекурсия. Операция рекурсии сопоставляет паре частичных функций f:Zl—* Z* и g'.Zf2—<-Z* частичную функцию h = Z"+1 —*Z|, определяемую рекурсией по пос- леднему аргументу h(xlt .... х„, y+l) = g(xlt ...,хп,у, х„, у)), h(xx, ...,х„, 0) = f (xv .... х„). 3) Минимизация. Оператор минимизации ставит в соот- 21
ветствие частичной функции /:Z++1—>Z+частичную функ- цию Л: Z"—*£*, й (хг....х„) = min' {ха+11 f , хп, х„+1)= 1}. Уравнение f (xt... хп, хп+1) — 1 вводится для обеспече- ния однозначности h(xi. . х„). Введенная операция min' отличается от обычной опера- ции нахождения минимального неотрицательного цело- численного корня уравнения f(x1,...,xn,xn+J)=l тем, что решение вычисляется последовательным перебором зна- чений ха+1 = 1,2,..., пока уравнение не удовлетворится. ( Результат считается неопределенным, если, не дойдя до ре- шения, мы наталкиваемся на неопределенное значение f либо, если решения не существует.. Так, например, min {х\х—5=1}=6, но ft=min' {xlx—5=1} не определено, ; так как при х=1 значение h отрицательно. Ясно, что операции суперпозиции и рекурсии, если их применять к всюду определенным функциям, дадут всюду определенные функции. В отличие от них минимизация может приводить к не- полностью определенным функциям. Именно этой операции мы обязаны возникновением из всюду определенных функ- ций частичных функций. Теперь’мы подготовлены к тому, чтобы ввести важное для настоящей главы понятие рекурсивных функций. Функция f называется частично-рекурсивной функцией, если она может быть получена из базовых функций С1 (х), О" (х1( .... х„), Pr’l (х„ ..., х„) с помощью конечного чис- ла операций композиции, рекурсии и минимизации. Всюду определенная* частично-рекурсивная функция называется общерекурсивной. Частично-рекурсивные функции, построенные без при- ,? менения оператора минимизации, называются примитивно рекурсивными. Ясно, что они являются и общерекурсив- ными. 3. Определение частично-рекурсивных функций удобно для последующего обсуждения представить в таком виде. ] Последовательность частичных функций ft,. . ., на- i зывается частично-рекурсивным описанием функции f=fN, j если fi— одна из базовых функций, a fi, i^2 является либо i базовой функцией, либо может быть получена применением i одной из элементарных операций к некоторым из функций i А, . . ., А-t- Функция / называется частично-рекурсивной, если она допускает, частично-рекурсивное описание. 22
Функции/ используемые в математике или в приложе- ниях, обычно являются частично-рекурсивными либо (в не- прерывном случае) могут быть сколь угодно точно прибли- жены такими функциями. А. Черч высказал предположение, что понятием ча- стично-рекурсивной функции, и исчерпывается понятие вычислимой функции. Описание частично-рекурсивной функции индуцирует понятие алгоритма, вычисляющего значения функции в области ее определения. В терминах частично-рекурсивных функций тезис Черча формули- руется следующим образом. Каков бы ни был алгоритм, определяющий значения вы- числимой функции, существует эквивалентный ему алго- ритм, представляющий собой описание частично-рекурсив- ной функции. Машина Тьюринга 1. Приведем теперь другое уточнение понятия «алго- ритм» — на этот раз в терминах некоторой идеальной вычислительной машины с неограниченными ресурсами. Идея уточнения и формализации понятия «алгоритм», использующая .воображаемую машину, принадлежит ан- глийскому математику А. М. Тьюрингу. Она была пред- ложена в 1937 г. еще до появления электронных вычис- лительных машин. «Конструкция» машины Тьюринга определяет некоторый вычислительный процесс, который и предлагается при- нять в качестве уточнения понятия «алгоритм». 2. Опишем «конструкцию» и принцип работы машины Тьюринга. Машина состоит из четырех частей: ленты, считывающей головки, внутренней памяти и управляющего механизма. Лента представляет собой неограниченную в обе стороны полосу, разбитую на бесчисленное множество ячеек, ну- меруемых целыми числами. (Неограниченность ресурсов — важная особенность машины Тьюринга, позволяющая дока- зать эквивалентность вычислительного процесса, определяе- мого ею, другим формализациям понятия «алгоритм». Машина Тьюринга, таким образом, не реальная, а вообра- жаемая машина, используемая не для вычислений, а для теоретического анализа.) Лента предполагается направ- ленной: слева от ячейки / расположена ячейка /—1, а 23
справа — ячейка /4-1. В каждой ячейке может быть запи- сан один из трех символов — 0,1 или особый символ 0. В начальный момент во всех ячейках, кроме конечного их чйсла, указаны символы 0. В остальных ячейках, рас- положенных подряд, записаны символы 0 или 1, образую- щие перерабатываемое слово. Считывающая головка может перемещаться вдоль лен- ты так, что в каждый момент времени она находится против одной определенной ячейки и может «обозревать» ее со- держимое. В начальный момент головка находится против самой левой из ячеек ленты, содержащих символы перера- батываемого слова. Внутренняя память — это устройство, которое в каж- дый момент может находиться в одном из*‘конечного числа k состояний qit ..., qk. Среди £тих состояний выделены два — начальное и так называемое стоп-состояние. В начальный момент внутренняя память находится в начальном состоя- нии. Управляющий механизм — это устройство, которое в зависимости от символа, обозреваемого считывающей головкой, и состояния внутренней памяти может изменить символ, записанный в обозреваемой головкой ячейке, изме- нить состояние внутренней памяти и .сдвинуть считыва- ющую головку на одну ячейку вправо или влево (или оставить на месте). Работа машины определяется ее программой — набором инструкций вида qjSj—^Sjnq,., где 1<7, r^.k, Sj, St при- нимают значения 0, 1, 0, а л — один из трех символов П, Л или М, означающих указание сдвинуться на ячейку вправо, влево или остаться на месте. При этом в программе имеется одна и только одна инструкция с левой частью qtSj для каждого возможного значения пары qt, Sj, если только q,— не стоп-состояние. 3. Машина работает в соответствии со следующими правилами. На каждом (t-м) такте, начиная с началь- ного, определяется состояние qi{ty внутренней памяти ма- шины и считывается содержимое Sy(t) обозреваемой ячейки. Если qi(ty есть стоп-состояние, то работа машины пре- кращается. Если состояние qi{ty не есть стоп-состояние, то в программе отыскивается инструкция с -левой частью ?i(O $/«>• Пусть соответствующая правая часть Stnqr. Тогда: а) в обозреваемую ячейку записывается символ S( вместо Sy(/); 24
б) в качестве состояния внутренней памяти в момент /+.1 устанавливается qr', в) считывающая головка остается на месте, если л=Л1, сдвигается на ячейку вправо, если л=П, либо на ячейку влево, если л=Л. На этом такт работы машины заканчивается. Результат работы после остановки машины считается определенным, если на ленте нет символов подмножества {О, 1}, разделенных символами 0 (т. е. либо на ленте вооб- ще нет символов 0 или 1, либо имеющиеся символы из мно- жества {О, 1} идут подряд на некотором числе ячеек ленты). Если на ленте не содержится символов 0 или 1, то резуль- тат работы машины на исходном слове .не определен. Если на ленте символы 0 и 1 идут подряд на некотором числе ячеек, то соответствующее двоичное слово есть результат работы машины. 4. Функционирование машины Тьюринга индуцирует вычислительный процесс, используемый для уточнения по- нятия «алгоритм». Алгоритм, реализуемый на машине Тьюринга, определяется парой, составленной из алфавита Q—(q.u . . ., qk) состояний внутренней памяти и программы. Каждый такт алгоритма, примененный к записи на ленте двоичного слова х, приводит к одному из трех возможных результатов: а) переводит записанное на ленте двоичное слово х в двоичное слово-результат; б) приводит к остановке с неопределенным результатом; в) останавливается на данном х. В случае, когда результат на входе х определен, чис- ло тактов работы машины на слове х до остановки называет- ся временем работы соответствующего алгоритма на слове х. 5. Мы описали простейшую модель машины Тьюринга. Рассматриваются и различные усложнения машины, по- зволяющие, в частности, сократить время работы соответ- ствующих алгоритмов на наборах входных слов. Алгорит- мы, реализуемые на этих машинах, определяются парой — «структурой» и «программой». «Структура» характеризует конструктивные особенности и параметры машины, влия- ющие на вычислительный процесс. «Программа» — это набор инструкций, в соответствии с которыми функциони- рует машина. Уточнение понятия «алгоритм» может быть проведено и на более простой машине, чем Машина Тьюринга, например, на машине Поста. Ее элементарные действия проще, чем 25
элементарные операции машины Тьюринга, и способы за- писи информации менее разнообразна. Поэтому запись и переработка информации на машине Поста требуют, как правило, большего объема памяти и большего числа шагов (большего времени работы), чем описанная здесь простей- шая модель Тьюринга. - Тезис Черча в терминах машины Тьюринга формулиру- ется следующим образом. Каков бы ни был алгоритм, определяющий значения вы- числимой функции, существует эквивалентный ему алго- ритм, реализуемый на машине Тьюринга. Интуитивно ясно, что понятие «алгоритм» может быть уточнено не только, в терминах простейших идеализиро- ванных вычислительных устройств, таких, как машина Тьюринга или машина Поста. Любая универсальная вы- числительная машина произвольной структуры, располага- ющая, однако, неограниченными ресурсами, может быть использована для формализации понятия «алгоритм». Ал- горитм, реализуемый машиной, определяется парой: «структурой» машины и «программой». Конечно, строгая формулировка этого утверждения (особенно четкое опре- деление понятий «структура» и «программа») требует уточ- нения. Мьц однако, апеллируем здесь к интуиции читате- ля и ограничимся следующим формальным замечанием. Под «структурой» вычислительной машины мы будем в дальнейшем подразумевать функцию ф(р, х)—у, ставя- щую в соответствие входу х и «программе» р выход у. Тезис Черча во введенных терминах можно сформули- ровать следующим образом. «Структура» универсальной вычислительной машины, определяющей вместе с «про- граммой» алгоритм, является частично-рекурсивной функ- цией. Определение алгоритмической сложности . . 1. Как мы видели, значения вычислимой функции могут быть получены с помощью разнообразных итеративных про- цессов, составленных из базовых функций и элементарных операций, или с помощью алгоритмов, реализованных на машинах Поста или на разных моделях машины Тьюринга. Наконец, значения вычислимой функции могут быть полу- чены с помощью программы для произвольной универсаль- ной машины с неограниченными ресурсами (времени и 26
памяти). В любой из этих моделей существует бесконечное число «программ», позволяющих по заданному значению аргумента вычислимой функции установить или вычис- лить решение у задачи х. Естественно после уточнения и формализации понятия «алгоритм» сделать следующий шаг — научиться сравнивать трудоемкость решения задач на различных «структурах». По-видимому, одной из важных характеристик слож- ности решения задачи является кратчайшая длина про- граммы, содержащей всю информацию, необходимую для обеспечения обусловленного алгоритмом вычислитель- ного процесса при помощи универсальной машины фик- сированной структуры. Пусть х € X — некоторая задача из класса X задач, у — ее решение — элемент некоторого множества У. Уже отмечалось, что соответствие между решениями задач клас- са и условиями задач удобно рассматривать как частич- ную функцию. Алгоритм решения задачи класса X позво- ляет с помощью программы р получить на универсальной машине со структурой <р(р, х) решение у задачи х^Х. Заметим, что не всегда удобно интерпретировать эле- менты х и у как задачу и ее решение. В таких случаях будем считать х и у последовательностями в некотором алфавите, истолковываемыми в соответствии с рассматриваемой ситу- ацией. Вместо алгоритма решения .задачи будем тогда го- ворить об алгоритме, позволяющем с помощью Программы р восстанавливать по последовательности х$Х последова- тельность у С Y (или по коду объекта х код объекта у). Пусть 1(р) — длина программы р — число знаков в ее записи. Будем считать далее, что программа записывается в двоичном коде и представляет собой, следовательно, дво- ичную последовательность (двоичное слово) конечной дли- ны. Обозначим через 5 множество всех конечных последова- тельностей из нулей и единиц, т. е. множество всех допу- стимых программ. Естественно под сложностью вычисления решения у задачи х (или под сложностью восстановления последова- тельности у по последовательности х) на машине со струк- турой ф(р, х) понимать минимальную длину допустимой программы р, т. е. программы, для которой ф(р, х)—у. Сложность задачи бесконечна, если не существует про- граммы, обеспечивающей вычисление решения у задачи х на машине заданной «структуры» ф. Формально определение сложности вычисления реше- Ю
Вия у задачи, х (или условной сложности объекта у отно- сительно объекта х) записывается в виде \ I, i^_J min/(P):(P(P. х) = у, (ooiVpgS ф(р, *)=#«/. Величина КФ (у\х) называется также алгоритмической сложностью. Это название обусловлено алгоритмическим подходом к определению понятия «сложность» и отнюдь не связано с описанием, сложности алгоритма решения массовой задачи. Минимальная длина программы для ре- шения разных задач класса X может зависеть от индивиду- альной задачи х£Х. 2: Как видим, сложность объектов (последовательностей) зависит от «структуры» вычислительной машины, на кото- рой эти объекты реализуются. Основной результат теории алгоритмической сложности, принадлежащий А. Н. Кол- могорову и Р. Соломонову, показывает, что эта зависимость не очень существенна. А. Н. Колмогоров доказал следую- щее утверждение [16]. х Существуют универсальные вычислительные машины со структурой ф, такие, что соответствующие им сложности К$(у\х) переработки х в у связаны с алгоритмической слож- ностью Кф’^х) решения тех же задач на машинах с лю- бой другой структурой ф неравенством ' (у | х) (у | х) -|- С^ф, где Сфф— некоторая константа, зависящая лишь от струк- тур ф и ф и не зависящая от х и у. Это значит, что существуют универсальные мащины (бу- дем их называть оптимальными), позволяющие решать любые задачи с длиной программы, которая превосходит длину программы на любой другой машине не более чем на константу, зависящую лишь от этой второй машины. Определение алгоритмической сложности в соответствии с теоремой Колмогорова становится инвариантным относи- тельно вычислительной машины, на которой реализован алгоритм. Идея доказательства состоит в том, что всякая машина „«структуры» ф может быть промоделирована на универсальной машине «структуры» ф с помощью некото- рой программы (транслятора). Если у вычисляется по х в машине ф с помощью программы р, то на машине ф он может быть вычислен программой, полученной из р при- 28
соединением транслятора, размер которого не зависит от х и у. Строгое обоснование теоремы Колмогорова, впрочем, как и ряда других утверждений теории алгоритмов, опи- рается на введенное в формальной логике понятие нумера- ции. Входы и выходы алгоритмов и программы вычислений представляют собой конечные тексты — конечные после- довательности букв (двоичных знаков) и как таковые они могут быть перенумерованы. Манипулирование нумерация- ми конечных объектов является одним из важных средств установления взаимосвязей между характеристиками объ- ектов в теории алгоритмов. В частности, ряд результатов теории алгоритмов основан на следующем утверждении. Пусть о=ф(ы)— функция от и$Х со значениями v£Y, п(и) и п(и) — номера и и v в некоторой нумерации. Функция <р частично-рекурсивна тогда и только тогда, когда она порождается частично-рекурсивным преобразо- ванием Ф номеров п (и) =Ф [«(«)]. . ' «Структура» вычислительной машины — частично-ре- курсивная функция ф(р, х)=р, связывающая вход х, выход-р и программу р. Чтобы вычислить выход у (реше- ние задачи) по входу х (по условиям задачи) на машине заданной «структуры», нужно задать конечную информа- цию — программу р. Приведем в соответствие заданной «структуре» машины некоторую нумерацию и перенесем ее на все изучаемые объекты. Теорема Колмогорова утверждает, что существуют (оп- тимальные) «структуры» ф вычислительных машин, ко- торым соответствуют нумерации, позволяющие наиболее экономным путем восстановить решение у задачи по ее условиям х и программе р, заданных в терминах «струк- туры» <р. Именно для вычисления^ по х на универсальной машине со «структурой» ф достаточно не больше K^(p|x)4-const бит информации: к программе р нужно добавить номер «структуры» <р в нумерации, отвечающей «структуре» ф (не зависящей от х и у). Сложности Кф,(г/|х) и K^O/lx) алгоритма, перераба- тывающего х в у, относительно оптимальных «структур» Ф1 и фа различаются не более чем на константу Опре- деляя алгоритмическую сложность, мы будем фиксировать 29
раз и навсегда некоторую оптималыгую(или, как ее еще иногда называют, универсальную) «структуру». Неопределенность константы в определении алгорит- мической сложности оставляет, конечно, неприятный оса- док. Можно было бы избежать неопределенности, ограни- чив анализ фиксированными «структурами». Вряд ли это, однако, возможно без явного произвола. А. Н. Колмого- ров считает, что различные «разумные» варианты будут привадить к оценкам сложностей, различающимся на сотни бит, а не на десятки тысяч бит. И сложность «сложных» объектов, оцениваемых десятками и сотнями тысяч бит (только для столь сложных объектов и имеет смысл вся излагаемая здесь теория), будет оцениваться практически однозначно. Это, конечно, не формально доказываемое утверждение, а интуитивные представления крупнейшего ученого — ос- нователя теории алгоритмической сложности и не только ее. Свойства алгоритмической сложности 1. Привед енное формальное определение сложности про- воцирует допрос: а нельзя ли построить алгоритм, вычис- ляющий сложность алгоритма, предназначенного для ре- шения задач того или иного класса (для определения зна- чений той или иной вычислимой функции). Такой алгоритм позволял бы определять длины кратчайших программ ре- шения задач. А это шаг к автоматизации «оптимального» программирования. Оказывается, однако, что такого алгоритма нет (идея доказательства этого факта приведена ниже при обсужде- нии сложности объекта). Алгоритмическая сложность яв- ляется невычислимой функцией и, следовательно, разра- ботка программ кратчайшей длины не может быть автома- тизирована. Вычисление алгоритмической сложности и построение кратчайшей программы представляют собой творческие процессы, требующие в каждом отдельном слу- чае изобретательности. Тем не менее можно найти мажоранты алгоритмической сложности — оценки сложности сверху — такие частично- рекурсивные (и даже общерекурсивные) функции х(г/|х), что /Сф(«/|х)<Зс(0|х)+С, где С—константа, не завися- щая от х. Более того, если известна задача х и Некоторое число s^A^fz/lx), то можно эффективно найти одну из
программ р решения задачи х на машине со «структурой» «р, которая хотя и не будет'самой короткой, все же будет иметь длину, не превышающую s. Имеет место следующее утверждение. Пусть объект х принадлежит конечному множеству из М объектов. Тогда доля тех объектов у, для которых условная сложность К<р(у\х) не превышает 1(М)—т, не превосходит Уг"'1- (Здесь 1(М) —длина двоичного представления М.) Этот результат получается из мощностных соображе- ний, впервые использованных К. Шенноном. Мощностные соображения позволяют получать нижние оценки слож- ности объектов из заданных классов при различных опре- делениях сложности. Число задач у из заданного мно- жества, имеющих при фиксированных х сложность нё больше 1(М)—т, не превосходит числа 2/<м,-т М/'2Я!-1 всех двоичных программ размера не выше 1(М)—т и составляет Уг”'1 часть из М объектов класса. Особый интерес (и содержательный, и вычислительный) представляет мажоранта алгоритмической сложности /Сф(у|х), являющаяся «подправленным количество^ ин- формации, содержащимся в х об у». Подробней об этом не- сколько далее. 2. Перспективность введенного А. Н. Колмогоровым по- нятия алгоритмической сложности и роль этой категории в теоретической математике, в частности в математической логике, не вызывает сомнений у специалистов. Не все, однако, верят в прикладную ценность теории алгоритми- ческой сложности. Мы разделяем мнение тех, кто считает, что категория сложности безусловно перспективна и с практической точки зрения. Но мы не можем согласиться с теми, кто считает,'что интерес к ожидаемым приложе- ниям алгоритмической сложности в значительной мере снижается из-за того, что Kv(y\x), измеряя длину програм- мы решения задачи, не касается времени, в течение кото- рого эта программа должна работать, не оценивает потреб- ную память и не приспособлена к учету возможного сокра- щения времени решения задачи за счет распараллеливания вычислений, удлинения программы и других рационализа- торских предложений. Умозрительные рассуждения приводят к выводу, что в теории сложных систем оптимизация статических харак- теристик вряд ли меньше влияет на качество функциони- рования систем, чем оптимизация ее динамических харак- теристик. Во многих случаях, если не всегда, при проек- 31
тировании сложных систем оптимизация (в определенном смысле) внутреннего механизма действия системы является гораздо более естественным требованием к проекту, чем оптимизация реакции на выбор заданных возмущений си- стемы. • ' ’ Природа, совершенствуя свое творение — живой мир, заботилась, по-видимому, не столько о том, чтобы миними зировать время реакции живых организмов на ожидаемые возмущения внешней среды, сколько об эффективности — качестве и компактности механизма развития и адаптации — программы развертывания жизни. Эволюция живого — это последовательное совершенствование генетической про- граммы, и алгоритмов обучения. Таким образом, природа оптимизирует статические характеристики живых орга- низмов (их алгоритмическую сложность) и не’всегда стре- мится к оптимизации динамических характеристик орга- низмов — времени переработки информации, -поступаю- щей от внешней среды, выбора и реализации решений. Все эти этапы — существенные элементы жизненного процесса и в ряде случаев стремление сократить их продолжитель- ность — равносильно стремлению сократить удовлетворе- ние, доставляемое жизнью. ; Аналогичным образом рациональная экономическая системаэто прежде всего производственные мощности и компактный внутренний механизм управления — про- грамма бесперебойного функционирования экономики. Раз- дутые штаты, многоступенчатое управление, бесконечные инструкции, регламентирующие каждый шаг производст- ва,— чрезмерная плата за оптимизацию реакции системы на каждое ожидаемое возмущение. Более естественный путь обеспечения рационального функционирования эко- номики — развитие минимального числа внутренних сти- мулов, определяющих программу алгоритма реакции на спрос и предложение. Не в анализе ли сложных систем, подобных тем, которые изучаются в генетике и экономике,— ближайшие перспек- тивы приложений теории алгоритмической сложности? Колмогоровские результатам в теории сложности — фор- мально сформулированные законы природы. Их интерпре- тация в терминах конкретных сложных систем — важная прикладная задача. 32
Сложность объекта 1. Введенное выше понятие алгоритмической сложности — сложности переработки слова к в слово у на машине со «структурой» <р — порождает более простое понятие сложность К^(у) объекта у — сложность слова у по отношению к машине со «структурой» ф. Будем называть сложностью Лф(//) объекта у значе- ние /<ф(^|х) при фиксированном значении х (например, при х=1). Таким образом, тш/(р):ф(р, 1)=у, < : - Ч>(Д. 1)¥=У.' Как и в алгоритмической сложности Л’ф^х),‘ Для сложности (у) объекта могут быть найдены Так назы- ваемые оптимальные структуры ф, такие/чтб'! Кф (у) Кф (у)-I- где константа Сфф зависит только от Структур ф и <р и не зависит от Объекта у. Это значит, что: существуют такие «структуры» универсальных вычислительных машин с не- ограниченными ресурсами (такие частично-рекурсивные функции), в терминах которых могут быть построены про- граммы, восстанавливающие (описывающие) любые объек- ты у, грубо говоря, наиболее экономным путем. Сложность ’Кф(у) объекта у (слова у) удовлетворяет следующим свойствам: 1) (у)<I (у) (следовательно, (у) < ооууСS); 2) доля слов у, для которых Кф(г/) </0—т, среди всех слов у длиной /9 не превосходит 1/2®-1(т..е. оценка К<,(//)-С/(у) для.большинства слов точная); 3) lim Кф(у) = оо. Следовательно, и Jim т (у) =.oq,: где т (у) = min (х)—наибольшая монотонно' неубывающая функция,' ограничивающая КФ(у) снизу. При этом tn (у) растет медленнее любой монотонной общерекурсивной функции. Это означает, что функция Кф(у) не допускает нетривиальной (отличной от константы) оценки снизу; 4) А’фСу), как и Кф(у|х) — невычислимая функция. Действительна, если бы функция К<? (у) была вычислимой, то путем последовательного просмотра объектов (слов) у 2 £-987 зз
в «естественном» порядке можно было бы найти первый из них, для которого КФ(^)^Л (k < I (у)— некоторое число). Этот объект однозначно задается числом k (про- граммой длины /(А)) и программой вычисления функции Кф. Поэтому Кф(у) I (k)Сlog2k + С +1, что при достаточно больших k противоречит неравенству /Сф (у) k. Итак, не существует алгоритма вычисления Kv(z/), хотя имеется возможность получить оценки К9(у) сверху. Общность определений и результатов теории алгорит- мической сложности (и сложности объектов) получена ценой некоторых практически нереализуемых предположений. Дело в том, что, говоря о вычислительных машинах, реали- зующих алгоритм, мы не ограничивали времени счета и необходимой памяти. В случае, когда на время работы (чис- ло шагов) алгоритма наложены даже самые слабые огра- ничения, длина программы может существенно возрасти. В литературе имеются многочисленные примеры, подтвер- ждающие этот вывод. Качественно объяснить подобное яв- ление можно, если учесть, что сложность — невычислимая функция. Оптимальный алгоритм будет перебирать все возможные программы, вычисляющие решение задачи или восстанавливающие объект на универсальных вычисли- тельных машинах, и нельзя заранее сказать, какая именно программ^ будет ^самой короткой. Поэтому, если время ра- боты машины заранее ограничено, решение задачи может быть не достигнуто или объект может быть точно не восста- новлен к моменту прекращения счета. 2. Хотя, как уже указывалось, не существует алго- ритмов вычисления КФ(«/) и (у | х) для конкретных за- дач или объектов, все же можно получить почти всюду сколь угодно хорошие оценки сверху этих величин. Для приложений представляют интерес мажоранты сложности, связанные с условной или безусловной энтро- пией объекта. . .. Пусть проводится т испытаний с s возможными исхо- дами, причем, частость Л-го исхода, k—1, . . ., s, равна рк. Предположим, что каждый исход записывается двоичным словом длиной г. Всего таких слов 2'. Следовательно, s<2r. Отождествим формальную запись рассматриваемого объекта у с двоичным словом длиной тг, представляющим собой запись исходов всей серии испытаний. В приведенных понятиях может быть доказано следующее утверждение, устанавливающее вычислимую мажоранту сложности. Существуют константы Сф и Сф, не завися- 34
щие от у, такие, что Q/X т [Я (р) 4- а (т)] + Сф, где 2Г Н(р)=—2 pk\ogiPk, К=1 а а (т) = (% -> 0 при /п->оо. Это значит, что энтропия Шеннона Н (р) может быть ис- пользована для построения мажоранты сложности Kv(y) объекта у. Энтропия тем лучше оценивает сложность объекта, чем больше число т наблюдений за его состоянием. Соотношение между энтропией и сложностью установле- но для объектов (текстов), представляющих собой запись последовательности независимых испытаний, т. е. для тек- стов, не имеющих других закономерностей, кроме частот- ных. В этом случае появляются веские основания рассма- тривать энтропию объекта как некоторую меру сложности объекта и, наоборот, сложность объекта как некоторую ха- рактеристику его неопределенности (хаотичности). Инту- итивно ясно и далее это будет аргументировано, что, чем больше закономерностей в тексте, тем меньше его слож- ность. Таким образом, учет одних лишь частотных зако- номерностей текста и пренебрежение всеми другими (воз- можно, скрытыми) закономерностями приводит к завы- шению алгоритмической сложности текста. Это служит неформальным объяснением целесообразности использо- вания относительно легко вычисляемой энтропии Шеннона в качестве мажоранты невычислимой алгоритмической слож- ности. Сложность и случайность 1. Интуитивно ясно, что «сложные последовательно- сти ведут себя как случайные», а «случайность» есть «от- сутствие закономерности». А. М. Колмогорову и П. Мар- тин-Лефу принадлежит заслуга установления четкой свя- зи между сложностью и случайностью, имеющей далеко идущие философские, математические и прикладные по- следствия. Проблема обоснования теории вероятностей и ее основ- 1* . 35
кого понятия «случайность» (ниже «случайная последова- тельность нулей и единиц») имеет более чем 60-летнюю ис- торию. Первое определение «случайной 0—1 последовательно- сти» принадлежит Р. Мизесу. В 1919 г. Р. Мизес предло- жил называть бесконечную последовательность х={хг> х2, . . .} из нулей и единиц случайной, если она удовлет- воряет двум свойствам: а) относительная частота появления 1 равна 1/2, т. е. lim 4<*i'+ • • • +*»)вт» : б) в подпоследовательности Х1={х^, х{}, . .. .} 0—1 по- следовательности х={хъ х.а, . . .}, определяемой любым «правилом выбора», относительная частота появления 1 рав- на 1/2, т. е. lim 4-(х/. 4-х,14- ... 4-х,„) = -я-. При этом, вероятности определяются как предел частот. У Мизеса, однако, возникли трудности при строгом опре- делении приятия «правило выбора». Его идеи не выдержа- ли проверки временам. Были построены примеры (Билль, 1939) 0—1 последовательностей, . удовлетворяющих тре- бованиям Р. Мизеса к случайным последовательностям, но не удовлетворяющих некоторым теоремам теории "ве- роятностей (в частности, теореме о повторном логарифме '' *i4-’*'4-*»j—'~2 limsup—।— ‘"-'-z =' 1 a. , "** у y2nlog.log л *i4--«'4*x«—S’ \ lim inf - р ......— —^1 I. "*“ -% У 2n log log n J Дело здесь, грубо говоря, в том, что Р. Мизес, определяя случайность как отсутствие закономерностей, учитывал только частотные закономерности. С точки зрения совре- менного подхода А. Н. Колмогорова и П- Мартин-Лефа к случайности., этого оказывается недостаточно. 86
В 1933 г. А. Н. Колмогоров предложил рассматривать теорию вероятностей как прикладную теорию меры. Эле- гантность и формальная завершенность построений Кол- могорова привлекли специалистов по теории вероятностей, и развитие идей Р. Мизеса затормозилось. Однако плата за новый подход к теории вероятностей оказалась сущест- венной. Пришлось отказаться от рассмотрения случай- ных индивидуальных (бесконечных) последовательностей и рассматривать только случайные множества последова- тельностей. 2. В 1965 г. П. Мартин-Леф, основываясь на идеях А. Н. Колмогорова, дал определение случайной последо- вательности, свободное от трудностей, встретившихся в концепции Р. Мизеса. «Не случайными» предлагается счи- тать только те црследовательности, в которых наблюдается достаточно много закономерностей. При этом под законо- мерностью подразумевается любое проверяемое свойство последовательности, присущее лишь узкому классу после- довательностей. Пусть x—{xi, ... х„, . . .} бесконечная двоичная по- следовательность. Рассматривая последовательно удли- няющиеся начальные фрагменты этой последовательности (x)„={xi, • ♦ • . хп)> будем пытаться устанавливать скры- тые в них закономерности — правила, позволяющие их, по крайней мере грубо, восстановить. Традиционный подход к выявлению закономерностей бес- конечной последовательности -связан с простыми процеду- рами подсчета частот, с которыми встречаются 0 и 1 во фрагментах двоичной последовательности. Однако инту- итивно понятие «случайность» противостоит не столько жест- кой повторяемости, сколько более широкому понятию «ор- ганизованности». В свою очередь, степень организованности естественно характеризовать сложностью алгоритма, поз- воляющего восстанавливать последовательно удлиняющие- ся начальные фрагменты бесконечной последовательности. Ясно, что определение степени организованности беско- нечной последовательности не сводится только к подсчету частот. П. Мартин-Леф формализовал идею выделения' зако- номерностей и предложил подход к оценке «количества закономерностей», содержащихся в бесконечной последо- вательности; Под «тестом на случайность» будем понимать вычис- лимую функцию F на множестве конечных двоичных после- 37
довательностей со значениями из натурального ряда, удов- летворяющую следующему условию: для каждого т>0 до- ля множества последовательностей х, у которых существует начальный фрагмент (x)n с F ((х)п)^т, не превосходит 2~т, т. е. доля множества тех последовательностей, в ко- торых может быть обнаружено более чем на т бит законо- мерностей, не должна превосходить 2~т. Обозначим через F(x) верхнюю грань по «.значений F((x)„) и будем говорить, что последовательность х «вы- держивает тест F», если F(x) конечно, или, что «тест F отбрасывает х», если F(x)=oo. Значение F(x) теста есть «количество» найденных им закономерностей. Функция F показывает, на сколько бит закономерностей типа, опре- деляемого функцией F, можно установить в последователь- ности х. Каждый бит закономерностей должен по крайней мере вдвое сократить множество допустимых последователь- ностей. Двоичная последовательность называется случайной, если она выдерживает все тесты. При таком определении случайной последовательности можно доказать, что они удовлетворяют всем эффективно проверяемым законам тео- рии вероятностей (закону больших чисел, закону повтор- ного логарифма и т. д.). В случае если какой-либо вероят- ностный какой не выполняется, его условия индуцируют некоторую вычислимую функцию '—тест, который не вы- держивается проверяемыми последовательностями (невы- полнение какого-либо вероятностного закона есть законо- мерность). Требование вычислимости F обеспечивает передачу про- верки на случайность вычислительной машине.' 3. По определению последовательность может быть, строго говоря, объявлена случайной после прохождения ею всех тестов. Стало быть, установление числа бит законо- мерностей в бесконечной двоичной последовательности производится тем точней, чем больше вычислимых (ча- стично-рекурсивных) функций использовано в качестве тестов. Казалось бы, проверка последовательности на слу- чайность и оценка числа бит закономерностей в ней совсем не конструктивная процедура. Оказывается, это не совсем так. Как мы видели, переход к оптимальным (универсаль- ным) структурам позволяет ослабить зависимость алгорит- мической сложности или сложности объекта от «структуры» вычислительной машины (от выбранной частично-рекур- сивной функции). Аналогичным образом можно заменить 38
проверку на случайность по всем тестам (по всем частично- рекурсивным функциям) проверкой по одной так называе- мой универсальной функции (по одному универсальному тесту)- П. Мартин-Леф доказал, что существует тест F* (называемый универсальным) такой, что для'любогодругого теста F при всех бесконечных последовательностях х выполняется неравенство F(x)^.F* (х)+С, где С —неко- торая константа, не зависящая от проверяемой последова- тельности х. Теорема П. Мартин-Лефа позволяет уточнить определение случайной последовательности. Бесконечная двоичная последовательность случайна, если она выдерживает универсальный тест. 4. Конечно, замена проверки на случайность по всем тестам проверкой по одному — универсальному — не дает- ся даром и установление случайного характера беско- нечной последовательности не становится от этого сущест- венно более конструктивной операцией. Доказательство существования универсального теста имеет главным обра- зом теоретическое значение. Оно уточняет понятие «слу- чайность» и позволяет получить ряд качественных выводов. Обозначим через р(х) число бит закономерностей дво- ичного слова х, которые найдены в нем универсальным тестом F*; 1(х) — по-прежнему длина слова х. По опреде- лению для вычисления р(х) следует: а) применить F* ко всем последовательностям (£)„ длины п, начинающимся с фрагмента х; б) вычислить наименьшее значение F* на таких последо- вательностях (min F* ((£)„)); ' (6)л в) взять максимум полученной величины по п. р (х) = max min F* {((£)„) | fragmente (£)„ = х}. п (5)п Фундаментальный результат Мартин-Лефа, устанавли- вающий связь между понятиями случайности и сложности, формулируется в следующем утверждении. Сумма сложности слова х и числа бит его закономерно- стей почти совпадает с длиной двоичной записи этого числа. Точнее, |(Р (*) + К. (х))—I (х)| < 41 (I (х)) 4- const. Если последовательность £={£i, слу- чайна, то отсюда следует, что сложность начального фраг- мента (|)„ длины п К. ((£)„) > п—41 (п) + const Vn. 39 V
Полученное неравенство означает, что сложность (до- статочно длинных) начальных фрагментов бесконечной слу- чайной последовательности приблизительно равна их дли- не. Это важный результат, поскольку он позволяет свести анализ; бесконечной случайной последовательности к изу- ' чению конечных последовательностей, каждая из которых может быть построена с помощью подходящего алгоритма. Последнее неравенство может быть также использовано ; в качестве хоть и грубого, но содержательного определения индивидуальной случайной последовательности. Случай- ; ной следует признать всякую последовательность, у кото- рой алгоритмическая сложность начального фрагмента (при i подходящем (оптимальном) способе его описания) растет ! достаточно быстро с увеличением длины фрагмента. Алгоритмическая сложность и теория информации : ' 1. Отправляясь от алгоритмической сложности, можно ' показать, что установившийся подход к теории информа- ции, основанный на принципах теории вероятностей, не । является единственным и наиболее естественным. Собст- венно, у ^колыбели теории алгоритмической сложности на- ходится работа А. Н. Колмогорова о новом (алгоритми- ческом) подходе к понятию «количество информации» [22]. Важнейшим понятием теории информации является «энтропия» сообщений. Привычная шенноновская трактов- ; ка энтропии— это мера неопределенности результатов опыта, могущего иметь в зависимости от случая различные исходы. Приведем умозрительные основания для выбора энтропии в качестве меры неопределенности. Пусть опыт А имеет $ равновероятных исходов, а опыт : В — I равновероятных исходов. В этом случае степень F « неопределенности результатов опыта зависит только от | числа . исходов: FA=F(s), FB=F(I). Число исходов опыта ,? АВ: (Т. е. объединенных в один опытов А и В) равно s/.-| Естественно полагать, что мера неопределенности опыта АВ : равна сумме мер неопределенности опытов А и В, т, е., F (sl)=F(s)+F (I). По определению опыт, имеющий един-1 ственный. исход, не связан с неопределенностью. Его сТе-1 пень неопределенности F(l)=0. Ясно также, что степень j неопределенности должна расти с увеличением числа ис-i ходов; т. е. F(s)>F(l) при «>/. Перечисленным свойствам I 40 1
удовлетворяет функция F(s)=log s. Можно показать, что с точностью до нормирующего множителя это единствен- ная функция, удовлетворяющая сформулированным тре- бованиям к мере неопределенности равновероятных со- бытий Таким образом, если исходы опыта равновероятны и ре- . 1 - ализуются каждый с вероятностью р = —, то общая мера неопределенности опыта равна log s = — log у = — log р, а мера неопределенности каждого исхода равна у logs= =—plogp. Пусть теперь исходы опыта неравновероятны и произ- водится т независимых испытаний с s возможными исхода- ми с вероятностями р2, . . ., р, соответственно. Продол- жая приведенные выше интуитивные рассуждения, есте- ственно принять в качестве меры неопределенности j-ro исхода — pi log pi, а в качестве общей меры неопределен- S ности опыта — сумму 2^ р{ log р(. Эта величина называется энтропией опыта А и обозначается И (Л) или Н(р). К. Шен- нон [431 приводит набор естественных требований к мере неопределенности опыта с неравновероятными исходами. Энтропия является единственной с точностью до норми- рующего множителя функцией, удовлетворяющей этим требованиям. 2. А. Н. Колмогоров 123] приводит другое (отличное от меры неопределенности результатов опыта) толкование энтропии. Его можно аргументировать как вероятностными, так и комбинаторными соображениями. При этом комбина- торная аргументация связана с существенно более слабыми допущениями. 1 Пусть по-ПрежнеМу проводится т независимых испы- таний с s возможными исходами, наступающими соответ- ственно с вероятностями plt . . ., ps. Пусть т достаточно велико. Оказывается, что для записи исходов всей серии испытаний необходимо приблизительно mH битов. Вероят- ностная аргументация Этого утверждения существенно ис- пользует схему независимых испытаний. Тем не менее это утверждение может быть доказано при гораздо менее жест- ких предположениях чисто комбинаторного порядка, не л>Мы предполагаем основание логарифмов равным 2. Тогда степень неопределенности будет измеряться в битах (в двоичных единицах). 41
связанных с вероятностными представлениями о независи- мости испытаний. Пусть t-й исход, i=l, . . ., s, в результате испытаний реализован тг раз. Перенумеруем все возможные располо- жения исходов ( их число С (пи, т.) = —г). у °' . .ms\ j Можно зафиксировать результат испытаний, указав ко- личества mi, . . ., ms каждого из исходов и номер той по- следовательности исходов, которая имела место в процессе испытаний. Чтобы записать количество реализаций каж- дого исхода, требуется не более $ log т бит информации (поскольку всего исходов s, а запись tnt, i=l......s, содержит не больше двоичных знаков, чем запись числа ис- пытаний т, т. е. не превышает log tn). Номер реализованной последовательности исходов не превышает C(mi, .... ms). v Запись С требует log С двоичных знаков. Таким образом, для записи последовательности исходов при т испытаниях необходимо не более s log /п-f-log С бит информации. Используя формулу Старлинга ml == у 2шп ( — ) е12т, где получаем, что при большом т запись после- довательности исходов испытаний требует порядка ml — S — log-^-)~m// двоичных знаков. \ i=i ф т J Заметим, что в приведенных рассуждениях не было речи о независимости испытаний и о вероятностях реализаций исходов. Полученный вывод логически не зависим от ка- ких бы то ни было вероятностных Допущений. При независимых испытаниях и большом т в силу зако- на больших чисел ~ Р/ и оценка длины записи последо- вательности исходов испытаний в комбинаторном, подходе та же, что и в вероятностном, использующем существенно более жесткие допущения.. Аналогичным образом можно, исходя из комбинатор- ных соображений, получить энтропию цепи Маркова при существенно более слабых предположениях, чем при ве- роятностном подходе. 3. В классической (шенноновской) теории информации количество информации, содержащееся в объекте х об объекте у, определяется через энтропию Я (у) объекта у и условную энтропию Я(у|х): 1 (у I х) = Н (у)—Н (у IX). 42
При этом энтропия (условная и безусловная) определяет- ся из вероятностных соображений. Комбинаторная трак- товка энтропии Н (у) (аналогичные рассуждения могут быть проведены и относительно условной энтропии Н(у\х)) и приведенные выше соображения о мажорантах сложности позволяют дать не связанное с вероятностными предпо- сылками толкование понятия «количество информации». Сложность К (у) объекта у можно интерпретировать как информацию, содержащуюся в объекте у-о самом себе, т. е. как количество информации, необходимое для восстанов- ления объекта у. Аналогичным образом в качестве количе- ства информации, которую следует добавить к информа- ции, содержащейся в х, чтобы восстановить у, естественно рассматривать условную (алгоритмическую) сложность К(у\х). Разность между этими величинами целесообразно принять за определение количества информации в х об уг l<f(y\x)=K't(y)—K.'f(y\ х). Индекс <р здесь указывает «структуру» вычислительной машины, относительно которой оценивается сложность. Классическое определение количества информации ес- тественно для массовых явлений, описываемых вероятност- ными характеристиками (например, для оценки информа- ции, содержащейся в потоке телеграмм). Шенноновский подход приспособлен к требованиям теории передачи по каналам связи массовой информации, состоящей из боль- шого числа слабо связанных сообщений, удовлетворяющих некоторым статистическим закономерностям. Вероятност- ное определение количества информации не поддается ис- толкованию применительно к индивидуальным событиям. Неясно, например, как в понятиях традиционной теории информации оценить количество информации, содержащееся в переводе некоторой книги на другой язык, относительно оригинала. Колмогоровское определение количества информации относится к индивидуальным объектам и в принципе дает возможность оценить содержащуюся в них информацию. Однако практические аспекты приложения количествен- ных методов оценки информации, содержащейся в индиви- дуальных объектах, ждут еще своего исследования и раз- решения. Они должны учитывать формальные особенности, связанные с определением алгоритмической сложности. В частности, в каждом отдельном случае следует аргумен- та
тировать выбор универсальной структуры, относительно которой оценивается сложность. Ведь в отличие от шенно- новского определения количества информации колмогоров- ское определение сохраняет некоторую неопределенность и зависит от выбора универсальной структуры <р. Разные варианты /ф(у1х) и комбинаторного определения количества информации эквивалентны лйшь в смысле |/<р(у|хУ—Л|>0/|*)| где константа Сфф зависит от универсальных структур, относительно которых ' определяется алгоритмическая сложность. 4. Комбинаторные определения энтропии и количества информации заставили пересмотреть ряд утверждений тео- рии Информации. . В частности, вместо привычных утверждений шенно- новской теории информации, основанной на вероятностном подходе,:. Н(х, у) = Н (х)-\-Н (у]х), 1(у\х) = 1 (х|^) при комбинаторном подходе имеют место уточненные соот- ношения * Я (х, у) = Н (х) 4- Н (у | х)+О (log К (х у)), \I(y\x)—l{x\y)\ = O[\QgK\.x, у)). При этом установлено, что дефект в коммутативности при комбинаторном определении количества информации действительно может иметь указанный в последней форму- ле порядок. Содержательный., и формальный анализ показывает', что применение уточненных соотношений для энтропии и количества информации к индивидуальным объектам при- водит к более естественным выводам, чем использование утверждений классической теории информации, а в прило- жениях, доступных вероятностному подходу, расхожде- ния между выводами, вытекающими из колмогоровского и шенноновского определений количества информаций, пренебрежимо малы. 44
Сложность табулирования 1. К проблеме алгоритмической сложности примыкает задача оценки сложности табулирования функций. Работам Д. Н. Колмогорова по алгоритмической сложности пред-, шествовали его работы и работы его учеников А. Г. Ви- тушкина и В. И. Арнольда по XIII проблеме Гильберта, которая связана с оценкой сложности функций, в частно- сти, в интересах их экономного табулирования. Можно ду- мать, что эти работы стимулировали проблематику алгорит- мической сложности. В 1900 г. на Втором международном математическом конгрессе Д. Гильберт выдвинул 23 нерешенные проблемы, которые, с его точки зрения, определяли направления раз- вития математики XX века.,ХШ проблема формулирова- лась следующим образом: существуют лй аналитические функции трех переменных, не представимые суперпозицией непрерывных функций .меньшего числа переменных. Ис- ходя из этого, он предположил, что «сложность» функций определяется главным образом числом аргументов. Од- нако, как выяснилось позднее, эта- гипотеза, справедли- вая для аналитических функций, неверна в общем случае для более широких классов функций. В частности, 'для s раз дифференцируемых функций п переменных^ характери- стикой сложности функций оказывается не число ее. аргу- ментов, а отношение у. (Чтобы больше не возвращаться к XIII проблеме Гильберта, заметим, что окончательно? ее ре- шение и опровержение гипотезы Д. Гильберта принадле- жит А. Н, Колмогорову и В.,И. Арнольду, В 1956 г. Кол- могоров доказал, что всякая непрерывная функция п переменных может быть представлена в виде суперпозиции непрерывных функций трех переменных. В 1957 г. В,. И. Ар- нольд — тогда еще студент мехмата МГУ — доказал, что всякая непрерывная функция трёх переменных представима в виде суперпозиции непрерывных функций двух, перемен- ных. В том же 1957 г. А. Н. Колмогоров поставил точку над XIII проблемой Гильберта. Он доказал, что любая не- прерывная функция « переменных может быть представлена, в виде суперпозиции непрерывных функций одного пе- ременного и операции сложения). Исследования А. Н. Колмогорова и А. Г. Витушкина, стимулированные XIII проблемой Гильберта, естественным образом привели к оценкам объема наиболее экономных 45
таблиц, для записи функций разных классов (функций, принадлежащих тем или иным функциональным простран- ствам) — к оценкам общего количества двоичных знаков, необходимых для записи всех параметров таблицы, и к оценке сложности алгоритма, расшифровывающего табли- цу. Заметим, что, несмотря на прогресс, достигнутый в по- следние годы в разработке запоминающих устройств боль- шой емкости, необходимость в' составлении экономных таблиц отнюдь не отпала. Огромные объемы информации, подлежащие запоминанию в современных экономических, социальных, технических и военных системах, и дефицит времени на поиск нужных данных сохраняют актуальность проблемы экономного табулирования. 2. Приведем нестрогую (упрощенную) постановку зада- чи об оценке сложности таблиц функций заданного класса. Пусть F — некоторое семейство функций f(x), опреде- ленных на множестве GcE", a Te(f) — таблица любой функ- ции f(x)£Ft состоящая из значений р параметров уи уг, . . ., ур и расшифровывающего алгоритма А (у), восста- навливающего / (х) с точностью до е. Часто под алгоритмом А (у) понимают полином Р* (у) от р переменных уи у2, . . ., ур степени не выше k по каждому из переменных, ко- эффициенты которого произвольным образом зависят от xgG, такой, что при всех f(x)(tF существует набор у= =(г/ь • • на котором |f(*)-^(f/)l<* VxgG. Задача заключается в том, чтобы по свойствам класса F функций f(x) оценить «сложность» таблиц для элементов из F. Сложность таблицы определяется, во-первых, ее объемом — минимальным числом двоичных знаков, не- обходимых для записи всех параметров таблицы, и, во- вторых, сложностью расшифровывающего алгоритма. В ча- стности, если под 4 (у) понимают полином Р* (у), то слож- ность расшифровывающего алгоритма определяется числа- ми р и k. Легко сообразить, что наиболее экономная запись в таб- лицу элемента х из конечного множества X*={xi,, .., хя} содержит logs п двоичных знаков. Величина logan назы- вается энтропией конечного множества Х={хи . . ., хп} и обозначается Н(Х). Если X состоит из бесконечного числа элементов, то записать любой его элемент с помощью конеч- ного числа двоичных знаков невозможно. Для оценки объе- 4в
ма таблиц, отвечающих бесконечным множествам, необхо- димо объединить близкие по своим свойствам элементы в группы так, чтобы число групп было конечным. В 1955 г. А. Н. Колмогоров ввел понятие 8-энтропии мет- рического пространства F функций. Под 8-энтропией’прост- ранства F функций понимают величину tf£(F) = log2^(F), где Ne(F) — число элементов минимальной в F по числу , точек s-сети множества F. (Напомним, что множество YcF называется 8-сетью пространства F, если для всех f£F. можно указать y$Y такой, что рНу,/)<^е. Здесь pf(y, /) — расстояние между у и / в метрике F.) е-энтропия какого-либо класса функций — это, грубо говоря,- количество информации, позволяющее выделить функцию этого класса с точностью е. А. Н. Колмогоров по? казал, что 8-энтропия s раз дифференцируемых функций п п переменных растет как 8 s. Это значит, что количество информации, необходимое для того, чтобы восстановить функцию класса, тем больше, чем больше п — число неза- висимых переменных, и тем меньше, чем выше гладкость s. При этом существенно именно отношение . Отсюда, между прочим, следует теорема Витушкина: при всяких п.и s существует s раз дифференцируемая функция п переменных, не представимая суперпозициями р раз дифференцируе- мых функций т переменных, если только — <—. Ведь р s количество информации, необходимое для задания супер- позиции, не может превосходить (по порядку величины) количество информации, достаточное для задания состав- ляющих суперпозицию меньшего числа переменных. А. Г. Витушкин расширил колмогоровское понятие е-энтропии и ввёл понятие относительной ё-энтропии. Он разрешил записывать в таблицы функций из класса F функции, хорошо аппроксимирующие элементы из F, но не принадлежащие F. Таким образом, он получил возмож- ность строить более экономные методы составления таблиц. Пусть Ф—метрическое расширение пространства F (т. е. Ф содержит F и при всех Д, f2£F ft) — = Рф(Д, ft), где pf и рФ —расстояния между Ди Д в смысле метрик F и Ф соответственно). Под 8-энтропией пространства F функций относительно 47
его метрического расширения Ф (или просто под относи* тельной 8-энтропией F) понимают величину Ht(F) = logiNt(F), .. . . где Nf (F)—число элементов минимальной в Ф по числу точек е-сети множества F. Ясно, что колмогоровская 8-энтропия пространства F функций Яе(£) = Я^(Г). Будем называть таблицей lT(f) функций f(x) из F, восстанавливающей f с точностью до е при помощи некото- рой функций ф из Ф,-набор у=(уъ . . ур) элементов'не- которого множества Y и алгоритм А(у), который ставит в соответствие набору у некоторый элемент <p g Ф такой, что рб(Ф,Алгоритм А (у) строит в пространстве Ф e-сеть для F. . • Объемом таблицы Т® (/) называется число Р (Tf (f)) =» — plogan, где h—число элементов множества. Y. _ Имеет место следующая оценка относительней е-энтро- пий класса F функцйй: • : inf Р [?*(/)]< Я? (Г)< inf P[Tf (f)] +1. т№ < • Таким образом, при фиксированном Ф для f£F отно- сительная e-энтропия Я® (F) совпадает с точностью до 1 с нижней гранью объема таблицы?® (f). Наметим схему алгоритма сопоставления с точностью до в функции f € F таблицы минимального объема. Фик- сируем в расширенном пространстве Ф минимальную е- сеть пространства F. Обозначим ее элементы черезд>1( Ф2,... ..., Ф„ (п = Я® (Г)). Примем в качестве параметра табли- цы для f €F номер того элемента ф, который аппрокси-' мирует f с точностью е. Поскольку номер ф меняется от - 1 до п, то его двоичная записьзанимает[1о§Я®(?)] + + 1 = [Я®(?)] 4-1 двоичных знаков. 3. Назовем абсолютной е-энтропией HR(F) метрическо- го пространства F нижнюю грань относительных е-энтро-; пий F при всевозможных его метрических расширениях Ф He(F) = infHf(F). ФЭР 48
Оказывается, нижняя грань достигается на пространст- ве £ всех непрерывных функций. Таким образом, простран- ство С является наилучшим метрическим расширением для всякого (компактного) метрического пространства F (с равномерной метрикой) ^(Р) = Яе(Г)<Я?(Г) УФ. Прикладной смысл абсолютной е-энтропии определяется следующим утверждением. Объем таблицы Tf(f) функции f<tF не меньше абсо- лютной е-энтропии He(Fj. При этом для каждой функции fgF можно составить таблицу, объем которой не больше [Л (F)] +1. Доказательства приведенных утверждений содержатся в монографии [9]. Там же приведены, кроме того, неравен- ства — оценки сложности таблиц для ряда функциональ- ных пространств. Приведем здесь лишь некоторые оценки параметров р. и k наиболее экономных алгоритмов/восста- навливающих функции f$F С ТОЧНОСТЬЮ ДО 8;с. помощью таблиц (F). _ . ' • . Л- О plog^>aFtfe(F), где а,р— некоторая константа, определяемая классом,функ- ций F и не зависящая от р, k и в. 2) Существуют метода составления таблиц Т? (f), для кото- рых plogtH<Me(F), где рр— некоторая константа, зависящая лишь от класса F табулируемых функций. В частности, к таким методам сос- тавления таблиц относятся методы, основанные на запо- минании коэффициентов фрагмента ряда Тейлора функций. Для некоторых классов F функций в [91 получены приб- лиженные выражения для абсолютной е-энтропии F. Они позволяют уточнить приведенные оценки параметров слож- ности таблиц функций соответствующих классов. К сожалению, классы F, для которых получены оценки сложности таблиц, выделены сугубо формальными свойства- ми функций. На практике обычно возникает потребность 49
в составлении таблиц функций, отвечающих реальным явле- ниям и процессам и классифицируемых по содержатель- ным признакам. Можно, однако, полагать, что рабочий аппарат, изложенный в [9], окажется] полезным для оценки сложности соответствующих таблиц $ для разработки ме- тодов наиболее экономного использования памяти вычис- лительных машин. Сложность и закон необходимого разнообразия 1. К законам кибернетики часто относят закон необхо- димого разнообразия У. Р. Эшби [48]. Как и многие дру- гие утверждения, декларировавшиеся на ранней стадии развития кибернетики, этот закон сформулирован в недо- статочно четких терминах и апеллирует к интуиции чита- теля. Одна из формулировок закона необходимого разно- образия (которая, скорей, навеяна духом работ У. Р. Эшби, чем вытекает из его рассуждений) такова: для нормального функционирования управляемой системы, обеспечиваю- щего полное использование ее потенциала, требуется, чтобы разнообразие управляющей системы было не мень- ше разнообразия управляемого объекта. При этом поня- тия «нормальное функционирование» и «разнообразие» не уточняются и в различных работах толкуются по-разному. Различные авторы интерпретируют термин «нормальное функционирование» как «устойчивое поведение» или «пре- бывание в состоянии гомеостазиса» или «целеустремленное развитие». Термин «разнообразие» толкуется как «число степеней свободы», или как «сложность», так или иначе определенная на эвристическом уровне. Сам У. Р. Эшби — по специальности биолог, чуждый формально-логического способа выражения своих мыслей,— и не пытался уточ- : нить основные понятия закона необходимого разнообразия, ’ интуитивно (и, наверное, справедливо) полагая, что в каж- i дой конкретной области профессионал это сделает лучше, а приемлемая для всех (или для многих) достаточно строгая и в то же время содержательная формулировка закона, если ; она вообще возможна, отшлифуется со временем. ] Проявления закона Эшби встречаются на каждом шагу. | Качественные выводы из закона необходимого разнообра- | зия естественны и не слишком чувствительны к уточнению понятий, используемых в формулировке закона. Ясно, например, что если объект управления обладает большим ] 50 j
разнообразием — многими состояниями равновесия, поз- воляющими приспосабливаться к возможным возмущениям среды, то рациональная управляющая система не должна ограничивать потенциальных возможностей объекта. Струк- тура и производительность (разнообразие) управляющей системы должны обесйечить отслеживание поведения среды и адаптацию объекта к состоянию среда. Закон Эшби стихийно проявляется и в проблемах орга- низации. Чтобы исключить конфликтные ситуации в орга- низационных системах, необходимо, в частности, опреде- ленное соответствие между возможностями (разнообразием) коллектива и руководителя. Управляющий долж'ен обла- дать качествами, позволяющими использовать потенциал коллектива. В противном случае следует либо увеличить, разнообразие управления — заменить руководителя более подходящим, ввести промежуточное звено, либо, если это по каким-то причинам невозможно или нецелесообраз- но, сократить разнообразие объекта — «затрубить» кол- лектив —‘ перевести Членов коллектива, чей потенциал полностью не используется, в другое (желательно более подходящее) подразделение. Как видно, в данном случае закон необходимого разнообразия вполне согласуется с первым законом Паркинсона. Приведем еще пример стихийного проявления закона необходимого разнообразия. Вся сознательная жизнь человека представляет собой непрерывную цепь выбора решений. Разрешить возникаю- щую задачу — значит, изменить ситуацию желаемым обра- зом. Чтобы человек был в состоянии это сделать, он должен обладать большим разнообразием, чем ситуация, которую он старается изменить. Разнообразие лица, принимающего решение, определяется его физическими и материальными возможностями и моральными принципами — ограничени- ями на выбор средств достижения цели. Разнообразие си- туации определяется факторами, подлежащими учету, и трудоемкостью их изменения в желаемом направлении. Задача оказывается неразрешимой для лица, принимаю- щего решение, если его разнообразие не соответствует разнообразию ситуации. В поисках путей преодоления про- тиворечий человек пытается сократить разнообразие ситу- ации — упростить постановку задачи, умерить свои жела- ния или повысить свое разнообразие (расширить свои материальные возможности или снизить ограничения, Qtt- ределяемые моральными принципами). К сожалению, йе- 61
редки случаи, , когда разрешимость задачи достигается ;! «наиболее экономным путем» — за счет пренебрежения мо- . ральными ограничениями. Из медицинской практики изве- стно, однако, что преодоление противоречий за счет уступок ‘ в принципах может приводить к психическим срывам. 2. На практике далеко не всегда можно рассчитывать 1 на стихийное проявление закона необходимого разнообра- 1 зия при установлении рационального соответствия между | объектом управления и управляющей системой. Обоснован- 1 ное проектирование управляющих устройств для сложных 1 объектов требует четкого определения условий согласова- | ния и, в частности, понятия «разнообразие». ? Известны работы^ в которых предлагается основывать | согласование управления и объекта по соответствию.между 1 алгоритмическими сложностями объекта управления и системы переработки информации, реализуемой управляю- г щим устройством. . .. Объект и система управления характеризуются различ- » ными параметрами. Параметры объекта определяются его | возможными состояниями и механизмом. переходов из , сое- : тояния в состояние и существенно зависят от целевого наз- начения объекта. Параметры управляющего устройства. | определяются его. структурой, объемами различных типов. I памяти, скоростью выполнения тех или иных операций. I Объект управления создает рабочую нагрузку для управ-. I ляющего устройства. • I В качестве эффективной меры рабочей нагрузки пред- | лагается использовать сложность объекта. Управляющий 1 вычислительный комплекс не должен снижать потенциал | управляемого объекта. Его сложность поэтому не должна быть меньше сложности объекта. Таким образом, алгорит- мическая сложность выступает здесь ^ак мера разнообра- | зия.^Выбор системы управления сводится, следовательно,- К выбору, наиболее экономного вычислительного комплек- са, сложность которого не меньше сложности управляемого. объекта.. , ; ji Для практического использования подобного подхода' необходимо связать сложность объекта и сложность вычис- л лительного комплекса (точнее, их оценки)* с технико-эко- номическими параметрами управляемого объекта и системы управления и учесть, таким образом, соответствие между л логическими моделями объекта и управления и их физиче-., скими образами. .Это трудоемкая задача, которая вряд ли ' может быть решена без продуманной идеализации объекта 52
й системы управления (например, в виде конечных автома- та) и рационально организованного имитационного моде- лирования. Трудоемкость решения задачи обусловлена, кроме того, тем, что алгоритмическая сложность — невы- числимая функция. Поэтому возникают дополнительные проблемы, связанные с выбором подходящей мажоранты сложности или с сужением класса рассматриваемых систем. В частности, исследования упрощаются, ecjjn ограничиться системами с заданными параметрами. Известны некоторые небезуспешные попытки установле- ния таким ббразом соответствия вычислительной систе- мы и объекта управления. Они позволили выявить пере- груженные звенья управляющей системы и прогнозировать пути развития системы по мере эволюции объекта. Законы сохранения (массы, энергии, импульса) или связанные с ними вариационные принципы в задачах есте- ственных наук определяют область допустимых изменений процессов неживой природы. Из множества возможных движений реализуются лишь те, которые оптимизируют не- которые функционалы или попадают в некоторые области, допускаемые соответствующими законами сохранения. За- коны сохранения, таким образом, участвуют в формиро- вании моделей явлений и процессов в науках о неживой природе. В моделях принятия решений — в планировании, управлении, проектировании и организации — область до- пустимых решений определяется обычно балансовыми соот- ношениями. Дополнительные неравенства, устанавливае- мые законом необходимого разнообразия, сужают-область рациональных решений, выделяя из нее только те решения, которые гарантируют согласованность объекта управления и системы управления. 3. В некоторых работах по сложным динамическим сис- темам под нормальным функционированием подразуме- вают поведение, обеспечивающее пребывание управляемого объекта в гомеостатическом состоянии, т. е. в состоянии, при* котором существенные характеристики объекта не вы- ходят из некоторой благоприятной для его жизнедеятель- ности области. Такие системы называют гомеостатическими. Гомеостатические системы состоят из пассивной и актив- ной подсистем— из собственно объекта и управляющего Устройства. Управляющее устройство возвращает систему в гомеостатическое состояние при небольших возмущениях объекта, вызываемых средой обитания системы- Таким обра- зом, активная подсистема обеспечивает сохранение гомео- 53
стазиса системы в заданном диапазоне изменения характе- i ристик среды. В соответствии с законом Эшби разнообра- ’ зие активной подсистемы (АП) должно быть не меньше раз- i нообразия пассивной подсистемы (ПЛ). Под разнообразием управления и объекта подразумевается в данном случае ; подходящая для изучаемой конкретной ситуации компо- нента сложности активной подсистемы (Сдп) и пассивной подсистемы (Сйп). Чтобы система при ожидаемых измене- ниях среды не выходила из состояния гомеостазиса, необ- ; ходимо, чтобы было Выражая Сдп и Спп через параметры, подлежащие регулированию, получаем огра- ; ничения на их выбор, вытекающие из закона необходимого < разнообразия. Проблема поддержания гомеостазиса приобретает сей- час особый интерес в связи с экологическими задачами. Природа и люди, представляют собой единую систему, в которой на разных этапах эволюции неживая природа и । человеческое общество являются пассивной или активной подсистемой. Состояние гомеостазиса, в котором находит- ся система, включающая человека и биосферу, определяет благоприятные условия для жизни. Человек в процессе производственной деятельности меняет параметры био- сферы и сам непрерывно адаптируется к изменяющимся ус- ловиям Существования, сохраняя при этом гомеостазис системы. Но приспособительные возможности человека и природы ограничены. Рассогласование в развитии биосфе- ры и человеческого общества чревато нарушением гомеоста- зиса системы и может подорвать основу современной циви- лизаций. Производственная деятельность человека оказывает на природу как разрушительное, так и восстанавливающее дей- | ствие. Поддержание гомеостазиса требует превышения раз- j нообразия восстанавливающих процессов над разнообра- j зием разрушительных действий. Разнообразие восстанови- | тельных механизмов должно превышать разнообразие I процессов, разрушающих природу. Разработка моделей | взаимодействия природы и общества и методов решения 1 возникающих здесь проблем—основная задача экологии—I науки о собственном доме. | Постановка экологических проблем должна быть согла-1 сована с динамикой эволюционных процессов. Конечно, f основная угроза равновесию между природой и обще-1 ством связана с опасностью ядерного конфликта. Однако | следует иметь в виду, что не только ядерная катастрофа, j 54 $
н0 и незаметные изменения антропогенной нагрузки на биосферу могут вывести траекторию эволюционного про- цесса в область, не приемлемую для жизнедеятельности человека. Неконтролируемое развитие производства грозит существованию человеческого рода. Одной из актуальнейших задач человечества становится управление эволюционными процессами в масштабе плане- ты. Координация развития общества и окружающей среды требует согласованных усилий специалистов естественных и общественных наук. Следует полагать, что в формировании теории управле- ния эволюционными процессами и в разработке количест- венных и качественных методов анализа глобальных реше- ний далеко не последнюю роль будут играть интенсивно развивающиеся сейчас методы оценки различных компо- нент сложности явлений и процессов, определяющих разру- шительные и восстановительные воздействия человеческого общества на окружающую его среду. 4. Одна из наиболее интересных задач, встречающихся в науках о природе и Обществе,— это проблема развития. Еще несколько десятилетий назад подчеркивалось раз- личие в принципах развития систем неживой и живой при- роды. Развитие замкнутых систем неживой природы — эволюция вещества в изолированных средах — в соответ- ствии со вторым Началом термодинамики приводит к уве- личению разнообразия, к возрастанию неупорядоченности. Эволюция неживой материи направлена к непрерывной дез-. организации и приводит ее к наиболее вероятному состоянию максимального беспорядка. Напротив, процессы развития живых систем — их эволюция от наименее со- вершенных биологических макромолекул и микроорганиз- мов до , высокоорганизованных биологических видов — характеризуются в соответствии с эволюционной теорией снижением разнообразия.— совершенствованием организа- ции. Ч. Дарвин объяснял необратимую эволюцию к более организованным структурам в живых системах действием естественного отбора, который благоприятствует исключе- ниям и приводит к тому, что исключения — организован- ные структуры — постепенно становятся правилом. Это объяснение^ однако, не устраняет противоречие со вторым началом термодинамики и не снимает вопроса о том, при- менимы ли законы физики к изучению живых систем. В последние десятилетия обсуждение этой проблематики продвинулось Далеко вперед. Показано, что законы эволю- 55
ции Живого не противоречат второму началу термодинами- । ки. Живой организм — неравновесная открытая система. В открытых системах вдали от состояния равновесия в ста- ! ционарном режиме уравнения эволюции не исключают спонтанного снижения разнообразия. При определенных, условиях возможна самоорганизация материи.. Для этого следует «питать» систему свободной энергией, которая ис- пользуется для управления определенным^ реакциями/ удерживающими систему от увядания до «мертвого» сос- ‘ тояния. По-видимому, простота самоорганизации выгодна',; для живого организма и поэтому эволюция обеспечила слож- нейшие биологические системы простейшими принципами, управления. Эволюция живого отобрала и сохранила лишь те механизмы управления биологическим объектом, кото- s рые наиболее' экономным образом обеспечивают выполне- 4 ние функций живого организма 1 Влияние теории алгоритмической сложности на математические дисциплины 1. Теории алгоритмической сложности всего 20 лет. | Тем не менее ее влияние, на ряд смежных математических i дисциплин (и на их приложения) уже достаточно сильно * ощущается. Теория алгоритмической сложности позволяет более > совершенным образом, чем построения, основанные на , идеях Р. Мизеса, связать математическую теорию веро-1 ясностей с ее приложениями. Приведем рассуждения t А. Н. Колмогорова по этому поводу. Традиционно, следуя Р. ‘Мизесу, принимали в качестве основы приложений те- ории вероятностей признание гипотезы об устойчивости/ •частот.. Определим это понятие. Пусть результат большого числа п испытаний (например,/ выпадение «орла» и «решки» при подбрасывании не обяза-. тельно правильной монету) записан в виде последователь-; ности нулей и единиц. Будем говорить, что выпадение еди- ницы случайно с вероятностью р, если доля единиц и эта частота существенно не меняется при выборе из по- следовательности любой достаточно длинной подпоследова-? тельности (при этом выбор должен удовлетворять некого-! рым неЖеСткПм ограничениям, которые мы здесь не ого-’ вариваем). Это свойство случайной последовательности,-г 56 .1
на котором основывается практическое применение теории вероятностей, называют устойчивостью частот. Оказывается, что требование устойчивости частот, опре- деляющее допустимость использования теоретико-вероят- ностных законов, может быть заменено другим, проще проверяемым. Именно алгоритмическая сложность после- довательности нулей и единиц, для которой -~ ^Р не может быть существенно больше, чем пН (р)= — п \р log р+ (1 — р) log (1 —р)}. Можно доказать, что устойчивость частот (по Р. Мизесу) автоматически обеспечивается, если алгоритмическая слож- ность двоичной последовательности, отражающей резуль- таты испытаний, достаточно близка к пН (р). Этот принцип может быть сформулирован в терминах различных задач теории вероятностей. В частности, пусть последователь- ность нулей и единиц образует цепь Маркова с матрицей переходных вероятностей Upoll, i, {0, 1). Здесь рм— приближённое значение частот 0 после 0, ри— частота 1 после 0, р10— частота 0 после 1 и рп— частота 1 после 1. Можно вычислить максимальную алгоритмическую слож- ность такой последовательности длины п. Оказывается, что если алгоритмическая сложность конкретной последова- тельности с заданными частотами переходов достаточно близка к максимальной, то для нее автоматически выполня- ются все утверждения теории цепей Маркова. Заметим, что в приложениях теории случайных про- цессов далеко не всегда имеются содержательные аргумен- ты считать процесс марковским. Непосредственная' про- верка устойчивости частот матрицы переходов по резуль- татам наблюдений — неконструктивная процедура. Оценка сверху алгоритмической сложности последовательности ре- зультатов испытаний —-существенно более простая задача. Таким образом, теория алгоритмической сложности ука- зывает достаточно конструктивные критерии допустимости использования конкретных экспериментальных статис- тических материалов для обоснованных' предсказаний сос- тояния случайного явления или поведения случайного процесса., 2. Теория алгоритмической сложности оказала рево- люционизирующее влияние на логические основы теории информации.. Традиционная теория информации представля- ет
ет собой раздел теории вероятностей и как таковая имеет дело с массовыми, а не с индивидуальными явлениями. Новые принципы построения теории информации не тре- буют рассмотрения конкретного объекта как реализации некоторого массового явления и не связаны с обработкой статистического материала и использованием вероятностных закономерностей. Таким образом, теория информации, ос- нованная на логических принципах алгоритмической слож- ности, может предшествовать теории вероятностей, а не опи- раться на нее. Шенноновская теория информации и фундаментальные теоремы о передаче информации по своему смыслу приме- нимы только в узкой области, связанной со статистической теорией связи. В теории передачи информации интерес представляют лишь частотные закономерности передавае- мых текстов. По словам А. Н. Колмогорова, «вероятност- ный подход является естественным в теории передачи по каналам связи, передающим «пакеты» информации, состоя- щие из большого числа не связанных или слабо связанных сообщений, подчиняющихся определенным вероятностным закономерностям» ([22], с. 6). Поскольку традиционное определение «количества ин- формации» использует только вероятностные концепции, то вопросы типа: «Каково количество информации в одном физическом законе относительно другого закона или в од- ной математической теореме о другой теореме?» не имеют смысла. Однако такие вопросы вполне естественны и ос- мысленны при новом алгоритмическом подходе к теории информации. Точно так же корректными становятся вопро- сы о количестве информации, содержащейся в отдельной книге, в конкретной картине или в определенном организ- ме. Больше того, используя алгоритмическое определение условного количества информации в х об у, можно ставить вопрос о количестве информации, которое получит конкретный объект с фиксированным тезаурусом х от предъявленного ему индивидуального, объекта у. И при этом не возникает необходимости вводить ансамбль всех возможных таких объектов и задавать на нем распределение вероятностей. Правда, между содержательной постановкой вопроса и разработкой конструктивных методов подготовки ответа весьма большая дистанция. Здесь должны быть преодолены серьезные трудности. Однако можно ожидать, что эти трудности носят главным образом технический ха- рактер. Следует также помнить, что ответы на поставленные 58
вопросы могут быть получены с точностью до константы, определяемой выбором универсальной «структуры», отно- сительно которой производится оценка. Это означает, что алгоритмическая теория информации применима лишь к большим массивам информации, по отношению к которым константы, лежащие в основе теории, пренебрежимо малы. Тем не менее можно считать, что первый шаг в новом пер- спективном направлении оценки информации, содержащей- ся в индивидуальных объектах, сделан. Намечены прин- ципы накопления новых знаний, наиболее экономным об- разом использующие имеющиеся знания. 3. Утверждения, доказанные в теории алгоритмической сложности, представляют интерес и за пределами теории вероятностей и прикладной теории информации. В част- ности, ряд результатов. теории сложности, по мнению А. Н. Колмогорова, имеет принципиальное значение с точки зрения исследований по основаниям математики. В качестве примера А. Н. Колмогоров приводит одну теорему Барздиня. Утверждение теоремы может быть использовано для некоторых выводов по расширенной пос- тановке X проблемы Гильберта. Этот пример стоит того, чтобы его обсудить. Напомним предварительно определение понятия «пере- числимое множество», используемое в формулировке теоре- мы Барздиня. Пусть £□. = {!, 2, 3, ...}—множество натуральных чисел, —m-кратное декартово произведение Z+ на себя. Множество jWc:Z+ называется перечислимым, если су- ществует такая частично-рекурсивная функция /, что М= =Д/ (т. е. М является областью определения /). Интуи- тивный смысл перечислимого множества таков:, существует программа, которая распознаетэлементх € М, но, возможно, не умеет распознавать элементы xgZ^, х(£М. Другими словами, перечислимое множество — это множество, все элементы которого мбгут быть получены с помощью неко- торой «порождающей» его программы.. Рассмотрим бесконечную двоичную последовательность х = {х1, .... хА, ...}, в которой множество номеров и с х„ — 1 перечислимо. Обозначим через х" = (х1( ..., х„) начальный фрагмент, длиной п последовательности х. Если бы было перечислимо и множество номеров нулей, то Функция f(n) — xn была бы вычислимой и сложность К (хп | п) вычисления по номеру п фрагмента х” была бы ограниченной. Но в общем случае (при перечислимом мно- 59
жестве номеров единиц) Д' (хп | п) может неограниченно возрастать. Теорема Барздиня дает оценку роста K.{xn\nh Имеет место утверждение: для двоичной последователь- ности с перечислимым множеством единиц М К (хп | п) log п 4- С, причем существуют такие последовательности, для кото- рых при любом п . : г . Д' (Х“ | П) >’ 10g П. Напомним теперь X проблему Гильберта и укажем, ка- кие прогнозы можно получить из теоремы Барздиня при расширений этой проблемы. Д. Гильберт сформулировал свою X проблему следую- щим образом. Пусть задано диофантово уравнение с произвольным’ числом неизвестных и целыми коэффициентами. Требуется указать способ, при помощи которого можно после конечного числа операций установить, разрешимо ли это уравнение в целых числах. — Диофаятовы уравнения -могут быть закодированы ко- нечными текстами — конечными последовательностями дво- ичных знаков. Поэтому множество всех диофантовых урав- нений может быть перенумеровано натуральными числами: Получим последовательность диофантовых уравнений ,Dn. В этих терминах X проблема Гильберта может быть пере- ; формулирована следующим образом: существует ли общий алгоритм, позволяющий установить, имеет ли уравнение". - * решение в целых числах. В конце 60-х годов Ю. В. Матиясевич решил эту труд- ную проблему, поставленную в начале века, и доказал; = что такого алгоритма нет. Можно, однако, расширить^ постановку проблемы й поставить вопрос о существовании | алгоритма, позволяющего выяснить, имеют ли целые' шения первые п диофантовых уравнений при получении! некоторой дополнительной информации J п с заданным по-| рядком роста количества этой информации с ростом п.^ . Теорема Барздиня показывает, что этот рост может быть| очень медленным: logn+C. А. Н. Колмогоров считает^ что этот фундаментальный результат — не единственной приложение теоремы Барздиня к основаниям математики. 60 • ♦
Предвидимые приложения теории алгоритмической сложности Как мы видели, теория алгоритмической сложности узке играет заметную роль в математической логике, в теории вероятностей, в теории информации, в основаниях матема- тики. Представляется, однако, что приложения алго- ритмической сложности не ограничиваются смежными ма- тематическими дисциплинами. Мы уже подчеркивали наше убеждение в том, что на основные утверждения, теории алгоритмической сложности можно смотреть как на сфор- мулированные в абстрактных терминах законы природы. Направление, в котором следует ожидать интерпретации формальных закономерностей, теории сложности в содер- жательных термина^,— это, по-видимому, эволюционная теория в самом общем виде — возникновение и эволюция га- лактик, возникновение и эволюция Солнечной системы й Земли, химическая эволюция, возникновение жизни и биологическая эволюция, эволюция всей биосферы и от- дельных ее цидов. Представляется, что больше всех других дисциплин, подгцтовленй к восприятию идей теории Слож- ности биология (точнее, биофцзцка) и, в частности, генетика. Принципы алгоритмической Сложности, по-видимому, со временем скажутся на подходах к проблемам пЬстаноЬки и решения организационных задач в . болыйих коллективах и больших взаимодействующих'технических структурах. Информационное содержание структуры — это минималь- ное число инструкций, необходимых для ее задания. Для задания сложной структуры необходимо много инструкций. Простая повторяющаяся . структура может Сыть задана небольшим числом инструкций. Кардинальная особенность живых организмов и эффективных целенаправленных кол- лективов.— это их высокая организация — сложное взаи- модействие, порождённое эволюцией. Уже рпубликован ряд работ, в которых идеи алгоритмической сложности ис- пользуются для определения информационного содержания живого организма. Это пока главным образом работы спекулятивного характера. Некоторые гипотезы По поводу степени организации и • активности «живого» содержатся в статье известного специалиста по теории сложности Грего- ри Дж. Шайтина (42]. В ней содержатся и оригинальные формальные результаты, и список литературы по тёме «Сложность и жизнь». Более фундаментальные, но суще- ственно менее формализованные идеи по этой проблематике
содержатся в работах-биологов, физиков и главным обра- зом биофизиков Г. Кастлера, М. Эйгена, И. Пригожина; | М. В. Волькенштейна, Д. С.. Чернявского и др. j В капитальном труде лауреата Нобелевской премии | М. Эйгена [46] доказана принципиальная возможность * возникновения порядка в открытой системе и снят с обсуж- 3 дения вопрос о мнимом противоречии биологической эво- люции второму началу термодинамики. Миру априори не? грозит тепловая смерть. Эволюция живой материи в полном' соответствии с законами физики и химии способна обеспе- • чить возникновение новой информации, совершенствовал а ние организации. Исходный материал для эволюции — j случайные ненаправленные мутации. Управляющие факто-1 ры эволюции — естественный отбор и сложившийся к мо- | менту отбора тип структуры и развития системы (организ-1 ма). «Технологической базой» эволюции живой природы на | всех уровнях, начиная с молекулярного, является стандар- | тизация — комбинирование новых структур из. ограничен-г? ного числа элементов, сформировавшихся на предбиологи- ческой стадии эволюции. При другой технологии, связан- * ной, например, с перебором всевозможный мутаций, вероят- | ность возникновения жизни за время существования Все-1 ленной была бы ничтожно мала. Математическая модель эволюции на том или ином уррв-| не представляет собой систему обычно нелинейных диффе- ? ренциальных уравнений (обыкновенных или в частных | производных в зависимости от того, учитывается ли влия-1 ние пространственных координат на скорость изменения и ? другие параметры взаимодействия элементов системы). ? Переменные кинетических уравнений в соответствии с рас- сматриваемым уровнем эволюции представляют собой кон- центрации реагирующих веществ, число микроорганизмов или их суммарную биомассу, численность вида. Уравнения ; эволюции связывают скорости изменения переменных, * описывающих развитие системы, с характеристиками вза- имодействия ее элементов. _ В последние годы в биофизике исследуются различные варианты моделей эволюции — кинетические уравнения,, , определяющие траектории эволюционного процесса, изу- чаются химические, биологические, энергетические и ин-| формационные аспекты самоорганизации материи. Основной! вывод, к которому приводит качественный анализ уравне-| ний эволюционного процесса, заключается в том, что воз- * никновение жизни и последующая биологическая »эволю- j 62 _ Ч ¥
цИЯ — явления возрастания упорядоченности открытой, далекой от равновесия диссипативной системы. Представ- ляется, что удачная формализация этого тезиса, от которой следует ожидать не только качественных, но и количест- венных оценок эволюционного процесса, может быть полу- чена в терминах алгоритмической сложности. Пусть y(t)— траектория эволюционного процесса; Она зависит от начальных условий 3, от экологической ситуа- ции, в которой протекал процесс, и от реализации управ- ляющего фактора — естественного отбора. Прогноз эво- люционного процесса на этапе t требует знания истории,' т. е. последовательности z/t-1={t/(O), y(t— 1)}, и стимула, определяющего ход развития. Неживая материя в соответствии со вторым началом тер-, модинамики эволюционирует к состоянию максимальной неопределенности — к термодинамическому равновесию. Эволюция живой материи — открытой системы, далекой от равновесия,— стимулируется стремлением к накоплению полезной (ценной) информации, способствующей повыше- нию упорядоченности системы. Под мерой ценности информации здесь естественно под- разумевать величину 7(ИО$'_1)=/(//(*)|0(О). y(t—1)), которая в комбинаторной трактовке теоретико- информационных понятий вычисляется как разность между сложностью системы на этапе t и ее условной сложностью на этом этапе, определяемой фрагментом у*~* эволюцион- ного процесса. Чем больше ценность информации, тем луч- ше организована, более упорядочена система на этапе I. Это значит, что естественный ход эволюции приводит к росту / (у (i)\y (0), • • •;у а- l))=K(y (1))—К(у W1). Условия протекания эволюции не произвольны, а свя- заны определенными ограничениями, в частности ограни- чениями экологического характера. Установление этих ограничений дает основания для построения мажоранты сложности K(y(i)) и условной сложности /((</(01#*"1). Таким образом, может быть описана область, в которой организация (упорядоченность) системы возрастает. При этом возникает и принципиальная возможность учета ант- ропологического вмешательства в естественный ход эво- люции. 3 Если бы жизнь возникла и развивалась вновь, ход Эволюции был бы, по-видимому, иным. 63
вычислительная сложность; Меры сложности вычислений! 1. Алгоритмическая сложность — предмет рассмотрев ния предыдущей главы (К (у, х)' и К (х)) — введена для| оценки сложности решения индивидуальных задач и слож-t ности описания индивидуальных объектов. В теории вы-? числений существенный интерес представляют характера-J стики сложности массовых задач — классов X «однотип- j ных» индивидуальных задач х.. . | Зафиксируем способ кодирования индивидуальных, задач | и способ кодирования их решений. Можно считать соответ-? ствующие' коды элементами множества целых неотрицатель- ? ных чисел Z={0, 1, 2,. . . }. Тогда каждой массовой задаче й соответствует функция f : Z -+Z. Функция / (х) — это код у j решения индивидуальной задачи, код "условий которой х.| Будем говорить, что массовая задача разрешима на машине | со структурой ф(х, р), если найдется- программа р; для) которой ф(х, р)=/(х) Vx£Z. Иначе говоря, класс задач | разрешим, если существует программа, позволяющая найтк| решение .любой задачи класса пр предъявленному eq уело-1 вию. Подобных программ, разумеется, , йбжет быть много.! Минимальную из длин таких програ!мм естественно назы- вать статической алгоритмической ’ сложнрСт’ьк) соответ- ствующёго класса задач. Будем обозначать эту характери-| стику /<ф$). Таким образом^ . .. кzft_/т'п/(Р)ГД:Ф(*- />)=/(*). loozVpgS Эх€Х Ф.(х, p).^=f(x): - ‘ -J Здесь по-прежнему 3 — множество всех допустимых про- грамм. (Если кодирование задач и решений проводится в« двоичных последовательностях, то 3.— множество всех J двоичных последовательностей.) Как и для алгоритми-| ческой сложности индивидуального объекта, можно по-| казать, что существуют универсальные (оптимальные) струк-| туры ф, такие, что любая задача, разрешимая на машине| любой структуры <р, разрешима и на машине структуры причем где С*, — константа, завися-^ щая только от структур ф и ф. | Массовые задачи, разрешимые на машине универсаль-| ной структуры (это в точности задачи, которые отвечают! вычислимым функциям /),.называются алгоритмически раз- 64 • 1
решимыми. Соответственно (для фиксированной оп- тимальной структуры ,ф) будем называть статической ал- горитмической сложностью массовой задачи класса задач f и обозначать К (f). Таким образом, алгоритмическая сложность массовой задачи — это сложность описания алгоритма решения задач данного класса. Она оценивает минимально возможную длину программы решения фиксированной массовой проб- лемы, но не дает представления о динамических (внешних) характеристиках вычислительного процесса. Алгоритми- ческая сложность класса задач не позволяет судить о тру- доемкости вычислений при решении любой индивидуальной задачи и оценивать средние или максимальные затраты времени, памяти и других ресурсов, необходимых для ее решения. А ведь именно'эти вопросы главным образом и представляют интерес для вычислителя. Часто оказывается, что сокращение длины программы приводит к существен- ному увеличению времени счета и потребной памяти,. Известны задачи (например, так называемые переборные задачи), для которых существуют весьма простые алгорит- мы с короткими программами, однако получение решения с помощью этих простых программ требует астрономического числа вычислений. Встречаются и алгоритмы с громоздкими программами, которые тем не менее сравнительно быстро приводят к цели. Таким образом, для более полной оценки вычислительного процесса следует дополнить внутреннюю характеристику трудоемкости процесса — алгоритмическую сложность — внешними, позволяющими оценить минималь- ные затраты различных вычислительных ресурсов на реше- ние задач класса. Чтобы проиллюстрировать, к чему может привести недооценка всесторонней характеристики вычислительного процесса, приведем следующий (сообщенный нам Б. Т. По- ляком) курьезный случай. В 1972 г. в № 2 журнала «Математическое программи- рование» появилась за подписью Anonitnus статья «Новый алгоритм оптимизации». Статья написана на сугубо фор- мальном языке, свойственном многим абстрактным мате- матическим работам. За частоколом определений, лемм, теорем трудно было разобраться в содержательной струк- туре метода, а приведенная на некоем фантастическом язы- ке программа вычислений не способствовала уяснению принципов, на которых основан предлагаемый метод. В библиографии, на которую ссылался автор, фигурировали 3 5-987 fiC
Гаусс, Бурбаки, неопубликованная статья автора и част, ноё„ .сообщение. • , Для демонстрации достоинств «нового» метода и его прещ муществ по сравнению с известными алгоритмами автор приводит таблицу, в которой различные методы сравни, ваются по 10 критериям. Среди них применимость метода д дискретным задачам, к оптимизации негладких и невыпук- лых функций, длина программы (в наших терминах алгоритмическая сложность), наличие доказательства схо- димости и др. Показано, что по 9 из 10 критериев «но> вый» метод имеет решающее преимущество по сравнению с известными. Лишь по последней характеристике — по вы- числительным ресурсам, потребным для решения задач (в нашей терминологии — по компонентам вычислительной сложности), в работе отсутствуют данные' как по «новому! методу, так и по существующим. Тем не менее явное пре- восходство «нового» метода по 9 из 10 критериев оценки дало автору основание рекомендовать предлагаемую им процедуру как «универсальный метод оптимизации», кото- рый следует предпочесть ранее разработанным. < Как оказалось, за нарочито чрезмерно формализован; ным абстрактным описанием «нового» метода скрывался обычны^ полный перебор, а автором статьи-шутки был известный математик Филипп Вулф. Отношение массового потребителя вычислительных алгоритмов к аргументации статьи характеризует то, что, по сообщению Ф. Вулфа, многие читатели восприняли эту пародию всерьез. Таким образом, алгоритмическая сложность и вычисли^ тельная сложность характеризуют различные аспекты вы- числительных процедур. Объективная оценка трудоемко- сти вычислений должна учитывать различные компоненты сложности. • Статическая сложность решения задач фиксированного* класса — скалярная величина. Сложность вычислитель- ного процесса — функция, аргумент которой определяется индивидуальной задачей класса. Различные алгоритм^ всегда сравнимы между собой по длине («объему») программ мы, а процессы вычислений могут быть несравнимы пй сложности. Для разных задач класса (для разных значений аргумента вычислительной сложности) те или иные процес- сы вычислений могут оказаться более экономными. Длй алгоритмов, таким образом, может быть установлена слож- ностная иерархия, а характеристики классов задач, осно* ванные на мерах сложности вычислений, лишь частично 66 ?
порядочены. Для каждой вычислимой функции (для каж- дого класса задач, или, что то же, для каждой массовой проблемы) можно упорядочить по минимальному объему программы все алгоритмы, позволяющие решать задачи этого класса. С упорядочиванием алгоритмов по вычисли- тельной сложности ситуация менее прозрачна й возможные утверждения более расплывчаты. Однако об этом несколько позже. Для оценки эффективности и трудоемкости вычислитель- ных процессов в зависимости от ситуации используются статистические или динамические меры сложности. В тех случаях, когда время программирования и трудоемкость программирования велики или когда программа исполь- зуется редко, подходящей характеристикой процесса вы- числений является объем программы. В случаях, когда программа используется часто или .потребности в ресурсах ЭВМ велики, целесообразно оценивать вычислительный процесс составляющими его вычислительной сложно- сти. Рассмотрим пару (А, х), где А — алгоритм решения мас- совой проблемы (класса задач), ах — индивидуальная задача класса. Вычислительный процесс характеризуется функциями сложности рА(х), называемыми сигнализирую- щими вычисления [38]. Чтобы упростить сравнение вычис- лительных процессов, целесообразно характеризовать ре- шение массовых проблем верхними и нижними оценками сигнализирующих. Получить верхнюю оценку р сигнали- зирующей ^д(х), значит, показать, что существует алго- ритм А, решающий массовую проблему f(x) с характери- стикой сложности; не превосходящей р. Сигнализирующая рд (х) имеет нижнюю оценку р, если для любого алгоритма А, решающего задачи х класса f(x), сигнализирующая рА(х) не меньше р. Чем ближе друг к другу р и р, тем точнее охарактеризована соответствующая компонента вы- числительной сложности. Рассматриваются также «сред- ние» и гарантированные оценки сигнализирующих и зави- симости этих оценок от размерности задачи. 2. В теории вычислений рассматриваются следующие меры сложности. (1) Сигнализирующая времени tA(x), равная числу ша- гов, которые совершает алгоритм А, будучи применен к слову х (число шагов, необходимых алгоритму А для реше- тя индивидуальной задачи х). Иногда используются также 3* 67
функции iA(X) = max iA(x) н iA(n)= maxtA(x), xeX . Ul=n где |x|— длина слова x (или размерность задачи х, при* надлежащей данному классу X). Меры сложности вычисли ний tA (X) и ~tA (и) относятся к худшему случаю и дают га* рантированные оценки затрат времени на решение задачи фиксированного класса и фиксированной размерности. Гарантированные оценки сложности ^массовой проблемы часто оказываются чрезмерно завышенными. Задачи х, на которых они достигаются, могут встречаться крайне редко. Например, для симплексного метода в линейном программировании построены искусственные примеры, в которых временная сложность экспоненциально растет с: ростом размерности задачи. Между тем на практике сим- плекс-метод оказывается весьма эффективным.- Более реа- листичны оценки временной сложности «в среднем». Одна- ко далеко не всегда имеются основания определить частость; возникновения тех или иных задач данного класса. i । Анализ вычислительной сложности требует также оценки таких временных сигнализирующих, как t (X) = min tA (X) и t (п) — kiin (п), где в зависимости, от исследуемой пробч, лемы минимизация производится по всевозможным алго-г ритмам или по алгоритмам некоторого фиксированного^ класса. % Сигнализирующая времени tA(x) характеризует время! работы алгоритма А, затрачиваемое на решение задачи х! (от момента записи входной информации до получения! результата). I (2) Сигнализирующая емкости 5л(х), равная числу? ячеек памяти, к которым хотя бы раз происходило обраще-j иие в процессе вычисления слова х (решения' задачи х) cj помощью алгоритма А. Аналогично вводятся 5Л(Х)=- = тах5л(х) и SA(n) = тахЗл (х). Все рассуждения об| хеХ |х|=п . *’# оценках «по наихудшему случаю» и «в среднем», приве-| денные по отношению к сигнализирующей времени, nepe-f носятся, естественно, и на сигнализирующую емкости^ Сигнализирующая емкости характеризует -объем памяти,| необходимый для решения задачи. | (3) Сигнализирующая колебаний (поворотов) ®л (х) опре*| деляется для машин Тьюринга, вычисляющих слово х. в| «8- 1
соответствии с алгоритмом А как число изменений направ- ления при движении считывающей головки вдоль ленты. Аналогом сигнализирующей ©д(х) является количество циклов в программе для реальной машины, которые нару- шают «естественный» ход программы. (4) Сигнализирующая режима гА(х) определяется для машины Тьюринга как число переходов из ячейки в ячейку, которые совершает алгоритм А, будучи применен к слову х. Сигнализирующая гА (х) учитывает только те рабочие так- ты, при которых считывается новая информация. Для ре- альных адресных машин выполнение каждой команды сопровождается обращением к памяти. Поэтому аналогом сигнализирующей режима является число обращений к долговременным запоминающим устройствам-накопителям на магнитных лентах, дисках, барабанах и т. д. В теории вычислений рассматриваются и другие меры сложности, удовлетворяющие некоторым естественным ус- ловиям — требованиям к характеристикам трудоемкости вычисления. Однако наибольшее внимание в известных работах уделяется временнбй и емкостной сигнализирую- щим. Временная сигнализирующая часто отождествляется с вычислительной сложностью. Для рациональной организации вычислений целесооб- разно учитывать и меры сложности, характеризующие на- дежность вычислений, возможности распараллеливания процесса. решения задач класса, частоту обращения к различным ячейкам и блокам машины..Построение обозри- мых и в то же время достаточно близких к реальным моде- лей вычислительного устройства и выбор сигнализирую- щих устройств и систем математического обеспечения — важная задача прикладной теории сложности. Инвариантные результаты теории вычислений 1. Выше уже указывалось, что сигнализирующие функ- ции могут оказаться несравнимыми между собой. Поэтому, если задана некоторая вычислимая функция, то неясно, су- ществует ли для нее наилучшее (по той или иной мере слож- ности). вычисление. Сравнение классов задач (вычислимых Функций) по вычислительной сложности приходится вести по верхним и нижним оценкам сложности или по так или иначе определенным средним (по задачам класса) значе- ниям сигнализирующих. G9
IS Вмял,ям теории вычислительной сложности зависят q| выбранного вычислительного устройства и выбранной меры вычислительной сложности. Поэтому можно предположить] что переход от одного типа, вычислителя к другому и о? одной сигнализирующей к другой изменит и сложностну^ иерархию функций (например, по верхним или нижний оценкам р или р). В некотором смысле это так и есть н| самом деле. Однако в аксиоматической теории вычисление установлены весьма общие инвариантные результаты. Сут! их в том, что выбор сигнализирующих вычисления и типа вычислителя не может существенно изменить соотношений между сложностями различных классов задач. Если задача! значительно сложнее задачи II, то это отношение coxpal нится при любой естественной сигнализирующей, выбранное в качестве меры сложности, и любом типе вычислителя, ре! шающего эти задачи. 2. Общие закономерности процессов вычисления прояв- ляются лишь при рассмотрении достаточно богатых п( своим возможностям классов объектов. Если интересовать ся,-например, такой «узкой» массовой проблемой, как пер4 множение «-разрядных чисел, окажется, что временны^ сигнализирующие различаются по порядку величины для различных типов вычислительных устройств. Аксиомати- ческая теория вычислений рассматривает гораздо более широкие классы задач и находит в них объекты, для котЫ рых справедливы весьма общие, не зависящие от организа- ции процесса вычисления или устройства вычислителя зако- номерности. ' Приведем пример такого общего результата. Пусть мы имеем две универсальные Вычислительные машины. При этом первая из них обладает богатым множеством операций; гибкой структурой и огромным быстродействием, а вторая во всех отношениях уступает первой — допускает всего несколько операций, имеет жесткую структуру и весьм| низкую производительность. Оказывается, существуют вий числимые функции, для вычисления которых нельзя полу| чить преимущество в скорости вычислений, используя пер| вую машину. Для каждой программы мощной машина существует программа малопроизводительной машины, вй| числяющая ту же функцию быстрее (при достаточно боль- ших значениях аргумента). Однако не существует эффектна* ного способа нахождения такой программы для второ! машины. Доказано лишь, что она существует. Аналоги^ ные результаты можно получить и для любой другой сиг- 70 5
надозирующей вычислений, удовлетворяющей естественным требованиям к мерам сложности. г Заметим, что подобные результаты не зависят от струк- туры используемых машин. Как уже указывалось, наиболее существенная информация о вычислительной сложности — это информация, не зависящая от типа машины. Хорошие алгоритмы имеют тенденцию оставаться хорошими незави- симо от языка программирования или типа машины, на которой они реализованы. Отношение к таким результатам может быть двоякое. С одной стороны, они позволяют описать структуру и закономерности класса вычислимых функций и весьма привлекательны своей законченностью. С другой — эта теория рассматривает задачи., слишком сложные с точки зрения сегодняшней практики. А как утверждает Л. Заде [15], чем сложнее система, тем менее мы способны дать точные и в то же время имеющие практическое значение суж- дения о ее поведении. Это вечное противоречие между воз- можностями теории и требованиями практики стимулирует возникновение новых идей и разработку новых подходов к постановке и решению актуальных задач современности. Классификация по сложности задач дискретной оптимизации 1. Многие задачи планирования в экономике и проекти- рования в технике, будучи формализованы, могут быть записаны как задачи дискретной оптимизации (целочислен- ного- программирования). В формальных терминах решение такой задачи — это вектор параметров управления х с дискретными компонентами (каждая из которых может принимать одно- из нескольких фиксированных значений). Решение задачи оптимизирует заданную функцию /0(х) — показатель качества плана или проекта — при соблюдении ограничений вида j=l,. . т. При линейных функциях, определяющих показатель качества и ограни- чения,— это задача дискретного линейного программи- рования. . В терминах задач дискретного (целочисленного^ линей- ного программирования описываются такие экономические и технические проблемы, как задачи транспортного типа, задачи назначения, распределительные задачи, задачи тео- рии расписаний, задача коммивояжера, задачи логи- 71
. ческого, технологического и надежностного проектирования^ и многие другие задачи комбинаторного типа. Содержатель-1 ному описанию задач, интерпретации и численным методам^ дискретной оптимизации посвящена богатая литература? (см., например, [55] и цитированные в ней работы). Практика решения задач целочисленного программиро- вания выявила некоторые классы задач, решение которых не связано с трудоемкими вычислениями, и многие задачи, для которых до сих пор не найдены Экономные методы реше- ния. Уже давно — лет двадцать назад — было замечено,, что при решении ряда задач дискретной оптимизации любым из известных методов требуется чрезмерно большое число итераций (шагов) и трудоемкость решения быстро растет с’ . ростом размерности задачи. Богатый опыт успешного реше- ния задач линейного программирования большой размер- ности, в которых отсутствовало требование целочислен- ности переменных, породил мнение о том, что трудности,' возникавшие при решении отдельных дискретных задач,— явление временное, связанное с несовершенством разра- ботанных методов дискретной оптимизации и недостаточной производительностью вычислительной техники . тех лет. Ситуация, однако, оказалась гораздо более сложной, чем это предполагалось ранее. 2. В йачале семидесятых годов появились работы, кото- рые дали основание для вывода, что трудоемкость решения, ряда задач комбинаторного типа (впрочем, как и задач орга- низации многих других вычислительных процессов) опре- деляется не преходящими факторами, связанными с несо- вершенством вычислительных методов и невысокой произ- водительностью ЭВМ, а вызвана, по-видимому, принци- пиальными особенностями структуры этих задач. В задачах линейного программирования, в которых переменные не ограничены условиями целочисленности, глобальная информация об условиях задачи полностью определяется локальной информацией о значениях функцио- налов качества и ограничений и их градиентов в любой точ- ке области задания переменных. Этим в известной мере.; определяется относительная простота и эффективность ме-! тодов линейного программирования. В задачах целочислен- ного линейного программирования ситуация иная. Пусть,.: например, все п переменных задачи булевы, т. е. могур принимать только значения 0 или 1. Эго значит, что об-г ласть определения задачи —. множество вершин п-мерного куба. Пои отсутствии априорных: данных о структуре , .72 . "
целевого функционала и матрицы условий локальная ин- формация о значениях функционалов задачи, достигаемых в какой-либо вершине области определения решения, не дает-сведений о значениях, достигаемых этими функцио- налами в соседних вершинах куба. По-видимому, в этом одна из главных причин трудоемкости решения многих задач дискретной оптимизации. Более строгие, однако еще не окончательные суждения по этому поводу (полностью обоснованных выводов еще нет) будут изложены далее. • 3. Мы говорили о легкорешаемых и труднорешаёмых задачах дискретной оптимизации. Как же определить сте- пень трудоемкости вычислительного процесса? По предложению Дж. Эдмондса [45) массовая задача считается легкорешаемой, если существует алгоритм, поз- воляющий решать любую индивидуальную задачу, принад- лежащую этой массовой проблеме, за число шагов (или при числе элементарных операций), не превышающее некото- рый полином от размерности задачи. Соответственно, мас- совая задача трудноразрешима, если не существует алго- ритма, позволяющего решать все задачи этого класса при числе итераций, не меньшем, чем экспоненциальная функ- ция ' от размерности задачи. Таким образом, «хорошие задачи» имеют полиномиальную временную сложность, а сложность «плохих задач» экспоненциальна. Следующие три таблицы (заимствованные из (12] и [37]) дают наглядное представление о сравнительной скорости роста некоторых функций полиномиального и экспоненци- Таблица 1 Оценка времени решения задачи \ Размер- X. ность п Сложность^ . 20 50 100 200 500 1000 1000 я 1000 л log я 100 я2 Ю л3 nlog п 2П/3 2« 3« 0,02 с 0,09 с 0,04 с 0,02 с 0,4 с 0,0001 с 1 с .58 мин 0,05 с 0,3 с 0,25 с 1с 1,1 Ч 0,1 с 35 лет 2.10е век 0,1 с 0,6 с 1 с 10 с 220 сут 2,7 ч 3*10* век 0,2 с 1,5 с 4 с 1 мин 125 век 3.10* век 0,5 с 4 „5 с 25 с 21 мин 5* 10а век 1 с 10 с 2 мин 2,7 ч 73
Таблица 2 Влияние производительности ЭВМ на размерность разрешимой задачи Производи- тельность Сложность Современные ЭВМ ЭВМ, в 100 раз более быстрые ЭВМ, в r000 раз более быстрые п N{ 100 Nt 1000 Ni п* 10 Nt 31,6 п3 Nt 4,64 <V3 10 N3 и5 Ns 2,5 Nt 4 2« Nt JVH-6,64 AM-10 Зл Nt JVH-4,19 AM-M ального характера и, следовательно, позволяют сравнить значения вычислительных сложностей (временных сигнали- зирующих), отвечающих «хорошим» и «плохим» задачам. Правда, необходимо иметь в виду, что при относительно малых п экспоненциальный алгоритм может оказаться эффективнее алгоритма с полиномиально ограниченным временем работы. Например, функция 2“ не превосходит п4 до значения о, равного 4, не превосходит п8 до п=9, не превосходит да до л=20, не превышает пхо до п=59 и т. д. Тем не менее, как видно из приведенных таблиц, для задач немалой размерности, решение которых, собственно, и составляет проблему дискретной оптимизации, разделение задач по сложности на полиномиально и экспоненциально разрешимые естественно и обоснованно. Трудноразрешимые Максимальная размерность задач, Время Сложность " ***—— 1 c 10г c (1,7 мин) 1000 n 103 105 1000 n log ft 1,4-10* 7,7.103 100 n* 102 103 10ft’ 46 2,1.10* ftlogft 22 36 2»i/3 59 79 2» 19 26 3» 12 16
задачи — это, грубо говоря, задачи, требующие для реше- ния почти полного перебора вариантов. Как видно из таб- лиц, при немалых п (л=50 и более) вычисления экспонен- циальной временной сложности практически нереализуемы. Существенный рост производительности ЭВМ не приведет к заметному увеличению размерности разрешимых задач с экспоненциальной временной сигнализирующей. Таблица 1 позволяет сравнить скорости роста несколь- ких типичных полиномиальных и экспоненциальных функ- ций. Таблица оценивает время решения задач размерности п при р'азных временных сигнализирующих. Предполага- ется, что один шаг соответствует 1 мкс. Из таблицы видно, что по мере роста размерности п влияние постоянного множителя при степенных функциях на время счета убы- вает-. Таблица 2 показывает, как увеличатся размерности задач разной сложности, решаемых-за 1 ч машинного времени, если производительность ЭВМ возрастет в 100 или в 1000 раз по сравнению с современными машинами. Таблица 3, характеризующая максимальную - размер- ность задач, разрешимых за данное время при различных временных сигнализирующих, иллюстрирует с -несколько иной точки зрения выводы, определяемые таблицей 2. Приведенные таблицы обосновывают целесообразность предложенной Дж. Эдмондсом классификации по сложности комбинаторных задач. Такая классификация, как мы увидим дальше, обладает и рядом других достоинств. Она облегчает оценку сложности одних массовых задач по оцен- кам сложности других задач. Кроме того, она слабо чув- Таблица 3 разрешимых за данное время 10* с (2,7 ч) 10* с (12 сут) 10е с (3 года) 101* с (3 века) Ю7 5,2-105 10* 10® 54 99 33 20 10° 3,9-107 105 4,6-10* 79 119 39 25 1011 3,1.10° 10е 2,1.10* 112 139 46 29 1013 2,6.10^ 107 105 1$6 159 53 33 П
ствительна к структуре машин, на которых производятся вычисления. Большинство известных полиномиальных задач имеет полиномиальную оценку временной сложности невысокой степени (O(ns) или лучше). Выяснение, какие из известных естественных комбинаторных проблем-являются полиноми- альными, а какие экспоненциальными — одна из важней- ших задач теории вычислительной сложности.; В теории вычислительной сложности основное внима- ние уделяется временной сигнализирующей. Однако изве- стны и некоторые работы по сигнализирующей емкости. В частности, из результатов Хартманиса и Стирнса следует, что имеются проблемы, разрешимые при экспоненциальной памяти, но не разрешимые при полиномиальной памяти. 4. Рост производительности вычислительной техники и возможность реализации на современных машинах все более сложных алгоритмов повышают интерес практиков к теории сложности. Следует, однако, иметь в виду, что ряд общих результа- тов теории сложности получен ценой некоторых практи- чески нереализуемых предположений. В частности, поня- тие алгоритмической сложности не предполагает априори никаких ограничений на время работы алгоритма. Если наложить даЬке слабые огранйчения на число шагов алго- ритма, минимальная длина программы может существенно возрасти. Как уже отмечалось, колмогоровская сложность объекта не является вычислимой функцией. Оптимальный алгоритм будет перебирать все возможные способы кодиро- вания объекта. Если время работы алгоритма заранее ог- раничено, не будет уверенности в том, что лучший из про- смотренных к этому времени способов кодировки определит минимальную длину программы, восстанавливающей объ- ект. Аналогичным образом обстоит дело и в теории вычисли- тельной сложности, которая игнорирует вопрос обйсполь- зуёмых ресурсах. Это ограничивает способность теории определять минимальные затраты вычислительных ресур- сов в реальных ситуациях. Учет ограничений на организа- цию вычислительного процесса необходим не только для получения более «реальных» оценок сложности, но и для обоснованного решения практических задач, связанных с проектированием ЭВМ, в частности, для определения воз- можности размена памяти на время в процессе вычислений. Работы, последних лет по. теории сложности уделяют все 76’
больше внимания выяснению зависимости между качеством решения задачи и затрачиваемыми при этом ресурсами. Заметим, что практически все, что было сказано здесь о разделении задач дискретной оптимизации на легкоразре- шимые и трудноразрешимые, можно перенести и на другие массовые задачи организации вычислений — на задачи распознавания свойств, на установление значений вычис- лимых функций в заданной области изменения дискретных аргументов и др. Легкорешаемые дискретные задачи 1. Известно относительно небольшое количество массо- вых комбинаторных задач, для которых разработаны про- стые (полиномиальные) алгоритмы точного решения. Зна- чительно больше задач, для которых имеются полиномиаль- ные приближенные методы- решения, гарантирующие задан- ную верхнюю границу допустимых погрешностей. Извест- ны и такие задачи дискретной оптимизации (их совсем немного), для которых требование дискретности Параметров управления не вносит никаких дополнительных усложне- ний по сравнению с соответствующими непрерывными за- дачами. Рассмотрим, например, традиционную задачу линейного программирования. Требуется вычислить n-мерный вектор п х= (хь. . ., х„), минимизирующий линейную форму S С/Х, 1= 1 п при соблюдении линейных ограничений S = /=±=1, / = 1 , ..., т, х,^0, j — 1, .... «.Будем считать элементы atf матрицы условий А =||ао|| фиксированными целыми числами, а компоненты b, вектора о — произвольными целочисленны- ми величинами. Пусть, кроме того, ранг матрицы А совпада- ет с числом т ограничений-равенств. Как известно, область определения задачи линейного программирования представ- ляет собой выпуклое многогранное множество, обусловлен- ное ограничениями задачи. Обозначим это множество через М(Ь). Оптимальное значение целевого функционала задачи линейного программирования (если оно единственное) до- стигается в некоторой вершине М (Ь) (если решение не един- ственное, то среди множества решений задачи имеется не- сколько (по крайней мере две) вершин М (Ь), а все остальные 77
решения являются выпуклыми комбинациями этих вершин). | Следовательно, если матрица А устроена так, что вое вер- шины многогранного множества М (Ь) имеют целочисленные ; координаты, то дополнительное требование целочисленно- J сти искомых переменных не внесет никаких изменений в | алгоритм решения соответствующей непрерывной задачи и | не скажется на трудоемкости использования этого алгорит- | ма. Что же касается задач-линейного программирования, в ? которых не требуется гарантировать целочисленность * искомых переменных, то для них имеются полиномиальные | методы решения (подробней об этом далее). | Оказывается, существуют такие целочисленные матрицы А, которые гарантируют целочисленность всех вершин мно- f жества М{Ь) при произвольных целых значениях компонент > вектора Ь. Имеет место утверждение.- Для целочисленности всех вершин многогранных мно- жеств М (Ь) с произвольными целочисленными векторами b необходимо и достаточно, чтобы любой минор порядка т матрицы условий А был равен 0 или ±1. Таким «образом, задачи целочисленного линейного про- граммирования, матрицьюграничений которых удовлетво- ряют условиям приведенного утверждения, представляют* собой в принятой терминологии класс легкорешаемых задач. Сформулированным условиям удовлетворяют, в част- ности, классические транспортные задачи. Жесткость ус- ловий утверждения означает, что класс задач линейного программирования, в которых дополнительное требование дискретности искомых переменных не усложняет методов решения, крайне беден. Строго говоря, назвать классическую транспортную задачу легкорешаемой стало возможным лишь после 1979 г., когда было показано, что для решения общей задачи линей- ного программирования существует полиномиальный алго- ритм. Дело в том, что стандартные методы решения тран- спортной задачи представляют собой реализации общих методов линейного программирования, учитывающие спе- цифику матрицы условий. Так, например, метод потенциа- лов представляет собой симплекс-метод, приспособленный к условиям транспортной задачи, а известный венгерский метод является реализацией общего метода сокращения невязок. Уже указывалось, что все ранее известные общие конечные методы линейного программирования не обладают 78
полиномиальной сходимостью. Для каждого из них по- кроены примеры, решение которых требует перебора почти [сех вершин многогранного множества условий задачи. Ьольше того, были найдены и примеры транспортных задач размерности n(n=min(n1,n2), где «1— число пунктов про- изводства, а п2 — число пунктов потребления) для решения которых число итераций экспоненциально растет с ростом п. Полиномиальный алгоритм, построенный в 1979 г. Л. Г. Хачияном [40] для решения общей задачи линейного программирования, может быть переформулирован с уче- том особенностей матрицы условий транспортной задачи в терминах этой задачи, и это дает основание считать класси- ческую транспортную задачу легкорешаемой. 2. Одна из наиболее часто встречающихся вычислитель- ных операций, представляющих как самостоятельный ин- терес, так и служащих вспомогательной процедурой для решения более сложных задач,— это вычисление произве- дения двух матриц порядка п. Стандартные методы умно- жения матриц требуют О(п3) элементарных операций. Штрассен построил алгоритм умножения матриц, для кото- рого необходимо только О(и1<5^7) операций (log27=2,807). Этот алгоритм был улучшен в 1979 г. Новый алгоритм га- рантирует умножение матриц за q f п iog26 ) операции Clog^ 2,609^» Недавно появилась информация, отно- сящаяся к 1981 г., об оценке трудоемкости перемножения матриц величиной порядка О(п2’4915). Так называемая задача о кратчайших путях — задача нахождения минимальных расстояний от данной вершины ориентированного графа до всех остальных вершин — связа- на с умножением матриц. Дейкстра предложил алгоритм решения задачи о кратчайших путях, требующий в зави- симости от реализации графа О (п?) или О (mlnn) операций, где п — число вершин, а т — число ребер графа. Нахождение кратчайших путей для всех пар вершин графа требует О (и3) операций (Флойд). Фредман построил более экономный алгоритм решения этой задачи, исполь- • л / О/log log rtV/a \ о зующий J J элементарных операции и среди них О(я2,&) сравнений.. Как видим, оценка сверху трудоемкости решения мас- совых вычислительных задач требует «изобретения» алго- ритма, решающего все задачи класса, и установления 79
зависимости вычислительной сложности от размерности задачи. „ 3. В теории обработки сигналов и в различных задачах * вычислительной математики (например, при построении экономных алгоритмов вычисления полиномов и умноже- ния полиномов) в качестве вспомогательной задачи исполь- зуется дискретное преобразование Фурье. Напомним, что , дискретным преобразованием Фурье «-мерного вектора а= . (а3, аь. . ., называется вектор Ь=(Ьй, btl. . ., 6„_t) s П-1 такой, что&Л= S , где ©«, . ., ©„.j—(комплекс- 4=0 ные) корни п-ой степени из единицы. Традиционный метод вычисления дискретного преобразования Фурье требует 0(п2) операций. Так называемое быстрое преобразование Фурье производится за O(nlogn) операций. Последний ре- . . зультат в этом направлении получен Виноградом, который предложил алгоритм вычисления дискретного преобразова- ния Фурье за О (п) умножений. Однако оценки числа других элементарных операций, потребных при этом, Виноград ' не приводит. ; 4. При автоматизации проектирования радиоэлектронной л аппаратуры встречается следующая задача. На плате распо- ложено некоторое число элементов, которые должны быть соединены между тобой в соответствии с заданной схемой, j Возникает вопрос: можно ли реализовать эту схему на | плоскости без самопересечений. Другими словами, можно « ли нарисовать заданный граф на плоскости так, чтобы ни- | какие два ребра не пересекались. Эта задача называется • проверкой планарности графов. Куратовский показал в | 1930 г., что граф планарен в том и только в том случае, если | он не содержит подграфов, гомеоморфных указанным на рисунке двум графам и По сообщению В. Б. Алек- сеева, переводившего обзор Р. Э. Тарьяна [37], содержащий t некоторые из приведенных здесь оценок, этот же результат * доказан, но не опубликован Л. С. Понтрягиным в 1927 г» < 80 л
Шири построил алгоритм проверки планарности графа, требующий О(л*) операций. Хопкрофт и Тарьян опубли- ковали более экономный алгоритм, позволяющий решить вопрос о планарности графа за О(п log п) операций и затем упростили его и довели оценку до О(п). 5. В теорий сетей (транспортных, энергетических, связи и др.) большую роль играет задача о максимизации пото- ка. Поток формально описывается ориентированным гра- фом Г с двумя отмеченными вершинами — источником И и стоком С. Каждое ребро г графа Г характеризуется своей пропускной способностью s(r). Поток f на Г определяется потоками f(r)>0 на каждом , ребре г графа. Из содержа- тельных соображений ясно, что суммарный поток, входя-, щий в каждую вершину графа (кроме вершин И и G), равен суммарному потоку, вытекающему из этой вершины. Изучается величина потока — суммарный поток, выходя- щий из источника И (равный суммарному потоку, попадаю- щему в сток С). Задача о максимальном потоке состоит в определении потока максимальной величины, ограничен- ного пропускными способностями ребер графа Г. Для решения задачи о максимальном потоке в 1962 г. был построен популярный в задачах сетевой оптимизации алгоритм Форда — Фолкерсона. Он позволяет на каждой итерации находить путь, вдоль которого поток наращива- ется. На практике алгоритм Форда — Фолкерсона исполь- зуется успешно. Однако можно указ&ть случаи, когда этот алгоритм не сходится. В связи с этим алгоритм подвергался многочисленным модификациям. Эдмондс и Карп построили алгоритм максимизации потока с оценкой числа операций О (пт2) , где п — число вершин; т --- число ребер графа Г. Е. А. Диниц предложил алгоритм решения той же задачи за О(пгт) операций. А. В. Карзанов' усовершенствовал алгоритм Диница и построил алгоритм с оценкой трудоем- кости О(п’). Это при m=O(n2) всего на порядок выше ниж- ней оценки числа начальных данных — O(n4-m)=O(n2). 6. Помимо рассмотренных выше классов легкорешае- мых дискретных задач, в литературе рассматриваются и Другие массовые проблемы, для решения которых разра- ботаны полиномиальные алгоритмы. Однако число их неве- лико. Между тем дискретных задач, для которых до сих пор не найдено полиномиальных методов решения, очень много. Возникает вопрос: нельзя ли для этих задач постро- ить относительно простые приближенные методы решения, которые, однако, гарантировали бы, что определяемая ими 81
погрешность решения не превысит заранее заданную вели- ‘ чину. Оказывается, что для многих классов дискретных? задач построение приближенного решения с заданной верх-: ней границей погрешности столь же трудоемкая проблема, что и поиск точных методов. Доказано, например, что для задач линейного булевого программирования, задачи об оптимальной упаковке, задачи коммивояжера с произ- вольной матрицей расстояний и ряда других конструиро- вание алгоритмов решения, обеспечивающих заданную' верхнюю границу абсолютной погрешности 8, полиномиаль- но эквивалентно получению точного решения. Временная сложность точного решения этих задач не более чем в полином раз от размерности превышает сложность построе- ния приближенного радения с заданной верхней границей абсолютной погрешности. Интересно отметить, что некоторое сужение класса мат- риц расстояний в задаче коммивояжера (до класса матриц, элементы которых удовлетворяют неравенству треуголь- ника) уже позволяет строить полиномиальные приближен- ные алгоритмы для ее радения. В последние годы выделены и другие классы дискретных задач, для которых не найдены эффективные методы точ- ного решатия, но могут быть построены полиномиальные' приближенные методы, погрешность которых не превышает заданную величину. К таким задачам относятся, в частно- ста, различные варианты составления расписания работы многопроцессорных систем — распределения п независи- мых заданий между т процессорами. Предполагается задан- ным время ti} решения задачи i на процессоре /. Цель рас- пределения — минимизировать суммарное время решения всех задач. Для приближенного решения подобных задач с малой относительной погрешностью разработаны алгорит- мы с числом операций О (га2), O(nlogn), О (л) и потребной памятью 0(п). Для задачи оптимального резервирования при ограни- чениях на габариты, вес и другие характеристики запасных элементов (для решения которой также нет эффективного точного алгоритма) построен достаточно эффективный при- ближенный алгоритм решения. Список аналогичных задач можно продолжить. 7. Трудности, возникающие при точном и приближен- ном решении задач дискретной оптимизации, заставляют менять подходы к постановкам таких задач и смягчать тре- бования к решению. В предыдущем пункте предполагалось, 82
qTO приближенное решение должно обязательно удовлетво- рять всем ограничениям задачи, хотя и может не обеспечи- вать достижения оптимальной величины целевого функ- ционала. Возможности дискретной оптимизации можно расширить, если допустить р малые невязки в условиях задачи. Эффективные Приближенные алгоритмы, допус- кающие малые нарушения ограничений задачи, предло- жены для некоторых задач автоматизации проектирования радиоэлектронной аппаратуры. Для задач булевою программирования с очень большим числом переменных (порядка 103 и больше), но весьма ма- лым количеством ограничений (1—3) разработаны перспек- тивные методы, эффективно срабатывающие «почти всегда» [41. В [111 предложен другой (более грубый) подход к конст- руированию приближенных решений задач дискретной оп- тимизации, «оптимальных почти всегда».. Эго весьма простые методы, которые, однако, не гарантируют качества решения каждой индивидуальной задачи массовой проблемы. При некоторых нежестких требованиях к диапазону изменения параметров условий эти методы оказываются асимптоти- чески оптимальными, т. е. нри увеличении размерности п задачи доля точно решаемых задач увеличивается и стре- мится к единице' при п->оо. В 1111 приведены простые алгоритмы для получения оптимального почти всегда решения задачи коммивояжера и некоторых других массовых дискретных задач. В [501 предложен асимптотически оптимальный алгоритм для решения обобщенной задачи о соединении городов. Этот же алгоритм может быть использован для асимптотически оптимального решения многоиндексных транспортных за- дач специального вида и для эффективной аппроксимации многомерного распределения вероятностей по ограничен- ному статистическому материалу. Асимптотический подход представляет интерес при не- обходимости «в среднем хорошо» решить большое число индивидуальных задач массовой проблемы большой раз- мерности. Этот подход, однако, не дает никаких гарантий при решении каждой конкретной задачи. Подробные обзоры приближенных методов дискретной оптимизации и обсуждение их трудоемкости содержатся в монографии [391 и в статье [101. 83
Вычислительная сложность переборных' задач- 1, Как мы видели, известные точные методы решения комбинаторных задач, в частности задач дискретной опти- мизации, да и многие приближенные методы оказываются * малоэффективными при решении задач немалой размерно- ( сти. При конечном числе альтернатив можно всегда выбрать : лучший вариант, перебирая альтернативы и сравнивая их. между собой. Однако при немалом числе допустимых ва- ? риантов перебор требует астрономического объема вычисле-' ний. Для алгоритмиста и вычислителя крайне важно выяснить, есть ли надежда построить достаточно общие и эффективные методы точного или приближенного решения массовых вычислительных задач дискретной математики. Если таких возможностей нет, то стратегия вычислителя, меняется. В такой ситуации следует, по-видимому, разби- вать массовые дискретные задачи на все более узкие классы и строить более эффективные методы, основанные на изу- чении особенностей частных подклассов задач. В начале 70-х годов были опубликованы работы Л.А. Ле- вина [27], Р. Карпа [17] и С. Кука [25], посвященные вычис- лительной сложности так называемых переборных задач. Переборные задачи — это, грубо говоря, классы задач (мас- совые задачи), каждая из которых имеет конечное число ва- ? риантов решения и может быть решена (во всяком случае, f теоретически) с помощью полного перебора вариантов. По I крайней мере один из параметров (например, размерность п) массовой переборной проблемы неограничен. Таким обра- > зом, число индивидуальных задач в переборной проблеме бесконечно. Индивидуальные задачи переборной проблемы различаются исходными данными — значениями числовых « параметров условий. Такие известные задачи, как задача коммивояжера, различные задачи теории расписаний, зада--" ча о покрытии, задача о раскраске, трехиндексная задача о< назначениях, и многие другие являются задачами пере- борного типа. Проблема анализа переборных задач заключается не в ^ том, чтобы найти конечный алгоритм решения любой задачи- класса (таким алгоритмом является тривиальный перебор — | алгоритм экспоненциальной вычислительной сложности), | а в том, чтобы найти эффективный — полиномиальный —* « алгоритм, решающий каждую (без исключений) задачу \ класса достаточно быстро, \ ; Переборные задачи возникают в различных областям • 84-
дискретной математики и формулируются на языке той области, в которой они используются. Для удобства анализа целесообразно кодировать дискретные задачи (математиче- ские объекты и отношения между ними) словами в некотором алфавите. Обычно для этого используется двоичная систе- ма счисления. Число символов, необходимых для записи ус- ловий задачи, определяет ее размерность. работа всякого алгоритма составляется из отдельных ша- гов. Каждый шаг требует определенного числа элементар- ных операций. Число шагов или число элементарных опе- раций, необходимых для вычисления решения, определяет временную сложность работы алгоритма. Обычно заранее уславливаются, в каких единицах (в числе шагов алгоритма или в количестве тех или иных операций) оценивается вы- числительная сложность. За редким исключением, число элементарных операций на шаге существенно не зависит от размерности задачи и порядок временнбй сложности не за- висит от того, в каких категориях она оценивается. Различным индивидуальным задачам, составляющим данную переборную задачу, отвечает разная входная инфор- мация и разное число шагов алгоритма. В качестве харак- теристики входной информации х естественно брать длину /(х) слова, которым она кодируется. Временная сложность алгоритма А на задаче х описывается функцией fA(x), определяющей число-шагов (или элементарных операций), необходимых алгоритму А для решения задачи х класса. 2. Уже указывалось, что основной вопрос, возникаю- щий при теоретическом исследовании переборной задачи,— это вопрос о том, является ли она полиномиально разреши- мой. Состояние дел здесь до появления современной теории вычислительной сложности было таково. Были известны отдельные переборные полиномиально разрешимые задачи (некоторые из легкорешаемых задач описаны выше). Име- лось также много практически важных задач, для решения которых, несмотря на все усилия, до сих пор не найдены полиномиальные алгоритмы (некоторые из этих задач будут описаны далее). При этом каждая из задач второй группы изучалась более или менее самостоятельно. Что же нового внесла в этот круг вопросов теория вычи- слительной сложности? Прежде всего она выявила единую основу всех трудностей, возникающих в теории переборных задач. Было доказано существование универсальных пере- борных задач — таких задач <7, из полиномиальной разре- 85
i ши мости которых следует полиномиальная разрешимость любой переборной задачи. В классе хороню интерпретируе- мых в содержательных терминах задач универсальные зада-. чи представляют собой «максимально сложные» задачи. Показано, кроме того, что много естественных перебор- ных задач (например, задача коммивояжера, задача о раск-' раске, задача о покрытии, ряд классических задач теории расписаний и др.) являются универсальными. В работе) Л. А. Левина [271 было приведено шесть универсальных; задач. В статье Р. М. Карпа [17] содержится 20 таких задач;! В последние 10 лет число задач, универсальность которых; установлена, быстро увеличивалось. Сейчас известно не- сколько тысяч универсальных задач. ; Расширение списка универсальных задач представляет не только теоретический интерес, но и важно с практиче- ской точки зрения. Если бы удалось придумать полиноми- альный алгоритм для любой универсальной задачи, ска- жем задачи коммивояжера, то оказалось бы возможным по-, строить (причем эффективно) и алгоритмы решения всех без исключения переборных задач. Если же, наоборот, уда-. лось бы доказать, что эта задача не является полиномиаль- но разрешимой, то огромное число практически важных, задач оказалось бы таким же. Найти полиномиальный алгоритм Для какой-нибудь одной универсальной задачи не проще, чем для произвольной переборной задачи. Подчеркнем, что центральный теоретический вопрос, возникающий в связи с изложенным, вопрос о том, сущей-' вуют ли полиномиально неразрешимые переборные задачи, до сих пор не решен. Практическое значение решения этого вопроса трудно переоценить. Первая альтернатива озна- чала бы принципиальную безнадежность попыток эффектив- но решать (по крайней мере решать точно) огромное семей- ство важных для практики задач. Вторая же альтернатива, напротив, сразу ликвидировала бы все теоретические труд-; ности в решении переборных задач. Высказывается гипотеза, что для универсальных задач вообще не существует эффективных . методов решения. ; Неудачные попытки решения классических универсальных* задач, предпринимаемые многими специалистами вот ужей несколько десятилетий, заставляют многих ученых все | больше склоняться к мысли о справедливости этой гипо- й тезы.. Правда, несколько неожиданный результат, полу- ченный недавно в смежной области (о нем подробней в следующем параграфе), насторожил многих специалистов, .
и их высказывания по поводу возможности построения эф- фективных методе® решения универсальных задач' стали более осторожным®. . 3. Понятия переборной и универсальной задач были вве- дены Л. А. Левиным!. В работах Р. М. Карпа, С. Кука и других по вычислительной сложности использовались дру- гие понятия и несколько иная терминология. В категориях и терминах работ Карпа и Кука естественней использовать важное для теории вычислительной сложности понятие сводимости задач, возникшее в математической логике. Техника сводимости позволяет относительно элементарными средствами расширить класс универсальных задач. Гово- рят, что переборная задача А сводится к переборной задаче В, если метод решения задачи В можно преобразовать в метод решения задачи А. Сводимость называется полиноми- альной, если подобное преобразование можно произвести за полиномиальное число шаге® (или элементарных операций). В работах Карпа и Кука рассматривается временная слож- ность решения переборных задач. Предложенная ими мето- дология анализа переборных задач оказалась прогрессив- ной и позволила существенно расширить класс обнаружен- ных универсальных задач и исследовать их с других точек зрения.* Различают два тина переборных задач: задачи дискрет- ной оптимизации (экстремальные задачи) и задачи распозна- вания свойств. В экстремальных задачах задана область G изменения дискретной переменной х и целевая функция f(x). Требуется найти значение x$G, при котором f(x) дос- тигает экстремума. В задачах распознавания свойств (или, как их иногда называют, задачах типа «да — нет») требуется определить, обладает ли функция / (г) дискретного перемен- ного х некоторым фиксированным свойством. Естественные переборные задачи, представляющие практический интерес, можнб формулировать как в терминах задач оптимизации, так и в терминах задач распознавания свойств. Строго гово- ря, излагая концепцию Кука — Карпа, следовало бы говорить только о задачах распознавания свойств. Но мы сильно не погрешим против истины, если в последующих рассуждениях не всегда будем выделять задачи распознава- ния свойств из классов переборных задач. Подход Кука — Карпа к решению переборных задач требует ввода недетерминированных машин или недетерми- нированных алгоритмов. Возможные траектории процесса решения переборной 87
задачи можно представить в виде дерева, ветви которого отвечают последовательности шагов различных решающих алгоритмов. Массовая задача распознавания свойств счи- тается решенной, если для каждой индивидуальной задачи будет найдена ветвь дерева, которая приводит к ответу «да», или если будет установлено, что все ветви приводят к ответу «нет». Последнее равносильно тому, что на дереве* решения обратной задачи, «верно ли, что объект не обла-- дает указанным свойством»; будет найдена ветвь, которая^ приводит к ответу «да». Время, требуемое для решения' индивидуальной задачи класса, определяется числом шагов; кратчайшей траектории, приводящей к ответу «да». Работу недетерминированного алгоритма (или недетер- минированной машины) можно рассматривать как парал- лельную работу многих детерминированных алгоритмов (детерминированных машин), отвечающих каждой возмож- ной траектории процесса решения. Каждая машина выпол- няет последовательность шагов соответствующей траекто- рии процесса решения до тех пор, пока не будет получен ответ «да» или пока не окажется, что дальнейшие шаги невозможны. Другими словами, можно считать, что процесс? решения задачи распознавания свойств на недетерминиро- ванной машине состоит из двух этапов: «угадывания» траек- тории прдцесса, приводящей кратчайшим путем к ответу, «да», и проверки правильности догадки. По заданной инди-/ видуальной задаче «угадывается» ветвь дерева возможных? процессов решения — наиболее экономный из алгоритмов,; распознающих заданное свойство, а затея рассматриваемая? индивидуальная задача подается на детерминированную;- машину, алгоритм функционирования которой соответст- вует . угаданной ветви. Временная сложность решения^ переборной задачи на недетерминированной машине опре- - деляется как минимальное число шагов, используемое «yra- f данной» ветвью дерева возможных процессов решения. | Рассмотрим в качестве примера задачу коммивояжера.! Даны п пунктов и расстояния между ними. Нужно по-| строить маршрут минимальной протяженности, позволяю-^ щий обойти все пункты, не заходя в один и тот же дважды. | , Это экстремальная задача, но ее можно свести к нескольким f задачам распознавания свойств: существует ли проходящий | через все пункты маршрут длины не больше заданной вели-| чины k. Для задачи коммивояжера неизвестен полиномиаль- f ный алгоритм ее решения. Допустим, однако, что для- некоторой индивидуальной задачи каким-то образом полу--# --.88 * I
чены основания предполагать, что существует искомый маршрут, длиной, не превышающей k. Чтобы убедиться в том, что это действительно так, достаточно предъявить этот маршрут, проверить, проходит ли он через все пункты ровно по одному разу, вычислить его длину и сравнить ее с заданной величиной k. Как легко установить, временная сложность процедуры проверки «угаданного» решения ограничена полиномом от п. Полиномиальная проверяемость не влечет полиномиаль- ной разрешимости. Утверждая, что за полиномиальное время можно проверить ответ «да», мы не учитываем время на «угадывание» нужной ветви дерева возможных решений. Будем говорить; что недетерминированная машина ре- шает массовую задачу распознавания П за полиномиальное время, если существует полином такой, что для любой индивидуальной задачи / € П найдется некоторая догадка, длительность проверки которой на детерминированной ма- шине ограничена этим полиномом от размерности задачи. 4. Введем теперь два класса задач распознавания свойств (учитывая приведенную ранее оговорку, будем говорить о двух классах переборных задач). Класс Р (Polinomial) обозначает класс переборных задач, решение которых может быть проведено на детерминированной машине за полиномиальное время. Класс NP (Nondeterministic Poli- nomial) обозначает класс переборных задач, полиномиально разрешимых на недетерминированных машинах. Основная проблема в теории переборных задач заклю- чается в выяснении вопроса: «Существуют ли задачи, кото- рые содержатся в классе NP и не содержатся в классе Р?» Эта проблема в теории до сих пор не решена. Кук [25) показал, что класс NP содержит некий подкласс задач, ко- торые он назвал WP-полными, в некотором смысле «самые трудные» задачи. Если для какой-либо WP-полной задачи будет найден полиномиальный алгоритм решения на детер- минированной машине, то окажется возможным построение полиномиального алгоритма для любой задачи класса NP и, следовательно, P—NP. Таким образом, WP-полные задачи по Куку и Карпу представляют собой универсальные переборные задачи по Левину. Проблема «Р—WP?» является одной из важнейших про- блем теории вычислительной сложности. 89
Полиномиальная разрешимость задач линейного программирования 1. Уже указывалось, что* для подавляющего большинст- ва переборных задач, для которых до сих пор не было най- дено эффективных методов решения* доказана их NP- полнота (универсальность). Имеются,, однако* и единичные обратные примеры. Для некоторых задач, которые предпо- лагались универсальными, в последнее время построены полиномиальные методы решения. Один такой пример,' вызвавший своего рода сенсацию (и породивший сомнения по поводу справедливости гипотезы P—NP?), стоит-того, чтобы, о нем рассказать. Речь идет о задаче выяснения совместности системы ли- нейных неравенств п Эта задача представляет собой частный случай традицион- ной задачи (нецелочисленного) линейного программиро- вания и в. принципе может быть решена любым конечным (т. е. обеспечивающим точное решение за конечное число арифметических действий) методом линейного программи- рования. Оуйгако,. как уже отмечалось, симплекс-метод, впрочем, каки все другие известные ранее конечные методы линейного программирования, гарантирует точное решение задачи лишь, за число операций* экспоненциально растущее с ростом размерности задачи. Подчеркнем* что речь вдет о гарантиях. Известные конечные методы на практике доста- точно эффективны, но для каждого из них построены нетри- виальные примеры задач с экспоненциальной сложностью вычислений. Неоднократно ставился вопрос о том, является ли ука- занный факт дефектом методов или лежит в природе вещей. Последнее означает* что в принципе не существует конеч- ных методов решения общей задачи линейного программи- рования, скажем, с полиномиальной по п+т оценкой не- обходимого числа арифметических операций. Заметим, что речь шла об арифметических действиях, а не о трудоемко- сти в смысле современной теории вычислительной сложно- сти, Дело в том* что линейные задачи с вещественными ко- эффициентами не могут быть закодированы конечными дво- ичными словами. 2. К всеобщему удивлению, относительно недавно
Л- Г,. Хачияну [40] удалось достичь замечательного про- движения в этом направлении и, по существу, решить по- ставленный вопрос. Оговорка «по существу» связана с тем, что сам вопрос был слегка видоизменен, впрочем, без осо- бого ущерба дря его смысла. Вместо рассмотрения линей- ных задач с вещественными коэффициентами — бесконеч- ными двоичными дробями Хачиян рассматривает задачи с рациональными коэффициентами — конечными двоичными дробями, или, что то же самое, задачи с целыми коэффи- циентами. Это сужение семейства задач абсолютно несуще- ственно для приложений. Зато получаемая массовая задача попадает в сферу действия современней теории вычисли- тельной сложности. В частности, можно спросить, явля- ется ли она полиномиально разрешимой. Этот вопрос теперь имеет несколько иной смысл, чем раньше, в своей класси- ческой постановке. С одной стороны, размерность задачи, таким образом, увеличилась, что увеличило шансы на су- ществование эффективных методов решения (число шагов полиномиального метода теперь должно оцениваться сверху полиномом от большей величины, чем в классической по- становке, поскольку размерность, которую здесь удо- бно характеризовать длиной ее кода, теперь уже не п+т, а сумма длин двоичных записей коэффициентов задачи). Эти шансы зато сократились за счет сужения возможностей методов (раньше им разрешалось выполнять неконструк- тивные операции — действия над бесконечными двоичны- ми дробями, а теперь метод обязан быть алгоритмом в смыс- ле математической логики, т. е. допускаются лишь кон- структивные операции). В новой постановке Л. Г. Хачиян решил поставленный вопрос, и, что самое удивительное, положительно. Он по- строил полиномиальный алгоритм установления совмест- ности системы линейных неравенств с целыми коэффициен- тами и, кроме того, полиномиальный алгоритм решения об- щей задачи линейного программирования с ’целыми коэффи- циентами. Подчеркнем, что решение такой задачи отнюдь не обязано быть целочисленным вектором. Поэтому на первый взгляд кажется, что такая задача ®е укладывается в круг понятий дискретной математики. Это, однако, не так: среди решений рассматриваемой задачи (если они вооб- ще имеются) обязательно есть и решение с рациональными координатами, и его можно закодировать, кодируя двоич- ными словами наборы из числителей и знаменателей соот- ветствующих дробей.
- Заметим, что в рассуждениях и выводах Л. Г. Хачияна существенно используется модифицированный метод цент- ров тяжестей (метод эллипсоидов) приближенного решения выпуклых экстремальных задач. Разработка этого метода вызвана проблемами информационной сложности, и о нем пойдет речь ниже в следующей главе. Там же будут сопо- ставлены основные понятия вычислительной и информаци- онной сложности. 3. Опишем кратко ход рассуждений, лежащих в основе построения полиномиального алгоритма для выяснения разрешимости (в вещественных числах) системы линейных неравенств с целыми коэффициентами. п Рассмотрим систему i£/. Под размерностью l=i а этой системы будем понимать сумму длин двоичных п записей всех ее коэффициентов. Пусть ф(х)=тах{£а,;х,— lei /=1 bi}. Идея построения полиномиального алгоритма, позво- ляющего выяснить разрешимость рассматриваемой системы неравенств, заключается в следующих замечаниях: (1) Если система линейных неравенств совместна, то у нее есть решение в шаре V радиуса 2“ с центром в 0 и, сле- довательно, в этом случае mintp(x)^0. v (2) Если система несовместна, то min<p(x)>2~“. Это значит, что для решения вопроса о совместности си- стемы линейных неравенств достаточно оценить величину s = minjp(x) с погрешностью, например, не превышающей Функция <р(х) как максимум линейных форм выпукла, и ее минимизация на шаре V есть задача выпуклого програм- мирования. Как видно из построений, приведенных в следующей главе, минимизация <р(х) на V и оценка тру- доемкости получения требуемого приближения к оптимуму могут быть проведены по методу эллипсоидов. Число ите- раций, необходимых для решения задачи по методу эллип- соидов (и число элементарных операций модификации метода для решения системы линейных неравенств), полиномиаль- ным образом зависит от числа переменных и, стало быть, от а. Отсюда следует возможность построения полиномиаль- ного: алгоритма для выяснения совместности линейных неравенств. 92
Развитие описанных идей привело к созданию «полино- миальных» алгоритмов для решения задач линейного и вы- пуклого квадратичного программирования с целыми коэф- фициентами. 4. Необходимо подчеркнуть, что описанные в настоя- щем параграфе результаты относятся к линейным задачам, у которых целочисленны лишь коэффициенты целевой функции и элементы матрицы условий. На компоненты иско- мого решения никаких условий целочисленности не накла- дывается. Не следует путать целочисленные в этом смысле задачи с задачами целочисленного линейного программи- рования (где оптимизация ведется на целочисленной решет- ке). Задача последнего типа универсальна, а для задач, рассмотренных в [40], универсальность не доказана. По- этому результаты Л. Г. Хачияна не дают пока никакой су- щественной информации для решения центральной проб- лемы теории вычислительной сложности — проблемы «Р= =NP&>, т. е. вопроса о полиномиальной разрешимости уни- версальных задач перебора. Труднорешаемые дискретные задачи 1. Список универсальных (AfP-полных) дискретных мас- совых задач в настоящее время насчитывает тысячи задач, и с каждым днем этот список расширяется. Описания задач, для которых доказана JVP-полнота, разбросаны по различ- ным источникам. Наиболее полный перечень TVP-полных задач — более 300 задач, почти каждая из которых имеет несколько версий,— приведен в [12]. Мы здесь опишем несколько универсальных задач, к которым сводятся мно- гие технические и экономические проблемы. Напомним еще раз, что речь идет о наиболее трудных переборных задачах. Если для какой-либо одной из них будет найден полино- миальный алгоритм решения (метод решения, вычислитель- ная сложность которого растет как полином от размерности задачи), то этот алгоритм можно будет преобразовать и приспособить, сохраняя его полиномиальность по размер- ности, для любой другой переборной задачи и одна из важнейших проблем вычислительной математики <tP=NPh будет решена. 2. Неоднократно упоминавшаяся выше задача коммивоя- жера — наиболее популярная универсальная задача— 93
имеет много различных экономических и технических ин- ' терпретаций. Пусть задано п пунктов и целочисленная мат- рица расстояний между ними £>=1№>|| (dtj — расстояние между пунктами i и /). Требуется найти маршрут мини- мальной длины обхода всех пунктов, не заходящий дважды в один и тот же пункт. Такова формулировка задачи комми- вояжера в терминах экстремальных задач. В постановке, используемой в задачах распознавания свойств, предпола- гается, что задано еще целое число fc>0 и требуется уста- новить, имеется ли маршрут длины, не превышающей k, позволяющий обойти все пункты, не посещая дважды ка- кой-либо из них. Задача коммивояжера остается универсальной даже в том случае, если все расстояния du принимают одно из двух значений, например, 1 или 2. К задаче коммивояжера полиномиально сводится задача о гамильтоновом цикле, играющая важную роль в теории графов и ее приложениях. Она формулируется следующим образом. Пусть Г — граф с множеством вершин В и мно- жеством ребер Р. Простым циклом в графе Г называется такая последовательность {Ьи Ь2,..Ьк} различных вершин из В, что отрезки, соединяющие пары, вершин {bt, bi+J}, и отрезок {bk,bi} принадлежат Р, т. е. являются ребрами графа Г. Гамильтоновым циклом в Г называется простой цикл, содержащий все вершины, графа Г. Задача о . гамильтоновом цикле требует проверить, верно ли, что граф Г содержит гамильтонов цикл. Задача о гамильтоновом цикле полиномиально эквива- лентна задаче коммивояжера и, следовательно, также яв- ляется универсальной (ЛГР-полной) задачей. Чтобы убе- диться в этом, необходимо указать функцию <р, отображаю- * щую каждую индивидуальную задачу из массовой проблемы «гамильтонов цикл» (ГЦ) в соответствующую индивидуаль- ную задачу массовой проблемы «коммивояжер» (КВ). Пусть граф Г, определяемый множеством В из п вершин и множеством Р ребер, означает фиксированную индивиду- . ; альную задачу из ГЦ. Соответствующая задача из КВ стро- ится следующим образом. Множество пунктов П совпадает 3 с множеством вершин В графа Г. Определим расстояние - d(bt, bj) между двумя пунктами Ьг, так, что d(bt, ' 6j)=l, если отрезок [blt bj] £ Р, т. е. является ребром графа Г, и d(bt, bj)=2 — в противном случае. Примем число fc>0, определяющее задачу КВ в терминах распознавания свойств, равным п. Функция <р, устанавливающая своди- 94
мость индивидуальных задач ГЦ’ к индивидуальным зада- чам КВ, может быть вычислена за полиномиальное время. Для вычисления у п(п—1) расстояний d(bt, bj) необходимо лишь выяснить, являются ли отрезки [йг, bj] ребрами гра- фа Г. Строго говоря, для проверки полиномиальной сво- димости ГЦ к КВ следовало бы еще показать, что Г содержит гамильтонов цикл в том и только в том случае, если в соответствующей задаче КВ имеется соединяющий все пункты из П маршрут длиной не больше k. Но этот этап доказательства полиномиальной сводимости ГЦ к КВ мы опустим. Мы опустим также доказательство полиномиаль- ной сводимости КВ к ГЦ. 3. В сетевых задачах транспортного типа часто прихо- дится оценивать качество маршрута по нескольким крите- риям, например, по его длине и связанным с ним затратам. В связи с этим возникает задача выбора кратчайшего пуати при заданных ограничениях на затраты. В терминах распознавания свойств задача формулиру- ется следующим образом. Задан граф Г с множеством вер- шин В и множеством ребер Р. В графе выделены две вер- шины: источник (И) и сток (С). Каждому ребру г£Р графа Г приводятся в соответствие два целых положительных чис- ла — длина ребра /(г) и затраты s(r), связанные с переме- щением по этому ребру. Заданы, кроме того, два целых поло- жительных числа L и S. Требуется выяснить, существует ли в графе Г путь из вершины И в вершину С, длина кото- рого не превышает L при затратах не больше S. Это NP- полная задача. WP-полнота задачи о кратчайшем пути сохраняется и в том случае, когда Г — ориентированный граф. Обе задачи, однако, разрешимы за полиномиальна время, если длины всех ребер графа Г равны между собой или затраты, связанные с перемещением по разным ребрам, одинаковы. В этих случаях получаемая задача эквивалент- на задаче о максимальном потоке, рассмотренной при изучении легкорещаемых задач. К рассматриваемым задачам полиномиально сводится задача о разбиении множества А элементов а разной стои- мости s (a) (s (а) — целые положительные числа при всех а) на два множества Ai и Л2(ЛгПЛ2=0, Л10Л2=Л) оди- наковой стоимости. В задаче о разбиении следует, таким образом, установить, существует ли множество Л2гЛ 96
такое, что г ‘ 3 S(a)= s s(a). aeAi «€4\А1 Задача о разбиении — универсальная задача. 4. Ещё один пример универсальной задачи — задача о минимизации времени передачи сообщения — состоит в следующем. Имеется множество пунктов и сеть связи, » позволяющая пунктам — соседним узлам сети — непосред- ственно без ретрансляции (за один сеанс связи) передавать один другому сообщения. Представим сеть в виде графа Г с множеством В вершин,': отвечающих пунктам, и множеством Р ребер, отвечающих линиям связи. Пусть некоторое подмножество BQc.B пунктов связи располагает определенной информацией (сообще- нием), которую нужно передать всем пунктам сети. За один сеанс связи можно передать сообщение только в смежную вершину, т. е. в вершину, соединённую с источником информации ребром. Предполагается, что в течение се- анса связи можно передать сообщение из каждого пункта, обладающего информацией, только в один пункт, и, наобо- рот, каждьШ пункт, не располагающий информацией, мо- жет получить ее только из одного пункта. На. очередном сеансе связи выбираются некоторые из пунктов (вершин графа), которые еще не получили сообщение. Для того чтобы они могли на этом сеансе получить информацию, они долж- ны быть непосредственно связаны линией связи (ребром графа Г) хотя бы с одним из пунктов, которые к этому мо- менту уже получили сообщение. В задаче требуется орга- низовать передачу сообщения таким образом, чтобы опо- -вестить все пункты за минимальное число сеансов связи. . Это экстремальная постановка задачи. В терминах распозна- > вания свойств задается еще число k сеансов связи и требу- ется выяснить, можно ли за число шагов (сеансов связи), ' не превосходящее k, передать, соблюдая приведенные выше условия, сообщение из исходного множества Вв пунктов во все пункты сети. Формально постановка этой задачи записывается сле- дующим образом. Требуется установить, существует ли такая последова- тельность множеств вершин и ребер графа Г: Во, Ри Bt, Рг, . . ., Pt, Вл, что BtsB, Pt^P, Bt—B и для веек I, ‘ выполнены условия: 96
1Q ровно один конец каждого ребра из множества Pt принадлежит множеству вершин 2° никакие два ребра из не имеют общего конца; 3° Bt =Bi_t {]{b:[a, b}£ Pt}, а, В. Доказано, что при любом заданном числе сеансов £>4 задача о минимизации времени передачи сообщения NP- полная, а при /=1 для ее решения существует полиномиаль- ный алгоритм. Если исходное множество В® вершин содержит единст- венную вершину, задача остается WP-полной, но если при этом граф Г — дерево (т. е. односвязен и не имеет циклов), то задача оказывается полиномиально разрешимой. К рассмотренной модели полиномиально сводится задача о трехмерном сочетании, обобщающая задачу о двухмерном сочетании, известную в литературе под названием задачи о бракосочетании. Последняя формулируется следующим образом: имеется п холостых мужчин и столько же незамуж- них женщин. Каждая женщина и каждый мужчина состав- ляют список приемлемых партнеров. По этим спискам фор- мируется список всех пар мужчин и женщин, согласных вступить в брак друг с другом. В задаче требуется уста- новить, можно ли совершить п бракосочетаний так, чтобы каждый получил. приемлемую супругу (или супруга) й чтобы при этом никто не вступал в брак дважды. Оказывается, задачу, о двухмерном сочетании можно отнести к легкорешаемым. Для ее решения существует полиномиальный алгоритм. А вот если задачу обобщить и перейти от двухмерного сочетания к трехмерному, то задача станет труднорешаемой — jV/5-пол ной. В приведенных тер- минах задача о трехмерном сочетании формулируется так. Имеется по п представителей трех разных «полов» (напри- мер, как у А. Азимова в «Сами боги»: левник, правник и централь) и списки, отвечающие «трехмерному сочетанию», приемлемому для каждого участника любой потенциальной триады. Требуется выяснить, можно ли осуществить п трехмерных сочетаний, приемлемых для каждого участника любого «пола» и чтобы при этом ни один представитель не участвовал в двух триадах одновременно. Ясно, что многие трехиндексные задачи транспортного или распределительного типа укладываются в схему модели о трехмерных сочетаниях. 5. При организации машинных вычислений возникает задача динамического распределения памяти. Сущность этой задачи в следующем. Пусть имеется множество А 4 5 т 97
данных. Предполагаются заданными длина элемента а € А— целое положительное число (число букв слова а), моменты поступления слова а и окончания работы со словом а — целые положительные числа. Задача заключается в том, чтобы найти минимальный объем памяти, обеспечивающий распределение данных в памяти, учитывающее динамику их поступления и пребывания в системе. Это экстремальная постановка задачи. В терминах рас- познавания свойств задача формулируется следующим об- разом. Задано целое положительное число k — объем па- мяти вычислительного устройства. Требуется выяснить, можно ли поставить в соответствие каждому слову а£А номер ячейки а (а) в устройстве памяти o(a)g{l, 2,. . ., k}, с которой следует начинать запись слова, таким обра- зом, чтобы выполнялись следующие условия: 1° запись любого слова а$А, начатая в ячейке а (а), заканчивается в ячейке с номером, не превышающим k; 2° если два интервала в устройстве памяти, в которых записаны слова аг и аг, пересекаются, то момент окончания работы с одним из этих слов наступает не позже момента поступления другого слова. Задача динамического распределения памяти NP-пол- ная. Она остается AfP-полной даже в том случае, если дли- на всех слйв — элементов данных, подлежащих записи в памяти, принимает одно из двух значений 1 или 2. К задаче о Динамическом распределении памяти поли- номиально сводится версия задачи о разбиении множества, рассмотренной ранее и называемая «3-разбиение», или задача разбиения на тройки. Задано множество А из Зп слов и целое положительное число k. Длина слова а равна k k I (а) и при этом у < / (а) < у, а общая длина записи всех слов множества А равна nk. Требуется выяснить, можно ли разбить множество Л на га непересекающихся подмножеств Лп А^ ..., А„ так, чтобы суммарная дли- на записи элементов каждого подмножества равнялась k. Из ограничений на длины у < I (а) < у и требования S l(a) = k следует, что -Ц*-!- < 1 < -Ц11, где | Л{ I — Я€Л,- 4 2 число элементов в множестве Л;-. Отсюда | Л;|.= 3, т. е. каждое из множеств А{ должно содержать ровно три эле- мента множества Л. Задача разбиения слов на тройки одинаковой длины ДОР-полная задача. 98
6. Оказывается, и традиционная задача составления учебного расписания представляет собой NP-полную зада- чу. Сформулируем эту задачу. Пусть задано множество Т— рабочих часов, множество Р — преподавателей и множе- ство D — учебных дисциплин. Для каждого преподава- теля р g Р указано подмножество рабочих часов А (р)^ Т, приемлемых для него. Для каждой дисциплины d^D задано подмножество рабочих часов B(d)=T, допустимых для этой дисциплины (обусловленное, например, внеучеб- ными факторами), и наконец, для каждой пары (р, d) — «преподаватель — дисциплина» — предписана требуемая нагрузка r(p, d) — число часов, которое преподаватель р должен отвести дисциплине d. Требуется установить, су- ществует ли раслисание, учитывающее учебную программу, пожелания преподавателей, требуемую нагрузку и задан- ные внеучебные факторы. Запишем задачу в формальных терминах. Обозначим через f булеву функцию трех переменных р, d, t такую, что f(p, d, 0=1 означает, что преподаватель р проводит занятия по дисциплине d в час t. Задача заключается в том, чтобы выяснить, существует ли булева функция f(p, d, t), удовлетворяющая следующим условиям: Г/(р, d, 0=1 в том и тольковтом случае, если t€ А(р) П П В (d), т. е. лекция по дисциплине d назначается препода- вателю р в час t тогда и только тогда, когда-то приемлемо для преподавателя и допустимо для дисциплины; 2° для каждого часа t (Е Т и преподавателя р £ Р суще- ствует не более одной дисциплины d(ED, такой, что при этом f(p, d, 0=1; 3° для каждого часа tС Т и дисциплины d£D можно указать не более одного преподавателя р € Р, так, чтобы f(p, d, 0=1; 4° для каждой пары «преподаватель — дисциплина» (р, d)£PX.D существует ровно r(p, d) значений t (рабочих часов), для которых f(p, d, 0=1. Задача составления учебного расписания остается NP- полной даже при следующих упрощениях, предполагающих, что всего рабочих часов |Т| =3, все эти часы допустимы для всех дисциплин, т. е. B (d)=T для всех d^D, и требуемые нагрузки могут равняться одному из двух чисел 0 или 1. Общая задача составления учебного расписания стано- вится полиномиально разрешимой в одном из двух случаев: 4* 99
(а ) если число часов, приемлемых для каждого препода* ' вателя, не превышает двух (14 (р)|<2); (б ) если любой час t^T приемлем для любого препода- вателя и допустим для каждой дисциплины. 7. В заключение настоящего параграфа сформулируем без обсуждения еще несколько универсальных переборных задач. (1) Общая задача целочисленного линейного програм- #? жирования. Даны целочисленная тХп матрица Д = ||ао1|, J целочисленные m-мерный вектор Ь= (&<,. . Ьт) и п-мерный ; вектор с— (си. . с„). Требуется среди всех решений си- Ч п стемы неравенств а^х-^Ь^ i = \, ..т найти'цело- /=1 численный n-мерный вектор х= (хи. . ., '*„)> на котором ' П линейная форма достигает максимума. Более узкая задача булева линейного программирования (задача целочисленного линейного программирования, в \ которой все Xt могут принимать лишь значения 0 или 1) 7 также является универсальной переборной задачей. Однако ' для решения «почти всех» задач булева программирования 's существуетролиномиальный метод. Оказывается, «почти все» ’ задачи {0, 1 ^программирования можно решить на детер-. минированной машине Тьюринга за квадратичное время от длины записи исходной информации. (2) Решение системы булевых неравенств может рассмат- риваться как подкласс задач целочисленного линейного » п программирования. Дана система неравенств 2 - i — 1, ..., т, где элементы ai} матрицы А состоят из нулей и положительных и отрицательных единиц, а компоненты bi вектора b — нули и единицы. Требуется установить, имеет ли эта система булево решение, т. е. существует ли I вектор х—(хи. . ., хп) из нулей и единиц, удовлетворяю- « щий этой системе неравенств. | (3) К частной задаче целочисленного линейного програм- 1 мирования сводится и задача о разрешимости диофантова J Л ' ' уравнения. Дано уравнение 5 afXj = fe, где b — целые ; числа. Требуется выяснить, имеет ли оно булево решение — вектор х с компонентами 0 и 1. Заданное уравнение можно j 100 ,
представить в виде системы двух неравенств ~фа,х^—Ь. (4) Задача о клике. Дан граф Г и целое число &>0. Требуется установить, существут ли полный подграф (т. е. подграф, любые две вершины которого соединены ребром), имеющий k вершин. Если граф Г характеризует организа- ционную структуру, то задача требует определить, можно ли выделить сеть (клику) из k вершин организационных единиц, непосредственно связанных друг с другом. (5) Задача об упаковке множеств. Дано семейство мно- жеств {At} и целое число й>0. Требуется установить, име- ется ли в {At} подсемейство, состоящее из k попарно не пе- ресекающихся множеств. (6) Задача о покрытии множествами. Дано семейство множеств {Л,} и целое число £>0. Требуется установить, существует ли в {At} подсемейство {В/}, содержащее не более k множеств, объединение которых совпадает с объе- динением всех множеств исходного семейства. (7) Задача о раскраске. Дан граф Г и целое число k > 0. Требуется установить, можно ли раскрасить верши- ны графа в k цветов так, что никакие две смежные вершины не будут окрашены в один цвет. „ (8) Задача Белмана — Джонсона составления расписа- ния. Даны числа tt и xit t=T,. . ., п,— продолжительности обработки i-ro изделия соответственно на 1-й и 2-й машинах. Каждое изделие проходит обработку последовательно на каждой машине. Имеются емкости для хранения частично обработанных деталей. Заданы директивные сроки Tt и чис- ло fc>0. Требуется установить, имеется ли расписание, гарантирующее выполнение директивных сроков при общем времени обработки деталей, не превышающем k. (9) Задача Форда — Фалкерсона об организации парал- лельных работ. Даны числа х, — продолжительности не- прерываемых работ и ttj — времени перехода от работы i к работе /, число $ — одинаковых исполнителей, выполняю- щих работы параллельно, и число k>0. Требуется устано- вить, имеется ли распределение работ между исполнителя- ми, при котором общее время выполнения работ не превы- шает k. (10) Задача о покомпонентных векторных неравенствах. Даны два множества n-мерных векторов с целочисленными 101
компонентами X={xi,. . ., xj и Y—{yly. . ., уг}. Требует- ся установить, существует ли такой n-мерный вектор г с целочисленными компонентами, что число векторов х, С X, все компоненты которых не превосходят соответствующих составляющих г, не меньше числа векторов yj € ¥> все компо- ненты которых не превосходят соответствующих составляю- щих z. Задача остается ^-полной даже в том случае, если все составляющие векторов х{ и у} равны 0 или 1. В терминах перечисленных универсальных задач форму- лируются многие проблемы планирования, управления и проектирования-. Заключение 1. С некоторых пор не только физики и представители других естественных наук, но и математики начинают скло- няться к целесообразности описания реальных явлений не на языке математики бесконечного и непрерывного, а на, языке математики конечного и дискретного. В идеализиро- . ванном описании реального мира все чаще предполагается некоторый уровень зернистости. Математики, уделяющие внимание приложениям, начинают смотреть на разностные ' уравнения, оцисывающие физические процессы, не как на приближения к точным моделям, а как на модели, отражаю- щие сущность дискретной вселенной, клеточного автомат- ного пространства, в котЬром каждая клетка имеет только ; конечное число состояний. Появляются соображения о целесообразности отказаться от промежуточных непре- рывных моделей и изучать реальные явления в их дискрет- ном описании. Человеческий мозг оперирует в существен- ном по дискретному принципу, хотя математику, по-види- мому, в силу исторического развития математики часто привычней рассуждать в терминах гладких конструкций. Относительно несложные (в любом используемом здесь ? смысле) явления и процессы, допускающие наглядное представление, легче воспринимать в непрерывных терми- нах, чем в комбинаторных. «Сглаживание» дискретных рядов — переход от дискретного множества точек к усред- няющей их непрерывной (гладкой) поверхности — обычно используемый на практике прием приближенного выявления закономерностей явлений и процессов. Качественный анализ свойств относительно простых объектов и предсказание их 102
состояния и поведения удобней проводить в непрерывных понятиях и терминах. В сравнительно несложных задачах непрерывная математика позволяет получить аналитиче- ским путем явные решения и обеспечивает, таким образом, установление наглядной зависимости вариации решения от изменения параметров условий задачи. Однако это досто- инство непрерывной математики утрачивается по мере ус- ложнения задач, анализ которых невозможен без числен- ного решения каждой индивидуальной задачи класса. Первоначальные закономерности в механике, физике, астрономии были связаны с линейными зависимостями. Уточнение закономерностей потребовало учета нелинейно- стей. Аппроксимация нелинейных эффектов обычно произ- водится квадратичными или полиномиальными зависимо- стями более высоких степеней или аналитическими функция- ми. Во всех этих случаях часто удается получать явное ре- шение задач, связанных с учетом соответствующих"законо- мерностей. Количественными манипуляциями с этими клас- сами функций, собственно, исчерпываются конструктивные достижения непрерывной математики, не требующие тру- доемких машинных вычислений. Имеются, правда, еще вы- пуклые непрерывные задачи (и некоторые их расширения), в которых решение хоть и не может быть представлено в яв- ном виде, но которые, однако, не требуют чрезмерно тру- доемких вычислений. В приложениях (особенно в проблемах принятия решений) вряд ли могут быть указаны другие достаточно общие и широкие классы задач непрерывной ма- тематики, количественный анализ которых не требовал бы громоздких вычислений. Возможности аналоговой вычислительной техники не- измеримо более скромны, чем возможности универсальных цифровых вычислительных машин. В терминах непрерывной математики ставятся и исследуются относительно «хорошие» задачи. В терминах дискретной математики требования к формализации задачи менее жесткие. Поэтому во всех проблемах, связанных с численным анализом, особенно в проблемах выбора решений, намечается тяготение к ком- бинаторным методам исследований и стремление к описа- нию реальных явлений дискретными моделями, минуя промежуточный этап их непрерывного описания. По-види- мому, этим и объясняется внимание, которое в последние десятилетия все больше уделяется дискретным моделям прикладной математики. Классификация задач по различным мерам сложности 103
также сказывается более естественной для дискретных описаний, чем для непрерывных. Дискретные задачи при- нятия решений имеют четкую алгебраическую структуру. Способы кодирования задачи для организации вычислений очевидны и естественны. В непрерывных задачах проблема кодирования не простая — далеко не каждый подход к ней сохраняет непрерывные классические свойства задачи. Отсюда и более фундаментальные результаты теории алго- ритмической и вычислительной сложности, конструируй- мые в понятиях дискретной математики. Математики всегда стремились создавать эффективные > методы решения возможно более широких классов задач. Теория сложности показала, что общность и эффектив- ность — противоречивые требования к методу решения. Для весьма широких классов задач может вообще не суще- ствовать единого алгоритма решения. А в случае алгорит- мической разрешимости класса задач трудоемкость решения нередко убывает, если разбить класс задач на подклассы и, пользуясь их спецификой, разрабатывать для каждого из ' них эффективные методы анализа. Как мы видели, многие из этих проблем решены для задач дискретной математики. . Еще больше задач ждет своего решения. S 2. Вычислительная сложность, как она была определена в этой главе^ представляет собой минимаксную оценку клас- са задач. Она оценивается минимальным объемом ресурсов, необходимых для решения любой задачи класса. С практи- ческой точки зрения часто больший интерес представляет средняя оценка ресурсов, необходимых для решения задач .... класса. Однако ее вычисление предполагает наличие неко- торой информации об априорном распределении задач клас- са. Такой информацией далеко не всегда располагает иссле- дователь. Тем не менее может оказаться, что для широкого класса часто встречающихся на практике распределений оценка сложности не зависит или слабо зависит от характе- ' ристик ’'конкретного- распределения. В таких ситуациях удается в отдельных случаях оценить среднюю трудоем- , кость метода и получить больше оснований для прогнози- i рования затрат ресурсов, необходимых для решения мас- совой задачи. Так обстояло, например, дело с оценкой симплексного метода решения задач линейного программи- > рования. Практика свидетельствует о высокой эффектив- ности метода. Между тем еще четверть века назад были построены примеры задач линейного программирования, решение которых с помощью симплекс-метода требовало 104
почти полного перебора вершин многогранника условий. Следовательно, по минимаксной оценке симплекс-метод экспоненциально сложен. Однако совсем недавно (в 1982— 1983 гг.) появились работы, в которых обоснована полино- миальная (с невысокой степенью полинома от размерности и числа ограничений) средняя трудоемкость симплекс-метода при естественных нежестких предположениях относительно априорного распределения задач в классе. Таким образом, устранено расхождение между теоретическими и экспери- ментальными результатами. Следующим шагом в этом направлении является стати- стическая оценка сложности, учитывающая частость появ- ления «плохих» задач класса. Следует считать перспектив- ными дальнейшие исследования по оценке средней и‘ста- тистической сложности классов задач и трудоемкости мето- дов. Это относится не только к дискретным задачам, но и к рассматриваемым в следующей главе непрерывным задачам оптимизации. ИНФОРМАЦИОННАЯ СЛОЖНОСТЬ Сложность оптимизации В настоящей главе мы изучаем сложность решения за- дач оптимизации. Оптимизация, в том или ином смысле яв- ляется основой принятия рациональных решений. Каждое решение, особенно если его последствия влияют на наше будущее, должно быть наилучшим в некотором смысле, соответствующим специфике ситуации. В практике приня- тия решений содержательный смысл задачи часто опреде- ляет характеристику решения (или по крайней мере струк- турные свойства характеристики), оптимизация которой соответствует наилучшему выбору. Нередки также случаи, когда установление критерия эффективности предостав- ляется лицу, принимающему решение,/ имеющему опыт в постановке и анализе задач в соответствующей области и несущему ответственность за последствия принятых ре- шений. Однако в достаточно ответственных ситуациях оп- ределение понятия «лучшее решение» представляет собой чрезвычайно сложную методологическую проблему, ис- следование которой далеко не всегда является предметом чисто математических изысканий. Здесь может оказаться необходимым учет многих критериев качества, определяе- мых различными требованиями к решению. Зачастую реше- 105
ние затрагивает интересы многих лиц или коллективов, что не может не сказаться на понятии «лучшее решение». На- конец, в случаях, когда общее решение проблемы опреде- ляется частными решениями отдельных участнике® про- цесса выбора решений, возникают конфликтные ситуации, разрешение которых требует переговоров и установления компромисса. Во всех этих проблемах пока еще больше не- ясного, чем готовых рецептов. Обсуждение связанных с ними вопросов остается за рамками настоящей работы. Мы здесь исходим из того, что после согласования понятий «равно- весие», «компромисс» или «справедливость» удается, как правило, сформировать некоторый критерий (или указать структурные свойства критерия), к оптимизации которого сводятся конструктивные подходы к выбору «равновесных», «компромиссных» или «справедливых» решений. Так или иначе, оптимизация (условная или безусловная) обычно является основой или составной частью проблемы принятия решений. Поэтому оценка сложности задач оп- тимизации в зависимости от размерности задачи и допусти- мой погрешности представляет несомненный практический интерес. 2. Цель настоящей главы — оценить трудоемкость ре- шения массовых задач оптимизации (различных классов задач оптимизации) и получить, таким образом, представ- ление о сложности принятия решений в ситуациях, когда свойства критерия качества решения и области допустимых решений уже установлены. Собственно говоря, предыду- щая глава, посвященная вычислительной сложности, охва- тывала в некотором смысле и эту проблематику. Однако изложенная там методология позволяет оценивать лишь трудоемкость решения дискретных задач оптимйзации, условия которых фиксированы в виде набора параметров. Здесь мы будем рассматривать непрерывные экстремаль- ные задач!/*— достаточно общие модели математического программирования, не укладывающиеся в схему дискрет- ной оптимизации. Классы непрерывных экстремальных задач, как правило, не характеризуются набором парамет- ров. Исключение составляют задачи типа линейного или квадратичного программирования, для которых теория информационной сложности дает весьма грубые оценки. Трудоемкость решения таких задач естественней оценивать в рамках теории вычислительной сложности. Излагаемая в настоящей главе теория информационной сложности при- способлена к оценке сложности классов задач оптимиза- 106 •
ции, описываемых такими аморфными характеристиками, как степень гладкости, выпуклость, мера обусловлен- ности и др. Методология вычислительной сложности не оперирует подобными понятиями и не может быть исполь- зована для оценки трудоемкости решения соответствующих классов задач. В главе существенно используются материалы А. С. Не- мировского и Д. Б. Юдина по постановкам задач и резуль- татам теории информационной сложности. Постановка задачи и основные определения 1. Теория информационной сложности изучает потен- циальные возможности численных методов оптимизации для различных массовых условных экстремальных задач — для классов задач (недискретного) математического про- граммирования. Напомним, что в задаче математического программиро- вания требуется вычислить n-мерный вектор х, оптимизи- рующий (обращающий в минимум или в максимум в зави- симости от содержательной постановки задачи) критерий качества решения Д(х) при соблюдении ограничений /;(х)^0, /=1, ..., т. При этом предполагается заранее из- вестным некоторое замкнутое подмножество G «-мерного векторного пространства, из которого следует выбирать решение х. Таким образом, задача математического прог- раммирования имеет вид min |/у (х)< О, / = 1, xgGsT?0. В зависимости от свойств функций /=(/<>, Л, ..., /,л) и множества G имеют дело с тем или иным классом задач оптимизации. Известно огромное количество экономиче- ских и технических задач планирования, управления и проектирования, которые укладываются в приведенную схему математического программирования. Поэтому оцен- ка трудоемкости численных методов оптимизации представ- ляет не только теоретический, но и практический интерес. 2. Приведем формальное описание понятия «метод ре- шения задач данного класса». Оно основано на так называе- мом информационном подходе, предложенном Н. С. Бах- валовым в начале 60-х годов применительно к гораздо более сбще^ ситуации. 107
Зафиксируем семейство .(ft G) задач математического программирования и снабдим его источником информации ; об индивидуальных задачах класса — оракулом О. Оракул ' ; определяется множеством X допустимых вопросов, множе- ством Y возможных ответов и функцией наблюдения t|>(x, /) : XX (f, приводящей в соответствие каждому вопросу х € X по индивидуальной задаче / из рассматривав- - мого семейства ответ у € К. Решение задачи численным методом В с оракулом О про- исходит итеративно по шагам. На каждом шаге метод «за- ; дает вопрос» х£Х оракулу и получает от него ответ • y—ty(x, ё ¥• Каждый следующий вопрос формируется по предыдущим вопросам и ответам. Метода различаются правилами выбора вопросов оракулу. На некотором шаге ' (по выбору метода) -процедура решения останавливается и по накопленной к этому моменту информаций метод фор- мирует определяемое им приближенное решение г задачи /. Метод В численного решения задачи представляет со- бой набор инструкций по формированию очередных вопро- сов, выбору момента остановки и построению приближен- ного решения в зависимости от накопленной к очередному шагу информации о решаемой задаче. Таким образом, метод одновременно «идентифицирует» индивидуальную задачу класса (в окрестности ее решения) и решает ее. 3. Метод В, использующий оракул О для решения за- дач семейства (f, G), характеризуется своей трудоемкостью и: .погрешностью. Трудоемкостью метода В на задаче f _ класса называется число шагов, требуемое для решения задачи (число вопросов, задаваемых оракулу при решении задачи). Трудоемкостью метода В на классе задач назы- вается верхняя грань трудоемкостей индивидуальных задач - семейства. Погрешностью метода В на индивидуальной задаче f класса (т. е. погрешностью результата z метода В в качестве приближенного решения задачи /) называется " величина j? e==e(z, f) = tnax{f0(z)—f», fv(z).fm(z)}, _ где f* — оптимальное значение целевой функции ft(x). За- « дача / математического программирования считается раненной с погрешностью, не превышающей в, если най- ден вектор z ё G, для которого /o(z)—/.<e, /;(гХе, щ. ? Погрешность метода В на классе задач называется верхняя г .108
грань по f погрешностей метода В на индивидуальных за- дачах класса. Информационной сложностью Л/(е) решения задач клас- са (f, -G) с помощью методов В, использующих оракул О и обеспечивающих приближение с погрешностью, не боль- шей 8, называется потенциальная граница эффективности таких методов, определяемая как минимальная трудоем- кость, с которой метод В может еще решить любую инди- видуальную задачу класса с погрешностью, не превышаю- щей е. Другими словами, информационная сложность N(&) класса задач (/, 6) — это минимальное число I шагов, при котором еще существует некоторый метод В, использующий оракул О и решающий задачи класса с трудоемкостью не более 7 и погрешностью не более 8. В теории информационной сложности оцениваются сложности основных классов экстремальных задач и кон- струируются метода, оптимальные или почти оптимальные по сложности. Таким образом, теорйя информационной сложности — это теория построения и оценки экономных методов решения оптимизационных задач различных - классов. 4. В заключение параграфа обсудим достоинства и не- достатки принятого подхода к (щенке классов задач опти- мизации и методов их решения. Главные достоинства подхода — его общность и резуль- тативность. В описанную схему укладывается любой мыс- лимый численный метод оптимизации. Оказывается, что даже в столь широкой постановке удается получить содер- жательные результаты. Недостаток подхода — грубость измерения трудоемкости метода. Трудоемкость решения задач характеризуется здесь лишь объемом информации, которую нужно получить, чтобы построить решение задан- ной точности. При этом цё учитывается реальный расход вычислительных ресурсов на переработку этой информа- ции. Реальные затраты ресурсов могут существенно зави- сеть от выбранного метода и могут быть весьма велики. Грубость измерения трудоемкости — плата за общность и результативность подхода. Попытка уточнить определе- ние трудоемкости, заменив, например, число шагов метода числом необходимых арифметических операций для столь обширных и аморфных по структуре классов задач, как за- дачи нелинейного программирования, привела бы к ряду малообозримых проблем, решение которых неминуемо со- держало бы элементы произвола,- /09
Грубым представляется и принятый минимаксный под- ход —- оценка метода по результатам его применения к «наи- худшим» задачам класса. Казалось бы, что гораздо более объективными показателями метода были бы характеристи- ки (трудоемкость и погрешность), усредненные по задачам класса. Однако для сколь-нибудь широких классов задач нет никаких содержательных и математически осмыслен-' ных способов задать априорное распределение задач в клас- се. Это значит, что минимаксная постановка представляет- ся единственной доставляющей объективную информацию. Тем не менее мы увидим, что и при таком грубом подходе -к оценке сложности задач можно прийти к вполне осмыс- ленным и важным результатам о потенциальных возмож- х ностях методов оптимизации. Следует, правда, отметить, что в самое последнее время появились работы, заставляющие Смягчить приведенные выводы. Можно ожидать, что при некоторых естествен- ных требованиях к распределению задач в классах удастся получить оценки средней трудоемкости методов оптимиза- ции и получить, таким образом, возможность более объек- тивного их сравнения. Информационная сложность нелинейного (невыпуклого) программирования . 1. Рассмотрим класс всех гладких невыпуклых задач нелинейного программирования / (х) —> min |х£ G, где G — единичный шар в n-мерном пространстве Р", а функция f на Rn дифференцируема сколь угодно много раз, причем ее частные производные до порядка k включи- тельно во всем пространстве по модулю не превосходят 1. Пусть оракул сообщает значения производных f всех по- рядков (от 1 до k) в любой точке, в которой ему задается вопрос. Оказывается, информационная сложность такого класса задач фантастически велика и оценивается снизу формулой п N (е)^с(п, k)^k, J10
где с (и, k) — некоторая константа, зависящая от п и k. На практике k обычно невелико, k=\— 2 (старшие произ- водные мы оценивать обычно не умеем), так что при немалых п и — разработка универсального метода (годного для ре- шения любой задачи класса) с приемлемыми затратами вы- числительных ресурсов — безнадежная затея. (Заметим, что значение с (п, k) даже по заниженным оценкам таково, что при и=20, е=0,001 имеем Af(e);>10u.) Полученная оценка и сформулированный вывод справедливы и для методов случайного поиска. Таким образом, теория информационной сложности говорит о бесперспективности поиска универсальных мето- дов решения любых невыпуклых задач и рекомендует раз- работку специальных методов, учитывающих структуру и специфику более узких классов задач, включающих инте- ресующую прикладника конкретную проблему. Чем уже этот класс, чем больше особенностей структуры задач мо- жет быть учтено, тем’больше шансов на «изобретение» ме- тода приемлемой трудоемкости. 2. Заметим, что катастрофический рост сложности N(е) с ростом п и у вызван не столько многоэкстремальностыо задач рассматриваемого класса, сколько их невыпуклостью. Если сузить рассмотренный выше класс задач и оставить в нем только унимодальные задачи (задачи с единственной во всем пространстве критической точкой — нулем градиен- та), то сложность класса уменьшится несущественно и ее оценка снизу примет вид: л-1 A\(e)>Ci(n, ty(-j-) * > что немногим лучше оценки снизу для общей задачи нели- нейного программирования. Оптимизационные задачи не очень малой размерности, в которых целевой функционал имеет единственный экстремум и точки перегиба, уже крайне сложны для решения. Таким образом, одноэкстре- мальность не является еще тем свойством невыпуклых задач, которое позволяет существенно сократить трудо- емкость их решения. Выделение подклассов нелинейных задач, для которых могут быть разработаны эффективные методы анализа, должно быть основано на других струк- турных свойствах функционалов, определяющих условия задачи. • 111
Информационная сложность выпуклого программирования 1. Класс общих выпуклых задач является достаточно широким классом задач нелинейного программирования, в который укладываются многие прикладные проблемы. Этот класс задач характеризуется вполне приемлемой тру- доемкостью решения. Напомним, что в задачах выпуклого программирования область G — выпуклое множество, а критерий /®(х) каче- ства решения и функции f}(x), /=1, ..., т, определяющие ограничения задачи,— выпуклые функции. Множество G выпукло, если отрезок, соединяющий любые две точки G, целиком принадлежит .этому множеству. Функция f(x) выпукла на выпуклом множестве G, если хорда, соединяю- щая любые две точки графика f(x), лежит не ниже соответ- ствующей дуги графика (точек графика, отвечающих тем же значениям аргумента х). Выпуклые функции /(х) на выпук- лом множестве G обладают следующим свойством. Како- ва бы ни была точка х®, принадлежащая внутренности мно- жества G (обозначается Xo£intG), всегда можно через нее провести по крайней мере одну гиперплоскость (если Дх) гладкая, то только одну), которая разделит область G на две частя, такие, что в одной из них гарантируется вы- полнение неравенства Дх)^Дх®). Разделяющая гиперпло- скость определяется локальной информацией об Дх) в точке х®. Для гладких функций это значение и градиент Дх) в точке х®(/(х®) и V/(x)|x=Xo). Если в точке х® не существует градиента (f(x)—негладкая функция), то его роль играет так называемый опорный функционал — любой вектор, опре- деляющий направление гиперплоскости, проходящей через х® и не пересекающий график Дх). Таким образом, если, например, одно из ограничений задачи математического программирования не удовлетворяется в точке х® (при до- пустимой погрешности е), т. е. fj(x0)>e, то можно-, через точку х® провести гиперплоскость, которая рассечет G на две части, во всех точках одной из которых это ограни- чение не будет выполняться: Д(х)>Д(х®)>в. Если требует- ся найти точку х £ G, в которой /®(х) достигает минимума, то информация о поведении /®(х) в точке х„ позволяет про- вести через х® гиперплоскость, отсекающую от G часть, в ко- торой минимум /®(х) не может быть достигнут. На этом свой- стве основаны Некоторые эффективные методы выпуклого программирования. '
Будем рассматривать задачи выпуклого программиро- вания, в которых Q — выпуклое замкнутое ограниченное тело в n-мерном пространстве, а колебания выпуклых функ- ций Д(х), определяющих условия задач, не превышают единицы, т. е. тахД(х)—minfy(xX 1. Гладкость-этих функций отнюдь не предполагается. Бу- дем считать, что оракул сообщает значения функций Д(х) и их градиента в любой точке х, указываемой методом. Если в некоторой точке функция fs(x) не имеет градиента, ора- кул сообщает вместо него какой-нибудь отличный от нуля опорный функционал в этой точке (градиент к подходящим образом сглаженной в этой точке fj(x)). Для класса общих выпуклых задач получены верхняя и нижняя границы асимптотики сложности по е-»-0. Она задается следующими соотношениями: ЛГ(е)<2,2]п1п-Ц, е< 1, 8<8(G), ^(G)^. (Здесь ]а[ — наименьшее целое число, большее либо рав- ное a; e(G) — зависящая от G величина погрешности, на- чиная с которой справедлива нижняя оценка сложности.) Таким образом, в принципе можно решать общие вы- пуклые задачи методом, сходящимся со скоростью геомет- рической прогрессии со знаменателем 1—^тот метод не зависит от гладкости выпуклых функций Д(х) и от гео- метрических особенностей выпуклого тела G. В асимптоти- ке по е->0 быстрее решать общие выпуклые экстремальные задачи и нельзя. 2. Метод, реализующий при малых 8 верхнюю оценку ин- формационной сложности класса общих выпуклых задач, называется методом центров тяжести (МЦТ). Он представ- ляет собой- естественный многомерный аналог метода ми- нимизации одномерной выпуклой функции, известного под названием метода дихотомии, или метода деления пополам. Чтобы найти минимум одномерной функции Дх) на отрезке [а,Ы, находим иа графике середину [а, 6] точку х0. Вправо от х0 функцияДх) растет, так что на отрезке [х®, 61 Дх) не может достигнуть минимума. Далее рассматриваем отрезок [а, х01, делим его точкой хх пополам и отбрасываем поло- 113
вину этого отрезка, в которой Продолжая этот процесс, мы можем с любой заранее заданной точностью определить минимальное значение целевой функции f(x). Обобщение метода дихотомии на многомерный случай — это метод центров тяжести. Уже указывалось, что, выбирая любую точку х0 € intG, можно по локальным характеристи- кам функций fj(x), отвечающим нарушенным в х0 ограниче- ниям, усекать область G®=G, отбрасывая ее часть, заведомо не удовлетворяющую условиям задачи. Если в х0 не нару- шается ни оДно из ограничений задачи, можно, используя локальные характеристики /0(х) в х0, отсечь часть области 6«=G, в которой значения целевой функции заведомо пре- вышают /0(*в). Обозначим оставшуюся часть G через Gt. Область Gi также выпукла. Выберем в ней точку xt € intGf и проведем через хг гиперплоскость, отсекающую часть Gi, в которой не выполняются условия задачи, или (если все ограничения задачи в точке xt не нарушены) часть Gi, в ко- торой не может быть локализован минимум /0(х). Назовем оставшуюся часть Gi через 62 и продолжим процедуру. Таким образом, можно, последовательно выбирая точки Xi^intGj, сокращать объем области локализации решения задачи выпуклого программирования. Чтобы добиться до- статочно быстрого убывания объемов частей-G,- множества G, следует наиболее рациональным образом выбирать точ- ки xt. Наиболее эффективным оказывается выбор в каче- стве xt центра тяжести Сг. В этом случае отношение объемов областей G; и G,_i IG.-I 1 _ ( « \» I _ 1 114
Отвечающий этому правилу метод решения задач вы« пуклого программирования — метод центров тяжести — обеспечивает выполнение неравенства i ^(г{, у)", где Zt та из допустимых точек хл, .... xlt на которой до- стигается наименьшее значение f0(x). Из последнего нера- венства следует приведенная ранее верхняя оценка сложно- сти класса общих выпуклых задач. 3. Уже отмечалось, что оценка трудоемкости решения общих выпуклых задач, определяемая методом центров тя- жести, правильно описывает поведение сложности в асип- тотике по е->0. При этом асимптотика устанавливается, начиная от некоторого e(G), зависящего от геометрических свойств G. Если G куб или параллелепипед, то е (G) = у; если G шар или эллипсоид, то е (G) — у. Таким образом, при высоких требованиях к точности (e<e(G)) трудоемкость метода центров тяжести не может быть улучшена по поряд- ку. К сожалению, этот результат имеет чисто теоретическое значение. Для реализации МЦТ необходимо уметь на каж- дом шаге отыскивать центр тяжести произвольных выпук- лых тел. А это уже при и>3 практически безнадёжная в вы- числительном отношении задача. Однако ценой некоторого увеличения трудоемкости уда- ется подправить идею метода центров тяжести и обеспе- чить приемлемую вычислительную сложность решения выпуклых задач. Соответствующая модификация алгорит- ма называется модифицированным методом центров тя- жести (ММЦТ) или методом эллипсоидов (МЭ). Идея метода эллипсоидов заключается в том, что на каждом шаге область локализации решения вписывается (в надлежащей системе координат) в эллипсоид минималь- ного объема, для которого вычисление центра тяжести не представляет труда. Оказывается, что для метода эллип- соидов I I 1______с(«) IGz-il п • где 0<с(л) —« 4 • Отсюда следует, что оценка трудоем- П->00 & 115
кости метода эллипсоидов ЛЧ8)<ф*1п-у[, где с — некоторая константа. С другой стороны, алгоритмическая реализация метода эллипсоидов относительно проста. Один шаг метода требу- ет 0(п2) арифметических операций при памяти О(п2). Совсем недавно было показано, что на идее МЦТ может быть по аналогии с МЭ построен метод симплексов (МС), в котором роль эллипсоида на каждом шаге выполняет симплекс. Центр тяжести симплекса вычисляется без- тру- да. Его координаты являются среднеарифметическими зна- чениями координат вершин симплекса. Трудоемкость МС оценивается величиной сп3 In . Имеются, однако, основа- ния ожидать, что для широкого класса распределений сред- ние оценки МС предпочтительней средних оценок МЭ. Метод эллипсоидов и метод симплексов (МЭ и МС) являются единственными известными универсальными ме- , тодами решения общих выпуклых задач с полиномиальной 1 _ ‘ по п и — оценкой трудоемкости и полиномиальной по п вычислительной сложностью шага. Накопленный опыт использования метода эллипсоидов для решения выпуклых задач умеренной размерности : (и=154-25) на современных вычислительных машинах показывает, что точность решения порядка 10-54-10-в до- стигается за l-i-15 мин. 4. Мы видели, что асимптотика сложности класса общих выпуклых задач зависит только от размерности п тела G, а геометрические свойства G определяют момент установле- ния асимптотики. Обычно выход на асимптотику проис- ходит тем позже, чем больше п. В экономических и ряде других прикладных задач нередко п весьма велико (10*4-10*), а е не слишком мало (10~14-10~2). Поэтому пред- ’ ставляет интерес анализ поведения сложности (и реализую- щих ее методов) и в доасимптотическом диапазоне значе- ний е. ' Оказывается, что в этом случае для тел G с «хорошими» геометрическими свойствами (например, для тел типа «ша- ров» в так называемых пространствах Лебега Lp, в частно- сти для обычного шара в эвклидовом пространстве 12) 116 '
сложность ограничена сверху функцией, представляющей полином от и не зависящей или почти не зависящей от размерности п. Приведенный график иллюстрирует изме- нение сложности класса общих выпуклых задач для случая, когда тело G хорошо аппроксимируется эвклидо- вым. шаром. В начальном — доасимптотическом — диапа- зоне изменения сложность растет, как -р, и не зависит от размерности п. Так продолжается до тех пор, пока сложность не достигнет величины порядка размерности G. В конечном диапазоне значений — (при—^п2^ сложность меняется, как nln —. В промежуточном диапазоне порядок сложности меняется от п до nlnn. Примерно так же ведет себя график сложности выпуклых задач в случаях, когда G аппроксимируется шаром в L„, Кр<оо, только при 1 малых — е . ( 1 \tnax (2, р) (1 \2 т) 1пп» при р — оо N(e)~nln-L. В случаях когда G — эвклидов шар, верхняя оценка сложности начальном диапазоне изменения -i-) реали- .117
зуется обычным градиентным методом негладкой оптими- зации. Если G шар в Lp, соответствующие оценки сложности реализуются так называемыми методами зеркального спус- ка [33]. Эти методы представляют не только теоретический интерес. Они позволяют приспособить метод к геометрщ. ческим особенностям решаемой задачи. В некоторых ти- пичных задачах большой размерности (например, в харак- терных для ряда экономических и технических задач слу- чаях, когда G представляет собой симплекс) применение методов зеркального спуска дает ощутимый эффект. 5. В теории информационной сложности выпуклых задач имеются и оценки трудоемкости, и эффективные метода решения для различных частных классов выпуклых задач, в частности, для классов гладких и сильно выпуклых задач. Методы, реализующие верхнюю оценку сложности, обоб- щены и приспособлены к решению выпукло-вогнутых игр, выпуклых задач управления при неполной информации, ж обобщенных выпуклых задач, в которых требуется из некоторого выпуклого множества выбрать вектор, оптималь- ный в смысле заданного выпуклого предпочтения. Обзор постановок и результатов в этих направлениях см. в [35]. Наметились также и некоторые другие приложения резуль- татов теории информационной сложности. Субоптимальные законы управления 1. В [55] обращено внимание на то, что методы оптими- зации, субоптимальные по информационной сложности, в ряде случаев оказываются и субоптимальными «законами управления», т. е. методами, обеспечивающими оптимиза- цию в реальном времени. Подчеркнем еще раз, что рассмотренные выше методы оптимизации выпуклых функций могут быть эффективно .распространены на стохастический случай, когда информа- ция о значениях функций й их градиентов (или опорных функционалов) искажена случайными ошибками, распреде- • ление которых удовлетворяет некоторым нежестким тре- бованиям. Решение условной экстремальной задачи можно интер- . претировать в содержательных терминах как формирование управления реальным объектом. В момент t выбирается команда управления xt, принадлежащая допустимому мно- жеству управлений G и минимизирующая заданную функ- 118
цию потерь f(x). До сих пор, говоря о решении задачи чис- ленным методом, мы не предполагали взаимодействия с реальным объектом. Информация о локальных характе- ристиках функции потерь в выбранной точке х, не опреде- лялась реальной реакцией объекта на управляющее воз- действие хг. Стратегия выбора точек xt, в которых задава- лись вопросы источнику информации, оценивалась не тем, насколько хороши точки х; как команды управления, а тем, как быстро локальная информация о функции потерь в точках xt окажется достаточной для построения решения требуемой точности. Такой подход оправдан при работе с моделью, а нес реальным объектом. На практике часто возникает необходимость в построении адаптивной системы управления, в которой формирование управляющих воз- действий на априори не полностью описанный объект про- исходит в ходе работы с ним по результатам анализа его реакций на предыдущие воздействия. Оказывается, что несложная модификация методов зеркального спуска может обеспечить адаптивное управление объектом. 2. Пусть на объект управления в моменты /=1, 2, ... подаются команды xt£G. Будем считать, что в момент t на объект, кроме того, воздействует помеха ®t. Предпола- гается, что реализации помехи в различные моменты вре- мени — независимые, одинаково распределенные - случай- ные величины. Мы рассматриваем безынерционный объект, поведение которого в момент t полностью описывается командой xf и реализацией помехи ®( и йе зависит от предыстории воз- действий на объект. Поведение объекта в момент t оцени- вается функцией потерь ср(х1,®(). После реализации команды управления xt и помехи ®( в орган управления по цепи обратной связи поступает значение функции потерь <р и вектор градиента Vx«p в этой точке. Эта информация исполь- зуется для формирования очередного управляющего воз- действия x(+i. Правила построения очередной, команды как функции от накопленной к этому времени информации {<р(х1( ©J, ТжФ(ху ©О, -•ф(х{, <ot), V/P(xf, cot)} и представляют закон управления объектом. Будем характеризовать качество управления .средним по времени и по реализациям помех значением функции потерь = 2 ф(хт, ®т)1. 't=i 119
Оптимальный закон управления обеспечивает минимиза- цию g(i). г Будем считать, что область определения управляющих воздействий 6 выпукла, замкнута и ограничена, а функция <р(х, ®) выпукла (и липшицева по х € G). Обозначим f(x)—Matf(x, ®) и пусть х* есть точка, в ко- торой f(x) достигает своего минимального значения на G. Поскольку xt формируется по предыдущим командам и, ' следовательно, зависит от истории процесса до момента a не зависит от предшествующих помех «ч.......®<_i, то.. £(0>/(х*). С другой стороны, при Xf^X* g(t)=f(X*) при всех I. Однако если объект управления заранее полностью не определен, то управление xt=x* не может быть реализо- вано никаким законом управления и нужно заботиться лишь о том, чтобы g(t) возможно быстрей приблизилось к fix*). Выбор субоптимального численного метода решения стохастической задачи выпуклой оптимизации и формиро- вание субоптимального закона управления — близкие проблемы, различающиеся тем, что рациональный числен- ный метод оценивается по числу шагов, затрачиваемых на достижение решения требуемого качества, а закон управ- . ления оценивается по средним потерям, определяемым ис- пользовани!рм формируемых в ходе поиска управлений. 3. Обозначим через ех=Л1<йф(хх,®т)—f(x*) среднее зна- чение погрешности т-й команды хт, обусловленное выбран- ! ным методом оптимизации; в качестве решения экстремаль? . ной задачи / (х) —+ min при х ё G. Средние (по времени и помехам) потери g(f) превышают, минимально возможное значение нВ величину Д (/)=§(/)—/(х*)==-|- 2 в,.. т=1 I _ В силу выпуклости /(х) имеет место неравенство ?’ у2ет^*=у2(ЛЦф(хх, ®?)—/(х*)})= = 12 (/(хт)-7(х‘))f(± 2 хЛ-/(х*). 120
Пусть погрешность Д(0 метода оптимизации (который в рассматриваемом случае используется в качестве закона управления) в момент /не превышает требуемой величины 8. Если считать результатом работы метода в момент t точку . t -~-SxT, то трудоемкость такого метода равна t, а погреш- » 1 » ность не превышает Д( 0^8. Число шагов, гарантирующее решение задачи оптимизации с погрешностью' е, не больше минимально достижимого числа шагов, после которых «наи- лучший» закон управления обеспечит выполнение неравен- ства Д(/)^е. Обратное, вообще говоря, неверно. Если не- который метод оптимизации позволяет Находить решение погрешности е за t шагов, то это еще не значит, что он в ка- честве закона управления в состоянии гарантировать при всех T^t неравенство Д(Т)^е. Тем не менее существуют методы, «субоптимальные» в качестве вычислительных ме- тодов выпуклой оптимизации и в то же время «субопти- мальные» в качестве закона управления. Такими методами, в частности, являются упомянутые выше методы зеркаль- ного спуска. Соответствующее обсуждение и аргументация приведены в [55]. Адаптивное управление экономикой 1. Ё [34] рассмотрено еще одно приложение теории ин- формационной сложности на этот раз к теоретическим ас- . нектам адаптивного управления экономикой. В известных экономико-математических моделях управ- ления экономической системой обычно предполагается возможность прогнозирования результатов реализации лю- бых допустимых воздействий. В этом предположении вы- бираются оптимальные в том или ином смысле управления и исследуются их свойства. Предположение об априорном знании управляемой системы допустимо, если исследованию подлежат «локаль- ные» проблемы, связанные с выбором и анализом управляю- щих воздействий «вблизи» уже реализованных. Это пред- положение, однако, уязвимо, если речь идет ©«глобальном» управлении экономикой на больших временных интер- валах. ' . В настоящем параграфе рассматривается ситуация, в ко- торой требуется управлять экономикой с априори не пол- ностью известными последствиями принятых управлен- 121
ческих решений. Предполагается, что заранее известны лишь некоторые качественные характеристики системы, так что априорная информация выделяет не одну конкрет- ную экономическую систему, а достаточно широкий их класс. При этом заранее неизвестно, с какой именно систе- мой из этого класса придется иметь дело. Всю недостающую информацию можно получить лишь в ходе реального управ- ления, цель которого предполагается известной. Методоло- гия теории информационной сложности позволяет при не- которых естественных предположениях о классе систем построить эффективный (в некотором смысле субоптималь- ный) механизм накопления информации и управления, обеспечивающий достижение поставленной цели. При неполной априорной информации об управляющей системе качество механизма управления зависит не только от него, но и от конкретной системы, к которой он приме- няется. В таких случаях естественно сравнивать различ- ные способы управления по определяемым ими гарантиям. Другими словами, будем считать лучшим механизмом управления механизм, оптимальный в минимаксном смыс- ле. Такой механизм, обеспечивает возможно лучшее управ- ление в наихудшей ситуации. В отличие от известных экономико-математических мо- делей, в которых цель управления — максимизация тем- пов роста экономики, предлагаемый подход преследует другую цель — стабилизацию экономики в состоянии с наи- высшей полезностью за возможно меньшее время. Аргу- ментация этого подхода остается за рамками настоящей работы. Опишем класс рассматриваемых экономических си- стем — определим основные понятия, сформулируем цели управления и обсудим априорные гипотезы о системах, гарантирующие достижение поставленных целей. 2. Начнем с описания экономической системы. Под экономической системой будем понимать совокуп- ность трех объектов: производственной системы, дисцип- лины распределения наличного продукта и функции по- лезности. (а) Производственная система. Будем рассматривать эко- номическую систему, в которой обращаются п видов про- дукции. Функционирование системы происходит по тактам (например, годам). Продукция, произведенная в данном году, определяется планом этого года. Ясно, что возмож- ности управления не ограничиваются определением вектора 122
продуктов х, предназначенного на данном этапе для про- изводственного использования. Помимо этого, можно еще давать не стесненные наличными материальными ресурсами директивные указания. План z не только фиксирует вы- деленные производству материальные и трудовые ресурсы х, но и определяет директивные задания и по распреде- лению этих ресурсов между отраслями. Таким образом, план г характеризуется двумя группами компонент хим г = (х, и). Вектор х — (х1, ..., х") £ R"—это вектор продук- тов, предназначенных для производственного использова- ния в данном году. Вектор и = (и1, ..., —это век- тор плановых директив—команд производству со стороны управляющего органа. Имеем z == (х, и) € R1 х R™ = R^m. Будем обозначать х-компоненту плана z через Р (г). Под производственной функцией экономики Т{г)~ =(Ti(z), ..., T„(z)) будем понимать вектор-функцию, опре- деляющую производство разных видов продукции в резуль- тате реализации плана z. Планы, которые могут быть в принципе реализованы, образуют некоторое множество GcR"+m. Естественно при- нять, что G ограничено, a P(G) лежит в неотрицательном ортанте R". Будем называть пару (G, Т) производственной системой. (б) Распределение ресурсов. Продукт, имеющийся в си- стеме, на каждом такте распределяется между непроиз- водственным потреблением на данном такте и производ- ственными затратами на следующем такте и, возможно, частично переводится в запас. Дисциплина распределения определяет на каждом такте t объем продукта Rt^R", отведенный для производственного использования на так- те t, как функцию от «истории» системы до момента t. При этом Ri — начальное условие — предполагается заданной величиной. ' Допустимый план на такте t — это план, удовлетворяю- щий условиям zt£G, P(zt)^.Rt, т. е. план, реализуемый технически и обеспеченный ресурсами. Таким образом, функционирование производства опре- деляется траекторией планов zu z2, ..., которой соответству- ет траектория объемов производимых продуктов T(?i), Т(г2)....Последняя, в свою очередь, определяет в соот- ветствии с дисциплиной распределения наличного продукта траекторию Rit Rz, ..., объемов продукта, расходуемого на производство. (в) Полезность. Предполагается, что удовлетворение от 128
потребления в непроизводственной сфере вектора продук-;. тов х характеризуется функцией, полезности V(x). 3. Цели управления. Будем считать, что целью управле- ния является возможно более быстрая стабилизация эко- номики в состоянии с максимальной полезностью. Чтобы формализовать и, таким образом, уточнить цель управления, введем понятие стационарного состояния (или стационарного плана) экономики. Назовем стационар- ным планом экономики любой план z£G, для которого Т(г)^Р(г). Если z стационарный план и в момент t вектор ресурсов Rt допускает реализацию плана z (т. е. 7?^Р(г)), - то, начиная с момента t, мджно все время применять план z, изымая для непроизводственного потребления «излишек» T(z)—P(z) (чтобы исключить ситуации, в которых «из- лишка» может не оказаться, будем считать, что под Т(г) подразумевается производственная функция, из которой заранее исключен необходимый минимум непроизводствен-* ного потребления). Таким образом, можно стабилизировать экономику в соответствии с • планом z и полезностью V*(z) — V(T(z)—P(z)), называемой стационарной полез- ностью. Во введенных терминах цель управления состоит в наи- > быстрейшем^ переводе экономики в стационарное состояние с максимально возможной стационарной . полезностью V*=max{/*(z)|zCG — стационарно}. Это состояние бу- дем называть оптимальным. Можно показать, что при'есте- ственных предположениях относительно характеристик экономики стабилизация в оптимальном состоянии макси- мизирует среднюю по времени полезность управления. ' 4. Априорные гипотезы. Сформулируем предположения. об. управляемой. экономической системе, гарантирующие достижение поставленной цели. J Помимо общепринятых допущений о выпуклости, замк- нутости и ограниченности G и вогнутости компонент про- изводственной функции и функции полезности, мы будем. . предполагать экономику восстанавливаемой и расширяе- мой. Определим эти понятия. Экономика называется восстанавливаемой, если су- ществует (и известен) по крайней мере один план г£б, обладающий .следующими свойствами (1) г — «продуктивный» план, т. е. T(z)>P(z) (нера- венство по каждой компоненте); (2) какова бы ни была реализуемая траектория разви- 124.
тия системы до такта t, вектор Rt позволяет реализовать в такте t план г. План г, удовлетворяющий требованиям (1) и (2), назы- вается точкой восстановления экономики. Условие восстанавливаемости означает, что, несмотря на то что экономическая система не предполагается априо- ри заданной, существует гарантия от попадания системы в безвыходное состояние — существует «продуктивный» план, достижимый за один шаг из любого другого состоя- ния. Пусть X € R" — (Л.1, ..., %") > 0. Экономика называ- ется Л-расширяемой, если при реализации в произволь- ный момент t произвольного стационарного плана zt == = (xt, ut) выполняется условие R't+1 -f-V (Ту (г,)—х{), j=l, •••, п. Другими словами, экономика Л-расширяема, если дисциплина распределения имеющегося продукта такова, что, получив по /-му продукту прирост выпуска над затратами Tz(z)—х!, можно расширить вложение в производство продукта не менее чем на долю V от по- лученного прироста. 5. Будем предполагать, что после реализации плана zt управляющему органу становятся известными вектор T(zt) и матрица T'(z) субградиентов компонент производ- ственной функции в точке t. _Эта локальная информация используется для формирования очередного плана. Обозначим через А множество всех экономических си- стем, удовлетворяющих перечисленным в предыдущих пунктах допущениям. Приведем идею механизма управления — набора правил формирования очередных планов в зависимости от накоп- ленной к текущему такту информации. От механизма управ- ления требуется, чтобы на любой системе из А он определял траекторию планов, стабилизирующуюся на е-оптимальном по полезности стационарном плане. Качество механизма управления конкретной системой будем оценивать по вре-. Мени достижения е-оптимального стационарного плана. Чем оно меньше, тем механизм лучше. _ Требуемый механизм управления должен в конечном счете обеспечить решение системы выпуклых неравенств: z€G:T(z)>P(z), Р(г)>(1—е)Г, где V (г) = V (Т (г)—Р (г)), V = sup (V (г)| z € Qr P (г)}. 125
1 Первое из этих неравенств есть условие стационарности плана. Второе неравенство представляет собой условие е-оптимальности плана. При этом требуется выйти натраек- торию, удовлетворяющую этим неравенствам, за возможно меньшее время. В [34] предложен механизм, реализующий решение сфор- мулированной задачи. Механизм управления существенно использует схему метода центров тяжести. Содержательно механизм управления вначале переводит систему из начального состояния в состояние с максималь- ным темпом роста, а уже из него пёреводит систему в е-оп- тимальное по полезности состояние. Другими словами, вначале, абстрагируясь от полезности, определяется ста- ционарный план с наибольшим темпом роста — строится материально-техническая база дальнейшего движения. Да- лее, отправляясь от этого плана, оптимизируется полез? ность. Каждый такт первого этапа позволяет сократить об- ласть, «подозрительную на высокий показатель роста». Каждый такт второго этапа сокращает область, «подозри- тельную на высокую полезность». 6. Приведем оценку числа тактов т(Э, е), за которое экономическая система Э, управляемая предложенным в [341 механизмом, гарантированно перейдет в е-оптимальное состояние. Выражение «экономика Э, спустя т(Э, е) тактов, гаран- тированно застабилизируется в 8-оптимальном состоянии» означает, что накопленная за т(Э, е) тактов информация позволяет сделать вывод о том, что достигнутое состояние' нельзя существенно улучшить и, стало быть, это состояние имеет смысл (и возможно) «заморозить» на все последую- щее время. Назовем темпом роста экономики Э на плане г величину ф (г) = min V (Тх (г)—Р' (г)) — часть приращения выпуска над затратами, которую до- пускается использовать для расширения производства наи- более критичного продукта. Максимум темпа роста экономики Э по всем допустимым планам z$G обозначим через а(Э), а темп роста в точкег восстановления экономики—через а(Э). Величина Q = характеризует уровень потенциальных потерь, связанных 126
с переходом в точку восстановления г. Это значит, что су- ществует стационарный план с темпом роста в Q раз боль- шим, чем темп роста в г. Пусть х! = max \Р! (z)| г $ G} максимальный по допусти- Z6G мым планам объем продукта xJ, предназначенный_для про- изводственного использования, а р, (Э) = max VxA Вели- 1</<л с а (Э) - чина s==-^- характеризует, грубо говоря, отношение максимально возможного прироста продукции в ходе про- изводства к максимально возможному объему продукции. Пусть S < у, 8 < у, а (Э) < 2, Q > 2. В этих предпо- ложениях имеет место следующая оценка числа тактов т(Э, в), при котором предложенный в 134] механизм управ- ления гарантирует стабилизацию экономики Э в е-опти- мальном состоянии: т(Э, InQlnS-hln’y}. Здесь о— абсолютная константа (по грубой оценке порядка не более 102). Таким, образом, с точностью до логарифмиче- ских по Q, 8 и S членов время стабилизации обратно про- порционально темпу роста экономики. В [341 показано, что такое же неравенство может быть использовано для оценки эффективности механизма управ- ления экономикой и в случае, когда производство продук- ции определяется не только реализованным планом, но и некоторыми непредсказуемыми факторами, определяющими «состояние среды» (погода, конъюнктура и т. д.). Правда, при этом речь идет уже не о стабилизации системы в состоя- нии с максимальной полезностью, а о стабилизации в со- стоянии с заданной (достижимой) полезностью Vo. Кроме того, в этом случае качество механизма управления опре- деляется числом тактов, на которых желательный уровень полезности не достигается (чем оно меньше, тем лучше). Диалоговое программирование 1. Экономные алгоритмы решения задач выпуклой опти- мизации, рассмотренные в этой главе, могут быть исполь- зованы также для организации рационального диалога между специалистами по содержательным и формальным 127
дисциплинам в процессе постановки и анализа задач пла- нирования, управления и проектирования. Одна из наиболее серьезных причин недостаточной эф. фективности разработок и внедрения многих серьезных идей и проектов, в создании которых принимали участие большие коллективы ученых, заключается в неудовлетво- рительной организации взаимодействия специалистов раз- личного профиля, в первую очередь математиков и инже-: неров, математиков и экономистов. Математики — сторонники формального мышления — нередко вынуждают инженеров, экономистов и представи- телей других прикладных дисциплин, мыслящих в содер- жательных терминах, осваивать несвойственные их харак- теру и профессиональной подготовке формальные конструк- ции и непривычные для них логические схемы рассужде- ний. В свою очередь прикладники, ограниченные сроками выполнения работ,, требуют от математиков, участвующих, в постановке и решении прикладных задач, отказа от стро гйх формальных построений и использования эвристических приемов, невзирая на отсутствие у них интуиции в данной области и достаточного практического опыта. В итоге npij такой организации работы неэффективно используются квалификация и возможности и тех и-других. Среди'современных прикладных проблем, требующих количественного анализа, редко встречаются задачи, ис- следование которых можно было бы четко разделить на два этапа — содержательный (этап постановки задачи и накоп- ления исходной информации) и формально-математический (этап разработки метода анализа и формального решения задачи). Гораздо чаще этапы постановки и формального исследования задачи сложным образом переплетаются. К моменту, когда осознается необходимость в разработке некоторой системы й принимается решение о формировании соответствующих научных коллективов и финансировании работы, обычно нет еще четко поставленной задачи. Началь- ная содержательная постановка задачи обычно допускает далеко не однозначное истолкование. Цели системы и огра- ничения на ее создание выделяют на первом этапе разработ- ки не индивидуальную, как это понимают математики, за- дачу, а целый класс задач — массовую задачу. Априорная информация о массовой задаче, отвечающей исследуемой проблеме, определяется. содержательными соображениями о структуре системы и характеристиках ее функционирова- ния. • 128 ~
Четкая содержательная постановка задачи — необходи- мое, но отнюдь не достаточное условие для построения фор- мальной модели, поддающейся количественному анализу. Не всегда удается получить аналитическую или другую формальную запись зависимостей, определяющих условия задачи. Эго усложняет организацию взаимодействия спе- циалистов различного профиля при постановке и решении задач синтеза сложных систем. 2. Новые подходы к построению субоптимальных мето- дов оптимизации, основанные на теории информационной сложности, указывают пути рационального разделения тру- да и ответственности между математиками и вычислителями, с одной стороны/ и инженерами и экономистами — с дру- гой. Аналогичные формальные проблемы возникают ори согласовании интересов заказчика и исполнителей, руково- дителей работы различного уровня и т. д. Во всех этих случаях процесс постановки и решения задачи представляет собой целенаправленный диалог между лицом, ответствен- ным за разработку рацйональной последовательности эта- пов накопления информации, и представителями содержа- тельных дисциплин, обеспечивающих этап информацией. Будем называть методологию постановки и решения задач управления,- планирования и проектирования при ограниченной четко зафиксированной априорной инфор- мации об условиях задачи диалоговым (полилоговым) про- граммированием. Термин «диалоговое программирование» часто используется как наименование различных интерак- тивных процедур взаимодействия оператора с ЭВМ при от- ладке программ или выборе решений. Последующий текст не оставляет, однако, места для разночтений. Диалоговое программирование (ДП) позволяет посред- ством экономно организованного диалога между участни- ками разработки свести задачу синтеза системы к после- довательности задач анализа некоторой совокупности сис- тем. При заданных характеристиках источника информации (оракула) диалог считается рационально организованным, если идентификация задачи и вычисление решения требуе- мого качества проводятся наиболее экономным образом — при возможно меньшем числе вопросов математика и ответов оракула. В диалоговом программировании решение «наи- более сложной» индивидуальной задачи, принадлежащей массовой задаче, обусловленной исходной априорной ин- формацией, проводится за минимально возможное число элементарных актов диалога. ........ 5 5-»87 . 129
3. Будучи математической теорией, диалоговое програм- • мирование, естественно, ограничивается рассмотрением формализуемых задач выбора решений. Это задачи матема- тического программирования вида —>min|//(«)<0, /= 1, x£G^Ra. К задачам вида (Р») сводятся (по крайней мере в прин- ципе) многие проблемы, связанные с выбором решения, однако, как уже указывалось, эта сводимость в сколь- нибудь сложных ситуациях есть в действительности своди- мость лишь «в принципе». Обычно мы не можем рассчитывать на знание всех функ- ций, входящих в условия задачи. Априорная информация об условиях выбора решения не позволяет, как правило, построить достаточно полную формальную модель, отвечаю- щую исследуемой содержательной задаче. Конечно, можно было бы попытаться восполнить пробелы в наших знаниях соответствующими исследованиями. Однако в сложных' ситуациях объем недостающей информации так велик, а по- лучение ее столь трудоемко, что такого рода подход нереа- лизуем. Кроме того, он порочен и в методическом отноше- нии. Для отыскания решения не требуется знать о задаче все. Необходима информация гораздо меньшего объема, но. жнужного характера». Если же мы попытаемся получить • информацию, полностью идентифицирующую задачу, то наряду с указанной необходимой информацией мы должны узнать много объективно лишнего. Диалоговое программирование как раз и изучает вопрос о том, как наилучшим образом организовать процесс на- копления информации о решаемой задаче, чтобы возможно быстрее накопить минимальный объем знаний, по которому уже можно принять решение требуемого качества. 4. Поясним сущность диалогового программирования на следующей интерпретации задачи Пусть эта задача от- вечает формированию некоторой технической системы. Решение х определяет конкретную ее реализацию. Множе- ство G описывает область допустимых систем. Функционалы /»(х), ..., fm(x) выражают характеристики системы (затраты ресурсов, время разработки, функционально-технические характеристики и т. д.). Одна из этих характеристик (f»(x)) . подлежит оптимизации, тогда как на другие наложены определенные требования, ограничивающие допустимые диапазоны их изменения. Мы имеем, таким образом, дело с проблемой оптимального синтеза технической системы. 130 ,
Задачи такого рода весьма сложны. Гораздо более простыми являются задачи анализа. Задача анализа состоит в ответе на вопрос: каковы будут характеристики/у(х), /==0,1,...»т, системы, отвечающей данному конкретному значению х? Вопросы такого рода естественны для инженера. Для под- готовки ответа на них он обладает широким диапазоном возможностей (от использования прошлого опыта и прямого эксперимента до теоретического анализа проблемы). Ясно, что ответ на подобный вопрос содержит некоторую информацию о решаемой задаче. Диалоговое программи- рование (ДП), грубо говоря, исследует проблему наиболее эффективного использования информации, получаемой при решении последовательности задач анализа, для решения исходной задачи синтеза. Процесс применения ДП выглядит так. Для «запуска» диалога необходима некоторая априорная информация — задание множества в принципе возможных решений и описа- ние (грубое, качественное) свойств функционалов /у(х). После этого специалисту по содержательной стороне дела (инженеру) организатором диалога (лицом, принимающим решение,— ЛПР) ставится серия * задач анализа, связан- ная с решениями х1( х2, ..., xm gG. Формирование очередно- го анализируемого решения проводится ЛПР (с помощью математика) на основе всей полученной к данному моменту информации. После некоторого числа «вопросов к инжене- ру» ЛПР формирует результирующее решение х. Применяе- мая им методика гарантирует оптимальность эТого решения (с заранее предписанной точностью). В формально математическом отношении содержание ДП состоит в построении оптимальных дисциплин диалога дня стандартных классов задач типа Р«. «Оптимальность» здесь означает получение результата при минимальном числе «вопросов к инженеру». Для основных подклассов задач выпуклого программирования такие дисциплины построены (см. 155)). Это позволяет ставить вопрос практи- ческого применения намеченного подхода. Подчеркнем «организационные» аспекты ДП. В диало- ге «математик — инженер» каждая из сторон «остается на родной почве», говорит на своем «языке» — действует есте- ственными для нее методами. При использовании ДП от- падает необходимость построения адекватной действитель- ности формальной модели ситуации. Применение ДП рас- ширяет тем самым круг содержательных задач, доступных дяя точных методов решения. I* 131
5. Источник информации — оракул — при его рацио/ < нальном использовании обеспечивает в диалоговом програм- мировании идентификацию задачи до уровня, при котором может быть получено решение требуемого качества. Ответы источника информации (оракула) на вопросы организатора диалога могут содержать, например, значения функцио-. налов определяющих цели и ограничения для указан- ной в вопросе системы х. Такой источник информации будем называть оракулом нулевого порядка. Более квали- фицированный оракул (оракул первого порядка) может, помимо того, сообщить и градиенты соответствующих функ- - ционалов в точке, отвечающей той же системе, Оракул мо- жет отвечать на вопрос, реализуема заданная система или нет. Более опытный оракул способен, кроме того, назвать причину, по которой система х нереализуема, или указать «ближайшую» к ней (в некотором заранее обусловленном смысле) реализуемую систему. Ответы оракула могут быть точные или приближенные, детерминированные или иска- женные случайными помехами. Оракул может быть стацио- нарным или нестационарным, т. е. списки дозволенных во- просов могут сохраняться или меняться во времени. Есте- х ственно, что рациональная организация диалога требует, предварительной информации о способностях оракула. Подчеркнем, что математические аспекты диалогового программирования разработаны в настоящее время главным образом применительно к оракулам нулевого и особенно первого порядка (как точных, так и подверженных влиянию независимых от шага к шагу и центрированных помех). Оракулы в диалоге (или полилоге) — это инженеры, экономисты или эксперты, обладающие опытом и неформаль- ными содержательными знаниями в исследуемой проблеме и оснащенные необходимым оборудованием для моделиро- вания и экспериментирования. Другой участник диалога, в некотором смысле его организатор — это ЛПР, которому помогает математик. При наличии необходимого техниче- ского обеспечения (операционной системы для стандартных классов задач проектирования и управления) можно в тех ситуациях, где это целесообразно, исключить математика из непосредственного участия в диалоге. В таких ситуаци- ях диалоговое программирование обеспечивает рациональ- ное разделение обязанностей между специалистами, обла* ; дающими наибольшей информацией в обсуждаемом круге вопросов. Следует ожидать, что таким образом можно по- строить рациональные процедуры планирования эксперн- 132
мента, взаимодействия заказчика и исполнителя; врача и пациента. По-видимому, в этом же направлении будет со- вершенствоваться взаимодействие конструктора и ЭВМ—- диалоговое программирование в узком смысле слова. 6. В принципе применение диалогового программирова- ния возможно и целесообразно в процессах синтеза произ- вольных технических и других систем. Однако от принци- пиальной возможности до реального использования весьма большая дистанция. Главные трудности, которые здесь встречаются,— это проблемы, встающие перед специалиста- ми по содержательной стороне дела, проблемы, связанные с построением ответов на вопросы организаторов диалога. От инженера требуется умение достаточно точно и достовер- но решать задачи анализа. Время решения этих задач главным образом и определяет продолжительность диалога. Таким образом, главная задача, возникающая при приме- нении ДП, состоит в создании комплекса средств, помогаю- щих инженеру надежно и быстро решать задачи анализа. Таким комплексом средств лучше всего может служить система имитационного моделирования. f Еще одно условие применимости диалогового програм- мирования — единство интересов участников диалога. Ора- кул может ошибаться (разработаны процедуры 'ДП со сто- ’Хастическим оракулом), но не должен сознательно вводить организатора диалога (ЛПР) в заблуждение. Рассмотрим некоторые пути согласования интересов участников диа- лога. При этом одновременно сокращается" и размерность задачи. Для определенности здесь рассматриваются лишь томные детерминированные оракулы нулевого порядка. Один из возможных подходов к постановке и решению зада- чи Рв при несовпадении интересов участников решения зада- чй'-состоит в управлении оракулом Q (оракулами 0, в слу- чае полилога). Пусть выбор решения зависит от s лиц 0it а ЛПР — организатор Л полилога—имеет возможность воздейство- вать на участников Ь{ выбора решения, обещая предоста- вить 0( вектор ресурсов y{£Gvi<=.R.l. Задание векторов У1> ’ Уг (или, что то же самое, вектора у* — (уи .... ys) ^Gy = (Gyiх ... X G^) c Rs = (Rx, ..., Rs) обусловлива- ет .решение x=x(tf), принятое группой 0it Тем Самым вектор ys определяет числа gy (ys) = ft (x(ys)), j = = i,„.. m. . , . . • <: Цель организатора Л > полилога добиться . принятия 133
группой 0j> Os решения ж — оптимального плана зала- чи Pf. Вообще говоря, эта цель недостижима, поскольку Л не контролирует сами решения — управление х не находит- ся непосредственно в его руках. Самое большое, что может сделать Л, это решить задачу ~* min |gy(i/O <0, /=1, ^€б». На каждом шаге диалоговой процедуры решения этой , задачи организатор полилога Л сообщает i=l, .... s, вектор ресурсов y/gG^Q/^ G’c/?s), который может быть ему предоставлен для того, чтобы обеспечить реше- ние х. В ответ Л получает от оракулов информацию gfW)—h(x&)) о характеристиках решения x=x(ys), отвечающего вектору ресурсов у*. Эта процедура может повторяться. В любой момент Л может прекратить торг , и реализовать произвольное предложение на GycG* (от-. , личке G3' от G^ естественно—обещать можно больше, чем имеешь). Ясно, что работа оракула в задаче AMg} более трудо- емка, чем в исходной задаче А={/}- 6 задаче {/} оракулу указывается решение х и требуется установить его харак- теристики -v значения f/x), /=0, 1, т* и, возможно, их опорные функционалы в точке х. В задаче {g} от оракула требуется принять решение x=xfer) (построить план х или спроектировать схему х), обеспеченные обещанными ему ресурсами у, и установить характеристики f}(x(g))—g}(y) , (и, возможно, Vjg/у» этого решения. Однако для органи- затора Л полилога задача {g}, как правило, проще {/}: ее размерность обычно существенно ниже. Решая задачу {g} диалоговыми методами, приближаются в той мере, в ко- торой это допускается структурой и особенностями оракула, к решению «объективно существующей задачи {/}». Возможны и другие подходы к управлению оракулом. Пусть, например, организатору диалога известна «цена ресурсов» — функция /i(ys)> заданная или допускающая .. диалоговое наблюдение. Тогда управление оракулом сво- дится к итеративному решению задачи /=1> •••> 7. Во многих ситуациях конкурентный механизм вы- нуждает исполнителей согласовывать свои интересы с ин- тересами заказчика. 134
Пусть имеется s потенциальных подрядчиков, способных разрабатывать заданную систему. Заказчик (в. данном слу- чае организатор Л полилога) располагает суммой Y и стремится извлечь от реализация заказа максимальную при- быль. Обозначим через yt сумму, которую заказчик на оче- редном шаге полилога предлагает i-му подрядчику. Испол- нители в ответ сообщают векторы характеристик х,(у,), i=l, ..., s заказываемой системы, которые каждый из них способен обеспечить за предложенную плату. Организа- тор Л полилога (или специальный эксперт) по полученным от оракулов (подрядчиков) векторам xt(yt) технических ха- рактеристик системы оценивает доход ф<(хг(/л))==<р<(^), на который можно рассчитывать, если выполнение заказа будет поручено i-му исполнителю. Вид функции <р;(хг(г/г)) может быть заранее неизвестен, однако ее значения для заданных значений аргументов могут быть получены экспертным путем. Прибыль, на которую может рассчитывать заказчик при данном варианте предложения y=(yi, .... ys), равна g(y)— max {<p; (у;.)—у(}. Задача заказчика—выбрать испол- кителей и объем ассигнований» обеспечивающий ему мак- симальную прибыль. Решение этой задачи сводится к па- раллельному решению s одномерных задач Ф/ <!/()—Hi max IО < St < У ‘ ’ и 'к сравнению оптимальных значений целевых функцио- налов. Диалоговая процедура решения одномерных'задач с оракулами нулевого порядка не представляется трудо- емкой. 8. Рассмотрим роль диалогового программирования в корректировке моделей реальных задач. Пусть начальная модель синтезируемой системы пред- ставляет собой задачу Рв. Может оказаться, что некоторые ограничения исходной содержательной (выпуклой) задачи Р «по забывчивости» или из-за недостатка на начальном этапе информации об условиях функционирования системы не включены в Ро (для простоты будем считать, что /0 ап- риори известна). Предположим, что на каждом шаге диалога оракулу может быть предъявлена система х, по поводу которой он (оракул) либо сообщает, что она удовлетворяет ограниче- ниям Р, либо «вспоминает» (и сообщает организатору диа- лога) новое ограничение задачи Р, исключщощее реаяиза- 135
цию системы х. Таким образом, после к шагов диалога зада- ч ча Р8 уточняется. В новой задаче Рк число ограничений больше, чем в Р*. Представляются целесообразными две стратегии орга- низатора диалога. . (1), Стратегия оптимиста — указывать оракулу на «+1-м шаге в качестве очередной’ системы xk+t, подле- жащей анализу, решение задачи Рк (организатор диалога Располагает полной информацией 6 задаче Р*). Оптимист • верит, что на данный момент оракул ему уже сообщил все о ?. Стратегия оптимиста хороша, если задача Р не очень сложна, т. е. если-оракул «забыл» не очень много ограниче- ний. Вместе с тем стратегия оптимиста не гарантирует приближения х к решению задачи Р. (2). Стратегия пессимиста — указывать оракулу на *4-1-м шаге в качестве очередной системы х*+1 центр тя- жести (читатель, разобравшийся в механизме МЦТ, поймет . Смысл выбора центра тяжести области в качестве xft+l) об- -• Ласти ... где DP*— множество допустимых планов задачи Р*, а а* — ваилучшее достигнутое к /с-му шагу значение целевого Функционала Д>. . Пессимист не желает принимать никаких допущений — о том, насколько полно оракул- на данном шаге освоил за- дачу?: Он основывает свои решения только на твердо уста- * вовлённых фактах. Стратегия пессимиста гарантирует до- стижение решения задачи Р заданной точности за фикси- ” рованнЪё время, но не снижает этого времени даже тогда, когда Р=Р« (и в тех случаях, когда можно с самого начала точно решить задачу Р, если пользоваться стратегией оп- тимиста). По-видимому, рационально синтезировать обе страте- гии, например, на четных шагах диалога быть оптимистом, а на нечетных — пессимистом. Время, необходимое для построения решения задачи Р требуемой точности, не пре- вышает удвоенного минимума таких времен для «чистых» . стратегий. Таким образом, синтез стратегий наследует по- ложительные стороны обоих подходов. Однако склонность к -компромиссу удваивает трудоемкость процедуры. ’ 136'
Представляется, что применения диалогового програм- мирования будут стимулировать развитие теории информа- ционной сложности. СЛОЖНОСТЬ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ИНФОРМАЦИИ Характеристики сложности статистических систем 1. Для изучения закономерностей механизма, опреде- ляющего состояние и поведение многих систем в экономике, социальных науках, биологии и технике, исследователь располагает часто лишь результатами- наблюдений за реа- лизациями- состояний их элементов. Поведение таких си- стем носйт сильно стохастический характер и в деталях слабо предсказуемо. Тем не менее агрегированные харак- теристики многих явлений и процессов, опйсываёмЫх в тер- минах этих систем, оказываются в условиях неизменной или слабо меняющейся среда статистически устойчивыми. Статистическая устойчивость агрегированных характери- стик сложных явлений и процессов — основа для прогно- зов,. -без которых невозможно планирование, управление и проектирование? Один из возможных и достаточно эффективных подхо- дов к анализу систем, заданных статистическими материа- лами наблюдений невозможно, некоторой дополнительной априорной информацией,, состоит в моделировании их мно- гомерными случайными величинами или процессами. Каж- дой такой системе приводится в соответствие некоторый случайный вектор, составляющие которого описывают поведение элементов системы или некоторые ее характери- стики. Накопленные результаты статистических наблюде- ний за элементами и/или характеристиками изучаемой системы рассматриваются как реализации случайных зна- чений- компонент модели и являются исходным материалом для-описания системы и установления закономерностей ее доведения и развития. : Будем называть системы, для. которых многомерная случайная величина. (или многомерный случайный про- цесс) является подходящей моделью поведения, статисти- ческими системами. Изучение взаимосвязей между еостав- ляющими, случайного вектора, анализ различных, его ета- 137
тистических характеристик позволяют установить законо- мерности состояния и функционирования моделируемой им статистической системы. Это трудоемкий, цо необходимый этап в задачах принятия аргументированных решений. Таким образом, идентификация многих систем по резуль- татам наблюдения за их функционированием часто формаль- но сводится к изучению статистических закономерностей случайного вектора — модели исследуемой системы, ком- понентами которого являются значения признаков, опреде- ляющих систему. Более того, задачи анализа состояния и поведения статистической системы, так же, как и задачи синтеза (в частности, совершенствования и оптимизации) системы, зачастую требуют знания совместной функции распределения вероятностей набора взаимосвязанных слу- чайных величин — наблюдаемых признаков системы или по крайней мере некоторых их статистических характери- стик. В задачах количественного анализа вычисляются, усредненные значения показателей качества системы и функций, определяющих ограничения ее состояний и по- ведения. Усреднение этих показателей, вычисление их рассеивания, определение непосредственных связей между ними производятся в соответствии с совместной функцией распределения вероятностей компонент случайного векто- ра, индуцированного изучаемой статистической системой. Для установления причинно-следственных связей между элементами сложной системы использование многомерных функций распределения вероятностей компонент случай- ного вектора — модели статистической системы —- безуслов- но, предпочтительней оперирования исходной статистиче- ской информацией. Для постановки и решения задач син- теза системы — совершенствования ее структуры или характера функционирования — во многих случаях также необходимо знание совместной функции распределения вероятностей компонент ее модели. Достаточно адекват- ные постановки задач синтеза сложных систем представля- ют собой модели стохастического программирования или стохастического оптимального управления, в которых опти- мизируется усредненное (в том или ином заранее определен- ном смысле) значение показателя качества системы при со- блюдении (всегда, почти всегда, с некоторой заданной ве- роятностью или опять-таки в среднем) некоторых заранее предписанных ограничений на возможные состояния систе- мы или поведение ее элементов. Усреднение целевого функ- ционала и, если нужно, области его определения, уставов* 138
.пение вероятностных ограничений задачи также произво- дится в соответствии с совместной функцией распределения вероятностей компонент многомерной случайной . вели- чины, индуцированной изучаемой статистической системой. Заметим, что в реальных задачах, с которыми обычно сталкивается исследователь, исходная статистическая ин- формация, как правило, ограничена. Накопленных данных явно недостаточно для того, чтобы без дополнительных зна- ний или допущений о системе сколь-нибудь надежно вос- становить функцию распределения ее компонент. Мы пришли к выводу, что самые разнообразные задачи изучения и совершенствования статистических систем, ин- формация о функционировании которых накапливается в результате наблюдения за их состояниями и поведением, сводятся к построению и исследованию совместной функции распределения вероятностей компонент многомерной слу- чайной величины, моделирующей набор взаимосвязанных характеристик по ограниченной статистической информа- ции. Различные социально-экономические, технические, биологические и т. п. задачи анализа и синтеза представ- ляю'г собой характерные задачи изучения и совершенство- вания систем, закономерности функционирования которых познаются в процессе их статистического исследования. Приведенные соображения свидетельствуют о важности задачи восстановления совместной функции распределения вероятностей компонент случайного вектора, индуцирован- ного изучаемой статистической системой по информацион- ным массивам результатов наблюдений за реализациями ее признаков. 2. В дальнейшем под «анализом статистической системы» мы будем понимать обработку результатов наблюдений за состоянием и поведением системы. Без этого этапа не об- ходится ни одна проблема принятия решений. Задачей ана- лиза статистической системы является приближенное по- строение по наблюдениям за ее поведением совместной функции распределения случайного вектора», моделирую- щего систему. Важно также выявить частные статистиче- ские характеристики исходной информации, в терминах которых могут быть эффективно сформулированы, количе- ственно оценены и, что не менее существенно, качественно истолкованы взаимосвязи компонент исследуемой системы. По-видимому, именно поэтому в последнее время значитель- ная часть работ по математическому обеспечению статисти- ческбй обработки информации и идентификации стохасти- 139
ческих явлений и процессов посвящена разработке стати- стических характеристик связей, непосредственных свя- зей, существенных связей, силы связи и т. д. Возникает естественный вопрос: какова трудоемкость анализа современных статистических систем — систем до- статочно большой размерности — при тех или иных тре-. бованиях к точности и достоверности вычисления их харак- . теристик? Другими словами, какое число наблюдений за реализациями состояний элементов системы следует про- вести, чтобы гарантировать требуемую точность и надеж- ность вычисления статистических характеристик системы? Мы пришли к необходимости оценки сложности статисти- ческой обработки результатов наблюдений. Так же, как и сложность вычислений, сложность стати- стической обработки информации не .может быть оценена . единственным показателем. Мы вынуждены ввести ряд ха- • рактеристик сложности. Трудоемкость статистической об- ' работки .результатов наблюдений характеризует сложность ..оценивания статистических систем, или,, что то же самое, .сложность описания, системы. Мы увидим, что здесь нельзя обойтись одним числом. Сложность оценивания статиста-, •ческой системы зависит от выбора «метода описания систе- мы* и от'того, как понимать невязку — «расстояние» между истинной функцией распределения, и ее аппроксимацией. Ито .касается первого фактора —- зависимости сложности ..оценивания от «метода описания системы»,— то от его учета ‘ можно будет отказаться. Мы приведем, некоторые сообра- .жения. свидетельствующие о том, что .при естественных ме- тодах описания системы сложность оценивания .существенно . не зависит от них. Однако выбор «нормы», по которой оце- нивается, погрешность в аппроксимации функции распре- деления по результатам наблюдений, радикально влияет на число реализаций, обеспечивающее требуемую точность И надежность оценивания. Поэтому приходится иметь дело • С целым спектром характеристик сложности оценивания. В зависимости от содержательных особенностей и на- ' значения конкретных статистических систем то или иное определение нормы погрешности аппроксимации оказы-’ вается более подходящим.. Мы увидим, да это и достаточно очевидно, что для получения сколь-нибудь точного и на- дежного описания произвольной системы немалой размер- ности необходимо иметь огромное количество реализаций моделирующего ее случайного вектора — гораздо больше, .чем-то может быть обеспечено при любых предвидимых воз- ..НО
можностях накопления информации. Стало быть, восста- новление функции распределения, отвечающей произволь- ной статистической системе немалой размерности, по ре- зультатам наблюдений за ней—нереальная задача. Это зна- чит, что изучение статистических систем не очень малой размерности невозможно, да и не нужно проводить на одном лишь доступном количественному измерению статистиче- ском материале. Исследование закономерностей механиз- мов, определяющих их состояние, требует привлечения до- полнительных априорных соображений об особенностях функционирования систем изучаемого класса. Множество допустимых функций распределения должно быть сужено. Чем больше, однако, принимается априорных качественных предположений, тем выше, естественно, риск появления субъективных оценок и рекомендаций. В дальнейшем мы введем некоторые ограничения на классы изучаемых статистических систем. В содержатель- ных терминах выделенные статистические системы могут быть представлены композицией подсистем значительно меньшей размерности так, что все (или почти все) существен- ные связи между элементами системы оказываются внут- ренними связями подсистем. Будем называть такие стати- стические системы блочными. Представляется, что гипоте- зе блочности удовлетворяют многие статистические системы большой размерности в экономике и обществе, в биологии и в медицине, в различных отраслях техники. Аппрокси- мация статистической системы блочной системой радикаль- но снижает требования к объему эмпирического материала, необходимого для построения ее модели с заданной точ- ностью и требуемой надежностью. Принятая гипотеза ин- туитивно приемлема для широкого класса реальных систем. Естественный характер гипотезы оправдывается также следующими соображениями. Закономерности состояний и поведения многих реаль- ных статистических систем большой размерности установ- лены на весьма ограниченном эмпирическом материале, явно недостаточном (с формально-статистической точки зрения) для сколь-нибудь серьезных выводов. Тем не менее последующее практическое использование выявленных та- ким образом закономерностей подтвердило их справедли- вость. Между тем во многих случаях никакой дополнитель- ной априорной информации о механизме действия системы использовано не было. Статистические закономерности были установлены только по результатам наблюдений. Правдо- Ml
подобное объяснение наблюдаемого феномена заключается в том, что изучаемые статистические системы являлись или по крайней мере хорошо аппроксимировались блочными системами. Дальше будут формализованы классы статистических систем, удовлетворяющих дополнительным ограничениям. Степень удовлетворения гипотезе блочности будет охарак- теризована некотЬрыми параметрами — существенной раз- мерностью и дефектом информативности системы. Введен- ные параметры определяют естественную характеристику невязки между, истинной функцией распределения и ее аппроксимацией, построенной по результатам наблюдений за статистической системой. Это так называемая мера ин- формационного расхождения Хинчина — Кульбака — Лейбера. Сложность оценивания, в которой роль нормы — «расстояния» между сравниваемыми функциями распреде- ления — играет информационное расхождение, будем называть информативной сложностью статистических си- стем. Представляется, что для реальных статистических, систем это достаточно объективная характеристика трудо- емкости статистической обработки информации. Приведем в заключение несколько примеров статисти- ческих систем. В социально-экономических исследованиях часто встречается система «демография — трудовые ресур- сы». Элементами этой системы являются показатели демо- графической ситуации и параметры распределения трудо- вых ресурсов по отраслям народного хозяйства. Реализа- циями случайной величины, моделирующей систему, яв- ляются данные переписей населения, социологических обследований или статистических учетов в различных ре- гионах страны в разные годы. - Основным объектом медицины являются статистические системы типа «человек — болезнь — метод лечения». Эле- ментами таких систем являются характеристики пациента - и параметры, определяющие его состояние здоровья, этапы лечения и течение болезни. Информация о состоянии систе- мы накапливается в результате обследований больных и анализа историй болезни.- Анализ каждой из этих систем на достаточно большом статистическом материале дает основание считать, что их структуры в первом приближении удовлетворяют гипотезе блочности. 142
Сложность оценивания 1. Как уже отмечалось, отсутствие априорных гипотез, основанных на предварительном качественном анализе, практически исключает возможность установления законо- мерностей функционирования статистической системы (не- малой размерности) на основе данных статистического об- следования. Объем наблюдений, необходимый для сколь- нибудь надежной аппроксимации совместного распределе- ния вероятностей компонент случайного вектора — модели системы, астрономически быстро растет с ростом размер- ности системы. Действительно, пусть размерность системы равна п, а количество градаций (число возможных значений) каждого признака — т. Тогда сетка аргументов, в которых требуется вычислить значения совместной функции распре- деления вероятностей компонент модели системы, содер- жит тп узлов. Чтобы по результатам эксперимента или наблюдений за реальной системой получить статистически достоверную информацию о значениях функции распределе- ния вероятностей взаимосвязанных признаков, определяю- щих систему, и тем самым идентифицировать изучаемую систему, необходимо в каждом узле сетки аргументов полу- чить по крайней мере несколько измерений. Это значит, что для построения совместной функции распределения вероятностей компонент соответствующего случайного век- тора, индуцируемого данной системой, нужно располагать числом измерений порядка О(лг"). При лг=5 и п=20 или при /п=2 и п=50 практически невозможно реализовать тп измерений в приемлемые сроки при любом уровне раз- вития техники измерения. Следует при этом учесть, что значения т и п в реальных задачах планирования и управ- ления социально-экономическим развитием, проектирова- ния технических систем и т. п. могут значительно превос- ходить указанные величины. Априорные гипотезы, выделяющие класс статистических систем, могут отражать как содержательные, качествен- ные свойства систем, входящих в этот класс, так и формаль- ные особенности индуцируемых ими многомерных случай- ных величин. Так, например, класс статистических систем может определяться структурой графа связей между эле- ментами систем класса или какими-нибудь другими харак- теристиками взаимодействия элементов системы. В формаль- ных терминах класс статистических систем можно задать функциональным видом совместных распределений вероят- 143'
ностей компонент случайных векторов, моделирующих системы класса, заданным с точностью до численных зна- . чений параметров распределений. Например, можно рас- сматривать класс статистических систем, моделируемых нормально распределенными многомерными случайными величинами. 2. В реальных задачах исследования статистических систем наиболее трудоемким и дорогостоящим этапом яв- ляется сбор статистической информации. Поэтому жела- тельно заранее представлять себе необходимый объем ста- тистической информации для идентификации системы. В связи с этим одной из важных задач теории статистических систем является оценка сложности их описания. Естественно под сложностью оценивания (описания) . NA(n, е, а) класса n-мерных статистических систем понимать минимальное число независимых, одинаково распределен- ных (в соответствии'с истинным распределением вероятно- стей) реализаций моделирующей систему n-мерной случай- ной величины, необходимое для того, чтобы с заданной на- дежностью а восстановить совместную функцию распреде- ления вероятностей компонент модели любой статистиче- ской системы из класса А с погрешностью, не превосходя- щей заданную© величину е. - Для формального определения сложности оценивания класса статистических систем А целесообразно вначале ввести понятие «метод В описания многомерной случайной . величины». Дело в том, что сложность оценивания зависит от того, как используются результаты наблюдений за ис- следуемой статйстйческой системой для формирования со- ; вместного распределения вероятностей компонент ее моде- ли. Естественно связывать сложность оценивания с самым экономным методом описания. Определим, следуя 151], метод В описания многомерной . случайной величины £ £ А по N независимым одинаково распределенным (в соответствии с истинным распределением вероятностей р(х) случайного вектора ?) наблюдениям ...,xN), как любое отображение В: XN-*-A, где X — пространство элементарных событий (множество, на кото- ром определены функции распределения вероятностей р(х) случайных величин %£A,XN— X х ... X X. Выражение /V раз «метод В построения функции распределения вероятностей (описания статистической системы) имеет || • ||-погрешность в 144
при надежности а на. классе случайных векторов (статисти- ческих систем) Л» означает, что - Другими словами, метод В имеет || -||-погрешность, не пре- восходящую е с надежностью а, если вероятность того, что в результате работы метода В с выборкой размера N полу- чится распределение вероятностей, отличающееся от истин- ного по мере || • || не более чем на е, не меньше а. Метод В, имеющий на классе случайных векторов А при N наблюдет ниях || • ||-погрешность не более е при надежности не менее а, будем обозначать через By(||-II, &, а). 3. Теперь мы можем дать строгое формальное определе- ние сложности оценивания класса А многомерных случай- ных величин (класса статистических систем, моделируемых этими случайными векторами). Будем различать сложность оценивания, отвечающую заданному методу В описания класса А статистических систем, и сложность оценивания, определяемую только классом рассматриваемых систем. Под сложностью оценивания (описания) Na (В, || |j, 8, а) с заданными Ц*||-погрешностыо в и надежностью а, от- вечающей фиксированному методу В описания статисти- ческих систем класса А, будем понимать минимальное число N независимых, одинаково распределенных (в соот- ветствии с истинной функцией распределения вероятнос- тей) наблюдений, гарантирующих восстановление по методу B^pB(x\xN) совместной функции распределения вероят- ностей р (х) компонент случайного вектора В € Л, прини- мающего значения х£Х с Ц • Ц-погрешностью не более в и надежностью не менее а, т. е. ^ = (В,||.[|, в, а) = = min{W|P[||pB(x|xAr)—р(х)||<8]>а, = = min{Af 16 = 6^(11-11, 8, a)). Сложность оценивания (описания) ЛГл(|| -||, 8 a,) класса А n-мёрных статистических систем (сложность идентификации совместного распределения вероятностей «-мерной случай- ной величины ££Л) при || • ||-погрешности 8 и надежности а) определим как минимальное число N независимых, оди- наково распределенных (в соответствии с истинной функци- ей распределения вероятностей)" реализаций наблюдений за исследуемой статистической системой, при котрррм еще существует метод описания B—pB(x\xN), позволяющий с 145
L I! • ||-погрешностью, не превышающей 8, и надежностью не менее а восстановить истинное распределение вероятно- стей р(х) для любого случайного вектора т. е. ЛГл(14 а) = тт{^|ЭВ:В = ^(Ц.||, е, а)~ «пнпЛГд(В, |-|, 8, а), в Сложность оценивания класса статистических систем (случайных векторов, моделирующих системы класса) зависит не только от числа элементов системы (ее размер- ности), но и от количества возможных состояний этих эле- ментов (количества градаций компонент случайного век- тора, индуцированного системой}. Чтобы не увеличивать число параметров, определяющих сложность оценивания класса А статистических систем, целесообразно устанав- ливать зависимость сложности оценивания NA от числа Л4=|Х| различных векторов х£Х возможных значений, / п принимаемых случайной величиной % € A iМ — П /и,-, где k i=1 mi — количество градаций i-й компоненты случайного век- тора ?). 4. Будем рассматривать класс А статистических систем, моделями квторых служат дискретные многомерные слу- чайные величины | с совместным распределением вероятно- стей р(х), определенным на конечном множестве X из М элементов. Заметим, что множество всевозможных распре- делений вероятностей, определенных на X, представляет собой симплекс в RM. Поскольку сложность описания ЛГд(Ц-||, «, «) класса А статистических систем зависит от выбора меры близости между распределениями, то представляет интерес вопрос о том, как она изменяется с изменением нормы на Пусть ||-1| и ||- II' две нормы на RM. Положим, по определе- нию 0 = max JM-. Тогда справедливо следующее неравен- ujjMHI ство [511: 1 г м 11= 2J8/I' Для лебеговых метрик (частным слу- чаем которых при р-=2 является обычная эвклидова мет- 146
рика) можно явно определить значение р,- о Нй р = max -jtJL = Ой/. М « ip , р > q, Л Установленное неравенство позволяет проводить оценку сложности описания статистических систем в какой-либо одной фиксированной метрике, например в метрике Ц|||„= = max | В,-1. Для любой другой метрики оценку можно по- 1<£<п лучить из соотношения ЛМ4 8, а)<Ул(В-Ь|,а), при этом если || • || = ||- ||р, то $=М'/р. 5. Для того чтобы получить оценку сверху сложности идентификации распределений вероятностей случайных век- торов, моделирующих статистические системы класса А, достаточно определить сложность идентификации систем класса по какому-нибудь конкретному методу описания В статистических систем. Наиболее распространенным методом описания статисти- ческих систем является метод аппроксимации распределе- ния вероятностей компонент модели системы частостью В = рв (х | xN) '= , где Nx — число наблюдений, при кото- рых значения компонент случайной величины | (соответст- венно значения элементов системы, моделируемой |) опре- деляются вектором х£Х. Будем называть этот метод описания статистических систем методом частот. Другой метод (точнее, класс методов) описания стати- стических систем состоит в следующем. Наблюдения, отве- чающие одним и тем же условиям, разбиваются по какому- то принципу на группы. В каждой группе оценки опреде-. ляются методом частот. В качестве оценки вероятностей р(х) значения случайной величины в точке х принимается медиана оценок по группам наблюдений. Методы этого класса будем называть методами медианы.' В [51] получены приближенные выражения для сложно- сти оценивания статистических систем, отвечающие разным методам описания систем и разным мерам невязки между истинным распределением и восстановленным по резуль- татам наблюдений. Имеют место следующие утверждения. 147
(1). Сложность оценивания но методу частот, обеспечи- вающая || • || „-погрешность *не более е с надежностью не "менее а, определяется величиной max {р (х) (1 — р (х))}in у-^ и при любых р(х) не превышает «<”)—_Lin — . " 2es,nl — а‘ Отсюда для класса статистических систем Ло = {р (х) | р (х) (1 — р (х))< о2} имеем 2o« , 1 < По сложности оценивания в метрике HI- получаем в соответствии с приведенными выше неравенствами верх- ние оценки сложности оценивания по методу частот для любой лебеговой метрики ||-||р. Имеем N'p> < max {р (х) (1 — р (х))} In In y-J— • (2). Сложность оценивания по методам медианы, обеспе- чивающая ||- II „-погрешность не более е с надежностью не менее а, определяется величиной | max ip (х) (1 -р (х))} C^ln^. Для сложности оценивания в метрике II • II р .по методам медианы справедливы следующие неравенства: max {р (х) (1 — р (х))} In < еМ*1р 1 2(1 —а)* NW < 4 oW’/Hn ттгЦ-г • .Ад —- ea.. -2(1—Ct) >48
- Полученные оценки могут быть использованы, напри- мер, для вычисления количества наблюдений, позволяю- щих проверить с И-Ир-погрешностыо не более ё и надеж- ностью не менее а гипотезу о том, что распределение изу- чаемой случайной величины имеет заданный вид. В частно- сти, для проверки гипотезы о равномерном распределении случайной величины х при оценке невязки между истин- ным и эмпирическим распределениями в эвклидовой мет- рике (р=2) достаточно ограничиться-числом наблюдений, не превышающим у<2> 0 ( J —1П in д 1 . « In -. 1 . es (Al \ Af/J 2(1—а) е* 2(1— а) Сравнивая установленные верхние грани для сложности оценивания при разных методах описания статистических систем, видим, что они величины одного порядка. Это дает основание предполагать, что сложность оценивания будет слабо зависеть от метода описаний статистической системы и будет указанным образом зависеть от М, е и а. ' . Информативная сложность 1. Определение сложности оценивания, связанное с нор- мой отклонения приближенного распределения от истинно- го, слабо приспособлено к учету априорной информации о структуре связей, в изучаемом классе систем.. Гораздо естественней и проще, учитывать часто встречающиеся осо- бенности классов статистических систем,, если . вместо II • Ц-погрешности рассматривать так называемую невязку Хинчина — Кульбака — Лейбера — меру информацион- ного расхождения истинного и приближенного распределе- ний [26]. Принтом удается конструктивно учитывать на- иболее естественную априорную информацию об изучае- мых классах статистических систем — возможность при- ближённого представления совместного распределения ве- роятностей многомерной случайной величины — модели системы — в виде композиции частных распределений не- большой размерности. Это информация о существенных связях системы. Информационное расхождение как мера невязки распределений приспособлено к описанию и оценке трудоёмкости анализа статистических систем, которые могут быть аппроксимированы''блочными системами. 149
Известно, что два распределения вероятностен с нуле- вым информационным расхождением совпадают с точностью до множества меры нуль, т. е. в случае дискретных распре- делений (которые мы только и рассматривали здесь) просто совпадают. Это еще один аргумент в пользу выбора невязки по Хинчину — Кульбаку — Лейберу в качестве меры бли- зости истинного и приближенного распределений. Напомним, что для дискретных распределений инфор- мационное расхождение распределений вероятностей р и. р, определенных на множестве X, вычисляется по формуле 7(р:р) = S р(х)\п-^~. хех р(х) В задачах, в которых следует стремиться к минимальным потерям информации об изучаемой системе, получаемой по результатам наблюдений, информационное расхождение является, по-видимому, наиболее целесообразной оценкой качества аппроксимации статистической системы. Назовем информативной сложностью класса А статисти- ческих систем (или соответственно класса А случайных ве- личин) минимальное число К независимых одинаково рас- пределенных (в соответствии с истинной функцией распре- деления) наблюдений х1г хг, . . ., хк, при которых еще су- ществует метод В(е, а), позволяющий по ним построить приближенное распределение вероятностей p(x|xt....... х^—р^х^), аппроксимирующее истинное распределение р(х) с информационной невязкой, не превышающей е, и с надежностью не менее а. Формально КА = min {К | ЭВ (в, а):Р [7 (р (х) :р (х | х*)) < в] >а}. Здесь xK—(Xi, . . ., Хк) — независимые, одинаково рас- пределенные по р(х) наблюдения, a P(S)— вероятность события S. Таким образом, информативная сложность классов ста- тистических систем — это их сложность оценивания, в ко- торой || • ||-погрешность аппроксимации заменена информа- ционным расхождением 7 (р : р). ♦ Пусть по-прежнему X—конечное множество из М эле- ментов, А — семейство распределений вероятностей на X. Предполагается, что для всех р£А выполняется р(х)>0 VxgX. Будем интерпретировать М как число различных 150 I -
наборов значений n-мерной -случайной величины, понента которой принимает одно из /п< значений. Таким п образом, М=* П пг£. 1=1 В [52] построена оценка сверху для информативной слож- ности произвольного класса А статистических систем. _ 1 Имеет место утверждение, при не слишком малых а (1— <а<1) и 8>0 справедлива следующая оценка информатив- ной сложности класса статистических систем! „ , . .2Л1. 1 где v — положительный корень уравнения v8 = 2e(l—v). Для оценки сверху информативной сложности Кд_ использовано значение К для метода частот. Оценки такого же порядка получены и при некоторых других естественных методах описания статистических систем. Это дает основа- ние полагать, что оценку информативной сложности вряд ли можно существенно улучшить. Обратим здесь внимание читателя на то, что при малых / 8 верхняя оценка информативной сложности растет с уве- личением требуемой точности гораздо медленнее, чем верхняя оценка сложности описания статистической систе- мы: к=о(|-), лг=о(±). 2. До сих пор мы не принимали никаких допущений о свойствах изучаемых статистических систем. Величина п М П mit входящая множителем в оценку информативной <=1 сложности, для реальных статистических систем — астро- номическая величина. Эго значит, что при отсутствии апри- орной информации о классе изучаемых систем нельзя ожи- дать сколь-нибудь качественного построения соответствую- щих им распределений при любом обозримом наборе на- „ блюдений за реализациями состояний элементов системы. В начале главы была высказана гипотеза о блочной струк- туре многих реальных систем. Информативная сложность таких систем существенно ниже. Функции распределения, 151
отвечающие блочным системам достаточно высокой размер- ности, могут быть практически восстановлены по результат, там измерений. ...... Приведем формальное определение блочных систем и оценим информативную сложность таких систем в завиеи-. мости от характеризующих их параметров — существенной размерности и дефекта информативности. Будем называть л-мерную статистическую систему сис- темой Л-существенной размерности, если совместная функ- ция распределения модели системы.может быть представлена ; в виде композиции ее частных распределений размерности . не выше k. Точнее, n-мерная статистическая система явля- ется системой ^-существенной размерности, если существует перестановка a—{ai JjL, индексов {1,2, . . ., п} ее элемен- ' тов и наборы A(ct/) индексов, удовлетворяющие условию Д(аО/={ах,аа,..., аг_1} и содержащие не более чем по£— 1.. индексов (|А(аг)|^А—1), таких, что совместное распреде- ление p\Xf, . . ., х„) случайных величин, моделирующих элементы системы, может быть представлено в виде произ- ведения . ' Р (х).= П р (xai I Хд(а.)} = Р (Ха., . • • , XaJ П р (%а;| Таким образом, существенная размерность статистиче- ской системы — число k определяется по формуле , Л= min max J A (ar)|4-1. .... ... где {oti)"=i — перестановка индексов {1,2,. . ., п}; A (a j —: набор* индексов Из {at, . . ., atiU; |A(af)| ^ число инден-* сов* в А(аг). ........... Каждая статистическая система характеризуется Двумя1' размерностями: одной явной, равной числу п элементов системы, и другой скрытой — существенной, определяемой наиболее экономным блочным представлением системы. ; Будем-обозначать множество всех распределений веро- ятностей n-мерных случайных векторов, определенных наХ, черезР. Подмножество распределений, представимых в виде композиций частных распределений, размерности не выше fe, обозначим через Распределения из Рк. моделируют статистические системы: A-существенной размерности. Ста- тистические . системы, отвечающие-: распределениям из Р»» будем называть ^-блочными. 152:
Понятие fc-блочных систем дает основание для классифи- кации статистических систем и выделения классов систем, поддающихся статистическому анализу при обозримом объ- еме наблюдений за состояниями ее элементов. Качество аппроксимации реальной системы ^-блочной системой есте- ственно определять посредством информативной невязки 1(р\рк) между соответствующими распределениями ве- роятностей. В (49] приведена схема построения (по результатам на- блюдений) наилучшей информативной аппроксимации за- данной n-мерной статистической системы системой А-су- щеСтвенной размерности. Схема Вычислений сводится к ре- шению специальной задачи линейного целочисленного про- граммирования. Для k—2 имеется эффективный метод ре- шения этой задачи. При k>2 задача оказывается JVP-пол- ной. Однако в 1501 для нее построен достаточно простой асимптотически оптимальный метод решения. Обозначим Цр'Рк) = тл\п Цр-.р). Статистическая система, моделируемая n-мерным сов- местным распределением вероятностей р(х), является сис- темой ^-существенной размерности в-том и только в том слу- чае, если I (р : Рк)~0. :, Статистические системы размерности п, для которых ми- нимальная информационная невязка между ее моделью — распределением р и распределением ~р<с'Рк не превосходит некоторого, числа рА, т. е. J (р : Р*)^Р>, будем называть системами A-существенной размерности с дефектом йнфор-. мативности ₽S) или, короче, системами с дефектом инфор- мативности р*. При фиксированном дефекте информативности р су- щественная размерность характеризующая статистиче- скую систему, определяется по формуле Естественно, что конструктивные методы анализа можно ожидать лишь для тех статистических систем, у которых fep<^n, т. е. для систем малой существенной размерности. З.' Приведем оценку информативной сложности систем ^-существенной размерности и систем, аппроксимируемых ими. • - - 153 »
Пусть Р — множество всех n-мерных распределений - вероятностей, определенных на X—(xt, . . хм), Pk<zP подмножество распределений из Р, которые могут быть пред.. ставлены композицией распределений размерности не выше k, т. е. класс распределений ^-существенной размерности; Ред — класс распределений ^-существенной размерности с дефектом информативности 0. Р^ = {р € РI / (Р‘Рь) ^0). Pftp — это класс систем, которые могут быть с малым ин- формационным расхождением 0 аппроксимированы ста- тистическими системами из Рк. Ясно, что Рк—Рко- Введем величину Мк А4Л = тах/ П ие{а) . I Здесь {а)с{1, .... п}\ |{а}| — число элементов в {а}; mi — число градаций i-й составляющей случайного век- тора, моделирующего статистическую систему. В [52] построена оценка сверху для информативной сложности класса статистических систем ^-существен- ной размерности с дефектом информативности 0. Имеет место утверждение. При не слишком малых а (1—е~в^а^1) и 8>0^О справедлива следующая оценка: где v* — положительный корень уравнения Vfe е—0 2(1—v*) п—Л-(-1 * Таким образом, дополнительная информация о том, что n-мерная статистическая система может быть аппроксими- рована с дефектом информативности 0 системой й-суще- ственной размерности, позволяет при k<^n радикально со- кратить объем эмпирического материала, необходимого для построения модели системы (совместного распределения ве- роятностей состояний ее элементов) с заданной точностью (информативной невязкой) и требуемой надежностью. На- пример, для построения совместного распределения веро- ятностей составляющих 100-мерного дихотомического слу- чайного вектора (т. е. 100-мерного случайного вектора,, каждая компонента которого может принимать лишь два 154
значения) с информативной невязкой е=0,25 и надежностью а=0,9 требуется порядка 1031 наблюдений за системой, мо- делируемой этим вектором; Ясно, что такое количество реа- лизаций многомерной случайной величины получить прак- тически невозможно. В то же время, если имеется дополни- тельная информация, позволяющая отнести систему к клас- су Ред, например, с k=3 и 0=0,05, то при тех же е и а для построения информативной аппроксимации распределения 100-мерного дихотомического вектора требуется наблюдать • менее 10* его реализаций, а при Л=10 и 0=0,05 — не более 10* реализаций. Интуитивно представляется правдоподобным, что мно- гие реальные системы высокой размерности приближаются при небольшом дефекте информативности системами с ма- лой существенной размерностью. Выводы Сложность обработки результатов наблюдений очень быстро растет с ростом размерности соответствующей ста- тистической системы. Каждая статистическая система ха- рактеризуется двумя размерностями. Первая задается явно. Это характеристика класса систем — число переменных в модели системы. Вторая — скрытая. Она зависит от структуры конкретной системы и определяется так называе- мой существенной размерностью системы. Статистическая система, точнее, ее модель —- совместное распределение вероятностей р (х) состояний ее элементов — может быть описана многими различными^ способами: р(х)= И р(хв/|хД(вр), где {а, }?_i — некоторая перестановка набора {1, 2, . .л} индексов элементов системы, а Д(аг)с{а1, . . ., Среди этих записей имеется одна (иногда несколько), ко- торая определяет существенную размерность системы. Она соответствует перестановке, на которой достигается min max|A(a/)|. Эта перестановка определяет пред- ставление р(х), отвечающее структуре конкретной стати- стической системы и выявляющее ее существенные связи. Информативная сложность системы, вычисленная по ее 155
явной размерности п — по числу элементов системы; опре- деляет трудоемкость статистической обработки класса -р всех л-мерных систем, т. е. число наблюдений, позволяю*, щее получить с заданной точностью и требуемой надеж*" ностью функции распределения любой статистической сис- темы из п элементов. Инфврмативная сложность, вычислен* ная по ее существенной размерности k, характеризует тру- доемкость статистической обработки систем (подкласса Р*)< обладающих Яблочной структурой. Как правило, она значительно ниже информативной, сложности класса Р. . Многие реальные статистические системы могут быть достаточно хорошо аппроксимированы (с малой потерей информации — с некоторым дефектом информативности) системами весьма малой существенной размерности. Ин- формативная сложность любой такой системы, как правило, невелика/ Аппроксимация закономерностей механизмов, определяющих поведение соответствующей системы, может быть практически осуществлена по результатам наблюде- ний за реализациями состояний ее приближенной модели — случайной величины относительно невысокой размерности* Это, пожалуй, один из основных результатов теории ин? формативной сложности. . V КАТЕГОРИЯ «СЛОЖНОСТЬ» - , И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ' _ Проблема «человек—машина» . , 1. Одна из важных задач теории .сложности — прогно- зирование возможного будущего, к которому могут приве- - сти те или иные решения. В связи с этим разговор о катего?, рии «сложность» не может пройти мимо набивших оскомину вопросов: что может и чего не может ЭВМ, в карой мере реален «искусственный разум», что можно ожидать ют ис- кусственного интеллекта в_обозримом будущем и в какой мере следует возлагать надежды на искусственный разум? Короче говоря, завершая наш краткий обзор современного состояния теории сложности, нельзя уклониться от обсуж? девдя проблемы века — «человек и машина»; . ..Вопрос о перспективах передачи интеллектуальных функций человека вычислительной машине является пред- метам .ожесточенных дискуссий между учеными различны^ 150 ' ‘
направлений и вызывает неизменный интерес у широкой публики. Мы с самого начала исходим из того, что пробле- ма «машина и мышление» является не только и не столько технической или математической, сколько социологической и этической. По-видимому, обществу важен не только ответ на вопрос, какие человеческие функции можно передать машине, но и в гораздо большей степени, какие человече- ские функции нужно ей передать. Если, например, потен- циальные временные ресурсы, необходимые для искусствен- ной реализации функций естественного интеллекта, опре- деляющих, скажем, его «мудрость» и «гуманность», соизме- римы с временем, в течение которого содержание этих по- нятий в обществе существенно не меняется, то вопрос, смо- жет ли машина выполнять роль врача или юриста, управ- ляющего производством или начальника штаба соединения, нужно заменить вопросом, следует ли машине доверить соответствующие функции. Конечно, можно возразить, что' обязанности «недостаточ- । но мудрой и гуманной» машины могут быть ограничены кон- сультацией специалистов, анализирующих подготовленные машиной решения. И действительно, трудно переоценить пользу, которую может получить врач или юрист, директор или командующий от машины с богатым банком знаний и высокой производительностью. Не следует, однако, упус- кать из виду, что темпы роста исследований и использова- ния вычислительной техники в различных областях чело- веческой деятельности и «головокружение от успехов» ЭВМ могут вывести ее из-под контроля. Приведенные далее высказывания специалистов, имеющих непосредственное отношение к развитию и применению машин, свидетель- ствуют о том, что это отнюдь не беспочвенные опасения. Со- циальные последствия бесконтрольного развития искус- ственного интеллекта не менее опасны, чем последствия неконтролируемых работ по расщеплению атомного ядра или по биологическим экспериментам с искусственными рекомбинантными молекулами ДНК. 2. Вряд ли можно сейчас возражать против того, что любая четко определенная формализуемая функция чело- веческого разума может быть «в конце' концов» алгоритми- вована (сведена к вычислениям) и передана вычислительной машине. Во всех таких видах деятельности машина все более успешно конкурирует с человеком. Больше того, огромная производительность и надежная память ставят машину ф таких ситуациях часто в более благоприятное положе- 157
ние по сравнению с человеком. Имеется чрезвычайно ши- рокий спектр задач, отвечающих насущным требованиям человечества, успешное решение которых может обеспе- чить незаменимый усилитель интеллекта — вычислитель- ная машина, и только она. Уже сейчас ЭВМ обеспечивают . ранение таких проблем, как управление полетами косми- ческих ракет, автоматизированное проектирование и про- изводство, разработка технологии создания материалов с заданными свойствами, прогноз погоды. А на очереди — управляемый термоядерный синтез, освоение ресурсов Мирового океана, защита окружающей среды. Все это, однако, задачи, которые либо уже четко формализованы, либо, по мнению достойных доверия- специалистов, могут быть в обозримом будущем четко поставлены и хотя бы «в принципе» формализованы. Возникает естественный вопрос: все ли понятия, кото- рыми оперируют люди в процессе принятия решений, могут быть четко определены и переведены на язык чисел, либо представлены на каком-либо формальном языке. Можно ли формально определить такие многогранные и многозначные категории, как мораль, справедливость, счастье, культура и другие понятия, выделяющие homo sapiens из животного мира, определяющие его личные цели и общественные идеа- лы. Эти понятия присущи человеку как члену общества и формируются и эволюционируют в процессе исторического развития природы и общества. 3. Приведем два примера, ставящие под сомнение воз- можности искусственного интеллекта даже не в столь слож- ных ситуациях выбора решений, которые непосредственно связаны с такими неформализуемыми понятиями, как мораль, этика и т. д. Первый пример заимствован из книги «Творец и робот», в которой ее автор Норберт Винер, подчеркивая опасность магии автоматизации, приводит новеллу В. В. Джекобса «Обезьянья лапа». Мы используем эту новеллу для несколь- ко иной цели. Фабула новеллы такова. В английской рабочей семье | слушают рассказы сержанта, возвратившегося из Индии. : Гость показывает талисман — высушенную обезьянью лапу I и говорит, что талисман наделен магическим свойством ис- полнять три желания своего владельца. Однако талисман, утверждает он, не принес своим владельцам счастья. На- оборот, все бывшие владельцы талисмана, и сержант в ик числе, натерпелись бед. Гость уже намерен бросить волшеб- 158
ную лапу в камин, но хозяин, невзирая на предостережение сержанта, овладевает талисманом и просит обезьянью лапу выполнить три его желания. Первое — получить двести фунтов стерлингов. Через некоторое время раздается стук в дверь. В ком- нату входит служащий фирмы и сообщает, что сын хозяи- на — рабочий фабрики, принадлежащей фирм§,-погиб в ре- зультате несчастного случая. Фирма выражает семье по- гибшего соболезнование и просит принять пособие в раз- мере двухсот фунтов. Так выполняется первое желание хозяина. В таком же духе магический талисман выполняет и два других желания. Талисман — своего рода искусственный интеллект — вы- полняет поставленную перед ним задачу как бездумный исполнитель. Он не уточняет постановку задачи и не до- полняет исходную информацию ограничениями, исключаю- щими нежелательные варианты решений. Чтобы подойти «сознательно» к решению задачи, талисман должен был бы знать, что такое «нежелательные решения», в каких усло- виях допустима реализация решения, какие препятствия могут при этом встретиться. Короче говоря, он должен рас- полагать информацией, которую люди, занимающиеся той же задачей, молчаливо предполагают само собой разумею- щейся. Другими словами, он должен был бы обладать не- которым жизненным опытом, а поскольку класс заданий талисману заранее жестко не ограничен, то дополнительная . информация, позволяющая ему «разумно» выполнять жела- ния владельца, должна соответствовать опыту вдумчивого исполнителя. Приобрести такой опыт — значит, повторить эволюцию homo sapiens и весь путь его общественного развития. Другого пути мы не видим. Второй пример был рассказан одному из авторов его старшим товарищем — очевидцем и участником описывае- мых ниже событий. Дело было в 1916 г. на одном из участков застабилизировавшегося к тому времени Западного фронта. В течение нескольких месяцев активных действий на участ- ке не наблюдалось. Только редкие перестрелки нарушали спокойное течение «окопной войны». Как-то командиру час- ти сообщили, что на его участок собирается с инспекцией великий князь. Было приказано продемонстрировать бое- готовность полка и доблесть войск: атаковать противника и занять некоторые его рубежи. Поставленная задача не соответствовала, однако, боезапасу, которым располагала часть. Возникла проблема выбора объектов, по которым ' 159
следовало сосредоточить артогонь, и объекта для первого удара, чтобы при ограниченном числе снарядов возможно, больше ослабить ожидаемое сопротивление противника. Офицеры штаба высказывали разные предложения. Все они, однако, были слабо аргументированы. Споры затяну- лись бы, если б денщик командира полка не попросил разре- шения вмешаться в разговор. Наблюдая время от времени в перископ за позициями противника, он заметил, что, как только выглядывает солнце, на крыше одной из землянок появляется и греется на солнце котенок.с бантиком. С вы- водом денщика нельзя было не согласиться: землянка явно была офицерским жильем или командным пунктом. И в том и в другом случае первой целью артналета следовало вы- брать землянку с котенком. . . Рассказывая эту историю, очевидец событий спрашивал у автора, в то время еще молодого сторонника модных в те годы кибернетических идей, представляет ли он себе, авто- мат (в нынешних терминах искусственный интеллект), • спо- собный найти основания для выбора решения, подобно тому как это сделал неграмотный денщик в описанной ситуации. Авторы готовы задать тот же вопрос читателю. Мы уже указывали, что единственный, с нашей точки зрения, п^ть накопления опыта принятия решений в жи- тейских ситуациях — это моделирование эволюции и со- циального развития человека. Правдоподобные соображения о сложности таких процессов излагаются далее. Объективные и субъективные факторы в принятии решений В теории принятия решений формализованы и исследо- ваны главным образом те ситуации выбора, в'которых из- вестна, по крайней мере на содержательном уровне, цель решения — критерий качества выбора. Это ситуации, опи- сываемые моделями безусловной и условной оптимизации. В предыдущих главах обсуждались характеристики слож- ности различных классов задач, соответствующих этим моделям. Приведённые там оценки сложности определяют пути и трудоемкость автоматизации решения задач оптими- зации при известных критериях качества выбора. Значительно более серьезные проблемы возникают при постановке и анализе естественных задач принятия решений, в которых требуется обеспечить достижение многих целей, 160
удовлетворить интересы многих лиц, выбрать взаимопри- емлемые стратегии поведения конфликтующих сторон. Речь идет о современных разделах теории принятия решений — теории многокритериальных задач, теории групповых ре- шений и теории игр. Формальная постановка задач этих разделов требует четкого определения понятий «справед- ливое агрегирование целей», «рациональное согласование интересов», «равновесное разрешение конфликта». Суще- ствует множество, казалось бы, удовлетворительных опре- делений этих понятий, приводящих, вообще говоря, к раз- личным и иногда существенно различным решениям. Выбор подходящего определения зависит обычно от огромного количества содержательных признаков ситуации. Перечень признаков (и характер зависимости от них) интуитивных принципов компромисса, как правило, не удается заранее учесть и классифицировать. Они существенно определяются конкретными особенностями задачи. В общем случае нет формальных оснований предпочесть одни определения «справедливости», «согласованности», «равновесия» другим. Обоснование принципов выбора решения в этих задачах выходит за рамки математики. Единственное, что могут в таких ситуациях обеспечить формально-логические рас- суждения,— это некоторое сужение множества допустимых решений (например, до так называемого множества Паре- то — множества эффективных точек). Невозможность илй огромная сложность (в любом ра- зумном смысле) четкой формализации ключевых понятий современных разделов теории принятия решений исключает надежные основания для автоматизации соответствующих процессов. Между тем, в повседневной практике, в произ- водственной и общественной жизни необходимость в коор- динации целей, согласовании интересов и разрешении кон- фликтов встречается на каждом шагу. Люди часто без осо- бого труда неформально согласовывают цели и интересы и к всеобщему удовлетворению разрешают возникающие кон- фликты. Чем больший жизненный и исторический опыт на- коплен принимающим решение, тем, как правило, более естественной оказывается координация целей и действий. Чем мудрее договаривающиеся стороны, тем более устой- чивым оказывается согласованное решение. 2. Понятия «справедливость» и «компромисс», «мораль» и «нравственность», как и многие другие естественные чело- веческие категории,-^- неформальные понятия. Они пред- ставляют собой следствия исторического развития общества, 6М8Т 161
продукт цивилизации. Агрегирование критериев, согласо- вание интересов и разрешение конфликтов — чисто челове- ческие функции, исполнение которых требует опыта и муд. рости. И то и другое — свойства личности, формирующиеся и развивающиеся в процессе обучения и общественных контактов. . Известный советский генетик академик Н. П. Дубинин пишет 114]: «Вполне очевидно, что если бы детей современ- ного человека с момента их рождения лишить условий сов- ременной культуры, они остались бы на уровне наших да- леких предков, которые жили десятки тысяч лет назад. Однако дети таких «примитивных» людей в условиях совре- менной культуры... поднялись бы на высоты современного человека». Можно, конечно, сформулировать аксиоматически есте- ственные требования к понятию «справедливость» и к тем или иным категориям морали. В теории групповых решений, теории многокритериальных задач и теории игр имеются многочисленные интуитивные приемлемые определения по- нятий справедливости, равновесия, согласования интересов и целей, координации действий, агрегирования критериев (см.., напр., [6], [20], [31]). Каждый такой набор аксиом «рационального» агрегирования показателей многокрите- риальной Задачи может быть использован для формирова- ния машинных принципов, в соответствии с которыми ис- кусственный интеллект будет принимать решение при от- сутствии объективных четко сформулированных целей. Каждый набор аксиом, определяющий «рациональное» групповое решение, или «справедливый» дележ благ, или «компромиссное» разрешение конфликта может быть при- нят в качестве формальной основы некоторой машинной морали, устанавливающей правила поведения машинного сообщества — общества интеллектуальных роботов (вспом- ним, например, нечеткие неоднозначно интерпретируемые азимовские законы робототехники). ' Представляется, однако, что любые четко сформулиро- ванные однозначно истолковываемые «моральные» запове- ди, интуитивно соответствующие исторически сложившимся нормам в одних ситуациях, могут привести к решениям, со- вершенно неприемлемым для людей в других ситуациях. И совсем неясно, какие из известных аксиом, определяющих «рациональное согласование интересов я целей», полнее отражают в той или «ной обстановке реальвые нравственные нормы. Беяыне того, представляется крайне сомнительной «2
возможность достаточно полного формального описания ди- намических категорий, отображающих человеческое пове- дение,— категорий, существенно зависящих от развиваю- щихся условий жизни и общественных отношений. Здесь уместно напомнить известный парадокс Эрроу [47J, в кото- ром система аксиом, определяющая понятие справедливого группового решения, приводит к невозможности согласова- ния интересов без диктатора. При этом каждая из аксиом в отдельности представляется вполне интуитивно прием- лемой. В западной печати много пишут о внедрении электрони- ки в быт — об электронной кухне, о роботе-няньке, об авто- матической уборщице и т. д. Конечно, многие из функций домохозяйки могут быть формализованы и переданы авто- матам. Можно надеяться, что роботы справятся с этими функциями-гораздо лучше, чем человек. Нов, казалось бы, рутинной работе домохоеяйки могут встретиться непредви- денные' обстоятельства. В таких ситуациях автомат е элект- ронными мозгами может сварить несъедобный обед, уто- пить в ванне ребенка, выбросить алмаз в мусорную яму. Чтобы исключить нежелательные решения, нужно наде- лить робота чувствами, научить его понимать, «что такое хорошо и что такое плохо», отличать добро от зла. Но кто может поручиться, что при этом искусственный интеллект — мозг робота, вкусив плода от дерева познания, не придет к выводу, что лучше переложить трудоемкие работы на свою хозяйку и заменить ее в более приятных операциях, что не возникнет ситуация, описанная в фантастическом памфлете И. Варшавского «Перпетуум мобилен . с— 'Постойте! — в голосе Пентода звучат радостные нотки.— А почему мы вообще обязаны это- делать? — Что делать? — Кормить и обслуживать людей. — Но они же совершенно- беспомощны,— растерянно говорит председатель.— Лишить их обслуживания равно- сильно убийству .Мы не можем быть столь неблагодарны по отношению к нашим бывшим творцам. Чепуха! — вмешивается Конденсатор.— Мы научим их делать каменные орудия. — И обрабатывать ими землю,— радостно- добавляет Феррит.— Пожалуй, это выход. Так мы в решим». Возникает вопрос, много ли найдется охотников жить по соседству с обществом роботов, обладающих синтетиче-, скими нормами поведения, железной логикой» выдаюЩимй- 6* 163
ся вычислительными возможностями и способностью'боф производить себе подобных (последнее уже не фантазия)!} Авторам, например, такая перспектива не совсем по ду., ше. Мы видим единственную принципиальную возможность наделить вычислительную машину сугубо человеческими понятиями справедливости, мудрости, морали. Это — моде- лирование процесса развития личности и ее окружения, точнее, моделирование эволюции общества. Однако, как мы увидим несколько ниже, решение этой задачи — если она вообще осмыслена! — беспредельно сложно в любом мыслимом понимании этого слова. 3. Злоупотребление могущественными силами совре- менной науки и техники чревато опасностями. Проблемы, связанные с решением кардинальных вопросов существова- ния человеческого общества, с категориями добра и зла, войны и мира,— сугубо человеческие проблемы, и решение их можно доверить лишь коллективному человеческому разуму. Читатель вправе здесь предъявить нам претензии. Ав- торы, мол, запугивают читателя возможными последствия- ми вмешательства в жизнь общества искусственного ин- теллекта с синтетическими нормами нравственности. Но. ведь и естественный интеллект — человеческий разум — еще не может похвастать большими достижениями в уста- новлении рая на Земле. Мы отвергаем это возражение. Вся история человечества свидетельствует о поступательном, общественном прогрессе. История сметает с пути системы, не отвечающие объективным законам развития общества, оттачивая и совершенствуя при этом нравственные нормы общественной жизни. Трудно придумать механизм, ограничивающий на- правления развития предоставленного самому себе искус- ственного интеллекта или общества роботов. Для любителей повернуть ход истории вспять нет более подходящего спо- соба избежать осуждения, чем переложить ответственность за решения на искусственный интеллект, у которого Исто-- рически сложившиеся категории — мораль, гуманность, справедливость й др.— подменены теми или иными аксио- матически сформулированными понятиями равновесия, компромисса, устойчивости. 164
Сложность моделирования моральных категорий 1. Ниже мы сосредоточим внимание на одном йз аспектов проявления «сугубо человеческого» — на категориях мо- рал.и,играющих важнейшую роль в решениях, принимае- мых .человеком. . ' ... Допытаемся оценить минимальный объем информации, подлежащей . переработке при моделировании естествен- ного процесса установления моральных норм общественного поведения. Таким образом можно будет получить представ- ление о затратах времени, необходимого для обучения вы- числительной машины принятию решений в согласии с фор- мируемой обществом шкалой ценностей, дополняющей свод законов моральным кодексом. .Формирование и эволюция норм социального поведе- ния — исторический процесс. Это значит, что для уставов- - ления современной шкалы ценностей, принятой в той или иной социальной группе, нельзя ограничиться моделиро- ванием решений, принятых одним поколением. Мораль — историческая категория, сохраняющая элементы, присущие прошлому, и эволюционирующая вместе с изменяющимися общественными отношениями. Человек всегда и всюду но- сит с собой свою индивидуальную историю и историю чело- вечества. Моделирование решений человека как члена об- щества требует воспроизведения всей истории человеческой мысли, А. Н. Колмогоров говорил, что автомат, способный писать стихи на уровне больших поэтов, нельзя построить проще, чем промоделировав все развитие культурной жизни того общества, в котором поэты реально развиваются. Бо- гатство внутреннего мира человека есть следствие богатства его воспитания, обучения, деятельности й общественных связей. За игнорированием исторических корней человека И общества при выборе ответственных решений неотвратимо последует запись категорйй гуманности в «Красную книгу». Таким, образом, модель становления нравственных норм должна содержать блоки, отвечающие системам ценностей различных социальных групп разных поколений,, и блок, отражающий эволюцию моральных норм во времени. Мо- делирование должно соответствовать процессу формиро- вания индивидуальных, групповых, классовых и т. п. норм (норм нравственности социальных коллективов, эпохи и цивилизации в целом). Наметим контуры примитивных блочных иерархиче- ских моделей, позволяющих получить грубую оценку снизу 165
трудоемкости обучения неформализуемым моральным ка- тегориям. Все блоки модели конструируются по единому принципу. Элементы блока (люди, социальные группы, поколения) располагают наборами отношений предпочте- ния, унаследованными от предшествующих поколений. Предпочтения заданы на множествах альтернатив, опреде- ляющих поведение элемента. Элементы блока используют ресурсы из общих запасов. Этих ресурсов явно недостаточ- но для удовлетворения всех потребностей всех элементов блока. Возникает необходимость в корректировании по- требностей и предпочтений. Сдвиг предпочтений должен обеспечить согласование групповых решений и выживание цивилизации. Пусть блок содержит п элементов, каждый из которых может менять свои предпочтения на множествах альтерна- тив, Предположим, что каждый элемент блока может вы- бирать, свои предпочтения из некоторого множества, со- держащего т отношений, и при этом индивидуальные предпочтения в принципе допускают согласование интере- сов. Таким образом, групповые предпочтения блока фор- мируются из множества в tri1 наборов индивидуальных отношений предпочтения элементов блока. Можно предпола- гать, что процесс совершенствования групповых предпоч- тений бло^а — норм поведения элементов — представляет собой процесс типа естественного отбора. Набор индиви- дуальных предпочтений, не способствующий «выживанию» блока, не может быть включен в групповые предпочтения. Само собой разумеется, что все блоки модели взаимосвя- заны (по крайней мере опосредованно) и связи между ними влияют на построение групповых предпочтений. Вряд ли следует полагать, что формирование устойчи- вых групповых предпочтений блока потребует перебора всех или почти всех из наборов индивидуальных предпоч- тений. Но нет также и оснований надеяться на то, что со- гласование интересов может наступить достаточно быстро. Альтернативы, отвечающие групповым предпочтениям, ес- тественно по крайней мере считать эффективными точками (точками Парето) исходного множества альтернатив, на котором заданы индивидуальные предпочтения. Определе- ние точки Парето множества альтернатив при индивидуаль- ных предпочтениях, не связанных специальными условия- ми, требует экспоненциального по п перебора. Следова- тельно, даже моделирование отдельного блока при немалых п, соответствующих реальному, составу блока,— иеподъем- 166
ная задача при любом мыслимом быстродействии вычисли- тельной машины. Неизмеримо более сложную задачу пред- ставляет собой моделирование эволюции общества, требую- щее учета взаимосвязей элементов разных блоков. 2. Другое более формальное рассуждение на эту тему, основанное на предложенном Кемени и Снеллом [19] под- ходе к упорядочению по предпочтениям, приводит к тем же выводам. Можно согласиться с тем, что «справедливое» групповое решение должно быть наименее отклоняющимся от индиви- дуальных решений. Все дело, однако, в том, как определить «метрику» в пространстве предпочтений — «расстояние» между групповым и индивидуальными упорядочениями. Кемени и Снелл1 сформулировали достаточно естественные аксиоматические требования к «метрике» и доказали, что единственное определение расстояния между упорядоче- ниями, задаваемыми матрицами А(1) и А(2), устанавлива- ется функцией Здесь —матрица порядка тн упорядоче- ний предпочтений блока, отвечающая Л-му элементу блока. Элементы ац матрицы А удовлетворяют условиям (I) аг>=1, 0 или —1; (П) ац=—ан; (III) если av>0 и то aik^0, причем aik—0 в том и только в том случае, если агу=а/А=0. Обозначим через D область определения матриц А, эле- менты которых удовлетворяют условиям (I) — (III). Выбор матрицы Аг группового решения, найлучшим образом согласующегося с индивидуальными упорядоче- ниями элементов блока, сводится к решению задачи дис- кретного программирования: 2 d(А(П, Аг) —► mtn | i=l Приведенное ранее обсуждение вычислительной слож- ности задач целочисленного программирования не внушает оптимизма по поводу возможности механического установ- ления «справедливых» моральных норм за обозримое время. ! В наших рассуждениях не учтены многие факторы, су- щественно влияющие на установление групповых предпоч- 167 L
тений в блоках, и игнорируются затраты времени на полу* чение исходной информации для моделирования. Таким образом, полученная экспоненциальная по размерности системы оценка трудоемкости моделирования отдельного блока может служить лишь нижней оценкой (причем очень трубой) сложности моделирования процесса установления и эволюции моральных категорий общества. Но и она слиш- ком велика для того, чтобы можно было всерьез говорить о возможности построения «справедливой» «машинной мо- рали». Искусственный интеллект может породить лишь искусственную мораль. 3. Рассмотрим более простую задачу о выявлении прин- ципов выбора в той или иной области человеческой дея- тельности по результатам наблюдений за действиями опыт- ного-ЛПР (лица,.принимающего решение). В математической экономике исследуется и обсуждается понятие выявленного предпочтения' по данным выбороч- ного обследования. Эго понятие лежит в основе теории спроса и используется для разработки требований к плану производства, обеспечивающему удовлетворение платеже- способного спроса. По аналогии с понятием «выявленное предпочтение потребителя» может быть построено более общее понятие «выявленный механизм выбора ЛПР». Идея формирования такого понятия состоит в следующем. В ре- зультате наблюдения за поведением ЛПР фиксируются ситуации, требующие выбора, и принятые решения. Соот- ветственно. сопоставляются множества альтернатив, отве- чающие предъявлениям (ситуациям выбора), и их подмно- жества*— реализованные выборы. Таким образом, могут быть составлены так называемые функции выбора С (Х)^Х, где X — предъявленное множество альтернатив, С (X) — отобранное множество альтернатив; G — множество все- возможных альтернатив. Во всех случаях, когда удается построить всюду определенную (на G) функцию выбора, возникает возможность имитировать действия ЛПР. Од- нако, как. правило, множество ситуаций, в которых прихо- дится принимать решение, столь велико, что за обозримое время удается построить по данным наблюдений далёко не полностью определенную функцию выбора. Тем не менее во многих практических задачах данные ограниченного эксперимента могут служить представительной выборкой, позволяющей выявить закономерности механизма, в соот- ветствии с которым специалист принимает решение, или по крайней мере, высказать правдоподобные гипотезы по 168
I -этому „поводу. Собственно, именно по такому пути переходят I от накопления опыта к построению теории в естественных I науках. «Природа коварна, но не злонамеренна». Законы j .природы устанавливаются на ограниченном опытном ма- I териале. . . Исследования, проводящиеся в последнее время, позво- ляют привести в соответствие каждой функции выбора, j . рассматриваемой как концепция принятия решений, не- который механизм выбора — так называемую многошаго- вую схему обобщенного математического программирова- ния (см., напр., 156] и цитированную в ней литературу). Для произвольной функции выбора число шагов многоша- гового механизма принятия решений оценивается числом альтернатив в предъявлении и не может быть существенно уменьшено. Однако если функция выбора удовлетворяет некоторым нежестким допущениям, так или иначе характе- ризующим «рациональный» выбор, можно радикально со- кратить число, шагов механизма и упростить структуру задачи, решаемой на каждом шаге. В таких случаях меха- низм принятия решений, сконструированный по не прл- ' ностью определенной функции выбора, может быть с успе- хом использован и в ситуациях, не наблюдавшихся в экспе- рименте. Другими словами, если функция выбора удовлет- воряет требованиям к «рациональному» выбору, можно построить механизм принятия решений по ограниченному объему наблюдений. Предварительный анализ методов построения многоша- говой схемы обобщенного математического программирова- ния по заданной концепции «рационального» выбора приво- дит к следующим выводам. (1) При выполнении некоторых требований к «рацио- нальному» выбору могут быть построены механизмы приня- тия решения приемлемой трудоемкости, восстанавливающие функцию выбора ЛПР по ограниченному объему наблюде- ний. Типичная задача, в которой оказывается полезным разработанный аппарат,— это, например, создание схем, существенно облегчающих работу диспетчера, управляю- щего воздушным движением. (2) В конфликтных ситуациях «представительная вы- борка» стратегий опытного «игрока», позволяющая восста- новить его новедение в «игре», как правило, мало отличается от множества всевозможных стратегий. Отсюда сложность автоматизации. выбора «рациональной» линии поведения в конфликте. ? „ 169
(3) В общем случае выяснение принципиальной воз- можности конструирования механизма выбора по ограни- ченной выборке наблюдений за действиями «эталонного» ЛПР представляет собой АР-полную задачу. Таким образом, ни моделцрованйе эволюции обществен- ных отношений, ни наблюдения за решениями лиц, имеющих опыт и знания в соответствующей области, не дают основа- ний для надежд на формализацию понятия «компромиссный» или «справедливый» выбор в сложных ситуациях. Слишком долго должен обучаться искусственный интеллект, чтобы ему можно было доверить решение стратегических проблем человеческого общества. 4. Здесь уместно сделать следующее замечание. Отрицая возможность построения приемлемой «машин- ной» морали, не следует впадать в другую крайность — преувеличивать роль человеческой интуиции. Аргентинский физик и философ М, Бунге, известный со- ветским читателям своими переведенными на русский язык монографиями «Причинность» (1962) и «Интуиция и наука» (1967), замечает, что нацизм в сфере идеологии был подго- товлен многочисленными философами и «духоучеными», возносившими интуицию и противопоставляющими ин- стинкты толпы, подогреваемой безответственными фюрера- ми, науке и фазуму. А. Колнаи 124], излагая идеологию нацизма и егофилософских предшественникж, пишет: «...на- род, доведенный до звероподобного состояния враждебной разуму догмой, легче склонить к совершению иррациональ- ных поступков, чем народ, бдительность которого поддер- живается критикой». . В проблемах морали машинный интеллект и инстинкт и интуиция — две стороны одной медали. Искусственного интеллекта и интеллектуальной интуиции при всей их по- ложительной роли в решении сложнейших технических проблем недостаточно для формирования шкалы человече- ских ценностей. Как же определить понятия «справедли- вость», «компромисс», «равновесие» и другие нормы обще- ственного поведения, составляющие основу выбора решений в сложных ситуациях? Ответ на этот вопрос выходит за рамки обсуждаемой здесь проблемы. Ясно лини», что он немыслим без синтеза общественных я естественных наук. Одними сложностными соображениями, достаточными для того, чтобы аргументировать невозможность формализации моральных норм, здесь не обойтись. :. . 5. Художник и писатель, участник французского Со- 170
противления Веркор в книге-эссе «Во что я верю» пишет, что эволюция нравов происходит в направлении, прямо проти- воположном эволюции животного мира. Человечество, вме- сто того чтобы подчиняться слепым инстинктам, борется с ними, вместо того чтобы предпочитать грубую силу, созда- ет предпосылки для защиты слабых. Таким образом, род человеческий, нарушая природный уклад жизни, освобож- дался от того, что у него оставалось от животного. Всякая попытка вернуться' к беспощадной системе естественного отбора — возродить практику господства сильного над слабым — отбрасывала человечество в далекое прошлое. Такие поползновения повернуть код истории назад неизмен- но пресекались прогрессивными силами. Литература и искусство, этика и мораль также необхо- димы для эволюции человеческого рода, как и производство и наука. Под влиянием Шекспира и Достоевского, Вольтера и Толстого, Бетховена и Чайковского, Рафаэля и Репина меняется видение мира. Люди преобразовывают конкрет- ную реальность, стремясь создать мир, подобный тому об- разу, который их покорил. Искусственный интеллект — верный помощник человека в решении технических и тех- нологических проблем сколь угодно широкого масштаба, может активно способствовать или противодействовать прогрессивной эволюции нравов. Первая альтернатива мо- жет иметь место, лишь если искусственный интеллект су- меет впитать в себя многовековую духовную культуру че- ловечества. Насколько сложна эта задача, мы уже видели. Границы использования искусственного интеллекта 1^Практачоская невозможность обучения машины выбо- ру решений в соответствии с исторически сложившимися нормами нравственности налагает определенные ограниче- ния на перспективы использования вычислительной тех- ники. Развитие и применение искусственного интеллекта должно быть ограничено выбором решений в областях чело- веческой деятельности, не требующих мудрости, не посягаю- щих на условия жизни последующих поколений. Еще Н. Винер s своей последней работе «Творец и робот» пре- дупреждал, что бездумное развитие и использование вы- числительной техники грозят порабощением Виаер провозглашает «машине машинное, человеку чело- 171
веческое». К сожалению, не все деятели, которым «отец ‘ кибернетики» адресовал свои предостережения, деятели, оп- ределяющие направления развития и применения искусст- "венного интеллекта, разделяют это мнение основополож- ника кибернетики. Опасность передачи машине противопо» ' казанных ей функций существует. Позаимствуем из книги Дж. Вейценбаума [5] высказы- ‘ вания нескольких апологетов глобального использования искусственного интеллекта, которым-автор присвоил клич- ку искусственных интеллигентов. Аналогичные материалы содержатся и в книге X. Дрейфуса (131. Директор ведущей американской вычислительной лабо- ратории (его имя Вейценбаум не называет) в документе, обосновывающем перспективные исследования, говорит, в частности, что «...вычислительная машина включила себя и несомненно будет продолжать включать себя в осущест- вление большинства функций, имеющих фундаментальное значение для существования, защиты и развития нашего общества...» (5, с. 309]. Предполагается, следовательно, что машине будет доверено, в частности, и решение вопросов добра и зла, войны и мира. Цитируя этот документ, Вейцен- баум указывает, что в нем нет и намека на вопрос, хотим ли мы такого. будущего. Этот вопрос просто не подлежит об- суждению.*^ . ’Американский специалист по искусственному интел- ' леИту Г. Саймон в 1960 г. предсказывал: «В очень близком будущем (много раньше, чем через 25 лет) мы добьемся •технической возможности возложить на машины все функ- Ййи, выполняемые человеком в организации» [5]. Профессор Дж. Форрестер, известный советским чита- телям по его переведенным на русский язык книгам «Миро- вая динамика» и «Динамика развития городов», идет еще дальше: «Величайшая неопределенность, свойственна^, мыс- ленным моделям, заключается в невозможности предвидеть последствия взаимодействия отдельных частей системы. Эта неопределенность полностью ликвидирована в машинных моделях» 15]. ’ ' Специалист по искусственному интеллекту профессор Массачусетского технологического института. М. Минский торжественно заявляет: «При жизни нашего поколения... останется лишь немного интеллектуальных задач, которые будут не под силу машинам: проблема создания «искус- ственного интедлекта» будет в основном решена» 130, с. 2]. Может показаться, Что все (или почти все) в этих выска- 172
зываниях верно: Но это обманчивое впечатление. Оценки сложности процедур передачи функций естественного ин- теллекта искусственному без ущерба для шкалы человече- ских ценностей приводят к однозначному выводу: затраты ресурсов, в частности временных, на безболезненную пере- дачу интеллектуальных, сугубо человеческих функций ма- шине превышают величины, о которых можно серьезно вести речь. Как не вспомнить при этом сакраментальный ответ Ж. Ж. Руссо на вопрос: способствовало ли возрожде- ние наук и искусств улучшению нравов? Говорили ведь в старину: кто успевает в науках, но отстает в нравах, тот больше отстает, чем успевает. В цитируемой книге Вейценбаума приводится еще ряд высказываний «искусственных интеллигентов» (в том числе Б. Ф. Скиннера — лидера бихевиористского направления в психологии), которые считают невозможным доверять че- ловеческому мозгу и нечеткому человеческому языку и ощущают необходимость в создании вычислительных ма- шин, «на которые можно полагаться». Цитируя высказыва- ния «мессий от техники» о преимуществах машинного языка над человеческим, Вейценбаум восклицает: «Остается толь- ко удивляться, что этот обычный язык...,до сих пор суще- ствует. И если столь очевидно, что любые понятия й отно- шения можно перевести в термины машинного языка, то почему Же лингвисты, например Халле, Якобсон, Хом- ский, все еще так упорно бьются над своими проблемами? И почему еще существуют поэты?» 15). Здесь уместно напомнить, что автор этих слов не «гума- нитарий», а «технарь». Вейценбаум составил в 60-х годах программу «Элиза», позволяющую имитировать первичное обследование пациента психотерапевтом. Вейценбаума по- разило, что квалифицированные психиатры и образованные инженеры всерьез решили, что подобная программа, может стать основой автоматизированной психотерапии и, в част- ности, решает задачу понимания машиной естественного человеческого языка. Тревожное чувство остаться непоня- тым заставило его взяться за перо. Изучение категории «сложность» привело нас' к тем же выводам совсем по* другим соображениям. 2. Повторим еще раз, что мы никоим образом не под- вергаем сомнению роль и возможности искусственного ин- теллекта в исследований кардинальных проблем естество- знания и техники — в анализе любых задач, которые могут быть тай или иначе формализованы И сложность решения 173
которых имеет обозримую оценку. Наши, сомнения отно- сятся главным образом к возможности и целесообразности автоматизированного решения таких интеллектуальных за- дач, как задачи принятия решений, связанные с наличием многих критериев и столкновением различных интересов. Такие задачи содержат неформализуемую компоненту — принцип установления справедливого в данной ситуации компромисса. Это не математическая, а сугубо гуманитар- ная задача. Основанием для ее решения*^является истори- чески сложившаяся шкала общественных ценностей и муд- рость лица, принимающего решение. По-видимому, и мы это уже неоднократно подчеркивали, единственный путь формализации таких понятий связан с моделированием развития лица, принимающего решение, и его окружения. Эго задача колоссальной сложности. В цитированных замечаниях специалистов по искусствен- ному интеллекту возлагаются большие надежды на непре- рывный рост производительности вычислительной техники. В последнее время много разговоров ведется вокруг япон- ского проекта создания вычислительных комплексов пятого поколения. Для японцев это национальная программа. Для ее решения они сосредоточили свой промышленный по- тенциал и интеллектуальную элиту. Выделены огромные .ассигнования \и налаживается международное сотрудни- чество. Какими только терминами ци величают эту проб- лему. Предполагается снабдить эту мощную технику зна- ниями и средствами использования знаний. Правда, в до- ступной околонаучной литературе не уточняется, что такое человеческие знания, каковы .их природа, форма, объем, что такое мыслительные возможности человека. Нам пред- ставляется, что по всем этим вопросам мы знаем немногим больше, чем ничего. Но даже оставляя на совести авторов рекламных изданий сверхзадачи проекта, трудно переоце- нить возможности ЭВМ. пятого поколения. А ведь за ним последуют в обозримом будущем и очередные поколения ком- пьютеров. Лидерство в информационной технике безуслов- но будет содействовать и завоеванию ведущего положения в других областях. Но приведет ли стремительное развитие «индустрии переработки информации» к целесообразности передачи искусственному интеллекту, решения проблем справедливого согласования интересов? Приведенные ранее рассуждения позволяли бы ожидать положительный ответ на эти вопросы, если бы предвидимый рост производительности и> «интеллекта» вычислительной 174
техники обеспечил моделирование общественных черт эво- люции поведения человека и общества. Мы видели, однако, что даже самые простые и грубые подходы к формализации понятия «справедливое согласование интересов» сводятся к решению задач переборного тина. Имеются основания считать эти задачи экспоненциально сложными. Реальный механизм эволюции жизни за миллионы лет на миллиардах организмов отшлифовал пусть еще далеко не совершенные понятия морали, позволяющие уживаться при ограничен- ' ных ресурсах огромным коллективам людей. «Повторить» этот процесс за обозримое время при любом мыслимом уско- рении (определяемом даже потенциальными возможностя- ми вычислительной техники) — нереальная задача. Т&6-: лицы 2 и 3, оценивающие влияние производительности ЭВМ на размерность разрешимой задачи и максимальную раз- мерность задач, разрешимых за заданное время, иллюстри- руют этот вывод для задач экспоненциальной сложности. Таким образом, в задачах принятия решений, в которых не обойтись без понятия «справедливый компромисс», ис- кусственный интеллект и в обозримом будущем будет нуж- даться в участии естественного интеллекта. Совершенство-! вание выбираемых решений нуждается не столько в усиле- нии искусственного интеллекта, сколько в разработке эффективных путей взаимодействия искусственного и ес- тественного интеллекта. Рациональный симбиоз человека и машины, в котором человеку отводится человеческое, а ма- шине— машинное,— вот основное направление, способ- ствующее принятию решений, требующих согласования интересов. Преувеличение возможностей искусственного интеллек- та в выборе компромиссных решений имеет те же корни, что и неоправданные надежды на глобальную автоматизацию в первые годы кибернетического бума. Итон другое — следствия определенных успехов, достигнутых кибернети- ками и специалистами по искусственному интеллекту при решении относительно простых задач. Выводы, полученные при анализе поведения простых автоматов в несложных сре- дах и «умных» машин, принимающих рациональные реше- ния в «эталонных» ситуациях, с малозначащими оговор- ками экстраполировались безответственными популяриза- торами на сколь угодно сложные системы и. произвольные ситуации. Реальные явления и процессы много сложнее кибернети- ческих игрушек, а выбор рациональной стратегии в сколь- 175
нибудь серьезной конфликтной ситуации не сравнить по трудоемкости с автоматизированным выбором лучшего хода в игре «крестики и нолики». Теория суюЖности имеет веские основания утверждать, что в подавляющем большинстве классов задач принятия решений трудоемкость наиболее экономных методов (например, число итераций или элемен- тарных действий, необходимых для выбора решения требуе- мой точности) растет неизмеримо быстрее «сложности» задач класса (например, ее’ размерности — числа параметров, определяющих решение). Представляется, что именно по- этому выдающиеся пропагандисты ультрановых направле- ний сменили со временем первоначальные восторги на нотки разочарования. Так, последняя книга «отца кибернетики» Норберта Винера «Творец.и робот», впрочем, как и «Новые главы кибернетики», написаны совсем не в той тонально- сти, что «Кибернетика» или «Кибернетика и общество». . Стоит также обратить внимание на то, какую эволюцию прошел видный ученый и талантливый писатель-фантаст Айзек Азимов, сменивший благоговение перед сверхинтел- лектом мозга-гиганта («Три закона робототехники») на откровенную насмешку над электронным разумом Мульти- вака («Машина-победитель»). Вице-президент АН СССР академик Е. П. Велихов в предисловии Лк переводу предварительного отчета Япон- ского комитета научных исследований в области создания ЭВМ пятого поколения [441 говорит об ограниченной «спо- собности» ЭВМ к анализу вновь поступившей информации и о неумении вычислительной машины с достаточной сте- пенью надежности выявить содержательность вновь посту- пивших данных. Е. П. Велихов замечает: «Возникающие в связи с этим препятствия, вероятно, принципиально не- преодолимы». И далее; «...искусство выбирать решения В' подлинно сложной обстановке еще долгое время будет не- доступным компьютеру, который лишен способности дей- ствовать субъективно, соизмеряя решения и поступки с ме- рой ответственности и иными важными для человека атри- бутами существования» [44, с. 91. 176
ЗАКЛЮЧЕНИЕ.. Возможно ли единое определение категории' «сложность»? Мы исследовали различные компоненты сложности — интуитивно приемлемые характеристики трудоемкости ме- тодов решения массовых проблем и минимальных ресурсов, гарантирующих требуемое, качество описания или синтеза систем заданных классов. Изучение этих составляющих ка- тегории «сложность» позволяет в ряде случаев (исходя из познанных логических, физических и биологических зако- номерностей) оценить количественно или по крайней мере качественно потенциальные возможности целенаправленных действий и процессов и содействовать, таким образом, про- гнозированию будущего. Мы с самого начала подчеркивали, что на современном уровне знаний понятие «сложность» вряд ли можно рас- сматривать как скалярное, что оно Является много- гранным — векторным — понятием и точный смысл его оп- ределяется в соответствии с конкретными особенностями изучаемых ситуаций и проблем. Отсутствие единого опре- деления категории «сложность» оставляет, однако, чувство неудовлетворенности. Ведь до К. Шеннона и понятие «ко- личество информации» считалось многозначным. Его точ- ный смысл обусловливался спецификой передаваемой или хранимой информации. А. Н. Колмогоров отмечает [21], что по первоначальному замыслу понятие «информации» не связывалось со скалярной величиной. «Различные виды информации могут быть чрезвычайно разнообразны. Можно было заранее ожидать, что можно предложить те или иные способы измерять «количество» информации, но было не ясно, существует ли среди этих способов какой-либо один, имеющий принципиальное преимущество перед другими, а главное, было совершенно не ясно, можно ли качественно различные информации, для которых та или иная условная количественная мера одинакова, действительно считать эквивалентными в смысле трудности их передачи черёз ка- налы связи или их хранения в запоминающих устройствах. Оказалось, что такая «правильная» по преимуществу мера количества информации существует и позволяет решать до конца широкий класс задач, в которых априори независи- мость решения от более тонких качественных особенностей информации была совершенно не ясна». 177
Выдающийся вклад Шеннона заключается, в частности, в том, что он сумел сформулировать определение «количе- ства информации» как единственную скалярную функцию, удовлетворяющую некоторым разумным аксиомам [43] — естественным требованиям к численной оценке объема пере- даваемой или хранимой информации. Определение Шеннона удовлетворило всех потребителей этого понятия во всех ситуациях, где оно использовалось. Хотелось бы надеяться, что по мере роста понимания природы сложности будет предложено и единое определение категории «сложность», так что формулировка каждой из ее существенных компонент будет при некоторых предпо- сылках вытекать из общего определения как частный слу- чай. Не следует, однако, себя чрезмерно обольщать по это- му поводу и закрывать глаза на трудности, связанные с та- кой задачей. Понятие количества информации относится к физике. Категория же сложности должна обслуживать весь спектр проблем, относящихся не только к разделам естествознания, но и к разным аспектам человеческой дея- тельности, В физике мы работаем с относительно простыми системами. Обращаясь к наукам, лежащим за пределами физики, мы сталкиваемся с более сложными (в любом ра- зумном интуитивйом смысле) структурами, с большим чис- лом переменных и взаимосвязей, с более серьезными и менее случайными нелинейными эффектами. Мы еще не располагаем достаточно общими мерами сложности таких структур. При использовании математических методов в физике наличие обоснованных физических принципов, устанавли- вающих количественную связь между основными физиче- скими понятиями, позволяет измерять эффективность физи- ческих процессов. В физике имеются фундаментальные физические постоянные, устанавливающие пределы осущест- вимости тех или иных физических процессов и характери- зующие затраты, связанные с их реализацией. Не так обстоит дело в других науках. Как измерить сложность биологических, экономических систем, как оценить эффективность решения задач в той или иной области? Приемлемое общее определение категории сложности, если оно вообще возможно, породило бы надежду на воз- можность установления общих закономерностей поведения сложных систем, не зависящих от их природы, и получения оценок достижимости тех или иных целей при различных подходах к управлению сложными системами. Математика, 178
по словам А. Пуанкаре,— это искусство давать разным вещам одно название. Изучив одну закономерность, иссле- дователь узнает ее затем во множестве самых различных ситуаций. По-видимому, это наиболее естественный путь познания закономерностей все усложняющейся действи- тельности. , Пути преодоления сложности 1.. Сложность явлений и процессов зависит не только от их объективных характеристик, но и от уровня наших знаний о них й от выбранного способа описания изучаемых объектов. В средние века умение производить арифметиче- ские операции было признаком большой учености, в на- стоящее время с этим справляются ученики младших классов. В системе Птоломея планеты двигались по слож- ным орбитам, в системе Коперника описание орбит пре- дельно просто. Компоненты сложности, исследованные и формализо- ванные в предыдущих главах, обсуждались в понятиях и терминах логики и вычислительной математики. Явления и процессы, сложностные характеристики которых оцени- вались, разлагались на элементарные составляющие. Пред- ставления о целом основывались на изучении элементов и взаимосвязей между ними. Таков основной, но не единст- венный подход математики к познанию реальности. Это надежный, доказательный, строгий подход. Но умение ло- гически мыслить, умение доказывать — это еще не вся математика. Установление качественных и количественных закономерностей требует, кроме того, и целостного взгляда на процессы и явления. Математика как инструмент позна- ния полезна, когда удается концентрировать внимание на центральных вопросах и игнорировать второстепенные факторы. Выделению главного способствуют опыт, содер- жательные знания, интуиция и изобретательность. Логика и вычислительный аппарат становятся инструментами по- знания, если они дополняются интуицией. Интуиция, ко- нечно, не обладает строгостью и достоверностью логики и не способна обеспечить оценки, которые можно получить с помощью вычислений. Зало интуиция позволяет посмот- реть на исследуемое явление издали, откуда хоть и не видны детали, но различимы общие контуры явлений и Доступны оцегйеи его сглаженных характеристик. , ! * 179
Аналогии, присущие интуйтивно-содержательному мыш- лению, обеспечивают возможность перенести приемы» испы- танные при изучении одних задач, на другие. Но как вы- брать исходную позицию и угол зрения, позволяющие оки- нуть взглядом явление в целом, как подметить сходство между вновь возникшей проблемой и изученными ранее? Формально-логического ответа на этот вопрос мы не знаем. Интуитивные возможности исследователя, конечно, воз- растают с накоплением опыта. Следует, однако, полагать, что способности к логике или интуиции (особенно к послед- ней) являются врожденными. 2. Логика и интуиция в науке вообще и в математике в частности играют каждая свою необходимую роль. Ло- гика, гарантирующая достоверность, есть орудие доказа- тельства, а интуиция — способность к целостному "восприя- тию— орудие изобретательства. Оба подхода одинаково необходимы для прогресса науки. Отказ от любого из них затуманивает качественные закономерности явления, ог- рубляет количественные оценки его характеристик. Возможности объяснения «сложного» через изучение «простого», по-видимому, имеют свои границы. Вряд ли целесообразно объяснять закономерности макромира в тер- минах и понятиях теории элементарных частиц. Для этого нужны и другие понятия и другие термины, связанные с ха- рактеристиками макроявления. Так и объективное исследо- вание категории сложности не может ограничиться логиче- ским анализом компонент сложности, основанным на изуче- нии возможных конфигураций и взаимодействий элементов, составляющих оцениваемый объект. Требуется еще привле- чение новых понятий, обеспечивающих целостный взгляд на изучаемое явление и исключающих, таким образом, учет нереализуемых или крайне редко реализуемых в практиче- ских условиях конфигураций или взаимодействий компо- нент изучаемого явления. Строгий язык алгоритмов и . машин оперирует элемен- тарными понятиями. Язык интуиции — язык образов — обладает гибкой динамической семантикой. В емких инту- итивных терминах целостного макроописания объекта по- тери в точности описания с лихвой компенсируются сни- жением сложности объектов, «аппроксимирующих» иссле- дуемые. Таким образом, на оценки компонент сложности, полученные в предыдущих главах на основе формально- логического подхода, можно смотреть как на оценки сверху 180 I
зцаченцй слоншости, учитывающих, помимо того, .инту- итдвный подход к описанию объекта. . Мы пришли к выводу, что путь к преодолению слож- ности— это объединение формально-логического подхода к описанию и изучению объекта с интуитивным творческим подходом. Что же такое математическое творчество? Выдающийся французский математик Анри Пуанкаре говорил, что тво- рить в математике — значит, отличать, выбирать. Матема- тическое творчество состоит в' комбинировании известных и построений новых' понятий, позволяющих установить родство между фактами из удаленных друг от друга обла- стей.*Ий комбинаций известных математических объектов ничтожное меньшинство оказывается полезным. Выделение таких комбинаций требует колоссального перебора. Под- дающаяся контролю логическая деятельность вряд ли спо- собна на это. Подсознание играет в математическом твор- честве первостепенную роль. О механизме подсознательного мышлейия известно очень мало. Как объяснить интуитив- ный выбор из множества комбинаций понятий и объектов именно тех, которые представляют интерес и стимулируют сознательное мышление? В чем причина того, что из под- сознательного хаоса в мозгу одним продуктам деятельности мозга удается превысить порог сознания, а другим нет? . Мржно думать, что так же, как среди всех раздражений наших органов чувств только самые сильные останавливают на себе внимание, так и среди неосознаваемых мозговых процессов подготовлены к осознанию те, которые оказыва- ют наибольшее влияние на нашу способность к восприя- тию, Среди математиков бытует мнение, что одним из ос- новных критериев отбора при переходе от подсознания к сознанию, от внелогического к логическому мышлению яв- ляются эстетические эмоции —г чувство гармонии чисел и изящества форм. Математические объекты вызывают ощу- щение прекрасного, если их структура столь гармонична, что ум способен охватить целое, проникая в то же время в детали. Для математика самые абстрактные сущности яв- ляются как бы живыми существами, обладающими каким-то внутренним единством, изящными формами, стройной струк- турой. Люди творческого труда знакомы с ощущением счастья и радости в моменты озарения, когда после дли- тельных, . порой мучительных переживаний, вызванных не- решенной проблемой, вдруг при самых неподходящих об- стоятельствах, возникает решение задачи, Стимулом ктвор- 181
честву^ является присущая человеку внутренняя потреб- ность "к преодолению трудностей. Время, в течение которого подсознательно вынашивает- ся подход к решению, может быть достаточно большим. Перебор комбинаций, выделяющий надпороговые идеи, озаряющие мозг, должен быть необычайно велик. Каковы бы ни были осмысленные пределы скорости подсознатель- ного перебора, трудно представить себе случайный выбор комбинации фактов и понятий, составляющих сущность до- гадки, за обозримое время. Математикам известно, что слу- чайный поиск может быть эффективен только тогда, когда «мощность» множества удачных решений не мала по срав- нению с объемом области всех возможных решений. Чтобы повысить эффективность случайного поиска, им следует уп- равлять. Имеются основания ожидать, что интуитивный и сознательный процессы выбора решений тесно перепле-. таются и представляют собой итеративную последователь- ность логических и подсознательных этапов. Плодотворной подсознательной деятельности предшествует этап логиче- • ских рассуждений, сужающих область поиска. Границы интуитивной активности выбираются не наугад. С другой стороны, подсознательная деятельность, как правило, не доставляет готовый результат, а придает некоторый им- пульс сознанию, которое, в свою очередь, упорядочивает процесс интуитивного поиска в состоянии кажущегося по- коя мозга. Конечно, приведенные рассуждения не под- креплены сколько-нибудь серьезной экспериментальной проверкой, но они представляют собой вполне правдопо- добную рабочую гипотезу. Эта соображения могут быть ис- пользованы не только для постановки работ по изучению физиологии творческой деятельности, но и для разработки техники и технологии «усилителей» интеллекта. 4. Необходимость внелогического этапа — интуиции — в математическом мышлении вытекает и из сугуф формаль- ных соображений. Усилия, предпринятые математиками, чтобы очистить научную систему от интуитивного элемента, привели к противоположному результату. В так называемой «чистой» математике существуют раз- делы, все утверждения которых могут быть логически вы- ведены из некоторой системы независимых аксиом. Одиако если речь идет о прикладной математике, претендующей на связь с внешним миром, полностью дедуктивная теория невозможна. Это следует из уже упомянутой во второй гла- ве теоремы Геделя, содержательная интерпретация которой 182
может, быть изложена следующим образом. Какова бы ни была независимая, непротиворечивая система аксиом, всег- да существуют высказывания, истинность или ложность которых не может быть установлена на основании исходных аксиом. Это значит, что для того, чтобы соответствующая формальная теория справлялась с оценкой всех относящих- ся к ней утверждений и фактов, необходимо дополнять ее логические основания новыми аксиомами, не зависящими от исходных и не противоречащими им. Другими словами, развитие формальной теории требует непрерывного обога- щения ее аксиоматических основ внелогическими интуи- тивными элементами. Эту интерпретацию теоремы Геделя предвидел Козьма Прутков и выразил ее следующими сло- вами: «Многие вещи нам не понятны не потому, что наши понятия слабы; а потому, что сии вещи не входят в круг наших понятий» (Плоды раздумья, с. 66). Во многих разделах прикладной математики необходи- мость в интуитивном расширении логических основ теории возникает на .каждом шагу. Например, в многокритериаль- ных задачах, в теории групповых решений, в теории игр каждый новый класс ситуаций требует определения поня- тия равновесия посредством новых аксиом, отражающих интуитивные представления лица, принимающего решение о справедливом компромиссе. Еще сильней переплетаются формальные и интуитивные начала в инженерном творчестве. 5. Человечество познает мир двумя путями — с по- мощью эксперимента и логических рассуждений, с одной стороны, и с помощью чувств и воображения — с другой. Первый путь присущ в большей степени науке, второй — искусству. Наука оперирует понятиями, искусство — об- разами. Цивилизация обязана своими достижениями не только успехам науки, но и велйким творениям искусства. Искусство утверждает авторитет интуитивного постижения и нарушает монополию логического мышления. Искусство способно давать целостное восприятие действительности. Оно противостоит формальному подходу к изучению реаль- ности, когда разные качества и свойства объекта исследу- ются разными науками и в пределах каждой из них основ- ным методом исследования предполагается разложение целого на простейшие элементы. Хотя, по словам Ояра Ва- циетиса, «наука это тоже искусство, если она действительно наука, а не ремесло», исторически сложилось так, что наука и искусство оказались в разных областях человеческой, культуры. . . ....... .... . 183
Не в синтезе ли логичееиогоивнейогнческого подходов к познанию действительное™ ^- основной путь к преодо^-47 лению сложности изучения окружающего мира? Положи- тельный ответ на этот вопрос не противоречит современным Тенденциям в науковедении и искусствознании. Не проти- востояние, «физиков» и «лириков», не противоборство «тех- нофилов» и «технофобов», а их координированные усилия способствуют преодолению сложности познания природу и общества. Ясно, что, какими путями ни пойдет раз- витие человеческой культуры, за преодоление сложности придется-расплачиваться. Возникнут Новые понятия, по- явятся новые объекты исследования, усложнится окружаю- щий мир. Таково непрерывное развитие жизни. Как гово- рится в прекрасных стихах Эмиля Верхарна («Невозмож- ное»): . . ... . - . : Что виделось вчера |<ак цель глазам твоим,— Для завтрашнего дня — оковы; >ккль — только пища мыслей новых, Но голод их неутолим'. . ' *
' . ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА . 1. Бир Ст. Мы и сложность современного мира,— В кнл Кибер- нетика сегодня: проблемы и суждения.—; М.: Знание, 1976. "2. Бирюков Б. В., Тюхтин В. С. О понятии «сложность».— В кн.: • Логика и методология науки.— М.: Наука, 1967. . 3. Bremerman Н. I. Limits oLGenetic Control.— IEEE Transakti- ons of Military Electronics, V.M.T.L.— 7, № 2, 3, April — July, 1ЙЗ. 4. Бузыцкий П.Д., Фрейман Г. А. О применении аналитических методов в комбинаторных задачах.— Изв. АН СССР. Техн, кибернетика, 1980, №2. - - 5. Вейценбаум Дж. Возможности вычислительных машин и чело- веческий разум.— М.: Радио и связь, 1982. 6. Вилкас Э; Й.» Майминас Е. 3. Решения: теория, информация, моделирование.— М.: Радио и связь, 1981. 7. Винер Н. Кибернетика и общество.— М.: ИЛ, 1958*. 8. Винер Н. Творец и робот.— М.: ИЛ, 1960. 9. Витушкин А. Г. Оценка сложности задачи табулирования.— М.: Фиэматгиз, 1959. 10. Генс Г. В., Левнер Е. В. Дискретные оптимизационные зада- чи и эффективные приближенные алгоритмы. Обзор.— Изв. АН СССР. Техн, кибернетика, 1979, №6. 11. Гимади Э. X., Глебов Н. И., Перепелица В. А: Алгоритмы с оценкой для задач дискретной оптимизации. — Проблемы кибернетики. Вып. 31.— М.: Наука, 19 12. Гэри М., Джонсон Д. Вычислительные машины и труднорешае- мые задачи.— М.: Мир, 1982. ,13 . Дрейфус X. Чего не могут вычислительные машины.— М,: Прогресс, 1978. 14. Дубинин Н. П. Вечное движение.— М.: Прогресс, 1973. 15. Заде Л. Основы нового подхода к анализу сложных систем и процессов принятия решений.— В кн.: Математика сегодня.— М.: Знание, 1974. 16. Звонкин А. К.? Левин Л. А. Сложность объектов и обоснова- ние понятия информации и случайности с помощью теории алгорит- мов.— УМН, 1970, т. 25, № 6. 17. Карп Р. М. Сводимость комбинаторных проблем.—. Кибернети- ческий сборник. Вып. 12.— М.: Мир, 1975. 18. Касти Дж. Большие системы. Связность, сложность, катаст- рофы.— М.: Мир, 1982. 19. Кемени Дж., Снелл Дж. Кибернетическое моделирование.— М.: Советское радио, 1972. ;185
20. Кини Р. Л., Райфа X. Принятие решений при многих критери-; ях: предпочтения и замещения.— М.: Лдио и связь, 1981 21. Колмогоров А. Н. Теория передачи информации.— М.: Изд-во АН СССР, 1956. 22. Колмогоров А. Н. Три подхода к определению понятия «ко- личество информации».— Проблемы передачи информации, 1965, т, L №1. 23. Колмогоров А. Н. Комбинаторные основания теории информа- ции и исчисления вероятностей.— УМН, 1983, т. 38, № 4. 24. Kolnai A. The Ware Against the West.— London, Gollanez, 1938. 25. Кук С. A. ’ Сложность процедур вывода теорем.— Кибернети- ческий сборник. Вып. 12.—М.:,Мир, 1975. 26. Кульбак С. Теория информации и статистика.— М.: Наука, 1967. 27. Левин Л. А, Универсальные задачи перебора.— Проблемы пе- редачи информации, 1973, т. 9, №3. 28. Манин Ю. И. Вычислимое и невычислимое.— М.: Советское ра- дио, 1980. 29. Марков А. А. Теория алгорифмов.— Труды Математического института АН СССР, 42, 1954. 30. Minsky М. Computation: Finite and Infinite Machines.— Eng* lewood Cliffs, N. Y. Prentice — Hall, 1967. 31. Миркин Б. Г. Проблема группового выбора.— М.: Наука, 1974. . 32. Нейман Дж. фон. Общая и логическая теория автоматов.— В кн.: Тьюринг А. М. Может ли машина мыслить? — М.: Физматгиз, 1960. 33. Немировский А. С., Юдин Д. Б. Сложность задач и эффекта в-^ ность методов оптимизации.— М.: Наука, 1979. 34. Немировский А. С., Юдин Д. Б. Адаптивное управление эконо- микой.— М.: ЦЭМИ АН СССР, 1982. 35. Немировский А. С., Юдин Д. Б. Информационная сложность математического программирования.— Изв. АН СССР. Техн, кибер- нетика, 1983, № 1. , ' 36. Пуанкаре А. О науке.— М.: Наука, 1983. 37. Тарьян Р. Э. Сложность комбинаторных алгоритмов.— Кибер- нетический сборник. Вып. 17.—М.: Мир, 1980. ’ 38. Трахтенброт Б. А. Сложность алгоритмов и вычислений.— Новосибирск: Изд-во НГУ, 1967. 39. Финкельштейн Ю. Ю. Приближенные методы и прикладные за- дачи дискретного программирования.— М.: Наука, 1976. 40. Хачиян Л. Г. Полиномиальные алгоритмы в линейном програм- мировании.— ЖВМ и МФ, 1980, т. 20, Xs 1. 41. Хинчин А. Я. Понятие энтропии в теории вероятностей.— УМН, 1953, т. 8, №3 (55). 42. Chaitin G. I. Towared a Mathematical Definition of «Life».— Symposium MFCS, High Tatras, 1975. 43. Шеннон К. Математическая теория связи.— М.: 1948. 44. ЭВМ пятого поколения. Концепции, проблемы, перспективы / Под ред. Т. Мото-ока.— М.: Финансы и статистика, 1984. 45. Edmonds J. Paths, Trees and Flowers.—Canad. J. Math., 17, 1965. 46. Эйген M. Самоорганизация материи и эволюция биологичес- ких макромолекул.— М.: Мир, 1973. 186
.47 , Arrow К. J. Social Choice and individual Values,— Wiley,* N.Y., 1951. . 48. Эшби У. P. Введение в кибернетику.— М.: ИЛ, 1959. 49. Юдин А. Д. Информативные структуры многомерных случай- ных величин.— Изв. АН СССР. Техн, кибернетика, 1977, № 6. 50. Юдин А. Д. Асимптотически оптимальный алгоритм решения обобщенной задачи о соединении городов.— Изв. АН СССР. Техн. ;ки- бернетика, 1981, №2. 51. Юдин А. Д. Сложность оценивания статистических систем.т- Из?. АН СССР. Техн, кибернетика, 1981, №6. ; 5?. Юдин А. Д. Сложность статистических систем.— ДАН СССР, 1982, т. 266, №5. ’ • , _ . ,53. Юдин А. Д. Информативная сложность статистических* сис- тем.— Изв. АН СССР. Техн, кибернетика, 1982, № 3. 54. Юдин Д. Б., Немировский А. С. Эффективность случайного поиска в задачах управления.— Изв. АН СССР. Техн, кибернетика * 1977, № 3. 55. Юдин Д. Б., Горяшко А. П., Немировский А. С. Математиче- ские методы оптимизации устройств и алгоритмов в АСУ.— М.: Радио и связь, 1982. 56. Юдин Д. Б., Шоломов Л. А. Обобщенное математическое прог- раммирование и функции выбора.— Известия АН СССР. Техн, кибер- нетика, 1985, №3. .. k 57. Юдин Д. Б., Юдин А. Д. Экстремальные модели в экономике* — М.: Экономика, 1979.
СЛОВАРЬ ТЕРМИНОВ Адаптивная система — система, приспосабливающая свое поведе- ние к условиям меняющейся среды. Алгоритм правило, определяющее порядок выполнения некото- рой совокупности операций для решения задач определенного класса' Эквивалентные между собой формальные уточнения понятия «алгоритм» формулируются в терминах универсальных машин или частично-рекур- сивных функций. ’ Алгоритмическая сложность /C<p(z/|x) (или условная сложность объекта у относительно объекта х) применительно к универсальной машине со структурой <р (р, х) — это минимальная длина программы р, для которой <р(р, х)=у. Если раз и навсегда зафиксировать объект х, то Кф(р1х)=-Кф(у) — сложность объекта у. Диалоговое программирование — формальная методология органи- зации рационального взаимодействия специалистов различного профиля (математиков и прикладников), совместно участвующих в разработке целенаправленной системы. Информационная сложность решения задач данного класса с требуе- мой точностью— это минимальное число обращений к оракулу/при котором еще существует метод решения любой задачи класса с погреш- ностью, не превышающей заданную. Класс Р переборных задач — класс переборных задач, полиноми- ально разрешимых на детерминированной машине Тьюринга; Класс NP переборных здоач (АГР-полные задачи) — класс задач, полиномиально разрешимых на недетерминированной машине Тьюринга* Машина Тьюринга — идеальная вычислительная машина с неогра- ниченными ресурсами, используемая для изучения вычислительных процессов и формального уточнения понятия «алгоритм». Оракул — источник информации об индивидуальных задачах класса. Определяется множеством допустимых вопросов к нему и множест- вом возможных ответов. В практических ситуациях оракул — экс- перт, имитационная модель или испытательный стенд. Переборная задача — массовая задача, каждая реализация (индиви- дуальная задача) которой имеет конечное число вариантов решения и может быть решена (по крайней мере в принципе) с помощью полного перебора вариантов. Полиномиально сложная задача — переборная Задача, вычислитель- ная сложность которой растет как полином от размерности задачи. Рекурсия —способ определения значения функции в некоторой точке через значения этой функции в конечном числе других точек, которые в каком-то смысле «предшествуют» ей. Сигнализирующие вычисления Цл(х) — характеристики вычисли- тельного процесса, указывающие затраты ресурсов (времени, памяти и 188
др.) при решении задачи х с помощью алгоритма Л. В зависимости от того, какие ресурсы лимитируемы, та или иная сигнализирующая рас- сматривается как вычислительная сложность задачи. Сложность оценивания класса статистических систем — это мини- мальное число независимых одинаково распределенных реализации случайной величины, моделирующей систему, необходимых для того, чтобы с заданной точностью и требуемой надежностью восстановить совместную функцию, распределения вероятностей компонент модели любой системы класса. Статистическая система — система, подходящей моделью поведения которой является многомерная случайная величина. Универсальная переборная задача — переборная задача, из полино- миальной разрешимости которой следует полиномиальная разреши- мость всех других переборных задач. Экспоненциально сложная задача — переборная задача, вычисли- тельная сложность которой растет как экспонента от размерности задачи. Энтропия — мера неопределенности ситуации. Может быть ис- пользована как мажоранта сложности ситуации и как оценка количе- ства информации, необходимого для восстановления ситуации. ,
СОДЕРЖАНИЕ Предисловие 3 Что такое категория «сложность» и зачем она нужная 5 Интуитивные определенна сложности 5г Сложность и неформальные проблемы 7 Математические задачи теории сложности 8 Сложность и прикладные проблемы 10 Возможно ли путешествие по телеграфу? 14 Алгоритмическая сложность 17 Что такое алгоритм? 17 Частично-рекурсивные функции 19 Машина Тьюринга 23 Определение алгоритмической сложности 26 Свойства алгоритмической сложности 30 Сложность объекта 33 Сложность и случайность 35 Алгоритмическая сложность и теория информации 40 Сложность табулирования 45 Сложность и закон необходимого разнообразия 50 Влияние теории алгоритмической сложности на математические дисциплины 50 Предвидимые приложения теории алгоритмической сложности 61 Вычислительная сложность 64 , Меры сложности вычислений 64 Инвариантные результаты теории вычислений 69 Классификация по сложности задач дискретной оптимизации 71 Легкорешаемые дискретные задачи 77 Вычислительная сложность переборных задач 84 Полиномиальная разрешимость задач линейного программиро- вания 90 Труднорешаемые дискретные задачи 93 Заключение 102 Информационная сложность 105 Сложность оптимизации 105 Постановка задачи и основные определения 107 Информационная сложность нелинейного (невыпуклого) программирования ПО Информационная сложность выпуклого программирования 112 Субоптимальные законы управления 118 Адаптивное управление экономикой 121 Диалоговое программирование 127 Сложность статистической обработки информации 137 Характеристики сложности статистических систем 137
Сложность оценивания 143 Информативная сложность 149 ’ Выводы 155 Категория «сложность» и искусственный интеллект 156 Проблема «человек — машина» 156 Объективные и субъективные факторы в принятии решений 160 Сложность моделирования моральных категорий 165 Границы использования искусственного интеллекта 171 Заключение 177 Возможно ли единое определение категории «сложность»? 177 Пути преодоления сложности 179 Использованная литература 185 Словарь терминов 188
Давид Борисович ЮДИН Александр Давидович ЮДИН ЧИСЛО И МЫСЛЬ Выпуск 8 (Математики измеряют сложность) Главный отраслевой редактор А. Нелюбов Редактор Н. Феоктистова Мл. редактор Н. Карячкина Художественный редактор М. Бабичева Технический редактор А. Красавина Корректор С. Ткаченгко ИБ № 7049 Сдано в набор 31.01.8,5. Подписанок печати 07.06.85. А09339. Формат бумаги 84X108/32. Бумага тип. X® 3. Гарнитура лите- ратурная. Печать высокая. Усл. печ. л. 10,08. Усл. кр.-лтт. 10,50. Уч.-изд. л. 10,43. Тираж 40000 экз. Заказ 5'987. Цена 55.коп. Издательство «Знание». 101835» ГСП, Москва. Центру проезд Серова, д. 4. Индекс заказа 856713. Отпечатано с матриц 1-й Образцовой типографии имени Жданова г. Москвы на Головном предприятии республиканского. производственного объединения «Полиграфкнига», 25205Л Киев, ул. - Довженко, 3.