Text
                    Э. МЕНДЕЛЬСОН
Введение
в математическую
логику
Перевод с английского
Ф. А. КАБАКОВА
Под редакцией
С. И. АДЯНА
ИЗДАНИЕ ВТОРОЕ, ИСПРАВЛЕННОЕ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1976


518 М 50 УДК 519. 95 Introduction to Mathematical Logic by Elliott Mendelson Associate Professor of Mathematics Queens College Flushing, New York D. VAN NOSTRAND COMPANY, INC. PRINCETON, NEW JERSEY TORONTO NEW YORK LONDON Эллиот Мендельсон ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ ЛОГИКУ М., 1976 г., 320 стр. с илл. Редактор В. В. Донченко Техн. редактор Л. П. Колесникова Корректор Л. С. Сомова Печать с матриц. Подписано к печати 18/Ш 1976 г. Бумага 60x90Vie. Физ. печ. л. 20. Условн. печ. л. 20. Уч.- изд. л. 21,61. Тираж 33 000 экз. Цена книги 1 р. 65 к. Заказ 552, Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 Отпечатано во 2-й типографии изд-ва «Наука», Москва, Шубинский пер,, 10, заказ 473, с матриц ордена Трудового Красного Знамени Ленинградского производственно-технического объединения «Печатный Двор» имени А. М. Горького Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, полиграфии н книжной торговли. 197136, Ленинград, П-136, Гатчинская улм 26, ж. 20203—051 053(02)-76
Оглавление От редактора перевода 5 Предисловие 6 Введение 7 Глава 1. Исчисление высказываний 19 § 1. Пропозициональные связки. Истинностные таблицы 19 § 2. Тавтологии 24 § 3. Полные системы связок 31 § 4. Система аксиом для исчисления высказываний 36 § 5. Независимость. Многозначные логики 46 § б. Другие аксиоматизации 48 Глава 2. Теории первого порядка 63 § 1. Кванторы 53 2. Интерпретации. Выполнимость и истинность. Модели 57 3. Теории первого порядка 64 4. Свойства теорий первого порядка 67 б. Теоремы о полноте 71 б. Некоторые дополнительные метатеоремы 81 § 7. Правило С 83 § 8. Теории первого порядка с равенством 86 § 9. Введение новых функциональных букв и предметных констант 93 § 10. Предваренные нормальные формы 96 § 11. Изоморфизм интерпретаций. Категоричность теорий 102 § 12. Обобщенные теории первого порядка. Полнота и разрешимость 104 Глава 3. Формальная арифметика 115 § 1. Система аксиом 115 § 2. Арифметические функции и отношения 132 § 3. Примитивно рекурсивные и рекурсивные функции 135 § 4. Арифметизация. Гёделевы номера 151 § 5. Теорема Гёделя для теории S 158 § 6. Рекурсивная неразрешимость. Теорема Тарского. Система Робинсона 167 Глава 4. Аксиоматическая теория множеств 177 § 1. Система аксиом 177 § 2. Порядковые числа 188 § 3. Равномощность. Конечные и счетные множества 199 § 4. Теорема Хартогса. Начальные порядковые числа. Арифметика порядковых чисел 207 § 5. Аксиома выбора. Аксиома ограничения , 217
4 ОГЛАВЛЕНИЕ Глава 5. Эффективная вычислимость 228 § 1. Нормальные алгорифмы Маркова 228 § 2. Алгорифмы Тьюринга 251 § 3. Вычислимость по Эрбрану — Гёделю. Рекхрсивно перечислимые множества 261 § 4. Неразрешимые проблемы 278 Дополнение. Доказательство непротиворечивости формальной арифметики 282 Литература 296 Алфавитный указатель 310 Символы и обозначения 318
От редактора перевода В книге Э, Мендельсона «Введение в математическую логику» дается доступное для начинающего читателя и достаточно полное изложение основных разделов современной математической логики и многих ее приложений. Наряду с такими разделами, как логика высказываний, исчисление предикатов, формальная арифметика и теория алгоритмов, в ней освещены также теория моделей и аксиоматическая теория множеств, отсутствующие в книге С. К. Клини «Введение в метаматематику», которая до настоящего времени служила наиболее полным пособием по математической логике. Следует однако отметить, что в отличие от книги С. К. Клини в этой книге по существу не затрагиваются интуиционистское и конструктивное направления математической логики. Изложение материала в книге ясное и лаконичное. Основной текст перемежается с большим числом примеров и упражнений. В упражнения автор вынес также некоторые результаты, используемые затем в основном тексте. Это, наряду с лаконичностью изложения, способствовало сокращению размеров книги при весьма обширном содержании. Переводчик и редактор перевода позволили себе без специальных оговорок и примечаний исправить ряд неточностей и опечаток, имевшихся в оригинале, а также привести терминологию и обозначения в соответствие с принятыми в русской литературе. Книгу Э. Мендельсона можно рекомендовать в качестве пособия не только студентам и аспирантам, специализирующимся по математической логике, но также всякому, кто захочет начать систематическое изучение этого предмета. Во втором издании книги исправлены опечатки и отдельные погрешности, замеченные после выхода в свет первого издания. Редактор благодарен Н. М. Нагорному и А. Л. Семенову, указавшим на ряд неточностей, допущенных в первом издании книги. С. И. Адян
Предисловие В этой книге мы попытались представить сжатое введение в некоторые основные разделы математической логики. Чтобы дать полное и точное изложение основных и наиболее важных вопросов, мы опустили такие дополнительные темы, как модальная, комбинаторная и интуиционистская логики, а также некоторые интересные, но более специальные вопросы, как, например, степени рекурсивной неразрешимости. Придерживаясь того мнения, что начинающим следует предлагать наиболее естественные и легкие доказательства, мы применяем самые непринужденные теоретико-множественные методы. Значение требования конструктивных доказательств может быть оценено только после известного опыта занятий математической логикой. В конце концов, если уж нам предстоит быть изгнанными из «канторова рая» (как назвал Гильберт неконструктивную теорию множеств), то по крайней мере мы должны знать, чего лишаемся. Пять глав книги удобно распределить на два семестра, а для курса в один семестр вполне подойдут главы с 1 по 3 (при этом можно, если это потребуется для ускорения, опустить §§ 5 и 6 главы 1 и §§ 10—12 главы 2). Мы будем отмечать верхним индексом D упражнения, которые, вероятно, будут трудны для начинающего, и верхним индексом А — упражнения, предполагающие знакомство с материалом, недостаточно освещенным в тексте. Настоящая книга представляет собой расширенное воспроизведение записей полугодового курса лекций по математической логике, читанного автором с 1958 по I960 г. в Колумбийском университете, а в 1961 и 1962 гг. в Куинс колледже. Автор надеется, что эта книга может быть прочитана без особого труда всяким, кто имеет некоторый опыт абстрактного математического мышления; при этом каких-либо конкретных предварительных знаний не требуется. Автор хотел бы поблагодарить Дж. Баркли Россера за поддержку и руководство во время аспирантских занятий логикой, а также с признательностью отметить несомненное влияние, оказанное на него книгами Гильберта и Бер- найса [1934, 1939], Клини [1952], Россера [1953] и Чёрча [1956]. Эллиот Мендельсон Queens, New York, Январь 1963
Введение Согласно одному из самых распространенных определений, логика есть анализ методов рассуждений. Изучая эти методы, логика интересуется в первую очередь формой, а не содержанием доводов в том или ином рассуждении. Рассмотрим, например, следующие два вывода: (1) Все люди смертны. Сократ—человек. Следовательно, Сократ смертен. (2) Все кролики любя г морковь. Себастьян — кролик. Следовательно, Себастьян любит морковь. Оба эти вывода имеют одну и ту же форму: все А суть В; S есть Л; следовательно, 5 есть Б. Истинность или ложность отдельных посылок или заключений не интересует логика. Он желает лишь знать, вытекает ли истинность заключения из истинности посылок. Систематическая формализация и каталогизация правильных способов рассуждений — одна из основных задач логика. Если при этом логик применяет математический аппарат, и его исследования посвящены в первую очередь изучению математических рассуждений, то предмет его занятий может быть назван математической логикой. Мы можем сузить область математической логики, если скажем, что главная ее цель — дать точное и адекватное определение понятия «математическое доказательство». Безупречные определения имеют малую ценность в начале изучения предмета. Лучший способ понять, что такое математическая логика, состоит в том, чтобы приняться за ее изучение. Мы рекомендуем студенту начать читать эту книгу, даже если (и в особенности если) он имеет сомнения относительно значения и целей предмета. Хотя логика и является основой всех остальных наук, тем не менее присущее ей, наряду с фундаментальностью, свойство самоочевидности действовало расхолаживающе на стремление к сколько-нибудь глубоким логическим исследованиям вплоть до девятнадцатого столетия, когда интерес к логике оживился под влиянием открытия неевклидовых геометрий и стремления обеспечить строгое обоснование анализа. Этот новый интерес оставался все еще не столь жгучим до тех пор, пока на исходе столетия математический мир не был потрясен открытием парадоксов, т. е. рассуждений, приводящих к противоречиям. Наиболее важными из этих парадоксов являются следующие. Логические парадоксы (1) (Рассел, 1902). Под множеством мы понимаем всякое собрание каких-либо объектов. Примерами множеств являются множество всех
о ВВЕДЕНИЕ четных чисел, множество всех саксофонистов в Бруклине и т. д. Объекты, из которых состоит множество, называются его элементами. Множества сами могут быть элементами множеств, так, например, множество всех множеств целых чисел имеет своими элементами множества. Большинство множеств не являются элементами самих себя. Например, множество всех котов не является элементом самого себя, потому что оно само не кот. Возможны, однако, и такие множества, которые принадлежат самим себе как элементы, — например, множество всех множеств. Рассмотрим теперь множество А всех таких множеств Х> что X не есть элемент X. Согласно определению, если А есть элемент Д то А также и не есть элемент Л, и если А не есть элемент Л, то Л есть элемент Л. В любом случае Л есть элемент Л и Л не есть элемент Л. (2) (Кантор, 1899). Этот парадокс требует некоторых сведений из теории кардинальных чисел, и может быть опущен читателем, если он не знаком с этой теорией. Кардинальное число У множества У определяется как множество всех множеств X, равномощных с множеством У (т. е. таких X, для которых существует взаимно однозначное соответствие между Y и X, см. стр. 15). Мы определяем Y^Z как условие рав- номощности Y с некоторым подмножеством множества Z, a 7<Z— как K<Zh YфZ. Кантор доказал, что если qP(Y) есть множество всех подмножеств множества У, то У <с75 (Y) (см. стр. 202). Пусть С универсальное множество, т. е. множество всех множеств. Так как Р есть подмножество множества_С, то, очевидно, 3*(С)^С. С другой стороны, по теореме Кантора С<$>(С). Теорема _же Шредера — Берн- штейна (см. стр. 201) утверждает, что если Y^Z и Z^ Y> то 7=Z Следовательно, С==ИЬ(С)У что находится в противоречии с C<.qP (С). (3) (Б у р а л и - Ф о р т и, 1897). Этот парадокс аналогичен парадоксу Кантора. Он возникает ъ теории порядковых чисел и будет понятен только тому, кто уже знаком с теорией порядковых чисел. Для любого порядкового числа существует порядковое число, его превосходящее. Однако порядковое число, определяемое множеством всех порядковых чисел, является наибольшим порядковым числом. Семантические парадоксы (4) Парадокс лжеца. Некто говорит: «Я лгу». Если он при этом лжет, то сказанное им есть ложь, и, следовательно, он не лжет. Если же он при этом не лжет, то сказанное им есть истина, и, следовательно, он лжет. В любом случае оказывается, что он лжет и не лжет одновременно *). *) С парадоксом лжеца имеет сходство известный еще в древности (см., например, «Послание к Титу св. апостола Павла», 1, 12) так называемый «парадокс критянина». Критский философ Эпименид сказал: «Все критяне — лжецы». Если то, что он сказал, верно, то, поскольку Эпименид сам критянин, сказанное
ВВЕДЕНИЕ 9 (5) (Ришар, 1905). С помощью некоторых фраз русского языка могут быть охарактеризованы те или иные вещественные числа. Например, фраза «отношение длины окружности к длине диаметра в круге» характеризует число тс. Все фразы русского языка могут быть перенумерованы некоторым стандартным способом, а именно: упорядочим сперва лексикографически (т. е. как в словаре) все фразы, содержащие в точности k букв, а затем поместим все фразы из k букв впереди всех фраз с ббльшим числом букв. Теперь можно перенумеровать все те фразы русского языка, которые характеризуют то или иное вещественное число. Для этого достаточно в стандартной нумерации всех фраз опустить все остальные фразы. Число, получающее при такой нумерации номер и, назовем п-м числом Ришара. Рассмотрим такую фразу: «Вещественное число, у которого #-й десятичный знак равен 1, если у п-го числа Ришара я-й десятичный знак не равен 1, и я-й десятичный знак равен 2, если у п-го числа Ришара п-й десятичный знак равен 1». Эта фраза определяет некоторое число Ришара, допустим, k-e; однако, согласно определению, оно отличается от £-го числа Ришара в k-м десятичном знаке. (6) (Б е р р и, 1906). Существует лишь конечное число слогов в русском языке. Следовательно, имеется лишь конечное число таких фраз русского языка, которые содержат не более пятидесяти слогов. Поэтому с помощью таких фраз можно охарактеризовать только конечное число натуральных чисел. Пусть k есть наименьшее из натуральных чисел, которые не характеризуются никакой фразой русского языка, содержащей не более пятидесяти слогов. Напечатанная курсивом фраза характеризует число k и содержит не более пятидесяти слогов. (7) (Грел л инг, 1908). Прилагательное называется авто логическим, если свойство, которое оно обозначает, присуще ему самому. Прилагательное называется гетерологическим, если свойство, которое оно обозначает, ему самому не присуще. Так, например, прилагательные «многосложный», «русский» являются автологическими, а прилагательные «односложный», «французский», «голубой» — гетерологическими. Рассмотрим прилагательное «гетерологический». Если это прилагательное гетероло- гично, то оно негетерологично, если же оно негетерологично, то оно гетерологично. Итак, в любом случае прилагательное «гетерологический» является гетерологическим и негетерологическим одновременно. Все эти парадоксы являются подлинными в том смысле, что они не содержат явных логических изъянов. В логических парадоксах используются только понятия теории множеств, в то время как в парадоксах семантических применяются такие понятия, как «характеризовать», им есть ложь. Следовательно, то, что он сказал, есть ложь. Тогда должен быть такой критянин, который не лжет. Последнее не является логически невозможным, и мы здесь не имеем настоящего парадокса. Тем не менее тот факт, что произнесение Эпименидом этого ложного высказывания может повлечь за собой существование критянина, который не лжет, до некоторой степени обескураживает.
Ю ВВЕДЕНИЕ «истинный», «прилагательное», которое вовсе не обязаны появлятьса в обычном математическом языке. Ввиду этого логические парадоксы представляют собой куда ббльшую угрозу спокойствию духа математиков» чем парадоксы семантические. Анализ парадоксов привел к различным планам их устранения. Все эти планы предлагают тем или иным путем ограничивать «наивные» понятия, участвующие в выводе этих парадоксов. Рассел обратил внимание на то, что во всех этих парадоксах имеет место самоотнесение понятий. Он предложил снабдить каждый объект некоторым неотрицательным целым числом — «типом» этого объекта. После этого высказывание «х есть элемент множества у» должно считаться осмысленным тогда и только тогда, когда тип у на единицу больше типа jc Этот подход, систематически развитый Расселом и Уайтхедом [1910—1913] в так называемую теорию типов, приводит к цели, когда речь идет об устранении известных парадоксов *), однако он громоздок в практическом применении и имеет также некоторые другие недостатки. Другое острие критики логических парадоксов было нацелено на содержащееся в них допущение, состоящее в том, что для любого свойства Р (х) существует соответствующее множество всех элементов х, обладающих свойством Р(х). Стоит лишь отвергнуть это допущение, и логические парадоксы становятся невозможными **). Однако при этом необходимо принять некоторые новые постулаты для того, чтобы мы могли, опираясь на них, доказать существование таких множеств, в которых повседневно нуждаются практически работающие математики. Первая такая аксиоматическая теория множеств была построена Цермело [1908]. В главе 4 мы рассмотрим одну аксиоматическую теорию множеств, которая ведет свое происхождение от системы Цермело (с некоторыми изменениями, принадлежащими фон Нейману, Р. Робинсону, Бер- найсу и Гёделю). Существуют также различные смешанные теории, соединяющие в себе те или иные черты теории типов и аксиоматической теории множеств; примером теории такого рода может служить система NF Куайна (см. Рос сер [1953]). Более глубокое истолкование парадоксов было предпринято Брау- эром и его интуиционистской школой (см. Рейтинг [1956]). Интуици- онисты отказываются признавать универсальный характер некоторых основных законов логики таких, например, как закон исключенного третьего: Р или не Р. Этот закон, утверждают «ни, верен для конечных *) Так, например, парадокс Рассела зависит от существования множества Л всех множеств, которые не являются элементами самих себя. Так как, согласно теории типов, бессмысленно говорить .о том, что какое-то множество принадлежит самому себе, то такого множества не может быт,ь. **) Парадокс Рассела в таком случде доказывает, что не существует множества А всех множеств, коюрые не принадлежат самим cqtfe в качестве эде- мента, а парадоксы Кантора и Бурали-Форти показывают, ,чго не суще.ствуел: универсального множества и нг существует множества scqx ординальных чисел. Семантические же парадоксы теперь не могут быть даже сформулированы, лоскольк) они включаю! в себя понятия, не выразимые внутри этой системы
ВВЕДЕНИЕ 11 множеств, но нет никаких оснований распространять его без всяких ограничений на все множества. Точно так же, говорят интуционисты, необоснованным является заключение, что утверждение «существует объект х такой, что не Р(х)» следует из утверждения «неверно, что для любого х Р(х)». По их мнению, мы только тогда можем согласиться с утверждением существования объекта* обладающего тем или иным свойством, когда мы владеем методом построения (или отыскания) такого объекта. Разумеется, если мы подчинимся суровым интуционист- ским требованиям, то парадоксы станут невыводимыми (или даже лишенными смысла), но, увы, в таком же положении тогда окажутся и многие столь любимые теоремы повседневной математики, и по этой причине интуционизм нашел себе мало приверженцев среди математиков. Какой бы мы, однако, не избрали подход к проблеме парадоксов, следует сперва исследовать язык логики и математики, чтобы разобраться в том, какие в ней могут быть употреблены символы, как из этих символов составляются термы, формулы, утверждения и доказательства, что может и что не может быть доказано, если исходить из тех или иных аксиом и правил вывода. В этом состоит одна из задач математической логики, и пока это не сделано, нет и базы для сопоставления соперничающих точек зрения на основания логики и математики. Глубокие и опустошительные результаты Гёделя, Тарского, Чёрча, Россера, Клини и многих других были богатой наградой за вложенный труд и завоевали для математической логики положение независимой ветви математики. Для тех, кто является абсолютным новичком, мы теперь кратко изложим некоторые основные понятия и факты, используемые в книге. Впрочем, мы рекомендуем читателю опустить сейчас этот обзор и лишь обращаться к нему в дальнейшем по мере необходимости для справок. Множество есть собрание объектов *). Объекты этого собрания называются элементами множества. Мы будем писать «х^у» вместо утверждения, что «х есть элемент у». (В том же смысле мы будем понимать высказывания «л; принадлежит у» и «у содержит х».) Отрицание утверждения «х ^ у» будет обозначаться через «х ф у». Запись «х <= у» означает, что каждый элемент множества х является также элементом множества у или, другими словами, что х есть подмножество у (или х включено в у).- Желая выразить тот факт, что t и s обозначают один и тот же объект, мы будем писать «t = s». *) Мы здесь не будем уточнять, какие собрания объектов являются множествами. Однако мы будем избегать употребления таких связанных с понятием множества идей и процедур, которые могут привести к парадоксам. Все излагаемые здесь результаты могут быть формализованы в аксиоматической теории множеств, рассмотренной в главе 4. Термин «класс» иногда употреб* ляют как синоним термина «множество», но мы его здесь избегаем, поскольку он в главе 4 употребляется в другом значении. Если свойство Р(х) определяет некоторое множество, то это множество часто обозначают через {х\Р (х)} ИДИ Х(Р(х)).
12 ВВЕДЕНИЕ Как обычно, «t Ф- s» означает отрицание «t = s». Для множеств х hj/мы говорим, что х=у в том и только в том случае, если х ^у и у ^х9 т. е. в том и только в том случае, если х и у имеют одни и те же элементы. Если хя^у, но хфу> то мы говорим, что х есть собственное подмножество у, и пишем хау. Объединение х[]у множеств х и у определяется как множество всех объектов, являющихся элементами хотя бы одного из множеств х и у. Отсюда сразу следует, что х[}х = х, х\)у =у [)xu(x\Jy)\Jz = =-^ U (^ U ^)- Пересечение х(]у есть множество элементов, принадлежащих и х и у. Нетрудно проверить, что х П х = х, х(]у=у(]х, х()(Упг)=(х()у)[)г, x[)(y[)z) = (x(] у)[)(х(] z) и x\}(y[\z) = = {x\]y)[\(x\]z). Относительным дополнением х — у называется множество тех элементов х, которые не являются элементами у. Мы постулируем также существование пустого множества 0, т. е. множества, которое вовсе не имеет элементов. Легко видеть, что х f| 0 = 0, х [} 0 = = х, х—0 = х, х — х = 0. Два множества х и у называются непересекающимися, если х[)у = 0. Пусть даны какие-нибудь объекты bly ..., bk\ множество, элементами которого являются все эти объекты и только они, обозначается через {Ьъ ..., bk}. В частности, {х, у} есть множество с двумя элементами х и у; если при этом хфу, то {х, у) называется неупорядоченной парой (или просто парой) объектов хну. Множество {х, х\ обозначается также через [х\ и называется одноэлементным множеством с элементом х. Заметим, что {х, у) = {у, х}. Через (Ьь ..., Ьп) мы обозначаем упорядоченную п-ку объектов bh ..., Ьп. Основное свойство упорядоченных я-ок состоит в том, что (bh ..., bn) = (ch ..., сп) тогда и только тогда, когда bi = ch ..., bn = cn. Так, в частности, (ръ Ьъ) = (Ь<ъ, bi) в том и только в том случае, если &1 = £2. Упорядоченные двойки называются упорядоченными парами. Если X — множество и п — целое положительное число, то через Хп мы обозначаем множество всех упорядоченных л-ок (bh ..., bn) элементов bh ..., bn множества Х\ при этом мы условимся под Xх понимать X. Хп называется п-кратным декартовым произведением X на себя или п-й декартовой степенью множества X. Если Y и Z—множества, то Y X Z означает множество всех таких упорядоченных пар {у, z), что j/sFh 2eZ. Y X Z называется декартовым произведением множеств Y и Z. Под п-местным отношением (отношением с п аргументами) на множестве X мы понимаем всякое подмножество множества Хп, т. е. всякое множество я-ок элементов X. Например, 3-местное отношение «между» для точек на прямой представляет собой множество всех троек (х, у, z) таких, что точка х лежит между точками у и z. Двуместное отношение называют также бинарным отношением; например, бинарное отношение отцовства на множестве всех людей есть множество всех упорядоченных пар (х, у) таких, что х и у — люди и х есть отец у. Одноместное отношение на X есть подмножество X и называется свойством на X.
ВВЕДЕНИЕ 13 Пусть R—бинарное отношение на множестве X. Областью определения R называется множество всех у таких, что (у, z)gR хотя бы при одном z\ множеством значений R называется множество всех z таких, что (уу z) e /? хотя бы при одном у\ наконец, объединение области определения и множества значений R называется полем отношения R. Отношение Z?"1, обратное к R, определяется как множество всех упорядоченных пар (у, z) таких, что (z, у) е R. Так, например, область определения отношения < на множестве со всех неотрицательных целых чисел есть со, множеством значений этого отношения служит со — {0}, а обратным отношением является отношение >. Замечание. Часто вместо (х, у) е R пишут xRy. Так, в приведенном примере мы обычно пишем х<Су вместо (х, у) е <С Бинарное отношение R называется рефлексивным, если xRx для любого х из поля отношения R, симметричным, если из xRy следует yRx, и транзитивным, если из xRy и yRz следует xRz. Например, отношение ^ на множестве целых чисел рефлексивно и транзи- тивно, но не симметрично. Отношение «иметь по крайней мере одного общего родителя» на множестве людей рефлексивно и симметрично, но не транзитивно. Бинарное рефлексивное, симметричное и транзитивное отношение называется отношением эквивалентности. Примеры отношений эквивалентности: (1) отношение тождества 1Х на произвольном множестве X, состоящее из всех пар (у, у), где у е X; (2) отношение параллельности между прямыми в плоскости; (3) отношение х=.у (mod#), означающее, что х и у целые и х — у делится на данное фиксированное целое положительное число п\ (4) отношение между прямолинейными направленными отрезками в трехмерном пространстве, имеющее место тогда и только тогда, когда отрезки имеют одинаковые направление и длину; (5) отношение конгруэнтности на множестве треугольников в плоскости; (6) отношение подобия на множестве треугольников в плоскости. Пусть дано отношение эквивалентности R на множестве X и некоторый элемент у множества X. Определим [у] как множество всех таких z из Ху для которых yRz. Множество [у] называется классом R-экбивалентноети, определяемым элементом у. Легко видеть, что [у] = [,г] тогда и только тогда, когда yRzy и если \у] Ф [z], то [у] П [z] = = 0, т. е. различные классы /^-эквивалентности не имеют общих элементов. Таким образом, X полностью разбивается на классы /?-эквива- лентности В примере (1) классами эквивалентности являются одноэлементные множества {у}, где jel В примере (2) классы эквивалентности могут рассматриваться как направления в данной плоскости. В примере (3) имеется п классов эквивалентности, k-ft класс эквивалентности, (k = 0, 1, ..., п—1) состоит из всех тех чисел, которые при делении на п дают в остатке k. В (4) классы эквивалентности суть трехмерные векторы. Бинарное отношение / называется функцией, если из (х, у) е / и (х, z) e / следует y = z. Для любого х из области определении
14 ВВЕДЕНИИ функции / существует единственный элемент у такой, что (х, у) е/; этот элемент у обозначается через f(x). Если х принадлежит области определения /, то говорят, что f(x) определено. Если / есть функция с областью определения X и множеством значений Y, то говорят, что / отображает X на Y. Если / отображает X на У и У s 2, то говорят, что / отображает X в Z. Например, если f(x) = 2x для любого целого х, то мы можем сказать, что / отображает множество всех целых чисел на множество всех четных чисел и что / отображает множество всех целых чисел в множество всех целых чисел. Функция, область определения которой состоит из я-ок, называется функцией от п аргументов. {Всюду определенной) функцией от п аргументов на множестве X называется всякая функция, у которой область определения совпадает с Хп. Обычно вместо f((xh ..., хп)) мы пишем f(xh ..., хп). Частичной функцией от п аргументов на множестве X называется всякая функция, областью определения которой служит какое-нибудь подмножество Хп. Например, обычное деление является частичной, но не всюду определенной, функцией от двух аргументов на множестве целых чисел (поскольку деление на нуль не определено). Если / есть функция с областью определения X и множеством значе,- ний К, то ограничением fz функции f множеством Z называется функция / fl (Zx У). Очевидно, fz(u) = v тогда и только тогда, когда hgZ и f(u) = v. Образом множества Z при отображении посредством функции f называется множество значений функции fz. Прообразом множества W при отображении посредством функции / называется множество всех тех элементов и из области определения функции /, для которых /(и) е W. Говорят что функция / отображает множество X на множество (в множество) У, если X есть подмножество области определения /, а образом X при отображении посредством / является множество Y (подмножество множества Y). Под п-местной операцией (или операцией с п аргументами) на множестве X мы понимаем функцию, отображающую Хп в X. Например, обычное сложение является бинарной (т. е. двуместной) операцией на множестве натуральных чисел {0, 1, 2, ...}. Обычное вычитание не является бинарной операцией на множестве натуральных чисел, однако является бинарной операцией на множестве всех целых чисел. Если / и g— функции, то композиция fog этих функций (иногда обозначаемая также через fg) есть, по определению, такая функция, что (f* g) (x)=f (g (x))> (f°g)(x) определено тогда и только тогда, когда определены g(x) и f(g(x)). Например, если g(x) = x* и f(x) = x-\- 1, то (f*g)(x) = x*-\-\ и (g*f)(x)=a(x-\- l)\ Или, например, если g(x) = = — х для каждого вещественного числа х, a f(x) = }fx для каждого неотрицательного вещественного х, то (f°g)(x) определено только для лг^О и (fog)(x) = yr—х. Функция /, для которой из f(x)=f(y) следует х=у} называется взаимно однозначной функцией (или (1-1)- функцией).
ВВЕДЕНИЕ 15 Примеры. (1) Отношение тождества 1Х на множестве X есть взаимно однозначная функция; (2) взаимно однозначной является функция f(x) = 2x, где х — произвольное целое число; (3) функция f(x) = x*, где х — произвольное целое число, не является взаимно однозначной, поскольку /(—1)=/(1). Заметим, что функция / будет взаимно однозначной тогда и только тогда, когда обратное отношение f~l есть функция. Если X есть область определения, a У—множество значений взаимно однозначной функции /, то о функции / говорят, что она есть взаимно однозначное соответствие (или (\Л)-соответствие) между множествами X и У; при этом /"* оказывается взаимно однозначным соответствием между У и X, (/~1о/) = /х и (fbf~1) = IY. Если / есть взаимно однозначное соответствие между X и У, a g есть взаимно однозначное соответствие между У и Z, то g°f есть взаимно однозначное соответствие между X и Z. Множества X и У называются равномощными (сокращенно Хо^ У), если существует взаимно однозначное соответствие между X и Y. Очевидно, Х~Х, из Х~ Y следует У^^иизЛ'с^У и Yc^lZ следует Xc^Z. Можно доказать (см. теорему Шредера — Берн- штейна, стр. 201), что если X~Yt^Y и Y~Xi^X, то Х~Г. Если Хс^. У, то иногда говорят, что X и У имеют одну и ту же мощность (или, иначе, имеют одно и то же кардинальное число), а если X равномощно с некоторым подмножеством У, но при этом У не равно- мощно ни с каким подмножеством X, то говорят, что мощность (кардинальное число) X меньше мощности (кардинального числа) У *). Множество X называется счетным, если оно равномощно с множеством положительных целых чисел. Говорят также, что счетное множество имеет мощность ^0> а всякое множество, равномощное с множеством всех подмножеств какого-нибудь счетного множества, имеет мощность 2 ° (или имеет мощность континуума). Множество называется конечным, если оно пустое или если оно равномощно с множеством всех целых положительных чисел {1, 2,...,/г}, не превосходящих какого- нибудь целого положительного числа п. Множество, не являющееся конечным, называется бесконечным. Множество называется не более чем счетным, если оно конечно или счетно. Очевидно, всякое подмножество счетного множества не более чем счетно. Счетной последовательностью называется всякая функция s, областью определения которой служит множество целых положительных чисел. Обычно вместо 5 (п) пишут sn. Конечной последовательностью называется всякая функция, для которой существует такое целое положительное п, что ее область определения совпадает с множеством {1, 2, ..., п}. *) Мощность множества X можно определять как собрание [X] всех множеств, равномощных с X. При этом в одних системах теории множеств такое [X] может не существовать, в то время как в других системах (см. стр. 201 — —202) всегда существует, но может не являться множеством. Для кардинальных чисел [X] и [У] отношение [Х]^[У] может быть определено как утверждение тою, что X равномощно с некоторым подмножеством У,
16 ВВЕДЕНИЕ Пусть Р (х> уъ ..., yk) — какое-нибудь отношение на множестве неотрицательных целых чисел. В частности, Р может содержать только одну переменную х, т. е. оно может быть свойством. Если Р(О, уи ... ...,yk) выполнено и для любого п из Р(л, у\,...,yk) следует Р(п-(- 1, Уъ • • • > У kit то Р (х, _уь ..., yk) выполнено для всех целых неотрицательных х (принцип математической индукции). При применении этого принципа для доказательства того, что при любом п из Р(я, yh ..., yk) следует Р (п -\- 1, уь ..., yk), обычно допускают Р (п, уь ..., yk) и затем выводят Р (п -(- 1, уъ ..., з'л); в таком выводе Р (п, уъ ..., j/ft) называется индуктивным предположением. Если отношение Р содержит переменные Уъ • • • > Уь отличные от х, то говорят, что доказательство утверждения «при любом х Р (х)» ведется индукцией по х. Такой же принцип индукции справедлив для множества целых чисел, ббльших заданного числа /. Пример. Чтобы с помощью математической индукции доказать, что сумма первых п нечетных чисел, т. е. 1 -\- 3-{- 5-f-...-\-(2п—1), равна п\ доказывают сначала, что 1 = I2 (т. е. Р(1)), а затем доказывают, что из 1 + 3 + 5-t-...-t-(2/z— 1) = л2 следует 1 + 3 + 5 + .. . + (2л— 1)+ -^-(2п-\-\) = (п-\-\f (т. е. что из Р (п) следует Р(п-\-\)). Из принципа математической индукции можно вывести следующий принцип полной индукции: если для любого неотрицательного целого х из предположения, что Р (и, уъ ..., yk) верно при всех и, меньших х> следует верность Р (х, уь ..., yk\ то Р (х> уъ ..., yk) верно при всех неотрицательных целых х. (Упражнение. С помощью принципа полной индукции доказать, что каждое целое число, большее единицы, делится на некоторое простое число.) Транзитивное бинарное отношение /?, для которого xRx ложно при любом х из поля Ry называется частичным упорядочением. (Если R есть частичное упорядочение, то отношение R\ представляющее собой объединение R и множества всех упорядоченных пар (х, х), где х принадлежит полю R, называется рефлексивным частичным упорядочением; термин «частичное упорядочение» употребляется в литературе как в указанном выше смысле, так и в смысле рефлексивного частичного упорядочения. Заметим, что (xRy и yRx) невозможно, если R — частичное упорядочение. Если R — рефлексивное частичное упорядочение, то из (xRy и yRx) следует х=у) (Рефлексивным) полным упорядочением (или просто упорядочением) называется такое (рефлексивное) частичное упорядочение, при котором для любых х и у из поля R либо х=у, либо xRy, либо yRx. Примеры. (1) Отношение < на множестве целых чисел является полным упорядочением, а отношение ^ — рефлексивным полным упорядочением; (2) отношение cz на множестве всех подмножеств множества положительных целых чисел является частичным упорядочением, но не полным упорядочением, а отношение 9= на том же множестве является рефлексивным частичным упорядочением, но не рефлексивным полным упорядочением. Пусть С—поле отношения R и В — подмножество С:
ВВЕДЕНИЕ 17 элемент у из В называется R-наименыиим (или наименьшим относительно отношения R) элементом в В, если для любого элемента z из В, отличного от у, справедливо yRz. Полное упорядочение называется вполне упорядочением (или вполне упорядочивающим отношением), если всякое непустое подмножество поля R имеет /^-наименьший элемент. Примеры. (1) Отношение < на множестве неотрицательных целых чисел является вполне упорядочением; (2) отношение < на множестве неотрицательных рациональных чисел является полным упорядочением, но не вполне упорядочением; (3) отношение < на множестве всех целых чисел является полным упорядочением, но не вполне упорядочением. Каждому вполне упорядочению R с полем X соответствует следующий принцип полной индукции: если свойство Р таково, что для любого элемента и множества X из того, что свойством Р обладает всякий элемент z Множества X, для которого zRu, следует, что и обладает свойством Р, то свойством Р обладают все элементы из X. Если множество X бесконечно, то доказательство, использующее этот принцип, называется доказательством по трансфинитной индукции. Говорят, что множество X может быть вполне упорядочено, если существует вполне упорядочение, поле которого включает X. В современной математике применяется допущение, носящее название принципа вполне упорядочения, согласно которому всякое множество может быть вполне упорядочено. По вопросу о законности этого принципа возникла, однако, серьезная полемика. Принцип вполне упорядочения эквивалентен (в обычной аксиоматике теории множеств) аксиоме выбора {мультипликативной аксиоме): каково бы ни было множество X непустых, попарно непересекающихся множеств, существует множество У (называемое множеством выбора), которое содержит в точности по одному элементу из каждого множества, являющегося элементом Л'. Пусть В—непустое множество, /—функция, отображающая В в В, и g— функция, отображающая В* в В. Условимся писать х' вместо f(x) и х П у вместо g(x, у). Назовем теперь упорядоченную тройку (B,f, g) булевой алгеброй, если для любых х, у и z из В выполнены условия: 0) х П У=У П х; (") х П (У П г) = (х (} у) П г\ (Hi) л; П y' = z П z' тогда и только тогда, когда х {] у = х. Для (дг'ПУУ введем обозначение х [] у и будем писать х^у вместо х П у = х. Легко показать, что z [\ zr = w [\wr для любых w, z из В\ будем обозначать значение z [\ zr через 0. (Не следует смешивать введенные сейчас символы f|, U, 0 с соответствующими символами, применяемыми в теории множеств.) Введем, наконец, символ 1 для обозначения О'. Мы теперь имеем: z (J z' = 1 для любого г из i5, < является рефлексивным частичным упорядочением и (В, f, |J) есть булева алгебра. Идеалом в (В, /, g) называется всякое непустое подмножество J множества В такое, что: (1) если х е J и у е J, то х [) у е J, и (2) если х s~J и у^ В, то х (] у ^J. Очевидно, {0} и В — идеалы. Всякий идеал,
18 ВВЕДЕНИЕ отличный от В, называется собственным идеалом. Собственный идеал называется максимальным идеалом, если он не содержится ни в каком другом собственном идеале. Можно показать, что собственный идеал J является максимальным тогда и только тогда, когда для любого и из В либо «eJ, либо uF e J. Из принципа вполне упорядочения (или из аксиомы выбора) вытекает, что каждая булева алгебра содержит максимальный идеал или, что эквивалентно, всякий собственный идеал включен в некоторый максимальный идеал. Пример. Пусть В есть множество всех подмножеств некоторого множества X, для Ке5 пусть У = Х— У, а для У и Z из В пусть У О Z означает обычное теоретико-множественное пересечение множеств У и Z. Тогда упорядоченная тройка (В, ', {]) оказывается булевой алгеброй. Роль 0 в В играет пустое множество 0, а 1 есть X. Пусть и — произвольный элемент множества X и Ju — множество всех подмножеств X, которые не содержат и. Тогда Ju есть максимальный идеал. Более детальное изложение теории булевых алгебр см., например, у Сикорского [1960].
Глава 1 Исчисление высказываний § 1. Пропозициональные связки. Истинностные таблицы Из высказываний путем соединения их различными способами можно составлять новые, более сложные высказывания. Мы будем рассматривать одни только истинностно-функциональные комбинации, в которых истинность или ложность новых высказываний определяется истинностью или ложностью составляющих высказываний. Отрицание является одной из простейших операций над высказываниями. Хотя в разговорном языке то или иное высказывание может быть отрицаемо многими способами, мы здесь будем это делать одним способом, помещая знак отрицания ~| перед всем высказыванием. Так, если А есть высказывание, то "]А обозначает отрицание А и читается «не А». Истинностно-функциональный характер отрицания становится ясным из рассмотрения следующей истинностной таблицы: А ПА и л л и Когда А истинно, ~}А ложно; когда А ложно, ~]А истинно. Буквы И и Л мы употребляем для обозначения истинностных значений: «истина» и «ложь». Другой распространенной истинностно-функциональной операцией является конъюнкция: «и». Конъюнкция высказываний А и В будет обозначаться через Л&Д она имеет следующую истинностную таблицу: А В А&В И И И лил И Л Л Л Л Л Высказывание А&В истинно тогда и только тогда, когда истинны оба высказывания А и В. Высказывания Аи В называются конъюнктивными членами или членами конъюнкции А&В. Заметим, что в истинностной таблице для конъюнкции имеются четыре строки соответственно числу возможных распределений истинностных значений для А и В.
20 ГЛ. 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ В разговорных языках связка «или» употребляется в двух различных смыслах — разделительном и соединительном. В первом случае утверждение «Л или В» означает, что утверждается одно и только одно из высказываний А и В, а во втором случае — хотя бы одно из этих высказываний. Для связки «или» в этом втором, соединительном смысле мы и введем специальный знак: \J. Эта операция имеет следующую истинностную таблицу: А И Л И Л в и и л л А\1 В И И И Л Таким образом, А\] В ложно тогда и только тогда, когда и А и В ложны. Высказывание «А V В» называется дизъюнкцией с дизъюнктивными членами А и В. Упражнение Построить истинностную таблицу для «или» в разделительном смысле. Другой важной истинностно-функциональной операцией является следование: «если А, то В». Смысл обычного употребления здесь неясен. Разумеется, высказывание «если Л, то В» ложно, когда посылка А истинна, а заключение В ложно. Однако в других случаях, при обычном употреблении этой связки, мы не имеем вполне определенного истинностного значения. Неясно, например, истинными или ложными следует считать высказывания: (1) Если 1 —|— 1 = 2, то Париж есть столица Франции. (2) Если 1 — 1 ф 2, то Париж есть столица Франции. (3) Если 1 —|— 1 =т^= 2, то Рим есть столица Франции. Смысл их неясен, поскольку мы привыкли к тому, что между посылкой и заключением имеется определенная (обычно причинная) связь. Мы условимся считать, что «если Д то В» ложно тогда и только тогда, когда истинно А и ложно В. Таким образом, высказывания (1) — (3) будут считаться истинными. Обозначим «если А, то В» через A zd В. Это последнее выражение называется импликацией. Вот истинностная таблица для и>: А В А-=>В ИИ И Л и л и л л и л и
§ 1. ПРОПОЗИЦИОНАЛЬНЫЕ СВЯЗКИ ИСТИННОСТНЫЕ ТАБЛИЦЫ 21 Такое уточнение смысла высказывания «если Л, то Въ не противоречит обычной практике, скорее даже ее расширяет *). Известным оправданием приведенной истинностной таблицы для id может служить наше желание, чтобы высказывание «если Л и В, то В» было всегда истинным. Так, случай, когда А и В истинны, оправдывает первую строку в нашей истинностной таблице для id, поскольку «Л и В» и В оба истинны. Если А ложно и В истинно, то «А и В» ложно, в то время как В истинно. Это соответствует второй строке таблицы. Наконец, если А ложно и В ложно, то «Л и В» ложно и В ложно. Это дает нам четвертую строку таблицы. Еще больше уверенности в разумности нашего определения придает нам смысл таких предложений, как, например: «Для любого х, если х есть нечетное целое положительное число, то х1 есть нечетное целое положительное число». Здесь утверждается, что для любого х предложение «если х есть нечетное целое положительное число, то х2 есть нечетное целое положительное число» истинно. При этом мы, разумеется, не хотим рассматривать как контрпримеры к нашему общему утверждению случаи, когда х не есть нечетное целое положительное число. Это обеспечивается второй и четвертой строками нашей таблицы истинности. Наконец, каждый случай, когда х и х* суть нечетные целые положительные числа, подтверждает наше общее утверждение. Это соответствует первой строке нашей таблицы. Обозначим выражение «Л тогда и только тогда, когда Б» через «Л = В». Такое выражение называется эквивалентностью. Очевидно, Л = В истинно тогда и только тогда, когда Л и В имеют одно и то же истинностное значение. Поэтому мы имеем следующую истинностную таблицу: Л В А = В ИИ И Л и л и л л л л и *) Иногда встречается некоторое не истинностно-функциональное понимание высказывания «если Л, то /?», связанное с законами причинности. Высказывание «если этот кусок железа положен в воду в момент времени t, то железо растворится» рассматривается как ложное даже в том случае, если кусок железа не положен в воду в момент времени t, т. е. даже если посылка ложна. Другое не истинностно-функциональное употребление связки «если ..., то...» имеет место в так называемых контрфактических условных предложениях, таких как содержательно ложное высказывание «если , сэр Вальтер Скотт не написал ни одного романа, то не было гражданской войны в США». При исти шо- стно-функциональном подходе это высказывание следовало бы признать истинным ввиду ложности посылки. К счастью, математика и логика не нуждаются в законах причинности и контрфактических условных предложениях. Подробнее об условных предложениях и других связках см. К у айн [1951].
22 ГЛ. 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ Символы ~|, &, V> ZDf = будем называть пропозициональными связками *). Всякое высказывание, построенное при помощи этих связок, имеет некоторое истинностное значение, зависящее от истинностных значений составляющих высказываний. Мы будем применять термин пропозициональная форма для выражений, построенных из пропозициональных букв Л, В, С и т. д. с помощью пропозициональных связок. Точнее: (1) Все пропозициональные буквы (заглавные буквы латинского алфавита) и такие же буквы с числовыми индексами **)) суть пропозициональные формы. (2) Если os£ и S3 — пропозициональные формы, то ("*] &f), {&£ & S3\ {&# У <з®), (e^ZDo®) и (е^ = <з$?) — тоже пропозициональные формы. (3) Только те выражения являются пропозициональными формами, для которых это следует из (1) и (2) ***). Каждому распределению истинностных значений пропозициональных букв, входящих в ту или иную пропозициональную форму, соответствует, согласно истинностным таблицам для пропозициональных связок, некоторое истинностное значение этой пропозициональной формы. Таким образом, всякая пропозициональная форма определяет некоторую истинностную функцию, которая графически может быть представлена истинностной таблицей для этой пропозициональной формы. Так, например, пропозициональная форма (((1 А) у В) id С) имеет следующую истинностную таблицу: А В С (~]А) (f| А) у В) ((("1 А) у В) zd С) И И И и л л и л *) При введении новых терминов мы будем избегать применения кавычек, «ели это не будет вызывать недоразумений. Строго говоря, в данном предложении в кавычки следовало взять каждую связку (см. К у айн [1951], стр. 23 — 27). **) Например Аи Л2, Л17, Въи С2> ••• ***) Иначе это определение можно сформулировать следующим образом: £f есть пропозициональная форма тогда и только тогда, когда существует такая конечная последовательность q^i» q^k .••» orfm что oSlп — о и для каждого i (1 ^ i *^n) ojgi является или буквой, или отрицанием, конъюнкцией, дизъюнкцией, импликацией или эквивалентностью предшествующих в этой последовательности выражений. Заметим, что рукописные латинские буквы @^, S3, ^ и т. д. употребляются нами для произвольных выражений, тогда как печатные латинские буквы применяются лишь как пропозициональные буквы. И л и л и и л и и л л и и л л и и и и л л л л л и л и л и л и и и л и и и л и
§ 1. ПРОПОЗИЦИОНАЛЬНЫЕ СВЯЗКИ ИСТИННОСТНЫЕ ТАБЛИЦЫ 23 Здесь каждая строка содержит некоторое распределение истинностных значений для букв Л, Ву С и соответствующие истинностные значения, принимаемые различными пропозициональными формами, которые возникают при построении формы (((~| A) \J В) zd С). Для формы ((Л = B)zd (О Л) & В)) истинностная таблица будет следующая: А В ( И И л и и л л л и л л и DCM) л и л и (0Л)&£) ( л и л л (Л = B)ZD л и и л Если в пропозициональной форме имеется п различных букв, то тогда возможны 2п различных распределений истинностных значений для букв и, следовательно, истинностная таблица для такой формы содержит 2п строк. Упражнение Построить истинностные таблицы для пропозициональных форм ((Л п> В) V V (~| Л)) и ((Л т5 (В =э С)) z> ((Л => В) =э (В =э С))). Составление истинностной таблицы можно сократить следующим образом. Выпишем форму, для которой надо составить истинностную таблицу. Для каждого распределения истинностных значений пропозициональных букв, входящих в данную форму, под всеми вхождениями каждой из этих букв подпишем соответствующее истинностное значение. Затем шаг за шагом под каждой пропозициональной связкой будем выписывать истинностные значения той составляющей пропозициональной формы, для которой эта связка— главная *). Например, для ((Л = £):э ZD (("1 Л) & В)) мы получаем ((Л = В) zd ((1 Л) & В)) ииил лили ЛЛИИ ИЛИИ илли лилл лилл иллл Упражнения 1. Написать сокращенные истинностные таблицы для ((ЛэВ)&Л) и ((Л V 2. Записать следующие высказывания в виде пропозициональные форм, употребляя пропозициональные буквы для обозначения атомарны? *) Главной связкой пропозициональной формы называется та связка, которая при построении формы применяется последней.
24 гл. i. исчисление высказываний высказываний, т. е. таких высказываний, которые уже не построены из каких- либо других высказываний. (a) Если мистер Джонс счастлив, то миссис Джонс несчастлива, и если мистер Джонс несчастлив, то миссис Джонс счастлива. (b) Или Сэм пойдет на вечеринку, и Макс не пойдет на нее; или Сэм не пойдет на вечеринку, и Макс отлично проведет время. (c) Необходимое и достаточное условие счастья для шейха состоит в том, чтобы иметь вино, женщин и услаждать свой слух пением. (d) Фиорелло ходит в кино только в том случае, когда там показывают комедию. (e) Для того чтобы х было нечетным, достаточно, чтобы х было простым. (f) Необходимым условием сходимости последовательности s является ограниченность s. (g) Взятку платят тогда и только тогда, когда товар доставлен. (h) «Гиганты» выиграют приз, если «Хитрецы» сегодня не выиграют, (i) Если х положительно, то х2 положительно. § 2. Тавтологии Истинностной функцией от п аргументов называется всякая функция от п аргументов, принимающая истинностные значения И или Л, если аргументы ее пробегают те же значения. Как мы видели, всякая пропозициональная форма определяет некоторую истинностную функцию *). Пропозициональная форма, которая истинна независимо от того, какие значения принимают встречающиеся в ней пропозициональные буквы, называется тавтологией. Пропозициональная форма является тавтологией тогда и только тогда, когда соответствующая истинностная функция принимает только значение И, или, что то же, если в ее таб- *) Для большей точности следовало бы пересчитать все пропозициональные буквы, например, в порядке Л, В, ..., Z, А1у Ви ..., Zu Л2, ... Если теперь некоторая пропозициональная форма содержит ^-ю, ..., /л-ю пропозициональные буквы из этого пересчета (где it < ...</„), то соответствующая истинностная функция должна иметь своими аргументами х. , ..., xf. в том же порядке, при этом X; соответствует i .-й пропозициональной букве. Например, (Л и В) порождает истинностную функцию Aj А2 1 \А1> А8/ И и л и в то время как (В zd А) порождает истинностную функцию v -V i /v v \ Aj Аз 1 \л-1} Ag^ И л и л и и л л и л и и и л л и л и и
$ 2 ТАВТОЛОГИИ 25 лице истинности столбец под самой пропозициональной формой состоит только из букв И. Если (о/£ иэ <£Щ является тавтологией, то говорят, что о/1 логически влечет Sd или что <&® является логическим следствием о/1 (в исчислении высказываний). Если {оЛ' = 33) есть тавтология, то говорят, что orf и М логически эквивалентны (в исчислении высказываний) *). Примерами тавтологий являются (Л \J ("| Л)) («закон исключенного третьего»), (~1 (Л & ("1 Л))) и (A se (I (~| А))). Отметим также, что (Л & В) логически влечет Л, (Л & (Л id В)) логически влечет Ву а (Л id В) и ((П Л) V В) логически эквивалентны. Истинностные таблицы дают нам эффективную процедуру для решения вопроса о том, является ли данная пропозициональная форма тавтологией. Упражнения 1. Определить, являются ли следующие пропозициональные формы тавтологиями: (a) (((Л => Я) => £) =э В); (b) ((А = В) = (А = (В=зА))). 2. Доказать или опровергнуть: (a) (Л = £) логически влечет (A id В); (b) (("] А) V В) логически эквивалентно ((~| В) V Л). 3. Показать, что q/£ и SB логически эквивалентны тогда и только тогда, когда в соответствующих истинностных таблицах столбцы под q/£ и под $& совпадают. Пропозициональная форма, которая ложна при всех возможных истинностных значениях ее пропозициональных букв, называется противоречием. Истинностная таблица для такой формы имеет в столбце под этой формой одни только буквы Л. Пример. (А = С\А)). А -\А (Л = ПЛ)) ИЛ Л ли л Другим примером противоречия является (Л & (~| Л)). Заметим, что пропозициональная форма &£ является тавтологией тогда и только тогда, когда ("] <з^) есть противоречие. Высказывание (в каком-нибудь естественном языке, вроде русского, или в какой-либо формальной теор-ии **)), которое получается из какой- либо тавтологии посредством подстановки высказываний вместо пропозициональных букв, при условии, что вхождения одной и той же буквы *) В дальнейшем в этой главе мы будем опускать участвующие в определениях слова «в исчислении высказываний». **) Под формальной теорией мы понимаем всякий искусственный язык, в котором точно описываются понятия «осмысленного выражения», аксиомы и правила вывода; см. стр. 36 — 37.
26 ГЛ 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ замещаются одним и тем же высказыванием, называется логически истинным (в исчислении высказываний). О таком высказывании можно сказать, что оно истинно уже в силу одной только своей функционально- истинностной структуры. Примером может служить предложение русского языка «если идет дождь или идет снег, и не идет снег, то идет дождь», которое можно получить подстановкой в тавтологию (((А \/ В) & & (1 В)) zd А). Высказывание, которое можно получить с помощью подстановки в противоречие, называется логически ложным (в исчислении высказываний). Мы теперь установим несколько более общих фактов о тавтологиях. Предложение 1.1. Если ofl и (о/£ idSB) — тавтологии, то SB — тавтология. Доказательство. Пусть orf и (orf id SB) — тавтологии. Допустим, что при некотором распределении истинностных значений для пропозициональных букв, входящих в о?€ и е®, SB принимает значение Л. Поскольку о/£ есть тавтология, то при том же распределении истинностных значений orf принимает значение И. Тогда (orf! id SB) получит значение Л. Это противоречит предположению о том, что (о/£ id SB) есть тавтология. Предложение 1.2. Если &£ есть тавтология, содержащая пропозициональные буквы Аь Л2,..., Ат и SB получается из о/l подстановкой в orf пропозициональных форм о/£ь &£%•.. > о^п вместо Аи Л2,..., Ап соответственно, то SB есть тавтология, т. е. подстановка в тавтологию приводит к тавтологии. Доказательство. Предположим, что о/l есть тавтология, и пусть задано произвольное распределение истинностных значений для пропозициональных букв, входящих в SB. Формы ет^ь о/£ъ ..., &€п примут тогда некоторые значения хь х2,..., хп (каждое х,- есть И или Л); если мы придадим значения хь х2,..., хп соответственно буквам Ah Л2,..., АПУ то результирующее значение &# совпадет с истинностным значением SB при заданном распределении значений букв, входящих в SB. Так как а& есть тавтология, то SB при этом распределении значений своих аргументов примет значение И. Таким образом, SB всегда принимает значение И. Предложение 1.3. Если SBY получается из &£\ подстановкой SB вместо одного или большего числа вхождений orf', то ((&# = <э$?) zd id (s^i = SB{)) есть тавтология', и, следовательно, если orf и SB логически эквивалентны, то оД\ и SBV тоже логически эквивалентны. Доказательство. Рассмотрим произвольное распределение истинностных значений для пропозициональных букв. Если &# и SB имеют при этом распределении противоположные значения, то (<2т£ = сЩ принимает значение Л и тогда ((о^ = SB) id (orf\ = SBfi) принимает значение И. Если же qs£ и SB принимают одно и то же истинностное значение, то одинаковые истинностные значения примут также &#\ и SBh поскольку «$1 отличается от os£\ тем только, что в некоторых местах вместо orf содержит SB. Таким образом, в этом случае (orf = SB) есть И, есть И, а потому и ((о^ = S3)zd (q/?\ = SB$) есть И.
§ 2. ТАВТОЛОГИИ 27 Введем некоторые соглашения о более экономном употреблении скобок в записях формул. Эти соглашения облегчат нам чтение сложных выражений. Во-первых, мы будем опускать в пропозициональной форме внешнюю пару скобок. (В случае пропозициональной буквы этой внешней пары скобок нет по определению.) Во-вторых, если форма содержит вхождения только одной бинарной связки (т. е. id, =, V или &), то для каждого вхождения этой связки опускаются внешние скобки у той из двух форм, соединяемых этим вхождением, которая стоит слева. Примеры. Azd В id AzdC пишется вместо (((A id В) id A) id С), а В\/ В\/ А\/(С\/ А) пишется вместо (((В у В) у А) у (С У А)). В-третьих, договоримся считать связки упорядоченными следующим образом: =, id, у, &, ~| и будем опускать во всякой пропозициональной форме все те пары скобок, без которых возможно восстановление этой формы на основе следующего правила. Каждое вхождение знака "1 относится к наименьшей пропозициональной форме, следующей за ним; после расстановки всех скобок, относящихся ко всем вхождениям знака "|, каждое вхождение знака & связывает наименьшие формы, окружающие это вхождение; затем (т. е. после расстановки всех скобок, относящихся ко всем вхождениям знаков "| и 4) каждое вхождение знака У связывает наименьшие формы, окружающие это вхождение, и подобным же образом для zd и =. При применении этого правила к одной и той же связке мы продвигаемся слева направо. Примеры. В форме А У ~]В :э С = Л скобки восстанавливаются следующими шагами: У )C п качестве упражнения предлагается показать, что П = С= & В у ~] D id В обозначает ((D = С) — ((((Л & D) & В) у О D)) id В)). Однако не всякая форма может быть записана без употребления скобок, Так, например, дальнейшее исключение скобок невозможно для форм Л =) (В id С), 1 (А у В), ASl(Bid С). Упражнения 1. Исключить возможно большее число скобок в формах ((В ЕЕ ((1С) V (Я & Л))) ЕЕ (В ZD В)) (((Л&ПД))&С) V D). 2. Восстанови! ь скобки в формах Сз](Л\/С)&Л = 5 и С z> Az> A ~ = ~]А V В.
28 ГЛ. I. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ 3. Если договориться писать ~|©^> & q/ZSB, V o/ZSB, => q/£SB и = © соответственно вместо ПетЯ, (оЖ &SB), (©^ V е®)> (<з^ => ей?) и (q# = \ то скобки не будут нужны. Например, форма ((~|Л) id (В У ("]£))) запишется теперь как zd ~^А\/ В ~]D. Предлагаем читателю записать по этой системе форму (А\1 ((В &C]D))id А)). Если каждую из связок и>, &, V» == оценить числом +1, каждую пропозициональную букву — числом —1, а связку ~| — нулем, то в этой бесскобочной системе записи произвольное выражение оД будет пропозициональной формой тогда и только тогда,. когда сумма оценок всех вхождений символов в оД равна —1 и сумма оценок всех символов каждого собственного начального отрезка оД неотрицательна. 4. Определить, является ли каждая из следующих форм тавтологией, противоречием или ни тем и ни другим: (a) А = (АУ Л); (b) (Лэ5)з ((В zdC)zd(Azd С)); (c) ((Л id В) & В) id Л; (d) (е) (f) (g) 5. Доказать, что если q/£&SB есть тавтология, то тавтологиями являются оД и SB, и что если Qjg есть тавтология, то &£ \] SB и SS \1 о/? суть тавтологии. 6. Применить предложение 1.2 для случая, когда ^ есть (Л, & Л2) id Au orfi есть В &.D и ©7^2 есть ~|5. 7. Доказать, что каждая из перечисленных пар состоит из логически эквивалентных форм: (а) П(Л У В) и С|Л)&ОЯ); (Ь)П(Л&#) и ("|Л) VHB); (c) Ak(B\J С) и (Л & 5) У (Л & С); (d) Л V (^ & С) и (Л V В) & (Л V С)\ (e) Л V (Л & ^) и Л; (f) Л гэ 5 и ~|В =) ~\А (форма ~~\В з> ~1Л называется контрапозицией формы Л =э В)\ (g) (Л&Б) VC15) и Л VC1B); (h) Л & (Л V В) и Л; (i) А&В и В&А; (]) Л V # и 5 V А (к) (Л & В) & С и Л & (в & С); (1) (Л V В) V С и Л V (В V С); (т) Л = В и 5 = Л; (П) (Л ЕЕ £) ЕЕ С И Л ЕЕ (5 ЕЕ С). 8. (Принцип двойственности.; (a) Пусть оД есть пропозициональная форма, содержащая только связки *|, & и V» а форма о/£' получается из q/£ заменой в ней всюду & на V и V на &; доказать, что оД является тавтологией тогда и только то1да, ко1да тавтологией является ~]<2/^'. Отсюда далее: если q/£ id SB— тавтология, той SB' =э orf' — тавтология, и если q/£ = SB — тавтоло! ия, то тавтологией является и o/g' =iSB'- (Указание. Использовать 7 (а) и 7 (Ь).) (b) Вывести 7 (Ь) из 7 (а) и 7 (d) из 7 (с).
§ 2 ТАВТОЛОГИИ 29 (с) Пусть оД—пропозициональная форма, содержащая только связки ""], &, V» а форма (2т^* получается из q/£ заменой в &£ всюду & на \/ и обратно и каждой пропозициональной буквы ее отрицанием; показать, что форме q/£* логически эквивалентна форма ~]<2^- Форма q/£* называется двойственной форме qs£. Найти пропозициональную форму, двойственную фэрме (А V ~]В) & А & (~|С V (А & С)). 9. Пропозициональная форма, содержащая только связку = , является тавтологической тогда и только тогда, когда всякая пропозициональная буква входиг в нее четное число раз. 10. (Шеннон [1938], X о н [I960])*). Электрическая цепь,содержащая только двухпозиционные переключатели (при одном состоянии переключателя ток через него проходит, при другом — не проходит), может быть представлена с помощью диаграммы, на которой возле каждого переключателя пишется буква, истинностное значение которой (И или Л) соответствует прохождению или непрохождению тока через этот переключатель. Например, условие, при котором ток идет через контур, изображенный на рис. 1, может быть выражено с помощью пропозициональной формы (А к В) V (С & ~\А). Форма (А&В)У V ((С V Л) & ~\В) представляет цепь, изображенную на рис. 2. \ V В Рис. 2. Применив упражнение 7 (d), (e), (g), (]), (1), мы можем убедиться в том, что эта последняя форма логически эквивалентна формам ((А к В) V (С V Л)) & &((А&В)у-]В), (((А&В)У А)\/ С)&(А&-\В), (А V С) & (А V ~\В) и, наконец, форме Л V (С&~]В). Таким образом, сеть, изображенная на рис. 2, Рис. 3. эквивалентна более простой сети, изображенной на рис. 3. (Две сети называются эквивалентными, если через одну из них ток идет тогда и только тогда, когда он идет через другую; из двух сетей та считается более простой, которая содержит меньшее число переключателей.) •) См. также Шестаков [1941], Яблонский [1958].
30 ГЛ. I. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИИ (a) Для цепей, изображенных на рис. 4, 5, 6, построить эквивалентные им более простые цепи. (b) Пусть каждый из трех членов комитета голосует «за», нажимая на кнопку. Построить по возможности более простую электрическую цепь, через которую ток проходил бы тогда и только тогда, когда не менее двух членов комитета голосуют «за». \ -Т/ Рис. 4. Рис. 5с Рис. 6. (с) Требуется, чтобы включение света в комнате осуществлялось с помощью трех различных переключателей таким образом, чтобы нажатие на любой из них приводило к включению света, если он перед этим был выключен, и к его выключению, если он был включен. Построить простую цепь, удовлетворяющую такому заданию. 11. Выяснить, являются ли следующие рассуждения логически правильными; для этого представить каждое предложение в виде пропозициональной формы и проверить, является ли заключение логическим следствием конъюнкции посылок. (a) Если Джонс—коммунист, то Джонс — атеист. Джонс — атеист. Следовательно, Джонс—коммунист. (b) Если строить противоатомные убежища, то другие государства будут чувствовать себя в опасности, а наш народ получит ложное представление о своей безопасности. Если другие страны будут чувствовать себя в опасности, то они смогут начать превентивную войну. Если наш народ получит ложное представление о своей безопасности, то он ослабит свои усилия, направленные на сохранение мира. Если же не строить противоатомные убежища, то мы
§ 3. ПОЛНЫЕ СИСТЕМЫ СВЯЗОК & рискуем иметь колоссальные потери в случае войны. Следовательно, либо другие страны могут начать превентивную войну, и наш народ ослабит свои усилия, направленные на сохранение мира, либо мы рискуем иметь колоссальные потери в случае войны. (c) Если Джонс не встречал этой ночью Смита, то либо Смит был убийцей, либо Джонс лжет. Если Смит не был убийцей, то Джонс не встречал Смита этой ночью, и убийство имело место после полуночи. Если убийство имело место после полуночи, то либо Смит был убийцей, либо Джонс лжет. Следовательно, Смит был убийцей. (d) Если капиталовложения останутся постоянными, то возрастут правительственные расходы или возникнет безработица. Если правительственные расходы не возрастут, то налоги будут снижены. Если налоги будут снижены и капиталовложения останутся постоянными, то безработица не возникнет. Следовательно, правительственные расходы возрастут. 12. Проверить совместность каждого из множеств утверждений. Для этого представить предложения в виде пропозициональных форм и затем проверить, является ли их конъюнкция противоречием. (a) Либо свидетель не был запуган, либо, если Генри покончил жизнь самоубийством, то записка была найдена. Если свидетель был запуган, то Генри не покончил жизнь самоубийством. Если записка была найдена, то Генри покончил жизнь самоубийством. (b) Если вечер скучен, то или Алиса начинает плакать, или Анатоль рассказывает смешные истории. Если Сильвестр приходит на вечер, то или вечер скучен, или Алиса начинает плакать. Если Анатоль рассказывает смешные истории, то Алиса не начинает плакать. Сильвестр приходит на вечер тогда и только тогда, когда Анатоль не рассказывает смешные истории. Если Алиса начинает плакать, то Анатоль рассказывает смешные истории. (c) Если курс ценных бумаг растет или процентная ставка снижается, то либо падает курс акций, либо налоги не повышаются. Курс акций понижается тогда и только тогда, когда растет курс ценных бумаг и налоги растут. Если процентная ставка снижается, то либо курс акций не понижается, либо курс ценных бумаг не растет. Либо повышаются налоги, либо курс акций понижается и снижается процентная ставка. § 3. Полные системы связок Всякая пропозициональная форма, содержащая п пропозициональных букв, порождает соответствующую истинностную функцию от п аргументов. Значениями этих аргументов и функции являются И («истина») или Л («ложь»). Логически эквивалентные формы порождают одну и ту же функцию. Естественно возникает вопрос: все ли истинностные функции порождаются таким образом. Предложение 1.4. Всякая истинностная функция порождается некоторой пропозициональной формой, содержащей связки ~|> & и у. Доказательство. Пусть f(xb ..., хл) — данная истинностная функция. Очевидно, f может быть представлена некоторой истинностной таблицей с 2п строками, где каждая строка содержит некоторое распределение истинностных значений для переменных хь ..., хп и соответствующее значение f (хь ..., хп). Занумеруем строки этой таблицы натуральными числами 1, 2, 3, ..., 2п. Пусть для каждого / при 1^ Q означает конъюнкцию £/{&,,♦& Ulm где V) есть Л/, если
32 ГЛ 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ в 1-й строке истинностной таблицы ху- принимает значение И, и Uj есть ~| Aj, если Ху принимает значение Л. Обозначим через D дизъюнкцию всех Q таких, что функция { в /-й строке истинностной таблицы получает значение И. (Если таких строк нет, то f всегда принимает значение Л, и тогда нашей теореме удовлетворяет форма А\ & ~| Л1.) Истинностная функция, определяемая формой Д совпадает с f. В самом деле, пусть дано какое-нибудь распределение истинностных значений для пропозициональных букв Аи • • • > Ап, и предположим, что в истинностной таблице для f это распределение истинностных значений для xt, ..., хп представлено в k-ft строке. Ck имеет при этом распределении значение И, тогда как все остальные Q имеют значение Л. Если для k-fi строки f имеет значение И, то Ck является дизъюнктивным членом D и, следовательно, при этом распределении D тоже имеет значение И. Если для k-Vi строки f принимает значение Л, то Ck не является дизъюнктивным членом D и для рассматриваемого распределения все дизъюнктивные члены D принимают значение Л, а следовательно, и D принимает значение Л. Итак, порождаемая формой D истинностная функция есть 1 Примеры. (а) Xi И Л И х2 И и л f(xi, х2) Л И И ля и Искомой формой D является форма П Ах & А2) V Hi & 1 Л) V (1 А * 1 i49). (Ь) Xi Х2 Х3 g(Xb Х2, Хз) и л и л и л и л и и л л и и л л и и и и л л л л и л и и л л л и Искомой формой D является форма (А{ & Ла & Л3) V (Л1 & 1 Ла & Л3) V (1 Ai&-}A*&A3) УПЛ1&-|Л<,&1 Л3).
3 ПОЛНЫЕ СИСТЕМЫ СВЯЗОК 33 Упражнение Найти пропозициональную форму, содержащую только связки ~|, & и V> которая имеет следующую истинностную функцию f (х1} х2, х3): xt х2 х8 f (х1э х2, х8) и л и л и л и л и и л л и и л л и и и и л л л л и и л л л л л и Следствие 1.5. Для любой из следующих трех пар связок & и "], V и ~1, zd и ~| и для любой истинностной функции f существует пропозициональная форма, содержащая связки только из заданной пары и порождающая f. Доказательство. Заметим, что А V В логически эквивалентно 1ПЛ&ПБ). Следовательно, в силу второй части предложения 1.3, всякая пропозициональная форма, содержащая только связки &, V» 1» логически эквивалентна некоторой пропозициональной форме, содержащей только связки & и ~| (получаемой заменой всех выражений &/£ \j <£% на П О ©т^ & П <з©)). Остальные части доказываемого следствия подобным же образом следуют из тавтологий: = -\С]А VI Я), A&B = "\(Azd"\B). Мы только что видели, что существуют пары связок, например ~| и &, через которые могут быть выражены (в смысле следствия 1.5) все истинностные функции. Оказывается, что того же эффекта можно добиться и с помощью одной связки | (конъюнкция отрицаний), которая задается истинностной таблицей А В А\В И И Л ЛИЛ И Л Л Л Л И А \ В истинно тогда и только тогда, когда не истинно Л и не истинно В. Нетрудно видеть, что формы ~\А = (А\А) и (А &В) = ((А | A) j(£ | В)) суть тавтологии, и потому, в силу следствия 1.5, одной связки | достаточно для построения всех истинностных функций. 2 Э. Мендельсон
ГЛ. 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ Другой связкой, также достаточной для этой цели, является связка | (дизъюнкция отрицаний или штрих Шеффера) с истинностной таблицей А И Л и л в и и л л 4 л и и и Л\В истинно тогда и только тогда, когда неверно, что А и В оба истинны. Достаточность связки | следует из тавтологий ~|Л = (л{л) и (A\JB) = {{A\A)\(B\B)). Предложение 1.6. Единственными бинарными связками, каждой из которых достаточно для построения всех истинностных функций, являются связки \ и |. Доказательство. Предположим, что h(Л, В) является достаточной в указанном смысле связкой. Если бы h (И, И) было И, то любая пропозициональная форма, построенная с помощью только лишь h, принимала бы значение И, когда все входящие в нее пропозициональные буквы принимают значение И. Следовательно, форма ~] А не могла бы быть выражена только через п. Итак, h (И, И) = Л. Аналогично получаем, что h (Л, Л) = И. Таким образом, мы имеем таблицу А И Л И л в и и л л п(Л, л и В) Если второе и третье места в столбце значений h этой таблицы заняты соответственно значениями И, И или Л, Л, то мы получаем связку | или связку |. Если же на этих местах стоит Л, И или И, Л, то формы h (Л, В) = "1 В и соответственно h (Л, В) = "1 Л оказываются тавтологиями. В обоих случаях функция h выражена через "]• Однако связка "] не является достаточной в рассматриваемом смысле, поскольку единственными истинностными функциями от одной переменной, которые могут быть выражены через ~|> являются функция, тождественно равная самой переменной, и отрицание переменной, а, например, функция, тождественно равная И, невыразима через отрицание. Упражнения 1. Доказать, что каждая из пар связок :=>, V и "|, = не является достаточной для выражения любой истинностной функции. 2. Пропозициональная форма называется дизъюнктивной нормальной формой, если она является дизъюнкцией, состоящей из одного или более дизъюнк-
$ 3 ПОЛНЫЕ СИСТЕМЫ СВЯЗОК 35 тивных членов, каждый из которых является конъюнкцией одной или нескольких пропозициональных букв или их отрицаний, например: (Л & В) V П Л &С), А & #, [АкВк~\А)\] (С & 1 Я) V И & 1 С), Л, Л V (Л & В). Форма называется конъюнктивной нормальной формой, если она является конъюнкцией одною или более конъюнктивных членов, каждый из которых является дизъюнкцией одной или нескольких пропозициональных букв или их отрицаний. Заметим, что пропозициональную букву и ее отрицание мы рассматриваем как (вырожденную) дизъюнкцию или конъюнкцию. Доказательство предложения 1.4 фактически является доказательством того, что всякая пропозициональная форма логически эквивалентна некоторой дизъюнктивной нормальной форме. Применяя этот результат к ~] &£% доказать, что &£ логически эквивалентно также и некоторой конъюнктивной нормальной форме. 3. Найти конъюнктивную и дизъюнктивную нормальные формы, логически эквивалентные формам (А => В) V (1 Л & С) и А == (В & "| А). Указание. Часто вместо того, чтобы использовать конструкцию из доказательства предложения 1.4, бывает удобнее применить упражнение 7 на стр. 28. В самом деле, пусть, например, дана форма ((A z> ~| В) & С) V V (~1 А = С). Чтобы получить конъюнктивную нормальную форму, исключим сначала id и =: (("] А V 1 В) & С) V ((Л V С) & (1 С V 1 Л)). Затем, в силу упражнения 7 (d), мы получаем (~]А V 1 В V Л V О &П Л V ~| В V 1 С V 1 А) & & (С V Л V С) & (С V ~\ С V ~1 Л), что логически эквивалентно конъюнктивной нормальной форме (~| Л V ~] 5 V ~| С) & (С V Л). Чтобы получить дизъюнктивную нормальную форму, мы тоже сначала исключим zd и =: (("] Л V "1 #) &С) V V (("] Л & С) V (Л & ~| С)), а затем, в силу упражнения 7 (с), получаем (~1 Л & С) V V (~]В & С) V (П Л & С) V (Л & ~1 С), что логически эквивалентно дизъюнктивной нормальной форме (~| Л & С) V (1 В & С) V (Л & 1 С). 4. Пропозициональную букву Л и ее отрицание ~| Л будем называть литералами буквы Л. Дизъюнктивная (конъюнктивная) нормальная форма называется совершенной, если никакой ее дизъюнктивный член (конъюнктивный член) не содержит двух вхождений литералов одной и той же буквы и если всякая буква, входящая в один из дизъюнктивных членов (конъюнктивных членов), входит и во все остальные. Например, дизъюнктивные нормальные формы (А&А& В) V \J(A&B), (Л & В) V Л, (Л &"| Л &£) V (А к В) не являются совершенными, а формы (А к"] В) V (Л&£) и (Л & fl & ~] С) V (Л & 5 &С) У (А & ~| 5 & ~| С) являются совершенными дизъюнктивными нормальными формами. Найти совершенные дизъюнктивную и конъюнктивную нормальные формы, логически эквивалентные формам Л = (В & ~| Л) и (Л :э В) \/(~|Л&С). Доказать, что всякая непротиворечивая (нетавтологическая) пропозициональная форма q/£ логически эквивалентна некоторой совершенной дизъюнктивной (конъюнктивной) нормальной форме У и что если & содержит в точности п букв, то o/g является тавтологией (противоречием) тогда и только тогда, когда 3F состоит из 2п дизъюнктивных (конъюнктивных) членов. 5. Некая страна населена жителями, каждый из которых либо всегда говорит правду, либо всегда лжет и которые отвечают на вопросы только посредством «да» или «нет». К развилке дорог, из которых одна ведет в столицу, а другая туда не приводит, приходит турист. Никаких знаков, указывающих, какую дорогу следует выбрать, при развилке нет. Зато здесь стоит местный житель, некто господин Р. Какой вопрос, требующий ответа «да» или «нет», должен задать ему турист, чтобы выбрать нужную ему дорогу? Указание. Пусть Л обозначает высказывание «господин Р всегда говорит правду», а В обозначает высказывание «дорога, идущая налево, ведет в столицу». С помощью подходящей истинностной таблицы построить такую пропозициональную форму, содержащую Л и В, чтобы ответ местного жителя на вопрос, истинна ли эта пропозициональная форма, гласил «да» тогда и только тогда, когда В истинно, 2»
36 ГЛ Т. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ § 4. Система аксиом для исчисления высказываний Истинностные таблицы позволяют ответить на многие важные вопросы, касающиеся истинностно-функциональных связок, в том числе такие, как вопрос о том, является ли данная пропозициональная форма тавтологией, противоречием или ни тем и ни другим, влечет ли она логически другую данную пропозициональную форму или являются ли две формы логически эквивалентными друг другу. Более сложные вопросы логики, которыми мы в дальнейшем займемся, уже не могут быть решены с помощью истинностных таблиц или с помощью каких-либо других подобных эффективных процедур. Поэтому нами будет рассмотрен другой метод — метод формальных теорий. Хотя, как мы видели, все основные вопросы, возникающие в логике высказываний, могут быть решены методом истинностных таблиц, поучи- тельно будет проиллюстрировать аксиоматический метод и на этой простой ветви логики. Формальная {аксиоматическая) теория £* считается определенной, если выполнены следующие условия: (1) Задано некоторое счетное множество символов — символов теории £? *). Конечные последовательности символов теории S? называются выражениями теории £?. (2) Имеется подмножество выражений теории £*, называемых формулами теории £^. (Обычно имеется эффективная процедура, позволяющая по данному выражению определить, является ли оно формулой.) (3) Выделено некоторое множество формул, называемых аксиомами теории S*. (Чаще всего имеется возможность эффективно выяснять, является ли данная формула теории S? аксиомой; в таком случае <£У называется эффективно аксиоматизированнойу или аксиоматической теорией.) (4) Имеется конечное множество Ri, ..., Rn отношений между формулами, называемых правилами вывода. Для каждого R/ существует целое положительное ] такое, что для каждого множества, состоящего из у формул, и для каждой формулы orf эффективно решается вопрос о том, находятся ли данные j формул в отношении R,- с формулой &#у и если да, то q/£ называется непосредственнным следствием данных у формул по правилу R/. Выводом в оУ называется всякая последовательность <э^ь ..., оЛп формул такая, что для любого / формула ©^ есть либо аксиома теории &, либо непосредственное следствие каких-либо предыдущих формул по одному из правил вывода. Формула od теории £? называется теоремой теории <з^, если существует вывод в S^t в котором последней формулой является а^\ такой вывод называется выводом формулы &£. *) В качестве таких символов MOiyi браться произвольные, а вовсе не обязательно лингвистические объекты.
§ 4. СИСТЕМА АКСИОМ ДЛЯ ИСЧИСЛЕНИЯ ВЫСКАЗЫВАНИЙ 37 Даже в случае эффективно аксиоматизированной теории £*, т. е. когда имеется эффективная процедура для определения, является ли данная формула аксиомой, понятие теоремы не обязательно эффективно, ибо, вообще говоря, может и не существовать эффективной процедуры (алгоритма), позволяющей узнавать по данной формуле, существует ли ее вывод в S*. Теория, для которой такой алгоритм существует, называется разрешимой, в противном случае теория называется неразрешимой. Грубо говоря, разрешимая теория — это такая теория, для которой можно изобрести машину, испытывающую формулы на свойство быть теоремой этой теории, в то время как для выполнения той же задачи в неразрешимой теории требуются все новые и новые независимые акты изобретательства. Формула о/ё называется следствием множества формул Г в £f тогда и только тогда, когда существует такая последовательность формул е^ь..., оЛгт что orfn есть о/£, и для любого / orfi есть либо аксиома, либо элемент Г, либо непосредственное следствие некоторых предыдущих формул по одному из правил вывода. Такая последовательность называется выводом о?£ из Г. Члены Г называются гипотезами или посылками вывода. Для сокращения утверждения «о^ есть следствие Г» мы будем употреблять запись Г |— &&. Чтобы избежать путаницы там, где будут рассматриваться не одна, а несколько теорий, мы будем употреблять запись Г [— yorf, указывая индексом S? на то, о какой теории идет речь. Если множество Г конечно: Г = {&©ь ..., <&п}, то вместо {<a$?i, ..., е%п} \— od мы будем писать о®ь ..., $Вп |— оЛ'. Если Г есть пустое множество 0, то Г |— А имеет место тогда и только тогда, когда os£ является теоремой. Вместо 01— ©^ принято писать просто [— <&€. Таким образом, |— orf служит сокращением утверждения «е^ есть теорема». Приведем несколько простых свойств понятия выводимости из посылок. (1) Если Г £ А и Т\-оЛу то А |- <&f. (2) Г |— оЛ тогда и только тогда, когда в Г существует конечное подмножество А, для которого А [— orf. (3) Если А |— erf и Г}— <з© для любого о® из множества А, то Свойство (1) выражает тот факт, что если оЛ выводимо из множества посылок Г, то оно останется выводимым, если мы добавим к Г новые посылки. Часть «тогда» утверждения (2) вытекает из (1). Часть «только тогда» этого утверждения становится очевидной, если мы вспомним, что всякий вывод orf из Г использует лишь конечное число посылок из Г. Весьма прост и смысл утверждения (3): если оЛ выводимо из А и каждая содержащаяся в А формула выводима из Г, то о^ выводимо из Г Мы введем теперь формальную аксиоматическую теорию L для исчисления высказываний. (1) Символами L являются ~1> =э> (,) и буквы At с целыми положительными числами в качестве индексов: Л4, А%, Л3, .,. Символы "] и zd
38 ГЛ. 1 ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ называются примитивными связками, а буквы At — пропозициональными буквами. (2) (а) Все пропозициональные буквы суть формулы. (Ь) Если оД и 33— формулы, то (~~\&#) и (&& =э <£&) — тоже формулы *). Таким образом, всякая формула теории L есть попросту пропозициональная форма, построенная из пропозициональных букв Л* с помощью связок ~1 и id. (3) Каковы бы ни были формулы о/ё, 33 и *£ теории L, следующие формулы суть аксиомы L: (Al) (orf zd (33 zd osf))', (А2) ((gs£ id (33 id Щ) id {{оЛ => 33) id (orf (A3) ((1 <2® =D I а^) ZD{(-\&ZD<»f)ZD 33)). (4) Единственным правилом вывода служит правило modus ponens: 33 есть непосредственное следствие od и &/£ id 33. Это правило будем сокращенно обозначать через МР. Мы будем придерживаться наших соглашений относительно исключения скобок. Отметим, что бесконечное множество аксиом теории \, задано с помощью всего лишь трех схем аксиом (Al), (A2), (A3), каждая из которых порождает бесконечное множество аксиом. Для любой формулы легко проверить, является ли она аксиомой, и, таким образом, L есть эффективно аксиоматизированная теория. Мы ставим своей целью построить систему L таким образом, чтобы класс всех ее теорем совпадал с классом всех тавтологий. Введем остальные связки с помощью следующих определений: (Dl) (с (D2) (< (D3) 0 tJ &&2) эЛ У 33) 2^ = 33) означает "1 (< означает ("|< означает (оЛ оЯ ZD "1 е/гг); з^) id ^&; Г ZD <^Э) & (о® Смысл определения (D1), например, состоит в том, что, каковы бы ни были формулы as? и 33, (о/£ & 33) служит обозначением для *) Для большей точности мы должны были бы добавить еще так называемый заключительный пункт: (с) Выражение является формулой тогда и только тогда, когда это может быть установлено с помощью пунктов (а) и (Ь). Это определение можно сделать строгим, взяв за образец определение из примечания ***) на стр. 22. **) Когда мы говорим, что (q/?&33) служит обозначением для ~| (q/? id ~|S3), мы под этим понимаем, что (&/£ &$3) выбирается в качестве нового названия в русском языке (или в любом другом языке %, на котором, быть может, случится говорить о теории L) для выражения ~| (ojg id ~| S3)- Заметим, что в качестве названия выражения, построенного посредством приписывания рядом каких-либо других выражений, мы употребляем выражения из русского языка (или языка £)у построенные с помощью приписывания рядом названий этих дру1их выражений; при этом мы употребляем скобки и связки как их собст-
§ 4 СИСТЕМА АКСИОМ ДЛЯ ИСЧИСЛЕНИЯ ВЫСКАЗЫВАНИЙ 39 Лемма 1.7. \— i о/£ zd gs£ для любой формулы osf. Доказательство*). Построим вывод формулы оЛ =э ©^ в L. (2) ^=> (3) {o/l ZD (4) q^ZD\ (5) orf ZD « ((&# ID G?£) (G^ZDesf) (1) (orf ID ((а?£ ZDgt£)ZD оЛ)) ZD ((&# ZD (оЛ ID (подстановка в схему аксиом (А2)) <2s£) (схема аксиом (А1)) (ИЗ (1), (2) ПО MP) (схема аксиом (Al)) (из (3), (4) по МР) венные названия, исключая, разумеется, те случаи, когда это может привести к недоразумению. Например, если q/£ есть название выражения (At id Л2) и $& есть название выражения ("| Лх), то (&£ zd SB) мы применяем как название выражения ((Л! =э Л2) =э ("| At)). Эти соглашения представляются совершенно естественными и не замечаются большинством людей, если явно на них не указано. За дальнейшими разъяснениями по этому вопросу мы отсылаем читателя к обсуждению квазиобозначений у Куайна (К у а й н [1951]) и автонимных символов у Карнапа (К а р н а п [1934], §§ 4 и 42); см. также Росс ер [ 1955], гл. III; Саппс [1957], глава 6; Чёрч [1956], введение и стр. 69—-71. *) Слово «proof» употребляется в двух различных смыслах. Во-первых, оно употребляется в некотором, определенном выше, точном смысле, как название для специального вида конечных последовательностей формул теории L («вывод в L»). В другом смысле оно означает последовательность предложений английского языка (дополненного различными техническими терминами), о которой предполагается, что она служит обосновывающей аргументацией в пользу того или иного утверждения о теории L (или какой-нибудь другой формальной теории). Вообще язык, который мы изучаем (в данном случае язык L), называется языком-объектом, а язык, на котором мы формулируем и доказываем различные результаты об этом языке-объекте, называется метаязыком. Этот метаязык сам мог бы быть формализован и стать предметом исследования, которое в свою очередь проводилось бы в некотором метаязыке, и т. д. Хотя для существенной части этой книги используется лишь некая математически узкая часть английского языка, мы тем не менее будем рассматривать английский язык как наш (неформализованный) метаязык. Разница между языком-объектом и метаязыком хорошо видна при изучении иностранных языков; например, на уроке немецкого языка этот последний является языком-объектом, а язык, на котором ведется преподавание, является метаязыком. Различию между «выводом в языке- объекте» и «доказательством в метаязыке» соответствует различие между теоремой языка-объекта и метатеоремой метаязыка. Во избежание недоразумений мы обычно вместо слова «метатеорема» употребляем слово «предложение». Слово «метаматематика» употребляется как название исследований логических и математических языков-объектов; иногда употребление этого слова ограничивается областью исследований, использующих только такие методы, которые квалифицируются метаматематиками как конструктивные (или так называемые финитные) методы. [Переводя это примечание автора, мы сохранили непереведенным слово «proof» в первой фразе, а также не сделали обычной замены слов «английский язык» словами «русский язык» (в соответствующих падежах). Дело в том, что два различных смысла слова «proof», о которых говориться в этом примечании, в русской литературе выражаются обычно с помощью двух различных терминов: «вывод» и «доказательство». Такой терминологией мы и пользуемся всюду в переводе книги. (Прим. перев.)]
ГЛ I ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ Упражнение Доказать (построив вывод): 1. К П 2. qJ id 33, 33 => IS К 3. e 4. В математических рассуждениях часто какое-нибудь утверждение о® доказывают в предположении верности другого утверждения ©^ после чего заключают, что верно утверждение «если ©^, то а©». Для системы L этот прием обосновывается следующей теоремой. Предложение 1.8*). (Теорема дедукции.) Если Г — множество формул, od и 33— формулы и Г, orf f— q%> то Г |— ©^ id S3. В частности, если &€\-ЗЗу то \-<2t£id33 (Эрбран [1930]). Доказательство. Пусть 33Ь ..., 33 п есть вывод из Г U \orf\ где ЗЗп = 33. Индукцией по / (l^l^n) докажем, что Г \- os€ id 33{. Прежде всего, gSSj должно быть либо элементом Г, либо быть аксиомой системы L, либо совпадать с оЛ'. По схеме аксиом (Al), S3X id zd (ad zd S3\) есть аксиома. Поэтому в первых двух случаях Г |— o/l zd&i по МР. В третьем случае, т. е. когда <ШХ совпадает с е^, по лемме 1.7 мы имеем |— &# id <3&\ и, следовательно, Г \— q/Z id 33\. Тем самым случай /=1 исчерпан. Допустим теперь, что Г |— &# 1эЗЗк для любого k < /. Для 331 имеем четыре возможности: 33\ есть аксиома, или 33t e Г, или ЗЗг есть о/£\ или 33{ следует по modus ponens из некоторых 33j и ЗЗт где / <С ^', m<i и о^5т имеет вид <^©у zd q®;. В первых трех случаях Г [— orf zd 33{ доказывается так же, как для /=1. В последнем случае применим индуктивное предположение, согласно которому Г (- а^ z> в^у и Т\-о^1э (33] zd о®,). По схеме аксиом (А2), h (<^=> id (33j zd ЗЗг)) zd ((qs€ id 33j) =d (®^ zd ^))- Следовательно, по МР, Г \- (orf id d5@y) zd(q^zd 3dt) и, снова по МР, Г |- orf id ЗЗь Таким образом, наше доказательство по индукции завершено, и для i = n мы получаем требуемое утверждение. (Заметим, что проведенное доказательство позволяет по данному выводу о® из Г и osf построить вывод arf id 33 из Г и что при доказательстве теоремы дедукции мы использовали только схемы аксиом (А1) и (А2).) Следствие 1.9. (1) orf ID «SB, p© ZD g* (- orf ZD &. (ii) &fz>(-№zD&)4<&\-o>fzD&. Доказательство (i) (a) g/£ id 33 гипотеза (b) 33 ц> с£ гипотеза *) Мы пишем Г, q£\- S3 вместо Г U {s/(|-J, и вообще Г, rf\33 вместо Г и Ь^ f}h&
§ 4. СИСТЕМА АКСИОМ ДЛЯ ИСЧИСЛЕНИЯ ВЫСКАЗЫВАНИЙ 41 (c) orf гипотеза (d) SB (а), (с), МР (e) У (b), (d), MP Таким образом, &# zd SB, SB id ?f, erf \- ?f Отсюда, по теореме дедук- Доказательство (ii) предлагается провести самостоятельно в качестве упражнения (использовать теорему дедукции). Лемма 1.10. Для любых формул о/£> SB следующие формулы являются теоремами L: (a) Ц SB zd «ЙВ; (е) (g/$? id q®) =d (1 g® (b) <з$ => 1 1=$; (f) o^ id (1 & (C) "|e^ID(e^ZDe»); (g) (e^D«i8) (d) ("]^8 id 1 ©^0 =) (©^ id q®); Доказательство. (a) h 11 ^ => <^- 1. (1 <2® id 11 cS8) id (("] d® zd 1 e®) id о®) схема аксиом (A3) 2. П*©=>1<^ лемма 1.7*) 3. П S3 zd 11Щ zd SB 1,2, следствие 1.9 (ii) 4. -n«®z>("l<a0Bz>~n<3®) схема аксиом (А1) б. Ц^ id ^8 3, 4, следствие 1.9 (i) (b) 1- d® zd 11 <^. 1. П 1 П ^ id"! SB) zd ((111 S3 zd Щ id 11SS) схема аксиом (A3) 2. ~1 ~| 1«® ^э 1 <$? пункт (а), доказанный выше 3. (111 SB zd SB) zd 11 S3 1, 2, MP 4. SB zd ("1"| 1 q® id SB) схема аксиом (А 1) 5. SB id 11 q® 3, 4, следствие 1.9 (i) (c) hV=)K=)^®). 1. 1©^ гипотеза 2. o^ гипотеза *) Вместо того чтобы приводить в этом месте полный вывод для I^, мы просто ссылаемся на лемму 1.7. Поступая таким образом, мы указываем на то, что в этом месте вывод для 1 SB =э 1 SB мог бы быть выписан, имей мы на то желание, время и место. Разумеется, это есть не что иное, как обычное применение ранее )становленных теорем.
42 , ГЛ. I. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ 3. orf zd (~| SB id erf) схема аксиом (А1) 4. ~\orfzDC\S3 =5 "1<зтО схема аксиом (А1) 5. 1 SB zd orf 2, 3, МР 6. -]<£@zd-]gs£ 1, 4, МР 7. П S3 zd 1 orf) => (О S3 :z> (2^) id <^S) схема аксиом (A3) 8. О SB zd orf) ZD s® 6, 7, МР 9. «ЙЭ 5, 8, МР Итак, в силу 1—9, ~\orf, o/£\-Sd. Поэтому, по теореме дедукции, "1 е^ |— о/£ zdSS и, снова по той же теореме, [- "| о^ id (q/1 id Si). (d) |- О SB z 1. "] q® id ~| ©^ гипотеза 2. ©^ гипотеза 3.n^Dl^)D((l^DG/)D SB) схема аксиом (A3) 4. qt€ id ("1 q® id (2^) схема аксиом (А1) 5. ("| SB zd orf) id SB 1, 3, MP 6. 4, 5, следствие 1.9 (i) 7. SB \ 2, 6, MP В силу 1—7, ~~\SB zd~}g7£, gt#\-SB, после чего, дважды применив теорему дедукции, получим требуемый результат. (e) (- (от? id S3) zd П SB zd "1 1. <2^ id о® гипотеза 2. "1 "1 <2^ =^ ^ пункт (а) 3. "11 (2^ id S3 1,2, следствие 1.9 (i) A. SBzd~]~]SB пункт (Ь) 5. "| "1 orf =) 11 S3 3, 4, следствие 1.9 (i) 6. О "| orf =) 1 1 е®) ID ("I SB ZD "1 (2^) ПУНКТ (d) 7. О ^® zd I erf) 5, б, МР В силу 1—7, orf zdS3 \-~\SB zd~\ erf, откуда (е) получается по теореме дедукции. (f) \-orf Очевидно, orf, erf zdSB |— SB. Применив дважды теорему дедукции, получаем (~ erf id ((q^ id ^S) id <aS8). По пункту (е) имеем |~ ({orf zd SB) zd &SB ~](orf zdSB)). Наконец, применив 1.9 (i). пол}чаем \- оЛ ZD П SB ZD 1 (erf ID S3)).
§ 4. СИСТЕМА АКСИОМ ДЛЯ ИСЧИСЛЕНИЯ ВЫСКАЗЫВАНИЙ 43 (g) \-(&flD SB) ZD (О orf Г) S3) =) S3). 1. q^zdS3 гипотеза 2. "1 o/l zd S3 гипотеза 3. (о^ => S3) zd ("I S3 zd "1 оЛ) пункт (е) 4. -\SSzd~\q^ 1, 3, МР 5. (П &# zd <?®) zd (П ^Э =э "1 "] ©^) пункт (е) 6. "I d® zz> П "1 ©^ 2, 5, МР 7. ("1 S3 zd "1 "1 &f) =э (П ^ =э "1 &f) zd SB) схема аксиом (A3) 8. О SB id ~l q#) zd S3 б, 7, МР 9. S3 4, 8, МР Итак, qt€idSB, ~]q^ id S3 |— S3, Применив два раза теорему дедукции^ получаем (g). Упражнения 1. Показать, что следующие формулы являются теоремами теории L: (а) (b) 2, Построить полное доказательство (вывод в L) для пункта (с) леммы 1.10. (Указание. Применить к приведенному выше доказательству пункта (с) леммы 1.10 построения из доказательства теоремы дедукции.) Читатель проникнется большей любовью к теореме дедукции, если он попытается провести доказательство леммы 1.10, не прибегая к помощи этой теоремы. Наша цель — показать, что формула теории L тогда и только тогда является теоремой этой теории, когда она есть тавтология. В одну сторону это совсем просто. Предложение 1.11. Всякая теорема теории L есть тавтология. Доказательство. В качестве упражнения можно убедиться в том, что каждая аксиома теории L есть тавтология. В силу предложения 1.1, правило modus ponens, примененное к тавтологиям, приводит к тавтологиям. Следовательно, всякая теорема теории L есть тавтология. Следующая лемма будет применена при доказательстве того, что каждая тавтология является теоремой теории L. Лемма 1.12. Пусть oft есть формула, a Bh ..., Bk—пропозициональные буквы, входящие в о/£, и пусть задано некоторое распределение истинностных значений для Вь ..., Bk. Пусть тогда В\ есть Bh если Bt принимает значение И, и ~] Вь если В{ принимает значение Л, и пусть, наконец, <&#' есть o/Z, если при этом распределении оД принимает значение И, и "~| ©^, если яД принимает значение Л. Тогда Вх, ..., B'k\- orf\
44 ГЛ ! ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ »Л3), го для каждой строки Если, например, ел истинностной таблицы обозначает ~|( А, И Л И Л А* Щ. И И Л л 1 А Аъ Л Л л и лемма 1.12 утверждает факт соответствующей выводимости. Так, в частности, третьей строке соответствует утверждение Аь ~] Лв |— ПП("1Л21Э Лв), а четвертой строке — "1 Л2, 1 Л5 \— 1(1 A* zd Лй). Доказательство. Доказательство ведется индукцией по числу п вхождений в erf примитивных связок (предполагается, естественно, что о/£ записано без сокращений). Цели л = 0, то erf представляет собой просто пропозициональную букву В\, и утверждение леммы сводится к Bi |— Вх и к "| Вх |— ~| Bh Допустим теперь, что лемма верна при любом j < п. Случай 1. orf имеет вид отрицания: lS3. Число вхождений примитивных связок в S3, очевидно, меньше п. Случай 1а. Пусть при заданном распределении истинностных значений S3 принимает значение И. Тогда orf принимает значение Л. Таким образом, S3' есть S3, a orf' есть 1<&€. По индуктивному предположению, примененному к &®, мы имеем В[, ..., B'k \— <з®. Следовательно, по лемме 1.10 (Ь) и МР, B'v ..., B'k \- "| "|с®. Но ~|"|«® и есть erf'. Случай 1Ь. Пусть SB принимает значение Л; тогда SB' есть 1SB, a orf' совпадает с orf. По индуктивному предположению, В\у ..., B'k |— (— "1 S3, что и требовалось получить, ибо 1 S3 есть ©^'. Случай 2. е^ имеет вид {S3 zd &). Тогда число вхождений примитивных связок в S3 и £f меньше, чем в <s^. Поэтому, в силу индуктивного предположения, В[у ..., B'k\- S3' и 5|, ..., ^ |— *8'. Случай 2а. о® принимает значение Л. Тогда orf принимает значение И, и S3' есть "1 S3, а ©^' есть orf Таким образом, В'ь ..., В'и |— (-1^ и, по лемме 1.10 (с), Я|, ..., fii h q® zd ^, но ^id^ и есть erf. Случай 2b. *8 принимает значение И. Следовательно, orf принимает значение И и *§' есть ?f, а е^' есть orf. Имеем В'ь ..., ^ [— ^, и тогда, по схеме аксиом (А1), В[, ..., ^ [—о® id ^, где S3zd^ совпадает с ©^'. Случай 2с. S3 принимает значение И и? принимает значение Л. Тогда erf' есть lerf, ибо erf принимает значение Л, о®' есть S3 и £?' есть 1 ^ Имеем Б;, ..., B'k |- «# и ^;, ..., B'k \- 1 %. Отсюда, по лемме 1.10(f) получаем В[, ..., В'к |- 1($3 d?), где П(^з^) и есть о^'. Предложение 1.13. (Теорема о полноте.) £сли формула о/? теории L является тавтологией, то она является теоремой теории L
§ 4 СИСТЕМА АКСИОМ ДЛЯ ИСЧИСЛЕНИЯ ВЫСКАЗЫВАНИЙ 45 Доказательство (Кальмар) Предположим, что o/Z есть тавтология и В\, ..., Bk—пропозициональные буквы, входящие в о/£> При каждом распределении истинностных значений для букв Bh ..., Вь мы имеем, в силу леммы 1.12, В[, ..., B'k \- &#. (&£' совпадает с &£, так как orf всегда принимает значение И.) Поэтому в случае, когда Bk принимает значение И, мы, применив лемму 1.12, получим В[, ..., В'ь — \, Bk \- orfy а когда Bk принимает значение Л, мы по той же лемме получим В\, ..., B'k-i, ~\BkY~ o/l. Отсюда, по теореме дедукции, В\, ... ..., В'к-Х (— Bk =d orf и В'ь ..., B'k-i \— "1 Bk id я/£. Применив теперь лемму 1.10 (g), получим В\, ..., B'k — 1\— о?£. Точно таким же образом, рассмотрев два случая, когда Bk_i принимает значения И и Л, и применив лемму 1.12, теорему дедукции и лемму 1.10 (g), мы исключим Вкл и так далее; после k таких шагов мы придем к f— o/£. Следствие 1.14. Если выражение SB содержит знаки ~], id, &, \j', = и является сокращением (см. определения Dl — D3) для некоторой формулы os£ теории L, то SB является тавтологией тогда и только тогда, когда о/£ есть теорема теории L. Доказательство. Выражения, вводимые в определениях D1 — D3 для сокращенного обозначения формул, представляют собой пропозициональные формы, логически эквивалентные обозначаемым ими пропозициональным формам. Следовательно, в силу предложения 1.3, о/£ и SB логически эквивалентны, а, потому SB есть тавтология тогда и только тогда, когда о/ё есть тавтология. Теперь остается воспользоваться предложением 1.13. Следствие 1.16. Система L непротиворечива, т. е. не существует формулы &# такой, чтобы orf и ~\от£ были теоремами в L Доказательство. Согласно предложению 1.11, каждая теорема теории L является тавтологией. Отрицание тавтологии не есть тавтология. Следовательно, ни для какой формулы o/Z невозможно, чтобы &£ и ~| о/£ были теоремами теории L. Из непротиворечивости L следует существование формулы, не являющейся теоремой теории L (например, отрицание любой теоремы). С другой стороны, непротиворечивость L можно было бы вывести непосредственно из факта существования формулы теории L, не являющейся теоремой. В самом деле, по лемме 1.10 (с) имеем |— L ~\оД zz>(q/£ id SB\ и, следовательно, если бы теория L была противоречива, т. е. если бы некоторая формула orf была выводима в L вместе со своим отрицанием ~1 ©^, то, в силу (— L "1 оД zd (qs€ id SB) и МР, в L была бы выводима всякая формула SB. (Эквивалентность непротиворечивости и существования невыводимой формулы верны для всякой теории с modus ponens в качестве правила вывода, для которой доказуема лемма 1.10 (с).) Теорию, в которой не все формулы являются теоремами, часто называют абсолютно непротиворечивой. Это определение применимо и к теориям, не содержащим знака отрицания.
46 ГЛ. 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ Упражнения 1. Проверить, что для любых формул ^т^, й и? следующие формулы являются тавтологиями и, следовательно, теоремами теории L: (a) (ЫГ V Sd) & ЫГ => IS) & (b) e^=D((^ID^) 2. Пусть qt^ — пропозициональная форма, не являющаяся тавтологией. Построим теорию L+, добавив к L в качестве новых аксиом все формулы, которые можно получить из <э/£, подставляя на места пропозициональных букв в Q/g произвольные формы (с тем, однако, условием, чтобы на места всех вхождений одной и той же буквы подставлялась одна и та же формула). Показать, что теория L+ противоречива. § 5. Независимость. Многозначные логики Подмножество X множества всех аксиом данной аксиоматической теории называется независимым, если какая-нибудь формула из X не может быть выведена с помощью правил вывода из аксиом, не входящих в X. Предложение 1.16. Каждая из схем аксиом (А 1) — (A3) независима. Доказательство. (а) Независимость (А1). Рассмотрим следующие таблицы: А 0 1 2 1Л 1 1 0 А 0 1 2 0 1 2 0 1 2 В 0 0 0 1 1 1 2 2 2 AzdB 0 2 0 2 2 0 2 0 0 При всяком распределении значений 0, 1, 2 для букв, входящих в формулу от€, эти таблицы позволяют найти соответствующее значение формулы оА'. Если формула ®£ всегда принимает значение 0, то она называется выделенной. Modus ponens сохраняет свойство выделенности. Читателю предлагается убедиться в этом самому, показав, что если формулы оЛ ZD <£% и о/£ выделенные, то и формула SB выделенная. Нетрудно проверить также, что всякая аксиома, получающаяся по схеме (А2) или (A3), тоже выделенная. Следовательно, выделенной является и всякая формула, выводимая из (А2) — (A3) с помощью modus ponens. Однако формула Ai zd (А2 id Ai), которая представляет собой частный случай (А1),
А 0 1 2 0 1 2 0 1 2 В 0 0 0 1 1 1 2 2 2 § 5. НЕЗАВИСИМОСТЬ МНОГОЗНАЧНЫЕ ЛОГИКИ 47" не выделенная, ибо она принимает значение 2, когда А\ принимает значение 1 и А% принимает значение 2. (b) Независимость (А2). Рассмотрим следующие таблицы: А 0 1 0 0 0 10 10 0 2 1 2 0 0 2 2 0 1 0 0 Всякую формулу, принимающую, согласно этим таблицам, всегда значение 0, назовем гротескной. Modus ponens сохраняет гротескность, и все частные случаи схем (А1) и (A3) гротескны (проверьте это сами). При этом, однако, частный случай (Ах id (Ла id Аг)) id ((Ai id Л2) id id (A\ zd Аъ)) схемы (А2) не является гротескным, ибо принимает значение 2, когда А\9 Л2 и Л3 получают соответственно значения 0, 0 и 1. (c) Независимость (A3). Пусть о?£ — произвольная формула и h (о/£) — формула, полученная из о/ё стиранием всех вхождений знака отрицания в о/£. Для всякого частного случая orf схем (А1) и (А2) Ь(от#) есть тавтология. Правило modus ponens сохраняет свойство оЛ иметь в качестве h (о/£) тавтологию, ибо если h (o/£ zd SB) и h (o/f) — тавтологии, то и h (S3) — тавтология (следует лишь заметить, что \\(g/£zdS3) совпадает с h (os£) id h (SB)). Следовательно, всякая формула о/£, выводимая из (А1) — (А2) с помощью modus ponens, имеет в качестве h (orf) тавтологию. Но h (("] Axzd~\ Ах) zd ((~| А\ zd Ах) zd Ay}) совпадает с (Ах zd A{) zd ((Ai zd Ax) zd А\\ а эта последняя формула не является тавтологией. Следовательно, (~| Ах zd ~| Ах) zd (("] Ах zd Ax) zd Ax\ частный случай (A3), невыводима из (А1) и (А2) с помощью modus ponens. Упражнение Доказать независимость схемы аксиом (A3) построением подходящих таблиц для связок ")из. Обобщение идеи, использованной для доказательства независимости схем аксиом (А1) — (A3), приводит к следующему понятию многозначной логики. Назовем числа 0, 1, ..., п «истинностными значениями» и выберем какое-нибудь число т с условием 1 ^т^п. Числа 0, 1,..., т будем называть выделенными истинностными значениями. Возьмем
ГЛ. 1 ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ некоторое конечное число «истинностных таблиц», представляющих функции, отображающие множество {0, 1, ..., п) в себя. Для каждой таблицы введем знак, который будем называть соответствующей этой таблице связкой. С помощью этих связок и пропозициональных букв мы можем строить пропозициональные формы. Каждая такая форма определяет некоторую «истинностную функцию», отображающую множество {0, 1, ...,«} в себя. Пропозициональная форма, принимающая только выделенные значения, называется выделенной. Говорят, что числа /г, т и основные истинностные таблицы определяют некоторую (конечную) многозначную логику М. Аксиоматическая теория, содержащая пропозициональные буквы и связки логики М, называется подходящей для логики М в том и только в том случае, когда множество теорем этой теории совпадает с множеством выделенных пропозициональных форм логики М. (Очевидно, все эти понятия могут быть обобщены на случай бесконечного множества истинностных значений.) В этой главе изучена 2-значная логика, соответствующая случаю п=\у /я = 0 и введенным в § 1 истинностным таблицам для связок ~| и id. Выделенные формулы этой логики назывались тавтологиями. Предложения 1.11 и 1.13 устанавливают тот факт, что теория L является подходящей для этой логики аксиоматической теорией. Две трехзначные логики были использованы нами при доказательстве независимости схем аксиом (А1) — (A3). Упражнения 1. (Мак-Кинси — Тарский.) Рассмотрим аксиоматическую систему Р, в которой имеется единственная бинарная связка *, единственное правило вывода — modus ponens (т. е. SS следует из q/£ * 3$ и q/£) и аксиомами служат все формулы вида Q/g * o/g. Доказать, что теория Р не является подходящей ни для какой (конечной) многозначной логики. 2. Для любой (конечной) многозначной логики М существует подходящая аксиоматическая теория. Дальнейшие сведения о многозначных логиках можно почерпнуть из монографии Россера и Тюркетта [1952], а также из упоминаемых в этой книге работ. § 6. Другие аксиоматизации Хотя система аксиом L и весьма проста, существует много других систем, работающих также хорошо. Вместо "1 и d можно использовать и другие наборы примитивных связок, лишь бы через них можно было выразить все остальные истинностно-функциональные связки. Примеры. Ц: Примитивные связки: \]у "]. osfiDolft служит сокращением для ~]o/f V 3$. Четыре схемы аксиом: (1) oft' \j o/£' zd э/€\ (2) ^ =) &Z V &\ (3) о* V <& => & V &*\ (4) (^ =) Ф) =э {&€ \/ ^ =>
$ 6. ДРУГИЕ АКСИОМАТИЗАЦИИ 49 ZD<3^\j^S\ Единственное правило вывода—modus ponens. Эта система рассмотрена в книге Гильберта и Аккермана [1938]. Ц: Примитивные связки: & и "]• q^zdSB сокращает ~\(оЛ &~\ЗВ). Три схемы аксиом: (1) ©^ zd (qS&&о/£)\ (2) (от£ &3B)zd о/£\ (3) (qt€ zd zdSB)zd{~1[(SB&?f)z)-|(?f&о/ё)\ Modus ponens служит единственным правилом вывода. Система подробно изучена Россером [1953]. L3: Эта система очень похожа на L; разница состоит в том, что вместо трех схем аксиом (А1) — (A3) здесь имеются лишь три конкретные аксиомы: (1) А\ zd (Л2 id А); (2) (Д id (Л2 id Л3)) id ((Л id Л2) id id (A\ zd Л3)); (3) ("1 Лд zd ~| A^ zd ((~| Л2 zd A{) zd Л2), зато кроме modus ponens имеется еще одно правило вывода — правило подстановки, раз-- решающее подстановку любой формулы на места всех вхождений данной пропозициональной буквы в данную формулу. L4: Примитивными связками служат id, &, V и ~|- Единственное правило вывода—modus ponens. Класс аксиом задается следующими схемами аксиом: (1) orf zd (SB zd qs#)\ (2) (оЛ ZD (SB ZD %)) ZD {{a^ Zd3B)zd(gs#' ZD %))\ (3) (4) (5) orf zd (SB : (6) Q* (7) SB: (8) (9) (10) ~| ~\q/? ZDorf. Как обычно, q/£ = SB означает (qs£ zd SB) & (SB zd q^\ Эту систему можно найти, например, в книге К лини [1952]. Упражнения 1. (Г и л ь б е теории Lx: (a) orf id d (b) HLl (ол (С) ^D^ (d) HLl<2^ (e) HLl^ (g) Ь-L* I q (h) Y-ugs# (0 b.WB p т и ' > Q?is • 'Vl< Ак ^ V ?) => (т. е к е р (& ~- м а н ID (Q 6^ ID ((^ ^)) V e^ [1938].) V 3B\ ") =э (g7 =э ^ V етЛ; V (e.^ V =)^g V ( Доказать следующие теоремы о ЗВ))\ %)) V <?/£)', рА V сё)\
50 ГЛ. 1. ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ (I) HLl erf V (S3 V &) => SB V {orf V (Ю HLl (1) f-Ll (m) q^ Ll (n) erf => Ш =>&),<&>£=> <0B HLl^ =5 g; (о) если Г, ©t^I-Liq®, то Г f-Ll erf ^ о® (теорема дедукции); (p) J&ZDerf, ~\Sd=>orf h-Ll ©^; (Я) l~LlG7^ тогда и только тогда, когда ©^ есть тавтология. (Указание. Доказать утверждения, аналогичные лемме 1.12 и предложению 1.13.) 2. (Р о с с е р [1953].) Доказать следующие утверждения о теории L2: (a) erf =э ^ S3 з g hLs "1 П (b) h (c) ь- (g) (h) (0 (3) 0) (^ =5 ^, ^ zd g h-L2 (m) e^ Z5 g (n) <2®zDg? (P) (q) (0 (t) Если Г, ^ HL2<2®, то Г HL2<37^2D<^8 (теорема дедукции); (V) o^ ZD ^ 1 q^ =5 ^g HL2 «a®; (w) Hl2 Q7^ тогда и только тогда, когда q^ есть тавтология. (Указание. Доказать аналоги леммы 1.12 и предложения 1.13.) 3. Доказать, что множества всех теорем теорий L и L8 совпадают. 4. (К л и н и [1952].) Доказать следующие предложения о теории L4: (a) Ь-цс^гэ^; (b) Если Г, 0т^ Ь-иа®, то Tt-LiG^ id SB (теорема дедукции);
§ б ДРУГИЕ АКСИОМАТИЗАЦИИ 61 (с) яЛ => «58, S3 zd % У-^оЛ =э Ъ\ (e) Si, (f) к,^ (g) К41 (h) hL4^ (j) hL4(l (k) |— l4©^ тогда и только тогда, когда oS? есть тавтология, (Доказать аналоги леммы 1.12 и предложения 1.13.) Для исчисления высказываний могут быть построены аксиоматизации и с одной единственной схемой аксиом. Так, например, если за примитивные связки принять ~| и id, то при единственном правиле вывода — modus ponens — достаточной оказывается схема аксиом: > %) => Щ => К* => (Мередит [1963]). Другим примером такого рода может служить система Н и к о д а [1917], в которой употребляется единственная связка | (дизъюнкция отрицаний), имеется единственное правило вывода, по которому сё следует из о/l и orf |(<a©|?f), и единственная схема аксиом Дальнейшие сведения из этсй области, в том числе и исторический обзор, можно найти в книге Чёрча [1956]. Упражнения 1. Доказать, что если схему аксиом (A3) в системе L заменить схемой аксиом (~| Qfg id ~] <ffl) zd (o53 zd q/£), to класс теорем от этого не изменится. 2. Интуиционистским исчислением высказываний называется система Lj, которая получается из системы L4 заменой в ней схемы аксиом (10) схемой (10)': (a) Рассмотрим п-\- 1-значную логику с единственным выделенным истинностным значением 0 и связками, определяемыми следующим образом: ~~| q/£ есть 0, если Q/g есть п, и ~] оД есть п в остальных случаях. q?£' && всегда равно максимуму значений ©^ и <&9, a q/£ \J cW — их минимуму; o/g zd <ffl есть 0, если значение s^ не меньше значения <$?, в противном случае ^^ Г) о^ есть <^. Показать, что все теоремы Lj являются выделенными. (b) Лх V "1 ^i и 1 "Mi ^ ^i не принадлежат к числу теорем Lj (c) Для любого т формула (Дх-УЩ V ... V (Лг^Лт) V И.5зЛа) V ... V HiSi4m) V •-. V (Лт_1 = Лш) не является теоремой. (d) (Гёдель [1933].) Теория Lj не является подходящей ни для какой конечной многозначной логики.
52 ГЛ. 1 ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ (е) (i) Если Г, Ojg\-L <£ftt то Гнье/зЙ (теорема дедукции); (ii) osl zd S3, SB =5 *ё Нц &4 з 4S\ (iv) h-Ll (V) hLl ц 1 1 1 e^ => 1 e^. ° (^) 1— Lt ~1 ~l ©^ тогда и только тогда, когда ©^ есть тавтология. (8) I—lt "I <2s£ тогда и только тогда, когда ~| qs# есть тавтология. D (h) Если q/1 не содержит связок, отличных от & и ~], то \-L оУ& тогда и только тогда, когда Q^ есть тавтология. Подробнее об интуиционистской логике см. Рейтинг [1956], К лини [1945], Яськовский [1936]. В последней из названных работ доказывается, что интуиционистская система Ц является теорией, подходящей для некоторой многозначной логики с перечислимым множеством истинностных значений. А 3. Пусть (зт^ и SB находятся в отношении R тогда и только тогда, когда b-L©^ = <2©- Доказать, что R есть отношение эквивалентности. Для произвольных классов эквивалентности \<&£\ и \Sd\ пусть [q^\ U [SS] = \<zrf V SB\ \<&f\ П Ш] = \o>f & SB\ и [6^]e[W]. Показать, что порожденные отношением R классы эквивалентности образуют булеву алгебру относительно операций U» П» ~- Эта алгебра называется алгеброй Ланденбаума, порожденной теорией L, и обозначается через L*. Нулевым элементом 0 алгебры L* является класс всех противоречий (т. е. ©трицаний тавтологий). Единицей 1 алгебры L* является класс эквивалентности, состоящий из всех тавтологий. Заметим, что \-lgs£ => SB тогда и только тогда, когда \qt£\^\SB\ в L*, и что Н l q^ = SB тогда и только тогда, когда [а*£] = [SB]. Доказать, что всякая булева функция / (построенная с помощью U» П» ~ из переменных, 0 и 1) тождественно равна 1 тогда и только тогда, когда [~l/#, где/# получается из / заменой (Ji П. "э О, 1 соответственно на V» &> ~1> ^i & 1 Аи А V 1 А-
Глава 2 Теории первого порядка § 1. Кванторы Существуют такие виды логических рассуждений, которые не могут быть обоснованы в рамках исчисления высказываний. Вот примеры таких рассуждений: (1) Всякий друг Мартина есть друг Джона. Питер не есть друг Джона. Следовательно, Питер не есть друг Мартина. (2) Все люди бессмертны. Сократ — человек. Следовательно, Сократ бессмертен. (3) Все люди — животные. Следовательно, голова человека есть голова животного. Корректность этих умозаключений покоится не только на истинностно-функциональных отношениях между входящими в них предложениями, но и на внутренней структуре самих предложений, а также и на понимании таких выражений, как «все», «всякий» и т. д. Чтобы сделать более прозрачной структуру сложных высказываний, удобно ввести специальные обозначения для некоторых часто встречающихся выражений. Если Р (х) означает, что х обладает свойством Р, то договоримся посредством VxP(x) обозначать утверждение: «для всякого предмета х свойство Р выполнено», или, другими словами, «все х обладают свойством Р». Запись ЗхР (х) будет означать, что «существует предмет х, обладающий свойством Р», т. е. «существует по крайней мере один предмет ху обладающий свойством Р». В выражении VxP(x) часть \/х называется квантором всеобщности, а часть Зх в выражении ЗхР (х) называется квантором существования. Изучение кванторов как логических операций и связанных с ними понятий и составляет основной предмет этой главы (отсюда и название этой главы: «Quantification Theory» в оригинале. — Прим. перев.). Примеры. Пусть ту /, /?, s, F (х> у), М (х), / (х), Л (х), h (x) обозначают соответственно «Мартин», «Джон»*, «Питер», «Сократ», «х есть друг у», «х есть человек», «х бессмертен», «х есть животное», «голова х». Тогда рассуждения (1) — (3) можно записать следующим образом: (1') IF (P. I) m)
54 гл. 2. теории первого порядка (2') Vx(M(x)idI(x)) M(s) I(s) (3') Vx (Эу (х = h (у) Ш (у)) iD3y(x = h (у) & Л (у)))' Заметим, что справедливость этих заключений не зависит от того, какой конкретный смысл имеют символы т, /, р, s, F, М, /, А и /г. Подобно тому как пропозициональные формы были использованы для выявления логической структуры, зависящей только от пропозициональных связок, можно и умозаключения (такие, как (1) — (3)), содержащие кванторы, представлять в абстрактной форме, как это было сделано в (Г) — (3'). Для этой цели мы используем запятые, скобки, символы исчисления высказываний ~| и id, предметные {индивидные) переменные хъ Хъ,...9хп,..., предметные (индивидные) константы ah а2,..., аю..., предикатные буквы Л{, А\,..., А{,... и функциональные буквы /], /\,... ...,/£,... Верхний индекс предикатной или функциональной буквы указывает число аргументов, а нижний индекс служит для различения букв с одним и тем же числом аргументов. В приведенных выше примерах т, у, р, s были предметными константами, F и = — двуместными предикатными буквами (т. е. буквами с двумя аргументами), Ж, /, А — одноместными предикатными буквами (т. е. буквами с одним аргументом), буква h играла роль функциональной буквы с одним аргументом. Функциональные буквы, примененные к предметным переменным и константам, порождают термы. Точнее: (a) всякая предметная переменная или предметная константа есть терм; (b) если fl — функциональная буква и th..., tn — термы, то /Г (th..., tn) есть терм; (c) выражение является термом только в том случае, если это следует из правил (а) и (Ь). Предикатные буквы, примененные к термам, порождают элементарные формулы, или точнее: если А? — предикатная буква, a th..., tn — термы, то A? (th..., tn) — элементарная формула. Формулы исчисления предикатов определяются следующим образом: (a) всякая элементарная формула есть формула, (b) если orf и М — формулы и у—предметная переменная, то каждое из выражений (~\&#)У (о/£ zd Sd) и (Vyosf) есть формула, (c) выражение является формулой только в том случае, если это следует из правил (а) и (Ь). В выражении (\/у&т#) «&>#» называется областью действия квантора Уу. Заметим, что ©^ может и не содержать переменной у, в таком случае мы обычно считаем, что содержательный смысл оЛ и (Ууа^) одинаков. Выражения o^kSS, оЛ\1<Ш, &?£ = <£$ определяются так же, как в системе L исчисления высказываний (см. стр. 38). Нет
§ 1. КВАНТОРЫ 55 необходимости включать в число основных символов знак Э для квантора существования, так как мы можем определить ЗхоД как сокращенную запись для П (Ух (~]о^)). Такое определение, очевидно, правильно отражает содержательный смысл кванторов. Оставляя в силе принятые в главе 1 соглашения об опускании скобок, договоримся дополнительно считать, что кванторы У/у и Зу располагаются по силе между связками =, и и связками \/, &, ~|. Примеры. Вместо ((Vj^ A\ (xi)) id А\ (xh x%)) пишем Vjct A\ (х{) иэ zd А\ (хъ х2), а вместо (V^i (A\ (x{) \J A\ (хъ х2))) пишем Vxx A\ (xt) V Упражнение Восстановить скобки в Vx2 ~\ А\ (xt) => А\ (хи хш, х3) V V^ A\ (х,) IVatj А\ (xt) zd Зх2 АЦхш) =э А\ (хи хш) V А\ (хш). Договоримся также опускать скобки, в которые заключается формула Qe^ в формулах вида Qi (Q©^), где Q и Qt — любые кванторы. Пример. Вместо (V^i (3jc2 (Vjq^i (хи x2, Xl)))) пишем формулу 3V д Упражнение Восстановить скобки в Wxt Vx3 Vx4 Л} (Xj) => Л^ (д:8) & ~] Л[ (xx) и в 3*! Ул:2 Зх3 Л{ (^i) V Зх2 "1 V*3 Л? (лг8, х2). Введем понятия свободного и связанного вхождения переменной в формулу: вхождение переменной х в данную формулу называется связанным, если х является переменной входящего в эту формулу квантора Vjc или находится в области действия входящего в эту формулу квантора Vx; в противном случае вхождение переменной х в данную формулу называется свободным. Пр (i) (ii) (iii) и мер ы A* (xi, лг2); A1 (v y\ —i V/ у ( A ( у. XT2) ID V.X Единственное в формуле (i) вхождение переменной Vi свободно. Первое вхождение переменной Xi в формулу (ii) свободно, а второе и третье — связанные. Все вхождения Х\ в формулу (iii) являются связанными. Каждое вхождение переменной дг2 во всех трех формулах свободно. Заметим, что одна и та же переменная может иметь свободные и связанные вхождения в одну и ту же формулу, как это имеет место, например, в (ii). Заметим также, что вхождение переменной может быть
56 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА связанным в той или иной формуле ©^ и в то же время свободным в некоторой подформуле формулы orf\ так, например, первое вхождение Х\ в формулу (ii) свободно, но (ii) является подформулой формулы (iii), где то же вхождение Х\ оказывается связанным. Упражнения Указать свободные и связанные вхождения переменных в следующие формулы: 1. Vxs (V*! А\ (xlt xt) zd A\ (*„ xt)). 2. V*2 A\ (xst x2) zd Vx9 A\ (xv хш). 3. (Ул:2 3x, A\ (xly xM9fl (xu хш))) V 1 V^ A\ (*„ f\ (xj). Переменная называется свободной (связанной) переменной в данной формуле, если существуют свободные (связанные) ее вхождения в эту формулу. Таким образом, переменная может быть одновременно свободной и связанной в одной и той же формуле. Такова, например, переменная Х\ в примере (ii). Пусть Xt ,..., Xi —переменные и &# — формула. Не обращая внимания на то, являются ли эти переменные свободными в &£ и существуют ли в orf другие свободные переменные, мы будем иногда применять запись od (Xi у..., Xt ) для обозначения формулы ©^ с тем, чтобы затем через <гт£ (th..., tk) обозначать результат подстановки термов th..., tk соответственно вместо свободных вхождений в о/l (если таковые имеются!) переменных д:^,..., х\. Терм t называется свободным для переменной xt в формуле orfy если никакое свободное вхождение лг* в oSl не лежит в области действия никакого квантора Ухр где Xj—переменная, входящая в t. Примеры, (а) Терм Xj свободен для xt в А\ (jq), но не свободен для Xi в 4xj А\ (х^. Терм f\ (xh х^) свободен для Х\ в Vx2 A\ (xh jc2) z> zd A\ (xx\ но не свободен для хх в Зхг Vx2 А\ (хи х2) =) А\ (хг). (b) Всякий терм, не содержащий переменных, свободен для любой переменной в любой формуле. (c) Терм t свободен для любой переменной в формуле ©^, если никакая переменная терма t не является связанной переменной в о^. (d) X{ свободно для Xi в любой формуле. (e) Всякий терм свободен для хг в <^, если &>€ не содержит свободных вхождений Xi. Упражнения 1. Свободен ли терм /} (хи х2) для xt в формулах А\ (хи х2) => Ул:2Л} (лг2), 2A* (x2, ai)) V Зл:2Л| (хи х2)7 2. Перевести следующие предложения на язык формул: (a) Все рыбы, кроме акул, добры к детям. (b) Либо всякий любитель выпивки весьма общителен, либо некий ростовщик честен и не пьет вина. (c) Не все птицы могут летать.
§ 2 ИНТЕРПРЕТАЦИИ ВЫПОЛНИМОСТЬ И ИСТИННОСТЬ 57 (d) Либо каждый любит кого-нибудь, и ни один не любит всех; либо некто любит всех, и кто-то не любит никого. (e) Ты можешь обманывать кое-кого все время, ты можешь обманывать всех некоторое время, но ты не можешь обманывать всех все время. (i) Некоторые остроумны, только когда пьяны. (g) Ни один политикан не честен. (h) Если кто-нибудь может сделать это, то и Джон может. (i) Всякий, в ком есть упорство, может изучить логику. (]) Если всякий разумный философ — циник и только женщины являются разумными философами, то тогда, если существуют разумные философы, то некоторые из женщин — циники. § 2. Интерпретации. Выполнимость и истинность. Модели Формулы имеют смысл только тогда, когда имеется какая-нибудь интерпретация входящих в нее символов. Под интерпретацией мы будем понимать всякую систему, состоящую из непустого множества D, называемого областью интерпретации, и какого-либо соответствия, относящего каждой предикатной букве Ап. некоторое л-местное отношение в D, каждой функциональной букве /* — некоторую я-местную операцию в D (т. е. функцию, отображающую D" в D) и каждой предметной постоянной at — некоторый элемент из D. При заданной интерпретации предметные переменные мыслятся пробегающими область D этой интерпретации, а связкам ~], и> и кванторам придается их обычный смысл. (Напомним, что всякое ^-местное отношение в D может рассматриваться как некоторое подмножество множества D" всех п-ок элементов из D. Например, если D есть множество человеческих существ, то отношение между двумя людьми, состоящее в том, что первый из них приходится отцом другому, можно отождествить с множеством всех упорядоченных пар (людей) (х, у) таких, что х является отцом у.) Для данной интерпретации всякая формула без свободных переменных (или, иначе, замкнутая формула) представляет собой высказывание, которое истинно или ложно, а всякая формула со свободными переменными выражает некоторое отношение на области интерпретации; это отношение может быть выполнено (истинно) для одних значений переменных из области интерпретации и не выполнено (ложно) для других. Примеры (О А\ (xh лг2); (П) V*2 А\ (xh лг2); (iii) 3x2 Vxi А* {хъ хх). Если мы берем в качестве области множество целых положительных чисел и интерпретируем А\(у, z) как y^z, то (i) представляет отношение y^z, которое выполнено для всех упорядоченных пар (а, Ь) целых положительных чисел таких, что а^Ь; (и) представляет свойство (т. е. отношение с одним аргументом) «для каждого целого положительного у, y^z», которое выполнено только для числа 1; наконец, (Ш)
58 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА оказывается истинным высказыванием, утверждающим существование наименьшего целого положительного числа. Если бы мы взяли в качестве области множество всех целых чисел, то (iii) оказалось бы ложным. Упражнения (1) А1(Д(х» *,), а,); (2) Л? (хи х2) => А\ (x2i Xl); (3) Vxt Vx2 Vx3 (A\ (xlt x2) zd (A\ (x2, *,) zd A\ (xu *,)))• Для следующих интерпретаций и для каждой из формул (1), (2), (3) указать, при каких значениях свободных переменных эти формулы выполнены (если они имеют свободные переменные), или выяснить, являются ли они ложными или истинными высказываниями (если они не содержат свободных переменных). (a) В качестве области берется множество всех целых положительных чисел, А\ (у, z), f\ (xy z) и at интерпретируются соответственно как у ^z, у • z, 1. (b) В качестве области берется множество всех человеческих существ, А\ (У, z)> ft 0>, г) и at интерпретируются соответственно как «у любит z», «z» и «Гитлер». (c) В качестве области берется множество всех множеств целых чисел, А\ (у» z), ff (у, z) и at интерпретируются соответственно как ygz, у U z и О (пустое множество). Понятия выполнимости и истинности интуитивно ясны, но для скептика они могут быть уточнены следующим образом (Тарский [1936]). Пусть дана некоторая интерпретация с областью D, и пусть Е есть множество всех счетных последовательностей элементов из D. Мы сейчас определим, что значит, что формула os£ выполнена на последовательности s = (bi, Ьг,...) из Е при данной интерпретации. Предварительно мы определим одноместную функцию s* со значениями из D и определенную на множестве всех термов. (1) Если терм t есть предметная переменная х-и то s*(£) = bt\ (2) Если терм t есть предметная константа, то s* (t) совпадает с интерпретацией этой константы в D. (3) Если fn есть функциональная буква, интерпретируемая операцией g в D, и fb..., tn — термы, то s* (f}(th...9 *«)) = g(s*(*i),..., s*(*„)). Таким образом, s* — это функция, определяемая последовательностью s и отображающая множество всех термов в D. Если говорить неформально, то для любой последовательности s = (bi, b2,...) и для любого терма t s*(t) есть элемент множества D, который получается в результате подстановки при каждом / элемента Ь/ на места всех вхождений переменной xt в терм t и затем выполнения всех операций интерпретации, соответствующих функциональным буквам терма t. Например, если t есть Д (х3, Д (xh ax))y областью интерпретации служит множество целых чисел, /| и fl интерпретируются соответственно как обычные умножение и сложение, а а\ — как 2; то для всякой последовательности s* =(bi, b^...) целых чисел s* (t) представляет собой целое число b3 X 0>i + 2)- Перейдем теперь к основному определению, которое сформулируем, следуя индуктивным шагам определения формулы.
§ 2 ИНТЕРПРЕТАЦИИ ВЫПОЛНИМОСТЬ И ИСТИННОСТЬ 59 (i) Если &# есть элементарная формула АпЛгъ..., tn) и Вп. есть соответствующее ей отношение в интерпретации, то формула ©^ считается выполненной на последовательности s в том и только в том случае, когда £^(s*(*i),..., s* (£„)), то есть если я-ка (s*(*i),..., s* (tn)) принадлежит отношению Вп. *). (ii) Формула ~]<^ выполнена на s тогда и только тогда, когда формула Q7& не выполнена на s. (iii) Формула od zd <£% выполнена на s тогда и только тогда, когда формула о/б не выполнена на s или когда формула <£% выполнена на s. (iv) Формула \fxi&# выполнена на s тогда и только тогда, когда формула о/£ выполнена на любой последовательности из Е, отличающейся от s не более чем своей 1-й компонентой. Иначе говоря, формула &>£ выполнена на последовательности s = (Ьь Ьг,...) тогда и только тогда, когда подстановка при каждом I символа, представляющего Ь,-, на места всех свободных вхождений х% в оД приводит к истинному в данной интерпретации предложению. Формула ©^ называется истинной (в данной интерпретации) тогда и только тогда, когда она выполнена на всякой последовательности из Е. Формула &# называется ложной (в данной интерпретации), если она не выполнена ни на одной последовательности из S. Данная интерпретация называется моделью для данного множества формул Г, если каждая формула из Г истинна в данной интерпретации. Читателю предоставляется самому убедиться в справедливости формулируемых ниже следствий из определений. (Следствия эти в большинстве своем тоже очевидны, если пользоваться обычными интуитивными понятиями истинности и выполнимости.) (I) o/f ложно в данной интерпретации тогда и только тогда, когда ~\os£ истинно в той же интерпретации, и q^ истинно тогда и только тогда, когда ~}от£ ложно. (II) Никакая формула не может быть одновременно истинной и ложной в одной и той же интерпретации. (III) Если в данной интерпретации истинны о^ и orf id g®, to истинно и S3. *) Так, например, если областью интерпретации служит множество вещественных чисел, а А\ и /{ (х) интерпретируются соответственно как ^ и ех, то формула А[ (/} (xj, хъ) выполнена на последовательности s = (bi, b2,...) тогда и только тогда, когда eb*=^b5. Если мы возьмем в качестве области множество точек плоскости, в качестве интерпретации А\ (х, у. г) отношение «х и у равноудалены от z», a /} (х> у) проинтерпретируем как среднюю точку прямолинейного отрезка с концами в х и у, то формула А\ (f{ (xlt xa), /f (xSf xx), xA) будет выполнена на последовательности s = (Ьь Ь2,...) тогда и только тогда, когда средние точки отрезков с концами blt b2 и b3, bt будут находиться на равном расстоянии от Ъг. Если областью является множество целых чисел, а А\ (х, у} и, v) и а1 интерпретируются соответственно как х • v = u • у и 2, то формула Л}(х3, аи xit х9) выполнена на s = (bx, b2,...) тогда и только то!да, когда bg = 2bj.
60 ГЛ 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА (IV) q/£ zd Si ложно в данной интерпретации тогда и только тогда, когда от£ в этой интерпретации истинно, a Si ложно. (V) (i) &£ &Si выполнено на последовательности s тогда и только тогда, когда о/£ выполнено на s и Si выполнено на s. orf \] Si выполнено на s тогда и только тогда, когда orf выполнено на s или Si выполнено на s. &£ = Si выполнено на s тогда и только тогда, когда либо &# выполнено на s и Si выполнено на s, либо orf не выполнено на s и Si не выполнено на s *). (ii) Зл^ет^ выполнено на s тогда и только тогда, Когда orf выполнено хотя бы на одной последовательности s', отличающейся от 8 *не более чем одной только /-й компонентой*). (VI) о/£ истинно в данной интерпретации тогда и только тогда, когда в этой интерпретации истинно Vjc,-©^. Замыканием данной формулы orf назовем формулу, которая получается приписыванием к о/£ спереди знаков кванторов всеобщности, содержащих в порядке убывания индексов все свободные переменные, входящие в ©^. Замыканием формулы ©^, не содержащей свободных переменных, будем называть саму формулу G7&. (Например, если о/£ есть А\ (х%, х%) id ~] 3at2AJ (*ь *ъ -*з). то замыканием orf будет формула Vjc8Vjc3Vat2VХ\о/1.) (VII) Всякий частный случай всякой тавтологии истинен во всякой интерпретации. (Частным случаем данной пропозициональной формы мы называем всякую формулу, получаемую подстановкой формул в эту пропозициональную форму вместо пропозициональных букв с тем условием, чтобы вместо всех вхождений одной и той же пропозициональной буквы подставлялась одна и та же формула.) (Указание. Показать, что все частные случаи аксиом системы L истинны, а затем применить (III) и предложение 1.13.) (VIII) Пусть свободные переменные (если таковые имеются) формулы &># содержатся среди переменных xt ,..., xt . Тогда если у последовательностей s и s' компоненты с номерами ih ..., tn совпадают, то формула О7# выполнена на s тогда и только тогда, когда она выполнена на s'. (Указание. Индукция по числу связок и кванторов в ©^. Сначала доказать, что если переменные терма t встречаются среди x-t ,... , x-t , а члены последовательностей s и s' с номерами ih..., in совпадают, то s* (£) = (s')* (£). В частности, если t не содержит переменных, то s*(^) = = s* (t) для любых вообще последовательностей Si и S2.) (Хотя, в силу (VIII), всякая формула с п свободными переменными выполнена или не выполнена по существу только на я-ках, а не на бесконечных последовательностях, все же общую теорию выполнимости для всех формул сразу удобнее развивать в терминах не конечных, а бесконечных последовательностей.) *) Напомним, что ojg &Si, os? V Si, o/g^Si, "^Xiostf являются сокращениями для ~\{q^zd }SB), Ыэ^8, (&t'■=><£%)&{Si'3^) и IVjfil^ соответственно.
§ 2 ИНТЕРПРЕТАЦИИ.ВЫПОЛНИМОСТЬ И ИСТИННОСТЬ 61 Множество всех я-ок (bf,..., bt- ) элементов области D таких, что формула od выполнена на всякой последовательности s, у которой /гя, ... ..., /л-я компоненты совпадают соответственно с bt-, ..., bt- , называется отношением (или свойством) интерпретации, соответствующим формуле ©^*). Пусть, например, областью D служит множество всех человеческих существ, А\ (х,у) и А% (х,у) интерпретируются соответственно как «х есть брат у» и «х есть родитель у»; тогда бинарное отношение в D, соответствующее формуле Зх3(А1(хь х3)& А\(х& х2)), представляет собой отношение родства, связывающее дядю и племянника. Если в качестве области D взять множество целых положительных чисел, a A\,f\ и ах интерпретировать соответственно как =*, умножение и 1, то формуле 1 А\ (хь аг) & Vx2 (3x3Al (хъ fl (x2, x8)) id А\ (х2, хг) V А\ (х2, аг)) будет соответствовать в указанном смысле свойство числа быть простым. (IX) Если формула а^ замкнута, то в любой данной интерпретации либо истинно е^, либо истинно "| о/£ (т. е. ложно orff), (Указание. Следует из (VIII).) При этом, разумеется, orf может быть истинно в одних интерпретациях и ложно в других (например, А\ (аг)). Незамкнутая, т. е. содержащая свободные переменные, формула о^ может в некоторых интерпретациях быть и не истинной и не ложной. Пусть, например, orf есть А\(хъ х2). Рассмотрим интерпретацию, областью которой служит множество целых чисел и в которой А\(хь х2) интерпретируется как х<у. В этой интерпретации <&& выполнено только на последовательностях s = (bi, b2, ...), удовлетворяющих условию bi <C b2. Следовательно, в этой интерпретации рассматриваемая формула ad не истинна и не ложна. (X) Лемма. Пусть t uv — термы, з — последовательность из 12, f получается из t подстановкой v вместо всех вхождений х{ и s' получается из s заменой в ней ее i-й компоненты на s* (v)\ тогда s* (tf) = (s')* (й). (Указание. Индукция по длине t**).) Пусть теперь os£(xt) — формула, t—терм, свободный для xt в оЛ (xi), и о/£ (0 — формула, полученная подстановкой t вместо всех свободных вхождений xt в o/g (xt). Утверждается, что формула od (t) выполнена на последовательности s = (Ъь Ь2, ...) тогда и только тогда, когда orf (xt) выполнена на последовательности s', полученной из s подстановкой s* (t) в s вместо Ь/. (Указание. Индукция по числу связок и кванторов в оД (xi) с применением леммы.) Следствие. Если на последовательности s выполнена формула 4xi<2s£(Xi) и терм t свободен для xt в g^(j^), то выполнена и формула &#{t). Следовательно, формула VхгоЛ(xt)zDos£(t) истинна в каждой интерпретации. *) Здесь предполагается, что xiv ..., #/„ — все свободные переменные формулы q/£. **) Длиной данного выражения называется число всех вхождений символов в это выражение.
62 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА (XI) Если формула о?€ не содержит Х{ в качестве свободной переменной, то формула истинна во всякой интерпретации. Упражнение Доказать (I) — (XI). В качестве примера докажем (XI). Допустим, что (XI) неверно. Это значит, что при некоторых &£ и S3 формула Vxi (^ id S3) => id (qt# id VxiS3) не истинна в некоторой интерпретации. Согласно пункту (Hi) последнего определения, должна существовать последовательность s, на которой Vatj (o7f =э S3) выполнено, a (q^ id Vxi(£@) не выполнено. Тогда опять по тому же пункту (ш) на этой последовательности s выполнено q^ и не выполнено V^XiS3. Следовательно, в силу пункта (iv) того же определения, существует последовательность s', быть может, отличающаяся от s одной лишь t-й компонентой, на которой не выполнено S3. Поскольку хг не является свободной переменной ни в Улг,- (^^ id S3), ни в ^т^, а сами эти формулы выполнены на s, то, в силу (VIII), они выполнены и на s\ Из того, что Vxi(o/£ id S3) выполнено на s', согласно (iv) вытекает, что и оД id S3 выполнено на s\ Таким образом, o/g id <£J3 и q/£ выполнены на s', откуда, по пункту (ш) определения, следует, что и S3 выполнено на s\ Мы пришли к противоречию с тем, что S3 не выполнено на s\ (XI) доказано. Формула оД называется логически общезначимой (в исчислении предикатов), если она истинна в каждой интерпретации. Формула orf называется выполнимой (в исчислении предикатов), если существует интерпретация, в которой о/£ выполнима хотя бы на одной последовательности из S. Очевидно, что формула о/£ логически общезначима тогда и только тогда, когда формула ~\о/£ не является выполнимой, и формула ©^ выполнима тогда и только тогда, когда формула П©^ не является логически общезначимой. Как мы знаем, во всякой интерпретации всякая замкнутая формула оД или истинна или ложна, т. е. выполнима либо на каждой последовательности, либо ни на одной. Следовательно, всякая замкнутая формула orf выполнима тогда и только тогда, когда она истинна в какой-нибудь интерпретации. Будем называть формулу ©^ противоречием (в исчислении предикатов), если формула "1 о/£ является логически общезначимой или, что то же самое, если формула о/g ложна во всякой интерпретации. Говорят, что формула о/£ логически влечет формулу S3 (в исчислении предикатов), если в любой интерпретации формула S3 выполнена на всякой последовательности, на которой выполнена формула оА'. (Более общо говорят, что формула S3 является логическим следствием (в исчислении предикатов) множества Г формул, если во всякой интерпретации формула S3 выполнена на каждой последовательности, на которой выполнены все формулы из Г.) Формулы называются логически эквивалентными (в исчислении предикатов), если каждая из них логически влечет другую.
§ 2 ИНТЕРПРЕТАЦИИ ВЫПОЛНИМОСТЬ И ИСТИННОСТЬ 63 Из этих определений непосредственно вытекают следующие утверждения: (a) Формула od логически влечет формулу S3 тогда и только тогда, когда формула es# id S3 логически общезначима. (b) Формулы orf и S3 логически эквивалентны тогда и только тогда, когда формула ©^ = 0® логически общезначима. (c) Если формула od логически влечет формулу S3 и osg истинно в данной интерпретации, то в этой же интерпретации истинно и S3. (d) Если формула S3 является логическим следствием некоторого множества Г формул, истинных в данной интерпретации, то в этой интерпретации истинна и формула S3. Всякое предложение какого-нибудь формального или естественного языка называется логически истинным (в исчислении предикатов), если оно является частным случаем некоторой логически общезначимой формулы, и называется логически ложным (в исчислении предикатов), если оно есть частный случай некоторого противоречия (в исчислении предикатов) *). Примеры. 1. Всякий частный случай тавтологии логически общезначим (VII). 2. Если ©^ не содержит х свободно, то Va: (os£ id S3) zd (gs£ id id 4xS3) логически общезначимо (XI). 3. Если t свободен для х в о/£, то ^xo/Z (x) id qs£ (t) логически общезначимо (X). 4. Формула У/хъЗххАЦхь x^)z^3x^x^A\{Xb x$ не является логически общезначимой. В качестве контрпримера рассмотрим область D, состоящую из всех целых чисел, и интерпретацию А\(у, z) посредством y<z. Тогда Vj^BjcHi (хь х2) истинно, a 3x{ix^A\{xh Jc2) ложно. Упражнения 1. Показать, что следующие формулы не являются логически общезначимыми: (a) (b) [V^ (A\ (x,) V A\ (xx))] id [(V-Mi (xt)) V 2. Показать, что следующие формулы логически общезначимы: (а) @/1 (f) id iLXio/g (х{)у если t свободен для xt в &#\ (b) (с) (d) ^х1а^=-]Зх^а^; (e) Vxi (q^idSS)^ (VxiQs£ id (i) (Vxiorf & VxtS3) = VXi (orf & S3)\ (g) (Vxiorf V Vx/Q®) id Vxi {orf V S3)\ (h) Ijc&jcjorf == 3xj3xiQs£; (i) ixiVXjesf id Vxj3xia7£. *) В дальнейшем слова «в исчислении предикатов» мы будем опускать.
64 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА 3. Доказать, что замкнутая формула &# логически влечет формулу 3d тогда п только тогда, когда SB истинна во всякой интерпретации, в которой истинна orf. (Это, вообще говоря, неверно, если orf содержит свободные переменные. Например, пусть qt£ есть А\ (xt) и <£В есть Vx^J (xt). Тогда, в силу (VI), $3 истинна, если истинна а/£. Предлагается построить интерпретацию, показывающую, что o/g не влечет логически $$.) 4. Показать, что формулы (a) 3xVy (А* (лг, у)&~]А\ (у, х) => [А\ (х, х) = А\ (у, у)]); (b) V*VyVz (A\ (х, у) к А\ (у, z) zd A\ (х, г)) & & V* 1 А\ (х, х) => ixVy "] А\ (*, у)) (c) VxVyVz {А\ (х, х) & (Л? (х, z) zd А\ (х, у) V А* (у, г))) zd 3yVzA\ (у, z) не являются логически общезначимыми. 5. Доказать, что всякая формула q/£ со свободными переменными уи ... ,уп выполнима тогда и только тогда, когда выполнима формула 3yi ... 1упо/£. 6. Введя подходящие обозначения, записать предложения, участвующие в нижеследующих выводах, в виде формул и выяснить, в каких случаях конъюнкция посылок логически влечет заключение. (a) Всякий, кто находится в здравом уме, может понимать математику. Ни один из сыновей Гегеля не может понимать математику. Сумасшедшие не допускаются к голосованию. Следовательно, никто из сыновей Гегеля не допускается к голосованию. (b) Для любого множества х существует множество у такое, что мощность у больше мощности х. Если х включено в у, то мощность х не больше мощности у. Всякое множество включено в V. Следовательно, V не множество. (c) Если всякий предок предка данного индивидуума есть также предок того же индивидуума и никакой индивидуум не есть предок самого себя, то должен существовать некто, не имеющий предков. (d) Всякий парикмахер в Джонсвилле бреет всех тех и только тех, кто не бреется сам. Следовательно, в Джонсвилле нет ни одного парикмахера. 7. Привести пример логически общезначимой формулы, которая не является частным случаем тавтологии. Показать, однако, что всякая логически общезначимая открытая формула (т. е. формула без кванторов) является частным случаем некоторой тавтологии. § 3. Теории первого порядка В случае пропозиционального исчисления метод истинностных таблиц дает нам эффективный способ проверки, является ли данная пропозициональная форма тавтологией. Однако представляется сомнительным существование эффективного процесса, позволяющего для любой данной формулы решать вопрос о том, является ли она логически общезначимой, поскольку теперь уже для каждой формулы приходится иметь дело с проверкой ее истинности в интерпретациях с областями, вообще говоря, сколь угодно большими конечными, а также и бесконечными. И в самом деле, в дальнейшем мы увидим, что, в соответствии с некоторым совершенно естественным определением понятия «эффективности», действительно может быть доказана невозможность эффективного способа распознавать логическую общезначимость. Аксиоматический метод, который был, пожалуй, излишней роскошью при изучении пропозиционального исчисления, представляется, таким образом, необходимым при изучении
§ 3 ТЕОРИИ ПЕРВОГО ПОРЯДКА 65 формул, содержащих кванторы *), и поэтому мы теперь обращаемся к рассмотрению теорий первого порядка **) (или, иначе, элементарных теорий). Символами всякой теории К первого порядка служат по существу те же символы, которые мы ввели ранее в этой главе: пропозициональные связки ~|, ^>"> знаки пунктуации ( , ), , (строго говоря, запятая не является необходимой, но удобна для облегчения чтения формул); счетное множество предметных переменных xh хъ ...; непустое, конечное или счетное, множество предикатных букв Л] (п, у'^1); конечное (возможно, и пустое) или счетное множество функциональных букв fj (пу /^1); и, наконец, конечное (тоже, возможно, пустое) или счетное множество предметных констант а* (/^1). Таким образом, в теории К могут отсутствовать некоторые или даже все функциональные буквы и предметные константы, а также некоторые — но не все! — предикатные буквы. Различные теории могут отличаться друг ог друга по составу символов. Сформулированные в § 1 определения терма, формулы и пропозициональных связок &, V» = остаются в силе для любой теории первого порядка. Разумеется, в случае каждой конкретной теории К в построении термов и формул участвуют только те символы, которые принадлежат теории К. Аксиомы теории К разбиваются на два класса: логические аксиомы и собственные (или нелогические) аксиомы. Логические аксиомы', каковы бы ни были формулы orf, S3 и £f теории К, следующие формулы являются логическими аксиомами теории К (1) orf zd (SB zd &f)\ (2) (е^ id (Si zd &)) id ((erf idS3)zd(q^i *) Имеются еще и другие доводы в пользу аксиоматического подхода. Концепции и построения, включающие в себя понятие интерпретации и связанные с ним понятия истины, модели и т. п., часто называются семантическими в отличие от так называемый синтаксических концепций, восходящих к простым отношениям между символами и выражениями точных формальных языков. Поскольку семантические понятия носят теоретико-множественный характер, а теория множеств, по причине парадоксов, представляется в известной степени шаткой основой для исследований в области математической логики, то многие логики считают более надежным синтаксический подход, состоящий в изучении формальных аксиоматических теорий с применением лишь довольно слабых арифметических методов. Подробнее об этом см. в первоначальных исследованиях в области семантики Тарского [1936], К лини [1952], Чёрча [1956] и Гильберта и Бернайса [1934]. **) Слова «первого порядка» указывают на отличие теорий, которые мы будем изучать, от таких теорий, в которых либо допускаются предикаты, имеющие в качестве возможных значений своих аргументов другие предикаты и функции, либо допускаются кванторы по предикатам или кванторы по функциям. Теорий первого порядка хватает для выражения известных математических теорий, и, во всяком случае, большинство теорий высших порядков может быть подходящим образом «переведено» на язык первого порядка. Примеры теорий высших порядков можно найти у Чёрча [1940], Гёделя [1931], Тарского [1933], Хазенъегера и Шольца [1961; §§ 200-219]. 3 Э. Мендельсон j
66 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА (3) О S3 ID 1 Q7f) ID (О S3 ID от?) ID S3)', (4) \fx[<?st? (x'i) id Qyf (t), где &>£ (xt) есть формула теории К и t есть терм теории К, свободный для Х{ в о/6 (Х(). Заметим, что t может совпадать с хь и тогда мы получаем аксиому V' х^ (xt) id оЛ (xt). (5) Vxi(o7£iDQ%})zD(QsfiD V-T/q®), если формула о/? не содержит свободных вхождений xt. Собственные аксиомы: таковые не могут быть сформулированы в общем случае, ибо меняются от теории к теории. Теория первого порядка, не содержащая собственных аксиом, называется исчислением предикатов первого порядка. Правилами вывода во всякой теории первого порядка являются (i) Modus ponens: из orf и o/g id S3 следует S3. (ii) Правило обобщения (или связывания квантором всеобщности): из &# следует V^хго^, (В дальнейшем применение этих правил будет сокращенно отмечаться соответственно посредством МР и Gen (от английского слова «Generalization»).) Моделью теории первого порядка К называется всякая интерпретация, в которой истинны все аксиомы теории К. В силу (III) и (VI) на стр. 59 — 60, если правила modus ponens и обобщения применяются к истинным в данной интерпретации формулам, то результатом являются формулы, также истинные в той же интерпретации. Следовательно, и всякая теорема теории К истинна во всякой ее модели. Как мы увидим позже, логические аксиомы выбраны таким образом, что множество логических следствий (в семантическом смысле, см. стр. 62) аксиом теории К в точности совпадает с множеством теорем теории К. В частности, для исчисления предикатов первого порядка оказывается, что множество его теорем совпадает с множеством логически общезначимых формул. Ограничения, содержащиеся в формулировках схем аксиом (4) и (5), требуют некоторых пояснений. Если бы, в случае схемы (4), терм t мог не быть свободным для xt в ©т^, то стал бы возможным следующий неприятный результат. Пусть от€{хх) есть ~\Чх2А\(хъ х2) и t есть х2. Заметим, что тогда терм t не свободен для х± в о/£ (х{). Рассмотрим такой частный случай схемы аксиом (4): Vxi (I Vx2A\ (хь х2)) id "I Vx2A\ (x2> x2)} (*) и возьмем в качестве интерпретации любую область; содержащую не менее двух элементов, а в качестве Af — отношение тождества. Тогда посылка в (*) истинна, а заключение ложно. Для схемы (5) отказ от требования, чтобы xt не входило свободно в от#, также приводит к неприятностям. Пусть, например, orf и SS представляют собой А\ (х^. Таким образом, сейчас Xi свободно входит в q/Z. Рассмотрим частный случай схемы (5): V*! (А{ (хг) => А\ (л*)) id (А\ (хг) id \fXlA\ (xj). (**)
§ 4. СВОЙСТВА ТЕОРИЙ ПЕРВОГО ПОРЯДКА 67 Антецедент в (**), очевидно, логически общезначим. Однако если мы возьмем какую-нибудь интерпретацию, в которой Л\ выполнено для некоторых, но не для всех элементов области, то обнаружим, что консек- вент не является истинным. Примеры теорий первого порядка. (i) Теория частичного упорядочения. Пусть К содержит единственную предикатную букву А\ и не содержит функциональных букв и предметных констант. Вместо А\(хь лг2) и ]i4|(xh Jt2) будем соответственно писать Х\ < х<2 и Х\ <£ л;2. Пусть, наконец, К содержит две собственные аксиомы: (a) Vjci (xi < Xi) (иррефлексивность); (b) \/хг Vx2Vx3 (Xi < jc2 & x2 < хъ id Xi < x3) (транзитивность). Всякая модель этой теории называется частично упорядоченной структурой. (и) Теория групп. Пусть К имеет одну предикатную букву А\, одну функциональную букву f\ и одну предметную константу а1в (В соответствии с обычными обозначениями, мы будем писать: t = s вместо А\ (t, s), t-\-s вместо f\ (t, s) и 0 вместо а^) Собственными аксиомами теории К являются формулы: (a) VjciVat2Vjc3 (х\ -\- (лг2 -f- лг3) = C*i -f- -^з) -f- ^з) (ассоциативность); (b) >/xl(0 + x1 = xl); (c) Vati3a:2 (хч -|- Х\ = 0) (существование обратного элемента); (d) Vati (x\ = х{) (рефлексивность равенства); (e) VxiVjc2(xi=jtr2 id Хъ = х{) (симметричность равенства); (f) VxiУдг2Vjc3 (Xi = х% id (jc2 = x3 id Xi = хг)) (транзитивность равенства); (g) VXi VX2V^T3 (X2 = XdID (X) -f X2 = Xt -f- ЛГ3 & ^2 + ^1 = X3 + ^l)) (подстановочность равенства). Всякая модель этой теории называется группой. Если в группе истинна формула Ух1Ух%(х1-\-Х2 = Х2-\-х1)> то группа называется абелевой, или коммутативной. Теория частичного упорядочения и теория групп обе являются эффективно аксиоматизированными. Вообще всякая теория с конечным числом собственных аксиом является эффективно аксиоматизированной, ибо, как нетрудно видеть, имеется возможность для любой Данной формулы эффективно решать вопрос, принадлежит ли она к числу логических аксиом (см. стр. 65—66). § 4. Свойства теорий первого порядка Все результаты этого параграфа относятся (если нет специальной оговорки) к произвольной теории первого порядка К. Заметим, что всякая теория первого порядка является формальной теорией (см. стр. 36). 3»
"о ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА Предложение 2.1. Если формула от? теории К есть частный случай тавтологии, то о/£ есть теорема в К и может быть выведена с употреблением одних только схем аксиом (1) — (3) и правила modus ponens. Доказательство. Пусть о/£ получена из некоторой тавтологии W с помощью подстановок. Согласно предложению 1.13, существует вывод W ъ L. Сделаем теперь всюду в этом выводе подстановки по следующему правилу: (i) если какая-нибудь пропозициональная буква входит в W, то на места всех ее вхождений в каждую формулу вывода подставляем ту формулу теории К, которая подставлялась в W на места вхождений той же буквы при построении osf, (ii) если данная пропозициональная буква не входит в W, то на места всех ее вхождений в формулы вывода подставляем произвольную (одну и ту же для данной буквы) формулу теории К. Полученная таким образом последовательность формул и будет выводом формулы о/£ в К, причем выводом, использующим только схемы аксиом (1) — (3) и МР. Предложение 2.2. Всякое исчисление предикатов первого порядка К непротиворечиво. Доказательство. Для произвольной формулы о^ обозначим через Ь(от£) выражение, получающееся в результате следующего преобразования формулы от€\ в о/£ опускаются все кванторы и термы (вместе с соответствующими скобками и запятыми). Например, h(У х±А\ (xh х2) id А\ (хг)) есть А\ => Л}, h (~| VjMS (xiy ah xn) id A\ (jc4)) есть ~| А\ zd Afy По существу h(os£) всегда является пропозициональной формой, в которой роль пропозициональных букв играют символы АК Очевидно, h (П &£) = ~~| h {os€) и h (о/ё id &) = h (osf) zd h (2$?). Для всякой аксиомы osf, получаемой по какой-нибудь из схем аксиом (1) — (5), \\(&£) является тавтологией. Это очевидно для (1) — (3). Всякий частный случай Vjqqt^ (Xi) id gs£ (t) схемы (4) преобразуется операцией h в тавтологию вида <э® гэ о®, а всякий частный случай Vjq (orf id SB) zd (g/£ id Vj^-q®) схемы (5) преобразуется в тавтологию вида (J^ id Й) id (£$ id Щ. Наконец, если h (&£) и h(s7^iD<2®) — тавтологии, то, в силу предложения 1.1, и h(^) — тавтология; и если h(<2^) тавтология, то и h(Vx/©^) — тавтология, ибо результаты применения операции h к оД и \fxiG?£ совпадают. Следовательно, если оУб есть теорема в К, то h(os£) есть тавтология. Если бы существовала формула 3& в К такая, что \— к&5# и [— к~|®®> то оба выражения h(o®) и h(~|^) были бы тавтологиями, что невозможно. Таким образом, К непротиворечиво. (Операция Ji равносильна интерпретации К в области, состоящей из одного элемента. Все теоремы К истинны в такой интерпретации, однако ни в какой интерпретации никакая формула не может быть истинной вместе со своим отрицанием.) Теорема дедукции для пропозиционального исчисления (предложение 1.8) без соответствующей модификации не может быть проведена для произвольных теорий первого порядка К. Например,
§ 4. СВОЙСТВА ТЕОРИЙ ПЕРВОГО ПОРЯДКА 69 для любой формулы оЛ', однако отнюдь не всегда |— к©^ id \fx o?£. В самом деле, рассмотрим область, содержащую по меньшей мере два элемента end. Пусть К есть некоторое исчисление предикатов, и пусть о?£ есть y4J(j^i). Проинтерпретируем А\ каким-нибудь свойством, которым обладает только элемент с. То1да А\(х\) выполнено на всякой последовательности s = (bb b2, ...)> где bi —с, однако \fx\A (xi) не выполнено вообще ни на какой последовательности. Следовательно, формула А\ (Х\) z> Vx\A\ (Х\) не истинна в этой интерпретации и потому не является логически общезначимой. Легко, однако, видеть (предложение 2.7), что всякая теорема всякого исчисления предикатов является логически общезначимой. Однако некоторая ослабленная, но все же полезная форма теоремы дедукции и здесь может быть доказана. Пусть от£ — какая-нибудь формула, принадлежащая заданному множеству Г формул, и пусть SBh ..., SBn— какой-нибудь вывод из Г, снабженный обоснованием каждого в нем шага. Мы будем говорить, что SB{ зависит от о/£ в этом выводе, если (i) SBt есть od и обоснованием SBt служит принадлежность SBt к Г, или (ii) SBt обосновано как непосредственное следствие по МР или Gen некоторых предшествующих в этом выводе формул, из которых по крайней мере одна зависит от orf. Пример. <2^, Vati©^ id *ё \— V!Х\ё\ (SBt) q/1 - гипотеза (q^j), Gen d £f гипотеза (S32), (<^з), МР (<^4), Gen Здесь (q®0 зависит от е^, (<з®з) зависит от <2?£, (<&г) зависит от Vxiosf id ^, (S8l) зависит от &# и от Ухю^ id ^ и (о®8) зависит от О7# И ОТ yfXiQ7f ID *ё. Предложение 2.3. Если SB не зависит от &# в выводе Г, <2^f |— SBy то Г [— SB. Доказательство. Пусть SBh ..., SBn = SB—вывод SB из Г и оЖ, в котором SB не зависит от orf. В качестве индуктивного предположения допустим, что доказываемое предложение справедливо для всех выводов, длина которых меньше п. Если SB принадлежит Г или есть аксиома, то Г |— SB. Если SB является непосредственным следствием каких-то (одной или двух) предшествующих формул, то, поскольку SB не зависит от оЛ\ не зависит от ©^ и ни одна из этих формул. Следовательно, по индуктивному предположению, из Г выводимы эти (одна или две) формулы, а вместе с ними и SB.
70 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА Предложение 2.4. (Теорема дедукции.) Пусть Г, &#\- SB> и при этом пусть существует такой вывод SB из {Г, &#}, в котором ни при каком применении правила обобщения к формулам, зависящим в этом выводе от q/Z, не связывается квантором никакая свободная переменная формулы о/£. Тогда Г |— ad zd SB. Доказательство. Пусть SBh ..., SBn — SB — удовлетворяющий условию теоремы вывод SB из {Г, ©т^}. Докажем по индукции, что Г f— оД zd SB* для любого /, / ^ п. Если SB{ есть аксиома или принадлежит Г, то Г |— q/Z zd SBh поскольку SBt zd (gs£ zd SBt) — аксиома. Если SBi совпадает с <s^, то Г [— q/Z zdSB{ в силу |— q/£ zd q/Z (предложение 2.1). Если существуют / и k, меньшие /, такие, что SBk есть SBj zd SBh то, согласно индуктивному предположению, Г |— &# zd SBj и Г |— q^ zd {SBj zd SBj). Следовательно, по схеме аксиом (2) и МР, Г |— &£ zd SBt. Предположим, наконец, что существует у, / << /, такое, что SB{ есть y/xkSBj. По предположению, Г \- я/£ id S3p и либо SBj не зависит от orf, либо xk не является свободной переменной формулы оЛ'. Если SBj не зависит от е^, то, в силу предложения 2.3, Г 1~ SBjy и тогда, применяя Gen, получаем Г \- \jxkSBj, т. е. Г |— SB{. По схеме аксиом (1), |— SBt zd (q^ zd SBt). Отсюда, по правилу МР, получаем: Г |— o/lz^SB^ Если xk не является свободной переменной формулы ет/, то, по схеме аксиом (5), \- Vxk (o/£ id SBj) zd (orf zd id ^XkSB j). Так как Г |— qs£ zd SB у, то, по правилу Gen, получаем Г |— Vxk (g?# zd SBj) и, наконец, с помощью МР: Г |— o/l zd ^xkSBjt т. е. Г [— q/£ zd SB{. Этим и завершается индукция. Доказываемое предложение мы получаем при i==n. Условия предложения 2.4 слишком громоздки, и часто полезнее оказываются его более слабые следствия: Следствие 2.5. Если Г, od |— SB и существует вывод, построенный без применения правила обобщения к свободным переменным формулы qt£> то Г |— q/£ zd SB. Следствие 2.6. Если формула о/l замкнута и Г, orf \- SB, то T\-<2^zdSB. Следующее дополнительное заключение можно извлечь из доказательств предложений 2.3 — 2.6. При построении нового вывода, т. е. вывода Г [— o/g zd SB (Г |— SBy в случае предложения 2.3), применение Gen к какой-нибудь формуле, зависящей от некоторой формулы £f из Г, требуется только в том случае, когда и в данном выводе, т. е. в выводе SB из {Г, ©^}, имеется применение Gen (с той же связываемой переменной) к некоторой формуле, зависящей от ¥>. (Нетрудно видеть, что SBj из доказательства предложения 2.4 зависит от той или иной посылки ? из Г в первоначальном выводе тогда и только тогда, когда q/£ zdSBj зависит ют "£ в новом выводе.) Это дополнительное замечание бывает полезно, когда мы хотим применить теорему дедукции несколько раз подряд в процессе доказательства какого-либо утверждения о выводимости, например, чтобы получить Г |- ^ zd (orf Z) SB) из Г, ^, оЛ \- S3. Поэтому в дальнейшем
$ 5. ТЕОРЕМЫ О ПОЛНОТЕ 71 мы будем рассматривать это замечание как часть заключения предложений 2.3 — 2.6. Пример. |— VxiVjc2g^ id Vx2Vjcis^. Доказательство. 1. V-TiVj^s^ гипотеза 2. VjeiV-%2^ =)Vj^2<2^ схема аксиом (4) 3. Vj^ 1, 2, MP 4. Vjc2g^ id s^ схема аксиом (4) 5. <^ 3, 4, MP 6. 1ххоЛ 5, Gen 7. Vx2V^k2^ 6, Gen Таким образом, в силу 1 — 7, мы имеем ^ X\i х^о/Р |— причем в построенном выводе ни при одном применении Gen не связывается свободная переменная формулы VxiVx2a^. Поэтому, на основании следствия 2.5, [— VV^ VV£ Упражнения 1. Показать, что (a) Ь (b) Ь (c) h (d) h 2. Пусть К — теория первого порядка, и пусть К# — теория со следующими аксиомами: (1) Yyi... VynQ/g, где ет^ — произвольная аксиома теории К, а уи ... ..., .Уя (л ^0) — произвольные предметные переменные; (2) уу4 ...Уул (^ id J8) id [V^ ... Vyn&f =) V^ ...УулвЗВ1, где q^ и о® — произвольные формулы, а у1у ..., з>л — произвольные предметные переменные. Единственным правилом вывода в К# служит modus ponens. Доказать, что множества всех теорем теорий К и К# совпадают. § 5. Теоремы о полноте Предложение 2.7. Во всяком исчислении предикатов первого порядка всякая теорема является логически общезначимой. Доказательство. В силу свойства (VII) понятия истинной формулы (см. стр. 60), аксиомы, задаваемые схемами (1) — (3), логически общезначимы. В силу свойств (X) (следствие) и (XI), логически верны аксиомы, порождаемые схемами (4) — (5). В силу (III) и (VI), правила вывода МР и Gen сохраняют свойство логической общезначимости. Таким образом, всякая теорема любого исчисления предикатов логически общезначима.
72 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА Упражнения 1. Для любой теории первого порядка К, если Г \-KQ^ и каждая формула из Г истинна в данной модели М, то и формула o/g истинна в модели М. 2. Если формула q£ не содержит кванторов и доказуема в исчислении предикатов, то она является частным случаем тавтологии, и потому, согласно предложению 2.1, для этой формулы существует бескванторный вывод (т. е. вывод, члены которого суть формулы, не содержащие кванторов), использующий только схемы аксиом (1) — (3) и МР. (Указание. Если бы формула q/£ не была тавтологией, то можно было бы построить интерпретацию с областью, состоящей из термов, входящих в q/£', в которой, в противоречие с предложением 2.7, формула о/£ была бы ложна.) Заметим, что этот результат влечет непротиворечивость исчисления предикатов, а также приводит к разрешающей процедуре для проблемы выводимости бескванторных формул. Предложение 2.7 представляет собой половину той теоремы о полноте, которую мы теперь хотим доказать. Другая ее половина будет следовать из гораздо более общих предложений, устанавливаемых ниже. Предварительно мы докажем несколько лемм. Пусть переменные Xi и Xj не совпадают и формула &# (Xj) получается из формулы о?£ (хд подстановкой Xj вместо всех свободных вхождений Xt, тогда от£ (хг) и gt£(xj) называются подобными, если Xj свободна для xt в orf (xt) и &?£ (xt) не имеет свободных вхождений Xj. ЕСЛИ о/£(Xi) И orf (xj) ПОДОбнЫ, ТО Xi СВОбОДНО ДЛЯ Xj в orf(xj) и о^ (xj) не имеет свободных вхождений Х{. Таким образом, подобие оказывается симметричным отношением. Иначе говоря, оД (xi) и orf (Xj) подобны тогда и только тогда, когда orf {xj) имеет свободные вхождения Xj в точности в тех местах, в которых orf (х\) имеет свободные вхождения xt. Лемма 2.8. Если формулы orf(х{) и erf(Xj) подобны, то |- VXiQsf (Xt) = \fXjorf (Xj). Доказательство. По схеме аксиом (4), [— \/х(&& (xt) zd orf (Xj). Применим правило Gen: f— Vxy (\/Xios£ (x{) zd q^ (xj)) и, по схеме аксиом (5), получим |— V^©^ (x{) id Vjc;-q^ {xj). Точно так же докажем, что \— y/Xjorf (xj) zd Vxia^ (xi). Применяя тавтологию А\ zd (Л2 zd zd(Ai&A*)) и предложение 2.1, получаем наконец |— V# {) Vf j Упражнение Если orf {xt) и o/g (xj) подобны, то Ь- ?LxiQ7g (Xi) = Лемма 2.9. Если замкнутая формула ~}&# теории К невыво* дима в К, то теория К', полученная из К добавлением о/£ в качестве аксиомы, непротиворечива. Доказательство. Допустим, что теория К' противоречива. Это значит, что имеется формула о®, для которой |— к, о® и [—к, ~\<£В. В силу предложения 2.1, имеем: [— K,SS zd ("|q® zd ~i osf). Следовательно, Hк' l®7^ и && \-£~]<2s&' Поскольку формула &? замкнута, го, в силу
§ 5 ТЕОРЕМЫ О ПОЛНОТЕ 73 следствия 2.6 теоремы дедукции, имеем |—к orf id "I orf. С другой стороны, в силу предложения 2.1, |— к (©^ =э ~| е^) =э 1 ©^. Поэтому \~К~\&^> что противоречит условию. (Подобным же образом, если формула ©^ невыводима в К, то добавление к К формулы "] &>£ в качестве новой аксиомы к противоречию не приводит.) Лемма 2.10. Множество всех выражений всякой теории первого порядка счетно (следовательно, сяетны в частности: множество всех термов, множество всех формул, множество всех замкнутых формул). Доказательство. Отнесем каждому символу и нечетное число g (и) по следующему правилу: g ( ( ) = 3, g ( ) ) = 5, g (,) = 7, g("l) = 9, g(z>)=H, g(xk) = d + 8k, g(ak) = 7 + 8k, g(/2)=9 + 8-(2».3*), g (Af) = 11 -f 8 • (2n • 3*); при этом полагаем g (V-Vj) = g (С*/)). Теперь выражению щи-^.^и,. отнесем число 2&("o)3£("i). . .pjf ("/•), где р/ — /-е простое число. При такой нумерации, очевидно, разные выражения получают разные номера, и мы можем пересчитать все выражения в порядке возрастания отнесенных им чисел. Более того, если мы умеем эффективно распознавать символы теории К, то тогда не только может быть осуществлена эффективная нумерация выражений этой теории, но оказывается возможным и по любому числу узнавать, является оно в этой нумерации номером какого-нибудь выражения теории К или нет. Сказанное верно, в частности, и для термов, формул, замкнутых формул и т. д. Если теория К является к тому же эффективно аксиоматизированной, т. е. если имеется эффективная процедура, позволяющая для любой данной формулы решать вопрос о том, является ли она аксиомой, то мы можем следующим образом перенумеровать все теоремы теории К*, имея соответствующую произведенной нумерации выражений в К нумерацию всех аксиом, начнем с первой в этой нумерации аксиомы, добавив к ней все ее непосредственные следствия по правилу МР и по правилу Gen, примененного только к переменной хг; затем добавим к полученному списку вторую аксиому (если ее еще там нег) и все непосредственные следствия формул эгого расширенного за счет второй аксиомы списка, на этот раз с применением правила Gen уже по двум переменным Хх и х2. Если, поступая подобным же образом далее, мы на k-м шаге добавим к уже полученному списку формул k-ю аксиому и ограничим действие Gen переменными хъ ..., xk> то при этом мы получим в конечном счете все теоремы теории К. Однако в отличие от случая выражений, формул, термов и т. д. оказывается, что существуют такие теории К, для которых мы не можем по любой наперед заданной формуле заранее сказать, встретится ли в конце концов эта формула в списке теорем. Назовем теорию К первого порядка полной, если для любой замкнутой формулы q/£ теории К либо |— }^о/£, либо j— ц~~1от£.
74 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА Теория К' первого порядка, имеющая те же символы, что и теория К первого порядка, называется расширением теории К, если всякая теорема теории К является также теоремой теории К'. (Очевидно, чтобы доказать, что теория К' является расширением теории К, достаточно доказать, что все собственные аксиомы теории К являются теоремами теории К'.) Лемма 2.11. (Лемма Линденбаума.) Если теория К первого порядка непротиворечива, то существует непротиворечивое полное ее расширение. Доказательство. Пусть SSh <£ВЪ ... — какой-нибудь пересчет всех замкнутых формул теории К (лемма 2.10). Следующим образом определим последовательность теорий Jo, Jh J2, ... Пусть Jo есть К. Предположим, что теория Jn(n^0) определена. Если неверно |— } ~\<£ВщЬ " ft то Л„+1 определим как теорию, получающуюся добавлением e®rt+i к Jn в качестве новой аксиомы. Если же |—, ~]<^Sn+li то полагаем Jn+1 = Jn. п Пусть J есть теория первого порядка, получающаяся, если в качестве аксиом взять все аксиомы всех теорий Jt. Очевидно, Jn+i служит расширением для Jm a J является расширением каждой из теорий Jiy в том числе и теории J0 = K- Для доказательства непротиворечивости теории J достаточно доказать непротиворечивость каждой из теорий Jt, так как всякий вывод противоречия в J использует лишь конечное число аксиом и, следовательно, является выводом противоречия уже в некоторой теории Jn. Докажем непротиворечивость теорий Jt индукцией по номеру /. По условию, теория J0 = K непротиворечива. Допустим, что теория Jj непротиворечива. Тогда, если Ji+1 = Jh то и теория Ji+1 непротиворечива. Если же J/+i ф J* и, следовательно, согласно определению J$+i, формула ~] <2®;+i невыводима в Jb то, по лемме 2.9, теория Jf+i тоже непротиворечива. Итак, непротиворечивость J,- влечет непротиворечивость J/+1, и мы доказали, что все теории J^ непротиворечивы; непротиворечива, следовательно, и теория J. Для доказательства полноты теории J рассмотрим произвольную замкнутую формулу &# теории К. Очевидно, qs# = q%!j+i при некотором /(/^0). Согласно определению теорий Jh либо |— л П&^у+ь либо |—л <a%?+i, так как если не Hji^y+i» то <2®/+i объявляется аксиомой в Jy+1. Следовательно, имеем |— ^ | <2®y+i или |— j «^/+i. Таким образом, теория J является непротиворечивым полным расширением теории К- Заметим, что если даже мы умеем эффективно распознавать аксиомы теории К, может тем не менее не существовать никакого эффективного способа распознавать (или даже перечислять) аксиомы теории J, т. е. J может не быть эффективно аксиоматизированной теорией, даже если К такова. Причиной этого может быть невозможность эффективного способа узнавать для любого п выводима или нет формула
f 5. ТЕОРЕМЫ О ПОЛНОТЕ ?5 Упражнение ^Доказать, что всякая непротиворечивая разрешимая теория первого порядка имеет непротиворечивое разрешимое полное расширение. Предложение 2.12*). Всякая непротиворечивая теория первого порядка имеет счетную модель (т. е, модель со счетной областью). Доказательство. Добавим к символам теории К счетное множество {bh Ь% ...} новых предметных констант. Новую, полученную таким образом теорию назовем теорией Ко- Ее аксиомами являются все аксиомы теории К, а также все частные случаи схем логических аксиом, содержащие новые предметные константы. Теория Ко непротиворечива. В самом деле, допустим, что для некоторой формулы о/£ существует вывод в Ко формулы о/£ & "1 от/. Заменим всюду в этом выводе каждую встречающуюся в нем предметную константу bt какой-нибудь предметной переменной, которая в этом выводе отсутствует. При такой замене участвующие в этом выводе аксиомы останутся аксиомами и сохранится свойство формул быть непосредственным следствием предыдущих формул по правилам вывода. Таким образом, после этой замены мы снова получим вывод, но теперь уже это будет вывод в К, поскольку ни одна из формул нового вывода не содержит предметных констант bh Ьъ ... Последняя формула этого вывода тоже является противоречием, что противоречит условию непротиворечивости теории К. Итак, теория Ко непротиворечива. Пусть Fi {xi^ F2 (*i2)> .. • > Fk (xik), ... — какой-нибудь пересчет всех формул теории Ко, содержащих не более одной свободной переменной (лемма 2.10). (Здесь xik — свободная переменная формулы Fki если же на самом деле Fk не содержит свободной переменной, то xik есть Хх) Выберем какую-нибудь последовательность bjv Ь^> ...» bjk, ..., составленную из элементов множества {bh Ьъ ...}, таким образом, чтобы постоянная bjk не содержалась в Fl (jc/±), ..., Fk (xik) ■ и была отлична от bjv ..., bjkV Рассмотрим формулу (Sk) -]4xikFk(xik)ZD-]Fk(bfk). Определим теорию Кп как теорию первого порядка, получающуюся из теории Ко в результате присоединения к аксиомам последней формул (Si), ..., (Sn) в качестве новых аксиом, а теорию Коо — как теорию, получающуюся аналогичным образом присоединением всех формул (Si) к аксиомам Ко- Всякий вывод в теории Коо содержит лишь конечное *) Мы здесь предлагаем упрощенное Хазенъегером [1953] доказательство Г е н к и н а [1949]. Впервые этот результат был установлен Г ё д е л е м [1930]. Расёва и Сикорский [1951, 1952] и Бет [1951] опубликовали доказательства, использующие соответственно алгебраические и топологические методы. Другие доказательства можно найти у Хинтиккц* [1955а, Ы и Бета [1959].
76 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА множество формул (St) и потому является также выводом и в некоторой теории К„. Следовательно, если все теории Кп непротиворечивы, то непротиворечива и тебрия Kqq. Индукцией по / докажем непротиворечивость теорий К/. Непротиворечивость Ко уже доказана. Допустим, что при некотором п (п^\) теория K,i_i непротиворечива, а теория К„ противоречива. Тогда, как мы знаем (в силу тавтологии А^ zd (~| Ai =э Л2) и предложения 2.1), в КЛ выводима любая формула. В частности, Ь~к 10$л)- Поэтому (5Л) [— к 1(Sn). Так как формула (Sn) замкнута, то, по следствию 2,6, I—K (Sn) ZD ~\ (Sn). Теперь, принимая во внима- ние тавтологию (Ai zd ~] A{) zd ~\ Ai и предложение 2.1, мы получаем К ~\(sn)> т. е. Используя затем тавтологии "] (At id Л2) id (Ai & "| Л2), (^i & Л2) id Ль (Л1&Л2)=^Л2 и ~] ~] Л иэ Ль мы получаем |— к ~]\fxt Fn(xt ) и Рассмотрим какой-нибудь вывод формулы Fn(bj^ в Кл_л. Пусть хр — переменная, не встречающаяся в этом выводе. Тогда если всюду в этом выводе заменить bjn на хр, то получим вывод Fn(xp) в Кл_ь т. е. |— к Fn(xp). Теперь, по правилу Gen, получаем |—к VxpFn'(xp) и, наконец, по лемме 2.8, \—к Vjc^ F(xi ). (Мы здесь используем тот %-i n n факт, что формулы Fn(xin) и Fn(xp) подобны.) Но, с другой стороны, выше мы установили, что |—к "1 Vjc,- Fn(X{ ). Таким образом, налицо п -1 противоречие с предположением о непротиворечивости Кл_1. Поэтому и теория Кл должна также быть непротиворечива. Итак, мы доказали, что все теории К*, а с ними вместе и теория Коо непротиворечивы. Заметим, что Коо есть непротиворечивое расширение Ко- По лемме 2.11, Коо имеет некоторое непротиворечивое полное расширение J. Назовем замкнутым термом всякий терм, не содержащий переменных. Счетная интерпретация М теории Ко будет иметь своей областью множество замкнутых термов теории Ко- (По лемме 2.10, это множество счетно.) Если с есть предметная константа в Ко, то она сама и будет своей интерпретацией. Функциональная буква /? теории К будет интерпретироваться операцией /V в М, имеющей своими аргументами замкнутые термы t\, ..., tn теории Ко а значением — замкнутый терм fj(th •••> tn) той же теории. Отношение (А*)*, интерпретирующее предикатную букву Ап. теории К, будет считаться выполненным в М для аргументов tb ..., tn тогда и только тогда, когда \—}An.(tb ..., tj. Чтобы доказать, что М является моделью Ко, достаточно доказать, что произвольная замкнутая формула о/£ теории Ко истинна в М тогда и только тогда, когда [— o/gy так как все теоремы теории Ко являются
§ 5 ТЕОРЕМЫ О ПОЛНОТЕ 77 также и теоремами теории J. Мы докажем это индукцией по числу связок и кванторов в о/б. Пусть сначала о/б есть замкнутая элементарная формула. В этом случае формула о/б> согласно определению, истинна в М тогда и только тогда, когда [— р/б. Допустим теперь, что всякая замкнутая формула SB с меньшим, чем у ©//, числом связок и кванторов истинна в М тогда и только тогда, когда |— уз®. Случай 1. о/б имеет вид ^SB. Если о/б истинна в М, то SB ложна в М и, следовательно, в силу индуктивного предположения, не f— }SB. Так как теория J полна, а формула SB замкнута, то |—л~|а®, т. е. j—jG/^. С другой стороны, если о/б не истинна в М, то SB истинна в М, и тогда |— jQ®, а так как теория J непротиворечива, то не |—л~|о®, т. е. не \- f/б. Случай 2. о/б есть (SB zd £?). Из замкнутости о/б вытекает замкнутость SB и сё. Если о/б ложна в М, то SB истинна и £? ложна в М. В силу полноты J, [— j~l^. Тогда, согласно тавтологии А\ id ("] Л2 id zd ~] (Л1 гэ Л2)), имеем |— л~1(<2® id^O, т. е. |— л~]о/б и, в силу непротиворечивости J, не \— ^о/б. С другой стороны, если не [— ло^, то, в силу полноты J, |— ,1(2^. Принимая во внимание тавтологии ~] (Л1 id Л2) zd Ax и "1 (i4i id Л2) id 1 Л2, получаем тогда \—}SB и |— j"l^. Следовательно, формула SB истинна в М. В силу же непротиворечивости J, имеем не |— j?f, и, следовательно, формула ^ ложна в М. Таким образом, о/б ложна в М. Случай 3. о/б есть \/xnS3. Тогда, при некотором k, S3 есть Fk (xik) и хп есть X(k. (Здесь есть еще возможность того, что SB замкнута и не содержит хп свободно. Но в таком случае о/б истинна тогда и только тогда, когда SB истинна (см. (VI) на стр. 60), и поэтому |— ^/б тогда и только тогда, когда |— SSB. Таким образом, интересующее нас утверждение для о/б следует из соответствующего утверждения о S3.) Предположим, что о/б истинна в М, но не \- f/б. В силу полноты J, имеем |— р^отб, т. е. \—f\\/xikFk(xik). Однако, как мы знаем, [— j(Sk). Следовательно, \—j~]Fk(bJk). Так как формула os6=VxikFk(xik) истинна в М, то истинна в М и формула Fk(bik) (см. (X), следствие, стр. 61). По индуктивному предположению, получаем |— JFk{bi^ и приходим, таким образом, к противоречию с фактом непротиворечивости теории J. Допустим теперь, что о/б ложна в М, но |— р/б. Из ложности формулы VxikFk(Xjk) в М и из определения М как множества всех замкнутых термов теории Ко вытекает (на основании (IV) и второй части (X) на стр. 60 и 61 *)), что для некоторого замкнутого терма t теории Ко Fk (0 ложно. Однако, по предположению, имеем \-3\fxikFk(xik). Следова- *) Здесь следует обратить внимание на то, что s*(t) = t для любой последовательности s элементов области М и для любого замкнутого терма t.
78 ГЛ 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА тельно, по аксиоме (4), \—^Fkit) и, далее, по индуктивному предположению, формула Fk (0 истинна в М. Мы снова пришли к противоречию. Итак, М является счетной моделью для J, а следовательно, и для Ко- Так как всякая теорема теории К является также теоремой и теории Ко, то М и для теории К тоже служит счетной моделью. (Заметим, что модель М не всегда может быть эффективно построена. Интерпретация предикатных букв зависит от понятия выводимости в J, а это последнее, как было отмечено непосредственно после доказательства леммы 2.11 (стр. 74), может не быть эффективно разрешимым.) Следствие 2.13. Всякая логически общезначимая формула теории К первого порядка является теоремой теории К. Доказательство. Достаточно рассмотреть лишь замкнутые формулы о^у поскольку всякая формула SB логически общезначима тогда и только тогда, когда логически общезначимо ее замыкание, и выводима в К тогда и только тогда, когда в К выводимо ее замыкание. Итак, пусть gs£ — логически общезначимая замкнутая формула теории К. Допустим, что Q7& не есть теорема в К. Тогда если мы добавим формулу ~]<^ в качестве новой аксиомы к теории К, то получим новую теорию К', непротиворечивую в силу леммы 2.9. Теория К' имеет, согласно предложению 2.12, модель М. Так как формула ~\es£ является аксиомой в К7, то ~]<2^ истинна в М, а так как формула е/£ логически общезначима, то и она истинна в М. Итак, мы пришли к тому, что формула о/£ одновременно истинна и ложна в М, что невозможно (см. (II), стр. 59). Таким образом, формула ©^ должна быть теоремой теории К. Следствие 2.14. (Теорема Г еде л я [1930] о полноте.) Во всяком исчислении предикатов первого порядка теоремами являются все те и только те формулы, которые логически общезначимы. Доказательство. Следует из предложения 2.7 и следствия 2.13. (Первоначальное доказательство самого Гйделя следовало совсем другими путями. Конструктивное доказательство родственного результата см. у Эрбрана [1930], целый ряд других доказательств теоремы Гёделя о полноте можно найти у Дребена [1952], Хинтикка [1955 а, Ь], Бета [1951], Расёвой и Сикорского [1951], [1952].) Следствие 2.15. (а) Формула о/l истинна в каждой счетной модели теории К тогда и только тогда, когда \— ко/£. Следовательно, <зт€ истинна в каждой модели теории К тогда и только тогда, когда \-ка^. (b) Если во всякой модели теории К формула S3 выполнена на каждой последовательности, на которой выполнены все формулы некоторого множества формул Г, то Г |— к<э®. (c) Если формула S3 теории К является логическим следствием (см. стр. 62) данного множества Г формул теории К, то Г |— к<з®. (d) Если формула S3 теории К является логическим следствием формулы о/6 той же теории, то о/l \-к<2®.
§ 5. ТЕОРЕМЫ О ПОЛНОТЕ 79 Доказательство, (а) Мы можем считать, что формула о/g замкнута. Допустим, что формула о/£ истинна в любой счетной модели теории К. Если не \-кот£, то теория K' = K-j- {~}os£} непротиворечива *). Следовательно, К' имеет счетную модель М. Формула ~] о/£, как аксиома теории К', истинна в М. Но М является также моделью и для К, и потому о^ истинна в М. Таким образом, формула orf одновременно истинна и ложна в М, и мы пришли к противоречию. (Ь) Рассмотрим теорию K-j-Г. Формула SB истинна в каждой модели этой теории. Тогда, в силу утверждения (а), |—к+г<^> и, следовательно, Пункт (с), очевидно, следует из (b), a (d) является частным случаем (с). Упражнение Доказать, что |—к ©т^ имеет место тогда и только тогда, когда существует формула £f, являющаяся замыканием конъюнкции некоторых аксиом теории К и такая, что формула *§ id qt# логически общезначима. Следствия 2.13—2.15 показывают, что для логики предикатов синтаксический метод теорий первого порядка равносилен семантическому методу, использующему понятия интерпретации, модели, логической общезначимости и т. п. Для исчисления высказываний аналогичная эквивалентность семантических (тавтология и др.) и синтаксических (теорема системы L и др.) понятий выражается следствием 1.14. Отметим также, что для исчисления высказываний теорема о полноте системы L (предложение 1.13) приводит к решению проблемы разрешения. Однако для теорий первого порядка мы не можем получить разрешающую процедуру для логической общезначимости или, что то же самое, для выводимости в любом исчислении предикатов первого порядка. Этот результат, а также некоторые родственные ему результаты будут доказаны ниже (гл. V). Из предложения 2.12 вытекает еще один важный классический результат: Следствие 2.16. (Теорема Сколема — Лёвенгейма [1919, 1915].) Если теория К первого порядка имеет какую-нибудь модель, то она имеет и счетную модель. Доказательство. Если К имеет модель, то К непротиворечива (см. (II), стр. 59). Следовательно, в силу предложения 2.12, К имеет счетную модель. Справедливо, однако, и следующее более сильное следствие предложения 2.12. Следствие 2.17. Для любого кардинального числа а^Хо всякая непротиворечивая теория К первого порядка имеет модель мощности а. *) Если К — теория и А — множество формул К, то через К + А обозначается теория, получающаяся из К добавлением формул А в качестве дополни- тильных аксиом.
SO ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА Доказательство. Как мы знаем, согласно предложению 2.12, теория К имеет счетную модель. Поэтому для наших целей теперь достаточно доказать следующую лемму. Лемма. Если а и $ — кардинальные числа, причем а ^ [3, и если К имеет модель мощности а, то К имеет модель и мощности р. Доказательство. Пусть М есть модель К с областью D мощности а, и пусть D' — какое-нибудь множество мощности р, содержащее D. Расширим модель М до некоторой интерпретации W с областью D' следующим образом. Пусть с—некоторый фиксированный элемент D. Условимся считать, что элементы множества ГУ — D ведут себя, как с. Например, если В'? есть интерпретация в М предикатной буквы Ап., а (В'?)' — новая интерпретация в М', то для любых db ..., dn из D' (В^у считается выполненным для (db dn) в том и только в том случае, когда В'* выполнено для (иь ..., иД где щ = d/, если d/ g D, и U; = c, если d^^D' —D. Аналогично распространяется интерпретация функциональных букв, а интерпретации для предметных констант остаются прежними, т. е. берутся из М. Индукцией по числу связок и кванторов в формуле o/Z нетрудно теперь доказать, что od истинна в М' тогда и только тогда, когда orf истинна в М. Следовательно, М' является моделью К мощности (3. Упражнения А 1. Если для некоторой мощности а^К0 формула &£ истинна в каждой интерпретации мощности а, то qs£ логически общезначима. А 2. Если формула Qjg истинна во всех интерпретациях мощности а, то orf истинна во всех интерпретациях мощности ^ а. 3. (а) Для всякой формулы Q/g существует лишь конечное множество интерпретаций оД на данной области, имеющей конечную мощность k. (Ъ} Для любой формулы Qjg существует эффективный способ узнавать, является ли оД истинной во всех интерпретациях с областью, имеющей некоторую фиксированную конечную мощность k. (Указание. Ввести новые предметные постоянные константы Ьи ..., Ь^ и всякую формулу вида Vxq5$(x) заменить на SB (&i) & ••• &<^9 (&*)•) 4. Показать, что следующая формула истинна во всех конечных областях, но в некоторой бесконечной области ложна: {VxVyVz [А\ (х9 х) & (Л| (х, у) & А\ (у, г) :э А\ (х, г)) & & (Л? (ху у) V А\ (у, х))]} => 3yVxA* (у, х). 5. (а) Замкнутая формула Улг1...УлглЭу1 ... 3ymQ^, где /га^О, п^\ и q^ не содержит кванторов, функциональных букв или предметных постоянных, логически общезначима тогда и только тогда, когда она истинна во всякой интерпретации с областью, состоящей из п объектов. (b) Замкнутая формула 3^i ... Ъуто/£ (где оД удовлетворяет условию пункта (а)) логически общезначима тогда и только тогда, когда она истинна в каждой области, состоящей из одного элемента. (c) Существует эффективная процедура для распознавания логической верности формул вида, описанного в (а) и (Ь).
§ 6. НЕКОТОРЫЕ ДОПОЛНИТЕЛЬНЫЕ МЕТАТЕОРЕМЫ 81 § 6. Некоторые дополнительные метатеоремы Для облегчения дальнейшей работы с конкретными теориями первого порядка полезно доказать несколько дополнительных фактов об этих теориях. В этом параграфе мы всюду будем предполагать, что имеем дело с некоторой произвольной теорией К первого порядка. Во многих случаях бывает желательно, доказав УхоЛ (jc), иметь также доказанным и orf {t\ где t — какой-нибудь терм, свободный для х в od (х). Это оказывается возможным, причем обосновывается следующим правилом. Правило индивидуализации А4. Если терм t свободен для х в orf (х), то Ух&£ (х) |— оЛ (t). Доказательство. Из Vxarf(х) и из частного случая Vxgt^(х) id id <2s£ (t) аксиомы (4) мы получаем of£ (f) с помощью modus ponens. Предложение 2.18. Если от£ и SB — формулы и предметная переменная х не является свободной в od, то следующие формулы суть теоремы в К: (a) о^ zd Vx<2s£ (следовательно, по аксиоме (4), \— е^£=У/х^); (b) 3xos£ id о?€ (следовательно, по нижеследующему правилу Е4, f- ЗхоЛ = (с) (d) Доказательство предоставляется читателю в качестве упражнения. Полезно также следующее производное правило, которое является контрапозицией правила А4. Правило существования Е4. Если терм t свободен для х в о/£ (х)} то [— о/? (t) zd 3xos€ (х) и, следовательно, оЛ (t) [— Зхот£ (х). Доказательство. По аксиоме (4) имеем |— ^х~\от€(х) zd ~\от£ (t). С помощью тавтологии (Л ZD ~] В) zd (В zd ~*\А) и Мр получаем \-о/£ (t) id id ~] Vx "1 ei? (x)} т. e. |— g?£ (t) zd 3xo?£ (x). Следовательно, оЛ (t) (— \- 3xgs£ (x). - Упражнения 1. Вывести следующие производные правила: Правило конъюнкции: q^, <£ft \- Qyg & $$. Правило дизъюнкции: <&$ r> g", SB =5 ^, q^ \] SB H ¥? V $Р- 2. Если формула SB получена из q/£ стиранием всех кванторов Чх или Зх, области действия которых не содержат х свободно, то \- Qyg' = SB< Предложение 2.19. Для любых формул о/£ и <ЗВ У- Vjc (q,4 = SB)zd (Vxgs? = Vxs%). Доказательство. 1. Vx(©/ = qS) гипотеза 2. \/xqs£ гипотеза 3. orf = <3& 1, правило А4 4. orf 2, правило А4
82 5. 6. 7. 8. 9. 10. 11. SB VxSB Vx(a?? = S3) Vx(G7f==~S3) Vx(s/ = <^) Vx(o^ = SB) \- \/x(gs# = c ГЛ f-' h h Щ 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА 3, 4, тавтология \Q/C Q/Oj i \Q/o ^ ®^/j MP 5, Gen 'xqt£(x)\->1xSB 1—6 Vxo^ zdVxSB 1—7, предложение 2.4 VJxSB id V'xg/£ доказывается аналогично 8 Чхот£ = V} xSB 8,9, правило коньюнкции zd (Ухот£ = 4xSB) 1—10, предложение 2.4 Предложение 2.20. (Теорема эквивалентности.) Если SB есть подформула от£ и osff есть результат замены в orf каких-нибудь {быть может, также и ни одного) вхождений SB формулой % и если всякая свободная переменная формулы SB или формулы ?f, которая одновременно является связанной переменной формулы orf\ встречается в списке yi,...,yk> mo Доказательство. Применим индукцию по числу связок и кванторов в о/£. Заметим сперва, что если ни одно вхождение SB на самом деле не заменяется, то ок совпадает с orf\ и формула, которую требуется вывести, является частным случаем тавтологии В 1э(А = А). Если S3 совпадает с &>£ и это единственное вхождение заменяется на ?f, то формула, которую требуется вывести, выводима из аксиомы (4) (см. упражнение 1 (d) на стр. 71). Итак, в дальнейшем мы можем считать, что SB есть собственная подформула о/£ и что по крайней мере одно вхождение SB подлежит замене. Предположим, что теорема верна для всякой формулы с меньшим числом связок и кванторов, чем у <2^. Случай 1. о/£ есть элементарная формула. Тогда SB не может быть собственной подформулой &&. Случай 2. оЛ есть ~\&. Пусть тогда orf' есть "]&'. По индуктивному предположению, |— V^i... Vy* (SB = &) id (& = &r). Отсюда с помощью тавтологии (Л = В) zd (П А = ~| В) получаем ^^SB ^r \yxyk{ )() Случай 3. от£ есть <# id Ш. Пусть тогда orff есть @If id Ш\ Согласно индуктивному предположению, |— V^Vi... Уук (&® = <&)zd (£& ^ J^') и VVi... Vy* (SB = %) zd {Ш = Ш'). Применяя тавтологию {{А =±В)& & (С = D)) zd ((A idC) = (Bzd D))y получаем |— Vyi... Vy* (SB = g7) =d ( Случай 4. ©^ есть VjcJF. Тогда для некоторой формулы ^' of£ совпадает с VjcJ^'. По индуктивному предположению, |— Vj/i... Vy^ (о® ^ %?) zd (& = &г). Переменная х не встречается свободно в Vyi... Vj>£ (э® = ??); в самом деле, если бы х входила свободно
$ 7. ПРАВИЛО С 83 в эту последнюю формулу, то х входила бы свободно в S3 или в ?f, а поскольку х связана в е^, х входила бы в перечень yh — yk и была бы связанной переменной в Vyi... Vy^ (е® = £?), что приводит нас к противоречию. Применяя теперь аксиому (5), мы получаем \- Vj/i... 4yk (S3 = c&)zd У/х (& = &'). В то же время, в силу предложения 2.19, имеем V* (^ id £&') zd (Чх& = Чх&'). Сопоставляя последние два утверждения о выводимости, получаем |— Vj>i... Vj/^ (S3 = ??) ц> ( ) Следствие 2.21. (Теорема о замене.) Пусть от£у S3, qt£' и *ё удовлетворяют условиям предложения 2.20. Если \-S3=.c£, то \- о/£ = &f\ а если f- S3 = *8 и |— orf, то \- о/£\ Следствие 2.22. (Переименование связанных переменных.) Если yixS3(x) есть подформула формулы &£, формула S3 (у) подобна формуле S3(x) и оЛ' есть результат замены по крайней мере одного вхождения 4xS3 (х) в оЛ на У/ySS (у), то |— o/g = orf'. Доказательство. Применить лемму 2.8 и следствие 2.3-1. Упражнения 1. Доказать, что у- Зх "| &£ = "| Vxqs£ и Ь- Ухат£ = ~\ lx ~| Q7f. 2. Пусть orf — формула, содержащая, быть может, кванторы и связки &, V, "It но не содержащая связок =5, =. Всюду в q/£ поменяем взаимно кванторы существования и всеобщности, а также связки & и V- Полученная в результате формула ©т^* называется двойственной к orf*). Доказать, что (а) \- q/£ тогда и только тогда, когда \- ~] ©т^*; (b) \- q^ zd S3 тогда и только тогда, когда Ь- о®* г> q^*\ (с) н о/? = S3 тогда и только тогда, когда \- ?/£* = ^8*; (d) применяя \-Ух ((э/£ &S3)^Vxqt£ &\/хS3 (см. упражнение 1 (с), стр. 71), доказать, что.Н З^с (^ V S3)^E"3xQ/g \J 3x&. § 7. Правило С В математике весьма распространены умозаключения следующего типа. Допустим, что мы вывели формулу вида Зх&# (х). Затем мы говорим: «Пусть Ъ — объект такой, что &#(Ь)», и продолжаем наше рассуждение или доказательство, приходя в конце концов к формуле, которая не содержит произвольно выбранного элемента Ь. Пусть, скажем, мы хотим доказать, что Зх (S3 (х) => W (х)), \fxS3 (х) \- 3x8 (х): 1. 3x(S3(x)zD<e}(x)) гипотеза 2. VxS3(x) гипотеза 3. S3 (b) zd *& (р) при некотором Ъ 1 *) Вот точное определение операции *: 1) если &£ — элементарная формула, то ^* есть orf\ 2) (Q/S к S3)* есть orf* V -ffi*\ 3) (^ V q®)* есть е/* &^&* 4) П ^)* 1^* 5) (Vf * Э^* 6 З^)* V ^ orf ) (QS rf V ffi ) (^ V q®) е ) П е^)* есть 1^*; 5) (V^f )* есть Эл:^*; 6) (З.г^)* есть (Прим. перев.)
84 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА 4. <?$(&) 2, правило А4 5. cS(b) 3, 4, МР 6. Зх*ё' (х) 5, правило Е4 7. Зх (qS0 (а:) =) ^ (л:)), Vj^ (х) \- Зхсё (х) 1 —6 Такой вывод представляется с интуитивной точки зрения совершенно законным. На самом же деле мы можем получить тот же результат, не прибегая к произвольному выбору некоторого элемента на шаге 3. Это может быть сделано следующим образом: 1. Ух<£${х) гипотеза 2. Ух~\<ё'{х) гипотеза 3. <£$ (х) 1, правило А4 4. ~| сё (х) 2, правило А4 5. 1 {S3 (х) z> & (х)) 3, 4, тавтология (A&-]B)zd 6. Ух~](^8(х)1Э^(х)) 5. Gen 7. Vjc^(x), Vx-]&(x)[-Vx-\(<$(x)zd&(x)) 1—6 8. VxSB (x) f- Vx 1 сё (x) zd Vjc 1 (d® (x) id g7 (x)) 7, предложение 2.4 9. VxS3 (x) |- 1 Ух -\ {SB (x) id & (x)) zd "1 Vjc 1 % (x) 8, тавтология 10. Vx^ (x) \- 3x {S3 {x) zd % (x)) zd 3x% (x) сокращение для 9 11. 3x{^{x)zd^{x)% VxS3{x)\-3x%{x) 10, MP Вообще всякая формула, которая может быть выведена с применением подобных произвольных актов выбора, может быть также выведена и без помощи таких актов выбора. Правило, позволяющее переходить от ЗхоЛ {х) к от£ ф), будем называть Правилом С (С — первая буква английского слова choice — выбор). Для большей точности следовало бы говорить о понятии «вывода с правилом С» в теории первого порядка К. Это правило можно определить следующим образом: Г f— сет£ тогда и только тогда, когда существует последовательность формул о®ь..., S3n — o/g такая, что выполняются следующие условия: (I) для любого / либо (i) S3t есть аксиома К, либо (ii) ей?/ принадлежит Г, либо (Hi) SBt следует по МР или Gen из формул, предшествующих в этой последовательности формуле SBb либо (iv) формуле <£®i предшествует формула Зхё* {х), а сама формула SBt есть %? {b)t где Ь — новая предметная постоянная. (Правило С.)
$ 7 ПРАВИЛО С 35 (II) В качестве аксиом в (1) (i) разрешаются также всевозможные логические аксиомы, включающие новые предметные постоянные, уже ранее введенные по правилу С, т. е. по (I) (iv). (III) He допускается применение правила Gen по переменным, свободным хотя бы в одной формуле вида Зхё (х), к которой ранее было применено правило С. (IV) о/ё не содержит новых предметных постоянных, введенных с помощью правила С. Следует обратить внимание на то, что пункт (III) определения действительно необходим, ибо без ограничений, накладываемых этим пунктом, становится возможным, например, такой вывод: 1. УхЗу А\ (х, у) гипотеза 2. ЗуЛ\(Ху у) 1, правило А4 3. Л\(х, Ь) 2, правило С 4. ЧхА\(х, Ь) 3, Gen 5. Зу Ух А\ (х, у) 4, правило Е4 6. УхЗуАЦхуу)\-сЗуУхА\(х,у) 1—5 А между тем мы знаем (см. пример 4 на стр. 63), что существует интерпретация, для которой формула Ух Зу А\ (х9 у) истинна, а формула Зу Ух А\ (х, у) ложна. Предложение 2.23. Если Г|—с<^, то Y\-qt£. Более того, из нижеследующего доказательства легко усмотреть, что если в новом выводе имеется применение правила Gen по некоторой переменной к формуле, зависящей от некоторой формулы из Г, то такое же применение Gen было и в первоначальном выводе *). Доказательство. Пусть дан какой-нибудь С-вывод формулы о^ из Г, и пусть 3y\<&\(y\\...y3yk<iok(yk)—формулы (в порядке их появления), к которым в этом С-выводе применяется правило С, а C\y->Ck—вводимые при этом новые предметные константы. Тогда, очевидно, Г, ??i (£i),..., ??/, (ck) |— ©^, а в силу ограничения на применение правила Gen в первоначальном С-выводе, мы можем применить теорему дедукции 2.4 и, следовательно, Г, W{ (с^,..., *ёk-\ (ck-\) [— |— ^k (ck) id qs£. Заменив всюду в соответствующем выводе константу ck на переменную z, не встречающуюся в этом выводе, мы получим Г, Г, (с,),..., 8f*_, (ск-г) h %к (Z) => ** и, следовательно, по правилу Gen, Г, ^i (сд, •.., SVi fa-i) h V^ (Sf* (z) z отсюда, на основании предложения 2.18 (d), получаем Г, ^i (ci),... ? ^Vi (ск-г) |- 3yk "ek (yk) id *) По-видимому, впервые правило С в схожей форме сформулировал Росс ер [1953].
86 ГЛ. 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА Но так как Г, Sf,(сО,..-, &ь-1 {ск-х) Ь *У>^(Л). ТО Повторяя эту же схему рассуждений, мы теперь исключим по очереди ?fЛ_! (сЛ_!), 2?Л_2(сЛ_2) и т. д. вплоть до ^i(ci), в результате чего получим Г [— ет^. Пример. 1- Vjc (от? (*) =) ^ (*)) => (Элг<2^ (лг) id Э*^ (*)). 1. Vjc (s^ (jc) zd q® (д;)) гипотеза 2. 3jC(2^(jc) гипотеза 3. os£(b) 2, правило С 4. G^ (b) id d®(6) 1, правило А4 5. в®(й) 3, 4, MP 6. 3jc<2®(jc) 5, правило Е4 7. У*(<2^(х):э^(.хг)), ЗлГ(2^(х)[-сЗх^(лг) 1—6 8. Vx (от? (х) zd SB (дг)), Зх©^ (х)|-Эдг<^ (дг) 7, предложение 2.23 9. Vjc (от? (х) zd SB (х)) |— Злгот^ (jc) id qx<a® (x) 8, предложение 2.4 10. \- Vx ((^ (х) z> ^ (л:)) id(3^(2^ (х) id 3xSB (x)) 9, предложение 2.4 Упражнения С помощью правила С и предложения 2.23 доказать: (1) \-3x (erf (х) => SB (x)) => (Vxqs? (x) zd Ъх^В (х))\ (2) Н (Vx &f (x) V ^xSB (x)) id Vx (&e (x) V SB (x)). § 8. Теории первого порядка с равенством Пусть К — теория первого порядка, в числе предикатных букв которой имеется А\. Будем для сокращения писать t = s вместо A\(ty s) и t=£ s вместо "| А\ (t, s). Теория К называется теорией первого порядка с равенством, если следующие формулы являются теоремами К: (6)*) \/х\ (х\ =• х\) (рефлексивность равенства); (7) (х —у) id (o/Z (x, x)zd os£ (x, у)) (подстановочность равенства), где х и у — предметные переменные, os£ (x, х) — произвольная формула, а от? (х, у) получается из о)? (дг, х) заменой каких-нибудь (не обязательно всех) свободных вхождений х вхождениями у, с соблюдением условия, чтобы у было свободно для тех вхождений х, которые заменяются. *) Мы здесь продолжаем нумерацию логических аксиом на стр. 65—66.
§ 8 ТЕОРИИ ПЕРВОГО ПОРЯДКА С РАВЕНСТВОМ 87 Таким образом, в одних случаях os€ (х, у) может иметь свободные вхождения х, в других случаях таких вхождений может уже не быть. Предложение 2.24. Во всякой теории первого порядка с равенством (a) \~t = t для любого терма t\ (b) [~x=yz>y = x; (С) \-X=yiD(y = ZIDX = z). Доказательство, (а) В силу (6), |— Vxi (Xi = х^)у следовательно, по правилу А4 \-t = t. (b) Пусть оД (х, х) есть х = х и о/ё {х> у) • есть у = х. Тогда, согласно (7), |— (х=у) id (x = x id у = х). Но, как только что доказано, |— х = х. Теперь |— х=у zDy = x мы получим с помощью тавтологии В ID ((А ID (В ID С)) ID (А ID С)). (c) Пусть ат#(у, у) есть y=rz и &# (у, х) есть x = z. Тогда, в силу (7) с взаимной заменой х и у, \—y==xiD(y = zzDX = z). Но в силу (Ь), (— х=у чэу = х. Следовательно, используя тавтологию (A zd В) id id ((В id С) id (A id С)), мы имеем \-x=yiD(y = ziDX = z). Упражнения Доказать: (1) Y-Vx (<$ (х)Е=Чу (х=у &<$(у))); (2) Н Vx Ш (x)~Vy{x=yzD<£ft (y)))\ (3) Условие (7) для равенства может быть сведено к нескольким более простым случаям. Предложение 2.25. Если теоремами теории первого порядка К являются формула (6) и, для любой элементарной формулы о/£ (х, х), формула (7), то К есть теория первого порядка с равенством, т. е. в К всякая формула вида (7) является теоремой. Доказательство. Итак, мы должны доказать, что всякая формула вида (7) является теоремой в К. Для элементарных формул это верно по условию. Заметим, что для рассматриваемой теории К предложение 2.24 верно, ибо в его доказательстве используется (7) только для элементарных формул. Следуя индукции по числу п всех связок и кванторов в ©т^, предположим, что для всех k<^n все формулы вида (7) являются теоремами в К. Случай 1. о/£(х, х) есть ~]<&(х, х). По индуктивному предположению мы имеем \-у = xid (J® (х, у) id q® (х, х)\ так как <3$ (ху х) получается из S3 (х, у) заменой некоторых вхождений у на х. Отсюда, применяя предложение 2.24(Ь) и тавтологии (Aid В) Id (~\B id ~]А) и (Л id В) zd ((В id С) id (A id С)), получаем |- х =у id (<^f (x, x) id ZD od (X, у)).
<№ ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА Случай 2. &?£(х, х) есть 33(х, x)zd<£(лг, х). В силу индуктивного предположения и предложения 2.24(Ь), |— х=у id (а® (л:, j) zdq®(at, x)) и |—х—j/id (<?(л:, лг)и)£Г(.хг, _у)). Отсюда с помощью тавтологии (Л ID (£j ID £)) => [(A ID (C ID CO) ID (Л ID ((5 ID C) Z> (^ ID С^))] ПОЛу- чаем f—л: == j; id {q^ (x, x) zd qs£ (x, y)). Случай 3. qt€ (xy x) есть \fz<M (дг, х, z). По индуктивному предположению, \>-x=y id (e® (x, xy z) zd <& (x> yy z)). Применяя правило Gen и аксиому (5), получаем |— х=у zd \/z(q%}(x, xf z) id 33 (ху у у z)). В силу упражнения 1 (а) на стр. 71 имеем Vz(<£ft(x, xy z) zd <£$ (ху уу z))zd zd [4zift(Xy Xy z) zd \/го%1(х, yy z)] и теперь с помощью тавтологии (Л id В) id ((В id С) id (Л id С)) получаем окончательно \- x=yzD ZD (&£ (X, X)ZDos£ (Xy у)). Сужение класса формул &?£ (х, х) в (7) может быть продолжено еще дальше. Предложение 2.26. Пусть К — теория первого порядкау в которой к числу теорем принадлежит формула (6), а также все формулы вида (7), в которых формула orf (ху х) элементарнау не содержит вхождений функциональных букв и &# (ху у) получается из о^ (х> х) замещением на у в точности одного вхождения х. Пусть, кроме того: (*) для всякой функциональной буквы fn, и для всякого набора переменных zh ..., zn выполнено \-х —у zd f. {zh ..., zn) —fn (wh ... ..., wn)y где fn. (w\y..., wn) получено из fn. (zh..., zn) заменой какого- нибудь одного вхождения х на у. Тогда К есть теория первого порядка с равенством. Доказательство. Отметим сразу, что случаи замены многих вхождений х на у сводятся, очевидно, к последовательным актам замещения одного вхождения х на у. Легко видеть, что и предложение 2.24 все еще доказуемо и в условиях настоящей теоремы. В силу предложения 2.25, достаточно доказать, что теоремами в К являются все формулы вида (7) с элементарными оЛ\ При этом не составляет труда доказать, ЧТО \-yl = Zl& ... &yn — ZnZD(G7£(yh...,yn)ZDG7g(zh ..., Zn)) ДЛЯ любого набора переменных Уъ...,Уп> %ь ••• > zn и для любой элементарной формулы orf без вхождений функциональных букв. Применяя правило А4, мы теперь можем свести доказательство к установлению факта [— х=у zd t(x9 x) = t(xy >•), где t(x, x)— терм и t(xy у) получен из t (Xy х) замещением на у некоторых вхождений х. Но это без труда может быть доказано с использованием условия (*) индукцией по числу функциональных букв, входящих в ty и мы предоставляем читателю проделать это самому в качестве упражнения. Упражнения 1. Пусть Kj — теория первого порядка с единственной предикатной буквой =, без функциональных букв и предметных констант и с собственными аксиомами: VXiiXi = х;), Wxiyx2(xi = x2^>xs = xl) и Vxiyx2Vx3(xl—x2iD(x«=x[]iD Zdxx = x8)). Доказать, что Kt есть теория первого порядка с равенством.
* 8 ТЕОРИИ ПЕРВОГО ПОРЯДКА С РАВЕНСТВОМ оУ У к а з а н и с. В силу предложения 2.26, достаточно вывести следующие формулы: х =у id (х = х id у = х), Х=у ZD (Х = Х ID X =У), X=y ID (Z=XZ2 Z=y). Теория Ki называется элементарной теорией равенства. 2. Пусть К2 — теория первого порядка с двумя предикатными буквами = и <, без функциональных букв и предметных констант и со следующими собственными аксиомами: (a) V*! (*!=*!); (b) VxtVx2 (xt = х2 id х2 = Xj)) (c) УхУх2Ух3 (xt = x2id (x2 = xz id xt = лг8)); (d) WXi3x23xz (Xj < x2 & хъ < Xi)] (e) Vxyx2Vxz (xt <x2kx2<x3iDXi< хг); (f) Wxyx2 (х,. = x2 => "| xj, < x2); (g) v^iVxa(л-!<^v^i=^V^<^i); (h) УхУх2 (xx < x2 id 3x3 (xt < xz & xz < x2)). Опираясь на предложение 2.26, показать, что К2 есть теория первого порядка с равенством. (К2 есть элементарная теория плотно упорядоченных множеств без первого и последнего элементов.) 3. Пусть К — произвольная теория первого порядка с равенством, (а) Доказать, что нкх1=^1& ... &xn=yn-=>t(xu ... , xn) = t(yu ... ,уп), где t (Уи ••• 1 Уп) получено из терма t (хи ... , хп) заменой л:^ ..., хп соответственно нъу1,...,уп- (Ь) Доказать, что 1—клгх ^у^... кхп=^уп id (q^ (xlt ... , хп) == = e^(^i» ••• » Д'я))» где o/g(yit ... , уп) получено заменой одного или более вхождений xi на у^ i= 1, 2, ..., л, причем >>!,..., уп свободны в o/g (xlt...f xn) для хи ..., хп соответственно. Примеры: 1. Элементарная теория групп G: предикатная буква ==, функциональная буква /j, предметная константа п\. Для сокращения в дальнейшем мы будем вместо /{(t, s) писать t -f- 5 и 0 вместо а\. Собственные аксиомы: (a) хх - (b) ^4-0 = ^; (c) Ух1Зх2(х1 + л:2 (d) дг1 = д:1; (e) xi = xi id х* = (f) x1 = x2zd (x2 = (g) Xi = XiZD (Xi + X3 = ЛГ2 + ^3 &^3 + Xi = Хг -f- X2). Опираясь на предложение 2.26, легко доказать, что G есть теория первого порядка с равенством. Если мы добавим еще одну аксиому; (h) xx-}rx%=-xi-\-xh
90 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА то получим теорию Gc, называемую элементарной теорией абелевых групп. 2. Элементарная теория полей F: предикатная буква =, функциональные буквы /[ и /|, предметные константы ах и а2. Сокращениями служат: t-\-s для f\(t, s), t*s для /|(£, s), 0 и 1 для а\ и а2 соответственно. Собственными аксиомами являются аксиомы (а) — (h) теории Gq из предыдущего примера 1, а также следующие формулы: (i) Х1 = Х21Э(Х1-Хг (j) (х1-Х2)-хг = х1-( (k) Xt - (лг2 -f- х3) = (X (1) хх.хъ = х%.хх; (m) ati - 1=дг, (п) x1=^0=d3x2(x1-^2=1). F является теорией первого порядка с равенством. Аксиомы (а) — (т) определяют элементарную теорию Re коммутативных колец с единицей. Добавив к F новую предикативную букву А\, которую будем обозначать знаком <, аксиомы (е), (f), (g) из предыдущего упражнения 2 и еще две аксиомы: xt < х% zd Xi -{-хг<лг2-|-хг, Х\ <<jc2 &0<x3 id =э ati • х3 <С ^2 • ^з> мы получим элементарную теорию F,^ упорядоченных полей. Упражнение Показать, что аксиомы равенства (d) — (f) в двух последних примерах могут быть заменены парой аксиом, из которых одна есть снова (d), а другая —формула х = у zd (z=yzD x = z). Часто встречаются теории первого порядка, в которых равенство = может быть определено. Это значит, что в такой теории К имеется формула % (х, у), для которой, если Ш (t, s) обозначить через t = s, формулы (6), (7) выводимы в К. При этом только следует условиться считать, что если t и s — термы, не свободные соответственно для х и у в % (х, у), то t~s служит сокращенным обозначением не Для $(t, s), а для некоторой формулы ^* (t, 5), которая получена из Ш (t, s) подходящим переименованием связанных переменных (см. следствие 2.22) таким образом, чтобы t и s оказались свободными соответственно для х и у в £* (xt у). Для таких теорий К могут быть доказаны предложения, аналогичные предложениям 2.25 и 2.26, в предположении, что (7) является теоремой в К для соответствующих типов формул Ш* (х, у). (Предоставляется читателю в качестве упражнения.) В теориях первого порядка с равенством для выражений вида «существует один и только один предмет х такой, что ...» можно использовать следующее Определение. 3iXs^(x) означает Ixorf(x)& VxV^v(&4(х)&
§ 8. ТЕОРИИ ПЕРВОГО ПОРЯДКА С РАВЕНСТВОМ 91 Упражнения 2. и Э^е^ (х) == 3*Vy (л: =.у == ^ (у)). 3. Ь Vx (<?Л (a:) = «й& (л:)) гэ [3^^ (дг) =s З^ (x)]. Для всякой модели теории первого порядка К с равенством отношение Е, соответствующее в этой модели предикатной букве =, является отношением эквивалентности (в силу предложения 2.24). Если в области некоторой модели это отношение Е оказывается отношением тождества, то эта модель называется нормальной. Всякая модель М теории К может быть сужена до некоторой нормальной модели М' теории К. Для этого в качестве области D' новой модели М' возьмем множество классов эквивалентности, определяемых отношением Е в области D модели М. Затем для каждой предикатной буквы Ап. с интерпретацией (Ап.\* в М определим новую интерпретацию (Л^у в М' условием: для любых классов эквивалентности [bi], ..., [Ьл], определяемых элементами Ьь ..., Ьп из D, (A*J выполнено тогда и только тогда, когда в М для bi,..., Ьп выполнено (А**}*. Это определение не зависит от выбора представителей Ъ1у..., Ьп соответствующих классов эквивалентности, так как, на основании (7), |— х\=у\ & ... &хп=уп Z) ZD (А"(хъ ..., хп) id Ап.(уь ..., Уп))- Аналогично, новую интерпретацию (fn.y в М' для функциональной буквы fn с интерпретацией (/?)* в М зададим условием: (/*)' ([bi],..., [Ьл]) = [(/*)* Фъ •. •, Ья)]. Нетрудно видеть, что и это определение не зависит от выбора представителей классов эквивалентности, так как, на основании (7), (— Х\=у\к.. ,&хп=уп id id fn.{X\y..., хп)==/пгуъ ... > Уп)- Наконец, всякая предметная константа п( с интерпретацией с в М будет теперь интерпретироваться в М' классом [с]. Отношение Е', соответствующее в М' предикатной букве =, является отношением тождества в D': E'([bi], [b2]) имеет место тогда и только тогда, когда выполнено Е (Ьь Ь2), т. е. когда [bi] = [b2]. Следующая лемма легко может быть теперь доказана по индукции: если s = (bi, b2,...) — счетная последовательность элементов из D, [bt-] — класс эквивалентности, порождаемый элементом bf, и s' = ([bi], [b2],...), то формула os£ выполнена в М на s тогда и только тогда, когда о/g выполнена в М' на s'. Отсюда следует, что всякая формула о/£ истинна в М тогда и только тогда, когда она истинна в М', а так как М есть модель К, то, следовательно, М' есть нормальная модель теории К. Предложение 2.27. (Продолжение предложения 2.12; Гёдель [1930].) Всякая непротиворечивая теория первого порядка К с равенством имеет конечную или счетную нормальную модель. Доказательство. Согласно предложению 2.12, К имеет счетную модель М. Следовательно, сужение модели М описанным только что выше способом приводит к нормальной конечной или счетной модели М', так как множество классов эквивалентности, на которые разбивается D, имеет мощность не большую, чем само D.
92 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА Следствие 2.28. (Продолжение теоремы Сколема — Лёвенгейма.) Всякая теория первого порядка К с равенством, имеющая бесконечную нормальную модель М, имеет счетную нормальную модель. Доказательство. Добавим к К новые предметные константы Ьъ Ьъ ... вместе с аксиомами bt Ф bj для I ф /. Новая теория К' непротиворечива. Если бы теория К' была противоречива, то существовал бы вывод в К! некоторого противоречия £f & ~] ?f, причем можно считать, что *8 есть формула теории К. Такой вывод использовал бы, очевидно, лишь конечное число новых аксиом: Ь-^фЪ]^ ..., Ь(пфЬ/пУ и модель М могла бы быть расширена до некоторой модели теории, получающейся из К добавлением аксиом Ь(1фЬ^у ..., Ь1пфЬ]п. В самом деле, так как М есть бесконечная нормальная модель, то мы можем так выбрать интерпретации предметных постоянных 6/, Ь^, ..., bin, bjn, чтобы формулы bi фЬ], ..., binФbjn были истинны в М. Поэтоту выводимость W & "1 ?f из этих формул и аксиом К повлекла бы за собой истинность £f & ~| & в М, что невозможно ввиду (II) на стр. 59. Итак, теория К' должна быть непротиворечивой. В силу предложения 2.27, К' имеет конечную или счетную нормальную модель N. Формулы bi Ф bj для 1ф] истинны в N, как аксиомы теории К'. Следовательно, элементы области модели N, интерпретирующие соответственно bh Ьъ . • •, должны быть попарно различны, откуда следует, что область N бесконечна и, следовательно, счетна. Упражнения 1. Определим ЪпХоД (х) для п^\ индукцией по п. Для случая /г=1 используем определение 3xXq^ (x) на стр. 90. Пусть теперь для произвольного п dn+1XQs# (х) обозначает 3 у (q^ (у) & Зпх (х ф у & &4 (х))). Показать, что Зпх<27# (х) выражает собой утверждение существования в точности п объектов, для которых оу£ выполнено, в том смысле, что во всякой нормальной модели формулы ЪпХоД (х) имеется в точности п объектов, которые обладают свойством, интерпретирующим ©^ (х). 2. Если теория первого порядка К с равенством имеет конечные нормальные модели со сколь угодно большим числом элементов, то она имеет и счетную модель. (Указание. Доказательство аналогично доказательству следствия 2.28.) 3. Всякое исчисление предикатов с равенством непротиворечиво. (У к а- з а н и е. Пусть orf — произвольная формула; опустить в ней все знаки кванторов, заменить всякую элементарную формулу ^ = SHa^§V~l^c некоторой фиксированной формулой $ВУ стереть все термы и все связанные с ними скобки. Показать, что если оД — теорема, то описанная процедура над q/£ приводит к частному случаю тавтологии. Однако при этом формула х1Фх1 преобразуется в ~| (d® V "1 <&&)•) 4. Доказать независимость аксиом (1) — (7) во всяком исчислении предикатов с равенством. (Указание. Для доказательства независимости аксиом (1) —(3) заменить все формулы /—s пропозициональной формой Л id Л, затем стереть все кванторы, термы и связанные с ними запятые и скобки; аксиомы (4) — (6) переходят при этом в пропозициональные формы вида Р zd P, а аксиома (7) — в (Р zd P) id (Q id Q). После этого для аксиом (2), (3) использовать то же доказательство, что и для независимости аксиом (А2) — (A3) пропозиционального исчисления (стр. 47). Что касается аксиомы (1), то трехзначная
§ 9. ВВЕДЕНИЕ НОВЫХ ФУНКЦИОНАЛЬНЫХ БУКВ 93 истинностная таблица, использованная на стр. 46 для доказательства независимости аксиомы (А1), не дает значения 0 для Р zd P; предлагается взамен этого воспользоваться следующими четырехзначными истинностными таблицами: А 0 1 2 3 1Л 1 0 3 2 А 0 1 2 3 0 1 2 3 В 0 0 0 0 1 1 1 1 AzdB 0 0 0 0 1 0 1 1 А 0 1 2 3 0 1 2 3 В 2 2 2 2 3 3 3 3 AzdP 1 0 0 0 1 0 1 0 Для доказательства независимости аксиомы (4) заменить все кванторы всеобщности Ух кванторами существования Зх. Вопрос с аксиомой (5) решается заменой всех термов t на хи а в*;ех кванторов всеобщности на Ухх. Для аксиомы (6) воспользоваться заменой всех формул вида / = s отрицанием какой- нибудь фиксированной теоремы. Наконец, заменив все формулы вида t — s какой-нибудь фиксированной теоремой, можно получить доказательство независимости аксиомы (7).) Во всяком исчислении предикатов с равенством формулы (б) и (7) предполагаются аксиомами. 5. Для правил вывода МР и Gen доказать их независимость в том смысле, что если мы опустим любое из них в определении исчисления предикатов с равенством, то его нельзя уже будет потом получить в качестве производного правила. (Указание. Для доказательства независимости МР достаточно заметить, что применение Gen увеличивает число кванторов, не меняя числа связок; замена всякой формулы Vxqt£ на V* ~] (o/g zd orf) поможет доказать независимость Gen.) 6. Назовем формулу оД /г-общезначимой, если она истинна во всех интерпретациях с k элементами. Назовем &$ в точности ^-общезначимой, если она /^-общезначима, но не является k + 1 -общезначимой. Заметим, что /г + 1-обще- значимость влечет /г-общезначимость. Построить пример в точности /г-обще- значимой формулы. (Подробнее об этом см. Гильберт — Бернайс [1934, §§4-5]; Вайсберг [1933].) § 9. Введение новых функциональных букв и предметных констант В математике часто после того, как удается доказать, что для любых yh ..., уп существует и притом единственный объект и, обладающий свойством о?£ (иу yh ..., уп), вводят новую функцию f(yh ..., уп) такую, что &G (/(уь -у Уп)> Уъ '-->Уп) выполнено при любых yh ..., уп. Аналогично, если доказано существование единственного объекта и, удовлетворяющего условию о/ё (и), где о/£ (и) имеет и своей единственной свободной переменной, то вводят новую предметную константу Ь. Общеизвестно, что такие определения хотя и удобны, но ни>чего действительно нового к теории не добавляют. Этот факт может быть точно выражен в следующей форме. Предложение 2.29. Пусть К — теория первого порядка с равенством. Предположим, что \-уЗ\и&#(и, уъ ..., уп). Пусть К' — теория первого порядка с равенством, полученная добавлением к К
94 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА новой п-местной функциональной буквы / собственной аксиомы &£ (/(Уъ • • • у Уп)> Уь •-> Уп) и всех содержащих / частных случаев аксиом (1) — (7). Тогда существует эффективное отображение, преобразующее всякую формулу SB теории К/ в некоторую формулу SB' теории К таким образом, что (1) если / не входит в SB, то SB' совпадает с SB, (2) (1 SB)' совпадает с "| (SS'), (3) (SB zd Щ' совпадает с SB'zd &', (4) (VxSB)' совпадает с Vx(SS)'y (5) |-к,^нв©', (6) если \-k>S3, то [-KS3'. Следовательно, если SB не содержит / и \—^SSy то |— КЛ, Доказательство. Назовем простым /-термом всякий терм fih, ..., ^/г)> ГДе термы tb ..., tn не содержит/. Пусть дана элементарная формула SB теории К', и пусть е©* обозначает результат замещения самого левого вхождения какого-либо простого /-терма f(tb ... ..., tn) в S3 первой переменной и, не встречающейся в SB. Назовем формулу Зи(о7^(и} tb ..., ^Л)&<э®*) /-образом SB. Если формула SB не содержит /, то пусть она сама будет своим /-образом. Очевидно, что \-^Зи{от€{иу tlf ..., ^)&g©*)=e<2®. (Здесь следует принять во внимание условие \- к 3iM(2t^ (м, уь ..., уп) и аксиому es£(f(yb ..., уп\ Уъ -у Уп) теории К'.) Число вхождений функциональной буквы /в о®* на единицу меньше, чем в SB, и [— к'Эи(<2^(н, tb ..., tn)kSB*)-==iSBy поэтому, строя последовательные /-образы, мы в конце концов получим формулу SB', которая не содержит/, и такую, что \— }^>SB' = SB. Назовем SB' /-свободным образом SB. Распространим теперь операцию ' на все формулы теории К', определив ("] SB)' как ~] (SB'), (S3zdW)' как SB' -цЪ1 и (VxSB)' как Vx(SB)'. Легко видеть, что утверждения (1) — (5) выполнены. Чтобы доказать (6), достаточно, используя (1) и (5), показать, что если SB не содержит /и |— ^SB, то |— y^SB. При этом мы можем считать, что формула SB замкнута, так как всякая формула выводима из своего замыкания и обратно. Пусть М —- произвольная модель теории К и Мх-—соответствующая ей нормальная модель той же теории (см. стр. 91). Как мы знаем, всякая формула истинна в М тогда и только тогда, когда она истинна в Мх. Так как |— кЗ-lUq/?(и, уъ ..., уп), то для любых Ъъ ..., Ъп из области модели Мх существует единственный элемент с в этой области, для которого ok (с, Ьъ ..., Ьп) истинно в Щ. Исходя из модели Мх, мы получим теперь модель М' теории К', если возьмем в качестве интерпретации функциональной буквы / функцию f', определенную условием f (bi, ..., Ъп) = с. В самом деле, логические аксиомы (включая аксиомы равенства для К') истинны в любой интерпретации, а аксиома A (f(yi, ..., уп), уъ • • • > Уп) верна в М' в силу определения функции f. Так как собственные аксиомы теории К не содержат / и
§ 9 ВВЕДЕНИИ НОВЫХ ФУНКЦИОНАЛЬНЫХ БУКВ 95 истинны в Мь то они истинны и в М'. Пусть теперь |—к,<а® и о® не содержит /. Тогда формула о®, истинна в М', а следовательно (так как она не содержит /), она истинна в Mi и в М. Итак, формула S3 истинна в любой модели теории К. Отсюда, в силу следствия 2.15 (а) теоремы о полноте, следует [— к<=®. (В случае, когда (— K3iito^ (и) и &# (и) не содержит етличных от и свободных переменных, теория К строится добавлением новой предметной константы Ь и аксиомы о/ё (Ь). После этого соответствующий аналог предложения 2.29 доказывается практически теми же рассуждениями, которые были только что приведены.) Упражнение Найти /-свободные образы формул (x, y,f(x, у, ..., y))zDf(y, х, ..., х) = х) уп-и /0>1> ...» Уп))) V ЪхАМх, f(yu .... уп)\ Отметим, что предложение 2.29 применимо и в том случае, когда вводится несколько различных новых символов, например /ь ... , fn. Мы можем тогда считать, что каждый символ // добавляется к теории, уже полученной в результате добавления символов /ь ..., //л. Таким образом, здесь необходимо «-кратное применение предложения 2.29. Формулу о©' теории К в предложении 2.29 можно рассматривать как свободный от / перевод формулы S3 в язык теории К. Примеры. 1. В элементарной теории групп G (см. стр. 89) выводимо 3iX2 (x\ -j- х% = 0). Введем новую функциональную букву / с одним аргументом и, обозначив f(t) через —t, добавим новую аксиому jci —|— (—Х\) = 0. Согласно предложению 2.29, после всех этих нововведений мы не сможем, однако, вывести никакую формулу теории G, которая не была бы выводима ранее. Таким образом, введение (— t) по существу ничем не усиливает первоначальную теорию. 2. В элементарной теории полей F (см. стр. 90) выводима формула 3\X%({x\ =5^=0 &jci -х<2= 1) V (jci = 0 &jc2 = 0)). Введем новую одноместную функциональную букву g и, приняв сокращение t'1 для g(t), новую аксиому (xi Ф 0 & х\ • х\ * = 1) V (xi = ° & х\1 = °)- Из этой аксиомы можно вывести Х\ -ф 0 zd Х\ • хх 1 = 1. Предложение 2.29 показывает, что в теориях первого порядка существенно необходимыми являются лишь предикатные буквы, без функциональных же букв и предметных констант можно обойтись. Так функциональную букву f" можно заменить новой предикатной буквой Л£+1 вместе с новой аксиомой 3\iiA^{ (yh ...,_ул, н). Предметная константа заменяется новой предикатной буквой Ak с аксиомой ЗхиАЦи). Пример. В элементарной теории групп G мы можем заменить функциональный знак -f- и предметную константу 0 предикатами А\ и А\ с дополнительными аксиомами VXiVx^3x^Al(xh хъ хг) и 3iXiA\{x\).
96 ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА При этом, разумеется, необходимо прежние аксиомы (а), (Ь), (с), (g) заменить соответственно следующими аксиомами: (а') АЦхъ хг, yi)&A\(xh yh y^&A\(xh хь (Ю А\ (У\) & А\ (хъ уъ у (с') Зх^ухМуъ(А\(ух)& (g') [xi = x*&Al(xh & А\ (Хь хъ уд] => У\ — У* &Уъ —Уь Следует заметить, что приведенное доказательство предложения 2.29 не конструктивно, так как оно использует семантические понятия (модель, истинность) и, кроме того, опирается на неконструктивно доказанное следствие 2.15(а). Известны, однако, и конструктивные, синтаксические доказательства предложения 2.29 (см. К лини [1952J, § 74), но они, как правило, весьма сложны. В обычном языке, а также в математике весьма часто употребляются описательные выражения типа «объект и такой, что от€ (иу уъ ..., уп)». Такие выражения называются точными описаниями. Пусть tuosf (я, уи ... • ••>.У/г) обозначает единственный предмет и такой, что g/(и, j/i, ... • • • > Уп\ если такой единственный предмет существует, если же такого единственного предмета не существует, то договоримся считать выражение то/£ (и, Уь ..., уп) лишенным смысла, или подразумевать под ним какой-нибудь фиксированный объект, скажем 0. (Так, например, мы можем сказать, что фразы «нынешний король Франции» или «наименьшее целое число» лишены смысла, или произвольно договориться считать их обозначениями для 0.) Существуют различные способы введения этих i-термов в формализованные теории, но так как в большинстве случаев достигаемые при этом результаты могут быть получены введением новых функциональных букв, как это было сделано выше и так как все эти способы приводят к теоремам, подобным предложению 2.29, то мы не будем здесь на этом останавливаться. По этому вопросу мы отсылаем читателя к Гильберту и Бернайсу [1934] и к Россеру [1939а], [1953]. § 10. Предваренные нормальные формы Формула Qij/i... О.пУп&^> гДб Oayt — квантор всеобщности или существования, yt и yj различны для 1Ф-] и о/£ не содержит кванторов, называется формулой в предваренной нормальной форме. (Сюда включается и случай п = 0, когда вообще нет никаких кванторов.) Мы докажем, что для любой формулы можно построить эквивалентную ей формулу в предваренной нормальной форме. Лемма 2.30. Во всякой теории первого порядка (I) \-(У/х&(х)1Э&) = Зу(&(у)1Э&), если у не входит свободно ни в Ъ (х\ ни в &1\
(II) 1- Зх%(x)zd& = Vy(&(у) ни в *ё' (х), ни в £$\ (III) Y-&ZD \/х^>(х)= бодно ни в *£ (х), ни в £$\ (IV) \- & id Зх% (х) = HU в *ё?(х), HU в £$ V8 10. ПРЕДВАРЕННЫЕ НОРМАЛЬНЫЕ ФОРМЫ 97 I, если у не входит свободно если у не входит сво- % (у))> если у не входит свободно (VI) Н Доказательство I(А). 2. 3. 4. 5. 6. Я (у) 7. 8. 9. Sf 10. -\ 11. 12. 13. 14. 15. Доказательство I(В). 2. 3. 4. 5. гипотеза гипотеза 2, определение квантора существования 3, тавтологии ) (1) следствие 2.21 4, правило А4 5, тавтология (А & 5) id A 6, Gen 7, лемма 2.8 1, 8, МР 5, тавтология *) 9, 10, тавтология 1 — 11 12, предложение 2.4 13, тавтология 14, предложение 2.4 гипотеза гипотеза 1., правило С 2, правило А4 3, 4, МР *) Применения очевидных тавтологий будут теперь отмечаться одним лишь словом «тавголошя». 4 3, Мендельсон
98 ГЛ 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА б Эу(^О;)=>^)> Vx&(x)\-C& 1 — 5 7. Зу(£(у)1эЩ Ухё(х)\-^ 6, предложение 2.23 8. Ь 3^ (^ (у) zd &?)•=> (Vxff (х) zzSf) 7, предложение 2.4 дважды Доказательство I (С). \- (>/х& (х) ZD^) = 3y (& (у) zd &Г) (А), (В), тавтология Остающиеся части (II) — (VI) доказываются легко, читателю предлагается сделать это самому в качестве упражнения. Здесь можно только заметить, что (VI) тривиально, а (V) содержится в упражнении 1 на стр. 83. (III) и (IV) легко следуют соответственно из (II) и (I). Лемма 2.30 позволяет в каждой формуле постепенно передвигать все кванторы влево. Собственно этот процесс и является существенной частью доказательства следующей теоремы. Предложение 2.31. Существует эффективная процедура, преобразующая всякую формулу о/ё к такой формуле 33 в предваренной нормальной форме, что |— о?£ = 33 *). Доказательство. Построение формулы 33 будет описано, следуя индукции по числу k всех связок и кванторов в формуле оД. (В силу предложения 2.18 (а) — (Ь), мы можем считать, что связанные переменные в кванторной приставке, которую мы хотим получить, попарно различны.) При k = 0 33 совпадает с orf. Допустим, что мы умеем строить соответствующие формулы 33 при любом k < п. Пусть формула orf имеет п связок и кванторов. Случай 1. Если о/g есть ~] W, то, согласно индуктивному предположению, мы умеем построить формулу £& в предваренной нормальной форме такую, что )—Ji?=?f. Отсюда \— ~\<ё> = ~| J^, т. е. [— д/ = = ~| &. Применяя теперь (V) и (VI) из леммы 2.30 и следствие 2.21, мы легко построим формулу 33 в предваренной нормальной форме такую, что |— ~}& = 33, откуда получаем |— ©^ = <2®. Случаи 2. Если orf? есть ?? id ^, то, по индуктивному предположению, мы можем построить формулы £?i и Ъх в предваренной нормальной форме такие, что |— ??=£fi и |— Ш = Шь Принимая во внимание соответствующую тавтологию, мы тогда получим |— (&1эЁ) = ^ (^i id £х), т. е. |— оЛ = (£*! id Ш\). Применяя теперь (I) — (IV) из леммы 2.30 и следствие 2.21, мы можем вынести кванторные приставки в ^i и Шх за внешние скобки в (^ и> St), в результате чего и получим такую формулу 33 в предваренной нормальной форме, что |— о^ = 33. Случай 3. g/Z есть Vjc^. По индуктивному предположению, мы умеем строить такую формулу *ё\ в предваренной нормальной форме, что \— £? = ??!. Следовательно, j— Vxff ^ Vat^i, т. е. |—©^=Va:??i. Но формула Vx^i является, очевидно, формулой в предваренной *) Такую формулу 33 автор в дальнейшем называет иногда предваренной нормальной формой формулы Q/g. {Прим. перев.)
$ 10. ПРЕДВАРЕННЫЕ НОРМАЛЬНЫЕ ФОРМЫ 99 нормальной форме. Примеры. I. Пусть &# есть формула V* (А{ (х) id V v (А\ (х, у) =) 1 VzA\ О, г))). Приведем ее к предваренной нормальной форме. В силу пункта (V) леммы 2.30 получаем V* (Л{ (х) =э У/у (Л~ (х, у) zd 3 г ~] д > (у, г))). В силу пункта (IV) той же леммы получаем V* 04} (х) => У/уЗи (Al (х, v) id I A\ Су, и))). В силу (III) получаем У/xWv (Al (x) => 3u (Al (x} v)=>-\Al (v, и))). В силу (IV) получаем >/x>/v3w(A\(x)zd(AI(x, v)zd~]AI(v, w))). Наконец, произведя переименование связанных геременных (следствие 2.22), получаем ЧхЧуЗг (А\ (х) id (A\ (x, y)iDlAl Су, -г))). 2. Пусть ©т^ есть А\ (х, у) => Зу [А\ (у) zd ((3xA\ (x)) id А\ (у))}. В силу пункта (II) леммы 2.30 получаем А\ (х, у) zd Зу [А\ (у) id Ми (А\ (и) => А\ (у))}. В силу (III) получаем А\ (ху у) id 3yMv (А\ Су) => (А\ (v) zd ^ (у))). В силу (IV) получаем 3w (A\ (х, у) zd Vv (A\ (w) id (A\ (v) zd A\ (w))). В силу (III) получаем 3wVz (Al (х, у) zd (A[ (w) zd (Al (z) zd A^ (w)))). Упражнение Построить предваренные нормальные формы, эквивалентные следующим формулам: 1. Уд: (А[ (х) id А\ (х, у))] id ({ЭуА[ (у)] id [3zA\ (у, z)]). 2. 1хА\ (х, у) zd (А\ (х) zd 1 ЭиА* (х, и)). Исчисление предикатов первого порядка, в kotoJdom нет функциональных букв и предметных констант и в котором для каждого целого положительного п имеется бесконечно много «-местных предикатных букв, называется чистым исчислением предикатов первого порядка. Для чистого исчисления предикатов первого порядка может быть 4*
100 ГЛ 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА доказана следующая теорема о предваренной нормальной форме некоторого весьма простого вида Назовем формулу в предваренной нормальной форме формулой в нормальной форме Сколема, если в ней все кванторы существования предшествуют всем кванторам всеобщности. Предложение 2.32. По всякой формуле о/£ чистого исчисления предикатов первого порядка можно эффективно построить такую формулу <£$ в нормальной форме Сколема, что [— о/? тогда и только тогда, когда \- <£% (или, что эквивалентно, в силу теоремы Гёделя о полноте 2.14, ©^ логически общезначима тогда и только тогда, когда логически общезначима «а®). Доказательство. Прежде всего, мы можем считать, что формула os£ замкнута, ибо всякая формула выводима одновременно со своим замыканием. Более того, в силу предложения 2.31, мы можем предполагать, что &£ уже есть формула в предваренной нормальной форме. Назовем рангом формулы о/£ число г, показывающее, сколько кванторов всеобщности предшествует в о/£ хотя бы одному квантору существования. Процесс построения нормальной формы Сколема для формулы о/£ будет теперь описан с помощью индукции по г. При г = 0 утверждение доказываемого предложения очевидно, так как тогда формула о/£ уже является формулой в нормальной форме Сколема. Допустим, что мы уже умеем строить искомую формулу в нормальной форме Сколема всякий раз, когда ранг исходной формулы меньше г, и пусть ранг о/£ равен г. Формула©^ может быть записана в виде 3y\,..3y^iu Q® (Уь • • • > Ут и)> гДе единственными свободными переменными в 3&(у\,... • ••>Ут и) являются уь ..., уп, и. Пусть Л"+1— первая п-\- 1 -местная предикатная буква, не встречающаяся в ок. Рассмотрим формулу ... Зуп ([ Vh («# (уь ..., у№ u)zDA^(yh ..., уп, и))] zd h ..., уш и)). Покажем, что \- о/l тогда и только тогда, когда |— orf\. Пусть |— os£x. Рассмотрим какой-нибудь вывод orf\. Заменим в этом выводе каждое вхождение формулы А'*+1 С2!» ..., zm w) формулой о®* (zh ..., zn, w), где а®* получается из 3$ заменой в SS всех связанных переменных, имеющих свободные вхождения где-нибудь в этом выводе, на переменные, в нем не встречающиеся. При этом, очевидно, мы получим вывод формулы 3yi...3M(Vn(e® (Уь ..., Уп, u)ZD&*(yh ...,ym U)))ZD iD\/u^*(yh ...,ут и)). (<£В заменяется на е®* таким образом, что применения аксиомы (4) остаются применениями той же аксиомы.) Произведя теперь обратную замену переменных, мы, на основании следствия 2.22, заключаем, что ... Зуп [ V« (Jo (yh • • •, Уп> и) => е® (Уъ •. •, Ую и)) =5
§ 10 ПРЕДВАРЕННЫЕ НОРМАЛЬНЫЕ ФОРМЫ 101 Так как |— \/и(<&(Уь ..., yw и)^><&(уъ ..., уПУ и)), то, в силу следствия 2.21, |- Зу\... Зуп Vms® (уъ ..., ут и), т. е. |— оЛ- Обратно, "пусть |- orf. По правилу С, получаем Vwq% (Ъъ ..., Ьт и). Но для любых формул J? и «f |- Vu&f id (Vw (^ id </) zd Vh«P) (см. упражнение 1, стр. 71). Поэтому Vw (e® (fti, • •., Ьп, и) z> Л» + l фъ ...,Ьт и)) id ViM**1 (*ь..., 6да и). Теперь по правилу Е4 получаем Зу\ ... 3j/,, [Vm (<эЗЭ (_уь ... ..., ^ н) id А":+] (уь ..., Уп> к))] =^ УмЛ^1 (j;b ..., ут н)), т. е. hce^i- Но тогда, в силу предложения 2.23, f— <s^i. Формула о^/2, являющаяся предваренной нормальной формой для о^ъ имеет вид 3yi... 3yn3uQiZi... ...Q5z5£, где 5 не содержит кванторов существования, a Qi^i...Qs2'5 есть кванторная приставка в <£$. (Строя о^ъ мы выносим сначала, по лемме 2.30 (I), первый квантор Vm, который превращается при этом в квантор Зм, затем выносим за знак первой импликации кванторную приставку в о®. При этом, в силу леммы 2.30 (I) — (II), кванторы существования превращаются в кванторы всеобщности и обратно. Но когда мы после этого выносим получившуюся кванторную приставку уже за знак второй импликации, то возвращаемся вновь к прежней кванторной приставке Qi^i... Qszs из <£®. Наконец, применив лемму 2.30 (III), выносим наружу второй квантор Vm, заменяя одновременно переменную и новой переменной и) Ранг orf% очевидно, на единицу меньше ранга &# и, кроме того, на основании предложения 2.31, |— о^\ = е^з- С другой стороны, f— o/l тогда и только тогда, когда |— о/£\. Следовательно, (- о/1 тогда и только тогда, когда |— &#* По индуктивному предположению мы уже умеем строить нормальную форму Сколема для о/#ъ которая, очевидно, является нормальной формой Сколема и для <з^. Пример. о/£\ Ух^y3z§(х, у, z), где *§ не содержит кванторов. &€\. Vjc(Vv3^(jc, у, z) zd A) (x)) id Ух А) (х)} где А) не встречается в £?. Построим сначала предваренную нормальную форму для o/£t Ъх ([VyBztf (х, у, z) =э А) (х)] о Уд;Л) (х)) (2.30(1)); Зх (Зу \3z<§ (х, У, z) => А)(х)] => VxA) (x)) (2.30(1)); Зл: (3vV2 (Sf (х, у, г) => А} (х)) гэ ЧхА) (х)) (2.30(11)); ЗхЧу (Чг (? (х, у, г) zd А} (х)) => Ух А} (х)) (2.30 (И)); 3xVy3z ((& (х, у, z) => А) (х)) zd VxA)(x)) (2.30 (I)); 3x4y3z\/v((£ (х, у, z) zd А)(х)) => A)(v)) (2.30 (III)). Повторим этот процесс снова, теперь уже применительно к формуле (& (х, у, z) zd A) (x)) Z2 А) (г»)), которую обозначим через 3'. Пусть А%
102 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА не встречается в J?. Строим последовательно формулы: 3x{yy[3z\lv&(xy у, z, v)z>Al(x, j/)] :э VyAJ (*, у)); 3x3y([3zVv&(x, у, z, v)zDAi(xf у)]^\/уА%(х, у)) (2.30(1)); 3x3y3zVv([&(x9 у, zt v)z*Al(x9 у)]1эУуА%(х, у)) (2.30(1), (II)); 3x3y3zVv\rw(l&(x, у, z, v)zdAI(x, y)]z*Al(x, w)) (2.30(111)). Таким образрм, для формулы о/£ нормальной формой Сколема будет формула 3x3y3z VvVw ([((«> (х, у, z) zd A) (x)) zd A) (v)) zd A% (x, у)] з A% (x} w)). Упражнения 1. Найти нормальную форму Сколема для формул: (а) "1 ЗхА[ (х) zd ValyVxAf (и, х, у); Ь) Vx3.yVa3tM} (л:, yt ut v). 2. Показать, что по всякой формуле q/£ чистого исчисления предикатов эффективно может быть построена формула а® того же исчисления, выполнимая тогда и только тогда, когда выполнима формула <эД, и имеющая вид Vy!... Vy^BZi... 3zm?f, где я, т ^ 0 и 1§ не содержит* кванторов. (Указание. Приме ~| rf 232) y!y^im, ^ рименить к ~| orf предложение 2.32.) 3. Найти нормальную форму Сколема SB для формулы V^B^i (x, у) и показать, что не |— <э® = Ух"ауА\ (л:, .у)* Следовательно, в отличие от предваренной нормальной формы (предложение 2.31) нормальная форма Сколема произвольной формулы о/g может не быть логически эквивалентной q/£. § 11. Изоморфизм интерпретаций. Категоричность теорий Будем говорить, что интерпретация М данной теории первого порядка К изоморфна другой интерпретации М' теории К, если существует такое взаимно однозначное отображение g (называемое изоморфизмом) области D интерпретации М на область D' интерпретации М', что (i) если (Лу)* и (Лу/—интерпретации предикатной буквы А] соответственно в М и М', то, каковы бы ни были Ьь..., Ь^изЭ, (Лу)*(Ьь ..., Ьп) выполнено'тогда и только тогда, когда выполнено (ЛуУ (g (bi), ..., g (bw)); '(ii) если (/у)* й (/у/—интерпретации функциональной буквы /у соответственно в М и М', то для любых t>i, ..., bn из D (/y)*(bi, ..., bn) = //X(g() g(j) (iii) если aj и а) — интерпретации предметной постоянной aj соответственно в М и М', то a'j = g(a*). Отметим, что если интерпретации М и М' изоморфны, то их области имеют одинаковую мощность. Предложение 2.33. Если g — изоморфизм интерпретаций М и М', то (1) каковы бы ни были формула о/£ теории К и последовательность s = (bi, Ьз, ...) элементов области D, формула о/£ выполнена на s тогда и только тогда, когда она выполнена на соответствующей последовательности g(s) —(g(bi), g(b2), ...) и, следовательно, (2) формула о/£ истинна в М тогда и только тогда, когда она истинна в М',
§ 11. ИЗОМОРФИЗМ ИНТЕРПРЕТАЦИЙ КАТЕГОРИЧНОСТЬ ТЕОРИЙ ЮЗ Доказательство. (2) вытекает непосредственно из (1). Доказательство (1) легко может быть выполнено индукцией по числу связок и кванторов в о/£\ мы оставляем его читателю в качестве упражнения. Предложение 2.33 говорит о том, что изоморфные интерпретации имеют одинаковую «структуру», существенно друг от друга не отличаясь. Упражнения 1. Если М — интерпретация с областью D для некоторой теории, a D' — множество той же мощности, что и D, то можно построить интерпретацию М' с областью D' для той же теории такую, что интерпретация М будет изоморфна интерпретации М'. 2. М изоморфна М. Если М изоморфна М', то М' изоморфна М. Если М изоморфна М' и М' изоморфна М", то М изоморфна М". Пусть m — кардинальное число. Теория К первого порядка с равенством называется m-категоричной, если 1) всякие две нормальные модели теории К, имеющие мощность т, изоморфны, и 2) К имеет хотя бы одну нормальную модель мощности m (см. Лось [1954с]). Примеры. 1. Пусть К2—теория, получающаяся присоединением к теории Ki (элементарная теория равенства, см. стр. 88—89) следующей аксиомы (Е2): 3xi3.xr2 (*! Фхъ& \/хг {хъ = Xt V *з = -Хз))- Теория К2 2-категорична Более того, всякая нормальная модель этой теории имеет в точности два элемента. Вообще, пусть (En) обозначает выражение 3Xi . . . Зхп ( & Xi^Xjk Чхп+1 (АГя+1 = X! V • • • V Хп+1 = *пУ), где & Х{ф-Х]—сокращенная запись для конъюнкции всевозмож- J ных формул Х{фХ) таких, что l^Kij^n. Тогда теория КД полученная присоединением к Ki новой аксиомы (En), л-категорична и всякая нормальная модель имеет в точности п элементов. 2. Описанная на стр. 89 теория Кз плотно упорядоченных множеств без первого и последнего элементов ^-категорична (см. Камке [1950], стр. 71: всякая счетная нормальная модель Кз изоморфна модели, состоящей из упорядоченного естественным образом множества всех рациональных чисел). При этом можно доказать, что теория Ка не является m-категоричной ни для какого ш, отличного от ft0- Упражнения А1. Построить теорию первого порядка с равенством, которая не была бы К0-категоричной, но была бы m-категоричной при любом m > $0. (Указание. Рассмотрим теорию О^ коммутативных rpvnn (стр. 89—90). Пусть для любого п пх обозначает терм (... {х + х) -\-... -\- х). Присоединим к G^ новые аксиомы
104 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА {(ffin)'- \^лгЭ1шу (ny = л:), где п = 2, 3, ... Новая теория является теорией коммутативных групп с однозначным делением. Ее нормальные модели являются по существу векторными пространствами над полем рациональных чисел. Однако, как известно, любые два таких пространства одной и той же несчетной мощности изоморфны и в то же время существуют счетные не изоморфные друг другу векторные пространства над полем рациональных чисел (см. Б у р б а к и [1947]).) А2. Построить теорию первого порядка с равенством, т-категоричную для любой бесконечной мощности т. (Указание. Присоединить к теории Gc коммутативных групп аксиому Wxi(2xl = Q). Нормальные модели полученной таким образом теории — это как раз векторные пространства над полем классов вычетов целых чисел по модулю 2. Любые два таких векторных пространства одинаковой мощности изоморфны (см. Бурбаки [1947]).) 3. Существует ли теория первого порядка с равенством, т-категоричная для некоторой несчетной мощности m и не n-категоричная для какой-нибудь другой несчетной мощности п? Выше в примере 2 мы имели дело с теорией, ш-категоричной только для т=К0, в упражнении 1 — с теорией, которая не К0-категорична и m-категорична для любой бесконечной мощности т, большей Ко» и в упражнении 2 — с теорией, m-категоричной при любом бесконечном т. Наконец, элементарная теория групп G не является т-категоричной ни при каком бесконечном т. Возникает вопрос, не исчерпываются ли этими четырьмя случаями все имеющиеся здесь возможности? (Доказательство того, что дело обстоит именно так, объявил М. Д. Морли в Notices Amer. Math. Soc. 9, No. 3 (1962), p. 218.) 4. Доказать, что теоремами теории Кп из предыдущего примера 1 являются те и только те формулы теории Кл, которые истинны в каждой нормальной модели мощности п. А§ 12. Обобщенные теории первого порядка. Полнота и разрешимость *) Если при определении понятия теории первого порядка мы не будем запрещать несчетные количества предикатных или функциональных букв, а также предметных констант, то получим понятие обобщенной теории первого порядка. Таким образом, теории первого порядка представляют собой частные случаи обобщенных теорий первого порядка. Читатель легко поймет, что все результаты о теориях первого порядка до леммы 2.9 включительно остаются в силе и для обобщенных теорий первого порядка, причем без изменений могут быть сохранены и доказательства. Лемма 2.10 заменяется леммой 2.10': если множество символов обобщенной теории первого порядка К может быть вполне упорядочено и имеет мощность J^a, то множество выражений теории К также может быть вполне упорядочено и имеет мощность J$a. (Упорядочим сперва выражения по их длине, которая всегда есть некоторое целое положительное число; пусть теперь е\ и е% — два различных выражения одинаковой длины и / — номер первого, считая слева, символа, входящего в eh отличного от /-го символа в еъ тогда будем считать, что е\ предшест- *) Этот параграф предполагает у читателя более детальное знакомство с порядковыми и кардинальными числами (см. гл. 4, а также Камке [1950J или Серпинский [1958]).
§ 12. ОБОБЩЕННЫЕ ТЕОРИИ ПЕРВОГО ПОРЯДКА 105 вует е% если /-й символ из е\ предшествует у-му символу из е% в упорядочении всех символов теории К.) Лемма Линденбаума 2.11' может быть доказана в тех же предположениях, что и лемма 2.10, причем теми же рассуждениями, которыми доказывался прежний вариант леммы Линденбаума, с той только разницей, что теперь все нумерации (формул <0$i и теорий Ji) должны быть трансфинитными, а доказательство непротиворечивости и полноты J должно опираться на трансфинитную индукцию Аналог теоремы Генкина 2.12 гласит: Предложение 2.34. Если множество символов непротиворечивой обобщенной теории первого порядка К может быть вполне упорядочено и имеет мощность $а, то К имеет модель мощности $ а- Доказательство. Прежнее доказательство предложения 2.12 модифицируется теперь следующим образом. Добавим $а новых предметных констант bi, b2, ..., Ьх, ... Как и прежде, новая теория Ко непротиворечива. Пусть F\ (j^x), ..., Fx (xt ), ... (A << ша) — последовательность всех формул теории Ко, содержащих не более одной свободной переменной. Пусть (£х) обозначает формулу ~| Vjc/ Fx (xi ) zd ~\Fx(bj ), где последовательность bj^ ..., bj различных предметных констант выбрана так, что bj не входит в FJXi} при р^Х. Новая теория Коо, полученная присоединением всех формул (5Х) в качестве новых аксиом, непротиворечива, что доказывается так же, как и прежде, только теперь уже по трансфинитной индукции. После этого, на основании аналога 2.11' леммы Линденбаума, мы делаем заключение о существовании полного непротиворечивого расширения J теории Коо- Модель строится теперь так же, как при доказательстве предложения 2.12, ее область, т. е. множество всех замкнутых термов теории Ко, имеет мощность $а. Следствие 2.35 (1). Если множество символов непротиворечивой обобщенной теории К первого порядка с равенством может быть вполне упорядочено и имеет мощность J$a, то теория К имеет нормальную модель мощности ^ J$a. (2) Если, кроме того, К имеет бесконечную нормальную модель (или если К имеет сколь угодно большие конечные нормальные модели), то К имеет нормаль- ную модель любой мощности Np^ft*- (3) В частности, если К есть обычная теория первого порядка с равенством (т. е. если ^а=^0) и если К имеет бесконечную нормальную модель (или если К имеет сколь угодно большие конечные нормальные модели), то К имеет нормальную модель любой мощности $$ ((3:^0). Доказательство. (1) Существующая на основании предложения 2.34 модель может быть сужена до нормальной (см. стр. 91) модели. Область этой модели состоит из классов эквивалентности в некотором множестве мощности ^а и, следовательно, имеет мощность ^ Ка. (2) Пусть &(з^&*> и пусть bh b% ...— множество новых предметных констант мощности J$p. Присоединим аксиомы ЬхфЬ^ для ^Фу*. Повторяя рассуждения доказательства следствия 2.28, можно показать,
106 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА что полученная таким образом новая теория непротиворечива и, следовательно, в силу (1), имеет нормальную модель мощности ^ ^р (поскольку эта новая теория имеет уже ^р символов). Но ввиду аксиом ЪхфЬ^ эта нормальная модель имеет в точности )&§ элементов. (3) Есть частный случай (2). Из леммы 2.9' и следствия 2.35(1),(2) легко следует, что если обобщенная теория К первого порядка с равенством имеет $а символов, Хр-категорична для некоторого (З^а и не имеет конечных моделей, то эта теория полна в том смысле, что для любой замкнутой формулы orf либо \— к&#, либо |— к~|<2^ (Boot [1954]). В самом деле, если не f— к<2^ и не |—к~1©^, то, в силу леммы 2.9', теории К' = К + \~\^\ и К* = К + {е/^} непротиворечивы, и, в силу следствия 2.35 (1), для этих теорий существуют соответственно модели Mt и М2 мощности ^ fc$a. Поскольку К не имеет конечных моделей, то Mt и М2 бесконечны. Поэтому, в силу следствия 2.35(2), существуют нормальные модели Ni и N2 соответственно теорий К' и К", имеющие мощность $$(1. Так как теория К ftp-категорична, то модели N4 и N2 должны быть изоморфны, что невозможно, однако, из-за того, что в модели Ni должна быть истинна формула "1 е/^, а в модели N2 должна быть истинна формула оЛ'. Поэтому либо (— к©^, либо [— к"1©^. В частности, если К есть обычная теория первого порядка с равенством, не имеющая конечных моделей и ft ^-категоричная для какого-нибудь (3^0, то К — полная теория. Примером такой теории является теория Кз плотно упорядоченных множеств без первого и последнего элементов (см. стр. 89, упражнение 2): она не имеет конечных моделей и fto-категорична. Если обычная теория первого порядка К является эффективно аксиоматизированной, т. е. если существует эффективный способ распознавания аксиом этой теории в множестве всех ее формул, и полной, то она разрешима, т. е. существует эффективная процедура, позволяющая для всякой формулы ответить на вопрос, выводима эта формула в К или нет. Чтобы убедиться в этом, следует вспомнить, что теоремы эффективно аксиоматизированной теории можно эффективно перенумеровать. Всякая формула ет/ выводима тогда и только тогда, когда выводимо ее замыкание. Поэтому мы можем ограничиться рассмотрением одних только замкнутых формул. Так как теория К — полная, то одна из формул ©^, ~}о># является теоремой теории К и, следовательно, встретится в нашем пересчете теорем. Это и дает нам искомую эффективную процедуру. Заметим, что если теория К противоречива, то всякая формула выводима в К и процедура, распознающая теоремы, тривиальна. Если же теория К непротиворечива, то обе формулы о/£ и "1 qs€ не могут появиться при пересчете теорем, и нам отстается лишь ждать, когда появится какая-нибудь одна из них. Если обычная эффективно аксиоматизированная теория первого порядка с равенством К не имеет конечных моделей и ftQ-категорична при некотором J3^5 0, то, в силу юлько чго доказанного, эта теория
$ 12 ОБОБЩЕННЫЕ ТЕОРИИ ПЕРВОГО ПОРЯДКА 107 разрешима. Так, например, разрешима теория Ка плотно упорядоченных множеств без первого и последнего элементов. В некоторых случаях возможны более прямые способы доказательства полноты и разрешимости В качестве примера рассмотрим только что упомянутую теорию К% Ленгфорд [ 1927] предложил следующую процедуру для Кг- Пусть q/Z — произвольная замкнутая формула. В силу предложения 2.31, мы можем считать, что <з^ есть формула в предваренной нормальной форме вида Qyi... Oiyn<&, где <Ш не содержит кванторов. Если Qyn есть V^, то заменим Оуп& на "1 Зуп~\ о®. Таким образом, в любом случае мы можем справа выделить часть Зу$, где ?f не содержит кванторов. Затем всякое отрицание хфу можно заменить на x<y\J у<х, а отрицание х<£у—на х=у V у<.х. Следовательно, из W могут быть изгнаны все знаки отрицания. Мы можем теперь привести сб к дизъюнктивной нормальной форме, т. е. к дизъюнкции конъюнкций элементарных формул (см. стр. 34, упражнение 2). Далее, как мы знаем, формула Зуп $>\ V ... V £?*,) эквивалентна формуле Зу$\ V • --V 'ЗУп&к- Рассмотрим отдельно каждый дизъюнктивный член Зу$\. ¥> i есть конъюнкция элементарных формул вида t < s и t = s. Опустим квантор Зуп перед ??,-, если ^ не содержит уп. Заметим, что если J? не содержит ут то Зуп (J^ & Щ можно заменить на & &3уп%. Таким образом, мы приходим к рассмотрению формулы вида Зуп^у где <У есть конъюнкция элементарных формул, каждая из которых содержит уп. Если при этом один из конъюнктивных членов есть yn = zy где z — переменная, отличная от ут то заменим в eF все вхождения уп на z и опустим Зуп. Если уп=уп является единственным конъюнктивным членом в eF, то тоже опустим Зуп. Если же ^ содержит уп=уп вместе с какими-нибудь конъюнктивными членами, то опустим уп=уп. Всякое выражение Зу^, содержащее конъюнктивным членом в ef неравенство уп<ут заменим на уп<СУп- Если of имеет вид уп < zx к .. .& уп < zj или щ<уп&..Лит<ут где гъ ..., z% uh ...' ..., ит отличны от ут то заменим Зуп<^ на уп=уп. Если же eF имеет вид yn<z1&...&yn<Zj&u1<:yn&...&um<ym то заменим З? на конъюнкцию всевозможных формул щ<С^1> l^i^m, 1 Исчерпав таким образом все возможные случаи, мы заменим формулу Зу^о на некоторую формулу е^, не содержащую квантора Зут т. е. исключим квантор Зуп. Мы приходим к формуле Q^i... Qjv^i^?, где ?f не содержит кванторов. Применим ту же процедуру последовательно к кванторам Оу„_ъ •••» Q^i- В результате мы получим некоторую бескванторную формулу, построенную из элементарных формул вида х = х и х<С.х. Если, наконец, в этой последней формуле заменить всякую элементарную формулу х = х на х = х zd x = x, а всякую элементарную формулу х<,х на ~](х = х^> х = х), то результатом будет некоторая формула, являющаяся частным случаем тавтологии или отрицания тавтологии. (Доказать!) В силу предложения 2.1 либо выводима сама эта формула, либо выводимо ее отрицание. Легко видеть, что вся описанная процедура представляет собой последовательность переходов
ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА от некоторых формул <&~ к некоторым формулам U с сохранением условия |— к<2^=#. Отсюда на основании следствия 2.21 заключаем, что если выводима формула, являющаяся окончательным результатом описанной процедуры, то выводима формула s^, если же выводимо отрицание окончательного результата процедуры, то выводима формула ~1 о/£. Таким образом, теория Кз является полной и разрешимой. Использованный в этом доказательстве метод последовательного исключения кванторов существования был применен также и к другим теориям. С его помощью была получена (Гильберт и Бернайс [1934]), т. I, § 5) разрешающая процедура для элементарной теории равенства Ki (см. стр. 89). Тарский [1951] доказал этим методом полноту и разрешимость элементарной алгебры (т. е. элементарной теории вещественно замкнутых полей, см. Ван дер Варден [1930—1931]), а Шмелева [1955] доказала разрешимость элементарной теории абе- левых групп. (Одно полезное применение этого метода имеется также у Феферманаи Воота [1959].) D Упражнения 1. (Г е н к и н [1955].) Если обычная теория первого порядка с равенством К конечно аксиоматизируема и ^-категорична при каком-нибудь а, то К — разрешимая теория. (Указание. Пусть (Вп) — формула, содержательно выражающая существование не менее п элементов; расширим теорию К, присоединив к ней в качестве новых аксиом формулы (Вп) при /г=1, 2, ... Новая теория не имеет конечных моделей.) 2. Доказать разрешимость элементарной теории равенства Kt (см. стр. 89). (Указание. Рассмотреть формулы (Вп), где (Вп) утверждает существование по крайней мере п элементов. При исключении кванторов существования формулы (Вп) считать элементарными.) Математические приложения (1) Пусть F — элементарная теория полей (см. стр. 90) и п служит обозначением для 1 —J— 1 —|— ... —]— 1. Утверждение о том, что поле имеет характеристику /?, может быть выражено формулой *8р\ /? = 0. Для любой замкнутой формулы о/ё теории F, которая истинна во всех полях характеристики 0, существует простое число q такое, что формула &£ истинна для каждого поля характеристики ^q. В самом деле, пусть F' — теория, полученная присоединением к F аксиом ~] ^ъ ~Х&ъ ..., ~|£fp> ... (для всех простых р). Нормальными моделями теории F' являются поля характеристики нуль. Поэтому, принимая во внимание, что если формула ©^ истинна во всех нормагльных моделях, то она истинна и вообще во всех моделях, мы, на основании следствия 2.15 (а), заключаем, что \—F,os£, Следовательно, для некоторого конечного набора "1 ^ > •••» ~X&q новых аксиом мы имеем ~|^, ..., I??,? \— F&#- Пусть q — какое-нибудь простое число, большее каждого из чисел #!>•••> Яп> В каждом поле характеристики ^ q формулы 1 ?f ^,..., <ё
§ 12. ОБОБЩЕННЫЕ ТЕОРИИ ПЕРВОГО ПОРЯДКА 109 истинны; следовательно, истинна и формула orf (А. Робинсон [1951]). (2) Всякий граф можно рассматривать как множество, частично упорядоченное некоторым бинарным симметричным отношением R (т. е. отношением, выполненным для любых двух вершин тогда и только тогда, когда эти вершины соединены ребром). Назовем граф ^-хроматическим, если он может быть разбит на k попарно непересекающихся (возможно пустых) множеств так, чтобы никакие два элемента из одного и того же множества не были связаны отношением R. (Содержательно этим k множествам можно сопоставить k различных цветов, в которые вершины графа окрашиваются таким образом, чтобы всякие две вершины, соединенные ребром, были окрашены в разные цвета.) Очевидно, что всякий подграф ^-хроматического графа есть также ^-хроматический граф. Докажем, что если множество вершин графа 5 может быть вполне упорядочено, а всякий его конечный подграф ^-хроматический, то и сам граф $ является ^-хроматическим. Для доказательства построим следующую обобщенную теорию К первого порядка с равенством (Бет [1953J). В этой теории будут иметься две двуместные предикатные буквы А\ (—) и А\ (соответствующая отношению R на 5\ k одноместных предикатных букв А[, ..., А^ (соответствующих тем k множествам, на которые мы стремимся разбить $) и предметные константы ас, по одной для каждого элемента с графа £. В качестве собственных аксиом, помимо обычных аксиом равенства (6) — (7) (см. стр. 86), возьмем следующие формулы: (I) ~| А\ (х, х) (иррефлексивность R); (II) А\(х, у) zd А\(у, х) (симметричность /?); (III) Vx(A\(x)\/ ... У А)г(х)) (разбиение на k классов); (IV) \1х-\(А\(х)кА)(х)) для 1</</<А (классы разбиения попарно не пересекаются); (V) ЧхЧу{А1(х)[\А\{у)=>-\А\(х, у)) для 1<*<* (никакие два элемента одного и того же класса не связаны отношением R); (VI) аъ ф ас для любых двух различных элементов Ь, с из графа 3>; (VII) А\ (аь, ас) для любых Ь, с из ^, для которых R(&, с). Рассмотрим произвольное конечное множество этих аксиом. Оно содержит лишь конечное число предметных констант ас, ..., ас . Поэтому соответствующий подграф {ch ..., сп} тоже конечен и, по предположению, ^-хроматический. Это означает, что данное конечное множество аксиом имеет модель и потому непротиворечиво. Из непротиворечивости всякого конечного множества аксиом теории К следует,
ПО ГЛ 2 ТЕОРИИ ПЕРВОГО ПОРЯДКА очевидно, непротиворечивость и самой теории К. Теперь мы видим, что теория К удовлетворяет всем условиям следствия 2.35 (1) и потому имеет нормальную модель, мощность которой меньше или равна мощности графа Э. Эта модель является ^-хроматическим графом и, в силу (VI)—(VII), содержит граф $ в качестве подграфа. Поэтому и граф Ъ ^-хроматический. (Поучительно сравнить это доказательство с обычным математическим доказательством той же теоремы у де Брейна и Эрдёша [1951]. Продемонстрированный только что метод часто избавляет от запутанных рассуждений с применением теоремы Тихонова или леммы Кёнига.) Упражнения 1. (Лось [1954 b.) Группа В называется упорядочиваемой, если существует такое ) порядочивающее группу В отношение R, для которого из xRy следует (x + z)R(y + z) и (z -f- х) R (z -(- У)- Методом, подобным примененному в примере (2) выше, показать, что группа В упорядочиваема тогда и только тогда, когда упорядочиваема любая ее конечно порожденная подгруппа. (При этом, как и в предыдущем примере, предполагается также, что группа В может быть вполне упорядочена.) 2. Построить теорию первого порядка алгебраически замкнутых полей характеристики /?(:>0), присоединив к теории F полей новые аксиомы Рт где Рп утверждает существование корня у всякого отличного от константы полинома степени ^п, а также аксиомы для определения характеристики. Показать, что формула теории F, истинная в каком-нибудь одном алгебраически замкнутом поле характеристики нуль, истинна во всяком таком поле. (У к а- з а н и е. Эта теория К „-категорична для (3>0, аксиоматизируема и не имеет конечной модели.) (См. А. Робинсон [1952].) 3. Обычными математическими рассуждениями решить конечную задачу бракосочетания: пусть М — конечное множество, состоящее из т мужчин, и N — некоторое множество женщин, причем каждый мужчина знает лишь конечное число женщин, а если l^k^m, то мужчины всякого подмножества мощности к множества М знакомы не менее чем с к женщинами из N (т. е. существует не менее к женщин из N, каждая из которых знакома по крайней мере с одним из данных к мужчин); тогда имеется возможность сочетать браком (моногамно) всех мужчин из М с женщинами из N таким образом, чтобы каждый мужчина женился на знакомой ему женщине. (Указание (Халмош и Boot [1950]). При т=\ решение тривиально, для т >> 1 применить индукцию, рассмотрев два случая: (I) при любом к} где \^k<m, всякое множество из к мужчин знакомо не менее чем с к -\- 1 женщинами и (II) для некоторого к, где 1^/г</я, существует множество из к мужчин, знакомых в точности с к женщинами.) Распространить этот результат на бесконечный случай, т. е. на тот случай, когда, при прежних предположениях для любого конечного /г, само множество М бесконечно (и может быть вполне упорядочено). (У к а- з а н и е. Построить подходящую обобщенную теорию первого порядка, аналогичную той, что была использована выше в примере (2) математических приложений, и применить следствие 2.35 (1).) 4. Решение 17-й проблемы Гильберта методом, изложенным в этом параграфе, можно найти в работе А. Робинсона [1955]. Пусть os£ — какая-нибудь формула в предваренной нормальной форме, являющаяся своим замыканием, например, уъ >/8, уь у
§ 12. ОБОБЩЕННЫЕ ТЕОРИИ ПЕРВОГО ПОРЯДКА Ш где Si не содержит кванторов. Опустим квантор Зу\ и заменим ухъ 3d новой предметной константой Ьх\ Уу2ЧугЗуьЗуьVyee® фъ уъ j/3, _у4, Уь J'e)- Теперь опустим кванторы Vj/2, V3/3 и получим формулу Зу{3уъу/у% $Иь Уъ Уь Уъ Уъ)- Опустим, далее, квантор 3^4 и заменим переменную в а© новой функциональной буквой g (j2, УзУ- "ЗуьЧуъ^® Фъ Уъ Уь ь Уг), Уъ Уд- Опустим квантор Зуъ, заменив в Sd переменную j/8 на новую функциональную букву Н{уъ уг): VjV3® (bh yh уъ g(yb y?), АСУз, Уъ), У%). Наконец, опустим и квантор Vy6: 3$ {bh j>2, _y3, g(y% уъ), h(y%, уд, уъ). Последняя формула не содержит кванторов. Таким образом, вводя новые функциональные буквы, мы можем исключить все кванторы из произвольной замкнутой формулы о/£ в предваренной нормальной форме. Обозначим через ©^* результат такой переработки формулы &4. Примеры. 1. Пусть od есть Vyi3j/2 Vy8 Уу{3уъ33 (yh уъ уЪу yif уъ), тогда в качестве g^* имеем У г, У^ h{yh j/8, v4)). 2. Если q^ есть Зу^у^/у^У/у^у^ (yh уъ ys, yi} j/B), то соответствующей формулой Q7#* будет формула 33(Ь, су уд, уь g(y& Уь)). Отметим, что ©^* |— &>£, так как кванторы можно вернуть назад несколькими последовательными применениями правил Gen и Е4. (В самом деле, ведь, говоря точно, мы в процессе построения os£* опускаем все кванторы общности и все кванторы существования и при этом каждую связанную квантором существования переменную y-t заменяем термом g(z\y ..., zk), где g—некоторая новая функциональная буква и z\, ..., Zk — все те переменные, которые связаны кванторами всеобщности, предшествующими квантору 3yi) Предложение 2.36. (Вторая е-теорема; Ра сё в а [1956], Гильберт и Бернайс [1939].) Пусть К — теория первого порядка. Заменим каждую аксиому о^ теории К новой аксиомой оЛ*. (При этом предполагается, что при построении этих формул &£* новые функциональные буквы и предметные переменные, вводимые для какой-нибудь одной формулы, отличны от таковых же, вводимых для других формул.) Пусть К* есть теория первого порядка с собственными аксиомами о/£*. Тогда (а) если Чэ — формула теории К и |—к*^> то |~к^ Ф) теоРия К непротиворечива тогда и только тогда, когда непротиворечива теория К*. Доказательство. (1) Пусть |— КФ?Г, где ?f — формула теории К, и пусть М — счетная модель теории К. Мы всегда можем считать, что областью модели М является множество Р всех натуральных чисел (см. упражнение 1 на стр. 103). Пусть оД — какая-нибудь аксиома теории К; предположим для определенности, что она имеет вид З^у^у3у^(у\, уъ уъ, у^), где SS не содержит кванторов. Тогда будет иметь вид S3(b, уъ уг, g(y* .Уз))- Последовательными шагами расширим теперь модель М (не изменяя, однако, ее области Р) следующим образом. Так как формула Зу^у^у-^Зу^ (уь у* Уь уд истинна
П2 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА в модели М, то существуют целые положительные числа уь для которых УуъУугЗуьо%}(уъ Уъ Уь Уд истинно в М; число/?*, являющееся наименьшим среди таких уъ сделаем интерпретацией предметной константы Ъ. В расширенной таким образом модели, очевидно, истинна формула Зу^З (£, уъ уъ, уд. Для любых целых положительных у2, у3 интерпретацией g(y& .Уз) пусть будет то наименьшее у4, при котором формула & (Ь, уъ Уг> Уд истинна в расширенной модели. Итак, формула <&S(b, уъ уг, g(y% yd) истинна в расширенной модели. Поступив аналогичным образом с каждой аксиомой ©^ теории К, мы построим модель М* теории К*. Так как [— K+?f, то формула ?f истинна в М*. Но тогда формула с£ истинна, очевидно, и в модели М, ибо модель М* тем только и отличается от модели М, что заключает в себе интерпретации нововведенных функциональных букв и предметных констант, которых £f, как всякая формула теории К, не содержит. Итак, доказано, что формула ?? истинна во всякой счетной модели теории К. Отсюда, на основании следствия 2.15 (а), следует |— K?f. (Конструктивное доказательство эквивалентного результата см. у Гильберта и Бер- найса [1939].) (2) Ввиду того, что ©^* |— g^, теория К* является расширением теории К. Следовательно, если теория К* непротиворечива, то непротиворечива и теория К- Предположим теперь, что непротиворечива теория К. Пусть ?f—произвольная формула теории К- Если бы теория К* была противоречива, то мы имели бы \~^§ h ~\<ё>. Тогда, в силу части (1) настоящего доказательства, мы имели бы и (— K£f&~]£f, что невозможно из-за непротиворечивости теории К. Назовем обобщенной теоремой полноты предложение, гласящее, что всякая непротиворечивая обобщенная теория первого порядка имеет модель. Очевидно, если предположить, что можно вполне упорядочить всякое множество (или, что эквивалентно, при допущении аксиомы выбора), обобщенная теорема полноты является следствием предложения 2.34. Теоремой о максимальном идеале мы называем следующее утверждение: всякая булева алгебра имеет максимальный идеал. Это утверждение эквивалентно теореме о булевом^ представлении, согласно которой всякая булева алгебра изоморфна некоторой булевой алгебре множеств. (См. Стоун [1936]. О теории булевых алгебр см. Сикорский [I960].) Единственное известное доказательство теоремы о максимальном идеале использует аксиому выбора. Любопытно, однако, что эта теорема эквивалентна обобщенной теореме полноты и что эта эквивалентность может быть доказана без применения аксиомы выбора. Предложение 2.37. (Лось [1954а], Ра сё в а и Сикорский [1951], [1952].) Обобщенная теорема о полноте эквивалентна теореме о максимальном идеале. Доказательство. (1) Допустим, что верна обобщенная теорема о полноте. Пусть В — булева алгебра. Построим обобщенную теорию К
§ 12. ОБОБЩЕННЫЕ ТЕОРИИ ПЕРВОГО ПОРЯДКА ИЗ первого порядка с равенством, имеющую двуместные функциональные буквы U и П, одноместную функциональную букву f[ if\ (t) мы будем обозначать через ?), предикатные буквы = и А\ и для каждого элемента b алгебры В предметную константу аъ. В качестве аксиом мы возьмем обычные аксиомы булевой алгебры (см. Сикорский [I960]), аксиомы (6) — (7) равенства, полное описание В (т. е. всевозможные формулы аьфас, аь \] ас = аф аь 0_ac = ae, ab = abv где соответственно Ъфсу b U c = d, b f| c = e, b = bi в В) и, наконец, аксиомы, выражающие тот факт, что А\ определяет максимальный идеал (т. е. A\(x{\xl A\{x)kA\{y)zDA\{x\]yl A[(x) zd А\(х (] у), А\(х)У У А\(х) и ~\А\(х\]х). Теория К непротиворечива. В самом деле, вывод противоречия в К, если бы такой существовал, содержал бы лишь конечное число символов аь, ас, ... , например, аь , ..., аь , и 1 п тогда соответствующие элементы bi, ..., bn алгебры В порождали бы некоторую конечную подалгебру В' алгебры В. Но всякая конечная булева алгебра, очевидно, имеет максимальный идеал. Следовательно, подалгебра В' была бы моделью для формул, встречающихся в выводе противоречия, а само это противоречие было бы истинно в В', что невозможно. В силу своей непротиворечивости, теория К имеет, согласно обобщенной теореме полноты, некоторую модель А, являющуюся, естественно, булевой алгеброй с некоторым максимальным идеалом I. Но алгебра В, очевидно, есть подалгебра алгебры А, и следовательно, множество I П В является максимальным идеалом в В. (2) Предположим, что верна теорема о максимальном идеале. Пусть К — непротиворечивая обобщенная теория первого порядка. Для каждой аксиомы <&# теории К построим формулу ©^*, приведя сначала &£ к предваренной нормальной форме, а затем исключив кванторы путем введения новых функциональных букв и предметных констант. Пусть К' — теория, имеющая своими аксиомами построенные таким образом формулы ©^*, а также все частные случаи тавтологий, и такая, в которой все формулы не содержат кванторов, а правилами вывода служат modus ponens и правило подстановки для переменных (т. е. подстановки термов вместо переменных). Теория К' непротиворечива, так как теоремы этой теории являются одновременно теоремами непротиворечивой теории К* из предложения 2.36. Пусть В — алгебра Линденбаума, порожденная теорией К'. (Поясним, что это значит: пусть для произвольных формул ©^ и S3 o^Eq<^3 означает |— k,©^ = q®; отношение Eq есть отношение эквивалентности; пусть [о^] — класс эквивалентности, определяемый формулой gs#; зададим операции U, П, ~ над классами эквивалентности равенствами [qs€] U [Щ = [&# У <э®], [е^] П [Щ = = [os£ &<2®] и [qs£] — [~]gt#]; относительно этих операций классы эквивалентности образуют булеву алгебру, которая и называется алгеброй Линденбаума, порожденной теорией К'.) Пусть, согласно теореме о максимальном идеале, I есть максимальный идеал алгебры В. Построим модель М теории К' с областью, состоящей из термов теории К'.
П4 ГЛ. 2. ТЕОРИИ ПЕРВОГО ПОРЯДКА в которой предметные константы и функциональные буквы интерпретируют самих себя, и для всякой предикатной буквы А" предикат Лу (th ..., tn) считается истинным в М тогда и только тогда, когда [Лу (th ..., tn)\ не принадлежит I. Легко показать, что любая формула gs£ теории К' истинна в М тогда и только тогда, когда [os£] не принадлежит I. Но для всякой теоремы Sd теории К' [а®]=1 и, следовательно, [о®] не принадлежит I. Поэтому М на самом деле является моделью К'. Для любой аксиомы orf теории К каждый результат подстановки в формулу о/l* (уъ • ■ •, Уп) является теоремой теории К', следовательно, формула gs£* (уъ •••> Уп) истинна в модели М при любых уь ..., уп. Обращая процесс, в результате которого формула (2/^* возникает из формулы ок, теперь легко доказать, что и эта последняя формула истинна в модели М. Таким образом, М есть также модель и для теории К. Является ли обобщенная теорема полноты существенно более слабой, чем аксиома выбора, или она ей эквивалентна? Некоторые частичные результаты, относящиеся к этой проблеме, можно найти у Лося и Р ы лль-Нар дзевского [1954] и у Генкина [1954]. О найденном доказательстве неэквивалентности этих предложений заявил Дж. Д. Гальперн в Notices Amer. Math. Soc. 9, No. 4 (1962), p. 315. Упражнения 1. Доказать, что обобщенная теорема о полноте влечет утверждение о том, что всякое множество может быть упорядочено (и, следовательно, аксиому выбора для любого множества непустых попарно не пересекающихся конечных множеств). 2. Проанализировать доказательство предложения 2.37 (2) и показать, что если К есть обычная теория первого порядка, то алгебра Линденбаума В счетна, и все рассуждение может быть проведено без использования теоремы о максимальном идеале. Алгебраические структуры, естественным образом связанные с исчислениями высказываний, оказываются булевыми" алгебрами (см. стр. 52, упражнение 3, а также Розенблюм [Г950], гл. 1—2). В случае теорий первого порядка наличие кванторов приводит к более сложным алгебраическим структурам. Так, например, если К есть теория первого порядка, то в соответствующей алгебре Линденбаума В имеет место [ЗхА (х)] = ^ [о/£ (t)]t где 2 означает наименьшую верхнюю грань в В, t t a t пробегает множество всех термов, свободных для х в о/£ (х). В свое время были предложены два типа алгебраических структур в качестве алгебраических аналогов рассмотренных в этой главе логических теорий. Один из них — цилиндрические алгебры—был детально изучен Тарским, Томпсоном, Генкиным и другими (см. Генкин и Тарский [1961]). Другим подходом явилась теория полиадических алгебр, введенная и развитая Халмошем [1962].
Глава 3 Формальная арифметика § 1. Система аксиом Наряду с геометрией арифметика является наиболее непосредственно интуитивной областью математики. Вполне естественно поэтому именно с арифметики начать попытку формализации и строгого обоснования математики. Первое, полуаксиоматическое построение этой дисциплины было предложено Деде.киндом [1901] и стало известно под названием «системы аксиом Пеано» *). Эту систему можно сформулировать следующим образом: (Р1) 0 есть натуральное число. (Р2) для любого натурального числа х существует другое натуральное число, обозначаемое х' и называемое: (непосредственно) следующее за х. (РЗ) 0 ф- х' для любого натурального числа х. (Р4) Если х' = у', то х = у. (Р5) Если Q есть свойство, которым, быть может, обладают одни и не обладают другие натуральные числа, и если (I) натуральное число 0 обладает свойством Q и (II) для всякого натурального числа х из того, что х обладает свойством Q, следует, что и натуральное число х' обладает свойством Q, то свойством Q обладают все натуральные числа (принцип индукции). Этих аксиом, вместе с некоторым фрагментом теории множеств, достаточно для построения не только арифметики, но и теории рациональных, вещественных и комплексных чисел (см. Ландау [1930]). Однако в этих аксиомах содержатся интуитивные понятия такие, как, например, «свойство», что мешает всей системе быть строгой формализацией. Поэтому мы сейчас построим некоторую теорию первого порядка S, основанную на системе аксиом Пеано, которая окажется, по всей видимости, достаточной для вывода всех основных результатов элементарной арифметики. Эта теория первого порядка S будет иметь единственную предикатную букву А\, единственную предметную константу ах и три функциональные буквы /J, /{, /|. Впрочем, чтобы не порывать с привычным; нам по неформальной арифметике обозначениями, в дальнейшем м *) Исторические сведения по этому вопросу можно найти у Ван X а [1957а].
Пб ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА будем обычно писать t = s вместо А{ (t, s), 0 вместо п\ и t\ t-\-s, t-s соответственно вместо f{(t), fl(t> s), /|ft s), где t и 5 —термы. Вот собственные аксиомы теории S: (51) xi = х* =э (xi = хъ Z) Хъ = х& (52) Х1 = Хъ^>х[ = х'ъ (53) О^^У; (54) jci = х'г id jci = jc2; (55) ^ + 0 = W> (56) *i+x2 = (xi + x2)'; (57) X!.0 = 0; (58) ЛГ! • (X2) = (Xi • Хъ) -f- ДГГ, (59) ©^ (0) id (Vat {&€ (x) id orf (x')) zdVxo^ (x))9 где &€ (x) — про- извольная формула теории S. Заметим, что аксиомы (SI) — (S8) являются конкретными формулами, в то время как (S9) представляет собой схему аксиом, порождающую бесконечное множество аксиом. При этом схема аксиом (S9), которую мы будем называть принципом математической индукции, не соответствует полностью аксиоме (Р5) системы аксиом Пеано, поскольку в этой последней интуитивно предполагаются 2 Ко свойств натуральных чисел, а схема аксиом (S9) может иметь дело лишь со счетным множеством свойств, определяемых формулами теории S. Аксиомы (S3) и (S4) соответствуют аксиомам (РЗ) и (Р4) системы аксиом Пеано. Аксиомы (Р1) и (Р2) пеановской системы обеспечивают существование нуля 0 и операции «непосредственно следующий», которым в теории S соответствуют предметная константа ах и функциональная буква /}. Наши аксиомы (SI) — (S2) обеспечивают некоторые необходимые свойства равенства, которые Дедекиндом и Пеано предполагались как интуитивно очевидные. Аксиомы (S5) — (S8) представляют собой рекурсивные равенства, служащие определениями операций сложения и умножения. Никаких постулатов, соответствующих этих аксиомам, Дедекинд и Пеано не формулировали, потому что они допускали использование интуитивной теории множеств, в рамках которой существование операций -j- и •, удовлетворяющих аксиомам (S5) — (S8), выводимо. (См. Ландау [1930], теоремы 4 и 28.) С помощью МР из схемы аксиом (S9) мы можем получить следующее правило индукции: из <2^(0) и V х (orf (х) id g?£ (xr)) выводится Vat q/1 (x). Наша ближайшая цель состоит в том, чтобы вывести обычные свойства равенства; другими словами, мы хотим доказать, что свойства (6) — (7) равенства (см. стр. 86) выводимы в S, и, следовательно, S является теорией первого порядка с равенством. Прежде всего, отметим некоторые непосредственные и очевидные следствия из аксиом. Этими следствиями мы будем в дальнейшем поль-
§ I. СИСТЕМА АКСИОМ Ш зоваться для сокращения и вообще для более удобного проведения доказательств. Лемма 3.1. Для любых термов tf s и г теории S следующие формулы суть теоремы в S: (S2') (S3') (S4') (S5') <S6') (S7') (S8') Доказательство. (ST) — (S8') следуют соответственно из (SI) — (S8): сперва следует образовать замыкания по правилу Gen, а затем применить правило А4 с подходящими термами t, r, 5. Предложение 3.2. Для любых термов t, s и г следующие формулы являются теоремами теории S: (a) t = t; (b) t=riDr = t; (c) t = г z> (г = 5 zd t = s); (d) r = * id (s = t zd r = s)\ (e) t = rz}t-\-s = r-\-s\ (f) г = 0-Н; (g) f + r = (t + ry; (h) ^ + r = r + ^; (i) ^ = r Z5 s -j-t = s + r> (j) (k) t = rzDt*s = i (1) 0.^ = 0; (m) f • r = t. г + г; (n) t.r = r-t\ Док азательство. (a) 1. 2. (^ + 0 = 0zD(f + 0 = ^iDf = 0 (ST) 3 t + O = tiDt = t 1, 2, MP 4. / = * 1, 3, MP
s ГЛ 3 ФОРМАЛЬНАЯ АРИФМЕТИКА (b) 1. t=rZD(t = tZDr = t) (SI') 2. t — tzD(t = r zd r = f) 1, тавтология 3. t^rzDT = t 2, (a), MP (C) 1. r = tZD(r = SZDt = s) (SI') 2. г = г=эг = г (b) 3. t = r id (r = 5 n> t = s) 1, 2, тавтология 2. t = szD(r = tzDr = s) 1, тавтология 3. S = t ZD t = S (b) 4. 5 = t zd (r = t zd r = s) 2, 3, тавтология 5. r = t zd (s = t zd r = s) 4, тавтология (e) Применим правило индукции к следующей формуле &# (г): (О 1. x + 0 = x (S5') 2. y_|_o=j/ (S5') 3. х=у гипотеза 4. х-\-0=у 1, 3, (с) 5. х + 0=у +0 2, 4, (d) 6. х=у zd х-\-0=у-\-0 1—5, теорема дедукции т. е. [- <2т£ (0). (ii) I. x=yzDX-\-z=y-\-z гипотеза 2. х=у гипотеза 3. х + ?! = (х + zy (S&) 5. x-\-z=y-\-z 1, 2, MP 6. (X + zY = (y + zy 5, (S20 7. x + J = (y-\-zy 3, 6, (c) 8. x + z'=y + 2f 4, 7, (d) 9. (x=yzD(x-\~z=y + z))zi zd (x =y zd (x -)- zr =y 4- z')) 1 —8, теорема дедукции т. e. \-&€ (z) id orf (z'\ По правилу индукции из (i) и (ii) следует \-4zos£(z), откуда с помощью правил Gen и А4 окончательно получаем |— t = r zd t -\- s = (f) Обозначим через &#(х) формулу х- (i) 0 = 0 + 0, в силу (S5') и (Ь), т. е. ^
§ I. СИСТЕМА АКСИОМ 119 (ii) 1. х = 0-\-х гипотеза 3. y = (0-f л:/ 1, (S2') 4. У = 0 + лг' 2, 3, (d) 5. x = 0-\-xzd x^==^0-]-У 1—4, Теорема дедукции т. е. Из (i) и (ii) получаем по правилу индукции j— Vat (jc = 0 -j- jc), откуда по правилу А 4 [— t = O-\-t. (g) Пусть ok (if) обозначает xf -\- у = (x -\- y)\ (i) i. j/ + o==j/ (S60 2. x-\-0 = x (S5f) 3. (лг-)-ОУ = л-' 2, (S2') 4. x'-\-0 = (x-\-0)' 1, 3, (d) т. e. |— <2^ (0). (ii) 1. J? -\-у = (х-{- у)' гипотеза 2. x' -\-У = (x' -\-y)' (S&) 3. (xf -\-y)' = (x + y)" 1, (S2') 4. y-fy = (^ + vyf 2, 3, (c) 5. (х-\-У) = (х-\-у)' (S6') 6. (х\-у')' = (х-\-у)" 5, (S2') 7. Jt'+/ = (* + /)' 4, 6, (d) 1—7, теорема дедукции т. е. \~о^(у):эо^{У). Теперь из (i) и (ii) получаем с помощью правила индукции |— My(xf -f-у = (х-f-у)) и затем в силу Gen и А4 |— f -[- r = (t-\-r)\ (h) Пусть orf (x) обсвначает х-\-у=у-\-х. U) 1. -tf-f-u — х (ьо) 2. д: = 0 + л: (f) 3. лг-|-О = О + лг 1, 2, (с) т. е. [- о/£ (0). (ii) 1. дг-j- у=у-\-х гипотеза . X —j— _y = [X —р J// ^oO j . у -j- л: = (у -|~ лг) (g) 4. (jc -f- 3;)' = О + л:/ 1, (S2') 5. х + У = (у + хУ 2, 4, (с) 6. х-\-У=У + * 3, 5, (d) I—6, теорема дедукции I. e. h ^1'
120 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА Отсюда, в силу (i) и (ii), по правилу индукции имеем \-\fу (х-\-у = =у-\-х) и затем по правилам Gen и А4 получаем |—1-\- r —r -\-t. (i) 1. * = г: 2. t-\-s = s + t 3. r + s = s-{-r 4. t=r 5. £-|-s = r-|-s 6. 5 + ^=Г + ^ 7. 5-j-^ = 5 + r 8. ^=r: (j) Берем в качестве orf (z) формулу (i) 1. 2. 3. 4. т. e. (-s^(O). 00 2. 3. 4. 5. 6. 7. 8. 10. +04-*)' = т. е. (e) (h) (h) гипотеза 1, 4, MP 2, 5, (SI') 3, 6, (c) 1—7, теорема дедукции (Sff) (S5') 2, (0 1, 3, (d) гипотеза (Sff) 1, (S2') 2, 3, (c) (S6') 5, (0 (S6') 6, 7, (d) 4, 8, (d) 1—9, теорема дедукции И снова, применяя к (i) и (ii) правило индукции, получаем |— Vz ({х -f- у) -)- z = х -\- (у -f- .г)), откуда по правилам Gen и А4 заключаем \—(t-\-r)-\-s = t-\-(r-\-s). Доказательство пунктов (к) — (о) оставляем читателю в качестве упражнений. Следствие 3.3. Теория S является теорией первого порядка с равенством, т. е. в этой теории \-х\ = Х\ и |— х=у zd (qs£ (x, x) zd ZD оЛ (х, у)), где о/£ (х, у) получается из о/£ (х, х) заменой одного или нескольких вхождений х на у при условии, что переменная у свободна для этих вхождений х (см. стр. 86).
§ 1. СИСТЕМА АКСИОМ 121 Доказательство. В силу предложения 2.26 утверждение 3.3 является непосредственным следствием предложения 3.2 (а) — (е), (i), (k), (о) и (S2'). Отметим, что интерпретация теории S, в которой (a) множество всех неотрицательных целых чисел служит областью, (b) целое число 0 интерпретирует символ О, (c) операция взятия последующего (прибавление единицы) интерпретирует функцию ' (т. е. функциональную букву /}), (d) обычные сложение и умножение интерпретируют -\- и •, (e) предикатная буква = интерпретируется отношением тождества, является нормальной моделью теории S. Эта модель называется стандартной моделью теории S. Всякая нормальная модель теории S, не изоморфная ее стандартной модели, называется нестандартной моделью теории S. Если мы признаем эту стандартную интерпретацию моделью теории S, то тогда мы должны будем признать и факт непротиворечивости этой теории. Однако семантические методы, включающие в себя, как правило, известную долю теоретико-множественных рассуждений, по мнению некоторых математиков являются слишком ненадежной основой для доказательства непротиворечивости. Более того, мы и не доказываем строго, что аксиомы теории S истинны в стандартной интерпретации, а принимаем это утверждение всего лишь как интуитивно очевидное. Поэтому, а также по ряду других причин принято всякий раз, когда на утверждение о непротиворечивости теории S опирается какое-либо доказательство, явно ссылаться на это утверждение как на некоторую недоказанную гипотезу. (В Приложении мы приводим одно «доказательство» непротиворечивости теории S.) Ряд важных свойств сложения и умножения содержится в следующих предложениях. Предложение 3.4. Для любых термов t, r, s следующие формулы являются теоремами теории S: (a) t • (г -\- s) = (t • г) -}- (t • s) (дистрибутивность); (b) (r -f- s) -t = (r • t) -f- (s • t) (дистрибутивность); (c) {t-r)-s = t-(r -s) (ассоциативность умножения); (d)t-\-s = r-\-s^t=r (правило сокращения для -|-). Доказательство. (a) Индукцией по z доказать |— х-(у-{-z) = (x*y)-\-(x* z). (b) Следует из (а) с помощью предложения 3.2 (п). (c) Индукцией по z доказать |— {x-y)-z = x-(y-z). (d) Индукцией по z} с использованием (S4'), доказать \-x-\-z=* \ Термы 0, 0', 0", 0"', ... мы в дальнейшем будем называть цифрами и обозначать, как обычно, 0, 1, 2, 3, ... И вообще, для любого целого
122 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА неотрицательного п соответствующую цифру О'"---', т. е. О с п штрихами, будем обозначать через п. Цифры можно определить рекурсивно: О есть цифра; если и — цифра, то и м' — цифра. Предложение 3.5. 2 = t-\-t (и т. д. для 3, 4, ...); id 3y(*=/); (а) (b) Н (c) \-t (d) (е) (f) (g) (h) (i) (j) Доказательство. (a) 1. 2. 3. 4. 5. t-\-~\=f (b) 1. t.O' = t.O-\ 2. ^-0 = 0 3. (*.O)-j-* = 4. t-O' = O-\-t 5. 0-[-*=:* 6. ^0'==^ 7. t»\=t (c) M M 2. <•!=/ 3. (t.\)-\-t = 4. t.\' = t-\-t 5. t'2 = t-\-t (S6') (S5') 2, (S2') 1,3, предложение 3.2(с) 4, определение цифры f (S8') (S7f) 2, предложение 3.2(е) 1,3, предложение 3.2(с) предложение 3.2(f),(b) 4, 5, предложение 3.2(с) 6, определение цифры Г (S8') (b) 2, предложение 3.2(е) 1,3, предложение 3.2(с) 4, определение цифры 2 (d) Обозначим через <э^О>) формулу x-\-y = 0iD х = 0 & у = 0. Легко показать, что f-e^(O). В силу (S3f), [—(jc —|—З'У Ф 0. Отсюда на основании (S6') получаем |—дг-(-/^:О. Следовательно, в силу тавтологии "1 A id (A id В), \—Qs?(y') и далее, в силу тавтологии A zd(B z^ A), получаем |— &£(у) =э о?£ (у'\ Применив теперь правило индукции,
§ 1 СИСТЕМА АКСИОМ 123 получим f-Vy<=^(y), а затем с помощью правил Gen и А4 и утверждение (d). (e) Доказывается аналогично (d). Предоставляется в качестве упражнения читателю. (f) Доказывается индукцией по у в формуле х-\-у—\ zd((лг = О&у = \) у (х=\&у = 0)). (g) Индукция по у в Х'у— 1 zd (х= Г ку= 1). (h) Провести индукцию по х в х Ф 0 id 3w (x = wr). (i) Пусть orf(y) есть формула Vat (z Ф 0 id (x • ^ = J/ • г id * =-У)). (i) 1. гфО гипотеза 2. x-z = 0'Z гипотеза 3. О *z = 0 предложение 3.2(1) 4. x-z — 0 2, 3, предложение 3.2(с) 5. х = 0 1, 4, (е) 6. 2'^0з(лг-(г = 0-(г=5Лг = 0) 1—5, теорема дедукции 7. Vx(zфО id (х• z = 0• z id x = 0)) 6, Gen т. е. \-о^(0). (и) 1. Vx(z=^=0 zd(jc*^=-v-z idx=j)) гипотеза (<^О>)) 2. г =^= 0 гипотеза 3. A;.z=y«^ гипотеза 4. УФО (S3'), предложение 3.2(Ь) 6. у*гфО 2, 4, (е), тавтология Q. х^фО 3, 5, (S1'), тавтологии 7. хфО 6, (S7'), предложение 3.2(о), (е), тавтологии 8. 3w (x = zcf) 7, (h) 9. x = wr 8, правило С 10. w' -z =y'-z 3, 9, свойство (7) равенства 11. w*z -\-z=y-z-\-z 10, предложение 3.2 (m), (d) 12. wz—y»z 11, предложение 3.4
124 ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА 13. гфО ZD((w-z = y-z)z}(w — z)) 1, правило А4 14. w-z=y-zzDW=y 2, 13, МР 15. w=y 12, 14, МР 16. w' = y 15, (S2') 17. х = уг 9, 16, предложение 3.2 (с) 18. оЛ{у), zфO, x*z=y *z\- х—У 1—17, предложение 2.23 19. Qs£(y) \-z=/=Qzi(x-z=y -ziDX==y) 18, теорема дедукции (дважды) 20. &£(y)l-Vx(z=£0z} ZD(x-z = y-ziDX=y)) 19, Gen 21. \-osg (у) => gt£ (У) 20, теорема дедукции Теперь к (i) и (ii) применяем правило индукции, чтобы получить \—Vyos#(у), после чего доказательство завершаем с помощью правил Gen и А4. Доказательство (j) предоставляем читателю в качестве упражнения. Предложение 3.6. (а) Для любых натуральных тип, если тфПу то \—тфп. Кроме того \—т-\-п = т-{-п и \-т>п = т*п. (Ь) Всякая модель S бесконечна, (с) Каково бы ни было кардинальное число ^,, S имеет нормальную модель мощности $ . Доказательство, (а) Допустим, что тфп. Тогда т<п или п<С.т\ пусть для определенности т<п. 1. т = п гипотеза т раз п раз 2. ()"'•••' = ()'"•••' 1, определение цифр т, п 3. Применяем т раз (S4'): п — т раз Обозначим п — т — 1 через t. Так как т<Сп, то п — т — 1^0. Поэтому 0 = f. 4. ОфГ (S3') б. 0 = f&0фf 3, 4, тавтология 6. |— т = п zd (0 = И & 0 Ф f) 1—5, теорема дедукции 7. \-тфп 6, тавтология Аналогичное рассуждение можно провести для случая т<С.п. Теперь индукцией по п в метаязыке мы можем доказать и \-т-\-п = т-\-п. Во-первых, tfz-j-О есть т. Следовательно, по (S5'), |— т -\- 0 = т -\- 0. Предположим, что |— т-\-п = т-\-п. Тогда, в силу (S2') и (S6'),
§ 1. СИСТЕМА АКСИОМ ' 12о \-(т-\-пУ = т-\-(п)'. Но т-\-(п-\-1) есть (т-\-п)г и л-f-l есть (л)', следовательно, |— //г —|— (лг —j— 1) = т -\- п -j- 1. Подобным же образом индукцией по п в метаязыке нетрудно доказать и |— Ш'П = т-п. (b) В силу доказанного только что пункта (а), во всякой модели теории S объекты, соответствующие различным цифрам, должны быть различны, всех же цифр имеется счетное множество. (c) Это утверждение следует из следствия 2.35(с) и из того факта, что стандартная модель является бесконечной нормальной моделью. Отношение порядка в S можно ввести следующим образом. О пределения t< t ^ 5 означает s означает £>s означает *< Чтобы первое пример. 5 означает s означает 3w (w Ф i i <^s у i- s<t, l(t<S) I 0&t-\-w = s)) = 5, Л Т. Д. из этих определений было корректным, можно, на- , считать, что w — это не входит в термы Пр едложен! дующие формулы (а) <Ь) (с) (d) (е) (*) (g) (h) 0) (j) (к) 0) (m) (n) До (a) (b) t<t; t<sz)(s< t<SZDS<\ t<s = t-\ t^t; t^SZD(S* t^SZD(S< 0<f; t<r = f* t^r = t< t<f; (0<l)&(l &(2<3)& казатель Следует из 1. ;<s 2. s<r t И S. первая предметная переменная. л е 3.7. Каковы бы ни выводимы в <riDt<r); -r<s-\-r; ^riDt^r); J- r < s -f- r); :rf; <2)& CTBO. предложения S: (о) (о') (Р) (q) (г) (s) (t) 00 (v) (w) (х) (У) (z) 3.4(d). были термы гфг=>{1;<г t = r \J t<r t^r\J r^t; гфОиг + г гфО^г-г^ гф0 = г>0 r>0iD(t>Q гфО^У>\ г ф 0 =э (t < s гфО^У^в t<0; t^r&r^tz гипотеза гипотеза t, r V г< V г< >t\ -А; 1 id Г '.ZDt- = t- = t • D t = } которая и s, еле- Ct; -t>0); r > r); г < s • r); r < s - r); r.
ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА 126 3. 3w(хй)фО&г-\-т = 8) 1, определение 4. 3v (v Ф 0 & 5 -|- v = г) 2, определение и, возможно, переименование связанных переменных 5. х0фО&(-]-хй) = 8 3, правило С 6. vфO&s-\-v = r 4, правило С 7. t-\-w~s 5, тавтология 8. s-\-v = r 6, тавтология 9. (t-\-w)-\-v = r 7, 8, предложение 3.2(е) 10. t-\-(ха>-\-v) = г 9, предложение 3.2(j) 1\. мфО 5, тавтология 12. v ф 0 6, тавтология 13. w-\-v ф 0 И, 12, предложение 3.5(d), тавтология 14. w -\-vфO&t-\- (w-\-v) = r 10, 13, тавтология 15. Зи(ифО&(-\-и = г) 14, правило Е4 16. t<c r 15, определение 17. |— t<cs id (s<r id t<ir) 1 —16, теорема о дедукции, предложение 2.23 Доказательство выводимости формул (с)—(z) оставляется читателю в качестве упражнения. Теоремы (а)—(z) не расположены в каком-нибудь специальном порядке, если не считать того, что при этом порядке каждая из них может быть выведена более или менее непосредственно из предыдущих. Предложение 3.8. (а) Для каждого натурального k (а') Для каждого натурального k и для всякой формулы o/Z \-Q^(0)&...&e^(k) = yfx(x<ikzDQ^ (х)). (b) Для каждого натурального k>0 \-х = 0 У ... У x = k—\=x<k. (bf) Для каждого натурального ^>0 и для любой формулы \-Gsf(0)&...&o?f 0— l) = (c) f- (Ух (х <у =5 &€ (х)) & 4x ID VJC(<2^(JC) V Доказательство, (а) Мы докажем [— д: = 0 V--- У x=k = = x ^ k индукцией по k в метаязыке. В случае k = 0 утверждение [—дг = 0^х^0 легко следует из определений и предложения 3.7. Предположим, что J-- х = 0 V ... V х = k = х ^ k. Пусть теперь
§ 1. СИСТЕМА АКСИОМ 127 = 0\/ ...\/ х— k\Jx = k-{-\.Hox = k-}-\iDX^k-\-\ и, кроме 1 того, х — 0 У ...у x = Jzid х*^1г и x^kzDX^k-\-l. Следовательно, х = 0 V ... V x = k-\- I id x^k-\- I. Предположим теперь, что лг^£-|~^ тогда x = k-\-l или .я<;£-|-1. Если .*; = &-}-1, то х = 0 У ... \J x = k-\-\. Если же х < £ -f-1, то, так как & -f~ 1 есть (&)', мы имеем х^ ky по предположению 3.7 (1), откуда, в силу индуктивного предположения, х = 0 у ...\/ х= k и, наконец, jc = O\/... ... V jc = /г —|— 1. (Мы сейчас доказали пункт (а) предложения 3.8 неформально. Мы и в дальнейшем будем иногда так поступать. В проведенном только что доказательстве неявно используются теорема дедукции, элиминируемость правила С, теорема о замене (следствие 2.21), а также ряд тавтологий). Пункты (а'),« (Ь) и (г/) легко следуют из (а). Пункт (с) вытекает почти непосредственно из предложения 3.7 (о) с помощью очевидных тавтологий. Теперь мы можем вывести некоторые более сильные формы принципа индукции. Предложение 3.9. (а) (П о л н а я индукция.) \- Vjc (V* (г < х и> оЛ (z)) z {Пусть свойство Р таково, что для любого натурального числа х из того, что этим свойством обладают все натуральные числа, меньшие х, вытекает, что им обладает и число х. Тогда свойством Р обладают все натуральные числа.). (Ь) (Принцип наименьшего числа.) |- orf (x) zd 3y{o^(y) & V* (z <у zd~\q^ (z))). (Если свойством Р обладает хотя бы одно натуральное число, то среди всех натуральных чисел, обладающих свойством Р, существует наименьшее). Доказательство, (а) Обозначим формулу Vz (z <: х zd qs£ (z)) через <£®(х). (i) 1. Vat (Vz (z < x id orf (z)) zd gs# (x)) гипотеза 2. V-г (z < 0 id od (z)) zd od (0) 1, правило А4 3. z < 0 предложение 3.7 (у) 4. \fz(z <C.O zd g?£(z)) 3, тавтология, Gen 5. a^(0) 4,2, M? 6. Vz (z ^ 0 id orf (z)) 5, предложение т. е. SB(Q) 3.8(a') 7. V* (V* (* <* id ©$?(*)) id 3 1—6
128 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА (ii) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. wx (vz (z <ixzD S3(x)} т. e. V*(; V^ {z <^xf ID os£ 1 Vz (z < XJ ID orf 1 z^xf id г<У N г < л/ id s^ (г) Vz (Z^X' ID ©^ Vjc ( Vz (,г < jc :э г<хзе/(г)) (-г)) id orf (xf) / z = xf (z)), т. е. ^(дО &€ (z)) id S8(x)idSc>(x')) гипотеза гипотеза 2, предложение 3,7(1) 1, правило А4 3, 4, МР определение, тавтология 3, правило А4 5, аксиома (7) равенства 6, 7, 8, тавтология, Gen 1—9, теорема дедукции, Gen Из (i), (ii) по правилу индукции получаем ^ |— Ул: Sd (x), т. е. ?f \— Va: Vz (z ^ лг id o^ (z)), где ^ есть формула Vje (Vz (z < л: id id ©^ (z)) =) orf (x)). Дважды применив правило А4, получим *£ \- x^xzd G7& (х)\ но так как \- х^х> то *£ (— ©^ (jc), откуда, по правилу Gen и теореме дедукции, окончательно имеем |— *§ zz> Vx oft (jc). (b) 1. 2. 3. 4. 5. 6. id 7. od (X) ID гипотеза 1, тавтология 2, тавтология 3, (a) c"l@^ вместо G7& 4, правило А4 1—5, теорема дедукции 6, тавтология Упражнение Показать, что (метод бесконечного спуска). Следующим важным арифметическим понятием, которое мы теперь определим, является понятие делимости. Определение. t\s служит сокращением для 3z (s = t • z\ где z — первая переменная, не входящая в t и s.
§ 1. СИСТЕМА АКСИОМ 129 , Предложение 3.10. Следующие формулы выводимы в S: (a) t\t\ (e) (b) I \t; (f) (c) <|0; (g) t\szzt\r.s; (d) t\s&s\rzDt\r; (h) t\s&t\ r zd t\s-\-r. Доказательство, (a) t = t'\. Следовательно, t\t. (b) t=\ -t. Следовательно, 1 \t. (c) 0 = ^-0, поэтому *|0. (d) Если 5 = t- z и r = s-w, то r = t» (z -w). (e) Если 5=^=0 и t\s, то s = t*z для некоторого z, при этом, очевидно, z =т^= 0, т. е. z = ur для некоторого и. Итак, s = t - (ur) — Читатель легко докажет выводимость и остающихся формул (f)—(h). Упражнение Доказать: 1. f- t | Г=) t =T. 2. \- (t\SZDt\s')ZDt =Т. Для дальнейших целей полезно будет доказать единственность частного и остатка при делении одного числа на другое. Предложение 3.11. |— у фО zd 3iu3iv(x=y-u-\-v&v<cy)- Доказательство. Обозначим через &#(х) формулу у ф 0 z) 3u3v (х —у • и -\- v & v <,У)- (i) 1. уфО гипотеза 2. 0=у.0-{-0 (S5'), (S7f) 3. 0<Zy 1, предложение 3.7 (t) 4. О =у • О -J— 0 & 0 <у 2, 3, тавтология 5. 3u3v(Q=y -и -\-v&v<Cy) 4, правило Е4 6. у Ф 0 zd Зм 3v (0 =j/ •« -[" v & v < У) *—5, теорема дедукции (и) 1. о/1 (х\ т. е. у Ф 0 id Зи 3v (x —у • м -f- -f- г; & v <СУ) гипотеза 2. у ф 0 гипотеза 3. ЗиЭх>(*=-у-и + <0&<»<О') 1, 2, МР 4. х—у-а-{-Ь&Ь<у 3, правило С дважды 5. Ь<СУ 4, тавтология 6. b'z^y 5, предложение 3.7 (к) 5 Э. Мендельсон
130 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА 7. Ьт <iy V U =У 8. b'<yzDx'=y-a-\-b'kb'<y 9. b'<y^>3u3v(x'=y-ii-\-v8LV<:y) 10. b'=yiDx'=y-a-\-y-l 11. У =у zd (У = у • (а -\- Г) -|- 0 & 0 < _у) 12. b'—yzD3u3v(x'=y-u-{-v&v<iy) 13. ЗмЭх; (х' = j/ • и -f- -и & г; <jO 14. <27£(x)zD(y=£:0zD3ti3v(x'=y-u-\- v <jO) 6, определение 4, (S6') 8, правило Е4, теорема дедукции 4, (S6f), предложение 3.5 (b) 10, предложение 3.4, 2, предложение 3.7 (t), (S5') 11, теорема дедукции, правило Е4 7, 9, 12, тавтология I —13, георема дедукции т. е. Из (i) и (ii) по правилу индукции получаем f— Таким образом, мы доказали существование частного и и остатка v. Докажем теперь единственность частного и остатка. Пусть уфО. Допустим, что х =у • щ -\- Vi & v{ <СУ и х —у • щ -\-Vi& щ <Су. Возможны случаи: их = иъ щ<щ и «2<^ь Если и1=:иъ то, в силу предложения 3.4 (d), Vi = v%. Если U\<Cu% то при некотором w=^=Q имеем щ = u\-\-w и тогда у • Hi -\- Vi =у • (mi -\-w)-\-v<i =y • Mi -\-y • w -f- u2, откуда v\ ==, =3; •w -\- Щ- Но так как w =^Q, то тогда 3/ • tp ^j/ и, следовательно, Vi=y -w -\-v%^y, чего не может быть из-за V\<iy. Таким образом, щ < щ. Аналогично доказывается, что щ < i\± Поэюму и\ = иъ а следовательно, И ^1=^2. После всего сделанного нет никаких принципиальных препятствий к тому, чтобы всякую теорему, доказываемую в курсах элементарной теории чисел (например, в книге Виноградова [1952]), перевести на язык теории S и построить вывод такого перевода в этой теории. Имеются некоторые теоретико-числовые функции такие, как, например, х! и ху, которые можно определить в S, и мы это сделаем ниже в этой главе. (В большинстве случаев можно, правда, обойтись без явного определения этих функций, но это очень скоро приводит к громоздким и запутанным построениям.) С другой стороны, некоторые классические результаты теории чисел такие, как теорема Дирихле, доказаны с помощью теории функций комплексного переменного, причем зачастую неизвестно даже, можно ли получить элементарные доказательства (или выводы в S) для таких теорем. Некоторые же теоремы теории чисел (например, теорема о простых числах) в самих формулировках содержат
$ Т СИСТЕМА АКСИОМ 131 неэлементарные понятия, вроде понятия логарифмической функции, и такие теоремы не могут быть даже сформулированы на языке теории S, если только для них не существует эквивалентной элементарной формы. Позже вопрос о силе и выразительных возможностях теории S будет рассмотрен подробнее. Будет, например, доказано, что существуют такие замкнутые формулы, которые недоказуемы и неопровержимы в теории S, если только она непротиворечива; следовательно, существует формула, истинная в стандартной интерпретации, но невыводимая в S. Мы увидим также, что такая неполнота теории S не может быть отнесена за счет нехватки каких-то существенных аксиом и что в основе этого явления кроются более глубокие причины, действующие также и в случае других теорий. Упражнения 1. Показать, что принцип индукции (S9) не зависит от остальных аксиом теории S. (Указание. Рассмотреть интерпретацию, областью которой служит множество полиномов с целыми коэффициентами и с неотрицательным старшим коэффициентом и в которой операции + и • интерпретируются как обычные сложение и умножение полиномов. Проверить истинность в такой интерпретации аксиом (SI) —(S8) и опровергнуть предложение 3.11, подставляя вместо х полином х и вместо у — полином 2.) D2. Существует нестандартная модель теории S любой мощности Ка. (Указание. Построить новую теорию S', присоединив к S новую предметную константу Ь и аксиомы ЬфО, Ьф\, ..., Ъфп> .... Показать, что теория S' непротиворечива, и применить предложение 2.27 и следствие 2.35 (с).) Э р е н- фойхт [1958] доказал, что существует по меньшей мере 2^а неизоморфных моделей мощности ^а. D3. Для системы аксиом Пеано дать обычное математическое доказательство ее категоричности в смысле изоморфности всяких двух ее «моделей». Объяснить, почему такое доказательство не применимо к теории первого порядка S. D4. (П р е с б у р г е р [1929].) Если удалить из теории S функциональную букву f\ для умножения и аксиомы (S7) — (S8), то полученная таким образом новая теория S+ полна и разрешима. (Указание. Использовать процедуру сведения, подобную той, что применялась для теории К2 на стр. 107 — 108. Для любого k определим k • t по индукции: 0 • t есть 0, (k + 1) • t есть (k • t) -f-1, т. е. k-t есть сумма k слагаемых, каждое из которых есть t. Пусть также £ = s(mod&) при каждом Услужит сокращением для 3x(tz=s-{-k-x\/s = = t + k • х). При сведении будем обращаться с формулами вида t = s (mod k) и t<s как с элементарными (хотя на самом деле они таковыми, разумеется, не являются). Относительно всякой формулы теории S+ мы заранее можем предполагать, что она уже приведена к предваренной нормальной форме. Теперь остается описать процедуру, следуя которой, по каждой формуле 3y?f, где ъ не содержит кванторов, строится эквивалентная ей формула, не содержащая кванторов (не забывая при этом о том, чъо элементарными формулами сейчас считаются формулы вида £ = s (mod к) и t < s). Дальнейшую помощь в деталях читатель получит у Гильберта и Бернайса [1934], т. I, стр. 359 - 366.) 5. (а) Всякая замкнутая элементарная формула t = s теории S разрешима в S, т. е. 0 f* б \t£ b) Всякая замкнутая формула теории S, не содержащая кванторов, разрешима в S. 5*
132 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА § 2. Арифметические функции и отношения Арифметическими функциями мы называем функции, у которых область определения и множество значений состоят из натуральных чисел, а арифметическим отношением является всякое отношение, заданное на множестве натуральных чисел. Так, например, умножение есть арифметическая функция с двумя аргументами, а выражение x-j-y<z определяет некоторое арифметическое отношение с тремя аргументами. Арифметические функции и отношения являются понятиями интуитивными и не связаны ни с какой формальной системой. Арифметическое отношение R(Xi, ..., хп) называется выразимым в теории S, если существует формула о^ (хь ..., хп) теории S с п свободными переменными такая, что для любых натуральных чисел kh ..., kn (1) если R(&i, ..., kn) истинно, то |— sg^(&i, ..., kn), (2) если R(*i, ...» kn) ложно, то \-s~]o^(kh ..., kn). Так, например, отношение равенства между натуральными числами выразимо в S формулой х\ = х%. В самом деле, если kl = fa) то термы ki и fa совпадают, и тогда, по предложению 3.2 (а), \—ski = fa. Аналогично, если кхфк^ то, в силу предложения 3.6 (а), \—^фк^ В свою очередь формулой Xi<ix% выразимо в S отношение «меньше». Если ki<ifat то существует отличное от нуля число п такое, что fa = fa -\- п, и тогда, в силу предложения 3.6 (а), |— sfa = h -\- n, а в силу (S3') и пфО, |— ^пфО. Следовательно, в S можно вывести формулу 3w(k% = = к1-\-Х0&х0фО), т. е. ki < k* Если же kx < kb то kx = fa или fa < kv причем в этом последнем случае, так же как и для случая k\ < kCJ доказывается |— sfa<Cfa- Наконец, если fa = fa, то \—ski = fa. Итак, в обоих случаях [— sfa^ki и тогда, по предложению 3.7 (а), (с), Упражнения 1. Показать, что отрицание, конъюнкция и дизъюнкция выразимых в S отношений выразимы в S. 2. Доказать, что отношение x-f-y = z выразимо в S. Арифметическая функция f(xb ..., хп) называется предетавимой в S, если существует формула osf (xh ..., хп + 1) теории S со свободными переменными х\> ..., хп + 1 такая, что для любых натуральных чисел k k (1) если f(kh ...,k^ = kn + u то \-sG7?(kh ..., Ът k (2) \-s31xn + 1o7f(kb ..., km xn + i). Если в этом определении условие (2) заменить условием
2 АРИФМЕТИЧЕСКИЕ ФУНКЦИИ И ОТНОШЕНИЯ 133 (2f) |— s3\Xn+i <2т£ (х\у ..., хт хп +1), то мы получим понятие сильно представимой в S функции. Заметим, что, в силу правил Gen и А4, из (2') следует (2). Следовательно, всякая сильно представимая функция является также представимой функцией. Примеры, (а) Нуль-функция Z(x) = 0 сильно представима в S с помощью формулы х\ = Х\&Хъ = 0. В самом деле, если Z(k\) = k% то k% = 0 и |— £1 = £1&0 = 0, т. е. выполнен пункт (1) определения сильно представимой функции. Кроме того, очевидно, |— 3iX2 (х\ = х1& &Х2 = 0), т. е. выполнен и пункт (2') этого определения. (b) Функция N(x) = x-f-1 сильно представима в S формулой х^ = х[. Действительно, при любом k\ из N(k{)==k<i, т. е. из ki = k\-\- I, следует, что термы £2 и {k^f совпадают и потому |— k% = (k^)r. Кроме того, \-31х2(х2 = х[). (c) Проектирующая функция U?(xb ..., хл) = х,- сильно представима В S С ПОМОЩЬЮ формулы Xi = Xi&...&Xn = Xn&Xn+1 = Xi. ЕСЛИ U?_(*i, ..., А0 = *я + ь_то kn+1 = kt и kn+1=~ki. Следовательно, |-*i = z=ki&... & kn = kn& knjr\ = kiy и условие (1) выполнено. Кроме того, |— 3\Хп+\{Х\ = Х\ & ... &xn = xn&xn + 1 — Xi), т. е.-выполнено и условие (2) определения сильно представимой в S функции. (d) Предположим, что функции g(xb ..., xm), hi(xb ..., хл), ..., hw (xi, ..., xn) (сильно) представимы в S соответственно формулами <®(ХЪ ..., Хт Xm+l), Q7fi(Xh ..., Xn+i), ..., Q^m(Xh ..., Xn+i). Зададим новую функцию f равенством f(xb ..., x/j) = g(h1(xb ..., хЛ), ..., hm(xi, ..., хп). Говорят, что функция f получена из g, hb ..., hn с помощью подстановки. Функция f также (сильно) представима в S, например, с помощью формулы —, Ут которую обозначим через o/f (хь х* ..., хп+{). В самом деле, пусть i(ki9..., kn) = kn+l и ht (Ai,..., кп)=Гь где 1 </*sg/H; тогда g(rh..., rm)= = kn+\. Согласно предположению о (сильной) представимости , g, hb ... ..., hm\-o^i(kb ..., ~kn, rt) для l^i^m и |- e® (rb ... ,_rm, J^+i). Следовательно, [— od(k\, ...» #л, П)& ... Sia^(kh ..., &л, Гщ) & &dS(rh ..., rm, Ая+1). По правилу Е4 |— ©^(Alf ..., ~km Ая+1), т. е. выполнено условие (1) определения представимости. Переходя ко второму пункту этого определения, мы остановимся на варианте сильной представимости. Допустим в качестве гипотез хп, уд& ... &&#m(xh ..., хпу ут)& ут)& г;)). (**)
134 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА Применив т раз правило С, получаем из (*) И ИЗ (**) e^iC*i,..., хт ct)& ... Так как [- Bi-tf^i©/^ (хь ..., хп, хп^)у то из orf% (хь ..., д:л, ^) и o^i(xh ..., хл, q) следует bi — Ct. Из е®(&ь ..., Ьт и) и *i = cb ... 9t.,bm=cm следует g® (сь ..., ст и). Поэтому из |- 3i^m+i^ (xh ...,xm и q®(ci, ..., ст v) мы получаем и = и Таким образом, \( ..., jcm и)ко^(хъ ..., xm г;)id u = v. Также легко показать, что |— Зхп+1<27# (х1} ..., xn+i) (предоставляется читателю в качестве упражнения). Отсюда получаем \-3\Хп^о^(xh ..., хт xn+i), т. е. утверждение (2') определения сильной представимости. Вариант (2) для случая представимости рассматривается аналогично. Упражнение Показать, что следующие функции сильно представимы в S: 1. Zn(xu ..., хя) = 0. (Указание. 1п (хх x«) = Z(Uj(xl,...,xJ), применить (а), (с), (d).) 2. Ck (хь ..., хл) = & для любого данного*^. (Указание. В силу 1, Со сильно представима; допустим, что сильно представима функция Сл, тогда используем равенство Ck-\-\(^u ..., xn) = N (Ck (xlt ..., хл)) и (b), (d).) 3. Сложение. 4. Умножение. Характеристической функцией данного отношения R(Xi, ..., хп) называется функция Cr(Xi, ..., хя), задаваемая условиями: ) = < 0, если R (хг, ..., хп) истинно, , если К (Хь ..., хп) ложно. Предложение 3.12. Если отношение R(хь ..., хп) выразимо в S, то характеристическая функция Cr(xi, ..., хп) этого отношения сильно представима в S, а если функция Cr (хь ..., хп) преде та- вима в S, то в S выразимо и отношение R(xb ..., хл). Доказательство. Не составляет труда проверить, что 1) если отношение R(xb ..., х/г) выразимо в S с помощью формулы оУ1(х1у ..., хп)у то функция CR(xb ..., хп) сильно представима в S с помощью формулы (o?f (х\, ..., хп)&хп+\ = 0) у (~\в/£(хь ...,хп)& &лгп+1=1), и 2) если функция Cr(Xi, ..., хл) представима в S с помощью формулы е®(.гь ..., хт хп^\ то отношение R(xb .,., хп) выразимо в S с помощью формулы $}{хь ..., хш 0).
§ 3. ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ КГ5 Упражнения 1. Показать, что если функция f (xlf ..., лп) представима в S, то в S выразимо и отношение/(.*!, ... , хп) = хп+1} называемое представляющим отношением (или графиком) функции f. 2. Доказать, что для всяких двух я-аргументных отношений Rx и R2 CHeR! = 1~CR1» C(R! или R2) = CRi " CR2' C(Ri и R2) = CRi + CR2~CRi * CR2' § 3. Примитивно рекурсивные и рекурсивные функции Изучение представимости функций в S приводит к одному классу функций, играющих весьма важную роль в математической логике. Определение (1) Следующие функции называются исходными функциями. (I) Нуль-функция: Z(x) = 0 при каждом х. (II) Прибавление единицы: N(x) = x-}-l при каждом х. (III) Проектирующие функции: \J](xh ..., хл) = х,- при всех х,..., хп (/=1, ..., щ /1=1, 2, ...). (2) Следующие два правила служат для получения новых функций, исходя из уже имеющихся функций. (IV) Подстановка: f(xb ..., x«)=g(h!(xb ..., хД ..., hm(xh ..., хл)); говорят, что функция i получена с помощью подстановки из функций g(yi> ..-, Ут)> hl(xb .-., Хл), ..., hm(xb ..., Хл). (V) Рекурсия: f(xb ..., хл, 0) = g(xb ..., хл), f(xi, ..., хл, y-f l) = h(xb ..., хПУ у, f (хь ..., хда у)), при этом исключается случай п—0, для которого отдельно: f(0) = £ (где k — фиксированное целое неотрицательное число), f(y+l) = h(y, f(y)). Мы будем говорить, что функция f получена из функций g и h (или в случае п==0 из одной лишь функции h) с помощью рекурсии, а Хь... ..., хп назовем параметрами рекурсии. Заметим, что функция f вполне определена: значение f (хь ..., хЛ, 0) определяется из первого равенства, а если мы уже знаем значение f(xb ..., хл, у), то из второго равенства мы можем найти значение f(xb ..., xw y-|-l). (VI) fx-оператор: пусть функция g(xb ..., хп, у) такова, что для любых хь ..., хп существует по крайней мере одно значение у, при котором g(xb ..., хт у) = 0. Обозначим через (xy(g(xi, ..., хл, у) = 0) наименьшее значение у, при котором g(xb ..., хт у) = 0. Вообще, для всякого отношения R (xi, ..., хл, у) будем через [xyR(xi, ..., хл, у) обозначать то наименьшее значение у, при котором R (хь ..., хл, у) истинно, если вообще такие значения существуют. Пусть f (хь ..., хл) =
136 ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА = My(g(xb •••» xm У) = 0)- Будем тогда говорить, что функция f получена из функции g с помощью [г-оператора, если выполнено вышеприведенное предположение о функции g: для любых хь ..., хп существует по крайней мере одно значение у, для которого g(xi, ..., хт y) = 0. (3) Функция f называется примитивно рекурсивной, если она может быть получена из исходных функций с помощью конечного числа подстановок (IV) и рекурсий (V), т. е. если существует такая конечная последовательность фуь'кций fh ..., fn, чю fw = f и для каждого/, 0^/^/7, функция ff либо исходная, либо может быть получена из некоторых предшествующих ей в этой последовательности функций с помощью применения правила (IV) (подстановки) или правила (V) (рекурсии). (4) Функция f называется рекурсивной, если она может быть получена из начальных функций с помощью конечного числа применений подстановки (IV), рекурсии (V) и fi-оператора (VI). Это последнее определение отличается от определения примитивно рекурсивной функции лишь дополнительным разрешением применять jw-оператор. Поэтому всякая примитивно рекурсивная функция является также и рекурсивной функцией. Позже мы увидим, что обратное неверно. Мы покажем, что класс рекурсивных функций совпадает с классом функций, представимых в S. (В литературе вместо термина «рекурсивный» иногда употребляется термин «общерекурсивный».) Докажем сначала, что введение фиктивных переменных, а также перестановка и отождествление переменных не выводят за пределы класса примитивно рекурсивных функций и класса рекурсивных функций. Предложение 3.13. Пусть g (уь ..., yk) — примитивно рекурсивная (или рекурсивная) функция, и пусть xh ..., хп—различные переменные; тогда, если при каждом /, \^i^k, z,- есть одна из переменных хь ..., хт то функция f (хь ..., хл) = g (zb ... , zk) тоже примитивно рекурсивная (соответственно рекурсивная). Доказательство. Пусть z,- = х;„ где 1 ^j\^п. Тогда z* = = U* (хь ..., хя) и f (хь ..., хя) = g (U* (хь ..., хл),..., U* (хь ..., хп)). п п Таким образом, функция f может быть получена из функций g, U.,..., U. h h с помощью подстановки, т. е. f есть примитивно рекурсивная (соответственно рекурсивная) функция. Примеры. 1. (Введение фиктивных переменных.) Если g(xi, х3) — примитивно рекурсивная функция и f (xi, х2, x3) = g(xi, х3), то f (xh x2, x3) есть также примитивно рекурсивная функция. Для доказательства положить Zj = Xi и z2 = x3 и применить предложение 3.13. 2. (Перестановка неременных.) Если g (xi, x2) — примитивно рекурсивная функция и f (xi, x2) = g(x2, Xi), то f есть также примитивно рекурсивная функция. Доказательство. В предложении 3.13 положить zt = х2 и z2=Xi. 3. (Отождествление переменных.) Если g (хь х2, х3) — примитивно рекурсивная функция и f(xb x2) = g(xb x2, xj), то f(xi, x2) есть также примитивно рекурсивная функция.
§ 3 ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 137 Доказательство. В 3.13 положить п = 2, гх = хь z2 = х2, z3 = хх. Следствие 3.14. (а) Нуль-функция Ъп(хъ ..., хЛ) = 0 примитивно рекурсивна. (Ь) Постоянная функция СЪ (хь ..., хп) = ky где k — некоторое фиксированное целое неотрицательное число, примитивно рекурсивна, (с) Правило подстановки (IV) может быть распространено на случай, когда каждая функция hh возможно, является функцией лишь от некоторых из переменных хъ ..., хя. Точно так же и в правиле рекурсии (V) функция g может фактически не зависеть от каких-либо из переменных хь ..., хя, а функция h может не зависеть от каких-либо из переменных хъ ..., хя, у или i(xl9..., хя, у). Доказательство, (а) Пусть в предложении 3.13 g есть нуль- функция Z. Тогда k=l и остается лишь положить z1 = x1. (b) Для k = 0 искомое утверждение совпадает с доказанным только что пунктом (а). Предположим, что оно верно при некотором k, тогда для &+ 1 достаточно воспользоваться равенством C2-|-i(xi>..., хп) = N(Cj£(xi,..., хЛ)). (с) В силу предложения 3.13, каждая из переменных хъ ..., хп может быть введена как фиктивная переменная, если это необходимо. Например, если h(x1} x3) —данная примитивно рекурсивная (или рекурсивная) функция, то функция h*(Xi, x2, x3) = h(x1, x3) = h(Ui(x1, x2, x3), из(хх> х2, х3)) тоже является примитивно рекурсивной (или рекурсивной). Предложение 3.15. Следующие функции являются примитивно рекурсивными: [ х— 1, если х> О, (а) х + у; (Ь) х-у; (с) хУ; (d)6(x) = { [ U, если х = (J; (е) х-у = (Х~У' еСЛп Х^У> (f)! х — у I = I х — У' есм х^^ \ 0, если х < у; \ у — х, если х < у; О, если х = 0, ^ ч — ч ( 1, если х = О, , если х ф 0; (i) x!; (j) min(x, у) — наименьшему из чисел х и у; (k) min(xi, ..., хп); (1) max(х, у) = наибольшему из чисел х и у; (т) тах(хх, ..., хЛ); (п) гт(х, у) = остатку от деления у на х, если хфО, и у, ££Л# х = 0; (о) qt (х, у) = частному от деления у на х. Доказательство. (а) По правилу рекурсии (V): f(x, 0) = U}(x) )' T* e* f(x, y+l) = N(f(x, у)). (b) x-0 = 0 g(x, 0) = Z(x) x (y + l) = (x-y) + xf ' ' g(x, y+l) = f(g(x, y), x),
138 ГЛ 3 ФОРМАЛЬНАЯ АРИФМЕТИКА где f есть функция сложения. (с) х°=1 (d) 8 (0) = 0 (е) (f) | х — у | = (х -1- у) -\- (у -*- х) (подстановка) (g) sg(O) = O sg(y+l)=l (h) Sg(x)=l-*-Sg(x) (i) 0! = l (j) min(x, y) = x-*-(x-*-y) (k) Предположим, что функция min (хь ..., xn) — примитивно рекурсивная. Для min (xi, ..., xrt+i) имеем min (хь ..., хл+0 = min (min (хь ..., хл), хл+1) (1) max(x, у) = у-\-(х-^-у) (m) max (хь ..., хлчЛ) = max (max (хь ..., хл), хл+1) (n) rm(x, 0) = 0 rm(x, y+l) = N(rm(x, y))• sg(| x- N(rm(x, y))|) (o) qt(x, 0) = 0 qt(x,y+l)=qt(x,y)+ii(|x —N(rm(x,y))D Определения хп с, ч f 0> если Z = 0, V f (xi, ..., хя, у) = \ y<z 1 f(xb..., xm O)-f...+f(xb..., хя, z—1), если z>0; 2] f(xb ..., хл, у)= 2 f(xi» •••> «я» У); y^z y<z+l П Г 1, если z = 0, f (xi,..., xm y) = { y<z I f (xi, ..., хл, 0)- ... -f (xi,...,xm z —1), если z>0; Y[h ...,xwy)= J][ f(xb..., xmy). Эти ограниченные суммы и произведения являются функциями аргументов хь ..., xm z. Суммы и произведения, ограниченные с двух сторон, можно теперь определить через введенные только что ограниченные суммы и
§ 3 ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 139 произведения, например: 2 f(xb ..., хл, у) = f (хь ..., хя, u-f l) + --- + f(xi, ..., х„, V— 1) = u<y<v = 2 f(x,..., хл, y + u+1). y<(v —u)~l Предложение 3.16. Если f — примитивно рекурсивная (или рекурсивная) функция, то все определенные выше ограниченные суммы и произведения этой функции являются также примитивно рекурсивными (или рекурсивными) функциями. Доказательство. Пусть g (хь ..., хЛ, z) = ^ f (хь ..., хл, у). y<z Тогда мы имеем следующую рекурсию: g(xt, ..., хЛ, 0) = 0; g (xi,..., хл, z + 1) = g (хь ..., хт z) -f- f (хь ..., хда z). Если жеп(хь ..., xn, z)= 2f(xi> •••> хя> У)> то имеем h (х1}..., хл, z) = y^ = g (xi,..., xn> z -j- 1) (подстановка). Доказательство соответствующих утверждений для сумм и произведений, ограниченных с двух сторон, мы предоставляем читателю. Пример. Функция D(x), равная 1 при х = 0 и числу делителей х, когда х>0, примитивно рекурсивна, так как 2~i(y, х)). Если нам заданы некоторые отношения в области натуральных чисел, то, применяя к ним логические связки исчисления высказываний, мы можем получить новые отношения. Мы будем пользоваться для этого теми же символами: ~], &, \J, id, = (если только при этом не будет возникать недоразумений из-за одновременного употребления этих символов в нашем метаязыке и в формальных теориях первого порядка). Например, для любых двух отношений Ri (хь ..., хл) и R2(xb ..., хп) Ri (хх,..., хл) V R2 (xi,..., хп) есть отношение, которое выполнено для Хь ..., хп тогда и только тогда, когда выполнено Ri (хь ..., хп) или R2 (хь ..., хп). Выражение Vyy<zR(xb ..., х„, у) мы будем употреблять для записи отношения: «При всяком у, если у < z, то R (хь ..., хю у)». В аналогичном смысле будут употребляться выражения Vyy=Sz, 3yy<z и 3yy^z; так, например, под Зуу <ZR (хь ..., хл, у) мы будем понимать утверждение: «Существует у такое, что y<z и R(xb ...,хд, у)». Выражения Vyy<z, Vyy^z, 3yy<z и 3yy^z мы назовем ограниченными кванторами. Наконец, ограниченный ^-оператор определим так: г наименьшему у такому, что у<г и !*Уу< zR (xi, ..., хя, у) = | R (хь ..., хт у), если такое у существует; [z в противном случае. (Здесь выбор z в качестве значения оператора во втором случае
НО ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА продиктован только интересами удобства в дальнейших доказательствах, никакого содержательного смысла в это не вкладывается.) Отношение R (хь ..., хл) называется примитивно рекурсивным (рекурсивным) отношением, если примитивно рекурсивной (соответственно рекурсивной) является его характеристическая функция С^ (хь ..., хп). В частности, датюе множество А натуральных чисел является примитивно рекурсивным (рекурсивным), если примитивно рекурсивной (рекурсивной) является его характеристическая функция Сд(х). Примеры. (1) Отношение xi = x2 примитивно рекурсивно, так как характеристическая функция его совпадает с функцией sg(|xi — х2(), которая примитивно рекурсивна, в силу предложения 3.15 (f), (g). (2) Примитивно рекурсивная функция sg(x2 —Xi) (предложение 3.15 (е), (h)) служит характеристической функцией отношения Xi < X2, которое, таким образом, примитивно рекурсивно. (3) Отношение Xi \ х% примитивно рекурсивно, так как его характеристической функцией является примитивно рекурсивная функция sg(rm(xi, x2)). (4) Отношение Рг(х), т. е. «х есть простое число», примитивно рекурсивно, так как СРг (х) = sg ((D (х) -±- 2) -f- sg (| х — 1 |) -\- sg (| х — 0 |)). (Напомним, что число х является простым тогда' и только тогда, когда оно имеет не более двух делителей и отлично от 0 и 1.) Предложение 3.17. Отношения, которые можно получить из примитивно рекурсивных (или рекурсивных) с помощью пропозициональных связок и ограниченных кванторов, также примитивно рекурсивны (соответственно рекурсивны)', применение ограниченных ^-операторов \ьуу<2 или [*уу<2 к примитивно рекурсивным (рекурсивным) отношениям приводит к примитивно рекурсивным (рекурсивным) функциям. Доказательство. Пусть отношения Rx (хь ..., хп) и R2 (хь ..., хп) примитивно рекурсивны (или рекурсивны). Это значит, что их характеристические функции Cr1 и Cr2 примитивно рекурсивны (соответственно рекурсивны). Но С-^ (хь ..., хп) = 1 — Crx (хь ..., хп), следовательно, и отношение ~|Ri примитивно рекурсивно (рекурсивно). Кроме того, CRiVr2(xi, ..., хя) = С«1(х1, ..., xn).CRa(xi, ..., хп), а потому и отношение Ri V R2 примитивно рекурсивно (рекурсивно). Для пропозициональных связок доказательство на этом и заканчивается, так как все остальные пропозициональные связки выражаются через связки ~] и V- Пусть теперь R (хь ..., хп, у) — примитивно рекурсивное (рекурсивное) отношение. Обозначим через Q (хь ..., хл, z) отношение Зуу <ZR (хь ... ..., хл, у). Нетрудно проверить, что CQ (хь ..., хп, г) = J\ CR (хь ..., хлу), y<z откуда, в силу предложения 3.16, следует, что Cq является примитивно рекурсивной (рекурсивной) функцией. Ограниченный квантор 3yy^z равносилен, очевидно, ограниченному квантору Зуу<2-{-ь который в свою
§ 3 ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 141 очередь может быть получен с помощью подстановки из ограниченного квантора Эуу<2. Кванторы Vyy<z и Vyy^z эквивалентны соответственно приставкам ~]3yy<z"l и "1 Эуу-с2П. Ограниченные с двух сторон кванторы такие, как 3yu<y<v> могут быть определены с помощью подстановок в уже рассмотренные ограниченные кванторы. Наконец, заметим, что функция i, ..., хя, и) принимает значение 1 при каждом у, для которого R(xi, ..., хл, и) ложно при всех и^у, и принимает значение 0 всякий раз, когда существует такое и^у, при котором R(xb ..., хт и) истинно. Поэтому, если для данного z существуют числа у меньшие, чем z, и такие, что R (хь ..., х„, у) истинно, то значение функции 2 П ^R (Хь * • * y<z u=<y ..., хЛ, и) равно числу целых неотрицательных чисел, меньших чем наименьшее из таких чисел у; в противном случае значение функции ■••' Хл> и) Равн0 z' Но эт0 значит> что T ..., xn, u) = |xyy<zR(x1, ..., хя, у). Отсюда, на основании предложения 3.16, и следует, что применение ограниченного [i-оператора к примитивно рекурсивному (рекурсивному) отношению приводит к примитивно рекурсивной (рекурсивной) функции. Примеры. (1) Пусть р (х) — функция, принимающая для каждого х значение, равное простому числу с номером х при пересчете всех простых чисел в порядке возрастания, начиная с р(0) = 2. В дальнейшем мы будем для краткости вместо р (х) писать рх. Оказывается, что рх есть примитивно рекурсивная функция аргумента х. В самом деле, заметим прежде всего, что (1) р0 =2; (ii) Px+i = P-yy<(Px)! + i(Px<y&Pr(y))- Здесь следует обратить внимание на то, что отношение u<y&Pr(y) примитивно рекурсивное. Следовательно, в силу предложения 3.17, функция (J-yy:<v(u<y)&Pi'(y)) является примитивно рекурсивной функцией аргументов и и v; обозначим ее g (u, v). Подставив в g (u, v) примитивно рекурсивные функции z и z! -j- 1 соответственно вместо и и v, получим примитивно рекурсивную функцию h(z) = [xyy^z!_j_1 (z <у & Рг (у)). Теперь мы видим, что правая часть равенства (ii) есть h(px) и, таким образом, рх получается из (i), (ii) по правилу рекурсии (V). Граница (рх)! -(-1 для следующего за рх простого числа взята из евклидова доказательства бесконечности множества простых чисел (см., например, Виноградов [1952], стр. 19). (2) Всякое целое положительное число х однозначно разложимо в произведение степеней простых чисел: х = paopai... р|л. Обозначим через (х)* показатель а,- в таком разложении. Если х=1, то (x)f = 0 при любом /. Положим, наконец, (x)t = 0 для любого /, если х = 0. Функция (х); примитивно рекурсивна, так как при любом х (х)* = | + 1|
142 ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА (3) Обозначим через Ш(х) число отличных от нуля показателей в разложении х на простые множители. Пусть Ш(0) = 0. Функция lh примитивно рекурсивна. В самом деле, пусть R(x, у) обозначает примитивно рекурсивный предикат Рг (у) & у | х & х Ф 0, тогда In (х) = ^ sg(CR(x, у)). у<х (4) Если число х — 2а° • 3ai.... • р** «представляет» последовательность положительных чисел ао, аь ..., а^, а число у = 2Ь<> • Зь* •... • р£т «представляет» последовательность b0, bi, ..., bm, то число х * у = 2а°-За1»... • • • • P/Jfc• Р^°_]_ 'Pfej. ••••*P^mm+ «представляет» последовательность ао, аь ..., Чу bo, bi, b2, ..., bm, которая получается, если вторую из данных последовательностей записать непосредственно вслед за первой. Здесь мы имеем k-\-\=\h(x), #z-j-1 = lh (у) и by = (у)у. Поэтому х*у = = х- Y\ (Pm(x)+y)(y)/ и, следовательно, функция * является примитивно J<lh(y) рекурсивной. При записи повторных применений операции * скобки можно опускать ввиду того, что х * (у * z) = (х * у) * z. (5) Пусть дана функция f(xb ..., хл, у). Положим f*(xb ..., хл, 0) = f(xb ..., хл, 0), f*(xb ..., хл, y-j-l) = f*(xb ..., хл, y)*f(xb ..., хл, y-f-1). Тогда f*(xb ..., xn, z) = f(xb ..., хл, O)*f(xb ..., хл, l)*...*f(xb ... ..., хл, z), и если функция f — примитивно рекурсивная (рекурсивная), то такова же и f*. Упражнения 1. С помощью предложения 3.17 показать, что если отношение R (xlf ... ...,хл, у) примитивно рекурсивно (рекурсивно), то примитивно рекурсивны (рекурсивны) отношения хп> У)> эУи^у^у^(х1» •••» хп> У)» ^у<у хл» У)» 3yu<y^vR(xi» -•» х«» У) и функции п> У), P-yu^y^zR(xi» — » х«» У)' (х1» •••» х«> У)- 2. Доказать, что класс всех примитивно рекурсивных (рекурсивных) множеств замкнут относительно операций объединения, пересечения и дополнения и что всякое конечное множество примитивно рекурсивно. 3. Пусть (а) [У^п] обозначает наибольшее целое число, квадрат которого не превосходит п\ (Ь) П (п) равно числу простых чисел, не превосходящих п. Показать, что функции [У п] и П (п) — примитивно рекурсивные. А4. Пусть е есть основание натуральных логарифмов и при каждом п [пе] обозначает наибольшее целое число, не превосходящее /ге. Доказать, что функция [пе] примитивно рекурсивна. (Указание. Рассмотреть функцию S (п), определяемую рекурсией S (0) = 0, S (n -j- 1) = (п + 1) • S (п) + 1.) А5. Обозначим через RP(y, z) высказывание «числа у и z взаимно просты>, и пусть <р (п) — функция, значение которой при каждом п равно числу целых
§ 3. ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 143 положительных чисел, не превосходящих п и взаимно простых с п. Доказать, что отношение RP (у, г) и функция ср (п) примитивно рекурсивны. Мы теперь докажем следующую теорему об «определении с перебором случаев»; теорема эта будет полезна при дальнейшем изучении рекурсивных функций. Предложение 3.18. Пусть g!(xb ..., хп), если R!(xb ..., хп) истинно, g9(xb ..., хЛ), если R2(xb ..., хп) истинно, f(xb ..., хп) = { gk(xh •••» хл) если Rfc(xb ..., хл) истинно. Если при этом функции gb ..,, gk и отношения Rb ..., R* примитивно рекурсивны {или рекурсивны) и если для любых xh ..., хп истинно одно и только одно из высказываний Rt (хь ..., хЛ), ... ..., Rk (хь ..., х„), то функция f примитивно рекурсивна {рекурсивна). Доказательство. f(xb ^., xn) = g1(x1, ..., хп) • sg (CRl (хь ... (хь ..., хл)). Упражнения 1. Показать, что в предложении 3.18 предположение о том, что отношение Rfc примитивно рекурсивно (или рекурсивно), можно опустить. 2. Пусть х2, если х четно, : + 1, если х нечетно. Доказать, что функция f примитивно рекурсивна. 3. Пусть при каждом х С 2, если великая теорема Ферма истинна, \ 1, если великая теорема Ферма ложна. Является ли h (x) примитивно рекурсивной функцией? Весьма часто бывает необходимо устанавливать примитивно рекурсивное соответствие между множеством всех упорядоченных пар натуральных чисел и множеством всех натуральных чисел. Построим одно такое соответствие. С этой целью перенумеруем все упорядоченные пары натуральных чисел следующим образом: (О, 0), (0, 1), (1, 0), (1, 1), (0, 2), (2, 0), (1, 2), (2, 1), (2, 2) и вообще, перенумеровав все пары, компоненты которых не превосходят k> мы строим новую (&-^1)-ю группу всех тех, еще не перенумерованных пар, компоненты которых не превосходят k-\-\, перечисляя их в следующем порядке: (0, k -f Ч (k + 1, 0), (1, k + 1), {k-f 1, 1),..., (k, k-\- 1), {k-\- 1, k)y {k-\- 1, k-\- 1). (При этом группа, состоящая из одной только пары (0, 0), счигается нулевой.) Припишем паре (0, 0) номер 0. Всего
144 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА имеется (y-f-*)9 паР> компоненты которых не превосходят у, причем последняя из них, т. е. пара (у, у), получает при нашем пересчете номер (у-[-1)2—1=у2-|-2у. Если х<у, то пара (х, у) непосредственно предшествует паре (у, х), и обе они принадлежат одной и той же у-й группе. Номером пары (х, у) при х^у будет, очевидно, число (у2— 1) —|— (2х —|— 1) = у2-f- 2х, а при у<х — число (х2— 1) —|— (2у -j~2) = = x2-|"2y-f- 1. Теперь легко видеть, что функция о2(х, у), вычисляющая номер пары (х, у) в нашей нумерации, имеет следующее представление: о2 (х, у) = sg (х -*- у) • (: и, следовательно, является примитивно рекурсивной. Рассмотрим обратные функции, т. е. такие функции а\ и о|, что ai(a'2(x> У)) = х> °!(°8(х> У)) = У и a2(°i(z)> ai(z)) = z. При каждом z, таким образом, числа of (z) и o|(z) суть соответственно первая и вторая компоненты упорядоченной пары с номером z в построенной нумерации. Заметим, что of(0) = 0, о| (0) = 0, если о£(л)<о|(л), , если о\(п)>аЦп)9 0, если ol(ri) — al(ri), з\ (я), если о\ (п) Ф о\ (п), п) -\- 1, если of (л) = о| (п). Следовательно, п) * (sg (al (п) "^ °i О1))) 4" + {°l in) + 1) • (sg (of {n) -*- o\ (n))) = cp (of (л), а\ (я)), где функции ср и ф примитивно рекурсивны. Таким образом, функции of и а\ могут быть определены рекурсивно, но одновременно обе. Можно доказать, однако, что на самом деле каждая из функций of и с\ является примитивно рекурсивной. Доказательство, которое мы здесь приводим, носит несколько искусственный характер. Пусть т (и) = 2а?(и) • За2(и). Функция т примитивно рекурсивна. В самом деле, т (0) = 2°i • 3СТ2== ^^2°. 3°= 1, а т(/г-|- 1) = 2ст?(л+1) • 3ai(/l+1) = 2cp(ai(/г)'а^(/г)) - Зф(а1(/г)'ст1(л)) = = 2* «т (л»о. (^ (»))i). ЗФ «т (л»о« (М/г))1); отсюда, вспоминая, что функции (x)i примитивно рекурсивны (см. пример 2, стр. 141), заключаем, что функция т может быть получена из примитивно рекурсивных функций но правилу рекурсии (V). Но of (х) = (т (х))0 и а|(х) = (т (х))ь и, следовательно, функции Gj и о| примитивно рекурсивны, как результаты применения правила подстановки (IV) к примитивно рекурсивным функциям. Теперь, индукцией по п, могут быть построены взаимно однозначные примитивно рекурсивные соответствия между множеством всех
§ 3. ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 145 упорядоченных я-ок натуральных чисел и множеством всех натуральных чисел. Для п = 2 такое соответствие уже построено. Предположим, что для n = k мы имеем примитивно рекурсивные функции ok (xh ..., xk), о* (х), ..., о* (х) такие, что в* (ak (хь ..., хЛ)) = хь где 1 < / < k, и °*(°f(x)> •••> ^(х))3^ Тогда для n = k-\-\ положим ofe+1(xi, .д. и °feil(x)==a2(x)- Эти новые функции, очевидно, также примитивно рекурсивны, и читатель без труда докажет, что o*+1 (ak+1 (хь ..., хА+1)) = Х; для 1</<А+1 и a*+1 (a*+1 (х), ..., a^}(x)) = x. Иногда удобно бывает определять функции с помощью такой рекурсии, при которой значение f(xb ..., xm у —|— 1) зависит не только от f (xi, ..., хя, у), но и от некоторых, или даже всех значений f(xi, ..., хп, и), где и^у. Рекурсия этого типа называется возвратной рекурсией. Положим f# (хь ..., хЛ, у) = J7IР"^1 "'Х/г ^* Легко видеть, что и<у Цхь ..., хя, y)=r(f#(xb ..., xm у^"1^- Предложение 3.19. Если функция h (хь ..., хл, у, г) примитивно рекурсивна (рекурсивна) и f(xb ..., хл, y) = h(xb ..., xm у, %(хь ... ..., хл, у)), то функция f примитивно рекурсивна (рекурсивна). Доказательство. Из определения операции П на стр. 138 имеем %(хь ..., хя, 0)=1; кроме того, очевидно, ..., хя, y+l) = f#(xb ..., хя, у).ру^ хп>у) = Таким образом, согласно правилу рекурсии (V), функция f# является примитивно рекурсивной (рекурсивной), а так как i (xh ..., хп, у) = = (f#(xi, ..., хя, у-)-1))у, то и функция f примитивно рекурсивна (рекурсивна). Пример. Так называемая последовательность Фибоначчи задается рекурсивно равенствами: f(0)= 1, f(1) = 2, i(^-f-2) == f(*) + f(A+ 1) при k^O. Докажем, что функция f примитивно рекурсивна. В самом деле, во-первых, во-вторых, функция h(y, z)=ii примитивно рекурсивна и, наконец, f (k) = h(k, Упражнение Пусть g (0) = 2, g (1) == 4, g (k + 2) = 3g (k + 1) -*- (2g (k) + 1). Показать, что g есть примитивно рекурсивная функция.
Иб ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА Следствие 3.20. Если отношение Н (хь ..., хл, у, г) примитивно рекурсивно {рекурсивно) и R (хь ..., хя, у) выполнено тогда и только тогда, когда выполнено Н (хь ..., хя, у, (Cr)# (хь ..., хл, у)), где Cr — характеристическая функция отношения R, то отношение R примитивно рекурсивно {рекурсивно). Доказательство. Так как характеристическая функция Сн отношения Н примитивно рекурсивна (рекурсивна) и Ср(хь ..., хя, у) = = Сн(хь ..., хя, у, (Cr)^(xi, ..., хя, у)), то, согласно предложению 3.19, примитивно рекурсивной (рекурсивной) является и функция Cr, а с нею вместе и отношение R. В дальнейшем мы часто будем опираться на предложение 3.19 и на следствие 3.20. Эти два предложения оказываются полезными там, где приходится иметь дело с отношениями и функциями, значения которых для произвольного у определяются через их значения для аргументов, меньших чем у. В связи с этим заметим, что R (хь ..., хт и) эквивалентно равенству Ср(хь ..., хя, и) = 0, которое в свою очередь при м<У эквивалентно равенству ((Cr)#(xi, ..., хя, у))и = 0. Упражнения 1. Доказать, что множество всех общерекурсивных функций счетно. 2. Доказать, что если \и f2, ... — какой-нибудь пересчет всех примитивно рекурсивных (всех рекурсивных) функций от одной переменной, то функция ф (х, у) = fx (у) не является примитивно рекурсивной (рекурсивной). Предложение 3.21. ф-функция Гёделя.) Пусть р (хь х2, х3) = = rm(l -f-(x3-f- l)-x2, xt). Функция р примитивно рекурсивна, в силу предложения 3.15 (п). Эта функция, кроме того, сильно предетавима в S следующей формулой Bt{xh х%, х& дг4): Доказательство. Из предложения 3.11 следует, что \-3\Xg Bt {xh х% х<&, хд- Пусть р {kh 1гъ k^) = ki. Тогда при некотором k kx = {\-\-{k7>-\-\)'k$-kArklL и £4<i_|-(£3-|-l).£2. Поэтому, в силу предложения 3.6 (а), |— ^1 = (1 -\-(кг-{- \)*k*)'k-\-ki и, опять же в силу предложения 3.6 (а), а также на основании выразимости в S отношения <, имеем |— й4 < Г -\- (^3 -j- 0 * k% Следовательно, \- k\ ===== = (l -\-(h-\-i)-h) k -f- kj & kg < }_ + (fe-b l)-kv откуда по правилу E4 получаем \-Bt{k\, k% k& k^) Сильная представимость р в S формулой Bt доказана. Предложение 3.22. Для любой конечной последовательности натуральных чисел k0, kh ..., kn существуют такие натуральные числа Ь и с, что ${Ь, с, i) = ki для O^l^n. Доказательство. Пусть j = max (/z, k0, kh ..., kn) и c=j\. Рассмотрим числа ut == 1 -\-{i-j- 1)• cy где O^i^n. Никакие два из них не имеют общих делителей, отличных от 1. В самом деле, если бы
$3 ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 147 число р было простым делителем каких-нибудь двух чисел 1 -]-(*'~Ь \)*с и 1 -\-(т -[- 1) • Су где 0 < / <</я =^ я, то р было бы делителем и их разности (т — 0 • с. Но тогда р не было бы делителем с, ибо в противном случае оно было бы общим делителем чисел (i-\-\)-c и 1 —|— (/ —J— 1) • с и, следовательно, делителем числа 1, что невозможно. Следовательно, такое число р должно было бы быть делителем числа т — /, что тоже невозможно, ибо т — i^n^j, и, следовательно, т — / делит у! = с, и если бы р делило т — /, то делило бы и с. Итак, р не может делить (т — /) • с, и потому числа щ при Q^i^m попарно взаимно просты. Кроме того, если O^i^n, то А»£^у^у! = = c<i I -\-(i-\- \)-с — щ. Согласно китайской теореме об остатках (см. Диксон [1929] или упражнение 1 на стр. 151), существует число Ь < щи\ ... ип такое, что гт (щ, b) = kh если 0 ^ / ^ п. Но р (b, cf i) = = rm(l -f-(/-f~ l)-£> b) = rm(uiy b) = kiy что и требовалось доказать. Предложения 3.21 и 3.22 позволят нам выражать внутри системы S утверждения о конечных последовательностях натуральных чисел, что существенно важно для доказательства следующей основной теоремы. Предложение 3.23. Всякая рекурсивная функция представила в S. Доказательство. Исходные функции Z, N, U" представимы в S, согласно примерам (а) — (с) на стр. 133. В силу примера (d) на стр. 133, правило подстановки (IV) не выводит за пределы класса представимых функций. Обратимся к правилу рекурсии (V). Допустим, что функции g (хь ..., хп) и h (хь ..., хд, у, z) представимы в S соответственно формулами &£ (хъ ..., хп+1) и Ш (хъ ..., хя+з)> и пусть • f(xb ..., хя, 0) =g(xb ..,, хп)9 f(xb ..., хл, y-f- l) = h(xi, ..., хл, у, f(xb ..., хл, у)). Идея доказательства заключается в следующем. Равенство f (хь ... ...» xm y)~z справедливо тогда и только тогда, когда существует конечная последовательность чисел £0> ..., Ьу такая, что £0 = g(xi, ... ..., хп), &W4-i = h(Xb ..., хл, w, 6W) при всяком w-j-l^y и by = z\ но, согласно предложению 3.22, всякое высказывание о конечных последовательностях может быть выражено в терминах значений функции р, которая, в силу предложения 3.21, представима в S. Мы докажем, что функция f (хь ..., хп, хп+1) представима в S с помощью формулы W (хь ..., хп+%): 3u3v [(3w (Bt (и, v, 0, w)&<&£ (xh ..., xw w))) & & Bt (щ vy xn+1, xn+o) &\fw(w< xn+1 id 3y3z (Bt (и, Vy Wy y) & & Bt (lly V, W\ Z)&Q%} (Хь . .. , Xm Wy у у Z)))\ (i) Предположим сначала, что f (kh ..., km p) = m. Докажем km p, fit)- Если р = Оу то m = g(kh ..., kn). Рассмотрим последовательность, состоящую из одного числа т. Согласно предложению 3.22, существуют такие Ь, с} что R(b} c} 0) = т. Следовательно,
148 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА в силу предложения 3.21, \-Bt(b, С, 0, т). Кроме того, так как /# = = g (kh ... , kn), то |- от? (~kh ..., km m). Отсюда по правилу Е4 получаем |- 3w(Bt (ft, с, 0,w)&gs? (kl9 ..., knt да)). (*) Перед этим мы только что доказали, что \-Bt(pt с, о, т). (**) Переходя, наконец, к третьему конъюнктивному члену в ^ (kh ... ..., kn, О, m)> мы видим, что из |— "| (да < 0), на основании соответствующей тавтологии, следует \- Vw (w < 0 zd 3j/3^ (ft, е, да, j/) & &Д*(6, с, да', z)&e»(Ab ..., К w, У, г)). (♦•*) Из (*), (**) и (**#) по правилу Е4 получаем, наконец, [— ^(^ь ... ..., Л„, 0, ш)- Для /?>0 /(^i, ..., kn> p) вычисляется из равенств (I) за р-\-1 шагов. Пусть n = f(kh ..., km i) при /==0, 1, 2, ..., p. Согласно предложению 3.22, для последовательности r0, rh •.., тр существуют числа Ь} с такие, что $(Ь, с, /) = Г/ при Q^i^p. Тогда, по предложению 3.21, |— Bt(b, С, I, Г,-). Так как, в частности, $(Ь, с, 0) = = ro = f(£i, ..., km O) = g(Ab ..., kn\ то }-«(ft, С, 0, ro)&Q^(kh ... ..., ^я, Го)> и» следовательно, по правилу Е4 (1) Ь Зда(iB<(ft, с, 0, да)&^(Аь ...,*да да)). Далее, так как rp = f {kh ..., kw p) = /w, то [3 (ft, с, /?) = m. Поэтому (2) |- Bt (ft, С, A m). Если же, наконец, O^i^p—1, то P(ft, с, i) = ri = i(kh ..., kn, i) и p(ft, c, /+l) = n+i = f(A1, ..., km i+l) = h(kh...9km Uf(kh ... ..., An, /)) = h(^!, ..., km U гг). Следовательно, \- Bt(b, €, I, fj)& & Bt (ft, C, l\ Ti+1) & <£® {kb ..., kny I, fh fi+i). Теперь по правилу Е4 получаем h 3y3z(Bt(bt c, f, y)&Bt(b, С, Г, ^)&e»(*i, ..., Ада i, y, z)). Отсюда, на основании предложения 3.8 (b'), получаем (3) |- Vw(w<pzD3y3z(Bt(b, С, /, y)&Bt(b, С, Г, z)&<ffi(k1, ... ..., kn> U У> *)))• Применив дважды правило Е4 к конъюнкции формул, выводимость которых обозначена через (1), (2) и (3), получаем окончательно |— W (Jzb ..., km p, m). Таким образом, мы доказали, что пункт (1) определения представимости в S (стр. 133) для функции f выполнен. (и) Теперь мы должны доказать, что |— 3iArn+2^ (*i, ..., km p, хп+ъ) при любых k\y ..., кю р. Докажем это индукцией по р в метаязыке. Заметим, что, в силу доказанного выше, нам осталось доказать лишь единственность. Случай /? = 0 легкий, и мы его оставляем читателю
§ 3. ПРИМИТИВНО РЕКУРСИВНЫЕ И РЕКУРСИВНЫЕ ФУНКЦИИ 149 в качестве упражнения. Итак, предположим, что |— 3\Хп+^ (kh ..., kn> р, *я+а). Пусть a = g(£b ..., kn\ p=f(Ai, ..., kn> p) и 7==f(*b •-.» £* p-\-l) = h(kh ..., km p, P). Тогда (1) Ь«^(*ь...>*л,А Р>Т) (2) h^(^i> ••> К a) (3) hgfe...,^Ap) (4) (5) 1- З^я+aS7(*ь ...,к„, р, Предположим (6) Мы должны доказать, что ^Л+2 = Т- ^3 (6) по правилу С получаем (a) 3w{Bt(b, с, 0, т)&&г(кь ...,kn> *>)), (b) ф ) + (c) Vw (w <p + 1 => Эз/Зг (B^(6, c, w, j;) & &5^(b, c, w\ z)8t<m(kh ...,kn,w, y, z))). Из (с) получаем (d) Vw(w<:p=> 3y3z (Bt (b} c, w> y) & kBt{b, c, w\ z)4«(*b ..., ~km w,y, z))). Из (с) по правилу С следует (e) Bt (ft, cf p, d) & Bt (b, cy Я+Т е) к Si (~kh ...,kmp, d, e)^ Из (а), (d), (e) следует (f) «4*i,..., *„/>, 4 Из (f) и (5) следует (g) <* = p. Из (е) и (g) получаем (h) SS(kh ..., Am /?, p, 4 Так как функция h представима формулой Sd, то ив (1) и (h) следует (О Т = * Из (е) и (i) следует (j) В<(6, ^U и, наконец, из (Ь) и (j), на основании предложения 3.21, получаем (к) хпЩ = Ч- Индукция завершена. Перейдем, наконец, к (^-оператору. Допустим, что для любых хь ..., хп существует у такое, что g (хь ..., хл, у) = 0, и предположим, что функция g представима в S формулой £$ (хъ ..., лгл+а). Пусть
150 ГЛ 3 ФОРМАЛЬНАЯ АРИФМЕТИКА f (xi, ..., х„) = jxy (g (xi, ..., хл, у) = 0). Докажем, что тогда функция f представима формулой %(хь ..., хп+1): .., хту, 0)). Предположим сначала, что f (kh ..., kn) = m. Тогда g (&ь ..., kn, m) = = 0 и g (*,, ..., km k) Ф 0 при k < /гг. Поэтому |- Sf (~kh ..., *я, т, 0) и |— "| J? (&ь ..., Ап, &, о) при k < /гг. В силу предложения 3.8 (Ь'), Следовательно, |— Ш (kh ... , Ал, /tz). Остается доказать, что (— 3iJCw+i Ш (аь ..., Ал, xn+i), причем, ввиду уже доказанного, достаточно, очевидно, установить лишь единственность. Допустим, что £$ {k\, ..., km и, 0)&>/y(y<u=>l&(khj..,kw у,0)) и &(kl9 ,..,Ая, г1, 0)& & Vy (j; <С г; zd "I «^ (*i, ..., km у, О)). Тогда, если v < м, то мы получим противоречие «^ (^i, ..., km и, 0) & П £Я (Аь ..., Ая, ф, 0), а если м< г;, то получим противоречие £Zf (kh ... у km м, 0) & ~[ &(Аь ..., ^л, w, О). А так как j— u<v\/ v<C.u\J u = v, то u = v. Таким образом, мы доказали, что все рекурсивные функции пред- ставимы в S. Можно также показать, что все примитивно рекурсивные функции сильно представимы в S. Для исходных функций это было показано в примерах (а) — (с) на стр. 133. Кроме того, было также показано, что правило подстановки не выводит за пределы класса сильно представимых функций (там же, пример (d)). Наконец, приведенное только что доказательство того, что правило рекурсии не выводит за пределы класса представимых в S функций, может быть усовершенствовано для получения аналогичного утверждения о сильной представимости, поскольку предложение 3.22 может быть доказано в системе S при любом п, т. е. для каждого п ^ 1 Ь83и3х>(5*(и, v, 0, xi)&Bt(u, v, I, аг2)& ... &Bt(u, v> % хп)). Следствие 3,24. Всякое рекурсивное отношение выразимо в S. Доказательство. Пусть R (хь ..., хл) — рекурсивный предикат *). Характеристическая функция Сц этого предиката рекурсивна. В силу предложения 3.23, функция Cr представима в S и, следовательно, в силу предложения 3.12, предикат R выразим в S. Упражнения Н. (а) Показать, что если а и Ь — взаимно простые натуральные числа, то существует натуральное число с такое, что ас = 1 (mod b). (x = у (mod z) означает, что х и у имеют один и тот же остаток при делении на z или, иначе говоря, что разность х — у делится на z без остатка. (По сути дела, в настоя- *) Слово «предикат» употребляется часто как синоним слова «отношение».
$ 4 АРИФМЕТИЗАЦИЯ ГЁДЕЛЕВЫ НОМЕРА '51 щем упражнении речь идет о существовании целых и и v таких, что 1 = = au-f-bv.) b) Доказать китайскую георему об остатках: каковы бы ни были натуральные числа у1$ ..., yk и натуральные попарно взаимно простые числа хх, ..., х#, существует натуральное число z гакое, что z^yiOnodXj), ..., z= = У£ (mod x^), причем любые два таких числа z отличаются друг от друга на число, кратное произведению xx...Xk (Указание. Пусть х = х1...х^, и пусть x = w1x1==... = w^x^ при соответствующих w,-. Тогда, если l^i^k, то W/ и X/ взаимно просты, и, в силу предыдущего пункта (а), существует ъ\ такое, что w^z/ = I (mod x,-). Положим теперь z = w1z1y1 + ... + w^z^y^. Тогда z = w/z^y/ = у/ (mod X/). Кроме того, разность между любыми двумя такими решениями делится на хг, ...,xft, а следовательно, и на х^з.-.х^.) 2. (а) Назовем предикат R (хь ..., хп) арифметическим, если он является интерпретацией какой-нибудь формулы <э/£ (хъ ... , хп) теории S относительно стандартной модели Показать, что всякий рекурсивный предикат является арифметическим (Указание. Использовать следствие 3.24.) Ь) Показать, *то для всякой рекурсивной функции f (xlf ..., хп) ее представляющий предикат f (хх, ..., хп) = у (см. стр. 135, упражнение 1) рекурсивен. (Указание Характеристической функцией представляющего предиката является sg (| f (xx, ..., х„) — у |).) (с) Если функция f (хь ..., хп) рекурсивна, то ее представляющий предикат является арифметическим. 3. Открытая проблема: всякая ли рекурсивная функция сильно предста- вима в S? § 4. Арифметизация. Гёделевы номера Каждому символу и произвольной теории первого порядка К следующим образом поставим в соответствие положительное число g (/г), называемое гёделевым номером символа и: для А=1, 2, ...; для k=l, 2, ...; 2»3*) для k, n^l; g(A2)=H+8(2«3*) для k, /i^l; при этом положим g(\/Xi) = g((Xi)). Таким образом, различным символам поставлены в соответствие различные гёделевы номера, являющиеся положительными числами *). Примеры. g(*a) = 21, g(a4) = 39, g(/12)=105, g(AJ)=166. Пусть дано выражение иои1я..иг Гёделев номер g (wowi •••*'/•) этого выражения определим как 2g("о)3g(Mi). ..p^("/•), где р/ есть /-е простое число и ро == 2. Например, g {А\ (хъ х2)) = 2srUf) • 3*«> • бг(*1> • 7г<.) • 1UC-) • 13*0)« «=2107-33-513.77..1121.13б. Заметим, что, в силу единственности разложения натуральных чисел в произведения степеней простых чисел, различные выражения получают *) Эта же самая нумерация была применена в лемме 2.10, стр. 73.
152 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА при этом разные гёделевы номера. Кроме того, гёделевы номера выражений четны и потому отличны от гёделевых номеров символов. (Всякий символ можно рассматривать как выражение, и тогда он снабжается гёделевым номером, отличным от того, который становится ему в соответствие как символу. Это не должно, однако, приводить к недоразумению.) Наконец, гёделев номер произвольной последовательности е0, ..., ег выражений определим следующим образом: g(e0,..., er) = 2z(e<>) • З^^х X...pf^- Как и прежде, различные последовательности выражений имеют различные гёделевы номера, а так как эти последние четны и, кроме того, имеют четный показатель степени при 2, то они отличны и от гёделевых номеров символов, и от гёделевых номеров выражений. Таким образом, функция g взаимно однозначно отображает множество всех символов, выражений и конечных последовательностей выражений в множество целых положительных чисел. Множество значений функции g не совпадает, однако, с множеством всех целых положительных чисел; так, число 12 не является гёделевым номером. Упражнения 1. Построить объекты, имеющие своими гёделевыми номерами числа 1944 и 47. 2. Показать, что если п нечетно, то An не является гёделевым номером. 3. Найти гёделевы номера выражений: (а) /} (а,), (Ь) П (A* (alt х» *,))) =Э (A\ (*,)). Такая нумерация символов, выражений и последовательностей выражений впервые была предпринята Гёделем [1931] с целью арифме- тизации метаматематики *), т. е. с целью замены утверждений о формальной системе эквивалентными высказываниями о натуральных числах с последующим выражением этих высказываний в формальной системе. Идея арифметизации стала ключом к решению многих важных проблем математической логики. Рассмотренный здесь способ построения гёделевых номеров, разумеется, не является единственным. Другие способы можно найти у Клини [1952, гл. X] и у Шмульяна [1961, гл. I, § 6]. Предложение 3.25. Пусть для данной теории первого порядка К следующие отношения примитивно рекурсивны (рекурсивны): (а) 1С (х), что означает «х есть гёделев номер предметной константы теории К», (b) FL(x), что означает «х есть гёделев номер функциональной буквы теории К», (с) PL(x), что означает «х есть *) Арифметизацией данной теории первого порядка К мы называем всякую функцию g, отображающую взаимно однозначно множество всех символов, выражений и конечных последовательностей выражений теории К в множество целых положительных чисел. При этом требуется: (i) чтобы функция g была эффективно вычислимой, (и) чтобы существовала эффективная процедура, позволяющая для каждого т определить, является ли т значением функции g, и в случае, если является, то построить тот объект х, для которого m = g(x).
§ 4 АРИФМЕТИЗАЦИЯ ГЁДЕЛЕВЫ НОМЕРА 153 гёделев номер предикатной буквы теории К». Тогда следующие отношения и функции являются примитивно рекурсивными (рекурсивными), (В (1)—(4) предположения (а)—(с) не используются *).) (1) EVbl (х): «х есть гёделев номер выражения, состоящего из переменной», что может быть выражено формулой 3zz<x(l ^z&x = 25+8z). Это отношение примитивно рекурсивно на основании предложения 3.17. (2) ArgT (х) = (qt (8, х — 9))0; если х есть гёделев номер функциональной буквы /у, то ArgT(x) = /z. Argp(х) = (qt(8, х—11))0; если х есть гёделев номер предикатной буквы Лу, то ArgP(x) = /7. (3) МР (х, у, z): «выражение с гёделевым номером z непосредственно следует из выражений с гёделевыми номерами х и у по правилу modus ponens». Формально это отношение выражается равенством у== = 23*x*2n*z*25**). (4) Gen (x, у): «выражение с гёделевым номером у получается из выражения с гёделевым номером х по правилу обобщения», или формально: 3 (5) Е1С(х): «х есть гёделев номер выражения, состоящего из предметной константы», т. е. Эуу<х(1С (у)&х = 2У). (Предложение 3.17.) EFL(x): «х есть гёделев номер выражения, состоящего из функциональной буквы», т. е. 3yy<x(FL(y)&x = 2y). (Предложение 3.17.) EPL(x): «х есть гёделев номер выражения, состоящего из предикатной буквы», т. е. 3yy<x(PL(y)&x = 2y). (Предложение 3.17.) (6) Trm(x): «х есть гёделев номер терма теории К». Это высказывание истинно тогда и только тогда, когда либо х есть гёделев номер выражения, состоящего из предметной константы или из предметной переменной, либо существуют функциональная буква f% и термы £ь ..., tn такие, что х есть гёделев номер выражения fk{t\, •••> trd- В этом последнем случае пусть у — гёделев номер последовательности из п -\- 3 выражений: ft; ft(; fi(tu; ft(th fc; ...; ft(tb tb..., tn_h; ft (th... .., tn_h tn; ft(th ..., tn). Нетрудно видеть, что у< (pl+2)rt + 3< <; (pl)x z= pf. Заметим также, что n = ArgT ((x)0), ибо (х)0 есть гёделев номер символа ft. Следовательно, Trm (x) эквивалентно следующему отношению: EVbl (х) V Е1С (х) V Зуу < (Рх)Х2 [х = (у)ш (у) _, 1 & EFL ((у)0) & In (у) = ((х)о) =э 3vv <х ((y)u = (У)и -1 * v * 27 & Trm (v))) & & 3 vv <V ((y),h (y) ^ 2 = (y)m (у) -^ з * v & Trm (v) & (y),h (y) -^ i = (y)m (y) ^ 2 * 2B)]. Таким образом, в силу следствия 3.20, предикат Trm(x) примитивно *) Ниже автор перечисляет предикаты и функции одновременно с обоснованием их примитивной рекурсивности (или рекурсивности). (Прим. перев.) **) См. определение приписывающей функции * в примере 4 на стр. 142.
154 ГЛ 3 ФОРМАЛЬНАЯ АРИФМЕТИКА рекурсивен (рекурсивен), так как последняя формула содержит Trm (v) только для v < х *). (7) Atmf (x): «х есть гёде/ев номер элементарной формулы теории К». Это высказывание истинно тогда и только тогда, когда существуют термы tb ..., tn и предикатная буква А% такие, что х есть гёделев номер А\ Уъ • • • у *п)- Тогда существует последовательность выражений Л£; А\ (; Ak(tly\ Ak(tb t2); ...; Ak (tlf t2f ..., tn-lf; Ak(tb t2, ..., tn_b tn\ Ak(tb • ••> tn_b tn). Пусть у — гёделев номер этой последовательности, состоящей из л + 3 выражений. Так же, как и в предыдущем пункте (6), у <С(рх)х2 и п = Argp ((х)о)- Поэтому Atmf (х) эквивалентно следующему отношению: (Эу)у<(Рх)Х2 [х = (у)ш (У)-1 & EPL ((у)0) & lh (у) = Argp ((х)0) + + 3 & (у)! = (у)о • З3 & Vuu < ih (у) (и > 1 & и < Argp ((х)0) zd id 3vv<y ((y)u = (y)u^-i * v * 2' & Trm (v))) & 3vv<y ((y)ih(y)^2 = = (y)ih (у)-з * v & Trm (v)) & (y)ih(y)-1 = (y)ih (y)-^2 * 2B]. Отсюда, на основании предложения 3.17, заключаем, что отношение Atmf(x) примитивно рекурсивно (рекурсивно). (8) Fml (у): «у есть гёделев номер некоторой формулы теории К». Atmf (у) V 3zz<y [(Fml (z) & у = 2^ * 2» * z * 2») V V (Fml ((z)0) & Fml ((z)0 & у = 2» * (z)0 * 2" * (z\ * 2») V V (Fml ((z)0) & EVbl ((z)i) & у = 23 * 23 * (z)i * 25 * (z)0 * 25)]. Здесь применимо следствие 3.20 (возвратная рекурсия) (упражнение). (9) (a) Substi (у, u, v): «(у)0 есть гёделев номер результата подстановки в формулу с гёделевым номером (у)г терма с гёделевым номером и вместо всех свободных вхождений переменной с гёделевым номером v». Trm (u) & EVbl (v) & (((Т)! = v & (y)0 = u) V (3ww<(7)l ((V)i = = 2w & (Y)l ф v & (Y)o = (V)x)) \/ (3ww<(Y)l (1 < w к (у)г = = 2»*2'*v«2e#w& (y)i = (Y)o)) V (Atmf ((y),) =d id 3ww<(v)l3zz< (v)13aa<(v)o3Pp<(v)o ((y)i = w * z & (y)0 = = a * p & Substx (2a. 3W, u, v) & Substi (2P • 3Z, u, v))) V ^ V (3ww<(v)l3zz < (Y)l3cXa< (v)03pp < (V)o ((Y)i = 23 * w * 211 * z * 25 & & (Y)o = 23 * a * 2n * p * 26 & Substi (2a. 3W, u, v) & Substi (2P . 3Z, u, v))) V V (3ww<(v)l3aa<(v)o ((y)i = 23 * 29 * w * 25 & (y)0 = = 23*29*a*25&Subst1(2«.3w, u, v))). В силу следствия 3.20 (проверить его применимость), предикат Subst-x примитивно рекурсивен (рекурсивен). *) Если мы заменим оба вхождения Trm (v) в вышеприведенную формулу на (z)v = 0, то новая формула определит нам некоторый примитивно рекурсивный (рекурсивный) предикат Н (х, z) такой, что Trm (х) == Н (х, (CTrm)# (x)); поэтому здесь и применимо следствие 3.20.
§ 4 АРИФМЕТИЗЛЦИЯ ГЕДЕЛЕВЫ НОМЕРА 155 (b) Subst(x, у, u, v): «х есть гёделев номер результата подстановки терма с гёделевым номером и вместо всех свободных вхождений переменной с гёделевым номером v в формулу с гёделевым номером у». Это утверждение эквивалентно Substj (2х. Зу, u, v). (c) Пусть Sub (у, и, v) —гёделев номер результата подстановки терма с гёделевым номером и вместо всех свободных вхождений переменной с гёделевым номером v в формулу с гёделевым номером у. Так как Sub (у, u, v) = jxx uySubst(x, у, и, V), то функция Sub при- Риу митивно рекурсивна (рекурсивна), в силу предложения 3.17. (10) (a) Fr(u, x): «и есть гёделев номер формулы теории К, содержащей свободно переменную с гёделевым номером х». Fml (u) & EVbl (х) & "I Subst (и, и, 2& + **, х) (т. е. подстановка в формулу с гёделевым номером и переменной, отличной от переменной с гёделевым номером х, вместо всех свободных вхождений переменной с номером х приводит к новому выражению), (b) Fi*! (u, v, w): «и есть гёделев номер терма, свободного для переменной с гёделевым номером v, в формуле с гёделевым номером w». Trm (u) & EVL1 (v) & Fml (w) & [Atfml (w) V 3yy<w (w = 23 * 29 * у * 25 &. & Frx (u, v, y)) V 3yy<W3zz<w (w = 23 * у * 211 * z * 25 & &Frx(u, v, y)&Fri(u,v, z))VEyy<w3zz<w(w=s2»*2»*z*2«*y*2*& &EVbl(z)&(Fr(y, v)c Для доказательства применить возвратную рекурсию (следствие 3.20). (И) (а) Axj(x): «x есть гёделев номер частного случая схемы аксиом (1)». 3uu<x3vv<x (Fml (u) & Fml (v) & x = 23* u * 211 * 23 * v * 211*u * 25 * 26). (b) Ax2(x): «x есть гёделев номер частного случая схемы аксиом (2)». 3uu<x3vv<x3ww<x (Fml (u) & Fml (v) & Fml (w) & x = 2* * * 23 * u * 211 * 23 * v * 211 * w * 25 * 25 * 211 * 23 * 23 * u * 211 * v * * 25 * 211 * 23 * u * 211 * w * 2& * 25 * 25) (c) Ax3(x): «x% есть гёделев номер частного случая схемы аксиом (3)». 3uu<x3vv<x (Fml (u) & Fml (v) & x = 23 * 23 * 23 * 29 * v * 25 * 211* 23* 29* * u * 25 # 26 * 211 * 23 * 23 * 23 * 29 * v * 25 * 211 * u * 26 * 211 * v * 25 * 26). (d) Ax4(x): «x есть гёделев номер частного случая схемы аксиом (4)». 3uu<x3vv<x3ww Cx(Fml(u)&Trm(v)&EVbl(w)&Fri(v, w, u) & х — (u, v, w)*25>
156 ГЛ 3. ФОРМАЛЬНАЯ АРИФМЕТИКА (e) Ах5(х): «х есть гёделев номер частного случая схемы аксиом (5)». 3uu<x3vv<x3ww<x (Fml (u) & Fml (v) & EVbl (w) & "1 Fr (u, w) &x = = 23 * 2s * 23 * w * 25 * 23 * u * 211 * v * 25 * 25 * 211 * 23 * u * * 211 * 23 * 23 * w * 25 * v * 25 * 25 * 25). (f) LAx(y): «у есть гёделев номер логической аксиомы». AXl(y) V Ах2(у) V Ах3(у) V Ax4(y) V Ax5(y). (11') Gd(x): «x есть гёделев номер выражения теории К». EVbl (х) V EIC (х) V EFL (х) V EPL (х) V х = 23 V х = 2б V х = 2? V V х = 2° V х = 2" V 3uu<x3vv<x(x = u*v&Gd(u)&Gd(v)) (следствие 3.20). Замечание. В предложении 3.25 условия (а) — (с) выполнены для всякой теории К с конечным числом предметных констант, а также функциональных и предикатных букв, ибо для такой теории предикаты 1С (х), FL (х) и PL (x) примитивно рекурсивны. Так, например, если предметными константами теории К служат символы aiv aj2,... ..., aj , то 1С(х) истинно тогда и только тогда, когда х==7-\-8j\\J \J х = 7 + 8/2 V- • • V х = 7 + 8ул. В частности, условия (а) — (с) выполнены для S. Предложение 3.26. Если теория К удовлетворяет условиям (а) — (с) предложения 3.25 и если, кроме того, (d) предикат РгАх (у): «у есть гёделев номер собственной аксиомы теории К», примитивно рекурсивен {рекурсивен), то следующие отношения примитивно рекурсивны (рекурсивны). (12) Ах (у): «у есть гёделев номер аксиомы теории К». LAx (у) \/ РгАх (у). (13) (a) Prf(y): «у есть гёделев номер вывода в К». В силу следствия 3.20, предикат 3ww<y(y = 2w&Ax(w))\/3uu<y3ww<y3vv<y(Prf(u)& & У - и * (рт (u))v & (Ах (v) V Gen (v, (u)w))) V V3^z<y3ww<y3uu<y3vv<y(Prf(u)&y=u*(pih(u))v&MP((u)z, (u)w, v)), эквивалентный Prf (у), является примитивно рекурсивным (рекурсивным), (b) Pf(y, x): «у есть гёделев номер вывода формулы с гёделе- вым номером х». Pf(y, х) эквивалентно Prf (у) & х = (y)ih (у)— i- (Заметим, что S удовлетворяет условию (d). В самом деле, пусть гь а2, ..., а8 —гёделевы номера аксиом (SI) —(S8), и пусть и есть гёделев номер частного случая схемы аксиом (S9), что возможно тогда и только тогда, когда 3vv<u3yy<u(Eybl(v)&Fml(y)&u = 23*Sub(y, 215, v)* *2n*23*23*23*v*25*23*y*2n*Sub(y, 25?*23*v*25, v)* * 25 * 2б * 211 * 23 * 23 * v * 25 * у * 25 * 25 * 25).
§ 4 АРИФМЕТИЗАЦИЯ ГЁДЕЛЕВЫ НОМЕРА 157 Обозначим эту последнюю формулу через А9 (и). Тогда х есть гёделев номер собственной аксиомы теории S в том и только в том случае, когда х = ах V х = а2 V ... V х = а8 V А9 (х).) Предложение 3.27. Для теории S, наряду с отношениями и функциями (а) — (d) и (1) — (13), примитивно рекурсивными являются также следующие отношения и функции. (14) (a) Nu(y): «у есть гёделев номер некоторой цифры теории S». у = 216 \/ 3xx<y(Nu(x)&y = 267*23*x*25). Применить следствие 3.20. (b) Num (у) = гёделеву номеру у. Num (0) = 21*, Num (у + 1) = 2" * 23 * Num (у) * 2*. (15) Bw(u, v, х, у): «и есть гёделев номер некоторой формулы О7#у v есть гёделев номер переменной, свободной в ©^, и у есть гёделев номер вывода в S формулы, полученной из os£ подстановкой цифры х вместо свободных вхождений в о/£ переменной с гёделевым номером v». Fml (u) h EVbl (v) & Fr (u, v) & Pf (y, Sub (u, Num (x), v)). (16) Пусть qs£(xb ..., xn)— некоторая фиксированная формула теории S, единственными свободными переменными которой являются хь ..., хп, и пусть т есть гёделев номер orf (хь ..., хп). Обозначим через Bw^Ui, ..., un, у) высказывание: «у есть гёделев номер вывода в S формулы orf(пь ..., un)». Тогда Bw^Uj, ..., un, у) эквивалентно Pf (у, Sub... (Sub (Sub (m, Num(ux), 2*+*), Num(u2), 2*+ie))...). (17) (a) Wx(u, у): «и есть гёделев номер формулы о^ (хх), содержащей свободную переменную хь и у есть гёделев номер вывода в S формулы ©^(п)». Это утверждение эквивалентно Fml (u) & Fr (и, 213) & Pf (y> Sub (u> Num (u)> 2«)). (b) W2 (и, у): «и есть гёделев номер формулы о^ (хг), содержащей свободную переменную хь и у есть гёделев номер вывода в S формулы "| о/? (п). Это утверждение эквивалентно Fml(u)&Fr(u, 213)&Pf(y, Sub (23 * 29 * u * 2*, Num(u), 218)). (18) Определим, наконец, функцию D(u) таким образом, чтобы для каждого и, являющегося гёделевым номером формулы о/g (хх) со свободной переменной хь D(u) было равно гёделеву номеру формулы оЛ (и). Для этого положим D(u) = Sub(u, Num (и), 213). В дальнейшем символы, служащие для обозначения относящихся к системе S предикатов и функций из предложений 3.25—3.27, мы будем снабжать индексом «S», чтобы указать на зависимость этих предикатов и функций от S. Дело в том, что, рассматривая какую-нибудь другую теорию первого порядка S' с теми же символами, что и у S, мы можем получить в предложениях 3.25—3.27 предикаты и функции, отличные от предикатов и функций, соответствующих в этих предложениях теории S.
158 гл. з формальная'арифметика Предложение 3.28. Всякая функция f (хь ..., хп), представимая в S, рекурсивна. Доказательство. Пусть формула os€ {xh ..., хп, z) представляет f в S. Рассмотрим натуральные числа kh ..., kn. Пусть f(£b... ..., kn) = m. Тогда f- s <з^ (kh ..., kn, m). Пусть / есть гёделев номер вывода a^{kh ...,*№w)bS. Тогда Bw^(£b ..., km m, j) (см. предложение 3.27 (16)). Итак, для любых Хь ..., х„ Существует такое у, что Bw^(xb ..., хп, (у)о, (y)i). Поэтому f(хь ..., xra) = ([xyBw<;€(xi, ..., хп, (у)о, (y)i)V Согласно предложению 3.27 (16), предикат Bw^ примитивно рекурсивен. Отсюда, принимая во внимание правило [х-оператора (VI) в определении рекурсивных функций, заключаем, что функция pyBw^(xb ... , хп, (у)0, (у)0 рекурсивна; Следовательно, и функция f рекурсивна. Предложение 3.28 вместе с предложением 3.23 показывает, что класс рекурсивных функций совпадает с классом функций, предста- вимых в S. В главе 5 мы приведем доводы в пользу правдоподобности того, что понятие рекурсивной функции есть точный математический эквивалент интуитивной идеи эффективно вычислимой функции. Следствие 3.29. Всякий заданный на множестве натуральных чисел предикат R (хь ..., хя) рекурсивен тогда и только тогда, когда он выразим в теории S. Доказательство. Согласно определению, предикат R (xi, ..., хя) рекурсивен тогда и только тогда, когда рекурсивна функция CR. С другой стороны, предикат R выразим в S тогда и только тогда, когда функция CR представима в S (предложение 3.12). § 5. Теорема Гёделя для теории S Пусть К — теория первого порядка с теми же самыми символами, что и S. Теория К называется ^-непротиворечивой, если для всякой формулы gs£ (х) этой теории из того, что при любом п |— ке^(«), следует невозможность |— кЗх~]о^(х). Если мы признаем стандартную интерпретацию теории S в качестве модели этой теории, то тогда теорию S следует признать ^-непротиворечивой. Но, так или иначе, мы будем явно формулировать предположение о ^-непротиворечивости S всякий раз, когда эта ш-непротиворечивость будет использована в доказательстве (см. замечания о непротиворечивости на стр. 121). Предложение 3.30 Если теория К ^-непротиворечива, то она непротиворечива. Доказательство. Пусть теория К («-непротиворечива. Рассмотрим какую-нибудь выводимую в К формулу о^ (х) со свободной переменной, например х = х и> х = х. При любом п имеем, очевидно, [— ^п — п zd п — п. Поэтому формула Зх ~](х = х zd х = х) невыводима
§ 5. ТЕОРЕМА ГЁДЕЛЯ ДЛЯ ТЕОРИИ 5 159 в К. Следовательно, теория К непротиворечива (ибо, в силу тавтологии ~\Azd(AzdB), из противоречивости К следовало бы, что в К выводима любая формула). Согласно предложению 3.27 (17а), отношение Wi(u, у) примитивно рекурсивно и потому, в силу следствия 3.24, выразимо в S некоторой формулой №i(xlf x2) с двумя свободными переменными Х\, *ъ Это значит, что если Wi (kh k%) истинно, то |—s^i(^i, к%), и если W\{khk$ ложно, то (— s~l^i(£i, hi). Рассмотрим теперь формулу Пусть т есть гёделев номер формулы (*). Подставив в (*) т вместо Хи мы получим замкнутую формулу у/х^т^ш, х,). (**) Вспомним, что утверждение Wi(u, у) истинно тогда и только тогда, когда и есть гёделев номер некоторой формулы о/£ (х\), содержащей свободно переменную хь а у есть гёделев номер вывода в S формулы о/ё (п). Следовательно, (I) W! (т, у) истинно тогда и только тогда, когда у есть гёделев номер вывода в S формулы (**). Предложение 3.31. (Теорема Г ё дел я для теории S [1931].) (1) Если теория S непротиворечива, то формула (**) невыво- дима в S. (2) Если теория S ^-непротиворечива, то формула "](**) невыво- дима в S. (Таким образом, в силу предложения 3.30, если теория S со-непроти- воречива, то замкнутая формула (**) невыводима и неопровержима в S. Замкнутые формулы, обладающие таким свойством, называются неразрешимыми предложениями теории S.) Доказательство. (1) Предположим, что теория S непротиворечива и |— s Vxg ~] ^i (7й> хЛ. Пусть тогда k — гёделев номер какого- нибудь вывода в S этой последней формулы. В силу (I), справедливо Wi(#z, k). Так как №t выражает Wt в S, то \-s<t^'i{m} k). Из Vx^Wi^m, х2) по правилу А4 мы можем вывести ~\W\{т> k). Таким образом, в S оказываются выводимыми формулы Zl?i {m, k) и "1 tl^i (m, k\ что противоречит предположению о непротиворечивости S. (2) Предположим, что теория S ^-непротиворечива и [— | Vjc2 ~| УУХ (In, х%), т. е. Кs !(**)• На основании предложения 3.30, заключаем, что теория S непротиворечива и, следовательно* не f— s(**). Поэтому, каково бы ни было натуральное число п, п не есть гёделев номер вывода в S формулы (**), т. е. Wj (т, п) ложно для любого п. А это значит, что |— ъ~]Ш\(т, п) для любого п. Взяв в качестве формулы &#(х%) формулу ~]t/?i\m, x<z), мы, на основании предположения о ш-
I60 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА непротиворечивости теории S, заключаем, что не f— S3xal "1 У?\ itn, х%) и, следовательно, не (— s 3x^1} \ {т, х<Л. Мы пришли, таким образом, к противоречию с предположением, что [— s 3x$D'i {т, х%). Весьма любопытна стандартная интерпретация неразрешимого предложения (**): y/x<i~]t//l(7n} x2). Так как Шг выражает в S отношение Wi, то, в соответствии со стандартной интерпретацией, (**) утверждает, что W^/w, jc2) ложно для каждого натурального числа лг2. Согласно (I), это означает, что не существует вывода формулы (**) в S. Другими словами, формула (**) утверждает свою собственную невыводимость в S *). По теореме же Гёделя, если только теория S непротиворечива, эта формула и в самом деле невыводима в S и потому истинна при стандартной интерпретации. Итак, для натуральных чисел, соответствующих обычной интерпретации, формула (**) верна, но в S невыводима. Это может навести нас на мысль, что теорема Гёделя потому справедлива для теории S, что первоначально выбранная для этой теории система аксиом оказалась слишком слабой и что, если бы мы усилили теорию S, добавив к ней новые аксиомы, то новая теория могла бы оказаться полной. Так, например, чтобы получить некоторую более сильную теорию Si, мы могли бы добавить к S истинную формулу (**). Однако всякая рекурсивная функция, будучи представимой в S, пред- ставима также и в такой теории Si. Точно так же и предложения 3.25 — 3.27 остаются, очевидно, в силе, если их переформулировать для Si. Но ведь это и есть все, что требуется для того, чтобы получить результат Гёделя; и потому, если теория Si ш-непротиворечива, то и она имеет некоторое неразрешимое предложение SB. (S3 имеет ту же форму Vx2~l(?^i)s (~k, jc2), но, разумеется, будет отличаться от (**), поскольку отношение Wi для Si отлично от отношения Wi для S, и, следовательно, формула (2^0s и входящая в SB цифра k отличны от формулы W"\ и цифры т в (**).) Упражнения 1. Пусть Sg — расширение теории S, полученное добавлением к последней формулы "1 (**) в качестве новой аксиомы. Показать, что если теория S непротиворечива, то теория S непротиворечива и со-противоречива. 2. Теория К, содержащая те же символы, что и теория S, называется со- неполной, если существует такая формула orf (x\ что h^ <з/ («) для каждого неотрицательного п, но не У-^ХоД (•*)• Доказать, что если теория S непротиворечива, то она со-неполна. (Указание. Рассмотреть формулу х2) и применить предложение 3.31.) *) Таким образом, (**) является аналогом различных семантических парадоксов, в частности, таких, как парадоксы Ришара, Берри и парадокс лжеца (см. Ван Хао [1955]).
§ 5. ТЕОРЕМА ГЁДЕЛЯ ДЛЯ ТЕОРИИ S 161 3. Показать, что для непротиворечивой теории «-противоречивость влечет <о-неполноту. В теореме Гёделя содержится предположение о со-непротиво- речивости теории S. Однако, как показал Россер [1936 Ь], ценой некоторого усложнения доказательства можно с тем же успехом ограничиться предположением об обычной непротиворечивости теории S. Как было доказано, отношение W2(u, у) из предложения 3.27(17 Ь) является примитивно рекурсивным. Следовательно, W2 выразимо в S с помощью некоторой формулы ffi%(Xi, х2). Рассмотрим тогда формулу Пусть п — гёделев номер этой формулы. Подставив в нее вместо Х\ цифру пу получим замкнутую формулу (п, х2) id Зхг (хг ^ х% & Wi (п, х3))). (****) Вспомним, что Wi(u, у) (соответственно W2(u, у)) истинно тогда и только тогда, когда и есть гёделев номер какой-нибудь формулы &# (jci) со свободной переменной х\, а у есть гёделев номер вывода в S формулы <2?£ (и) (соответственно ~| &# (и)). Так как п есть гёделев номер формулы (***), то (II) Wi(#, у) истинно тогда и только тогда, когда у есть гёделев номер вывода в S формулы (***#); (HI) W2(tf, у) истинно тогда и только тогда, когда у есгь гёделев номер вывода в S формулы ~| (***#). Предложение 3.32. (Теорема Гёделя в форме Р о с с е р а [1936 Ь].) Если теория S непротиворечива, то в ней невыводимы обе формулы (****) и "1 (****) и, следовательно, существует неразрешимое предложение этой теории. Доказательство. Предположим, что теория S непротиворечива и что в S выводима формула (****), т. е. h sVjc2 {Wt (я, *) => Э*3 (хз < х, & Ш, (й, хь))). Пусть тогда k — гёделев номер какого-нибудь вывода (***#) в S. В силу (II), справедливо Wj (n, k). Так как VJx выражает Wx в S, то \-^Шх{п, Ъ\ Но из (****) по правилу А4 можно получить \-s^i(n, k) zd Зхг(xz^kfkУУъ(п, хг)) и затем по МР и |— S3x3 (x3 ^ k & &2^"2(#, лс3)). Так как, согласно предположению, теория S непротиворечива, то в S не существует вывода формулы ~1 (***#). Поэтому, в силу (III), W2 (л, у) ложно для всякого натурального у. А так как УУъ выражает W2 в S, то \— s ~\ Ш^ (п, ]) для любого натурального / и, в частности, |— s"|2^2(^ б) &. ..& ~1^2(я, k). Поэтому, в силу пуелг ложения 3.8(а'), |— sWx^(xs^kiD "]^72(^, Хз))> и, наконец, по теореме о замене (следствие 2.21), |— s "] Злг3 (х* ^ А & V)^ {n} лг3)). Но тем 6 Э. Мендельсон
162 ГЛ. 3 ФОРМАЛЬНАЯ АРИФМЕТИКА самым мы доказали выводимость в S формулы, являющейся отрицанием ранее выведенной уже в S формулы, что противоречит непротиворечивости S. (2) Допустим (-s "1 (****), т. е. (-s "I Vx2 (2^i (п, дг2) id Зхг (х3< <: лг2 & Vji {п, хг))). Пусть г — гёделев номер какого-нибудь вывода ~] (****). В силу (III), истинно W2(fl, r), и потому |— sW'2{n1 r). В силу предположения о непротиворечивости теории S, не существует вывода в S формулы (****), т. е. согласно (II), Wt(fl, у) ложно для каждого натурального у. Поэтому |— s""]2^i(fl, /) для каждого натурального числа /. В частности, bl^ifr 0)&1Ш1(п, П& ... &1^i(«, г)- Отсюда, в силу предложения 3.8 (а'), получаем (О К **< г id П^Мл, **). Рассмотрим теперь следующий вывод: (1) Г^х% гипотеза (2) Ш2{пУ г) выводимость доказана выше (3) г<лг2&^2(Я г) (1), (2), тавтология (4) Зхг(хг^х2&К?ъ(п, хг)) (3), правило Е4 Из (1) — (4) с помощью теоремы дедукции получаем (И) [- s г ^ х* zd Эхг (х3 ^ х2 & %&ъ (п, лг2)). Согласно предположению 3.7(р), (ш) |-sx2<f \J Т^х* Из (i) — (iii) с помощью подходящей тавтологии получаем (я, х*) V Э*з (х3 ^ jc2 & К?* (п, х*)), а затем снова с помощью тавтологии и правил МР и Gen: (Я ДГ2) Итак, (—s (****). Но это противоречит предположениям о непротиворечивости S и о том, что \— s "1 (****). Россерово неразрешимое предложение (****) тоже имеет интересную стандартную интерпретацию. Согласно (II) и (HI), Wi(/z, x2) означает, что х2 есть гёделев номер некоторого вывода в S формулы (**##), a W2(n, x3) означает, что х3 есть гёделев номер некоторого вывода bS формулы "| (***#). Таким образом, (****) утверждает, что если существует вывод в S формулы (****), то существует, и даже с меньшим гёделевым номером, вывод в S формулы ~| (****). Согласно же предложению 3.32, если теория S непротиворечива, то формула (**#*)
§ 5 ТЕОРЕМА ГЁДЕЛЯ ДЛЯ ТЕОРИИ S 163 в ней невыводима; поэтому, если теория S непротиворечива, то формула (****) верна в стандартной интерпретации. Теорема Гёделя в форме Россера применима не только к теории S. Пусть К — любая теория первого порядка с теми же символами, что и теория S. Анализ проведенного только что доказательства позволяет сформулировать следующие достаточные условия применимости теоремы Гёделя в форме Россера к теории К: (a) Отношения Wi и W2 (см. предложение 3.27(17), в котором всюду в определениях следует заменить S на К) выразимы в К. (b) Имеется формула u^v такая, что (i) для всякой формулы о?£ (х) и для всякого натурального k: (ii) для всякого натурального числа k: \-Kx^k V k^x. Заметим, что если К есть теория первого порядка с равенством, то условие (i) может быть заменено условием (Г) f-K *<*:=>(.* = О У х=\ V ... V •* = *)• Условие (а), говорящее о выразимости в К отношений Wt и W2> выполнено, если эти отношения рекурсивны и если в К выразимо всякое рекурсивное отношение. Из доказательств предложений 3.25 — — 3.27 легко видеть, что Wi и W2 рекурсивны, если для теории К выполнено условие (d) из предложения 3.26, т. е. если свойство РгАхк «быть гёделевым номером собственной аксиомы теории К» рекурсивно (или, иными словами, если множество гёделевых номеров собственных аксиом теории К рекурсивно). Таким образом, мы приходим к следующему результату. Предложение 3.33. Пусть К есть теория первого порядка с теми же символами, что и теория S, и пусть, кроме того, К удовлетворяет следующим условиям: (1) всякое рекурсивное отношение выразимо в К, (2) множество гёделевых номеров собственных аксиом теории К рекурсивно, (3) выполнены указанные выше условия (b), (i) — (ii). Тогда для теории К справедлива теорема Гёделя в форме Россера, т. е. если теория К непротиворечива, то существует неразрешимое в этой теории предложение. (Заметим, что, согласно предложению 3.12, условие (1) выполняется, если в К представима каждая рекурсивная функция; кроме того, если К есть теория первого порядка с равенством, то условие (3) (b) (i) может быть заменено на (V).) Назовем теорию К рекурсивно аксиоматизируемой, если существует такая теория К' с тем же, что и у К, множеством теорем, что множество РгАхк, гёделевых номеров^собственных аксиом К' рекурсивно. С*
164 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА Следствие 3.34. Теорема Гёделя в форме Россера справедлива для каждого непротиворечивого рекурсивно аксиоматизируемого расширения теории S, т. е. для каждого такого расширения существует предложение у неразрешимое в нем. Доказательство. Так как все рекурсивные отношения выразимы в S, то они выразимы и во всяком расширении S. Точно так же и условия (i) — (ii), будучи выполнены в S, выполнены и во всяком расширении S. Поэтому, на основании предложения 3.33, теорема Гёделя в форме Россера применима к любому непротиворечивому рекурсивно аксиоматизируемому расширению теории S. По прочтении главы 5 читатель сможет оценить всё правдоподобие гипотезы, согласно которой точное понятие рекурсивного множества соответствует интуитивному понятию эффективно разрешимого множества. Гипотеза эта носит название тезиса Чёрча *). Для всякого, кто принимает этот тезис, следствие 3.34 утверждает, что теория S существенно неполна, т. е. что любое непротиворечивое эффективно аксиоматизированное расширение теории S имеет неразрешимые предложения. (Напомним-, что теория называется эффективно аксиоматизированной, если существует эффективная процедура, позволяющая для каждой формулы этой теории узнавать, является ли она ее аксиомой.) Упражнения 1. Доказать, что множество Тг гёделевых номеров всех формул теории S, истинных в стандартной модели, не является рекурсивным. (Указание. Рассмотреть теорию первого порядка К, являющуюся расширением теории S и имеющую Тг в качестве множества аксиом, и применить следствие 3.34.) 2. Опираясь на следствие 3.34, показать, что не существует рекурсивно аксиоматизируемой теории, имеющей Тг в качестве множества гёделевых номеров своих теорем. Пусть Neg(x) = 23*29*x*25. Тогда, если х есть гёделев номер формулы ©7^, то Neg (х) есть гёделев номер формулы "1 gs£. Функция Neg, очевидно, рекурсивна и, следовательно, представима в S некоторой формулой Neg(xh jc2). Ранее нами был введен предикат Pf (у, х), истинный тогда и только тогда, когда х есть гёделев номер некоторой формулы о/£ теории S, а у есть гёделев номер некоторого вывода о/1 в S. В силу предложения 3.26, предикат Pf примитивно рекурсивен, и потому, на основании следствия 3.24, выразим в S с помощью некоторой формулы Обозначим через Cons формулу 4x\4xq4xzVxi~\(Pf(Xb ( x&)&Neg(Xb x$). Содержательно, т. е. в соответствии со стандартной интерпретацией, Cons выражает невозможность вывода в S *) Позже на стр. 249 тезис Чёрча будет сформулирован следующим образом: всякая арифметическая функция является эффективно вычислимой тогда и только тогда, когда она есть рекурсивная функция. Мы оставляем читателю в качестве упражнения доказать эквивалентность этих двух форм тезиса Чёрча.
§ 5. ТЕОРЕМА ГЁДЕЛЯ ДЛЯ ТЕОРИЙ S 165 какой-либо формулы вместе с ее отрицанием и является истинной в том и только в том случае, когда теория S непротиворечива. Иными словами, формулу Cons можно интерпретировать как утверждение непротиворечивости теории S. Вспомним теперь, что, в соответствии со стандартной интерпретацией, гёделева неразрешимая формула (**) (см. стр. 159) содержательно выражает свою собственную невыводимо сть. Тогда формула Cons =э (**) содержательно утверждает, что если теория S непротиворечива, то формула (**) в ней невыводима. Но в этом и состоит первая часть теоремы Гёделя. Математические рассуждения, доказывающие теорему Гёделя, могут быть выражены и проведены средствами теории S, так что в результате оказывается возможным получить вывод формулы Cons id (**) в теории S. (Доказательство этого утверждения см. у Гильберта и Бернайса [1939], стр. 285—328; Фефер- мана [I960].) Итак, |— sCons id (**). Согласно теореме Гёделя, однако, если теория S непротиворечива, то формула (**) в ней невыводима. Отсюда следует, что если теория S непротиворечива, то в ней невыводима и формула Cons; иными словами, если теория непротиворечива, то в ней невыводима некоторая формула, содержательно утверждающая непротиворечивость теории S. Этот результат носит название второй теоремы Гёделя (см. Гёдель [1931]). Грубо говоря, эта теорема утверждает, что если теория S непротиворечива, то доказательство непротиворечивости теории не может быть проведено средствами самой теории S, т. е. всякое такое доказательство обязательно должно использовать невыразимые в теории S идеи или методы. Примерами тому могут служить доказательства непротиворечивости теории S, предложенные Генценом [1936], [1938b] и Шютте [1951] (см. Дополнение), в которых применяются понятия и методы (например, один фрагмент теории счетных порядковых чисел), очевидно, не формализуемые средствами теории S. Рассмотрим следующее утверждение гапа второй теоремы Гёделя: пусть Сопк есть арифметизация утверждения о том, что данная теория первого порядка К непротиворечива (при этом, предполагается, что теория К содержит все предметные константы теории S); тогда если теория К достаточно сильна и непротиворечива, то формула Сопк невыводима в К. Эта теорема в действительности применима и к многим более общим теориям (не обязательно первого порядка). Однако в сформулированной таким образом второй теореме Гёделя помимо неопределенности, заключенной в словах «достаточно сильна» (которым, впрочем, нетрудно придать точный смысл), неясен также способ построения Сопк. В этом последнем обстоятельстве таится опасность, ибо, как показал Феферман [I960] (следствие 5.10), существует некоторый приемлемый способ построения Соп^ при котором |— sCo#s. Итак, следует уточнить формулировку теоремы. Это было сделано Ф е ф е р м а- ном [I960] приблизительно следующим образом. В ходе доказательства
166 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА предложения 3.23 было показано, как для всякой примитивно рекурсивной функции f (хь ..., хп) строится формула osf (xh ..., хт у\ представляющая f в S. Полученные таким образом формулы q/£(xh ..., хт 0) назовем PR-формулами. Формулу &®, имеющую вид Зу! ... 3ykorf, где ^0 и отк есть какая-нибудь PR-формула, назовем RE-формулой. В частности, всякая PR-формула является RE-формулой. Предположим теперь, что некоторая формула &>£ (х) представляет теорию К, т. е. что совокупность аксиом теории К совпадает с множеством тех формул, чьи гёделевы номера удовлетворяют &#. Тогда следующим образом можно построить предикат выводимости Prf^(x, у) для теории К. Рассмотрим выражение zd (Fml ((у)г) & (LAx (fy)g) \J «* ((y)2) V V 3v3w(v<z&w<z&(TAP((y\y (y)w> (у)г) V Gen((y)v и обозначим через Рг/Л(х9 у) формулу, которая получится, если в этом выражении примитивно рекурсивные функции и предикаты заменить соответственно представляющими или выражающими их формулами (например, если ??(и, v) представляет Ш(у), то z<4h(y) заменяем на Svfeiy, v)&z<iv)). Формула Prf^(x, у) выражает в S предикат, истинный для пары (х, у) натуральных чисел тогда и только тогда, когда у есть гёделев номер вывода в теории К формулы с гёделевым номером х. (Определения отношений и функций Fml, lh, (y)v, Gen, MP см. на стр. 141, 142, 153, 154.) Теперь мы можем построить и формулу Ргл(х\ соответствующую понятию теоремы теории К' такой формулой будет формула ЗуРг/л(х, у). Наконец, через Сопл обозначим следующую формулу, выражающую непротиворечивость теории К: \/х {Fml (x) zd "1 Ртл (х) V Зу (Neg (лг, у) & "1 Ргл О/))). Одним из следствий работы Фефермана [I960] является следующий точный вариант второй теоремы Гёделя. Пусть К — непротиворечивое расширение теории S, Ki — любая теория, для которой К является расширением и которая сама служит расширением системы Q Робинсона*) (в частности, Ki может совпадать с S или К), Тк — множество гёделевых номеров теорем теории К, и пусть некоторая RE-формула о?£ (х) выражает Тк в Кь тогда не |— кСопл. (Условие, требующее, чтобы формула о^ (х) была RE-формулой, является здесь необходимым; это следует из существования такой формулы <0$(х), которая выражает Ts в S и для которой [— sCon^ (Феферман [1960], следствие 5.10).). *) См. ниже, стр. 169. (Прим. перев.)
§ 6 РЕКУРСИВНАЯ НЕРАЗРЕШИМОСТЬ. ТЕОРЕМА ТАРСКОГО 167 § 6, Рекурсивная неразрешимость. Теорема Тарского. Система Робинсона Пусть К — какая-нибудь теория первого порядка с равенством и с теми же символами, что и теория S. В предложении 3.27(18) была определена функция D(u), которая для всякого и, являющегося гбде- левым номером какой-нибудь формулы o^(xi) со свободной переменной x\t принимает значение, равное гёделеву номеру формулы &# (и). Так как D(u) = Sub(u, Num(u), 213), то функция D, очевидно, примитивно рекурсивна. Через Тк обозначим множество гёделевых номеров теорем теории К. Предложение 3.35. Если теория К непротиворечива, а функция D представила в К, то Тк невыразимо в К. Доказательство. Предположим, что функция D представима и множество Тк выразимо в теории К. Тогда существуют такие формулы & *ч) и вГ(*0» что (1) если D (*)=/, то к (2) |- Зхх*& (k, х& (3) если АеТк, то \-^ (k); (4) если ke£TK> то \ Рассмотрим формулу o/l (xi): Vjc2 {Sf (xh лг2) z> "1 <£Г (x2)). Пусть p — гёделев номер этой формулы. Рассмотрим формулу £ Пусть q — гёделев номер формулы от^(р). Тогда D(p) = q. Поэтому, в силу (1), [— K&(pf q). Одно из двух: либо |— к&#(р), либо не |— Ko^f(P)- Если не \-к&£(р), то ?€£тк и> согласно (4), \-Kld?~(q). С другой стороны, если \-Kerf(p), то pKVjCi(^(p, x2) zd П<£Г (х2)). Отсюда по правилу А4 получаем |— к(«^(я, q) zd ~] <&~ (^)). Однако |— к&(р, q). Следовательно, |— к"1<2^"(^). Итак, в обоих случаях \— КП<2^(^). Из \-K&(pf q) и (2) следует \-^{pt x^)ZDXi = q. Но так как |—к"| <£Г (q), то |— кх2 = ^=>П^ (х^). Следовательно, |— к & (р, х2) =d ZD~]dT(x%) и по правилу Gen \-к\[хъ(&(р, jc2) id ~| <£Г (лг2)), т. е. \-Kes£(p). Поэтому ^gTr и, согласно (3), |— к<^(q). Но так как, кроме того, доказано, что |— КП^(^), то теория К противоречива. Следствие 3.36. Если теория К непротиворечива и всякая рекурсивная функция представима в К, то Тк невыразимо в К и, следовательно, Тк нерекурсивно. Доказательство. Функция D примитивно рекурсивна, следовательно, представима в К. В силу предложения 3.35, множество Т^ невыразимо в К- Так же, как при доказательстве предложения 3.12,
168 ' ГЛ. 3 ФОРМАЛЬТТАЯ АРИФМЕТИКА можно показать, что характеристическая функция Стк множества TR непредставима в К. Следовательно, функция Стк нерекурсивна, а вместе с ней нерекурсивно и множество Тк. Мы будем говорить, что теория К рекурсивно неразрешима, если множество Тк нерекурсивно. Теорию К назовем существенно рекурсивно неразрешимой, если она сама и всякое ее непротиворечивое расширение рекурсивно неразрешимы. (Если мы принимаем тезис Чёрча, то рекурсивная неразрешимость эквивалентна эффективной неразрешимости, т. е. невозможности какой бы то ни было механической разрешающей процедуры для свойства быть теоремой. Невозможность такой механической процедуры означает, что для каждой данной формулы требуются специальные усилия изобретательности для того, чтобы решить вопрос, является ли эта формула теоремой.) Следствие 3.37. Если теория S непротиворечива, то она существенно рекурсивно неразрешима. Доказательство. Пусть К — произвольное непротиворечивое расширение теории S (в том числе, быть может, и сама теория S). Всякая рекурсивная функция представима в S, а следовательно, и в К. Поэтому, в силу следствия 3.36, Тк нерекурсивно. Следствие 3.38. (Теорема Тарского [1936].) Множество Тг гёделевых номеров формул теории S, истинных в стандартной интерпретации, не является арифметическим множеством, т. е. не существует такой формулы ok (x) теории S, чтобы Тг совпадало с множеством чисел k, для которых os£ (k) истинно в стандартной ин т ерпре т а ции. Доказательство. Пусть К — расширение теории S, аксиомами которого являются все те формулы, которые истинны в стандартной интерпретации. Тогда Тк = Тг. Поскольку теория К имеет стандартную модель, мы можем считать эту теорию непротиворечивой. Согласно следствию 3.36, Тг невыразимо в К, так как всякая рекурсивная функция представима в К. Но всякое отношение выразимо в К тогда и только тогда, когда оно является стандартной интерпретацией некоторой формулы теории S. Следовательно, Тг — множество не арифметическое. (Грубо говоря, этот результат означает, что понятие арифметической истины арифметически неопределимо.) Упражнения 1. (а) Для всякого п, являющегося гёделевым номером какой-нибудь формулы Q^f, определим С1 (п) как гёделев номер замыкания q/£\ в противном случае положим С1 (п) = п. С помощью предложения 3.25 показать, что функция С1 примитивно рекурсивна. (Ь) Показать, что всякая рекурсивно аксиоматизируемая и полная теория первого порядка К рекурсивно разрешима, т. е., иными словами, что для такой теории множество Тк рекурсивно. (Эквивалентное утверждение: если теория первого порядка К рекурсивно аксиоматизируема и рекурсивно неразрешима, то она неполна.) [Указание. Если п есть гёделев номер формулы &#> то
$6. РЕКУРСИВНАЯ НЕРАЗРЕШИМОСТЬ. ТЕОРЕМА ТАРСКОГО 169 существует вывод либо замыкания q^, либо отрицания замыкания ат£, т. е. Э.У (Pf (У, С1 (п)) V Р^ (У, 28*29*С1 (/z)*25) V 1 Fml (/г)). Обозначив последнюю формулу через ЭуВ (у, /г), замечаем, что, в соответствии с правилом (VI) для fi-оператора, функция р.у (В (у, п)) является рекурсивной. Поэтому рекурсивен и предикат Pf (jxy (В (у, /г)), С1 (/г)). Но этот предикат эквивалентен предикату С1 (п) е Тк, который в свою очередь эквивалентен предикату п е Тк. Это рассуждение показывает также, что всякая полная эффективно аксиоматизированная теория эффективно разрешима, т. е. что для всякой такой теории существует эффективный способ определять, является ли данная формула теоремой или нет.] (с) Если теория К непротиворечива и рекурсивно аксиоматизируема и если в ней представима каждая рекурсивная функция, то в К существуют предложения, неразрешимые в ней. 2. Показать, что если теория К не является рекурсивно аксиоматизируемой, то она рекурсивно неразрешима. Система Робинсона. Рассмотрим теорию первого порядка, имеющую те же символы, что и теория S, и следующее конечное число аксиом: (1) Х! = Хи (2) х1 = х*=>х* = х1; (3) Х1 = Хъ1 (4) xi = x2Z (5) xi = x%^ (6) х1 = х% z (7) х'1 = Хъ= (8) 0=74*0'; (9) (10) (И) (12) ^.0 = (13) (14) + (единственность остатка). Мы будем называть эту теорию теорией RR. (Система Q аксиом (1)— (13) предложена Рафаэлем Робинсоном [1950]. Аксиома (14) была добавлена с целью упрощения одного из нижеследующих выводов.) Очевидно, теория RR является подтеорией теории S, поскольку все аксиомы теории RR являются теоремами теории S. Кроме того, из предложения 2.26 и наличия аксиом (1)—(6) в теории RR следует, что теория RR является теорией с равенством. Предложение 3.39. Следующие формулы являются теоремами теории RR: (а) П^-Щ = п-{-т для любых натуральных п и т\ (Ь) п-т = п- т для любых натуральных п и т\ { для любых натуральных п и тг если n*fe
170 ГЛ 3. ФОРМАЛЬНАЯ АРИФМЕТИКА (d) x^nzDX = 0\/x=l V ... V х = п для любого натурального п\ (e) x^n\J п^х для любого натурального п. Доказательство. Утверждения (а) —(с) доказываются так же как соответствующие утверждения в предложении 3.6 (а). Утверждения (d) и (е) доказываются индукцией по п в метаязыке с применением аксиомы (9). (Напомним, что выражение х^у, по определению означает формулу х=у V Зг&фО&х + г=*у.) Упражнения 1. Показать, что теория RR является собственной подтеорией теории S. (Указание. Рассмотреть в качестве нормальной модели теории RR (но не теории S *)) множество всех полиномов с целыми коэффициентами и неотрицательным старшим коэффициентом. Формула 1у (х =у-\-у \/ х =у+у-}-\) ложна в этой модели, но выводима в теории S.) Заметим, что теория S не только не совпадает с теорией RR, но и вообще не является конечно аксиоматизируемой (т. е. не существует никакой теории с конечным числом собственных аксиом и с тем же, что у S, множеством теорем). Это утверждение было доказано Р ы л л ь-Н а р д зе в с к и м [1953] и Рабином [1961]. 2. Показать, что аксиома (14) невыводима из аксиом (1)—(13). (Указание. Пусть оо— некоторый объект, не являющийся натуральным числом, и пусть оо' = оо, oo + * = x + oo = oo для всех дс, оо- 0 = 0 .оо = 0 и oo»x = = х -00 = 00 для всех х Ф 0.) Предложение 3.40. Всякая рекурсивная функция представила в теории RR. Доказательство. Для исходных функций, а также для правил подстановки и (х-оператора остаются полностью в силе соответствующие рассуждения из доказательства предложения 3.23, проведенные там применительно к S. Что касается правила рекурсии, то, повторив внимательно соответствующее рассуждение в доказательстве иредложения 3.23, мы убедимся, что и оно остается в силе для теории RR, так как для введенной в предложении 3.21 формулы Bt из р (kb &2> k3) = m следует |— R^Bt(kb k^k^m) и, в силу аксиомы (14), |— RR Bt (u> v, x,y)& &Bt(u, v, х, ) Упражнение Провести во всех деталях доказательство предложения 3.40. В той мере, в какой мы согласны считать стандартную интерпретацию моделью для теории RR, следует признать и непротиворечивость теории RR. Впрочем, следуя идеям доказательства Бета [1959, § 84] или К лини [1952, § 79], можно построить более конструктивные доказательства непротиворечивости этой теории RR. *) См. упражнение 1 на стр. 131. (Прим. перев.)
§ 6. РЕКУРСИВНАЯ НЕРАЗРЕШИМОСТЬ. ТЕОРЕМА ТАРСКОГО П1 Предложение 3.41. (a) Теория RR существенно рекурсивно неразрешима. (b) Теория RR существенно рекурсивно неполна *). Доказательство. Утверждение (а) следует из предложения 3.40 и следствия 3.36. Утверждение (Ь) следует из предложений 3.33 и 3.40 (или из (а) и упражнения 1(Ь) на стр. 168). Эти результаты были уже нами ранее получены для теории S. Однако воспроизвести их для теории RR представляет интерес в связи с тем, что теория RR конечно аксиоматизируема. Можно даже доказать, что предложение 3.40, а следовательно, и предложение 3.41 справедливы также и для системы Q Робинсона (аксиомы (1)—(13)), однако доказательство этого факта (см. Тарский, Мостовский и Робинсон [1953], стр. 56—59) более сложно, чем для теории RR. Пусть Ki и Кз— какие-нибудь две теории первого порядка с одними и теми же символами. Теория Кз называется конечным расширением теории Кь если существуют множество А формул и конечное множество В формул такие, что (1) множество теорем теории Ki совпадает с множеством формул, выводимых из А, (2) множество теорем теории Кз совпадает с множеством формул, выводимых из A U В. Две теории Ki и Кз называются совместимыми, если непротиворечива теория Ki U Кз> т. е. теория, множество аксиом которой является объединением множеств аксиом теорий Ki и Кз- Предложение 3.42. Пусть Ki и Кз— какие-нибудь две теории первого порядка с теми же символами, что и теория S; тогда если теория К2 является конечным расширением теории Ki и рекурсивно неразрешима, то и теория Ki рекурсивно неразрешима. Доказательство. Пусть А — множество аксиом теории Ki и A U {<2^ь ..., о^п) — множество аксиом теории К2. Мы можем предполагать, что формулы о/£\, ..., о^п — замкнутые. Тогда, в силу теоремы дедукции, всякая формула <£% выводима в Кз тогда и только тогда, когда в Ki выводима формула (о/£\ &... & <2^Л) id SB. Пусть с — гёделев номер формулы orf\ &.. .&о^л./ Число b является гёделевым номером некоторой теоремы теории Кз тогда и только тогда, когда число 23*с*211*&#23 является гёделевым номером какой-то теоремы теории Кь т. е. предикат Ь е ТКз эквивалентен предикату 23*с*2п*£*2бе е TKl. Следовательно, если бы множество TKl было рекурсивно, то рекурсивным было бы и множество ТКз, что противоречит рекурсивной неразрешимости теории Кз. Предложение 3.43. Всякая теория первого порядка К, имеющая те же символы, что и теория S, и совместимая с теорией RR, рекурсивно неразрешима. Доказательство. Так как теории К и RR совместимы, то теория К U RR является непротиворечивым расширением теории RR. Поэтому, *) Здесь автор, по-видимому, имеет в виду, что RR не имеет непротиворечивых, рекурсивно аксиоматизируемых полных расширений. (Прим. ред.)
172 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА на основании предложения 3.41, теория KURR рекурсивно неразрешима. Но эта теория является конечным расширением теории К; следовательно, в силу предложения 3.42, теория К рекурсивно неразрешима/ Следствие 3.44. Всякая теория первого порядка К рекурсивно неразрешима, если она имеет те же символы, что и теория S, и если ее аксиомы истинны в стандартной модели. Доказательство. Стандартная интерпретация является моделью для теории К U RR> поэтому эта теория непротиворечива, а следовательно, теории К и RR совместимы. Теперь остается применить предложение 3.43. Следствие 3.45. Исчисление предикатов Ps, имеющее те же символы, что и теория S, рекурсивно неразрешимо. Доказательство. PS|JRR = RR. Следовательно, Ps и RR совместимы и потому, в силу предложения 3.43, Ps рекурсивно неразрешимо. Исчисление предикатов первого порядка, содержащее все предикатные буквы Лу, все функциональные буквы /у и все предметные константы ар назовем насыщенным исчислением предикатов (первого порядка) или исчислением PF. Исчисление предикатов первого порядка, содержащее все предикатные буквы, но не содержащее функциональных букв и предметных констант, назовем чистым исчислением предикатов (первого порядка) или исчислением PP. Лемма 3.46. Существует рекурсивная функция h такая, что если и есть гёделев номер некоторой формулы оД исчисления PF, то h(u) есть гёделев номер некоторой формулы os£T исчисления РР, причем формула orf* выводима в РР тогда и только тогда, когда формула ad выводима в PF. Доказательство. Пусть о/£ — формула исчисления PF. Сопоставим каждой функциональной букве /у из о/1 какую-нибудь предикатную букву Лг , не входящую в о?£, так, чтобы различным функциональным буквам соответствовали различные предикатные буквы, а каждой предметной константе Яу из о/£ сопоставим (соблюдая аналогичное условие) не входящую в о?£ предикатную букву А\. Пусть Яу— первая входящая в оД предметная константа и z — первая не входящая в о^ переменная. Определим ©^* как результат замены каждого вхождения Яу в os£ на z. Построим формулу о/£\. 3zAi (z) zd zd 3z (АЪ (z) & Q/f*)y где А% есть предикатная буква, сопоставленная предметной константе Яу. Нетрудно проверить (см. доказательство предложения 2.29), что формула о/£ логически общезначима тогда и только тогда, когда логически общезначима формула <&£\. Продолжим аналогичные преобразования до тех пор, пока не получим формулу SB без предметных констант, логически общезначимую одновременно с е^. Пусть теперь /? (th ..., tn) — самый левый в формуле Si терм такой, что термы th ... t tn не содержат функциональных букв, и пусть w — первая переменная, не входящая в <£$. Обозначим через SB* формулу,
§ 6. РЕКУРСИВНАЯ НЕРАЗРЕШИМОСТЬ ТЕОРЕМА ТАРСКОГО ПЗ получающуюся из формулы SB заменой в ней каждого вхождения терма /? (fu •..» in) переменной w, и построим формулу SB{. где Л? + 1— предикатная буква, поставленная в соответствие функциональной букве /?. И в этом случае легко убедиться в том, что формула $В± логически общезначима тогда и только тогда, когда логически общезначима формула SB, Применим теперь аналогичное преобразование к SBX и т. д., пока не придем к некоторой формуле о^\ которая уже не содержит ни предметных констант, ни функциональных букв и, следовательно, является формулой исчисления PP. Формула ©^' логически общезначима тогда и только тогда, когда логически общезначима формула <з^. На основании теоремы Гёделя о полноте (следствие 2.14), формула orf логически общезначима тогда и только тогда, когда |—PF<2^> а формула orf' логически общезначима тогда и только тогда, когда |— ррет^'. Следовательно, \-v¥qs£ тогда и только тогда, когда |— рр©^'. Построим теперь функцию h: если и не является гёделевым номером никакой формулы исчисления PF, то положим h(u) = 0, если же и есть гёделев номер некоторой формулы os£ исчисления PF, то пусть h(u) будет гёделевым номером формулы о^\ Функция h, очевидно, эффективно вычислима; доказательство того, что она рекурсивна, мы оставляем в качестве упражнения на долю усердного читателя. Предложение 3.47 (Теорема Чёрча [1936а].) Исчисления PF и РР рекурсивно неразрешимы. Доказательство. (1)По теореме Гёделя о полноте всякая формула &# исчисления Ps выводима в Ps тогда и только тогда, когда она логически общезначима, и эта же формула от£ выводима в PF тогда и только тогда, когда она логически общезначима. Отсюда \- р о?£ тогда и только тогда, когда \—р¥&#. Заметим, что множество Ftnlp гёделевых номеров формул исчисления Ps рекурсивно. Пусть Tps и TPF обозначают соответственно множества гёделевых номеров теорем исчислений Ps и PF. Тогда Тр8 = ТРр П Fmlps, и из рекурсив- ности множества Трр следовала бы, в противоречие со следствием 3.45, рекурсивность множества Tps. Таким образом, исчисление PF рекурсивно неразрешимо. (2) Согласно лемме 3.46, и е= ТРр тогда и только тогда, когда h (u) e TRP, где h — некоторая рекурсивная функция. Поэтому, если множество Трр рекурсивно, то рекурсивно и множество TPF, что противоречит предыдущему пункту (1). Таким образом, множество . ТРР нерекурсивно, т. е. исчисление РР рекурсивно неразрешимо. Если мы признаём тезис Чёрча, то слова «рекурсивная неразрешимость» можно всюду заменить на «эффективная неразрешимость».
П4 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА В частности, предложение 3.47 утверждает, что не существует никакой эффективной разрешающей процедуры ни для чистого исчисления предикатов РР, ни для насыщенного исчисления предикатов PF. Отсюда следует и невозможность какого-либо эффективного способа узнавать, является ли данная формула логически общезначимой. Упражнение Показать, что в противовес теореме Чёрча чистое исчисление одноместных предикатов эффективно разрешимо. Под чистым исчислением одноместных предикатов мы здесь понимаем чистое исчисление предикатов, содержащее только одноместные предикатные буквы. [Указание. Пусть Ви ..., Bk — все, и притом без повторений, предикатные буквы, входящие в данную формулу o/g. Тогда формула q/£ общезначима в том и только в том случае, когда она истинна в каждой интерпретации, содержащей не более 2k элементов. В самом деле, предположим, что формула ofg истинна в каждой интерпретации с не более чем 2k элементами, и пусть М — произвольная интерпретация. Всякие два элемента b и с из области D интерпретации М назовем эквивалентными, если истинностные значения Bt (b), B2 (b), ..., £& (b) в М соответственно те же самые, что и у В^ (с), B2(c)t ..., В^(с). Введенное таким образом отношение эквивалентности разбивает D на классы эквивалентности, число которых не превышает 2k. Рассмотрим новую интерпретацию М' формулы Q/£ с областью, имеющей своими элементами эти классы эквивалентности, на которых очевидным образом определяются значения для Blt ... , В^. Индукцией по построению формулы qs£ легко доказать, что формула q^ истинна в М тогда и только тогда, когда она истинна в М\ Так как формула Q/f истинна в М', то она истинна и в М. Итак, формула истинна во всякой интерпретации и, следовательно, в силу следствия 2.14, выводима. К этому остается добавить, что истинность формулы Q/g в произвольной интерпретации, имеющей не более чем 2k элементов, пр@веряется эффективно.] Содержащийся в этом последнем упражнении результат является в некотором смысле наилучшим из возможных. В самом деле, по теореме Кальмара [1936], существует эффективная процедура, позволяющая по каждой формуле о^ чистого исчисления предикатов построить другую формулу о^* чистого исчисления предикатов, которая содержит единственную и притом двуместную предикатную букву и которая общезначима тогда и только тогда, когда общезначима формула <2т^. (Другое доказательство этого утверждения см. Чёрч [1956, § 47].) Отсюда, на основании теоремы Чёрча, следует, что не существует эффективной разрешающей процедуры для свойства общезначимости (или выводимости) формул, содержащих лишь двуместные предикатные буквы. Упражнения (Тарский, Мостовский и Робинсон [1953],!.) 1. Пусть К* — непротиворечивая теория первого порядка, Kt — существенно рекурсивно неразрешимая теория, всякая теорема которой является также и теоремой теории К*, и пусть понятие FmlKi (x) рекурсивно. Показать, что тогда теория К* существенно рекурсивно неразрешима.
§ 6 РЕКУРСИВНАЯ НЕРАЗРЕШИМОСТЬ ТЕОРЕМА ТАРСКОГО 175 2. Пусть К — теория первого порядка с равенством. Если предикатная буква Лу, функциональная буква fj и предметная константа а;. не являются символами теории К, то под допустимыми определениями Ар fj и ау- в К мы будем понимать соответственно выражения вида (a) V*t ... Wxn(A](xv ... , xj = &e{xv ... , хп)); (b) Vxx ... 4xJ*y(fj(xv\.., xn)=y = &(xv ..., xn, у)); (c)Vy(af=y=E<e'(y)), где Qsf, <£B, ?f — формулы теории К, причем последние две формулы таковы, что |-kv*i *•• VxiP\y£fc(xv ... , хп, у) и 1-кЭ^^СУ). Доказать, что если теория К непротиворечива, то добавление к К в качестве новых аксиом любых допустимых определений приводит к непротиворечивой теории К', которая рекурсивно неразрешима тогда и только тогда, когда рекурсивно неразрешима теория К. (Применить предложение 2.29.) 3. Назовем нелогической константой всякую предикатную или функциональную букву или предмс1ную константу. Пусть Ki — теория первого порядка с равенством и с конечным числом нелогических констант. Будем говорить, что теория Ki интерпретируема в теории первого порядка К с равенством, если всякой нелогической константе теории Ki, которая не является нелогической константой теории К, можно сопоставить допустимое определение в теории К таким образом, чтобы всякая аксиома (и, следовательно, всякая теорема) теории Ki оказалась выводимой в теории К*, получающейся из теории К добавлением к ней всех этих допустимых определений в качестве новых аксиом. Заметим, что если теория Ki интерпретируема в теории К, то она интерпретируема во всяком расширении теории К. Если теория Ki интерпретируема в непротиворечивой теории К и если Ki существенно рекурсивно неразрешима, то такова же и теория К. (Указание. В силу упражнения 2, теория К* непротиворечива, следовательно, в силу упражнения 1, К* существенно рекурсивно неразрешима. Таким образом, теория К рекурсивно неразрешима на основании упражнения 2.) 4. Пусть К — теория первого порядка с равенством, Ah — одноместная предикатная буква, не принадлежащая теории К, и q/£ — замкнутая формула. Заменим каждую, начиная с наименьших, подформулу в ofg вида Vx<£/$ (x) на (х) zd S3 (х)). Полученную в результате формулу q/c^ j назовем реля- А1- тивизацией формулы g/g посредством буквы А*-. Пусть К J — теория, аксиомами которой служат релятивизации посредством Л*, замыканий всех собственных аксиом теории К. (а) Теория К J интерпретируема в К. (Указание. Взять формулу Vx (Л j (х) = х = л:) в качестве допустимого определения для Л*..) А1- (Ь) Теория К J непротиворечива тогда и только тогда, когда непротиворе- чива теория К. (с) Теория К ^ существенно рекурсивно неразрешима одновременно с теорией К (Тарский, Мостовский и Робинсон [1953], стр. 28). 5. Теория К называется относительно интерпретируемой в теории К', если существует такая предикатная буква Л}, не принадлежащая теории К, что теория К ; интерпретируема в теории К'. Если теория К относительно интерпретируема в теории К' и существенно рекурсивно неразрешима, то и теория К' существенно рекурсивно неразрешима. (Применить упражнения 3 и 4.)
176 ГЛ. 3. ФОРМАЛЬНАЯ АРИФМЕТИКА 6. Всякую теорию первого порядка К, в которой относительно интерпретируема теория RR, назовем достаточно сальной. Доказать, что всякая достаточно сильная непротиворечивая теория К существенно рекурсивно неразрешима, а если, кроме того, теория К рекурсивно аксиоматизируема, то она неполна. (Применить предложение 3.41(а) на стр. 170 и упражнение 1(Ь) на стр. 168.) Грубо говоря, теория К является достаточно сильной, если понятия натурального числа, 0, 1, сложения и умножения «определимы» в К таким образом, чтобы аксиомы теории RR (релятивизованные посредством понятия «натуральное число» в К) оказывались выводимыми. Очевидно, всякая теория, адекватная современной математике, должна быть достаточно сильной, поэтому если такая теория непротиворечива, то она рекурсивно неразрешима, а если она рекурсивно аксиоматизируема, то неполна. Для гого, кто принимает тезис Чёрча, это означает, что всякая непротиворечивая достаточно сильная математическая теория эффективно неразрешима, а если она эффективно аксиоматизируема, то она будет неполна. (Аналогичные результаты верны также и для теорий высших порядков, см., например, Гёдель [1931], Хазенъегер и Ш о л ь ц [1961], §§237—238). Все это, по-видимому, лишает нас всякой надежды на полную и непротиворечивую аксиоматизацию математики.
Глава 4 Аксиоматическая теория множеств § 1. Система аксиом ~ Значение математической логики в нашем столетии сильно возросло. Главной причиной этого явилось открытие парадоксов теории множеств и необходимость пересмотра противоречивой интуитивной теории множеств. Было предложено много различных аксиоматических теорий для обоснования теории множеств, но как бы они не отличались друг от друга своими внешними чертами, общее для всех них содержание составляют те фундаментальные теоремы, на которые в своей повседневной работе опираются математики. Выбор той или иной из имеющихся теорий является в основном делом вкуса; мы же не предъявляем к системе, которой будем пользоваться, никаких требований, кроме того, чтобы она служила достаточной основой для построения современной математики. Мы опишем теорию первого порядка NBG, которая в основном является системой того же типа, • что и система, предложенная первоначально фон Нейманом [1925], [1928], а затем тщательно пересмотренная и упрощенная Р. Робинсоном [1937], Бернайсом [1937—1954] и Гёделем [1940]. (Мы будем в основном следовать монографии Гёделя, хотя и с некоторыми важными отклонениями.) Теория NBG имеет единственную предикатную букву А\ и не имеет ни одной функциональной буквы или предметной константы. Чтобы быть ближе к обозначениям Бернайса [1937—1954] и Гёделя [1940], мы будем употреблять в качестве переменных вместо хъ хъ ... прописные латинские буквы Х\у Х% ... (Как обычно, мы используем буквы X, У, Z, ... для обозначения произвольных переменных.) Мы введем также сокращенные обозначения X ^ У для А\ (X, У) и X ф У для 1 А\ (X, У). Содержательно знак е понимается как символ отношения принадлежности. Следующим образом определим равенство: Определение. Х= У служит сокращением для формулы VZ(Z(=X = Z<= У). Таким образом, два объекта равны тогда и только тогда, когда они состоят из одних и тех же элементов. Определение. X^ У служит сокращением для формулы VZ(Z е X zd Z <= У) (включение). Определение. Xа У служит сокращением для Х^ У&Хф У [собственное включение),
178 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Из этих определений легко следует Предложение 4.1. (a) y-X=Y=(X<= Y&YczX); (b) \-X = X; (c) y-X=Y=> Y=X; (d) 1- X=Y=)(Y=ZidX = Z); (e) \-X= Yzd(ZseXzdZee Y).\ Мы теперь приступим к перечислению собственных аксиом теории NBG, перемежая формулировки самих аксиом различными следствиями из них и некоторыми дополнительными определениями. Предварительно, однако, отметим, что в той «интерпретации», которая здесь подразумевается, значениями переменных являются классы. Классы — это совокупности, соответствующие некоторым, однако отнюдь не всем, свойствам *). (Эта «интерпретация» столь же неточна, как и понятия «совокупность», «свойство» и т. д.) Назовем класс множеством, если он является элементом какого- нибудь класса. Класс, не являющийся множеством, назовем собственным классом. Определение. М(Х) служит сокращением для BK^g F) (X есть множество). Определение. Рг(Х) служит сокращением для ~]М(Х) (X есть собственный класс). В дальнейшем мы увидим, что обычные способы вывода парадоксов приводят теперь уже не к противоречию, а всего лишь к результату, состоящему в том, что некоторые классы не являются множествами. Множества предназначены быть теми надежными, удобными классами, которыми математики пользуются в своей повседневной деятельности; в то время как собственные классы мыслятся как чудовищно необъятные собрания, которые, если позволить им быть множествами (т. е. быть элементами других классов), порождают противоречия. Упражнение И Ге=Х Система NBG задумана как теория, трактующая о классах, а не о предметах. Мотивом в пользу этого послужило то обстоятельство, что математика не нуждается в объектах, не являющихся классами, вроде коров или молекул. Все математические объекты и отношения могут быть выражены в терминах одних только классов. Если же ради при- *) Те свойства, которые фактически определяют классы, будут частично указаны в аксиомах. Эти аксиомы обеспечивают нам существование необходимых в математике классов и являются, как мы надеемся, достаточно скромными, чтобы из них нельзя было вывести противоречие.
§ I. СИСТЕМА АКСИОМ 179 ложений в других науках возникает необходимость привлечения «неклассов», то незначительная модификация системы NBG позволяет применить ее равным образом как к классам, так и к «неклассам» (Мостовский [1939]). Мы введем строчные латинские буквы xh х% ... в качестве специальных, ограниченных множествами, переменных. Иными словами, ^Ххо^{Х\) будет служить сокращением для VX(M(X) и> о/£ (Х)\ что содержательно имеет следующий смысл: «о^ истинно для всех множеств», и Зх\ qs£ (X\) будет служить сокращением для ЗХ (М (X) & о?£ (X)), что содержательно имеет смысл: «от£ истинно для некоторого множества». Заметим, что употребленная в этом определении переменная X должна быть отличной от переменных, входящих в о^ (х\). (Как и обычно, буквы х, у> z,... будут употребляться для обозначения произвольных переменных для множеств.) Пример. Выражение 4XVx3y3Zo?£ (X, х, у, Z) служит сокращением для 4XVXj(M(Xj)zd3Y{M(Y)&3Zg7#(X, Xp К, Z))). Упражнение \- X=Ye=Vz(ze=X~z<=Y). Аксиома Т. (Аксиома объемности.) X=Yzd(X&Z=Yе Z). Предложение 4.2. Система NBG является теорией первого порядка с равенством. Доказательство. Предложение 4.1, аксиома Т и замечание на стр. 90 о теориях, в которых равенство может быть определено. Упражнение Аксиома Р. (Аксиома пары.) УхУуЭг Vm (и & z = u = x \/ и = у)} т. е. для любых множеств х и у существует множество z такое, что х и у являются единственными его элементами. Упражнения 1. \-WxVy^iZ Vh (иег &е и = х V и=у), т. е. для любых двух множеств х и у существует единственное множество z, называемое неупорядоченной парой элементов х и у, элементами которого являются х и у и только они. 2. VX(M(X)3(X)) Аксиома N. (Аксиома пустого множества.) Зх У/у (у ф х\ т. е. существует множество, не содержащее никаких элементов. Из аксиомы N и аксиомы объемности следует, что существует лишь единственное множество, не содержащее никаких элементов, т. е.
180 ГЛ. 4< АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (— HiX Vy (у ф х). Поэтому мы можем ввести предметную константу 0, подчинив ее следующему условию. Определение. У у (у ф 0). Так как выполнено условие единственности для неупорядоченной пары, то мы можем ввести новую функциональную букву g(x, у) для обозначения неупорядоченной пары х и у. Впрочем вместо g(x, у) мы будем писать {х, у}. Заметим, что можно однозначно определить пару {X, У) для любых двух классов X и У, а не только для множеств х и у. Положим {Ху К} = 0, если один из классов X, У не является множеством. Можно доказать, что e=Z=u = X\Ju=Y)) V V(C\M(X)y~]M(Y))&Z=0)). Этим оправдано введение пары {X, У}: Определение. (M(X)&M(Y)& V и (и е= {X, Г} = = и = Х\/и=У))\/(аМ(Х)\/-\М(У))&{Х, У} = 0). Можно доказать, что |— NBr Vx \fy \/u(u e {x, y} = u = x\Ju—y) и В связи с этим определением читателю следует вернуться к § 9 гл. 2 и, в частности, к предложению 2.29, которое гарантирует нам, что введение новых предметных констант и функциональных букв, таких как 0 и {X, У}, ничего существенно нового к теории NBG не добавляет. Упражнения 1. Н {X, У} = {У, X}. (В дальнейшем на протяжении настоящей главы индекс NBG в записи !-^во опускается.) 2. Определим {X} как {X, X}. Тогда \- Vx Vy ({х} = {у] 1эх=у). Определение. (Ху У) = {{Х}> {X, У}}. (X, У) называется упо- рядоченной парой классов X и У. Никакого внутреннего интуитивного смысла это определение не имеет. Оно является лишь некоторым удобным способом (его предложил Ку- ратовский) определить упорядоченные пары таким образом, чтобы можно было доказать следующее предложение, выражающее характеристическое свойство упорядоченных пар. Предложение 4.3. f- Vjc Vy У/и Vi>((х, у) = (и, v) zd x = u&y==v). Доказательство. Пусть (х, у) = (и, v). Это значит, что {{*}> {*> У}} = {{"}> К v}}- Так как {■*} ^ {{*}> {х> У}}> т0 {*} е {{«Ь {tt, v}}. Поэтому {лг} = {м} или {дг} = {и, v}. В обоих случаях х — и. С другой стороны, {и, v} e {{м}, {и, v}} и, следовательно, {и, v) e е {{х)> \х> У}}- Отсюда {м, ту} = {х} или {и, v} = {x, у}. Подобным же образом, {х, у} = {и} или {х, у} = {и, v}. Если {и, v} = {х} и {х, у} = а»{и}, то x = u=y — v; в противном случае {и, v} = {x, у] и, еле-
* !. СИСТЕМА АКСИОМ 181 дователыю, {и, v}~{u, у). Если при этом v^^u, то y~vt если же v = а, то тоже у — v. Итак, в любом случае, y — v. Мы теперь обобщим понятие упорядоченной пары до понятия упорядоченной #-ки. Определение Так, например, <А, У, Z> = «A, Y), Z) и (X, К, Z, t/> = Нетрудно доказать следующее обобщение предложения 4.3: \- Ухг... VxnVyi... \/>я«Xi, ..., дгл) = <ву1, ...,^>id Z) ^ = j/x &... & xn w*yn). Аксиомы существования классов. Эти аксиомы утверждают, что для некоторых свойств, выраженных формулами, существуют соответствующие классы всех множеств, обладающих этими свойствами. Аксиома В1. ЗХ Vw Vt; ((m, v) e X ^ и е v) (^-отношение). Аксиома В2. VXVK3ZV«(aeZs«sX&ae Г) (/) Аксиома ВЗ. VX3Z Vh(h e Zzs=u ф X) {дополнение). Аксиома В4. VA'3Z Vm («eZs3^ «м, г^> е X)) {область определения). Аксиома В5. УХ 3Z Vm Vxr «и, ^)gZsmg4 Аксиома В6. VX 3Z Vm Vt; V-ш «м, v,w)^Zz= (v, w, и) е ^Y). Аксиома В7. VX3Z Vm Vt; Vw((u, v,w)^Z= (ut w, v) e A^). С помощью аксиом B2—В4 можно доказать К), f- VX31Z\fu{u<==Z==usE X), iZ Vw (и e Z в Зг; «и, t;> e= Эти результаты оправдывают введение новых функциональных букв п,-, &. Определения Vm (м е X П КэмеА'&ме У) {пересечение классов X и Y). Vm(heXsk^ X) {дополнение к классу X). Vw (м е ^(Х)^ Эх; ((и, г;) е А")) {область определения класса X). Х[) Y=={X (} Y) {объединение классов X и У). V = 0 _ (универсальный класс).
182 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Упражнения 1. 2. t- jl H H Vtt( л (1 (л П u<=XUY=ut=X У=УПХ Г)Пг = ХП(У(\ X()X=X X[\ хп X{)< xu 0 = 0 v=x (K(jz)=(xnm Y=X(\y V 2) H 1- 1- H H H 1- (XUY)U X[)X= xuo=. хик= ATU(Kn. y\ 1 1 / — Y Z X X V Z) X []X = X[](Y[jZ) ——- / V1 1 \f\ о / Y1 1 7^ = (Л U / / 11 \A\jZ.) U Y 3. (a) h- VX3ZVwVt;((tt, t>)eZ = (t>, fl)e4 (Указание. Применить последовательно аксиомы В5, В7, Вб, В4.) (b) h-VX3ZVttVt;V^((tt, v, t»)sZ=(a, да>еХ). (Указание. При- менить В5 и В7.) (c) {-VXIZVvVx^.. Vxn((xu...,xn, v)e=Z = (xu..., xn)<=X). (Применить В5.) (d) \-VX3ZVvl...VvmVxl...Vxn((xl, ..., лгл,^, ..., »m)sZ = (^, ... ...,хп)&Х). (Указание. Итерация (с).) (e) Н VX3ZVvl...VvmVxl...Vxn((xl, ... , *„_!, trlf ... , vm, xw)gZ = ^ (^i,..., xn) gX). (Указание. При т = 1 из (b) подстановкой (лгц ..., ^_i) вместо и и хп вместо w, а затем общий случай — итерацией.) (f) \-VX'BZVxVv1...Vvm((vl, ..., vm, ^eZs^X). (Указание. Использовать В5 и пункт (а).) (g) t-VX3ZVxi...Vxn((xl, ..., xn)e=ZEs3y((xu ..., хя, у)<=Х)). (Указание. Следует из В4 подстановкой (xlt ... , хп) вместо и и у вместо v.) (h) H VXIZVuVvVw ((v, и, w)<=Z ~ (и, w)&AQ. (Указание. Подставить (м, w) вместо и в аксиому В5 и применить аксиому В6.) (i) H VyY3ZV^ ... VvkVuVw((vu ... , t>ft, и, o;)g=Z = (w, ку)е=Х). (Указание. Подставить (»1э ... , v^) вместо v в (h).) Мы теперь можем доказать некоторую общую теорему о существовании классов. Предложение 4.4. Пусть у(Хи •••> Хт Yiy ..., Ym) — формула, переменные которой берутся лишь из числа Хъ ..., Хт Yh... ..., Ym. Назовем такую формулу предикативной, если в ней связанными являются только переменные для множеств (т. е. если она может быть приведена к такому виду с помощью принятых сокращений). Для всякой предикативной формулы ср (Xt) ..., Хт Уъ • • • > Ym) \-3Z4xi... Vxn((xh ..., xn)<=Z=y(xb ..., хф Yh ..., Ym)). Доказательство. Мы можем ограничиться рассмотрением только таких формул ср, которые не содержат подформул вида Yt e W, так как всякая такая подформула может быть заменена на Зх (х = Yt & х е W)9 что в свою очередь эквивалентно формуле 3x(4z{z e= x = z e КЛ&
§ 1. СИСТЕМА АКСИОМ 183 W). Можно также предполагать, что в ср не содержатся подформулы вида X ^ X, которые могут быть заменены на Эн (и = ^4й£ X), последнее же эквивалентно Зи (\fz (z ^u = z e Х)&и e X). Доказательство проведем теперь индукцией по числу k логических связок и кванторов, входящих в формулу ср (записанную с ограниченными переменными для множеств). 1. Пусть £ = 0. Формула ср имеет вид Xi e Хр или Xj e х^ или хг е К/, где \^i<Cj^n. В первом случае, по аксиоме В1, существует некоторый класс W\ такой, что Vxtfxj ((xh x>) e^, = xt <= xj). Во втором случае, по той же аксиоме, существует класс W% такой, что УхЯх; ((хр xt) e=W<i = Xj<= хд, и тогда, в силу упражнения 3 (а) на стр. 182, существует класс №3 такой, что VxiVxj ((xh xj) е= щ = xj е= хд. Итак, в любом из первых двух случаев существует класс W такой, что VxiVxj((Xi, Xj)<= И7=ср(Агь ..., хт Yh ..., Ym)). Тогда, заменив в упражнении 3 (i) на стр. 182 X на W, получим, что существует некоторый класс Zi такой, что VXi ... VXi-iiXi1Xj({xh ... , ATj_b Xh Xj) EZi = = ср(лп, ..., xn, Yh ..., Ym)). Далее, на основании упражнения 3 (е) там же при Z\ = X, заключаем, что существует класс Z% такой, что Vxi... Vxi\/xi+1.. .Vxy ((xi, ..., Xj) e Z2 = cp (xh ..., xm Yl9 ..., Уш)). Наконец, применяя упражнение 3 (d) там же при Z% = X, получаем, что существует класс Z такой, что .., xn)eZ=<p(xh ..., xni Yh ..., Ут)). Для остающегося случая Xi е К; теорема следует из упражнений 3 (f) и 3(d). 2. Предположим, что теорема доказана для любого k < s и что ср содержит 5 логических связок и кванторов. (а) ср есть ~1 ф. По индуктивному предположению, существует класс W такой, что V^!... Vxn((xh ..., хп)ее W=ty(xh ..., хПУ Yh ..., Km)). Теперь остается положить Z= W. (b) cp есть ф id 0. По индуктивному предположению, существуют классы Z\ и Z2 такие, что .., дгф Кь ..., Ym))
184 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ И VV( .., хт Уъ ..., Ут)\ Искомым классом Z в этом случае будет класс (Z\ f| Z2). (с) ср есть \Лхгф. По индуктивному предположению, существует класс W такой, что ..., хю х)<= W = ty(xh ..., лгш лг, Уь ..., У,л)). Применим сперва упражнение 3(g) при Х = W и получим класс Z\ такой, что ..., хп) е Zi = Злг ~| ф (лгь ..., хЛ, х, Уь ..., Ут)). Теперь положим окончательно Z=Zi, замечая, что У/х ф эквивалентно ~] Элг "1 ф. Примеры. 1. Пусть ср(X, Yh K2) есть формула 3u3v(X = = (м, d)&«g У1&т;е Уд). Здесь кванторы связывают только переменные для множеств. Поэтому, в силу теоремы о существовании классов, |— 3ZVjc(jce Z=3ii3v(x—(u, v)&u^l Ki&fe ¥%)), а на основании аксиомы объемности, \-3iZVx(x ^ Z=3u3v(x=(u, d)4«g Ki& & v e У2)). Поэтому возможно следующее определение, вводящее новую функциональную букву X: Определение. Vx(jceKiX Y<i=3ii3v(х = {и, v)ku^.Ylk, & v е Уз)- {Декартово произведение классов Ух и У2.) Определения. .X2 обозначает X X X (в частности, V8 обозначает класс всех упорядоченных пар). Хп обозначает Хп~х X X (в частности, V71 обозначает класс всех упорядоченных я-ок). Rel(X) служит сокращением для Хд!/2(Х есть отношение). 2. Пусть ср(Х, У) обозначает X <^ У. По теореме о существовании классов и на основании аксиомы объемности, [— 3iZVjc(a; e Z=x ^ У). Таким образом, существует класс Z, элементами которого являются все подмножества класса У. Определение. Vjc(л:е ^(У) = хе У). ((3s(У): яласс всгл; /шд- множеств класса У.) 3. Рассмотрим в качестве <р(Х, У) формулу Эх; (X ^ v & х; е У). По теореме о существовании классов и на основании аксиомы объемности, (— 3\Z4x(^GZ=3t)(xEi>&TiE У)), т. е. существует единственный класс Z, элементами которого являются все элементы элементов класса У и только они. Определение. Чх(х^ \J(Y) = 3v(xez vkv& У)). (1)(У): объединение всех элементов класса У.) 4. Пусть <р(Х) есть Зн(Лг=(и, к)). По теореме о существовании классов и на основании аксиомы объемности, существует единственный класс Z такой, что Ух(х& Z^3u(x = (su, и))).
§ Т. СИСТЕМА АКСИОМ 185 Определение. Vx(xe 1 = Эи(х = (и, и))). (Отношение тождества.) Следствие 4.5. Для всякой предикативной формулы y(Xh ... • • • > **т М» • • • > *т) = <?(xh ..., *де Кь ..., Ym)). Доказательство. В силу предложения 4.4, существует класс Z, для которого Vx!... Vxrt «Хь ..., хп) е= Z= ср (хь ..., хт Уь ..., Уш)). Очевидно, искомым классом W является класс W=Z [\ Vn; его единственность вытекает из аксиомы объемности. Определение. Для всякой предикативной формулы ср (Хъ ..., Хп, Уи • • • > Ут) через Xi... хлср (^, ..., хп, Yh ..., Ут) обозначается класс всех п-ок (хь ..., хп), удовлетворяющих формуле у(Хъ ..., хт Уъ ... ..., Кт), т. е. Уи(ие^1...^я(р(дгь ... , хп, Уъ ..., yj = 3^i... ...Зд:л(и = <дгь ..., *я)&<р(лгь ..., хПУ Yh ..., Ут))). Следствие 4.5 оправдывает такое определение. В частности, при п=\ получим |-Vh (и €=£?(.*, Уъ ..., Ут) = У(и, Уъ ..., KJ)*). Примеры. 1. Пусть ср есть (х% хх) е У. Обозначим х^х* ((х* Х\)^ е У) сокращенно через К, тогда \- У ^ V2 & VjciVat2 ((^ь лг2) е К = ^'(лг2, -^i) s К)- Назовем У обратным отношением класса У, 2. Пусть ср есть Зг;((г;, х) е К)- Обозначим через е^(У) выражение л:(3г;((г;, лт> е У)). Тогда |-Va (и е е# ( У) = Зг> «г>, и) е У)> Класс называется областью значений класса К. Очевидно, \-<М(У) = Заметим, что аксиомы В1—В7 являются частными случаями теоремы о существовании классов, т. е. предложения 4.4. Иными словами, вместо того, чтобы выдвигать предложение 4.4 в качестве схемы аксиом, можно с тем же результатом ограничиться лишь некоторым конечным числом его частных случаев. Вместе с тем, хотя предложение 4.4 и позволяет доказывать существование большого числа самых разнообразных классов, нам, однако, ничего еще не известно о существовании каких-либо множеств, кроме самых простых множеств таких, как 0, {0}, {0, {0}}, {{0}} и т. д. Чтобы обеспечить существование множеств более сложной структуры, мы введем дальнейшие аксиомы. Аксиома U. (Аксиома объединения.) УхЗуУи(ii^y = 3v(u^v&v^ x)). Эта аксиома утверждает, что объединение U (х) всех элементов множества х (см. пример 3 на стр. 184) является также множеством, т. е. f- Vjc (M (U (х))). Множество U (х) обозначают также через U u *) Иногда вместо хх... хпу (хи ..., хП} Ylt ... , Ут) применяют запись ^i — » Хп)\ч(х» •••> хП9 У19 ..., Ym)}.
186 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Упражнения 1. Показать, что Ь- VxVy (U ({л:, у})=х\}у) и, следовательно, \-VxVy(M(x[)y)). 2. (a)b-U(O) = O. (b)HU({0}) = 0. (с) (d)V^(U(()) {}) ()^(((,y)) {,^}) 3. Определим по индукции {xly ... , хп\ как {хи ..., xn_i} U {хп\- Тогда \- Vxt... VxnVu (и е {xl9 ... , хп\ = и = л^ V ... V и = лгл). Таким образом, для любых данных множеств хи ... , хп существует множество, элементами которого являются множества х1} ... , хп и только они. Другим средством порождения новых множеств из уже имеющихся является образование множества всех подмножеств данного множества. Аксиома W. (Аксиома множества всех подмножеств.) = w ^ х). Эта аксиома утверждает, что класс всех подмножеств множества х (см. пример 2 на стр. 184) есть также множество; мы его будем называть множеством всех подмножеств множества х. В силу этой аксиомы, \- Vx (M (&> (х))). Примеры. = {0, {0}}. = {0, {0}, {0, {0}}, {{0}}}. Значительно более общим средством построения новых множеств является следующая аксиома выделения. Аксиома S. VjcVY3zVw(mg^ehg^&he Y). Таким образом, для любого множества х и для любого класса Y существует множество, состоящее из элементов, общих для х и У. Следовательно, \- VatV Y(M (х П У)), т. е. пересечение множества с классом есть множество. Предложение 4.6. f- \fxVY(Y ^x => М (У)) (т. е. подкласс множества есть множество). Доказательство. \- \/x(Y^xzd Y[)x=Y)h |- \/x(M(Y[]x)). Так как всякая предикативная формула о/1 (у) порождает соответствующий класс (предложение 4.4), то из аксиомы S следует, что для любого множества х класс всех его элементов, удовлетворяющих данной предикативной формуле о/£ (у), есть множество. Однако для полного развития теории множеств нам потребуется аксиома, более сильная, чем аксиома S. Введем предварительно несколько определений. Опр еделени я Un (X) означает VxVyV* «*, у)е=Х&(х, z) <= X zd y = z). (X однозначен.) Fnc (X) означает X с V2 & Un (X). (X есть функция.) Y\X означает X[)(YX Ю- (Ограничение X областью Y.)
§ 1. СИСТЕМА АКСИОМ Ш\ (X) означает Un (X) & Un {x). (X взаимно однозначен.) z, если 187 X* У'= { О в противном случае. Если существует единственное z такое, что (yf z) e X, то z = Xy\ в противном случае Х'у = 0. Если X есть функция, а у — множество из области определения X, то Ху есть значение этой функции, примененной к у *). Х"У = <М(У\Х). (Если X есть функция, то XйУ есть область значений класса X, ограниченного областью Y.) Аксиома R. {Аксиома замещения) Ух (Un (X) => Зу Vm (и е у = 3v ((v, и) Gibe х))). Аксиома замещения утверждает, что если класс X однозначен, то класс вторых компонент тех пар из X, первые компоненты которых принадлежат х> является множеством (эквивалентное утверждение: М (S! (х 1 X))). Из этой аксиомы следует, что если X есть функция, то область значений результата ограничения X посредством всякой области, являющейся множеством, также есть множество. Упражнения 1. Показать, что аксиома замещения (R) влечет аксиому выделения (S). (Указание. Пусть X есть класс всех упорядоченных пар (м, и) таких, что «ef, т. е. Х = у^2 (yi = ^2 &ле У)- Очевидно, Un (X) и (Bv ((v, )Xk)) У{]) ))) {]) 2. н Vx (M (& (х)) & М (е% (х))). (Указание. Показать, что & (х) s £ U (U (х)) и ef (x)cU(U (x)); применить предложение 4.6 и аксиому U.) 3. н WxWy (М (л: X у)). (Указание. Показать, что х X у s £Р (<^ (х U З'))'» применить предложение 4.6 и аксиому W.) 4. (a) h М (5 №) & М (е? W) & ^/ W з М (X). (Указание. Х<= £fWXe? (X).) (b) Ь- Vy (Fnc(X) =>M(y1 X)). (У к а з а н и е. Fnc (у 1 X) & &F (у 1 X) <=^у, откуда, в силу аксиомы R и утверждения (а), следует М (Х"у).) Следующая аксиома обеспечивает существование бесконечных множеств. Аксиома I. (Аксиома бесконечности.) Зх (0 е х & Vm (и е х zd м U {м} е л:)). Аксиома бесконечности утверждает, что существует такое множество х, что Og^, и если и е лг, то и U {w} также принадлежит лг. Для такого множества х, очевидно, {0} е л;, {0, {0}} е л:, {0, {0}, {0, {0}}} е ^ *) В дальнейшем мы будем по мере необходимости вводить новые функциональные буквы и предметные константы, как только будет ясно, что соответствующее определение может быть обосновано теоремой о единственности. В настоящем случае происходит введение некоторой новой функциональной буквы h с сокращенным обозначением Х1У вместо h (X} Y),
188 ГЛ. 4, АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ и т. д. Если мы теперь положим 1 = {0}, 2 = {0, 1}, ..., п = {0, 1, ... ..., п — 1}, то для любого целого п ^ 0 будет выполнено п е х> и при этом 0*^1, 0 ф2, \ф% 0=^3, \фЪ, 2фЪ, ... Упражнение Доказать, что аксиома I влечет аксиому N *). Доказать также, что если некоторая формула влечет ЗХ(М(Х)), то вместе с аксиомой S та же формула влечет аксиому N. Список аксиом теории NBG завершен. Мы видим, что NBG имеет лишь конечное число аксиом, а именно: аксиому Т (объемности), аксиому Р (пары), аксиому N (пустого множества), аксиому S (выделения), аксиому U (объединения), аксиому W (множества всех подмножеств), аксиому R (замещения), аксиому I (бесконечности) и семь аксиом существования классов В1—В7. Мы видели также, что аксиомы N и S выводимы из остальных аксиом, однако они включены в общий список аксиом, так как представляют интерес при изучении некоторых более слабых подтеорий теории NBG. Убедимся теперь в том, что парадокс Рассела невыводим в NBG. Пусть У—х(хфх), т. е. Ух(х^ У=хфх). (Такой класс У существует, в силу теоремы о существовании классов (предложение 4.4), так как формула х ф х предикативна.) В первоначальной, т. е. не сокращенной, символике эта последняя формула записывается так: VX(M(X) zd ZD(X<=y=X<=£X)). Допустим М(У). Тогда КеУ=У^К, что, в силу тавтологии (Л = ~| А) id А & ~] А, влечет Kg У & У ф У. Отсюда по теореме дедукции получаем |-Ж(У)з(Ке К&К^ У), а затем, в силу тавтологии (В zd (А & "1 A)) id П В, получаем и П М(У). Таким образом, рассуждения, с помощью которых обычно выводится парадокс Рассела, в теории NBG приводят всего лишь к тому результату, что У есть собственный класс, т. е. не множество. Здесь мы имеем дело с типичным для теории NBG способом избавления от обычных парадоксов (например, парадоксов Кантора и Бурали-Форти). Упражнение \-~\M(V). (Универсальный класс не есть множество.) (Указание. V = ■= х (х = л:); для расселовского класса У=х (хфх) уже показано, что ~| остается применить предложение 4.6, принимая во внимание, что У <=, V.) § 2. Порядковые числа Определим сначала некоторые привычные понятия, связанные с отношениями. ♦) Чтобы в самой формулировке аксиомы I не предполагать аксиомы N, ыадд#жит в аксиоме 1 <0«а> заменить на <3v(v&xfkVu (и ф у))>.
§ 2. ПОРЯДКОВЫЕ ЧИСЛА 189 Опр еделения X Irr У означает Vy (у е= У zd (у, у) ф X) & Rel(X). (X есть иррефлексивное отношение на У.) X Tr У означает Rel(X)& VmVx»V^(u<= Y&v ее Y&w g Y& & (u, v)e=X&(v)w)(=Xzd (u, w) e= X). (X есть транзитивное отношение на У.) XPartY означает (XIrr Y)&(X Tr У). (X частично упорядочивает У.) XCon У означает Rel(X)&VuVv(ue= У&туе= У&ифю=>(и, г>)е= t=X\J (v, и> е= X). (X есть связное на У отношение.) АТо* У означает (.Y/rr У)&(АГ7> У)&(ХСол У). (^ упорядочивает У.) А* ИР* У служит обозначением для Rel(X)k{XIrr Y)&VZ(Z^ У& 3V0 > ^^( &(v, у)фХ))). (X вполне упорядочивает У, т. е. отношение X ирреф- лексивно на У, и всякий непустой подкласс класса Y имеет наименьший в смысле отношения X элемент.) Упражнения 1. |- (X We У) id (X Tot У). (Указание. Чтобы доказать ХСопУ, рассмотрим такие х и у, что хеУ, ^е^ и *=т^.У' очевидно, {л:, .у} имеет наименьший элемент, пусть это будет, например ху тогда (х, у) е X; чтобы показать, что X Тг У, рассмотрим х, у и г, для которых xeFjeK, 2ёУ и (х, _y)G^&(ji, z) e X; множество {лг, .у, 2} имеет наименьший элемент, которым обязан в данном случае быть х.) 2. |- (X We Y)k{Z^Y)ZD (X We Z). Примеры (из наивной теории множеств). 1. Отношение < на множестве Р всех целых положительных чисел вполне упорядочивает Р. 2. Отношение < на множестве всех целых чисел упорядочивает, но не вполне упорядочивает это множество. 3. Отношение cz на множестве W всех подмножеств множества всех целых чисел частично упорядочивает W, но не упорядочивает W. (Например, {1}<£{2} и {2} ф {1}.) Определение. Sim(Z, Wh Щ) служит сокращением для Э^Зха ЗпЗгз (Rel (n) & Rel (r2) &Wt = (rh xx) &W* = <r2, x2) & Fnc (Z) & & t/fli (Z) & ^ (Z) = XX & e^ (Z) = JC2 & \/ll\/v(U EEXi&VEEXiZD (ll, v) 6= e ri = (Z% Z'v) e r2)). (Z есть подобное отображение, отображающее отношение Гь определенное на хъ на отношение г2, определенное на лг2.). Определение. Sim (Wi, W2) служит сокращением для 3zSim(z, Wh W%y (Wi и \^2 — подобно упорядоченные структуры.) Пример. Пусть Г\ — отношение < на множестве Nn всех неотрицательных целых чисел, а г% — отношение < на множестве Р всех
190 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ положительных целых чисел; пусть, далее, z есть множество всех упорядоченных пар {х> х-\-\)у где х пробегает Nn. Тогда z есть подобное отображение (гь Nn) на (r2, P). Упражнения 1. |- Sim (Z, X, Y) з Sim (Z, X, Y). 2. |- Sim (Z, X, Y)ZDM(Z)kM(X)kM (Y). Определения Fld(X) означает 2f [X) \j <M(X). {Поле класса Х.) TOR (X) означает Rel (X) & (X Tot (Fid (X))). (X есть отношение порядка) W0R(X) означает Rel (X) & (X We (Fid (X))). (X есть вполне упорядочивающее отношение) Упражнения 1. I- (Sim (X, Y) ZD Sim (К, X)) & (Sim (X, Y) & Sim (Y, U)TD Sim (X, U)). 2. \-Sim ((X, Fid (X)), (Y, Fid (Г)))з (TOR(X) = TOR(Y))k(WOR(X) = ~WOR(Y)). Если x есть отношение порядка, то класс всех отношений порядка, подобных х, называется порядковым типом отношения х. В дальнейшем нас будут специально интересовать порядковые типы вполне упорядочивающих отношений. Оказывается, однако, что в теории NBG все порядковые типы (кроме порядкового типа {0} отношения 0) являются собственными классами. В связи с этим представляется удобным найти класс W вполне упорядоченных структур такой, чтобы всякое вполне упорядочивающее отношение было подобно некоторому и притом единственному элементу из W, Таким образом, мы подходим к изучению порядковых чисел. О преде ления Е означает ху(х^у). (Отношение принадлежности) Trans (X) означает \fu(u^ Xzd и^ X), (Класс X транзитивен) Secty (X, Z) означает Z s X & Vm У/v (as X&v e Z & <и, v) <= e= FdmgZ). (Класс Z является Y-сечением класса Х) SegY(X, U) = x(x<=X&{x, U)<==Y). (Y-сегмент класса X, определенный классом U) Упражнения 1. H Trans (X) = U (X) s X. 2. н Trans (X) & Trans (Y) з 7ra/zs (ЛГ U К) & Trans (X f] У). 3. \-Seg£(X, u) = x(x<=Xkxz=:U)kSegE(Y} a) £ Kfl и & ЛГ (S^ (К, и)).
§ 2. ПОРЯДКОВЫЕ ЧИСЛА 191 4. h Trans (X) =Уй(йеЬ SegE (X, и) = и), 5. \-(EWeX)&SectE(X, Z) kZ ФХиЗи(и е= XkZ = SegE(X, и)). (Указание. Взять в качестве и е-наименьший элемент класса X — Z.) Определения Ord (X) означает (Е We X) & Trans (X). (X является порядковым классом тогда и только тогда, когда е-отношение вполне упорядочивает X и всякий элемент X является также и подмножеством X.) On означает x(Ord(x)) (т.е. f— Vx (x e On = Ord (x))). Порядковый класс, являющийся множеством, называется порядковым числом. On есть класс всех порядковых чисел. Заметим, что формула х е On эквивалентна некоторой предикативной формуле, а именно конъюнкции формул (a) У/и (и ge xzd и фи); (b) У/и (и ^ х & и Ф 0 id 3v (v e и & Vze> (<a;eM&^s7^'uii)<iys'a;& &ze;^x;))); (c) Vm (м е л: id м ^ л:). (Первая из этих формул эквивалентна (Elrrx), вторая — (EWex)n третья — Trans (x).) Поэтому всякая формула, предикативная, если не обращать внимания на вхождения Оп> эквивалентна некоторой предикативной формуле и, следовательно, может рассматриваться в качестве ср в теореме существования классов (предложение 4.4). Здесь следует добавить, что всякая формула On^Y может быть заменена на Зу(у& Y& Примеры. 1. |— 0 е On. 2. Обозначим {0} через 1, тогда [- le On. Мы будем употреблять малые греческие буквы а, (3, у, 8, ... в качестве переменных, ограниченных порядковыми числами; например, V^ (a) означает Vjc (x e On id g?£ (х)) и Эа©^ (а) означает Зх (х е &^4 Предложение 4.7. (1) |- Ord (X)iD(X< (2) \-Ord{X)kYczXkTrans{Y)zD Y<= Х\ (3) [-(Ord(X)&Ord(Y))zD(YaX=Ye=X)] (4) |- Ord (X) & Ord (Y) id (X e Y V X= Y \/ Ye£X)&-\(Xe= Yfr &У£^)&1(^£ YSlX=Y); (5) \- Ord(X)& Y<=Xid YeEOn; (6) \-EWe On; (7) ^ Ord (On); (8) \-~\M{0n); (9) \- Ord (X) zd X= On\fXe On. Доказательство. (1) Если Ord(X)y то отношение Е иррефлек- сивно на Ху т. е. У/и (и ^ X и и фи), следовательно, если X е X, то Л:^Х Поэтому ХфХ. >--
192 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (2) Пусть Ord(X)k YaXk Trans (У). Легко видеть, что У является собственным /J-сечениехМ класса X. Поэтому, в силу упражнений 4—5 (стр. 191), Fel (3) Пусть Ord(X)kOrd(Y). Если У<=Х, то У с X, так как X транзитивно; но, в силу (1), У =^= Х\ следовательно, У а X. Обратно, если У си X, то, в силу (2), имеем У ^ X, так как У транзитивно. (4) Предположим Ord(X)&Ord(y)&XФ- У. Справедливы включения X П У ^ X и X О У^ У. Так как X и У транзитивны, то транзитивен и класс X П Y. Если X (] У с: X и X (] У а У, то, в силу (2), X [\ Ге X и X П У^е У, и потому X П Ке^П ^> чт0 противоречит иррефлексивности Е на X. Следовательно, или X П У = АГ или А' П У= У> т. е. или X £ У, или Уд! Но А' =^= К. Поэтому, согласно (3), Х^У или FeX На основании того же пункта (3), XgF и У^Х невозможно, ибо это влечет X а У к У cz X. Очевидно, в силу (1), невозможно и Xg УкХ=У. (5) Пусть Ord(X)& У<=Х. Мы должны доказать Е We У и Trans (У). Так как KgX и Trans (Х), то У cz X. Поэтому из Е We X следует Е We У. Далее, если mgF и ней, то, по Trans (X), v e X Так как ЕСопХ и FGA'bG^, то tig F, или Уег;, или ту= У. Если бы при этом оказалось, что v= У или Уег>, то, так как ЕТгХ и ме К&'оеи, мы получили бы кем, что противоречит пункту (1), Следовательно, ие У. Итак, если и е У, то н ^ У, т. е. справедливо Trans (У). (6) На основании (1), EIrrOn. Пусть класс X таков, что Х<=Оп& &ХфО, и пусть agl Если a—наименьший в X элемент, то пункт (6) доказан. (Под наименьшим элементом класса X понимается такой элемент v^X, что Vw^g^&m^tidtieh).) В противном случае рассуждаем следующим образом: так как EWea и ATf|a^=O, то должен существовать элемент (3, наименьший в Х(]а. В силу (4), ясно, что р есть наименьший элемент в X. (7) Требуется доказать EWeOn и Trans (On). Но Е We On есть (6) и, стало быть, доказано. Пусть теперь и ^ On и v ^ и. Тогда, в силу (5), v e On. Итак, Trans (On) доказано. (8) Из М (On), согласно (7), следует On e Оп} что противоречит (1). (9) Пусть Ord(X). Тогда Х<=Оп. Если ХфОп, то, в силу (3), ХееОп. Из предложения 4.7 (9) следует, что класс On—это единственный порядковый класс, не являющийся порядковым числом. Определение, х <^у означает х е On & у е On & х е .у; л:^о.У означает j/ еОя&(х =j; V дг<о.у)- Таким образом, для порядковых чисел отношения <0 и е совпадают, и <о вполне упорядочивает On. В частности, из предложения 4.7 (5) мы видим, что всякое порядковое число х равно множеству всех порядковых чисел, меньших х.
$ 2 ПОРЯДКОВЫЕ ЧИСЛА - 193 Предложение 4.8. (Трансфинитная индукция.) [- Vp (Va (a ее р id a e *) zd p e AT) =) On g= AT (т. е. если для всякого p из того, что все порядковые числа <Сор принадлежат Х> следует, что и р принадлежит Х> то в X находятся все порядковые числа). Доказательство. Предположим, что Vp (Va(a e P =э a e X) id dPg А'). Предположим также, что существует порядковое число, принадлежащее С#—X Тогда так как On вполне упорядочен отношением Е, то в On — X существует и некоторый наименьший элемент р. Итак, все порядковые числа <Со Р принадлежат X. Согласно предположению, отсюда следует, что и р принадлежит X, и мы пришли к противоречию. Предложение 4.8 применяется для доказательства утверждений, говорящих о том, что все порядковые числа обладают тем или иным свойством Р(а). При этом обычно полагают Х = х(Р (х)&х ^ On) и доказывают, что Vp (Va (a ge p ID P (a)) id P (p)). Определение, х' служит сокращением для х [) {x}. Предложение 4.9. (1) \-Ух(хееОп = хг е=Оп); (2) h Vai3p(a<op<oa0; (3) ^ VaVp(a'=pf=Da=P). Доказательство. (1) Очевидно, хеУ. Поэтому, если х' е On, то, на основании предложения 4.7(5), ид;£ On. Обратно, пусть х е On. Следует доказать Е We(x [) {х}) и Trans (х [) {х}). Так как Е We x и хфх, то EJrr(x U {х}). Кроме того, если уфО&у <=.х \] {х}, то либо у={х} и тогда х есть наименьший элемент у, либо у f| хфО и тогда наименьшим элементом у является наименьший элемент у f| x. Таким образом, Е We(x [) {х}). Наконец, если у^х [) {х} и и е у, то, очевидно, и е х, откуда получаем Trans (x \J {x}). (2) Предположим а <;0 р <оа'- Тогда а ^ р и р е а'. Из а^ р, в силу предложения 4.7(4), следует р <ф а и р ф а, что, согласно определению д?, противоречит р е= af. (3) Пусть а' = р'. Тогда р <0 а', и, по предыдущему пункту (2), р=^оа- Аналогично, а==с:ор. Следовательно, а = р. Определение. Sue(X) служит обозначением для Xе Onk &3a(Ar = af). (X есть непосредственно следующее порядковое число) Определение. К\ служит обозначением для х (х = О \J Sue (х)). (К\ есть класс всех порядковых чисел первого рода.) Определение, со служит обозначением для iCi&VwfMGJCDttG К\)). со есть класс всех порядковых чисел а первого рода и таких, что все порядковые числа <<оа тоже суть порядковые числа первого рода. Примеры. Оесо, 1 = {0} ^ со. 7 Э. Мендельсон
194 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Предложение 4.10. (1) Ж И; (2) Va(aGEco = a'GE(o); (3) 0 е Х& У и (и е X id и' е АЭ => со с АГ; (4) Va (а е со & р <0 a id p e со). Доказательство. (1) По аксиоме бесконечности I, существует такое множество х, что Ogi и Vm(mgxdw'g x). В силу предложения 4.6, достаточно показать со gz х. Допустим, что со д£ х. Пусть тогда a—наименьшее в со — х порядковое число. Очевидно, а^О, ибо О^х. Следовательно, Sue (а), т. е. Эр(а = (3'). Пусть 5—порядковое число такое, что а = Ъ'. Тогда &<оа, и потому 8gx. Но тогда и 8' е JC, т. е. ае х, что приводит к противоречию. Итак, со g= x и, следовательно, Ж (со). (2) Пусть а е со. Тогда о! е /Ci, ибо заведомо Swc (a'). Кроме того, если р е а', то pea или р = а, и потому р е К\. Итак, a' e со. Обратно, если а' е со, то а е со следует из а е а' и Vp (p e a id p e af). Пункт (3) доказывается рассуждениями, подобными тем, которые применялись при доказательстве пункта (1), а доказательство пункта (4) мы предоставляем читателю в качестве легкого упражнения. Элементы множества со называются конечными порядковыми числами. Мы будем применять обычную форму для их обозначения: 1 для (У, 2 для 1', 3 для 2' и т. д. Таким образом, 0 е со, 1 е со, 2 е со, 3 е со, ... Порядковые числа, отличные от нуля и не являющиеся порядковыми числами первого рода, назовем предельными порядковыми числами или порядковыми числами второго рода. Определение, him (x) означает х ^Оп&х фК\. Упражнение |- Lim (со). Предложение 4.11. (1) [— Vjc (х £ On Z) (U (х) е= О# & Va (a g JC D a ^0 U (x)) & & Vp (Va(a e= x zd a<0 p) zd U (x)^0 P))). (Каково бы ни было множество х порядковых чисел, множество U (х) является порядковым числом и притом наименьшей верхней гранью для х.) (2) |— Vjc (х с= On & х Ф 0 & Va (а е х id Эр (р е х & а <;0 Р)) =) =э!ш(и (*))). (Если л: есть непустое множество порядковых чисел без наибольшего элемента, то \J(x) есть предельное порядковое число.) Доказательство. (1) Пусть х^Оп. U(jc), будучи множеством порядковых чисел, вполне упорядочено отношением Е. Кроме того, если
' § 2 ПОРЯДКОВЫЕ ЧИСЛА 195 Ga, то существует f такое, что '[GX&aGj, что вместе с pea дает, по свойству транзитивности порядковых чисел, р е -у и, следовательно, (3 ^ U (х). Таким образом, U (х) транзитивно, и потому 1)(х)^0п. Если теперь ае^, то ag|JM и, по предложению 4.7(3), а =^о U (х). Предположим, наконец, что Va (a e x id а ^0 Р). Для любого 8, если SgU (х), то существует -у такое, что 8 е *у & Т е ■*• При этом 7^оР> и потому 8=^;ор. Таким образом, U(-*O^p и, по предложению 4.7(3), U(*)<op. (2) Пусть х Ф 0 & х s О/г & Va (a s * => Эр (р е * & a <0 р)). Если U(jc) = 0, то из aGJf следует a = 0. Тогда х = 0 или jc == 1, чего не может быть, в силу наших условий. Итак, Ц(х)фО. Допустим Sue (U (х)). Тогда U (х) = *у' при некотором *у. Так как, в силу первой части доказываемого предложения, \J(x) является наименьшей верхней гранью для х, то -у не является верхней гранью для х, следовательно, существует 8 е х такое, что т <0 8. Но тогда 8 = U (jc), поскольку U (д:) есть верхняя грань для х. Таким образом, в противоречие с условием, U (х) оказывается наибольшим в х элементом. Следовательно, "1 Sue (U (х))у и остается принять Lim (x). Упражнение |- Va ((Sac (a) ID (U (a))' = a) & (Lim (a) 3 U (a) = a)). Теперь мы можем сформулировать и доказать принцип трансфинитной индукции в другой форме. Предложение 4.12. (Трансфинитная индукция, вторая форма.) (1) Ь 0 <= X & Va (a g= X ZD a' g= Я) & Va (LZ/я (a) & Vp (p <0 a zd (2) (Индукция до 8.) [- 0 e X& Va(a'<08 &a e A' id a' e A)& & Va(a<0 8 & Lim (a) & Vp (p <oa =d p ge X) n> a e X) => 8 с Jf. Доказательство. (1) Пусть Y = x(x e 0/2 & Va(a^ojc ID DaG X)). В предположении, что верна посылка доказываемой формулы, легко показать, что Va (a <o f^a^ Y)zd^^ У. Следовательно, по предложению 4.8, On ^ У. А так как У ^ X, то и Оп^Х. (2) Предоставляется в качестве упражнения читателю. В теории множеств существенную роль играют определения по трансфинитной индукции. Эти определения могут быть оправданы с помощью следующих теорем. Предложение 4.13. (1) Ь 4X3lY(Fnc(Y)&&(Y) = 0n&\f(x(Ytb = Xt(a'\ У))). (Для любого X существует единственная функция У, определенная на всех порядковых числах и такая, что значение К на а равно значению X, примененного к ограничению У множеством порядковых чисел <Соа0 (2) |- 4xVX1VX<i'3lY(Fnc(Y)&&(y) = On& Y<0 = = *&Va(y<(aO = *i<(*''*))& Va(L//^(a)=) K'a = <V(aj У))) 7*
196 Г Л 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (3) (Индукция до 8.) \-VxVX1VX%3xY(Fnc(Y)&&(Y) — b&Yt0 = э К'а = *а«(«1 У))). Доказательство. (1) Пусть Yt = u (Fnc (ti)&&{u) &Vct.(a.^& (u)id ula. = Xl(crA и))). Докажем сначала, что если щ е Yx и и* ^ Yh то щ^щ или wa ^ Hi. В самом деле, пусть ^1=&(щ) и -2 = 02? (и%), тогда либо 7i ^о Т^> ли^° "ft^oTi- Пусть, например, fi^oT*» и пусть w есть множество всех таких порядковых чисел a <;0 *[ь что 1!Х'яфиъ1а. Допустим, что ze> ^ 0, и пусть yj — наименьший элемент в w. Тогда из р<о?] следует щ 1 р = щ ' р. Следовательно, т] 1 щ — у\ 1 щ. Но щ ' т] = Xl(r\ I U\j и г/2 *^ = X1 (у\ 1 щ)у и, таким образом, ц1'у1 = щ€у\1 что противоречит допущению о том, что непусто множество w, в котором т) есть наименьший элемент. Поэтому -zc —0, т. е. щ 'а = щ1си для всех a<CoTi- Отсюдз получаем щ = *[i 1 Mi = fi 1 г/^ ^ Щ- Таким образом, любые две функции из Y\ совпадают на общей части их областей определения. Положим K=U(Ki). Читателю предоставляется самому доказать, что У есть функция, область определения которой есть либо порядковое число, либо On, и что Va(K <a = .Y'(a1 Y)). После этого уже нетрудно доказать, что &(Y) = On. Если бы было &(У) = Ъ, то, положив W== Y U {(Ъ, Xе Y)}, мы имели бы Wg Ki и, следовательно, W <= К, откуда в свою очередь 8 е £$ (К) = 8, чего не может быть из-за 8^8. Единственность У легко доказывается с помощью трансфинитной индукции (предложение 4.12). Доказательство (2) аналогично доказательству (1), а (3) легко следует из (2). С помощью предложения 4.13 можно вводить новые функциональные буквы по трансфинитной индукции. Примеры. 1. Сложение порядковых чисел. В предложении 4.13(2) положим х = ф, Xi = и v (v = и'), Х% = и v (v = U (е^5 (и)). Получаем, что для всякого порядкового числа (3 существует единственная функция У такая, что Ур < 0 = р & Va (Ур * (а') = ( У^' а/) & Va (Lm (a) zd Ур' а = = и(У3"а)). Следовательно, существует и притом единственная функция -f-0> областью определения которой служит On1 и такая, что для любых двух порядковых чисел р и -f -|-0 (p, f) = Ур * f. Впрочем, мы тотчас же перейдем к привычной записи р -f-0 Т вм^сто -f-o (р, т)- Отметим, что L/«(a)z>p+»a= U т<оа В частности, Р+в 1 =Р+( (Р+ Р 2. Умножение порядковых чисел. В предложении 4.13(2) положим = 0, Xx = uv (z; = г/-|-о ?)> ^а = й'й (x; = U(q^(«))). Тогда так же, как
$ 2. ПОРЯДКОВЫЕ ЧИСЛА 197 и в предыдущем примере 1, заключаем, что существует функция со свойствами ()р = U (Р Хо^). т<оа Упражнение Обосновать операцию возведения в степень для порядковых чисел: §° = 1, т<оа Для произвольного множества X обозначим через Ех отношение принадлежности, ограниченное множеством X: Ех = ху(х ^у &х е y Предложение 4.14*). Пусть R — вполне упорядочивающее отношение на множестве х, т. е. R We х. Пусть, далее, f— функция, отображающая х в х> такая, что для любых и, v в х из (и, d)gR следует (/'«./'^gR. Тогда для любого и в х: u=flu или (и, f'u) е /?. Доказательство. Пусть Х==й ((/(и, и) е R). Мы хотим доказать, что /Y = 0. Допустим, что ХфО. Так как Х^х и R вполне упорядочивает х, то в X существует наименьший относительно порядка R элемент щ. Очевидно, (/'щ, щ) е R. Отсюда </4/<wo), /'ffoJeR т- е. f'Uo^X. Тогда соотношение (/' щ, щ) е R противоречит определению щ. Следствие 4.15. Если ае(3 и у^а, т. е. если у есть подмножество некоторого сегмента порядкового числа (3, то (Е„ р) и (Еу, у) не подобны. Доказательство. Предположим, что существует такая функция /, отображающая р на у, что всякий раз из ме^, nGp и иен следует f'u^f'v. Так как область значений / совпадает с у, то /'aGj/. По условию же у 9= а. Поэтому /'аеа. Но мы находимся в условиях предложения 4.14, в силу которого, следовательно (полагая Р=лг), имеем /са = а или ae/'a, что несовместимо с /'aea. Следствие 4.16.(1) Если ьф§, то (Еа, а) и (Е,ф) не подобны. (2) Каково бы ни было порядковое число а, всякое отображение f *) Начиная с этого места, многие теоремы теории NBG будут формулироваться на русском языке как результаты соответствующего перевода с формального языка этой теории. Это делается с целью избежать выписывания непомерно длинных формул, ввиду трудности их расшифровки. Впрочем, мы будем так поступать только в тех случаях, когда читатель без особого труда смог бы сам построить соответствующую формулу теории NBG по неформальной <русской> версии теоремы.
198 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ подобия (Ел9 а) на (Eai а) является тождественным отображением, т. е. /'Р = р при любом р<оа- Доказательство. (1) Следует из следствия 4.15. (2) В силу предложения 4.14, р^о/'Р и р^0/<а при любом р<Соа- Поэтому Р ^о/< Р <о (7) < (/' Р) = р, откуда /' р = р. Предложение 4.17. Каковы бы ни были непустое множество и и вполне упорядочивающее это множество отношение R (т. е. если R We и & и = Fid (R) &иф 0), существует единственное порядковое кисло f и единственная функция f такие, что f есть отображение подобия (Ev 7) на (R, м). (То есть всякое вполне упорядоченное множество подобно некоторому и притом единственному порядковому числу.) Доказательство. Пусть Z= vw (w^u — v & Vz (z e и — vzd id "I (z, w) e /?)). Очевидно, Z есть функция и притом такая, что если ней и и — г;=й=О, то Z'v есть наименьший относительно R элемент в и — v. Пусть X = vw (($(v), w) e Z). Пусть затем Y — функция, определяемая по трансфинитной индукции (предложение 4.13), область определения которой есть On и такая, что Va(K<a = ^'(ai У)). Наконец, пусть \^=а(У"аси&й—У"афО). Ясно, что если аеИ7и pea, то и Ре IF. Следовательно, либо W=0n, либо W есть некоторое порядковое число f- (Если УРфОп, то этим порядковым числом -у является наименьшее порядковое число в классе 0/2 — W.) Если a e W, то К*а = Л'<(а"| У) есть наименьший относительно R элемент в м— К "а, поэтому К* а ем, и если pea, то Уа=^К'р. Таким образом, Уесть взаимно однозначная функция на W, и область значений функции У, ограниченной классом W, является подмножеством и. Положим теперь f=(Wi У), т. е. определим / как функцию, обратную к функции У, ограниченной классом W. Функция / является взаимно однозначной функцией, область определения которой совпадает с некоторым подмножеством множества и, а областью значений служит W. Поэтому, на основании аксиомы замещения R (стр. 187), W есть множество и, следовательно, равно некоторому порядковому числу ^. Пусть g= у 1 У. Очевидно, что g есть взаимно однозначная функция с областью определения, равной 7, и областью значений, равной некоторому подмножеству щ множества и. Мы должны показать, что щ = и и что если аир взяты из 7 и р е а, то (^р,^'а)ЕЯ Итак, допустим, что а е ?, ре f» Pea. Так как g-'p является наименьшим относительно R элементом множества и — ^"Р, pea и функция g взаимно однозначна, то g"'ae ем — g " р. Следовательно, <g' p, g * a) e R. Остается доказать, что щ = и. Очевидно, щ = Уи^. Допустим, что и — щ Ф 0. Тогда fG W7. Но W=i> что приводит к противоречию. Итак, и = щ. Единственность 7 следует из утверждения 4.16. Предложение 4.18. Пусть отношение R вполне упорядочивает собственный класс X таким образом, что для любого у^Х
§ 3 РАВНОМОЩНОСТЬ КОНЕЧНЫЕ И СЧЕТНЫЕ МНОЖЕСТВА 199 класс всех предшественников элемента у относительно отношения R в X {т. е. R-сегмент в X, определенный элементом у) является множеством. Тогда R подобно ЕОп, т. е. существует взаимно однозначное подобное отображение h On на X такое, что из аер следует {h < а, h < р> ее R. Доказательство. Рассуждая так же, как и при доказательстве предложения 4.17, приходим, однако, к тому, что W теперь совпадает с On. Кроме того, из условия, что всякий /?-сегмент X является множеством, следует е%? (У) = Х. (Если бы было X — <М(У) Ф О, то в противоречие с аксиомой замещения мы получили бы, что On есть область значений для функции К, областью определения которой служит /?-сег- мент X, определенный наименьшим относительно R элементом w ъ X— е%(Г).) § 3. Равномощность. Конечные и счетные множества Мы будем говорить, что два класса X и Уравномощны, если существует взаимно однозначная функция, областью определения которой является X, а областью значений У. Следующими определениями вводится обозначение ЛГ~ У для сокращенной записи утверждения о равно- мощности классов X и У. Определения X ~ У означает (Fnc (F) & Unx (F) & & (F) = X & <& (F) = Y), Хс^У означает 3 Отметим, что \- VxVyfxc^y = 3zfxc^y\\. Поэтому формула предикативна (т. е. эквивалентна некоторой формуле, содержащей кванторы только по переменным для множеств). Очевидно, что если X с^. К, то X ~ У у и что если X с^ У и Y c^. Z, то X c^l Z, где Н есть компо- j? F Q Н зиция функций F и О (это значит, что Н = ху (3z ((л:, z) e F & (z, у") е е О)). Итак, мы имеем следующую теорему. Предложение 4.19. (1) Хс^Х, (2) Х~ У id Yc~X, (3) <Y~ ~ У& Yc^ZzdXc^Z. Предложение 4.20. (1) ((*~ Г)&(Х1с-1 У1)&(Х(}Х1 = (2) ((Х~ К)&№~ Ki))=>(* X Xi~ У х П). (3) Хх{у}с^Х (4) XX К~ К XX. (5) (XX У) X Z~X х (Y х Z). Доказательство. (1) Пусть Xс^ Y и Х\^. Y{. Toiда X U Xt en Y[)Yi.
200 ГЛ 4 АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (2) Пусть Xc=l Y иА']- Yh Положим W = iiv (ЗхЗу (х <= X & Тогда XxX^Yx Yv (3) Пусть ? = йх1(ие^&г!=(й,<у)). Тогда Хс^Х х {у}. (4) Пусть F = uv (ЗхЗу (хееХ&уее Y & и = (ху у) & v = (у, х))). X Y X Тогда XX Yc^l Y X X. (5) Положим F = их) (д(з = <<jc, y>, ^>&^=<x, (у, г»)). Тогда (X X Упражнение Доказать ll( ^ 11Г)1 ) Определение. XY=u (Fnc (и) & Sf (и) = У & е^ (п) ^ X). Таким у образом, X есть класс всех множеств, являющихся функциями, отображающими Y в X. Напомним, что 2 = {0, 1}. Отсюда получаем, что оР(х)с^2х для любого множества х. (Для всякого и ^ х характеристической функцией Си назовем такую функцию с областью определения ху что если j/gm, то С'у = 0, а если уфщ то С1у=1. Пусть F — функция, определенная на &*(х) и ставящая в соответствие каждому и^х функцию Си. Тогда $ьхЛ Упражнения 2. ь- VxVyM (хУ). (Указание. и^хУ id и ^ у X х.) 3. н Д°={0} = 1. 4. у 5. 6. (1 7. \-(XY)z^ X"YXZ. (Указание. Положить F= йд (Fnc (и) к & (u) = & VyVz (j/gK&zeZ zj v l (y, z) = (uiz)i z)).) Можно ввести такое отношение частичного упорядочения г< для классов, что X ^< Y тогда и только тогда, когда X содержит такое же, как в К, или меньшее, чем в У, количество элементов. О п р е д е л е н и е. X ^< Y служит сокращением для 3Z(Z c= Y & A'~Z) (т. е. X равномощно некоторому подклассу К) Определение. X-^> Y означае! A'z< >& l(A'c^ Y). Очевидно, \- Xz< Y=(X4> Y\j Xc^ Y). Упражнение Предложение 4.21 (i) h^
3 РАВНОМОЩНОСТЬ. КОНЕЧНЫЕ И СЧЕТНЫЕ МНОЖЕСТВА 201 (2) |- X<= YzdX^ У; (3) \- X-z< У& Y^Zzd (4) (Шредер —Бернштейн.) |- Xz< Yk Yz<XzdXc-l Y. Доказательство. (3) Пусть X~ Yx & У, <= Y& Y~ZX&ZX<= Z, и пусть Н есть композиция F и О. Тогда <М (Н) <^ Z к X ~ <М (Н). н (4) Известно много доказательств этой нетривиальной теоремы. Мы приведем здесь одно новое доказательство, принадлежащее Хелл- ману [1961]. Лемма. Если Х() Y= X{) Z= Y [)Z=0 и Xc^X[)Y[]Zy то существует такая функция G, кто Хс^.Х\] У. (Для доказательства этой леммы построим сначала некоторую функцию И с областью определения, равной ЛгХа): ((и> ^)> v) ^ H тогда и только тогда, когда йёХ, йе«) и существует такая функция / с областью определения, равной k\ что fi$ = Fiu и /V'е X &/<(/") = /7Ч/<7)&/^==^ Д™ каждого /g^. Таким образом, Нс((и, 0)) = /7<м; Н'((и, 1»== = F'(F'н), если F'uezXiH1 ((и, 2)) = F<(F«(F<и)), если F1uhF1(F'u) принадлежат .Y, и т. д. Пусть теперь X* — класс всех таких и, что иеХ и Зу(уеш&(и, у)&&(Н)&Н'((и9 v))^Z\ и Г* —класс всех таких г/, что гг е ЛГ и Vj (j; ^ со & <м, у) ^3 (H)zdH1- «», j/>) ^ Z). Тогда Х=Х* U У*. Определим теперь О следующим образом: £2? (G) = X> и если меХ*, то положим (}'и = и, если же «g F*, то положим Olu = Fl и. Читатель сам докажет, что X~ X[} Y) Теперь для доказательства теоремы Шредера—Бернштейна предположим, чю Хс^ Yt& KiS K& Ycg О Очевидно, Л П №— А) = 0, А{] (X— Xt) = Q и (X — Хх) П (Xt — Д) = 0. Кроме того, Х^з^ — ATi)U№ — ^)U^> и композиция // функций F и G является взаимно однозначной функцией с областью определения, равной X, и областью значений, равной А. Следовательно, Ac^lX. Согласно н лемме, существует взаимно однозначная функция D такая, что А с^ Х\ (ибо (^i — Л) U i4 = Ai). Пусть, наконец, Т есть композиция функций И, Д G, т. е. такая функция, что Т <и = (О)с (D<(H * и)). Тогда ^с^ У, так как Х~А, Ac^Xt и XX~Y. Упражнение Провести во всех деталях следующее, принадлежащее Уиттекеру, доказательство теоремы Шредера — Бернштейна для случая, когда X и У суть множества. Итак, пусть Х^с YtkY{^ У & Yc^ Xt & Xt s X. Для доказательства Х^ У достаточно найти множество Z ^ X такое, чтобы результат ограничения функции G множеством Y—F"Z был взаимно однозначной функцией, отображающей Y—F"Z на X — Z. (В самом деле, имея такое множество, мы далее
202 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ положим H = \Z\ F) U \(Х — Z) I (?), что означает, что Hl x = F' х, если л: е Z, и И1 x=Giху если ^еХ—Z. Но тогда, очевидно, Хс^ К.) Иско- // мым множеством Z является множество х (Зи (и ^ Xкх ^ и & G" (Y — F" и) ^ дХ-и)). Заметим, что это доказательство не использует определения со и вообще не зависит от теории порядковых чисел. Еще одно доказательство имеется у К лини [1952, § 4]. Предложение 4.22. Если X г< У и A z< В, то (1) У{]В = 0^Х\]А^< Y[jB; (2) XX А^<УхВ; (3) Ь*А=< Ув- Доказательство. (1) Допустим, что X~ У\ s К и А ~Вх s A Функцию Я" с областью определения, равной XLM, определим таким образом, чтобы выполнялось И1 x = Flx для х^Х и И1х = 01 х для jcgA-I Тогда А'и^^Я'Ч^и^)^ KUA Читателю предоставля- ется самому доказать пункты (2) и (3). Упражнения 1. 2. 3. Предложение 4.23. (Теорема Кантора.) |— Vx(x-^$Р(х)) щ следовательно, |— Vjc (л; -^ 2^). Доказательство. (1) Пусть область определения функции F равна х и F 1и={и} для любого ksi Тогда, очевидно, ^ и функция F взаимно однозначна. Таким образом, $() (2) Теперь следует доказать, что ~| (х с^. §Р (х)). Допустим, что хczl$Р(х) при некотором О. Пусть у = и (и &. х&и ф Q*и). Ясно, что j/e^(x). Следовательно, существует и притом единственное z в х такое, что Q(z=y. Так как Vh(w е^ = м &х&иф О1и\ то Vw(r/e О&^О'м). Отсюда по правилу А4 следует ^gO'^s ^ Так как х е х, то мы получаем гЕО^Е-г^О^ и приходим, таким образом, к противоречию. Заметим, что мы не доказали \—VxVy(x-z<y \J у^<х). На самом же деле это предложение и не может быть выведено, ибо, как оказывается, оно эквивалентно аксиоме выбора. Упражнение Если теория NBG непротиворечива, то, по предложению 2.12, она имеет .счетную модель. Объяснить, почему этот факт не противоречит теореме Кантора, ,из которой следует, что существуют несчетные бесконечные множества (например, 2е0)? Это кажущееся — но не настоящее! — противоречие называют иногда парадоксом Сколема. Отношение равномощности обладает всеми свойствами отношения эквивалентности. Это склоняет нас к тому, чтобы разбить класс всех
§ 3 РАВНОМОЩНОСТЬ КОНЕЧНЫЕ И СЧЕТНЫЕ МНОЖЕСТВА 203 множеств на классы эквивалентности по этому отношению. Классом эквивалентности данного множества х является класс всех множеств, равномощных множеству х. Эти классы эквивалентности называются кардинальными числами (или мощностями). Если, например, и есть множество и х={и}, то классом эквивалентности множества х является класс всех одноэлементных множеств {v}, он называется кардинальным числом 1С. Аналогично, если u=^=v и у = {иу v}, то классом эквивалентности для у будет класс всех двухэлементных, т. е. содержащих в точности по два элемента, множеств. Этот класс называется кардинальным числом 2С, иначе говоря, 2С = z(3xi3yi(x\ ф-У\ &<£ = = {хъ Уг}))- Следует отметить, что все кардинальные числа, кроме кардинального числа класса 0 (которое равно {0}), являются собственными классами. Так, например, К~1С, где V есть универсальный класс. В самом деле, пусть F'x — x для каждого х ^ V. Тогда, очевидно, V о^\с. Но так как ~\M(V)} то, по аксиоме замещения, и ~\М(\С). Упражнение Н 1М(2С). Поскольку кардинальные числа являются собственными классами, мы не имеем возможности рассматривать классы кардинальных чисел. Это обстоятельство делает трудным или даже невозможным формулирование и доказательство многих интересных фактов о кардинальных числах. По этой причине дальнейшее обсуждение кардинальных чисел на этом уровне мы прекращаем. Большинство утверждений, которые можно было бы сделать о кардинальных числах, могут быть перефразированы в терминах ~ и ^. Кроме того, в дальнейшем мы увидим, что если воспользоваться некоторыми дополнительными, содержательно правдоподобными, аксиомами, то открываются иные пути для определения понятия, которое может с успехом заменить понятие кардинального числа. Упражнение Доказать \- VxVR (R We х =э За (х^ а)). (Всякое вполне упорядоченное множество равномощно некоторому порядковому числу. Указание. Применить пре дожение 4.17.) Конечные множества. Напомним (стр. 193), что со есть множество всех порядковых чисел а таких, что а и все порядковые числа, меньшие а, являются порядковыми числами первого рода (т. е. являются непосредственно следующими или 0). Элементы со называются конечными порядковыми числами. Множество называется конечным, если оно равномощно какому-нибудь конечному порядковому числу. Определение. Fin (X) = За (а е со & X ~ а). В силу аксиомы замещения R, очевидно, \- Fin (X) zd M (X). Ясно, что все конечные
204 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ порядковые числа являются конечными множествами, и |— Fln(X) & Xc^z c*>Y-=>Fln{Y). Предложение 4.24. (1) |~Va(aeO/i — со ZD a~a'). (2) |~VaVp(aeco&a^=piD-la~p). {Никакое конечное порядковое кисло не равномощно порядковому числу, ему не равному. Отсюда следует, что всякое конечное множество равномощно одному и только одному конечному порядковому числу, и любое бесконечное порядковое число (т. е. всякий элемент On — со) не равномощно никакому конечному порядковому числу.) (3) |— VaVx (a е со & х cz a zd ~| a ~ х). (Никакое конечное порядковое число не может быть равномощно своему собственному подмножеству.) Доказательство. (1) Предположим, что ae On — a>. Определим функцию / следующим образом: & (f) = v!\ если 8 е со, то /'8 = 8', если 8 <ф со и Ьф а, то /'8 = 8; наконец, /'а = 0. Тогда a'^a. (2) Предположим противное, и пусть a — наименьшее порядковое число из со, для которого существует (3 такое, что (3 Ф а и a ~ (3. Тогда а <0 |3. (В противном случае не a, a (3 было бы наименьшим порядковым числом из со, равномощным с порядковым числом, ему не равным.) Пусть a£^j3. Если а = 0, то /=0 и [3 = 0, что противоречит предположению &Ф$. Таким образом, афО. Так как ае^, то а = 8' при некотором 8 е со. Мы можем также предполагать, что р = ?' при некотором 7- (Действительно, если (3 е со, то так как $ф0, существует такое f> что ^ = 7'' если же Р 9= ^ то> в СИЛУ пункта (1), [3^(3' и вместо (3 мы могли бы рассматривать (3'.) Итак, 8' = ac^f'- ^ак как афф, то 8^=т- Рассмотрим два случая. 1) /'8 = f. Тогда, очевидно, 8 £^т. 2) /1Ьф^, В этом случае существует такое р- е 8, что /'jjL=if- S1/ 1/ Пусть ft = ((8i/)—{<|x, T>})UK^/e8>b Имеем А'т=/вт, если т^ ^{8, jx}; /z^cm/'S. Поэтому 8 ^i 7. В обоих случаях 8 есть конечное h порядковое число, меньшее, чем а, и равномощное отличному от него порядковому числу, что противоречит определению а. (3) Допустим, что существуют такие [3 е со, что Зх(х а [3 &(3~х). Пусть a — наименьшее из таких р. Очевидно, афО. Следовательно, а = ^ при некотором у. Теперь так же, как и при доказательстве предыдущего пункта, можно показать, что f равномощно некоторой своей собственной части, чего, разумеется, не может быть из-за минимальности а. Предложение 4.25. (1) |—F/«(AT)& Y^X-=>Ftn(Y). (2) \-Fin (X) & Fin (Y) id Fin (X [} Y).
§ 3 РАВНОМОЩНОСТЬ КОНЕЧНЫЕ И СЧЕТНЫЕ МНОЖЕСТВА 205 (3) Назовем множество конечным по Дедекинду, если оно не равно- мощно никакому собственному своему подмножеству. Всякое конечное множество конечно по Дедекинду. (Обратное утверждение невыводимо без применения дополнительной аксиомы — аксиомы выбора.) Доказательство. (1) Предположим Fin(X)kY^ X. Тогда существуют / и а такие, что а ^ со и Xc^lol. Положим g= Y\f и W=g" Y. Справедливо W^ol. Так как W является множеством порядковых чисел, то отношение Ew вполне упорядочивает W. В силу предложения 4.17, (Ew, W) подобно (£р, (3) при некотором р. Следовательно, W~p. Кроме того, P^Qa. (Ибо в противном случае подобие (EXVy W) и (£., р) противоречило бы следствию 4.15.) Так как aew, то и р е ю; а так как Wc^ У, то получаем окончательно, что Fin (У). (2) Рассмотрим множество Z=h(mg(o& VjeVy V/(x c^.ii&. Fin (у) id id Fin (x[) у))). Для доказательства этого пункта, очевидно, достаточно показать, что Z = co. Прежде всего, 0 €= Z, ибо если je~O, то х = 0 и х[)у=у. Рассмотрим теперь произвольное а и допустим, что aeZ. Предположим также, что xc=lo! и Fin {у). Пусть a—flw и Х\ — = х—{w}. Тогда JCi~a. Так как, по предположению, aeZ, то Fin(xi U у). Но х U y = (xx U у) U {-до}. Поэтому Fin{x\] у) (ибо j— Vt) Vui (F/w (ij) id Fin (v U {x;i}))). Таким образом, о! е Z. Отсюда, на основании предложения 4.10(3), Z=o). (3) Этот пункт следует из предложения 4.24(3). Определения Inf (X) означает ~\Fin{X). (Класс X бесконечен.) Den(X) означает ЛТ~о). (Класс X счетен.) Нетрудно видеть, что \- In) (X) & X ~ Y id Inf( Y) и |- Den (X)&Xc^ c^lYid Den(Y). Так как a> есть множество, то, на основании аксиомы замещения R. получаем |— Den (X) id M (X). Предложение 4.26. (1) \-Inf(X) (2) [-Inf(X) = (3) Класс называется бесконечным по Дедекинду, если он равномо- щен некоторому своему собственному, т. е. отличному от него самого, подмножеству. Всякий бесконечный по Дедекинду класс бесконечен. (4) Ь Inf(*). Доказательство. Пункт (1) следует из предложения 4.25(1). В силу (1), |— Inf(X) id Inf(X{] {у}), а на основании предложения 4.25(2), \-Fnf(X\j {у}) id Inf(X\ что и доказывает пункт (2). Пункт (3) следует из предложения 4.25(3), а пункт (4) следует из [— о) ф а>. Предложение 4.27. \-Den(v)&z <=,v=>(Den(z)\J Fin(z)).
206 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Доказательство. Достаточно доказать, что z ^ u> id {Den (z) V V Fin (z)). Допустим, что z s со & "1 F/л (г). Из ~] F/л (г) следует, что для любого пег существует Ре^ такое, что а< (3 (в противном случае мы имели бы z<=.v!, а так как справедливо Fin{o!\ то и Fin(z)). Пусть X—функция такая, что Х'а для любого а е а> есть наименьшее порядковое число р в 21, для которого <*<;ор. Тогда, согласно предложению 4.13(3) (при 8 = (о), существует функция К, область определения которой совпадает с о> и такая, что У" 0 есть наименьшее порядковое число в z, и К'(т') для любого f из (о есть наименьшее порядковое число р в z с условием (К * f) <0 Р- Функция К взаимно однозначна, «^"(К)==со и Y"<u^z. Предположим, однако, что z — — Y "о)^=0 и 8 — наименьший элемент в z—У " о>. Пусть т — наименьшее порядковое число в У"о), для которого выполнено 8<от; тогда х=У1а при некотором о из а>. Так как 8<от, то афО и, следовательно, существует такое (igw, что c = |j/. Поэтому т или, что то же, У а есть наименьший элемент в z из тех, которые больше У"р.. Но К<(х<08, ибо т есть наименьший элемент в К "со из тех, которые больше 8. Следовательно, т = 8, и мы пришли к противоречию. Поэтому допущение z—У"со^=0 неверно, и, следовательно, У "со = z, т. е. Den(z). Упражнения . 1. 1- Fin (x) id Fin (gT5 (л:)). (Указание. Индукцией по а доказать У* (ЛГ ^ а & а<ЕЕсо ZD Лп ((З6 (*))).) 2. н Fm (л:) & V.y (^ex zd Лл (у)) zd Fin (U (л:)). (Указание. Индукция по а таким, что лг^а). 3. \- х^ук Fin (у) zd Л /г (л:). 4. ь- Fin (&> (х)) zd Fin (x). 5. h- Fin (U (*)) =5 (Fin (x) & V3; (j/gjc id Fin (y))). 6. h- Fin (x)=> (x^y\J y^> x), 7. h- Ля (л:) &Inf(Y) zd x-J Г. 8. Н/;т(д:)&>;с1д:=5<у-^д:. 9. н Лл (х) к Fin (y) zd Fin (x X y). 10. h- Лл (л:) & Ля (.у) id Л/г (л:^). П. [- Fin(x)ky<£xzDX^(x\}{y}). 12. Назовем л: минимальным (соответственно максимальным) элементом класса К, если д:е К и Vy (у е К zd "] jv с д:) (соответственно Vj/(zg Y zd ~\x с су)). Доказать, что класс Z конечен тогда и только тогда, когда всякое непустое множество подмножеств класса Z имеет минимальный (соответственно максимальный) элемент (Т а р с к и й [1925]). 13. (а) Н Fin (x) k Den (у) и Den (x [) у). (Указание. Индукция по а, где аз&х.) (b) Н Fin (x) к Den (y)kx^Ozj Den (x X у). (c) Всякое множество у содержит счетное подмножество тогда и только тогда, когда у бесконечно по Дедекинду. (Указание, (i) Предположим, что х ^у и Den (x). Пусть хо^. ы. Определим функцию g на у следующим образом:
§ 4. ТЕОРЕМА ХАРТОГСА НАЧАЛЬНЫЕ ПОРЯДКОВЫЕ ЧИСЛА 207 glu = u} если и^у — Ху и gla = (/)'((/' и)') для и^х. (и) Допустим, что у бесконечно по Дедекинду, т. е. что существует такое х} что х а у и у о^ х. Пусть v<=y — х. Определим функцию Л на а таким образом, чтобы выполнялись равенства hl0 = v и h l (а') =/' (h ' а) для любого «хеш. Функция h взаимно однозначна. В результате имеем Den (h" <о) и Л^о)^^-) § 4. Теорема Хартогса. Начальные порядковые числа. Арифметика порядковых чисел Мы теперь приступаем к изложению теоремы Хартогса, которой незаслуженно пренебрегают и которая, однако, несет в себе возможности многочисленных применений в теории множеств. Предложение 4.28. (X ар то г с [1915].) Для любого множества х существует порядковое число, которое не равномощно никакому подмножеству х (существует, следовательно, и наименьшее среди таких порядковых чисел). Доказательство. Предположим, что всякое порядковое число а равномощно некоторому подмножеству у множества х. Это значит, что ус^.а при некотором /. На множестве у определим отношение R таким образом, чтобы (и, v) e R выполнялось тогда и только тогда, когда (fiu)^(fiv). Тогда R вполне упорядочивает у, причем (R, у) подобно (Еа, а). Определим теперь функцию F с областью определения On и такую, что для любого a F'a есть множество w всех пар (,г, у)> удов- летвэрчющих условиям: у с= х, z вполне упорядочивает^ и (Е^ а) подобно (z, у), (w является множеством, ибо w ^ 3* (х X х) X ^ (х).) Для такой функции F выполнено соотношение F"{Ori) ^ ^(^(х X х) X X qP(x)), и, следовательно, F"(Ori) есть множество, F, кроме того,— функция взаимно однозначная. Поэтому On = F'" (F " (Оп))у и, следовательно, по аксиоме замещения R, On должно быть множеством, что противоречит предложению 4.7(8). Пусть е%^ — функция, которая каждому множеству х сопоставляет порядковое число а, являющееся наименьшим в классе порядковых чисел, не равномощных никакому подмножеству множества х. Назовем начальным порядковым числом всякое порядковое число а, которое не равномощно никакому порядковому числу, меньшему а. В силу предложения 4.24 (2), всякое конечное порядковое число является начальным, а со есть наименьшее из бесконечных начальных чисел. Для всякого множества х q%*'x есть также начальное порядковое число. В силу принципа трансфинитной индукции (предложение 4.13(2)), существует такая функция G, у которой областью определения служит On и которая удовлетворяет условиям: G« 0 = со; О'(а') = в>^ '(<3'а); О' X = U (G " X), если ) — предельное порядковое число.
208 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Функция О возрастает, т. е. из аЕр следует 0'agG'p; поэтому, если X есть предельное порядковое число и всякое значение G'a для а<0Х является начальным порядковым числом, то таково же и U(G"X). (В самом деле, порядковое число В = U (G " X) является наименьшей верхней гранью для G" X. Допустим, что Ь ~ «у при каком-нибудь f <о 8. Тогда существует а, меньшее X и такое, что -\ <0 G' а- Но G ' (а') <0 8. Таким образом, имеем О' а ^ О * (а') и О' (а') ^ 8 ^ ^ ^ Q< (а), откуда, по теореме Шредера—Бернштейна (предложение 4.21 (4)), получаем О' a ~ G * (а') = = <а%^ * (О < а), что противоречит определению функции о%Г) Итак, доказано, что О' а для любого а есть начальное порядковое число. С другой стороны, верно и то, что всякое бесконечное начальное порядковое число есть G'a при некотором а. (Предположим, что это не так. Пусть тогда о — наименьшее бесконечное начальное порядковое число, не принадлежащее G"On. По аксиоме замещения R, О" On не есть множество, следовательно, в Qu On имеются порядковые числа, большие а. Пусть [х — наименьшее из них, и пусть [x = G(p. Очевидно, р =^= 0. Еслир = *[' для некоторого -[> то G<7<oa<oG ' (fr) = е%" < (G'У), что противоречит определению е%Л Если же р — предельное, то существует a <o P такое, что о <о G'a <Co G' р, что противоречит определению р.) Таким образом, G является сохраняющим отношение е «изоморфизмом» между On и классом всех бесконечных начальных порядковых чисел. Обозначим G'a через a)a. Тогда a)0 = co; av есть наименьшее из начальных порядковых чисел, превосходящих a)a, и а>х для предельного порядкового числа X есть начальное порядковое число, являющееся наименьшей верхней гранью множества всех ша при а <Со X. Из предложения 4.14 следует, что а^о^а Для всех а- ^Ри этом любое порядковое число а равномощно с единственным начальным порядковым числом a)g^oa> а именно» с наименьшим из порядковых чисел, равномощ- ных с а. Обратимся теперь к арифметике порядковых чисел. Выше (стр. 196—197) были уже определены сложение, умножение и возведение в степень: (I) Urn (a) =з р +о« = U ® +„ т); (II) рХоО = О,° РХо(Г)=(РХот)-ЬР. LZ» (a) (III) LZ» (a) z)pXo*= U ( t <оа (a) zd rf = U (рт) 1 <!)"■
§ 4 ТЕОРЕМА ХАРТОГСА НАЧАЛЬНЫЕ ПОРЯДКОВЫЕ ЧИСЛА 209 Предложение 4.29. Следующие формулы являются теоремами: О) р+01=Р'; (2) о +о р = Р; (3) (4) (5) а+ор = а+о&=>Р = &; (6) а<ор:э Э^а+0S = P); (7) xgzOn =>а+0 U p= U (а+оР); (8) 0<0а&1<0р=)а<0а Хор; (9) (Ю) (11) x^OnZD a Xo U p= U (а Доказательства (1) р +о 1 = Р +о(О') = (Р +оО)'= (?)'. (2) Воспользуемся трансфинитной индукцией (предложение 4.12). Пусть АГ = р(О-(-оР = Р). Прежде всего OgX, так как О+оО = О. Если же 0 -|-о 7 = Т» то 0 4~о (f) = (0+о тУ ="['. Наконец, если him (о) и 0 -|-от = т Для любого т <оа> то 0 -\-0 a = U (0 -j-0 ^) = U т = а, по- х <0 а х<оа тому что U т есть наименьшая верхняя грань множества всех т, меньших а. т<оа (3) Пусть Ar = p(O<op Z) а <0 a-f-o P). Докажем Х=Оп с помощью трансфинитной индукции. Очевидно, ОеХ Если f e X, то a ^;0 a-|-o T» отсюда получаем а ^0 а -|-0 ^ <; (а -f-отУ ■= а Н~о (т')« Если, наконец, 1ш (^) ит£^ для всех т<;о^, то а <<0 af = a -j-o 1 ^о U (a -|~o T) = a ~f о ^ т<0Х Доказательство второй части этого пункта оставляем читателю в качестве упражнения. (4) Снова применяем трансфинитную индукцию. Пусть Аг=^(^а^?(Р<о <о 7 id ос-f-o Р <о а-|-о 7))- Очевидно, OgI Пусть ~{(= X и p<of. Тогда р <0 7 или р = f Если Р <о Т» т0» в СИЛУ Т е ^> a +oP <o a -)-o +о 7 <о (а+о Т)'= a+о f- Если р = 7, то a-f-0 p = a+0 Т<о(а+отУ = = a-j-o7f- Следовательно, fsX Пусть Lim(k) и tgI при любом т<о^« Предположим р<<о^- Тогда р <от ПРИ некотором х<о^> в силу Lim (к). Следовательно, так как tgX, то а -\-0 р <0 a -J-o х ^0 ^о U (а-\-0т) = a-f-0X. Отсюда имеем IgI т<0Х (5) Допустим а -}-0 р = а -|—0 8. Справедливо одно из трех: Р<0&, S<op или р = 8. Если р<0В, то а-}-о Р <о а+о 8, а если S<op, то a -f-o 8 <Соa -f-fl P — и то и другое следует из предыдущего пункта (4) и противоречит предположению, согласно которому а -|-0 J3 = a -J-o S Остается принять, что р = §.
210 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (6) Единственность В следует из (5). Докажем существование. Положим X=P(a<opZD3iB(a-(-oS = p)). Ясно, что OgX Пусть ч t= X, и пусть а <о f. Тогда а <0 «у или a = ?. Если a <0 f, то Э18 (a -)-o & = т)> и пусть a — какое-нибудь порядковое число такое, что a -J-o a = f. Тогда (а-(-оа')==(а-|-оаУ:==7'- Таким образом, Э^ (a -f-0 8 = ff)> и> следовательно, ^ ^ X. Предположим, наконец, что Ыт (к) и i ^ X при всяком т <о ^. Пусть а <0 X. Рассмотрим функцию / такую, что для любого |х, удовлетворяющего неравенствам а <о р <о К /' P- есть (единственное) порядковое число 8, для которого a —1-0 5 = р,. Заметим, что \ — = U jx= U (a+o/»> и если а<о^<о^> то //ЧЮ а <0 (х <0 X а <0 [х <0 X Отсюда, положив р= U (/'р-)» получаем a <о I* <о X Х= U («+«/»= U (a-foa) = a а <0 jx <0 X a < р (7) Пусть х с= Ол. В силу предыдущего пункта (6), существует такое В, что a-|~o&= U (a-f-oP). Мы должны доказать, что В = U р. Если Р е лг, то a —|—о р ^с0 a -j— S. Следовательно, р^08, в силу пункта (4). Таким образом, 8 есть верхняя грань множества всех fex Отсюда U р ^о 8. С другой стороны, если р е х, то a -j-0 р ^0 a -|-0 U р. Сле- довательно, a-}-08= U (а -|-0 Р) ^0 а -f-o U Р и, таким образом, в силу Р6* р б* пункта (4), 8^о U р. Отсюда окончательно получаем Ь= U р. Р €^ Р £х Пункты (8)—(11) оставляются читателю в качестве упражнений. Предложение 4.30. Следующие формулы являются теоремами: (1) р хо1=Р&1 хор = Р; (2) 0 Хор = О; (3) (4) (а ХоР) ХоТ^а Х0(Р (5) а Хо(Р+оТ) = (6) p1 = p&lP=l; (7) (Р^)в = (8) (9) Доказательство. (1)В силу предложения 4.29(2), р хо 1 = = р хоО' = (р xoO)+op = O-fop = p. Равенство же 1 Хор = р легко доказывается трансфинитной индукцией по р. (2) Равенство 0 ХоР = О также легко доказывается с помощью трансфинитной индукции.
§ 4 ТЕОРЕМА ХАРТОГСА НАЧАЛЬНЫЕ ПОРЯДКОВЫЕ ЧИСЛА 211 (3) Пусть ^=7(VaVP((a+op)+o7 = a+o(P+(iT)))- Как легко видеть, (a -f-o Р) +о 0 = a -f-o Р = а +о (Р +о 0), t.cOg X. Пусть ]е! Тогда (а +0 р) +о i = ((а +о Р) +о тУ = (а +о (Р +о т)У = а +о (Р +о тУ = = а-|-о (Р ~Ьо т')> т. е. f е X Наконец, пусть Ыт(к) итеХ при любом т<о^- Тогда, применив предложение 4.29(7), получаем (а-|~0 Р)+о +0X=U ((а+ор)+от)= U (а+о(Р+от)) = а+о U (р +0 т) = а +0 х <0 X т <0 X т <0 X + о (Р+«>*)• Доказательства пунктов (4)—(9) оставляем читателю в качестве упражнений. Мы хотели бы теперь особо остановиться на свойствах операций сложения и умножения порядковых чисел, ограниченных областью о>. Предложение 4.31. Пусть a, р, f су/иь элементы а>. Тогда (1) (2) а X о Р е (3) аР е а>; (4) а+ор = (5) а (6) ( (7) (а Доказательство. (1) Индукция по р. Пусть .Y=P(Va(a eco zd ID а-|-ор е «))). Очевидно, ОеХ Предположим, что р е= X и asw; тогда, согласно определению X, а -|-0 р е ю. Отсюда, на основании предложения 4.10 (2), получаем а -|-0 ф') = (а -|-0 р/ е о). Следовательно, по предложению 4.10(3), со cz X. Читатель сам докажет пункты (2) и (3). (4) Л е м м а. f-a е= ш & р е= со id af -fo Р = a -(-0 P'. Пусть К = p (P e со & Va (a e a) id a' -)-0 p == a -[-о Р'))- Легко видеть, что ОеК Предположим, что реУиаео). Согласно определению К, a'-fop = a-(-op'. Тогда «Г-f-0 ?' = («'+о РУ = (а+о Р7 = *+о (РТ Следовательно, и р'еК Теперь для доказательства пункта (4) положим АТ=Р(Рео>& &Va(aGWDa -j-0 P = Р -)-о °0)- Очевидно, OgX, ас помощью леммы легко доказать, что из р gX следует р' е X. Доказательства пунктов (5)—(7) оставляются в качестве упражнений. Читатель, вероятно, уже обратил внимание на то, что недоказанными остались некоторые основные законы арифметических операций, обычно справедливые в других, хорошо известных числовых системах; таковы, например, закон коммутативности сложения и закон коммутативности умножения. Следующие примеры показывают, что эти и некоторые другие законы обычной арифметики не переносятся на область порядковых чисел.
212 ГЛ 4 АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Примеры. 1. ЗаЗр (а -|-0 р ф р -|-0 а). В самом деле, имеем, с одной стороны, 1-[-оа)= U (1 -]-оа) = «> и вместе с тем со <0 а/ = со -|-01 а<оа> 2. ЗаЗр(ахор^=Р Xо а). Действительно, 2 Хо"> = U (2 х0а) = а)<0 а<0со <00)-J-Oa) = (a) Хо1)+о("> Хо1) = ^ Хо(1 +о1) = а) Х02. 3: З^ЗаЗр ((a-f0 P) ХоТ¥=(а ХоТ)+о(Р ХоТ»- Действительно, (1 +0 -f-o О X о со = 2 X о ю = со и со <0 со -J-o со = (1 X оw) +o (1 X о со). 4. ЗаЗрЗ? ((а X о Р)7 =^ аТ X о Рт). При а=р = 2 и 7 = со имеем (2 хо2Г = 4<°= U 4а = со, 2а>= U 2а = со и со <0со Хоa> = 2w ш Всякой формуле о^ формальной арифметической теории S (см. гл. 3) можно следующим образом сопоставить некоторую формулу е^* теории NBG: заменим сначала в о^ все знаки «-]-» и «•» соответственно на «-[-о» и «Хо»» затем, если а^ есть SSzdo или ~\S3 и если <&* и £?* уже построены, то определим ©^* соответственно как о®* zd ??* или "1 <э©*, если же orf есть Vjcq^ (х) и <й?* (jc) построено, то определим ©^* как Vjc (х е оо id q>®* (jc)), чем и завершается определение ©^*. Определим теперь формулу ет^# как jCiea)&...&jcnea)ZD ©^*, где •^1» •••> хп—все свободные переменные формулы &£. Таким образом, мы ограничили все переменные областью со и проинтерпретировали сложение, умножение и функцию «непосредственно следующий» соответствующими операциями над порядковыми числами. В результате всякая аксиома &£ теории S преобразуется в некоторую теорему о^ф теории NBG. (Для аксиом (S1) — (S3) это очевидно; (S4)# является теоремой в NBG, в силу предложения 4.9(3), а (S5) ф — (S8) ф выражают свойства сложения и умножения порядковых чисел (см. стр. 196—197). Для всякой формулы Q7f теории S формула о/£ф есть предикативная формула теории NBG. Поэтому все частные случаи (S9) ф выводимы с помощью трансфинитной индукции. Действительно, пусть о/1ф (0) & &Vjc(jcg«)D {о^ф (х) =) от£ф (х'))); положим X=у {у е о> & о^ф (у))\ тогда, по предложению 4.10(3), а> ^ X. Следовательно, Vx^^cdid zd о/£ф (х)).) Рассмотрим теперь правила вывода. Легко показать, что если Ьыво^# и I-nbgC^13^)^ to I~nbo^#- Верно также, что если \-тоо?£ф(х), то \-nm0txos£(х))ф. В самом деле, формула о^ф(х) имеет вид х е со Scy1 е «)&.. .&ут е w id g^/* (jc), поэтому если эта формула выводима в NBG, то выводима, очевидно, и формула j/iect)&...&_ywea)iD Vx (jc е со zd a??* (x)), но эта последняя и есть ( Vjc q/£ (x)) ф. Отсюда индукцией по длине вывода формулы rf bS уже нетрудно доказать, что если формула о/£ является теоремой в S, то формула <э/£ф является теоремой в NBG; и мы можем перевести в NBG все теоремы теории S, выведенные в главе 3. Рассмотрим арифметическую функцию h такую, что если х есть гёделев номер формулы orf теории S, то h(x) есть гёделев номер формулы оЛф теорий NBG, и п(х) = 0, если х не является гёделевым номером никакой формулы теории S. Можно доказать, что функция h
§ 4 ТЕОРЕМА ХАРТОГСА НАЧАЛЬНЫЕ ПОРЯДКОВЫЕ ЧИСЛА 213 рекурсивна (и даже примитивно рекурсивна). Пусть К — произвольное непротиворечивое расширение теории NBG. Если х есть гёделев номер некоторой теоремы теории S, то, как мы теперь знаем, h(x) есть гбде- лев номер некоторой теоремы теории NBG, а следовательно, и гёделев номер некоторой теоремы теории К- Пусть S' — расширение теории S, получающееся, если в качестве аксиом взять все те формулы о/£ теории S, для которых соответствующие формулы о/ё^ф являются теоремами теории К- Поскольку теория К, согласно предположению, непротиворечива, то непротиворечива и теория S', а так как теория S существенно рекурсивно неразрешима (следствие 3.37), то теория S' рекурсивно неразрешима, т. е. не рекурсивно множество TS' гёделевых номеров теорем теории S'. Допустим теперь, что теория К рекурсивно разрешима, т. е. что рекурсивно множество Т^ гёделевых номероз теорем теории К. Но характеристические функции CTs, и Стк множеств TS' и Тк связаны соотношением Cts, (х) = Стк (h (x)). Следовательно, тогда и множество Т$' оказалось бы рекурсивным, что противоречит рекурсивной неразрешимости теории S'. Таким образом, теория К рекурсивно неразрешима, и, следовательно, если теория NBG непротиворечива, то она существенно рекурсивно неразрешима. Рекурсивная неразрешимость всякой рекурсивно аксиоматизируемой теории влечет, как известно, неполноту такой теории (см. упражнение 1(Ь), стр. 168). Таким образом, мы имеем следующий результат: если теория NBG непротиворечива, то она существенно рекурсивно неразрешима и существенно неполна. (Этот результат может быть получен и непосредственно, т. е. тем же способом, которым в главе 3 нами был получен соответствующий результат для теории S. См. также упражнения на стр. 175.) По-видимому, теория NBG может служить базой для построения всей современной математики (мы хотим этим сказать только, что для всякого математика ясна принципиальная возможность перевода любой математической теоремы на язык теории NBG, а затем и доказательства ее в NBG или в каком-нибудь подходящем расширении NBG, получаемом добавлением различных «экстра-аксиом», вроде аксиомы выбора). Поэтому существенная неполнота теории NBG указывает, как нам кажется, на известную недостаточность «аксиоматического подхода к математике». Это заключение не зависит от специфических особенностей теории NBG. Из проведенного только что для этой теории рассуждения видно, что существенно рекурсивно неразрешимой и существенно неполной должна быть также и всякая другая непротиворечивая теория (включая сюда, наряду с теориями первого порядка, и «теории высших порядков»), если только представленная в ней арифметика натуральных чисел достаточно сильна для получения всех теорем теории S (или хотя бы теории RR). (В самом деле, достаточно лишь доказать, что в данной теории представимы все рекурсивные функции (см. следствие 3.36). Дальнейшие исследования по вопросам неразрешимости и неполноты см. у Шмульяна [1961] и Тарского, Мостовского и Робинсона [1953].)
214 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ Упражнение Убедиться в том, что определенная выше функция h рекурсивна. (Заметим, что, поскольку +о» Хо и 0 являются дополнительно введенными в NBG функциональными буквами и предметной константой, здесь следует показать, что соответствующее отображение, о котором говорится в предложении 2.29, рекурсивно.) Имеется несколько фактов из «арифметики мощностей» порядковых чисел, которые мы хотели бы теперь рассмотреть. К «арифметике мощностей» мы относим свойства, связанные с операциями объединения |J, декартова произведения X и XY, противопоставляемых операциям -j-0> Хо, и возведения в степень порядковых чисел. Напомним, что X и Xо— это две различные операции и что операции Ху (класс всех отображений Y в X) и а? (возведение в степень для порядковых чисел), несмотря на сходство обозначений, не имеют между собой ничего общего. (Из примера 4 на стр. 212 мы знаем, что 2со = со в смысле возведения в степень порядковых чисел, в то время как, в силу теоремы Кантора, со н 240, если под 2Ш понимать множество всех функций, отображающих со в 2 = {0, {0}}.) В дальнейшем, если это будет необходимо для избежания недоразумений, мы будем ар в смысле возведения в степень порядковых чисел обозначать через ехр (а, (3). Предложение 4.32. (a) |— со X со ~ со. (b) Если каждый из классов X и У содержит не менее двух элементов, то X\j Y^<X x Y. (c) Den (х) & Den (у) id Den (x [} у). Доказательство, (а) Пусть / есть функция с областью определения со и такая, что /*а=(а, 0) для любого а е со. Такая функция является взаимно однозначной и отображает со в некоторое подмножество множества со х со. Поэтому со ^ со х со. Обратно, пусть g—функция с областью определения со х со и такая, что g'(a, (3) = 2a ХоЗр для любой пары (а, (3) е со х со. Читатель может сам доказать в качестве упражнения, что эта функция взаимно однозначна. Следовательно, со х со ^ со. По теореме Шредера—Бернштейна, со х со ~ со. (b) Пусть а\ еА', я2 ^ X, ах Ф аъ JjS Yy b% e Y и Ъ\ Ф b%. Определим функцию / следующим образом: (х, bi), если х е Х\ (ah х), если лге У—X и хфЬ\, (#2, Ьъ)у если x = bi и дге Y—X. Функция / является взаимно однозначной, с областью определения Х[] У и областью значений в виде некоторого подмножества X X К Следовательно, Х[) Yz<X X Y. (c) Пусть Den (А) и Den {В). Тогда множества А и В содержат каждое не менее двух элементов. Поэтому, в силу предыдущего пункта (Ь),
§ 4 ТЕОРЕМА ХАРТОГСА НАЧАЛЬНЫЕ ПОРЯДКОВЫЕ ЧИСЛА 215 А{] В^< А X В. НоА~о) и /?~о). Следовательно, А X Вс^ю X <*>, и потому Ли^^шХ«)~а). В силу предложения 4.27, либо Den (A [J В), либо Fin (A [j В). Но так как А^А[}В и Den (А), то ~]Fin(A\JB). Для дальнейшего изучения сложения и умножения порядковых чисел весьма полезно получить конкретную интерпретацию этих операций. Предложение 4.33 (сложение). Пусть (R, А) подобно (Еа> a), (S, В) подобно (Ер, р) и А(]В = 0. Зададим отношение Т на А[)В условием: (х, у) &Т = (х ^ А &у е В) \J (х^. А &у еА&(л;, у) е &R)\J (х & В ку sM(x, _у) е 5). (Таким образом, Г совпадает с /? на А и с 5 на В, и всякий элемент из А J-предшествует всякому элементу из В.) Тогда Т вполне упорядочивает А[}В и (Г, А[}В) подобно (£а+о(з> а+оР>- Доказательство. Прежде всего, легко убедиться в том, что Т вполне упорядочивает А[) В, поскольку R и S вполне упорядочивают соответственно А и В. Чтобы доказать подобие (Г, А [) В) и (Еа+Ор> а-|~ор)> применим трансфинитную индукцию по (3. Если р—Ю, то и В = 0, и тогда T=R, А\]В = А и а -|—0 р = а, а потому, очевидно, (Ту A U В) и (£а+0(з, а+оР) подобны. Предположим, что утверждение верно для f> и положим P = y'- ^aK как (*$ ^) и (^ Р) П°Д°^НЬ1> т0 имеется функция / с областью определения В и областью значений (3 и такая, что для любых л: и у из В (х, у) ^ S тогда и только тогда> когда /' * е /"'.у. Пусть 6 = (/)' т, и положим 5f = В — {Ь} и Si = S ft (Bx X Вх). Из того, что Ь является максимальным относительно отношения 5 элементом в S, следует, что Si вполне упорядочивает В\. Кроме того, очевидно, Bi\f является подобным отображением Вх на -\. Пусть Т\ = Т П ((А О А) X (Л U ^i))« По индуктивному предположению, (Гь A[)Bi) подобно (£а_|_оТ, а —|—0 т) с некоторым подобным отображением gt имеющим областью определения А [) Bi и областью значений а -]-0 у. Продолжим g до gi = £|J {(by a-f-от)}- ^Ta последняя функция и осуществляет подобное отображение А[)В на (а4-оТ)' = а~Ь>т' = а4~оР- Пусть, наконец, имеем Llm(§\ и предположим, что утверждение справедливо при любом ^<;оР. Пусть снова/—подобное отображение В на р. Для каждого т<ор положим Вх — (/)а1) SX = S[)(BZ X Вт) и 7\ = Т П ((A U £т) X (Л U ^т))- Согласно индуктивному предположению и в силу следствия 4.16(2), для каждого т<ор существует единственная функция gT, осуществляющая подобие пар (Тх, А[)ВХ) и (£"а+оТ, а -f-oт)- Очевидно также, что если Tt <!о тз <Со Р, то ТХ11 gX2 осуществляет подобие пар <7\р А\]ВХ1) и (Ea+oXl, а-j-QTj), и, следовательно, в силу единственности ть ГТ11^Т2 = ^Т1, а потому ^Т2 является продолжением g^. Таким образом, функция g= U gx осуществляет подобие (Г, U (А (] Вх)) и <^ и (а+оТ), U (а+от)>. Но U (А[]ВХ) = А\}В и U (а +ох) = = ос —|—о Р> чем и завершается трансфинитная индукция. Предложение 4.34 (умножение). Пусть (R, А) подобно (Еа, а), (S} В) подобно (E&t P) u отношение W на А X В задано условием
216 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ «*, у), {и, v)) <= W= (xe=A&u<==A&y€=B&ve=B)& (((у, v) <= S) V y(j/ = t)&(j:,M)Efi)). Тогда W вполне упорядочивает Ах В и (W, Ах В) подобно (faxopi a Xo?>. Доказательство. Аналогично доказательству предыдущего предложения 4.33. Предоставляется читателю в качестве упражнения. Примеры. 1. 2Хо"> = о>. Пусть </?, А) = {Еъ 2) и <S,fi) = = (Zr^, со). Тогда пары из 2 X о> могут быть вполне упорядочены следующим образом: <0, 0>, (1,0), <0, 1>, <1, 1>, (0, 2>, (1,2), ..., (0, п), <1,л>, <0,/i+l>, <1, лг-f- 1>, ... 2. В силу предложения 4.30(5), о> х о 2 = w-|-0 а>. Пусть (R, Л) = = (£<„, со) и (5, 5) = (^ 2). Тогда о) X 2 может быть вполне упорядочено следующим образом (см. предложение 4.34): (0, 0), (1, 0), (2, 0),... ..., (0, 1>, (1, 1), <2, 1), ... Предложение 4.35. Для любого а соаXюа~соа. Доказательство. (Серпинский [1958].) Допустим, что утверждение неверно, и пусть а — наименьшее порядковое число, для которого 1 (о>а X <*>а ^ а)а). Тогда для всякого р < соа выполнено со х X а) ~ а) В силу предложения 4.32(1), О<оа- Положим р = соа х (*>а, и для любого Р^о^а Рь = Т ^ (Т ~4~o ^ — Р)- Покажем, что Р= U Pfl. P<0Wa Если -[ -f-o 8 = р <0 а>а, то 1 ^о Р <о ">« и s ^o P <о ">а, и, следовательно, (Т» 8) е о)а X (оа = Р. Итак, U Рп^Р. Для доказательства обратного включения Рс U Ра достаточно показать, что если f <0 ^а и ^ <о ^ то т+о^^^а- Итак, пусть т <0^>а и 5 <owa. 7 и 8 равномощны соответственно некоторым начальным порядковым числам со^ ^0 j и шр ^0 8. Обозначим через С наибольшее из порядковых чисел аир. Так как Т <о wa и S <0 «>а, то шс <0 а>а. Поэтому, в силу минимальности а, а>с X а)с^£О)с. Пусть Л = ^х{0} и 5 = S х {1|. В силу предложения 4.33, A\JB ~]f-|-o8. Так как f —^ и ^^^^р» то ^4^^^а X {0} и £?~а>рх {1}. Отсюда, принимая во внимание, что А[]В = 0у получаем AUB^KX {0})U(о)р X {1}). Однако, в силу предложения 4.32(2), К X {0}) U (^р X {1})=ЗК X {0}) X ((ор X {1})~а)аХо)р=Ча)сХа)с~а)с, и потому y Ч~о 8 г^ сос <<о <оа. Так как a>a есть начальное порядковое число, то 7 -\-0 Ь <0 a)a. (Ибо в противном случае, т. е. если бы было соа ==^0 ^ ~f~o Ъ, мы имели бы а>а ^< сос и а>с г< ">а одновременно, что, по теореме Шредера — Бернштейна, влечет coa = a)c, в противоречие с со ^о^а-) Таким образом, Р= U Р0. Рассмотрим Р0 при Р<о^а- На основании предложения 4.29(6), для любого 7^ор существует и притом единственное порядковое число 5 такое, что -у -j—о ^ == Р- Отсюда следует, что существует функция, подобно отображающая р' на множество Р , упорядоченное по величине первых компонент f входящих в него пар <7> 8). Определим следующее отношение R на Р. Для любых
§ 5 АКСИОМА ВЫБОРА АКСИОМА ОГРАНИЧЕНИЯ 217 0<Оа)а> Iх ^^а И ^0Ша ПОЛОЖИМ (<J, 8), (jl, v)) S i? ТОГДЯ И ТОЛЬКО тогда, когда либо ?+о 8 <0 ц+о ^, либо f -{-о 8 = р-f"o v&T<olx- Тогда если р! <о рз <С о wa, то пары из Ppj предшествуют относительно R парам из Рр2, а в пределах каждого Рр пары упорядочены относительно R по величине своих первых компонент. Легко видеть, что R вполне упорядочивает Р. Так как Р —<*>а X о>а, то теперь достаточно показать, что (R, Р) подобно (Е^ , a)a). В силу предложения 4.17, (R, Р) подобно некоторой паре (Е^ £), где £ — порядковое число. Отсюда следует, что Р ~ Е. Допустим, что coa <o E. Пусть / есть функция, осуществляющая подобное отображение (^, Е) на (R, Р), и пусть £=/'сюа. Тогда £ есть упорядоченная пара (f, 8), где f^o^a и 8<Со(*)а> а <оа 1 /, очевидно, является подобным отображением (Z:^ , a>a) на /^-сегмент Y=Seg^(Py (f, 8)) множества Р, определенный парой <j> 8). Очевидно, К£^(оа. Пусть р = y -fo 8 и (о, р) е К, тогда о -f-0 Р ^о Т +о 8 = Р; следовательно, а ^0 р и р ^о Р- Поэтому Y ^ р' X Р'. Но pf <0 a>a. Следовательно, p'~u)p где {А<оа. На основании определения соа, а)^ х (D^r^a)^. Итак, мы получаем wa^Kr<^ что находится в противоречии с о)^ -^ о)а. Следовательно, \ ^0 ^а- Поэтому Р ^< соа. Пусть теперь h есть функция, определенная на a3a и такая, что /г'Р = (р, 0) для любого Р <о °V Очевидно, h является взаимно однозначным соответствием между Р и подмножеством ша х {0} множества ооа X ^а» и потому o>az^P. Но тогда, в силу теоремы Шредера — Бернштейна, a>ac^P, что противоречит определению порядкового числа а. Следовательно, о) X оо ~ о) при любом р. Следствие 4.36. Если Л~и)а, Б~о), a f — наибольшее из порядковых чисел а, р, то Лх5^ш1 и А[)5~о)г В частности, ша X а>р ~ шт. Доказательство. На основании предложений 4.35 и 4.32(2), <»7 z< Л U ^ i4 А X £ ~ о)а X togi< (i)7 x coT r^: a>r Отсюда, по теореме Шредера — Бернштейна, следует А X Вс^ы^ и А{]Вс^шТ Мы здесь изложили лишь самые начала арифметики порядковых чисел. Дальнейшие сведения по этой теме можно найти у Серпин- ского [1958] и у Бахмана [1955]. § б. Аксиома выбора. Аксиома ограничения Аксиома выбора является одним из самых знаменитых и наиболее оспариваемых утверждений теории множеств. Мы сформулируем эту аксиому в следующей теореме, говорящей о ее эквивалентности ряду других важных утверждений. Предложение 4.37. Следующие формулы эквивалентны: (1) Аксиома выбора (АС): Для любого множества х существует функция f такая, что для всякого непустого подмножества у множества х /' у е у (такая функции называется выбирающей функцией для х).
218 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (2) Мультипликативная аксиома (Mult): Для любого множества х непустых и попарно непересекающихся множеств, существует множество у (называемое выбирающим множеством для х), которое содержит в точности по одному элементу иЬ каждого множества, являющегося элементом х. (и е х zd и Ф О & Vi> (v & х & v Ф и zd v П и = 0)) :э ID ЗуУ/ll (ll^XZD 3\W (W^U fly)). (3) Принцип вполне упорядочения (W. О.): Всякое множество может быть вполне упорядочено. Vx3y(y We х). (4) Трихотомия (Irich): VxVy (x ^<y V у z< x)- (5) Лемма Цорна (Zorn): Если в частично упорядоченном множестве х всякая цепь (т. е. всякое упорядоченное подмножество) имеет верхнюю грань, то в х существует максимальный элемент. VxVy ((у Part x) & Vи (и ^х&у Tot и =) 3v (v e x & Vw (w^uidw = = v V (w, v) eу))) zd3v(vgx& Vze;(w ^xzd (v, w) фу))). Доказательство. (1) |— (W. O.)zd Trich. Пусть даны множества x и у. Согласно (W. О.), хну могут быть вполне упорядочены. Поэтому, в силу предложения 4.17, существуют такие порядковые числа аир, что х ~ а и у ~ р. Но так как а ^ р или (3 ^< а, то либо х^<У, либо ^z^^- (2) \—Trich zd(W. О.). Пусть дано множество х. Согласно теореме Хартогса, существует такое порядковое число а, которое не равномощно никакому подмножеству множества х. Тогда, в силу Trick, x равно- мощно некоторому подмножеству у порядкового числа а, и вполне упорядочение Еу множества у порождает некоторое вполне упорядочение множества х. (3) |— (W. О.) zd Mult. Пусть х есть некоторое множество непустых, попарно непересекающихся множеств. Согласно (W. О.), существует отношение R, вполне упорядочивающее множество U (х). Следовательно, существует такая определенная на х функция /, что f'u для любого и ^ х есть наименьший относительно R элемент и. (Заметим, что а £ U (х).) (4) |— Mult zd AC. Для любого множества х существует функция g такая, что если и есть непустое подмножество х, то giu = uX {и}. Пусть Х\ — область значений функции g. Легко видеть, что Х\ является множеством непустых попарно непересекающихся множеств. На основании Mult, для Х\ существует выбирающее множество у. Отсюда, если 0 Ф и и и <= х, то «X {и} ^ Х\ и у содержит и притом единственный элемент (v, и) из и X {и}. Функция fiu = v является искомой выбирающей функцией для х. (5) [— AC id Zorn. Пусть у частично упорядочивает непустое множество х таким образом, что всякая дмхепь в х имеет в х верхнюю грань. На основании АС, для х существует выбирающая функция /.
§5. АКСИОМА ВЫБОРА. АКСИОМА ОГРАНИЧЕНИЯ 219 Рассмотрим произвольный элемент Ь множества х, и по трансфинитной индукции (предложение 4.13) определим функцию F такую, чтобы выполнялось F'0 = b и рс(х=/'и для любого а, где и есть множество всех таких верхних граней v множества F" а относительно упорядочения у, что v е х и v qL F" а. Пусть (3 есть наименьшее порядковое число, которому соответствует пустое множество верхних граней v множества F"(3 относительно упорядочения у, принадлежащих х и не принадлежащих F" (3. (Порядковые числа, обладающие таким свойством, существуют; в противном случае функция F была бы взаимно однозначной с областью определения On и с некоторым подмножеством множества х в качестве области значений, откуда по аксиоме замещения R следовало бы, что On есть множество.) Пусть g = p1/\ Нетрудно видеть, что функция g взаимно однозначна и что если а <о 7 <о Р> то (£"'а> £'т) ^У- Поэтому множество g" (3 является jz-цепью в х Согласно условию, в х существует верхняя грань w множества g"$. Так как множество верхних граней множества F"P (=g-"P), не содержащихся в #"р, пусто, то зде#"Р, и, следовательно, w является единственной верхней гранью множества g"$ (ибо всякое множество может содержать в себе не более одной своей верхней грани). Отсюда следует, что w есть максимальный относительно упорядочения у элемент множества х. (Действительно, если (w,z)^y и z e х, то z должно быть верхней гранью g"p, что, очевидно, невозможно.) (6) \— ZornzD(W. О.). Пусть z есть множество, а X есть класс всех взаимно однозначных функций /таких, что §Р(f) e On и <M(f) ^ z. Из теоремы Хартогса следует, что X есть множество. Очевидно также, что ОеХ Отношение cz частично упорядочивает Х Каковы бы ни были две функции, принадлежащие одной и той же цепи в X, одна из них является продолжением другой. Поэтому для любой цепи в X объединение всех принадлежащих ей функций есть снова взаимно однозначная функция, принадлежащая той же цепи. Следовательно, на основании Zorny в X имеется максимальный элемент g, представляющий собой взаимно однозначную функцию, определенную на некотором порядковом числе а и принимающую значения из z. Допустим, что z — g"oLz?L0. Пусть b^z — g"a, и положим f=g[) {(a, b)}. Тогда, очевидно, /е X и gaf, что противоречит максимальности g. Следовательно, g"& = z, т. е. olczLz. Посредством функции g отношение Еа, вполне упорядочи- g вающее множество а, преобразуется в некоторое отношение, вполне упорядочивающее z. Упражнения 1. Доказать, что следующие утверждения эквивалентны аксиоме выбора: (a) Всякое множество равномощно некоторому порядковому числу. (b) (Специальный случай леммы Цорна.) Если объединение всех элементов всякой непустой cz-цепи в непустом множестве х является снова элемеи том х} то в х имеется максимальный относительно отношения с: элемент.
220 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ (c) (Принцип максимальности Хаусдорфа.) Если х — множество, то всякая с-цепь в х является подмножеством некоторой максимальной оцепи в х. (d) (Лемма Тайхмюллера — Тьюки.) Всякое множество конечного характера имеет максимальный относительно отношения cz элемент. (Непустое множество х называется множеством конечного характера, если (i) всякое конечное подмножество всякого элементах есть также элемент л:, и (ii) элементом х является всякое множество у, все конечные подмножества которого су*гь элементы X.) (e) У/х (Rel (х) => Зу (Fnc (у) & & (х) = & (у) by s *)). 2. Показать, что в NBG выводима следующая «конечная» аксиома выбора: для всякого конечного множества х непустых попарно непересекающихся множеств существует выбирающее множество у. (Указание. Пусть х с~ а, где а <= <о; далее — индукция по а.) Предложение 4.38. Следующие утверждения являются следствиями аксиомы выбора: (I) Всякое бесконечное множество имеет счетное подмножество. (II) Всякое бесконечное множество бесконечно по Дедекинду. (III) Если х есть счетное множество, элементами которого являются счетные множества, то множество \J(x) счетно. Доказательство. (I) Примем АС. Пусть х — бесконечное множество. Согласно упражнению 1(а) на стр. 219, х равномощно некоторому порядковому числу а. Так как х бесконечно, то бесконечно и а. Следовательно, со<:0а, и потому со равномощно некоторому подмножеству х. (II) Следует из (I) и упражнения 13(с) на стр. 206. (III) Пусть х—счетное множество счетных множеств. Рассмотрим функцию /, которая каждому и ^ х сопоставляет множество всех взаимно однозначных отображений и на со. Пусть z — U (е^ (/)). В силу аксиомы выбора (примененной к г), существует функция g такая, что g' v^v для каждого непустого v £= z. В частности, если и е х, то ^'(/'w) представляет собой некоторое взаимно однозначное соответствие между и и со. Пусть теперь h — какое-нибудь взаимно однозначное соответствие между со и х. Определим функцию F на U (х) следующим образом. Пусть j/gU (х) и п есть наименьший элемент со, для которого у е h' п. Очевидно, /г'/ig х, и, следовательно, g'if'ih*n)) является взаимно однозначным соответствием между h<n и со. Положим теперь F'y=^ = (пу (#'(/'(^' я)))'j/). Нетрудно видеть, что F есть взаимно однозначная функция с областью определения Щл;) и областью значений, являющейся подмножеством множества со х со. Таким образом, U (х) ^ ^ со X со. Но так как со х со ~ со, то U (х) г^ со. Если же v e х, то v £= U (х) и ?j~co; следовательно, со^Щх). По теореме Шредера— Бернштейна, заключаем, что U (х) ~ со. Упражнения 1. Для каждого множества х определим декартово произведение JJ и как множество всех функций / с областью определения х и таких, что/' ueu при любом цел:. Доказать, что аксиома выбора эквивалентна утверждению о том,
§ 5. АКСИОМА ВЫБОРА АКСИОМА ОГРАНИЧЕНИЯ 221 что для каждого множества х непустых множеств декартово произведение JJ и и 6 х непусто. 2. Опираясь на аксиому выбора, показать, что всякое частичное упорядочение произвольного множества х погружается в некоторое полное упорядочение того же множества х. 3. Доказать, что следующее предложение следует из аксиомы выбора: каковы бы ни были порядковое число а и множество х, если х^(йаиУй(ие ехэйЧ а>а), то U (x) г^ «а. (Указание. Доказательство аналогично доказательству предложения 4.38 (Ш).) По-видимому, более сильной формой аксиомы выбора является следующая формула (UCF): 3X (Fnc (X) & Vm (и ф О => X' и е= и)). (UCF утверждает существование универсальной выбирающей функции, т. е. такой функции, которая каждому множеству сопоставляет некоторый его элемент.) UCF очевидным образом влечет АС, однако неизвестно, верно ли обратное, т. е. следует ли UCF из АС. Если мы примем аксиому выбора АС, то теория кардинальных чисел упростится, так как АС влечет, что всякое множество х равномощно некоторому порядковому числу и, следовательно, некоторому начальному порядковому числу а)а. Этим начальным порядковым числом а)а мы будем обозначать кардинальное число (или мощность) множества х. Таким образом, мы отождествляем кардинальные числа с начальными порядковыми числами. В соответствии с общепринятой системой обозначений, мы будем вместо а>а писать fta. Предложения 4.35—4.36 устанавливают некоторые из основных свойств сложения и умножения кардинальных чисел. Положение аксиомы выбора стало за последние годы менее спорным. Большинству математиков она представляется утверждением, совершенно правдоподобным. Кроме того, аксиома выбора имеет столь многочисленные и важные применения практически во всех отраслях математики, что отказ от нее выглядел бы как преднамеренная подножка работающему математику. Ниже в этом же параграфе мы обсудим вопрос о совместимости аксиомы выбора с остальными аксиомами теории множеств и ее независимости от них. Другим предложением, которое было выдвинуто в качестве одного из основных принципов теории множеств, является следующая, так называемая аксиома ограничения (аксиома D): MX (X ф 0 иэ Зу (у е X & &у f| Х=0)) (т. е. всякий непустой класс X содержит элемент, не имеющий с X общих элементов). Предложение 4.39. Аксиомой фундирования называется формула "1 Зх (Fnc (х) & §8 (х) = ш & Vm (и е a> id х ' (н') е х' м)) (т. е. не существует бесконечной убывающей ^.-последовательности хх э э^э...). (1) Аксиома ограничения влечет аксиому фундирования, (2) Если принять аксиому выбора, то из аксиомы фундирования следует аксиома ограничения. (3) Из аксиомы ограничения следует, что не существует никакого конечного ^-цикла, т. е. что невозможна функция /,
222 ГЛ 4 АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ определенная на каком-нибудь отличном от нуля конечном порядковом числе о! и такая, что /'Og/M e... е/'а ^/'0; в частности, отсюда следует, что не существует такого множества у, чтобы у gj;. Доказательство. (1) Допустим Fnc (х) & £& (х) = со & Vw (и s е со id .*;'(*/) е л:'и))- Пусть z = xu(o. По аксиоме ограничения, в z существует такой элемент у, что y[)z = 0. Так как у & z, то у=/1си для некоторого конечного порядкового числа а. Тогда /'(а') е^П-2'» чего, однако, не может быть из-за y(]z = 0. (2) Определим сначала для произвольного множества и транзитивное замыкание и. Пусть g— функция, следующим образом определенная по индукции на со: gt0 = {u}, gt(a!) = U (g'a) для любого а е со. Таким образом, gi\=u, g'2 = U(u) и т. д. Назовем транзитивным замыканием множества и множество TC(u) = \J(gu со). Для любого и ТС (и) транзит ивно, т. е. \fv(v е ТС (и) id v s 7 С (и)). Примем теперь аксиому выбора и аксиому фундирования и допустим, что существует такой класс Х=^=0, что ни один его элемент у не удовлетворяет условию у(]Х = 0. Пусть Ъ есть некоторый элемент класса X. Тогда Ь(]ХфО. Пусть, далее, с = ТС(Ь)(]Х и, согласно аксиоме выбора, h — некоторая выбирающая функция для с. Зададим на со функцию / условиями /<0 = Ь и /<(af) = ht((fta)(]X) для любого а е со. Теперь легко видеть, что /' (а')=/* а при любом а ^ со, и мы пришли к противоречию с аксиомой фундирования. (Приведенное доказательство по существу сводится к следующему: выбираем сначала какой-нибудь элемент Ь из X, затем с помощью функции h выбираем некоторый элемент /'1 из b П X, затем, благодаря тому, что общая часть /'1 и Ь[\Х непуста, выбираем некоторый элемент /' 2 из /Ч f| А' и т. д.) (3) Допустим, что имеется некоторый конечный е-цикл: /'0е g/Mg...g/'/ig/'О. Пусть X есть область значений функции /, т. е. Х={/'0, /Ч, ..., f*n}. Из аксиомы ограничения следует, что /</р|Х = 0 при некотором /, чего не может быть, ибо всякий элемент из X содержит в себе некоторый элемент, являющийся одновременно и элементом X. Замечание. Применение аксиомы выбора при выводе аксиомы ограничения из аксиомы фундирования является необходимым. Можно показать (см. Мендельсон [1958]), что если теория NBG непротиворечива, то, добавив к ней в качестве единственной новой аксиомы аксиому фундирования, мы получим такое расширение теории NBG, в котором аксиома ограничения невыводима. Следующая функция 47, определяемая по трансфинитной индукции, была впервые рассмотрена фон Нейманом: W ' (оО = & (W ' а), (X) => Ф ' X = U OF'P
§ 5. АКСИОМА ВЫБОРА АКСИОМА ОГРАНИЧЕНИЯ 223 Пусть H = \J(WuOri)) /У = U (Ф*а Р) и р есть такая функция, определенная на Я, что р1х для любого х^Н есть наименьшее порядковое число а, для которого дгеЯ'а. Назовем р'х рангом х. Заметим, что р* х всегда является порядковым числом первого рода. Упражнения 1. |— On £ Н. (Указание. Применить трансфинитную индукцию.) 2. |— Va (р * a = a'). (Указание. Применить трансфинитную индукцию.) 3. |- Trans (Я), т. е. и ев Я =э и gz //. 5. |— и г Н zd и е Н. (Указание. Пусть X — наименьшее порядковое число, большее чем ранг любого элемента множества и. Тогда и ^ Ч?' X и, следовательно, и е £Р> (ч7 ' X) = 4f (Xf).) Предложение 4.40. Аксиома ограничения эквивалентна утверждению, что V = H, т. е. что всякое множество является элементом Н. Доказательство. (1) Допустим, что V=H. Пусть ХфО, a — наименьший из рангов p'jc, где х е X, и Ь — какой-нибудь из элементов X, ранг которых равен а. Тогда Ъ [\ X = 0, ибо в противном случае из и ^ b [\ X следовало бы, на основании предыдущего упражнения 4, что р * и <о plb — a, чего не может быть, согласно определению а. (2) Примем аксиому ограничения и допустим, что V—НфО. Согласно аксиоме ограничения, существует такое множество у, что у е GV — H&y(](V—Н) = 0. Легко видеть, что у^И. Отсюда по предыдущему упражнению 5, заключаем, что у^Н. Мы пришли к противоречию с у е V — И. Упражнения 1. Показать, что аксиома ограничения эквивалентна следующему своему частному случаю: хф0-=>Зу(уеЕхку(}х = 0). 2. Предположив аксиому ограничения, показать, что хеО/г эквивалентно утверждению Trans (х) к Е Con х, т. е. формуле Vw (и е х zd u ^ x) к к VmVz/ (а е х к v е х к и Ф v zd и е v kv e и). Таким образом, с помощью аксиомы ограничения определение понятия порядкового числа может быть значительно упрощено. Предложение 4.40 делает весьма заманчивой идею присоединения аксиомы ограничения к NBG в качестве новой аксиомы. В самом деле, ведь равенство V = H утверждает, что всякое множество может быть получено, исходя из 0, посредством применения операций образования множества всех подмножеств и объединения всех элементов данного множества некоторое трансфинитное число раз. Понятно поэтому, что, получив в свое распоряжение такое утверждение, мы смогли бы прояснить наши довольно смутные представления о множествах. Кроме того, как мы только что видели в упражнении 2, аксиома ограничения позволяет
224 ГЛ 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ упростить определение понятия порядкового числа. Наконец, и теорию кардинальных чисел можно строить с помощью аксиомы ограничения, определяя кардинальное число всякого множества х как множество всех тех уу которые имеют наименьший ранг в классе всевозможных и, удовлетворяющих условию x~w. (В основу теории кардинальных чисел кладется при этом требование существования такой функции Card, областью определения которой был бы класс V и которая удовлетворяла бы условию Card*x= Card'у=;Х~у.) Математики, однако, не единодушны в вопросе о том, имеются ли достаточные основания для того, чтобы допустить аксиому ограничения в качестве новой аксиомы. Дело в том, что хотя аксиома ограничения и обладает большой упрощающей силой, однако по своему непосредственному правдоподобию она уступает даже аксиоме выбора, не говоря уже о том, что она до сих пор еще не нашла себе математических применений. Введенный выше класс Н в следующем смысле определяет внутреннюю модель теории NBG. Для всякой формулы о?£ (записанной без сокращенных обозначений) со свободными переменными Yh ..., Yn обозначим через RelH(o/£) формулу, полученную из формулы оУё заменой в ней всякой подформулы \fX<£ft(X) (начиная с самых внутренних) на VAT (X ^ Н а а® (X)) и добавлением к результату таких замен посылки (Ki^//&...& Yn^H)zD. Иными словами, образуя RelH(X), мы ишер- претируем «класс» как «подкласс класса Я». Тогда оказывается, чго для любой теоремы а^ теории NBG формула RelH(a^f) тоже является теоремой теории NBG. Упражнение Доказать, что для всякой аксиомы ат# теории NBG формула RelH(Qy£) есть теорема в NBG. Отметим, что RelH(yxSB) эквивалентно Vjc (x e H zd q®#), где q®# есть RelH(3$). В частности, RelH(M(X)) есть ЗК(КдЯ&ХеГ), что эквивалентно X ^ Н. Таким образом, «множествами» внутренней модели являются элементы Н. При семантическом подходе мы должны заметить лишь, что, какова бы ни была модель N теории NBG (в обычном смысле слова «модель»), объекты X модели N, которые удовлетворяют условию X <=: Ну также образуют модель теории NBG. Можно, кроме того, показать, что во внутренней модели справедлива и аксиома ограничения. Именно в этом и состоит первая часть предложения 4.40. Непосредственным следствием этого факта является совместимость аксиомы ограничения, т. е. если теория NBG непротиворечива, то непротиворечиво и расширение этой теории, получаемое за счет добавления аксиомы ограничения в качестве единственной новой аксиомы. С помощью соответствующей модели можно доказать также и независимость аксиомы ограничения от аксиом теории NBG (см. Бернайс [1954], часть VII); правда, модель эта оказывается уже более сложной, чем та, с помощью которой только чю была доказана совместимость. Таким образом, по
§ 5. АКСИОМА ВЫБОРА АКСИОМА ОГРАНИЧЕНИЯ 225 отношению к теории NBG аксиома ограничения оказывается одновременно совместимой и независимой: как она, так и ее отрицание могут быть без противоречий присоединены к теории NBG, если, разумеется, последняя сама непротиворечива. (В сущности теми же доказательствами можно воспользоваться и для установления фактов независимое!и и совместимости аксиомы ограничения по отношению к теории NBG -J- (АС).) Аксиома выбора также независима и совместима по отношению к теории NBG. Сначала Гёдель [1940] показал, что если теория NBG непротиворечива, то непротиворечива и теория NBG -|-(АС)-[-(аксиома ограничения)-)-(GCH), где (GCH) обозначает так называемую обобщен- ную континуум-гипотезу: Vjc Vj/ ~] (Inf (x)8zx-^>y&y-^^b (x)). (На самом деле, это утверждение страдает некоторым излишеством, ибо Серпинский [1947J и Шпеккер [1954J доказали, что |— (GCH) id zd (AC).) С другой стороны, Мендельсон [1958] доказал, что если теория NBG непротиворечива, то аксиома выбора невыводима даже в расширении этой теории, получающемся в результате добавления к ней аксиомы фундирования в качестве новой аксиомы. Таким образом, если теория NBG непротиворечива, то к ней без противоречия можно присоединить как саму аксиому выбора, так и ее отрицание. (Однако вопрос о независимости аксиомы выбора от аксиом теории NBG -j- (аксиома ограничения) остается пока открытым *).) Упражнения 1. Показать, что в модели Л/а, «классами> которой являются подклассы /7а, все аксиомы теории NBG (кроме, быть может, аксиомы бесконечности и аксиомы замещения) выполнены тогда и только тогда, когда а есть порядковое число второго рода (т. е. когда имеет место Urn (а)). Доказать также, что На удовлетворяет аксиоме бесконечности тогда и только тогда, когда со <0 а. 2. Показать, что аксиома бесконечности невыводима из остальных аксиом теории NBG, если последние образуют непротиворечивую систему аксиом. (Указание. Рассмотреть модель Нш, «классами» которой являются подмножества /Уш, и доказать, что аксиома бесконечности в этой модели не выполнена, а остальные аксиомы NBG выполнены.) *) По существу этот вопрос вместе с таким же вопросом для обобщенной континуум-ншотезы перестал быть открытым уже вскоре после того, как была написана эта книга, так как на теорию NBG ~\- (аксиома (ираничения) может быть перенесен результат П. Дж. К о э н а [1963— 1964] о независимости аксиомы выбора и обобщенной континуум-гипотезы для системы аксиом теории множеств Цермело - Френкеля ZF. Теория ZF получается из описываемой ниже на стр. 227 теории ZSF добавлением к ней аксиомы ограничения. Коэн доказал, что если теория ZF непротиворечива, то в ней невыводима аксиома выбора, а обобщенная континуум-! ипотеза невыводима в теории ZF + (аксиома выбора). Изложение этих результатов, а заодно и прежних результатов Гёделя о совместимости аксиомы4 выбора и обобщенной континуум-гипотезы (применительно к ZF) можно найти также в книге Коэн а [1966), переведенной недавно на русский язык. Здесь необходимо также указать на цикл статей Во пенки [1965], [1966], в которых отличными от коэновских методами доказывается, между прочим, и независимость обобщенной континуумчипотезы (для системы Гёделя—» Бернайса с аксиомой выбора). (Прим. перед.) 8 Э. Мендельсон
226 ГЛ. 4. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ МНОЖЕСТВ 3. Показать, что аксиома замещения R невыводима из аксиом Т,Р, N, В1—В7, U, W, S, если эти последние совместимы. (Указание. Показать, что #<o-i-0a> является моделью для аксиом Т, Р, N, В1—В7, U, W, S, но не для аксиомы R.) 4. Порядковое число а называется недостижимым, если Нл является моделью теории NBG. Поскольку NBG имеет лишь конечное множество собственных аксиом, утверждение, что а есть недостижимое порядковое число, может быть выражено как конъюнкция релятивизированных посредством На собственных аксиом NBG. Однако утверждение существования недостижимых порядковых чисел недоказуемо в теории NBG, если последняя непротиворечива. То же самое верно для расширения этой теории с помощью аксиомы выбора и обобщенной континуум-гипотезы. (См. Шепердсон [1951 — 1953], Монтегю и Boot [1959], а также, в этой связи, Бернайс [1961] и Л ев и [I960].) В свое время была установлена связь недостижимых порядковых чисел с некоторыми проблемами теории меры и алгебры (см. У лам [1930], Зиман [1955], Эрдёш иТарский [1961]). Вопрос о непротиворечивости расширения теории NBG добавлением аксиомы, утверждающей существование недостижимых порядковых чисел, остается пока открытым. 5. Функция w называется ^-последовательностью, если ее область определения совпадает с а. Если к тому же область значений функции w состоит из порядковых чисел, то назовем такую функцию а-последовательностью порядковых чисел. Наконец, если из р <0 7 <0 а всегда следует w ф) <0 w (7), то будем говорить, что w есть возрастающая ^-последовательность порядковых чисел. В силу предложения 4.11, если w есть возрастающая а-последовательность порядковых чисел, то U (w u а) есть наименьшая верхняя грань области значений w. Порядковое число 5 называется регулярным, если для любого а <05 всякая возрастающая а-последовательность порядковых чисел wy значения которой меньше 5, удовлетворяет неравенству U (w и а) -\-0 1 <с0 Ь. Порядковое число, не являющееся регулярным, называется сингулярным, (i) Какие конечные порядковые числа являются регулярными? (И) Показать, что <о0 регулярно и ойш сингулярно. (ш) Доказать, что всякое регулярное порядковое число является начальным, (iv) С помощью аксиомы выбора доказать, что всякое порядковое число вида ^T_j_ol регулярно. (v) Доказать, что если Lim (а) и порядковое число соа регулярно, то ша = а. (Если Lim (а), то регулярное порядковое число <оа называют слабо недостижимым.) (vi) Показать, что если для ша из 7 <о соа следует Of* (7) -$ «а, то Lim (а). Обратное утверждение следует из обобщенной континуум-гипотезы. Если 0 <о а, то регулярное порядковое число о>а, для которого 7 < <«> влечет & (7) -3 %» называется сильно недостижимым. Всякое сильно недостижимое порядковое число является слабо недостижимым, а в предположении обобщенной континуум-гипотезы верно и обратное утверждение. (vii) (Шепердсон [1951-1953], Монтегю и Boot [1959].) (а) Если порядковое число 7 недостижимо (т. е. если #т является моделью для NBG), то оно слабо недостижимо. (Ь) В теории NBG-f-(АС) всякое порядковое число недостижим тогда и только тогда, когда оно сильно недостижимо, (с) Если теория NBG непротиворечива, то в теории NBG + (АС) + + (GCH) невозможно доказать существование слабо недостижимых порядковых чисел.
§ в. АКСИОМА ВЫБОРА. АКСИОМА ОГРАНИЧЕНИЯ 227 Мы выбрали для аксиоматического построения теории множеств теорию NBG потому, что она является, возможно, самой простой и наиболее удобной для работающего математика. Конечно, имеется много других вариантов аксиоматической теории множеств. (1) Заменим (усилив тем самым теорию NBG) аксиомы В1—В7 одной схемой аксиом: ЗХМух ... Vyn ((yh ..., уп) е= X = ср (уь ..., Уп))> где ср — произвольная, не обязательно предикативная, формула теории NBG. Полученная таким образом новая теория NBG+ является расширением теории NBG. Мостовский [1951а] показал, что NBG* является собственным расширением теории NBG, если эта последняя непротиворечива. Теория NBG+ проще и сильнее теории NBG; но именно сила этой теории делает более рискованными надежды на ее непротиворечивость. Кроме того, представляется правдоподобным, что на теорию NBG+ уже не распространяется доказательство Гёделя [1940] об относительной непротиворечивости аксиомы выбора. (2) Система ZSF Цермело — Сколема — Френкеля является по существу частью теории NBG, трактующей только о множествах. В качестве переменных в ZSF мы используем Х\, х% ... Единственным предикатом в этой теории является двуместный предикат е. Аксиомами ZSF служат аксиомы Т (объемности), Р (пары), N (пустого множества), U (объединения), W (множества всех подмножеств), I (бесконечности) и, кроме того, имеется еще схема аксиом, соответствующая аксиоме замещения R: для всякой формулы ср (и, v) аксиомой является формула (Vu Vw Vm (ср (v, и) & ср (ту, w) zd и = w)) zd zd 3y V« (и е у = 3v (v e x & cp (v, u))). Всякая формула теории ZSF может рассматриваться как некоторая формула теории NBG, в которой переменные теории ZSF играют роль ограниченных множествами переменных теории NBG. Доказано (Н о в а к- Гал [1951], Россер и ВанХао [1950], Шёнфильд [1954]), что для любой замкнутой формулы &# теории ZSF, если (—nBG<2^> то [— ZSFe^; а потому теория ZSF непротиворечива в том и только в том случае, когда непротиворечива теория NBG. Подробнее о построении теории ZSF см. Саппс [1960]. Обзор различных аксиоматических систем теории множеств можно найти у Френкеля и Бар-Хиллела [1958] и у Вана Хао и Мак Нотона [1953]. Мы отсылаем также читателя по вопросам, касающимся более или менее подробного изложения теории типов, к Черчу [1940] и Куайну [1938]; системы New Foundations (NF) Куайна — к Рос сер у [1953] и Ш пе к керу [ 1953] (где доказано, что сильная аксиома выбора опровержима в NF) и сиаемы ML Куайна —■ к Куайну [1951].
Глава 5 Эффективная вычислимость § 1. Нормальные алгорифмы Маркова Обычно функция f(xb ..., хп) мыслится нами как эффективно вычислимая, если имеется какая-нибудь механическая процедура, следуя которой, можно найти значение f(kh ..., kn) этой функции всякий раз, как только даны значения kh ..., kn аргументов. Выражение «механическая процедура», разумеется, крайне неточно, но во всяком случае мы под этим понимаем некий процесс, не требующий для своего осуществления .никакой изобретательности. Достаточно прозрачным тому примером может служить операция сложения двух целых чисел, записанных в десятичной системе. Можно также указать на хорошо известный алгорифм Евклида для нахождения наибольшего общего делителя двух целых чисел. В этих двух примерах представляется интуитивно ясным, что данные функции эффективно вычислимы. И так обстоит дело всякий раз, когда эффективная процедура уже найдена. Однако все чаще и чаще мы сталкиваемся в математике с задачей, состоящей в том, чтобы доказать, что не существует эффективно вычислимой функции того или иного рода или что не существует никакой эффективной процедуры для решения какого-нибудь широкого класса проблем. Поясним сказанное еще таким примером. Хорошо известен эффективный способ узнавать, имеет ли целые корни данный произвольный многочлен с целыми коэффициентами, зависящий от одной переменной. С другой стороны, до сих пор еще остается нерешенной так называемая Десятая Проблема Гильберта, т. е. не решен вопрос о существовании эффективной процедуры, следуя которой, можно было бы для любого многочлена с целыми коэффициентами, зависящего от произвольного числа переменных, ответить на вопрос, имеет ли этот многочлен целые корни *). Если мы беремся доказывать, что та или иная функция не является эффективно вычислимой, то мы прежде должны сформулировать точное математическое определение понятия эффективной вычислимости. Совершенно аналогичная ситуация сложилась в свое время в математике, когда назрела необходимость уточнения таких понятий, как непрерывность, кривая, поверхность, площадь и т. п. *) Эта проблема была решена впервые Ю. В. М ат и я с е г, и ч е м [1970] и несколько позже Г. В. Ч ) д н о в с к и м [1970J. (Прим ред.)
f I. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 229 Всякая частная проблема из какого-нибудь общего класса проблем можег быть сформулирована в виде некоторого выражения подходящего языка. Всякое выражение того или иного языка в свою очередь можно рассматривать как последовательность символов этого языка при условии, что пустое место, оставляемое обычно для разделения слов, воспринимается как равноправный символ того же языка. Мы будет называть алфавитом всякое непустое конечное множество символов, а сами символы алфавита будем называть буквами, В естественных языках используется лишь конечное число букв. Равным образом и для наших целей достаточно будет ограничиться рассмотрением только таких алфавитов. (Впрочем, все, что можно записать в бесконечном алфавите fli, а2) ..., можно воспроизвести и в алфавите {Ь> с}, содержащем лишь две буквы. Для этого достаточно условиться считать, что последовательность Ьсс ... ссЬ изображает букву ап.) Для единообразия мы п раз будем, как правило, предполагать, что буквы всех алфавитов берутся из одной и той же счетной последовательности букв So, Sh ..., хотя иногда в целях удобства будем использовать и другие буквы. Словом в алфавите А называется Есякая конечная последовательность букв алфавита А. Пустая последовательность букв называется пустым словом и обозначается через А. Если Р обозначает слово S ... Sj и Q обозначает слово Sri, ..., Sr , то пусть PQ обозначает соединение Sj ... Sj Sri ... Sr этих двух слов. В частности, РА = = АР = Р. Кроме того,1 (PiP2) Р3 = Рх (Р2Р3). Алфавит А называется расширением алфавита В, если В ^ А. Если алфавит А есть расширение алфавита В, то всякое слово в алфавите В есть также слово и в алфавите А. Алгорифмом в алфавите А называется эффективно вычислимая функция, областью определения которой служит какое-нибудь подмножество множества всех слов в алфавите А и значениями которой являются также слова в алфавите А. Пусть Р есть слово в алфавите А; говорят, что алгорифм 81 применим к слову Р, если Р содержится в области определения Ш. Если алфавит В является расширением алфавита А, то всякий алгорифм в алфавите В называется алгорифмом над алфавитом А. Разумеется, в таком виде понятие алгорифма столь же туманно, как и понятие эффективно вычислимой функции. Большинство известных алгорифмов можно разбить на некоторые простейшие шаги. Исходя из stoi о наблюдения и следуя А. А. М а р- кову [1954], в качестве элементарной операции, на базе которой будут строиться алгорифмы, мы выделим подстановку одного слова вместо другого. Если Р и Q — слова в алфавите А, то выражение P-+Q и Р -> • Q будем называть формулами подстановки в алфавите А. При этом предполагается, что стрелка -> и точка • не являются буквами алфавита А Заметим, что здесь каждое из слов Р и Q може! Сы1ь прелым словом. Формула пода аноаки Р-*-Q называется
230 ГЛ. 5. ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ простой. Формула подстановки P->*Q называется заключительной. Пусть Р -> (•) Q обозначает одну; из формул подстановки Р -+ Q или Р -> • Q. Конечный список формул подстановки в алфавите А называется схемой алгорифма и порождает следующий алгорифм в алфавите А. Условимся предварительно говорить, что слово Т входит в слово Q, если существуют такие (возможно пустые) слова Ц У, что Q=UTV. Пусть теперь дано некоторое слово Р в алфавите А. Представляются две возможности: (1) Ни одно из слов Ph ..., Рг не входит в слово Р. Этот факт мы будем коротко записывать так: 21: Риэ. (2) Среди слов Pi, ..., Рг существуют такие, которые входят в Р. Пусть т — наименьшее целое число такое, что 1 ^ т ^ г и Рт входит в Р, и R — слово, которое получается, если самое левое вхождение слова Рт в слово Р заменить словом Qm. Тот факт, что Р и Я находятся в описанном отношении, коротко запишем в виде (a) Я:Р|-Я если формула подстановки Pm-*(-)Qm — простая (и тогда мы скажем, что алгорифм 21 просто переводит слово Р в слово Я)> или в виде (b) 2l:Ph-R, если формула подстановки Pm-+(*)Qm — заключительная (и тогда мы скажем, что алгорифм 81 заключительно переводит слово Р в слово Я). Пусть, далее, 81: Р |= R означает, что существует такая последовательность Яо> Rh •••> Rk слов в алфавите А, что Р = Яо, R = Rh 81:#,|-Яги Для / = 0> !. •••> ^ —2 и либ° Я: Я*-* h Я*, либ° 21 : /?л_i К • Ял (в этом последнем случае вместо 21: Р \= Я мы будем писать 21 / |=-Я). Мы полагаем теперь 21 (Р) = Я тогда и только тогда, когда лиС о 21: Р \= Я, либо 21: Р \= Я и 21: Я=э. Алгорифм, определенный таким образом, называется нормальным алгорифмом (или алгорифмом Маркова) в алфавите А. Работа алгорифма 21 может быть описана следующим образом. Пусть дано слово Р в алфавите А. Находим первую в схеме алгорифма 21 формулу подстановки Pm->()Qm такую, что Рт входит в Р. Совершаем подстановку слова Qm вместо самого левого вхождения слова Рт в слово Р. Пусть Я1 — результат такой подстановки. Если Pm-+(')Qm—заключительная формула подстановки, то работа алгорифма заканчивается и его значением является Яь Если формула подстановки Pm->(-)Qm простая, то применим к Ri тот же поиск, который был только что применен к Р, и так далее. Если мы в конце концов получим иксе слово Яр что 21:Я*^э, т. е, ни одно из слов
§ 1. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 231 Рь ..., Рг не входит в Rit то работа алгорифма заканчивается и Rt будет его значением. При этом возможно, что описанный процесс никогда не закончится. В таком случае мы говорим, что алгорифм 31 неприменим к слову Р. В нашем изложении теории нормальных алгорифмов мы следуем А. А. Маркову [1954]. Примеры. 1. Пусть А есть алфавит {Ь, с}. Рассмотрим схему Определяемый этой схемой нормальный алгорифм 3( перерабатывает всякое слово Р в алфавите А, содержащее хотя бы одно вхождение буквы Ьу в слово, которое получается вычеркиванием в Р самого левого вхождения буквы Ь. Пустое слово Ш перерабатывает в самого себя. Наконец 31 неприменим к непустым словам, не содержащим вхождений буквы Ь. 2. Пусть А есть алфавит {а0, ah ..., ап}. Рассмотрим схему Ял->А Условимся сокращенно изображать эту схему так: (При расшифровке такой сокращенной записи соответствующие формулы подстановки можно выписывать в произвольном порядке.) Эта схема определяет нормальный алгорифм 31, перерабатывающий всякое слово (в алфавите А) в пустое слово. Например, 3(: а^а^а^а^а^ [— а\а^а\а^ \— \— #2#i#3 Ь~ а*аъ г~ #з г~ А и, наконец, 31: A r=i. Следовательно, 3. Пусть А — алфавит, содержащий букву «Si, которую мы сокращенно обозначим через 1. Для всякого натурального числа п определим по индукции 0=1 и п-\-\=п\. Таким образом, 1 = 11, 2=111 и т. д. Слова п называются цифрами. Определим теперь нормальный алгорифм 31, схемой {А -> • 1 Для любого слова Р в алфавите А имеем 31(Р)=1Р*). В частности 31(#) = #-[-1 при любом натуральном п. 4. Пусть А—произвольный алфавит {а0, аь ..., ап}. Для всякого словаР=а/#/ ... а* слово Р = аг- а,- ...а/а/ назовем обращением Jo h 'k Jk Jk-i h h r ™t *) Это очевидно, если заметить, что всякое слово Р начинается с вхождения пустого слова А, ибо Р = ЛР,
?32 ГЛ. 5. ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ слова Р. Построим нормальный алгорифм 31 такой, чтобы для любого слова Р в алфавите А выполнялось равенство 3((Р) = Р. Рассмотрим следующую (сокращенно записанную) схему алгорифма в алфавите В = аа ->- р (а) рб-»5р (?€=А) (Ь) ра->(3 (с) Р -►. A (d) А->а (f) Эта схема определяет некоторый нормальный алгорифм 21 в алфавите В. Рассмотрим произвольное слово Р = а] a,j ... aj в алфавите А. В силу формулы подстановки (f), 31 :Р [— аР. Затем, применяя последовательно формулы подстановки (е), получаем 31: аР (— а,- аяу ау .. ,ау U ау а,- аау а, ... •'I ^0 ^2 Jk I 2 0 ^3 ... uj [—...[— О/ ад ... fly аау. Таким образом, 31: Р \= aj aj ... а;- аау в С помощью (f) получаем затем Ш: P\=oluj aj ... aj aaj . Применяя, как и выше, формулы подстановки (е), получаем 31: Р \= ujjij ... .., aj aaj &cij . Повторяя этот процесс, приходим к 31: Р |= aajJkajk ... clclj o.dj . Теперь, снова на основании (f), 3(: Р (= ааа;- аау ^ ... аау аау ^ и с помощью (а) 31: Р (= рау аау ...aajaaj. Теперь остается применить (Ь), (с) и в заключение (d), после чего и получаем Ш: Р\=-Р. Итак, мы построили некоторый нормальный алгорифм 31 над алфавитом А, обращающий всякое слово в алфавите А *). Упражнения 1. Пусть заданы алфавит А и произвольное слово Q в этом алфавите. Описать действие нормальных алгорифмов, задаваемых следующими схемами: (a) {А-^ -Q. (b) Схема в алфавите В = А U {а}, где а не принадлежит А: /ае-^а (5еА) *) Различие между понятием нормального алгорифма в алфавите А и понятием нормального алгорифма над алфавитом А является весьма важным. Всякий нормальный алгорифм в А использует только буквы А, тогда как нормальный алгорифм над А может использовать и некоторые дополнительные буквы, не входящие в А. Всякий нормальный алгорифм в А является также нормальным алгорифмом над А, но существуют, вообще говоря, алгорифмы в А, которые определяются нормальными алгорифмами над А, но сами не являются нормальными алгорифмами в А (см. упражнение 2 (d), стр. 251).
§ 1. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 233 (c) I 6-А (бе А) (d) Схема в алфавите B = AU{l}i 2. Пусть алфавит А не содержит букв а, [3, -у» и пусть В = А [) {а} и С = = A U К Р, 7}- (a) Построить нормальный алгорифм 9( в В такой, что 51 (А) = А и % (%Р)=р для любой буквы $ из А и для любого слова Р в А (т. е. нормальный алгорифм, «стирающий» первую букву во всяком непустом слове в алфавите А). (b) Построить нормальный алгорифм 93 в алфавите С такой, чтобы для любого слова Р в алфавите А было выполнено равенство 23 (Р) = РР. 3. Пусть буква а не входит в алфавиты А и В, и пусть аи ..., я& — фиксированные буквы из алфавита A, a Qu ...,Q& — фиксированные слова в алфавите В. Показать, что нормальный алгорифм в алфавите A U В U {а}, задаваемый схемой ai-^Qia (/=1,..., к) ~ {aiy ..., ak\) а — .А перерабатывает всякое слово Р в алфавите А в слов Qlt ..., слово Sub q\ q\(P), t. e. в результат одновременной подстановки слов Qlt ..., Q^ в слово Р соответственно вместо букв аи ..., а^ 4. Пусть Н = {1} и М={1, *}. Всякое натуральное число п может быть представлено соответствующей цифрой /г, которая представляет собой слово в алфавите Н. Поставим теперь в соответствие всякому вектору (пи ..., /г^), где пи ..,, nk — натуральные числа, слово п^ ... *nk в алфавите М, которое обозначии через (пи ..., nk). Так, например, (3, 1, 2) обозначает слово 1111*11*111. (а) Показать, что схема al определяет нормальный алгорифм 2tz над алфавитом М, применимый только к тем словам в алфавите М, которые являются цифрами, и такой, что 5(z (/г) = б для любого п. (Ь). Показать, что нормальный алгорифм 51^ над алфавитом М, определяемый схемой * —* * применим только к тем словам в алфавите М, которые суть цифры, причем 91 д, (п) =: п -j-1 для любою /г.
234 гл. 5. эффективная вычислимость (с) Пусть «!, ..., a2k — буквы, не входящие в алфавит М, и пусть 1 =^у ^ k. Обозначим через S?i (при 1=^/</г) список формул подстановки a2i - 1* -♦ a2i -1* «а/ _ 11 -*a2jl Рассмотрим нормальный алгорифм 51у, задаваемый одной из следующих трех схем: если 1<у</г, если у = 1, если j = kt то схемой то схемой то схемой аа1 —► 1а2 а2* —, а3 «2ft* -► а2^ _д_ ,. а^ a2k —*" * "^ Показать, что 51у применим к тем и только тем словам в алфавите М, которые имеют вид(/г1} ..., л^), причем 51 * ((пи ..., /г^)) = "л/для любого набора (d) Построить схему нормального алгорифма в алфавите М, перерабатывающего (п1} п2) в \ nY — п\ |. (e) Построить нормальные алгорифмы над алфавитом М для арифметических операций сложения и умножения. Пусть 91 и S3 — алгорифмы, а Р — слово. Мы будем применять запись 91(Р)~33(Р) для выражения того факта, что либо алгорифмы Я и8 оба неприменимы к слову Р, либо оба они к нему применимы и при этом 91(Р) = 93(Р). Вообще, если С и D — какие-нибудь выражения, то Cc^D будет в дальнейшем означать, что либо оба эти выражения не определены, либо оба они определены и обозначают один и тот же объект. Назовем
§ I. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 236 два алгорифма 21 и 33 над алфавитом А вполне эквивалентными относительно А, если для любого слова Р в алфавите А 3( (Р) ~ S3 (Р). Те же алгорифмы назовем эквивалентными относительно алфавита А, если 31 (Р) ~ 33 (Р) всякий раз, когда Р есть слово в А, и хотя бы одно из слов 31 (Р) или 33 (Р) определено и тоже является словом в А. Пусть, как и прежде (упражнение 4 на стр. 233), М обозначает алфавит {1, *}, пусть также со —множество всех натуральных чисел и ф есть частичная эффективно вычислимая арифметическая функция от п аргументов, т. е. функция, отображающая некоторое подмножество множества со" в со. Через 33Ф обозначим соответствующий алгорифм в М, т. е. такой алгорифм, что 33Ф ((&i, ..., kn)) =» ф (kb ..., £„") всякий раз, когда хотя бы одна из частей этого равенства определена. Предполагается также, что 33Ф неприменим к словам, отличным от слов вида (&i,..., kn). Мы назовем функцию ф частично вычислимой по Маркову функцией, если существует нормальный алгорифм 31 над М, вполне эквивалентный 33Ф относительно М *). Если функция ф определена всюду, т.е. для любой я-ки натуральных чисел, и является частично вычислимой по Маркову, то мы ее назовем вычислимой по Маркову. Мы теперь обобщим понятие рекурсивной функции (см. стр. 136). Частичную функцию ф от п аргументов назовем частично рекурсивной, если она может быть получена, исходя из начальных функций Z (нуль-функция), U/ (проектирующие функции) и N (прибавление единицы), с помощью подстановки, рекурсии и неограниченного fi-оператора. (Мы говорим, что функция г|? получена из функции т с помощью неограниченного ц,-опера- тора, если г|> (хь ..., хл)=|гу (т^,..., хя> у)=0), где |ху (т (хъ..., хя, у) = «=0) есть наименьшее число k (если такое существует), для которого т (хь ..., хл, k) = 0, а если 1 ^ / < k, то т (хъ ..., хл, /) определено и отлично от 0. Таким образом, г|) (хъ ..., х„) может быть не определено для некоторых п-ок (хь ..., хп). В частности г|) (хъ ..., хп) не определено для данных хь..., хл, если не существует такого у, что т (хъ..., хл, у)=0.) Очевидно, всякая рекурсивная функция является частично рекурсивной. Утверждение о том, что всякая всюду определенная частично рекурсивная функция является рекурсивной, верно, но отнюдь не очевидно, и мы его позже докажем. Мы покажем, что совпадают понятия частично вычислимой по Маркову функции и частично рекурсивной функции, а также понятия вычислимой по Маркову функция и рекурсивной функции. Будем говорить о нормальном алгорифме, что он замкнут^ если его схема содержит формулу подстановки вида A->-Q. В работе такого *) В этом и во всех других определениях настоящей главы квантор существования понимается в обычном «классическом» смысле. Когда мы утверждаем, что существует объект того или иного рода, то мы отнюдь не хотим этим сказать, что кто-то фактически уже нашел или когда-либо найдет такой объект. Так, в нашем случае функция ф может быть частично вычислимой по Маркову и при этом не обязательно, чтобы мы когда-нибудь в этом фактически убедились.
236 ГЛ. 5. ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ алгорифма возможен лишь заключительный обрыв, т. е. обрыв в результате применения заключительной формулы подстановки. Пусть 21 — произвольный алгорифм. Обозначим через 21* нормальный алгорифм, схема которого получается из схемы 21 добавлением новой формулы подстановки Л-*-Л к ней в конце. Нормальный алгорифм 2(* замкнут и вполне эквивалентен алгорифму 21 относительно алфавита алгорифма 21. Покажем теперь, что композиция двух нормальных алгорифмов есть снова нормальный алгорифм. Пусть 21 и 33 — нормальные алгорифмы в алфавите А. Сопоставим каждой букве b этого алфавига новую букву Ьу которую назовем двойником буквы Ь. Пусть А — алфавит, состоящий из всех двойников букв алфавита А. Выберем еще какие-нибудь две буквы а и р, не принадлежащие А [} А. Обозначим через <£?${ схему, полученную из схемы нормального алгорифма 21' заменой в ней точки в каждой заключительной формуле подстановки буквой а, и обозначим через c^sq схему, которая получается путем замены в схеме алгорифма 33' всех букв алфавита А их двойниками, всех точек — буквами (3 с последующей заменой всех формул подстановки вида Л -> Q и Л -> • Q соответственно формулами подстановки oc->aQ и a->a[3Q. Рассмотрим схему (в сокращенной записи): aa -> <za (ае А) OLCL —>• OLU (п £= А) ab -> ab (a, b e А) а$ -^фа (а е А) рй -^ pa (a e А) аЪ -> ab (а, >бА) Нормальный алгорифм (S над алфавитом А, определяемый этой схемой, таков, что для любого слова Р в A g (P) ~ 33 (21 (Р)) (доказать в качестве упражнения). Этот нормальный алгорифм называется композицией алгорифмов 31 и S3 и обозначается также символом S3"2f. В общем случае под 2(Л° ...°2d мы будем понимать «*•(...-Яа-ейа-Я!))."). Пусть 2) — некоторый нормальный алгорифм в алфавите А и В — некоторое расширение А. К схеме алгорифма 2) добавим сверху всевозможные формулы подстановки вида b -> &, где b — произвольная буква из В—А. Полученная таким образом схема определяет некоторый нормальный алгорифм 3)в в алфавите В, который неприменим ни к какому слову, содержащему буквы из В — А, и такой, что 2>в (Р) — 3) (Р) для любого слова Р в А. Алгорифм 3)в вполне эквивалентен алгорифму 3)
§ 1. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 237 относительно алфавита А и называется формальным распространением алгорифма D на алфавит В. Пусть даны нормальные алгорифхмы 31 и 33 соответственно в алфавитах At и А2. Рассмотрим алфавит А = А!иА2 и формальные распространения 31д и 33а алгорифмов 81 и 33 на алфавит А. Композиция (5 алгорифмов 8JA и 33а называется нормальной композицией алгорифмов 81 и 33 и обозначается символом 33° 81. (Недоразумений в связи с этим вторичным введением символа 33° 81 не возникает, так как в случае, когда Ai = A2, нормальная композиция алгорифмов 3J и 33 совпадает с их композицией.) S является нормальным алгорифмом над А, причем 6 (Р) ~ 33 (81 (Р)) для любого слова Р в Аь и кроме того, К применим только к таким словам Р в алфавите А, которые удовлетворяют условиям: (i) P есть слово в Ab (ii) 8( применим к Р, (iii) 33 применим к 2((Р). Предположим, что алфавит В является расширением алфавита А, и пусть Р — произвольное слово в алфавите В. Проекцией РА слова Р на алфавит А называется слово, получающееся из Р, если в Р стереть все вхождения букв из В — А. Сокращенно записанная схема задает нормальный алгорифм *|}в, а такой, что фВА(Р) = РА для любого слова Р в В. Алгорифм фв, а называется проектирующим алгорифмом. Пусть А и С — алфавиты без общих букв. Положим В = A U С. Тогда сокращенно записанная схема { са->ас (ogA, cgC) задает нормальный алгорифм ?А, с в алфавите В такой, что 2кс(Р) = = РкР для любого слова Р в В. Если 81 есть нормальный алгорифм в алфавите А и В есть расширение А, то нормальный алгорифм 33 в алфавите В, задаваемый схемой алгорифма 21, назовем естественным распространением алгорифма 81 на алфавит В. Очевидно, что 33 (Р)~2((Р) для любого слова Р в А и, кроме того, 33 (PQ) ~ 21 (Р) Q для любого слова Р в А и для любого слова Q в В — А. Заметим, что естественное распространение алгорифма 21 на В, вообще говоря, отличается от формального распространения 81 на В, так как последнее неприменимо ни к какому слову, содержащему буквы из В — А. Предложение 5.1. Пусть 8(ь ..., 3U—нормальные алгорифмы и А — объединение их алфавитов. Тогда существует нор мальный алгорифм 33 над А, называемый соединением алгорифмов 8(ь ..., 8U, такой, что 33(Р) ~ 31? (Р)31?(Р) ... 81?(Р) для любого слова Р в алфавите А, где 3(* есть естественное рас пространение 3(/ на А. Доказательство. Мы докажем это предложение для k = 2 после чего индукцией по k легко может быть получен и общий случа!
238 ГЛ В. ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ Введем алфавит А двойников букв алфавита А. Положим B==A(JA. Пусть 2li — нормальный алгорифм, схема которого получается заменой каждой буквы схемы алгорифма З^ ее двойником, и пусть Sff, 9lf — естественные распространения соответственно алгорифмов 8fi и % на В. Пусть А = {аь ..., ап). В силу упражнения 3 (стр. 233), существуют нормальные алгорифмы 2Bi = Subai_ а"_ и 2Be=s= aiai апап = Sub^1 **" над В такие, что SBi подставляет одновременно а\й\ v * * * * п вместо аи аф^ вместо а% и т. д., а 2Вз подставляет одновременно а\ вместо #ь а2 вместо й2 и т. д. Существуют, кроме того, нормальные алгорифмы gAi А и g^ А такие, что 2Д А(Р) = РАРА и $?А Д(Р) = РАРА. Тогда, как легко проверить, нормальная композиция 93 = ЭВ9в Sf^*?^ A» « 81* • ?А А • Sffij обладает искомым свойством: ЗЭ (Р) с- 21* (Р)Я* (Р) для любого слова Р в алфавите А. Следствие 5.2. Пусть 3(ь ..., 9fft — нормальные алгорифмы соответственно в алфавитах Аь ..., Ал, м пусть А = А!и ... \]kk. Тогда существует нормальный алгорифм Ъ над A|J{*} такой, что 3S(P)~9(f(P) *8Га#(Р)* ... *2ff(P) для любого слова Р 5 А, гд<? 31; —естественное распространение %i на А*). (/? частности, 83(Р)с^311(Р)*3[2(Р)* ... *3(Л(Р) для любого слова Р в алфавите А1П...ПА*.) Доказательство. Существует такой нормальный алгорифм 3) в A U {*}, что 2)(Р) = * для любого слова Р в А. Алгорифм 5) зададим схемой Пусть, на основании предложения 5.1, 33 есть соединение алгорифмов SIi, 2), %, 2), ..., 2), 2(ft. Тогда, как нетрудно видеть, $ (Р) с^ — 311 (Р) * 2f2 (Р) * ... * 3U (Р) Для любого слова Р в А и, в частности, S3 (Р) ~ 9(i (Р) * Э(2 (Р) * ... *8(/г(Р) Для любого слова Р в пересечении алфавитов Аь ..., Ak. Лемма 5.3. (1) Пусть $ — нормальный алгорифм в алфавите А и а — произвольная буква. Тогда существует нормальный алгорифм 3) над A U {а} такой, что для любого слова Р в А аР' если Р, если и алгорифм ф применим только к тем словам, к которым применим 6. •) Для дальнейших приложений следствия 5.2 полезно заметить, что автор здесь допускает возможность *gA. (Прим. ред.)
§ 1 НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 2S9 (2) Если 81 и 33 — нормальные алгорифмы в алфавите А и а — буква, не принадлежащая А, то существует нормальный алгорифм © над A U {а} такой, что @(Р)~21(Р) и @(аР)~93(Р) для любого слова Рек. Доказательство. (1) Существует нормальный алгорифм Jqx над A U {а}, перерабатывающий Л в а и всякое непустое слово в алфавите A (J {а} — в Л. Такой алгорифм может быть задан, например, следующей схемой: где Р — буква, не принадлежащая алфавиту A (J {а}. Пусть $2аа<&1*& Для любого слова Р в А, если (£(Р)=:Л, то ф2(Р)«=а, и если 6(Р)=^=Л, то £2(Р) = Л. Пусть 3 — тождественный нормальный алгорифм в А (со схемой {Л-^Л), и пусть 2) есть соединение алгорифмов ф2 и 3. Тогда если (£ (Р) = Л, то 2)(Р)=аР, и если (£(Р)=£Л, то £(*>) = Р. (2) Введем алфавит а двойников букв алфавита А. Пусть В =» — A U A U {а, Р}, где Р ф A |J A (J {а}. Если мы заменим в схеме алгорифма 33* всякую букву алфавита А ее двойником, все точки —буквой Р, а в получившейся в результате этого схеме заменим всякую формулу подстановки вида Л -> Q и Л -> pQ соответственно на a ->aQ и a->apQ, то получим некоторую схему, которую обозначим через ^щ. Пусть ^(«~схема алгорифма 21*. Построим теперь схему ссй —*■ oca ab-*-ub йр->-рй Рй->-Ра ab-*-ab аР->Л : (ае (а, i (ае (а е (a, i = А) be А) = А) = А) be А) Определенный этой схемой нормальный алгорифм © над A |J {a} есть искомый алгорифм, т. е. © (Р) ~ 51 (Р) и © (aP) ~ 33 (Р) для всякого слова Р в А. Предложение 5.4. Пусть 91, 33, S — нормальные алгорифмы и А — объединение их алфавитов. Тогда существует нормальный
240 ГЛ 5. ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ алгорифм Q£ над А такой, что S3(P), если Р есть слово в А и @(Р) = . ?{(Р), если Р есть слово в к и и применимый к тем и только к тем словам в к, к которым применим (5. Алгорифм (Ц называется разветвлением алгорифмов Ш и S3, управляемым алгорифмом (£. Доказательство. Пусть ?[ь S3i и @i — формальные распространения соответственно алгорифмов % S3 и К на А, и пусть а — буква, не входящая в А. По лемме 5.3 (1) существует такой нормальный алгорифм 3) над A (J {&}> что Г аР, если Р есть слово в А и (5 (Р) = Л, ~~~\ Р, если Р есть слово в А и (£(Р)=И=Л. Кроме того, по лемме 5.3(2), существует нормальный алгорифм ® над A U {а} такой, что если Р есть слово в А, то ® (Р) ~ 8lj (P) и © (аР) ~ ~33i(P). Теперь остается положить (£ = @°2). Пусть даны алгорифмы 91 и S в алфавите А и произвольное слово Ро в А. Применим 31 к Ро. Если в результате получится некоторое слово Рь то применим @ к Plt Если окажется, что (S,(pl) = А, то процесс заканчивается. Если же окажется, что (£(Pi)=/=A, то применим 9( к Pi. Если в результате получится некоторое слово Р2, то применим (§ к Р2, и снова, если окажется, что (£(Р2) = Л, то процесс останавливаем, если же окажется, что (5 (Рз) =^= А, то применяем 9( к Р2 и т. д. Определенный таким образом алгорифм 33 называется повторением алгорифма 2(, управляемым алгорифмом (?. Очевидно, что i8(P0) = Q тогда и только тогда, когда существует последовательность слов Ро, Ph ..., Рп(п>0) такая, что Рл = <3, g(Pn) = A, Р, = ?((Р,_0 при 0</<я и ^(Р^^Л при 0 <С / •< /г. Предложение 5.5. Пусть 91 м S — нормальные алгорифмы, А — объединение их алфавитов и 9(i и 6i — формальные распространения соответственно Ш и S на А. Тогда существует нормальный алгорифм S3 яад А, являющийся повторением алгорифма 3(ь управляемым алгорифмом (&ь Доказательство. Предложение, очевидно, достаточно доказать для случая, когда алфавиты алгорифмов 81 и (£ совпадают и когда, следовательно, 3(i = 31 и (Si = (5. Пусть буква а не входит в А. По лемме 5.3 (1) существует такой нормальный алгорифм 2) над В = A U {а}, что ( аР, если Р есть слово в А и (5 (Р) = А, \ Р, если Р есть слово в А и g (P) =^= Л. Пусть J5 = 2)e3(. § есть нормальный алгорифм в некотором расширении F алфавита В. Пусть буква (3 не входит в F. Рассмотрим
$ I. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 241 следующую схему: Ра->.а где £"сж — схема, полученная из схемы для g' путем замены в ней всех точек буквой р. Эга схема определяет некоторый нормальный алгорифм ©, причем (§(P) = Q тогда и только тогда, когда существует такая последовательность слов Ро, ..., РПУ что Р = Р0, Q = Ря, Р; = = g (Pj-i) (О <С / ^ п) и Рл — единственное в этой последовательности слово, начинающееся с буквы а. Пусть ^ — алгорифм, проектирующий алфавит F на алфавит F—{а} (т. е. стирающий все вхождения буквы а; см. стр. 237). Теперь легко убедиться в том, что нормальный алгорифм 33 = $ о © — искомый. Следствие 5.6. Пусть 31 и S — нормальные алгорифмы и к — объединение их алфавитов. Тогда существует нормальный алгорифм 1q над А, который всякое слово Р в алфавите А перераба' тывает в слово Q тогда и только тогда, когда существует такая последовательность слов Ро, ..., Рп (я^>=0), что Р0 = Р, Pn=Q, 6(РЯ) = А, РЖ = Я(Р,) и &(РдфА для / = 0,1, ... ..., л—1. Доказательство. Пусть 3 — тождественный нормальный алго- ргфм и 33 — повторение % управляемое алгорифмом (5. Искомым алго- риф,\ом fe является тогда разветвление 93 и 3, управляемое (5 (см. предложение 5.4). Этот алгорифм ^ называется полным повторением алгорифма % управляемым S. Предложение 5.7. Каков бы ни был нормальный алгорифм 91 в алфавите А, существует такой нормальный алгорифм Ш над алфавитом B = A|JC (где С = {*, 1}), что для любого слова Рек и для любого натурального числа п Ш (n*P) = Q тогда и только тогда, когда существует последовательность слов Ро, Р\, ..., Рп (п^0), удовлетворяющая условиям: Ро — Р, Pn=Q и Р( = Ш(Р^) для /= 1, 2, ..., п. Доказательство. Пусть а — какая-нибудь буква, не входящая в В, и положим D = B|J{a}. Рассмотрим нормальные алгорифмы в D, задаваемые, следующими схемами: B) all al* a*g а* -* .1 -^ а* -> а* -> Л
242 гл. 5. эффективная вычислимость Легко видеть, что для любого слова Р в алфавите В получаем $1ф*Р) = А и $х(п*Р)ф Л, если л>0. Если Р не содержит букву *, то ф2 (Р * Q) = р. «£>з-' \ а* -> • Л Как нетрудно проверить, ф3(я*Р) = Р для любого Р в В. $ъ'. {1 * -* • А Очевидно, ^4 (я * Р) = п — 1 ♦ Р, если л > 0, и «£)4 (0 * Р) = * Р. Кроме того, £5(6*Р) = Р. Пусть теперь € есть такой нормальный алгорифм, что (f(P) = = G£)2 ° §4) (Р) * (21 ° «£)з) (Р) для'любого слова Р в алфавите D (см. следствие 5.2). Тогда для любого слова Р в алфавите А получаем €(Й!§сР)=( я—1*31(Р), если л>0, \ *«£)(Р)> если я = 0. Обозначим через Е алфавит алгорифма (2. В силу следствия 5.6, найдется такой нормальный алгорифм § над Е, что 5 (Р) = Q тогда и только тогда, когда существует последовательность слов Ро, ..., Р* (& ^ 0), удовлетворяющая условиям: PQ = P, Pk = Q, ^ (РЛ) = Л, Pi = Qr(Pil) (0 < / ^ £) и ^ (Р/) ^= А (0 ^ / < Aj). Читателю предоставляется в качестве упражнения доказать теперь, что алгорифм 3(1 = фв«5 есть искомый нормальный алгорифм. Предложение 5.8. Всякая частично рекурсивная функция является частично вычислимой по Маркову функцией, и всякая рекурсивная функция является вычислимой по Маркову функцией. Доказательство. (1) Начальные функции Z, N, \Jj (l^j^k) вычислимы по Маркову (см. упражнение 4, стр. 233—234). (2) Подстановка. Предположим, что функция ф получается из функций т, срь ..., срЛ с помощью подстановки: <|> (хь ..., х„) = т (cpt (хь ..., хл),... ..., срЛ (хь ..., xj), где т, срь ..., срЛ — частично рекурсивны. Предположим также, что существуют нормальные алгорифмы 3(т, 31^, .*.., 31^ над М = {1, *}, которые частично вычисляют соответственно функции т, Ть •.., ?л- Согласно следствию 5.2, существует нормальный алгорифм 33 над М такой, что 53 (Р) ~ 3(ft (P) * 31^ (Р) ♦... * Щк (Р) для любого слова Р в алфавите М. В частности,
x f !. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 243 для любых натуральных хь ..., хл. Положим 6 = 2ГТ°93. Тогда для любых натуральных хь ..., хл имеем хь ..., хл)) ~ 5lt(cpt(хь ..., хл), ..., <рл(хь ..., хл))~ , ..., Хл), ..., <рл(хЬ ..., Хя)). (3) Рекурсия. Допустим, что функция ф получена из функций х и ср с помощью рекурсии: ..., хк, у, ф(хь ..., хЛ, у)), и пусть 3(т и Ш9 — нормальные алгорифмы над М, частично вычисляющие соответственно функции т и ср. Пусть, наконец, 9lz, 9Jn и 2(J — нормальные алгорифмы, вычисляющие соответственно функции Z, N и Uy. С помощью алгорифмов 3(у+1 может быть построен, в силу следствия 5.2, такой нормальный алгорифм 93i над М, что 93i (xi *... * ~xk * У) ^^ *i * • • • fc. Пусть М = 3(т ° 33i. Снова на основании следствия 5.2 и исходя $ f+1 T\ i из алгорифмов 8$t}, Slf+1, ..., 3I/T\ 5(z, »ff> строим нормальный алгорифм ЗЗз над М такой, что 339(Xi*...*x"ft*y)~y#Xi*...*X£*O* *т(хь ..., xk). Нормальный алгорифм ЗЗз == 3(neSf^+i работает таким образом, что ЗЗз (х 1 *... * хЛ * у * х) = у -j- 1. Применив ' следствие 5.2 к алгорифмам 3lf+2,..., 31^+2, 35а и Sff, получим нормальный алгорифм $4 над М такой, что .., хЛ, у, х). В силу предложения 5.7, существует такой нормальный алгорифм 33J, что при любом п^О равенство Ъ\(п* P) = Q выполнено тогда и только тогда, когда существует последовательность слов Ро> • • • > Рю удовлетворяющая условиям: Р0 = Р, Pn=Q и Pi = <tQi(Pi_l\ где0<О'^Я- Тогда алгорифм 93 = Sl^ta ° ®4 ° 33а и есть тот нормальный алгорифм над М, который вычисляет ф. В самом деле, прежде всего, ~у *Х1*...*хЛ*0*т(хь ..., xk). Применение затем к слову у *Х!*...*хЛ*0*т (хь ..., х^) алгорифма 93 \ равносильно, очевидно, у-кратному применению алгорифма 934, начиная со слова х^ *... * xk * 0 *т(хь ..., xk). Легко видеть, что при этом в результате получится слово x~i *. ..*х"л *у *ф(хь ..., xki у). Применив затем 31*^2, получим окончательно ф(хь ..., xk, у). (4) [i-оператор. Пусть ф(хь ..., хл) = [iy(ср(хь ..., хл, у) = 0) и предположим, что некоторый нормальный алгорифм 31^ над М частично вычисляет ср. Исходя из алгорифмов 5(?+1, ..., 21Л+1 и 2(n ° 2(л^1 в соответствии со следствием 5.2 построим нормальный алгорифм 2В такой,
244 ГЛ 5 ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ что 393(х 1 #...*xn*y) = xi*...xn*y-|- 1. Рассмотрим нормальный алгорифм £) над М, задаваемый схемой / 11-*.11 Если /1 = 0, то ф(Я) = А, если же /i>0, то 2)(й)#А. Пусть (£ = = фо8Гг Тогда =А, если ср(хь ..., хя) = 0, Пусть, далее, Я — нормальный алгорифм над М такой, что М (х 1 * ... * х п) == x"i * ... * хп * 0. Применив к алгорифмам 9В и (5 следствие 5.6, заключаем, что существует нормальный алгорифм $ над М, для которого равенство 1q(P) = Q выполнено тогда и только тогда, когда имеется последовательность слов Ро> • ••» Рп (я^0)> удовлетворяющая условиям: РО = РУ Pn=Q, $(Pn)z=z = А, Pf+1 = 2B(P,) и <$,(Рг)ФА, где / = 0, 1, ..., /1—1. Определим теперь нормальный алгорифм 33 как композицию $l£tl • ф ° Л. Нетрудно видеть, что S3^! * ... * х„) ~ р,у (ср (хь ..., хя, у) = 0)~ф(хь ..., хл). Из пунктов (1)—(4) следует, что если ф есть частично рекурсивная функция k аргументов, то существует такой нормальный алгорифм Ш9 над М, что 3(ф(х1*...*хЛ)~ф(х1, ..., хЛ). Читатель без труда построит схему, задающую нормальный алгорифм Ы над М, который применим только к словам вида x"i *... * "хА, где хь ... ..., xk — натуральные числа, и который работает таким образом, что Ы (xi *... * xk) = хi *... * хk. Зададим нормальный алгорифм %^ равенством % = %О<®-Тог№ $ф(х1*...*х*)~ф(хь ..., хЛ), причем 5ф применим к слову Р тогда и только тогда, когда Р есть слово в алфавите М вида х!#...* xk и ф (хь ..., х^) определено. Следовательно, всякая частично рекурсивная функция есть также частичная вычислимая по Маркову функция. Отсюда, в частности, следует, что всякая рекурсивная функция есть функция, вычислимая по Маркову. Мы теперь определим гёделевы номера для всех букв So, Si, ..., из которых состоят наши алфавиты: g(Si) = 21 -\-3. Далее, каждому слову P = Sj •••5y припишем гёделев номер где pk есть ^"е простое число. Положим, кроме того, g(A)=l. Наконец, гёделев номер последовательчости слов Ро, ..., Pk определим как (^(p)(^)
% 1. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 245 Условимся обозначать буквы Si и «Si соответственно буквами 1 и *. Тогда, рассматривая цифры как слова в алфавите {Si}, получаем g(0) = 28, п = 25.35 и вообще g(n) = Для всякого алфавита А существуют такие нормальные алгорифмы ) $i и фа над AU{1, *}, что $i(P) = g(P) и $a(g(P)) = p для любого слова Р в А. Рассмотрим вопрос о существовании алгорифма ^. Во-первых, существует такой нормальный алгорифм ^ над М (J А, где М={1, *}, что для любого непустого слова Р = amoami... ат в алфавите А 23i (Р) = g («m0) * g (amх) *... * g («тг) и 53i (аЛо) = g (ато) *. В самом деле, если А = {5у, ..., 5/1, то такой алгорифм ©i задается схемой *) а5У1 -> 2]х + 3 * а Л -> а Во-вторых, существует такой нормальный алгорифм ЗЗз, что Ъ2 (n#Q) = = 0 *2п * Q. (Доказательство этого факта предоставляется читателю в качестве упражнения. При этом полезно заметить, что так как функция 2х рекурсивна, то, в силу предложения 5.8, существует вычисляющий ее нормальный алгорифм.) Положим 53з = ЗЗз ^ ЗЗх- Тогда для всякого непустого слова P = Smo...Sm Пусть 21 есть такой нормальный алгорифм, что 21 (п * п * v * Q) = п -f-1 * и • р1^ t * Q. (Доказательство существования такого 21 мы тоже оставляем на долю читателя. Заметим лишь, что функция f(x, у, #) = х-рУ х рекурсивна и, следовательно, вычислима с помощью некоторого нормального алгорифма.) Пусть, далее, (5 — нормальный алгорифм, удовлетворяющий условию: (5(Р) = Л тогда и только тогда, когда Р содержит в точности два вхождения буквы #. В силу следствия 5.6, существует нормальный алгорифм <£>, являющийся полным повторением 21, управляемым $. Обозначим, наконец, через £ нормальный алгорифм, перерабатызаю ций всякое слово вида х *у * в слово у, и положим g = (£°,£>*333. Нетрудно *) Здесь следует потребовать, чтобы буква а не входила в алфавит AUM. (Прим. пере в.)
246 ГЛ 5 ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ убедиться в том, что §(P) = g(P) для любого непустого слова Р в Л. Теперь уже существование нормального алгорифма ^ над А [} М такого, что §^ (Р) = g (P) для любого, в том числе и пустого, слова в А, легко следует из предыдущего с помощью предложения 5.4. (Напомним, что в(А)=1.) Упражнение Доказать, что существует такой нормальный алгорифм %2 над A|JM, что £з (g (Р)) = Р Для любого слова Р в А. Указание. Построить нормальный алгорифм Ф, определенный только на словах вида 2* + 3, для которых S^gA, и такой, что 3)(2/ + 3) = S,\ Построить нормальный алгорифм $, определенный только на словах вида и, где и — положительное натуральное число, и такой, что & (и) = 0 * и #. Затем построить нормальный алгорифм 5 такой, что для любых натуральных п и и и для любого слова Р 8 (п * и * Р) = п + 1 * qt (р^л, и) * Р Ф ((UD- Пусть (£ — нормальный алгорифм такой, что ($(7г*1*Р)=Л для любого Р и любого целого неотрицательного /г, определенный также и для слов вида, отличного от я* 1 *Р, но со значением, отличным от Л. В силу предложения 5.5, существует нормальный алгорифм % осуществляющий повторение 5?, управляемое (£. Пусть © — нормальный алгорифм, перерабатывающий всякое слово вида /г*1*Р в слово Р. Положить £ = © »$«>&. Показать, что £ (g(Q)) = Q для любого непустого слова Q в А. В заключение с помощью предложения 5.4 учесть случай пустого Q. Пусть 31 — произвольный алгорифм (не обязательно нормальный) над алфавитом А. Поставим в соответствие алгорифму 2f частичную функцию ф>д, удовлетворяющую следующему условию: для любых натуральных чисел пит равенство ф^1 (п)=== т выполнено тогда и только тогда, когда либо п не есть гёделев номер никакого слова в алфавите А и т = 0, либо пит суть гёделевы номера некоторых слов Р и Q в А, причем 2f(P) = Q. Предположим, что функция фо{ частично рекурсивна (в этом случае мы назовем Ш рекурсивным алгорифмом). В силу предложения 5.8, тогда существует такой нормальный алгорифм 33 над алфавитом М = {1, *}, что 33 (п) ~ ф^1 (п) для любого натурального п, причем 35 определен только для тех /г, для которых определено ф^ (п). Пусть 9Т = S£2 e 33«Фь Нетрудно видеть, что 9Г есть нормальный алгорифм над алфавитом А, вполне эквивалентный алгорифму 21 относительно А. Таким образом, верно следующее Предложение 5.9. Если алгорифм 31 над алфавитом А таков, что функция фз1 частично рекурсивна, то существует нормальный алгорифм над алфавитом А, вполне эквивалентный алгорифму И относительно А. Предложение 5.10. Если 31 есть нормальный алгорифм над алфавитом А, то ф^ есть частично рекурсивная функция; если.
§> 1 НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 247 кроме того, 31 применим ко всякому слову в алфавите А, то функция Фз( рекурсивна. Доказательство. Назовем индексом простой формулы подстановки Р->Q число 21 • 3£(р) • 5?(Ф) и индексом заключительной формулы подстановки — число 22 ♦ Зг(р) • б?^. Назовем, далее, индексом схемы алгорифма P0->(-)Q(b ..., Pr-*(')Qr число 2k<>3ki...pkrr, где kt — индекс формулы подстановки Рг -> (•) Qt. Введем следующие рекурсивные предикаты: (1) Word(u): u=l\/Vz(z<lh(u)iD3y(y<u&(u)z = 2y + 3)) («и есть гёделев номер некоторого слова»). (2) SI (и): lh (и) = 3 & (и)0 = 1 & Word ((u)t) & Word ((u)2) (<ш есть индекс простой формулы подстановки»). (3) TI (u): lh (и) = 3 & (и)0 = 2 & Word ((u)0 & Word ((u)2) («и есть индекс заключительной формулы подстановки»). (4) Ind (u): и > 1 & Vz (z < lh (и) =) SI ((u)z) \JTl ((u)z)) («и есть индекс схемы алгорифма»). Обозначим через х □ у рекурсивную функцию, которую в главе 3 п стр. 142 (4)) мы обозначали через х*у. Тогда если х = ]^[р*/, где т п т аг>0 (/ = 0, 1, ..., я), и если У = ПР?г> то х □ У = ПPi'"'П Кроме того, хП 1 = 1 Qx = x. Операция □ соответствует операции соединения слов. (5) Lsub(x, у, е): «е есть индекс некоторой формулы подстановки P->(-)Q, а х и у суть гёделевы номера некоторых слов U и V таких, что Р входит в U и V есть результат подстановки Q на место самого левого вхождения Р в £/», т. е. Word(x)& Word(y)&(SI(e)\/TI(e))& &3uu^x3vv^x(x = uD(e)i П v&y = u □ (е)2П v&"] 3ww^x3zz^x (x = = wD(e)iDz&w<u)). (6) Осс(х, у): «x и у суть гёделевы номера соответственно некоторых слов U и V и слово V входит в слово U», т. е. Word (x) & &Word(y)&3vv<x3zz<x(x = vD У □ z). (7) End (e, z): «z есть гёделев номер некоторого слова Р> е есть индекс некоторой схемы, и определяемый этой схемой алгорифм неприменим к слову Р», т. е. Ind(e)& Word (z)&Vww<ih(e)(~| Occ (z, ((e)w)t)). (8) SCons (e, у, х): «е есть индекс некоторой схемы £?, а у и х суть гёделевы номера некоторых слов V и U таких, что V может быть получено применением к U некоторой простой формулы подстановки схемы ^», т. е. Ind (е) & Word (х) & Word (у) & 3vv < lh (e) (SI ((e)v) & & Lsub (x, у, (e)v) & Vzv<vO °cc (x, ((e)z)0)). (9) TCons(e, у, х): аналогично SCons(e, у, х) с заменой SI((e)v) на TI ((e)v) (т. е. слов «простой формулы подстановки» словами «заключительной формулы подстановки»).
248 гл. 5. эффективная вычислимость (10) Der(e, х, у): «е есть индекс некоторой схемы S", х есть гёде- лев номер некоторого слова Uo и у есть гбделев номер последовательности слов Uo, Uu ..., Uk (k^O) такой, что если ()<:/<£—1, то задаваемый схемой S^ алгорифм 31 переводит Ui в (//+ь и либо 8J: (JkJLl[-.Uk, либо Я: ик^\-ик и 81: £/А=] (либо если * = 0, то 31: l/*=i), т. е. Ind (е) & Word (х) & Vzz<lh(y) (Word ((y)z) & (у)0 = х& &Vzz<lh(y)JL2(SCons(e,(y)z+1,(y)z))&(lh(y)=l & End (e, (y)0)) V 0МУ)> > 1 &(TCons(e, (у)ш(у)л.ь (У)шгу)^2) V (SCons(e, (ук(у)^ь (y)ih(y)-^2)& &End<e, (y)ih( у) ^ i))))> (И) WA(u): «u есть гбделев номер слова в данном алфавите А = =W •••' sfmh T-e- u=l V Vzz<lh<u) ((u)z = 2y, + 3 V ... V (u)z = 2/m + 3). Пусть теперь 21 — произвольный нормальный алгорифм над алфавитом А и е — индекс схемы, которой он задается. Рассмотрим частично рекурсивную функцию ср (х) = [ху ((WA (х) & Der (е, х, у)) V ~| WA (x)). Как нетрудно видеть Ф3( (x) = (cP(x))lh (?(x)) _l_ j» откуда следует, что ^ есть частично рекурсивная функция. Если же при этом алгорифм 21 применим к каждому слову в А, то функция ср, а вместе с ней и функция ф^ рекурсивны. Упражнение Пусть задан алфавит А. Показать, что существует нормальный алгорифм 39 над A|JM такой, что для любого нормального алгорифма 91 в А, задаваемого схемой с индексом е, и для любого слова Р в А выполнено условное равенство 33 (е * Р) ^ % (Р). Алгорифм Ш называется универсальным алгорифмом для алфавита А. Следствие 5.11. Если данная частичная функция у является частично вычислимой по Маркову, то она есть функция частично рекурсивная, если же ср есть функция, вычислимая по Маркову, то функция ср рекурсивна. Доказательство. Пусть 31 — нормальный алгорифм над М такой, что ср(яь ..., nk) = m тогда и только тогда, когда 91 ((#ь .. • > %)) = т- Функция ф^ частично рекурсивна. Положим %(n) = g (/г). Функция т рекурсивна, так как g {п) = g (1Я+1) = ]~[ (р;)6 *). *) Здесь автором вводится обозначение \k для слова 11 ... 1. k раз (Прим. перед.)
§ 1. НОРМАЛЬНЫЕ АЛГОРИФМЫ МАРКОВА 249 Функция y (x) = lh (x) -1-1 также рекурсивна. Если x = J^[(pOB, то п= i = 0 = Y(x). Рекурсивна, очевидно, и функция 6 (ль ..., nk) = g((nl9 ..., nk)) = g(ln* + l*ln* + l* ... *Г*+Г)= ' [«1 + 1 "I ГЯ2+1 "I ПЫ5 КРя1 + 2)7- П(Р1 + Я1+^ -(РЯ1+Я,+В)7-.-. Г el J Тогда функция <р = у ° ф 0 $ является частично рекурсивной. Если функция ср вычислима по Маркову, то можно предполагать, что алгорифм ?[ применим к любому слову в М (схему алгорифма 21 можно изменить таким образом, чтобы он всякое слово в М, не имеющее вида щ* ... *nk, перерабатывал в Л). Тогда, в силу предложения 5.10, функция ф9 рекурсивна, а вместе с ней рекурсивна и функция ср = Упражнение Показать, что всюду определенная частично рекурсивная функция рекурсивна. Итак, следствие 5.11 и предложение 5.8 устанавливают эквивалентность понятий частичной вычислимости по Маркову и частичной рекур- сивности (а также вычислимости по Маркову и рекурсивности). Тезис Чёрча утверждает в свою очередь, что понятие вычислимости эквивалентно понятию рекурсивности (а в расширенной формулировке — что понятие частичной эффективной вычислимости эквивалентно понятию частичной рекурсивности). А. А. Марков в терминах алгорифмов сформулировал соответствующий принцип, названный им принципом нормализации: всякий алгорифм в А вполне эквивалентен относительно А некоторому нормальному алгорифму над А. Оказывается, что тезис Чёрча и принцип нормализации эквивалентны. В самом деле, примем сначала тезис Чёрча. Пусть 21 есть алгорифм в алфавите А. Соответствующая функция фзд является частичной эффективно вычислимой функцией. Тогда, в силу тезиса Чёрча, ф™ есть частично рекурсивная функция и, следовательно, алгорифм % на основании предложения 5.9, вполне эквивалентен относительно А некоторому нормальному алгорифму над А. Таким образом, если верен тезис Чёрча, то верен и принцип нормализации. Обратно, пусть верен принцип нормализации, и пусть ср — произвольная частичная эффективно вычислимая функция. Пусть, далее, 53^ — соответствующий алгорифм в М. Согласно принципу
250 ГЛ 5 ЭФФЕКТИВНАЯ ВЫЧИСЛИМОСТЬ нормализации, 95<р вполне эквивалентен относительно М некоторому нормальному алгорифму над М. Следовательно, функция <р есть частичная вычислимая по Маркову функция. Но тогда, в силу следствия 5.11, <р является функцией частично рекурсивной, и мы вывели, таким образом, из принципа нормализации тезис Черча. Разумеется, ввиду неточности интуитивных понятий алгорифма и эффективно вычислимой функции невозможно доказать верность принципа нормализации Маркова или тезиса Чёрча. Не располагаем мы и какими-либо априорными доводами в пользу этих гипотез. Нет никаких бесспорных оснований считать, что применение одних лишь ф