Text
                    Теория чисел
Краткое
и ясное
изложение
предмета
URSS

В. Босс ЛЕКЦИИ по МАТЕМАТИКЕ Теория чисел МОСКВА URSS
ББК 22.152я73 Босс В. Лекции по математике. Т. 14: Теория чисел: Учебное пособие. М.: Книжный дом «ЛИБРОКОМ», 2010. — 216 с. Излагаются основы теории чисел (теория делимости, сравнения, вычеты, диофантовы уравнения). Коротко затрагиваются новые веяния и взаимосвязи со смежными дисциплинами (алгебраический ракурс, алгоритмические проблемы, эллиптические кривые). Изложение отличается краткостью и прозрачностью. Для студентов, преподавателей, инженеров и научных работников. Издательство «Книжный дом “ЛИБРОКОМ”». 117312, Москва, пр-т Шестидесятилетия Октября, 9. Формат 60x90/16. Печ. л. 13,5. Зак. № 2859. Отпечатано в ООО «ЛЕНАИД». 117312, Москва, пр-т Шестидесятилетия Октября, 11 А, стр. 11. ISBN 978-5-397-01104-4 © Книжный дом «ЛИБРОКОМ», 2009 НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА “й-1 E-mail: URSS@URSS.ru Хх Каталог изданий в Интернете: W http://URSS.ru J Теп./факс: 7 (499) 135^12-16 URSS Тел./факс: 7 (499) 135-42-46 7664 ID 105546 Все права защищены. Никакая часть настоящей книги не может быть воспроизведена или передана в какой бы то ни было форме и какими бы то ни было средствами, будь то элек- тронные или механические, включая фотокопирование и запись на магнитный носитель, а также размещение в Интернете, если на то нет письменного разрешения владельца.
Оглавление Предисловие к «Лекциям»............................... 7 Предисловие к четырнадцатому тому................... 9 Глава 1. Отправные точки............................. 10 1.1. Мир состоит из побочных результатов........ 10 1.2. Универсализм диофантовых уравнений......... 11 1.3. Лабиринты натурального ряда ............... 14 1.4. На стыке с комбинаторикой.................. 18 1.5. Функция Аккермана.......................... 22 1.6. Арифметические гении....................... 24 1.7. Табличные представления ................... 26 1.8. О границах теории.......................... 30 1.9. Великая роль обозначений................... 32 1.10. Геометрические мотивы...................... 34 Гтава 2. Элементы классики........................... 37 2.1. Делимость.................................. 37 2.2. Простые числа как первооснова.............. 43 2.3. Основная теорема арифметики................ 48 2.4. Целая и дробная часть.................... 50 2.5. Мультипликативные функции ................. 53 2.6. Функции Мёбиуса и Эйлера................... 54 2.7. Арифметика вычетов......................... 57 2.8. Рядовые задачи............................. 59 2.9. Две системы вычетов........................ 61 2.10. Теоремы Эйлера и Ферма..................... 63 2.11. Алгебраическая подоплека................... 65
4 Оглавление 2.12. Цепные дроби .............................. 69 2.13. Диофантовы приближения . ........:........ 72 2.14. Задачи для обозрения ...................:.. 74 Глава 3. Теория сравнений .......................... 75 3.1. Диофантовы уравнения....................... 75 3.2. Сравнения первой степени.................. 77 3.3. Алгоритм возведения в степень .......... >. . 79 3.4. Полиномиальные сравнения.................. 80 3.5. Сравнения по простому модулю............ . . 82 3.6. Теорема Вильсона .......................... 83 3.7. Степенные и квадратичные вычеты.....85 3.8. Символы Лежандра и Якоби.................. 87 3.9. Закон взаимности ......................... 88 3.10. Теорема Шевалле................... .../... 90 3.11. Сумма четырех квадратов................... 91 Diaea 4. Первообразные корни......................... 95 4.1. Суть проблематики ........................ 95 4.2. Структура мультипликативной группы.....'... . 98 4.3. Составные модули.......................... 99 4.4. Круговые поля..............................102 . Глава 5. Алгоритмическая неразрешимость............105 5.1. Алгоритмы и вычислимость............... 105 5.2. Перечислимость и разрешимость............ 107 5.3. Диофантов язык.............................109 5.4. Примитивная арифметика................... 113 5.5. Феномен недоказуемости ....................115 5.6. Непротиворечивость....................... » :.. 118 5.7. Универсальные нумерации .............. ... 119 Diaea 6. Алгебраическая ниша....................... .. 122 6.1. Уход в абстракцию и возвращение.......... 122 6.2. Многочлены.................................123
Оглавление 5 6.3. Расширения полей...........................128 6.4. Алгебраические расширения и числа..........131 6.5. Теория р-адических чисел...................134 6.6. Квадратичные формы....................... 138 6.7. О булевых структурах.......................139 Глава 7. Эффективность счета.........................141 7.1. PNP-проблематика...........................141 7.2. Арифметические NP-задачи................. 144 7.3. Задачи криптографии ..................... 144 7.4. Тесты на простоту..........................148 7.5. Полиномиальный тест AKS.................. 151 7.6. О практике вычислений ................... 152 7.7. Алгоритмы факторизации................... 155 Глава 8. Распределение простых чисел.................157 8.1. Грубые причины ......................... .157 8.2. Функции Чебышева и асимптотика.............159 8.3. По каналам дзета-функции...................161 8.4. Характеры Дирихле........................ 165 8.5. Постулат Бертрана........................ 166 Глава 9. От Ферма до Уайлса........................ 169 9.1. Общая картина.......................... 169 9.2. Дивизоры Куммера ...................... 173 9.3. Эллиптические кривые .................... 174 9.4. Гипотеза Таниямы и теорема Ферма...........180 9.5. Конгруэнтные числа.........................182 Глава 10. Определения и результаты. ........... 184 10.1. Простые и составные числа ............... 184 10.2. Теория делимости......................... 186 10.3. Арифметические функции. ...................187 10.4. Сравнения и вычеты..................... 189 10.5. Алгебра и теория чисел.....................192
О Оглавление 10.6. I крвообразиые корни......................193 10.7. «Арифметика» многочленов................. 194 10.8. Расширения полей..........................195 10.9. Теория р-адических чисел..................196 10.10. Диофантовы уравнения...................... 196 10.11. Диофантовы уравнения и вычеты..............198 10.12. Цепные дроби ...........................•. . . 199 10.13. Алгоритмическая неразрешимость............:. . 201 10.14. PNP-проблематика.......................'. . . 203 10.15. Распределение простых чисел................204 10.16. Эллиптические кривые.................... 205 Сокращения и обозначения............................ 207 Литература ......................................... 210 Предметный указатель.................................212
Предисловие к «Лекциям» Среди миров, в мерцании светил Одной Звезды я повторяю имя... Не потому, чтоб я Ее любил, А потому, что я томлюсь с другими. И если мне сомненье тяжело, Я у Нее одной ищу ответа, Не потому, что от Нее светло, А потому, что с Ней не надо света. Иннокентий Анненский Для нормального изучения любого математического предмета необходимы, по крайней мере, 4 ингредиента: 1) живой учитель', 2) обыкновенный подробный учебник; 3) рядовой задачник; 4) учебник, освобожденный от рутины, но дающий общую картину, мотивы, связи, «что зачем». До четвертого пункта у системы образования руки не дохо- дили. Конечно, подобная задача иногда ставилась и решалась, но в большинстве случаев — при параллельном исполнении функций обыкновенного учебника. Акценты из-за перегрузки менялись, и намерения со второй-третьей главы начинали дрей- фовать, не достигая результата. В виртуальном пространстве так бывает. Аналог объединения гантели с теннисной ракеткой пере- стает решать обе задачи, хотя это не сразу бросается в глаза. «Лекции» ставят 4-й пункт своей главной целью. Сопутствую- щая идея — экономия слов и средств. Правда, на фоне деклараций о краткости и ясности изложения предполагаемое издание около 20 томов может показаться тяжеловесным, но это связано с об- ширностью математики, а не с перегрузкой деталями.
8 Предисловие к «Лекциям> Необходимо сказать, на кого рассчитано. Ответ «на всех» вы- глядит наивно, но он в какой-то мере отражает суть дела. Обозри- мый вид, обнаженные конструкции доказательств — такого сорта книги удобно иметь под рукой. Не секрет, что специалисты самой высокой категории тратят массу сил и времени на освоение ма- тематических секторов, лежащих за рамками собственной специ- ализации. Здесь же ко многим проблемам предлагается короткая дорога, позволяющая быстро освоить новые области и освежить старые. Для начинающих «короткие дороги» тем более полезны, поскольку облегчают движение любыми другими путями. В вопросе «на кого рассчитано», — есть и другой аспект. На сильных или слабых? На средний вуз или физтех? Опять-таки выходит «на всех». Звучит странно, но речь не идет о регламента- ции кругозора. Простым языком, коротко и прозрачно описыва- ется предмет. Из этого каждый извлечет свое и двинется дальше. Наконец, последнее. В условиях информационного наводне- ния инструменты вчерашнего дня перестают работать. Не потому, что изучаемые дисциплины чересчур разрослись, а потому, что новых секторов жизни стало слишком много. И в этих условиях мало кто готов уделять много времени чему-то одному. Поэтому учить всему — надо как-то иначе. «Лекции» дают пример. Пло- хой ли, хороший — покажет время. Но в любом случае, это про- дукт нового поколения. Те же «колеса», тот же «руль», та же мате- матическая суть, — но по-другому.
Предисловие к четырнадцатому тому Вокруг веселье хмурится, Везде чужая улица, Приманкою раскиданы Магниты небылиц... Но в петуха лишь курица Навечно может втюриться, В мечтах лаская идола Из племени жар-птиц. Теория чисел сродни Храму, где всяк входящий оставляет мирские помыслы за порогом. Но сей пантеон все же мириады нитей связывают с остальной математикой, оживляя и заземляя идеологическое ядро. Главная проблема — не потеряться в на- громождении результатов, каковое никак не рассасывается из-за таинственности корней и переизбытка фактов, заслоняющих кар- тину. Поэтому в начале пути целесообразно отсеивать лишнее, выделяя и концентрируясь на магистралях.
Глава 1 Отправные точки The early bird may get the worm, but the second mouse gets the cheese. Первая глава вынуждена преодолевать у читателя возможное отвращение к арифме- тике, что подталкивает к необходимости рас- ставлять акценты вопреки естественной логике. Поэтому задача на первом этапе минималь- ная — создать некоторый запас интереса. 1.1. Мир состоит из побочных результатов Первичные цели не достигаются, если значительны. И потому Вселенная состоит из побочных результатов. Вспомните стремле- ние выжить, ведущее сквозь будни. Или последнюю теорему Ферма о неразрешимости в целых х, у, z уравнения хп + уп = zn, п>2, игравшую 360 лет роль «мухи на другой стороне Луны» Уайлс, решивший задачу, нанес чувствительный вред научной среде, уничтожив маяк и оставив без ориентира публику. Платонический характер теории чисел долгое время пестовал- ся и превозносился на фоне понимания опосредованного влияния Говорят, будто Гильберт выделил как-то в качестве важной проблемы поимку мухи на другой стороне Луны, пояснив, что на этом пути могла бы быть решена масса полезных задач.
1.2. Универсализм диофантовых уравнений 11 оной на всю математику. Но сохранить «девственность» не уда- лось. Приложения шаг за шагом проникли в самое ядро арифме- тики. В первую очередь это, конечно, криптография. Кроме того, немало отдаленных контактов с теорией групп, анализом, геомет- рией стали переходить в фазу сращивания. Но мысль о журавле в небе все же остается, и этого идеалистического устремления ока- зывается достаточно для утилитарного развития. Как собственно и было еще в доисторические времена. «Математика никогда не достигла бы такой степени совершенства, не при- ложи древние столько усилий для изучения вопросов, которыми сегодня многие пренебрегают из-за их мнимой бесплодности», — писал Эйлер. 1.2. Универсализм диофантовых уравнений Значимость теории чисел настолько всеохватывающа, что об этом никто не помнит, да и мало кто знает. Декларация сия — не эпа- таж, а чистая правда, хотя и не вся. Если говорить коротко, то любая математическая проблема сводится к разрешимости того или иного диофантова уравнения в целых числах. Это, конечно, сюрприз, причем выдающийся. Речь идет не только о теоре- тико-числовых проблемах, а о любых математических: гипотеза Римана^ насчет нулей дзета-функции [5, т. 9], разрешимость урав- нения Навье—Стокса [5, т. 11] и т. п. Поэтому теория диофантовых уравнений, охватывающая все разрешимые и неразрешимые за- дачи 2 3\ не может быть простой в принципе. Другое дело что сложным задачам могли бы отвечать сложные уравнения, но и та- кие надежды не оправдываются. Напомним [5, т. 6]; что диофантовыми называют полиноми- альные уравнения вида p(zx,... ,£„)'= О, (1.1) 2) В статье: Wiles A. On the conjecture of Birch and Swinnerton—Dyer // Invent, math. 39(1977), No. 3, P. 223-251, — дается диофантова форма гипотезы Римана и проблемы четырех красок. 3'1 С некоторыми оговорками [5, т. 6].
12 Глава 1. Отправные точки где р(-) — полином с целыми коэффициентами, решения тоже подразумеваются целыми. Часть переменных в (1.1) выделяется далее в качестве пара- метров, и переписывается в виде р(а, х) = 0, т. е. p(a,xlt...,xm) = 0, (1-2) где параметр может быть векторным, д — {(ZI,..., причем все дг-, Xj G N = {1, 2,...}. 1.2.1. Множество А положительных векторов называется диофан- товым^, если при любом a G А и только при а G А уравнение (1.2) разрешимо в целых положительных Х\,... ,хт. Требование положительности перемен- :' ? ных .не принципиально и связано с техни- ши ческими причинами. Отрицательные коэф- фициенты полинома р(а, х) при этом не "* исключаются. В тех случаях, когда по урав- Ял нению р(а, х) = 0, неразрешимому в целых ’ Л положительных числах, необходимо ука- |В ч. зать уравнение неразрешимое в Лагранж (1736-1813) Z = {...,-1,0,1,...}, выручает известная теорема Лагранжа 3.11.1: каждое целое по- ложительное число является суммой четырех квадратов. Поэтому уравнение р(а, ж) = 0 достаточно заменить на р(а, 1 + р2 + q2 + г2 + s2) = 0. При т > 1 теорема Лагранжа применяется к каждому. Xj отдельно. Типа zf — 4Z|Z2 + 32. ^Диофантовы функции определяются как функции, график которых (множество пар), G = {ж।,..., хп, у = /(®ь. •., гп)}, диофантов.
1.2. Универсализм диофантовых уравнений 13 Определенную свободу маневра при использовании понятия 1.2.1 дает следующий, вообще говоря, неожиданный результат. 1.2.2. Лемма. Множество А С N диофантово в томм случае, когда оно является множеством положительных значений некото- рого полинома Р{х\,Х/с)- Фундаментальное достижение Матиясевича, поставившего последнюю точку в решении 10-й проблемы Гильберта^, заклю- чалось в установлении факта, в который «до того» мало кто готов был верить. 1.2.3. Теорема Матиясевича. Диофантовость множества равно- сильна его перечислимости С учетом леммы 1.2.2 оказалось, например, что: 1.2.4. Существует полином, множество положительных значений которого совпадает с множеством простых чисел,-и такой полином может быть конструктивно указан . (!) Диофантовы множества удобно характеризовать также с по- мощью «разрешенных» операций арифметического языка £0 = {+>х,=,3}, (1.3) допускающего для конструирования высказываний четыре опе- рации: сложение +, умножение х, равенство =- и декларацию существования 3 . 1.2.5. Теорема. Множество является диофантовым в томм слу- чае, когда оно описывается на языке L®. Ограниченность средств (1.3) удобна при доказательстве ре- зультатов принципиально-алгоритмического толка. Для помеще- ния конкретных математических проблем в лоно диофантовости Состоящей в возможности универсального алгоритмического .решения вопроса о на- личии целочисленных корней у полинома. 7) См. здесь главу 5, а также [5, т. 6], где тема излагается бол ее'обстоятельно и приво- дится доказательство центрального результата. 8) В [5, т. 6] есть пример такого полинома, б-й степени от 26 переменных.
14 Глава 1. Отправные точки желателен, конечно, более широкий ассортимент инструментов нежели Lq. На эти случаи есть теоремы об эквивалентности Lq другим языкам (п. 5.4.1), которые богаче и легче в употреблении. С их помощью в сферу разрешимости диофантовых уравнений переводится подавляющая часть математических проблем из ана- лиза, геометрии и других дисциплин. Проблема Гольдбаха9^, например, с помощью полинома P(xt,..., xm), пе- речисляющего простые числа, переформулируется как проблема разрешимости диофантова уравнения (2k + 2-qt -?2)2 + [?i - Р(х},..., гт)]2 + [?2 - Р(у\, • • •, ут)]2 = О относительно q}, q2, Xi,..., xm, 2/i,..., ym при любых значениях k 6 N, что как раз соответствует значению n = 2k + 2 4. От параметрической зависимости здесь можно избавиться посредством нехитрой технической уловки [5, т. 6]. Перевод задач из разных областей на диофантов язык говорит, конечно, лишь об алгоритмизуемости этих задач. Причем когда последняя изначально ясна, то ясна и принципиальная возмож- ность диофантова описания 10\ 1.3. Лабиринты натурального ряда Число р G N, р 1, называют простым, если оно делится только на 1 и само на себя. Остальные п G N, п 1, считаются со- ставными числами, каковые оказываются единственным образом представимы в каноническом виде п = р“'р“г Pkk- 9-* Состоящая в предположении о представимости любого четного п 4 в виде суммы двух простых чисел. Комментарии в следующем разделе. |0) Не все математические проблемы описываются на алгоритмическом языке. При- мером могут служить некоторые проблемы, связанные с эффективной конечностью или бесконечностью. Для уравнения Р(г) = 0 невозможно в общем случае (по теореме Райса [5, т. 6]) указать алгоритм, который бы отвечал на вопрос, конечно или бесконечно множество решений. И все нерешенные пока проблемы, где утверждается конечность или бесконечность множества элементов, удовлетворяющих некоторым свойствам, — попадают под подозрение. Такова, например, проблема, бесконечности пар простых чисел- близнецов. 1 '1 Подробности в главе 2.
1.3. Лабиринты натурального ряда 15 Простые числа таким образом являются атомами, из которых состоят «молекулы» натурального ряда N = {1,2,...}, и потому представляют первостепенный интерес, как периоди- ческая таблица Менделеева в химии. Тем не менее устройство совокупности простых чисел оказывается глубинно нетривиаль- ным. Самые простые вопросы не имеют ответа. Наиболее известны: проблема Гольдбаха, — состоящая в пред- положении, что любое четное п 4 представимо в виде суммы двух простых чисел, — и проблема чисел-близнецов^. Та и другая не решены до сих пор. И тут уместны некоторые штрихи, свиде- тельствующие о масштабах усилий и трудностей. Проблема Гольдбаха возникла более трехсот лет тому назад в переписке Гольдбаха с Эйлером. Гольдбах высказал предположение, что любое нечетное п > 5 представимо в виде суммы трех простых чисел — это называют теперь слабой гипотезой Гольдбаха. Эйлер усилил плод фантазии до указанной выше формулировки. Почти двести лет задача «стояла на месте», несмотря на уча- стие самого Эйлера. Лед тронулся в первой половине прошлого века. Сначала Харди и Литтлвуд (1923) показали справедливость «слабой гипотезы» для всех достаточно больших нечетных чисел, но в предполо- жении справедливости некоторого аналога гипотезы Римана. От обременительных допущений освободил результат Виноградов (1937), однако оценки мини- мального N, начиная с которого нечетные числа рас- кладываются в сумму трех простых, — зашкаливают до сих пор. Сейчас N ~ Ю43000, и массив в диапазоне [О, 1О43000] практически непроверяем. С вариантом Эйлера, насчет представимости четных чисел суммой двух простых, ситуация намного хуже. Есть результат Виноградова—Эстермана о требуемой представимости почти всех четных чисел. Шнирель- ман показал, что достаточно большие четные числа Шнирельман (1905-1938) 12) Существует ли бесконечно много пар простых чисел-близнецов, отделенных друг от друга всего одним числом. Все пары простых близнецов, кроме (3,5) имеют вид 6n ± 1. На данный момент (07.2009) наибольшая известная пара 200 366 3613 • 2195000 ± 1 (58 711 цифр).
16 Глава 1. Отправные точки представимы в виде суммы не более К простых чисел, и К поначалу было немногим менее миллиона. Сейчас результат доведен до К = 4, но расстояние до К = 2 все равно видится в парсеках. На прилегающей территории есть также другие ассоциированные результаты, но ощущение близости цели не появляется. На компьютерах проблема Гольдбаха проверена вплоть до N порядка IO18. Ситуация с числами-близнецами совсем безрадостна. Нехватка идей ед- ва ли не абсолютная. Жажда результата выливается главным образом в компью- терный счет. Самая большая известная пара 200 366 3613 • 2195 000 ± 1, числа в своей десятичной записи имеют по 58 711 цифр. Серпинский (1882-1969) Загадочные обстоятельства сопут- ствуют почти всем попыткам разобрать- ся в «атомарной структуре» натураль- ного ряда. Есть предположение, напри- мер, что всякое четное п бесконечным количеством способов представимо в ви- де разности двух последовательных про- стых чисел. Однако не доказано даже, что любое четное п представимо в виде разности двух каких-нибудь простых чи- сел хотя бы одним способом. Богатая коллекция безответных вопросов есть у Серпинского [17]. Не все они, конечно, того же калибра что и проблема Гольдбаха, но о масштабе «недавних» задач не всегда легко судить. Безделица иногда оборачивается проблемой века, а солидная с виду задача — лопается как мыльный пузырь. Трудно разобраться, в частности, насколько основательны многочисленные задачи о простых числах специального покроя. Существует ли бесконечно много простых чисел вида: (а) 111 ... 111, записываемых с помощью только единиц 13\ (й) 100... 001, у которых между крайними единицами од- ни нули; |3> Рекорд пока принадлежит числу 1023 9
1.3. Лабиринты натурального ряда 17 (с) остающихся простыми при любой перестановке цифр в их десятичной записи? (d) Конечно или бесконечно множество простых числовых палиндромов14^? Задачи открыты, и это до некоторой степени удивительно на фоне следующего результата [17]. 1.3.1. По любым двум последовательностям цифр а\,...,ап и при условии- Ьт Е {1,3, 7, 9}, всегда можно указать простое число с десятичной записью . ап .. .Ь\... bm, т. е. существуют простые числа, десятичная запись которых начи- нается и заканчивается любыми наперед заданными последователь- ностями цифр, за исключением последней, Ьт {2, 4, 5, 6, 8}. Бесконечность множества Р простых чисел общеизвестна |5\ Классическое рассуждение Евклида (п. 2.2.2) дает тому обосно- вание в две строчки. Однако насыщенность натурального ряда простыми числами иногда вызывает удивление. С одной сто- роны, например, в N есть сколь угодно длинные промежутки свободные от элементов Р (раздел 8.3). С другой стороны, ряд расходится, что так или иначе впечатляет, ибо всех натуральных п «еле-еле хватает» для расходимости 00 1 2-—' п а тут после жуткой выбраковки слагаемых 1 /п сумма (1.4) греш- ным делом все равно уходит в бесконечность. * 15 '^Читаемых одинаково в обоих направлениях, типа 131, 313, 727,929. 15> Приблизительно на уровне шарообразности Земли.
18 Глава 1. Отправные точки 1.3.2. Теорема Эйлера. Сумма (1.4) u TT (1---------) , — расходятся. pej> \ Р/ Если 2fc > х, то, как легко убедиться 1 Р (1.5) pep \ г / p^x,peip что приводит к расходимости произведения из-за свойства = оо. В то же время в силу легко проверяемого неравенства |7> 1 1 - - Р 1 Р 1 2р(р - 1) (1-6) имеем что в per итоге гарантирует расходимость (1.4). ► 1 2’ 1.4. На стыке с комбинаторикой Как в самой арифметике, так и за ее пределами постоянно возникают числа, представляемые различными формулами ли- бо описаниями той или иной природы. Один из источников — комбинаторика. При этом особый интерес представляют те ситу- ации, в которых обнаруживаются связи с удаленными областями. Характерный пример — пятиугольные числа 18\ измеряющие коли- чество «целых точек» в комплектах гомотетичных пятиугольников (рисунок ниже) с целочисленными сторонами О, 1, 2,.... |6) Первое неравенство в (1.5) проистекает из замены суммы бесконечной геометриче- ской прогрессии ее конечной частью. Раскрытие скобок при перемножении сомножителей / 1 1 \ ,. 1 г , + - + ... + благодаря условию 2 х даст все слагаемые - при п (г], откуда следует второе неравенство (1.5). ,7) Неравенство (1.6) получается подстановкой z = 1/р в очевидное равенство z^ I z% 1п(1-г)-'-г=- + - + ...< _(? + ? + ...)=—_ г 6(0,1). Z J А а( 1 Z 1 |8) Известные еще древним грекам.
1.4. На стыке с комбинаторикой 19 Для пятиугольного числа fn легко устанавливается формула ) Д = 1п(Зп-1), (1.7) дающая ряд 1, 5, 12, 22, 35, 51, 70, 92, .117... . (1.8) Экспонаты (1.7), (1.8) кажутся высосанными из пальца. Де- скать, мало ли безделушек вокруг. Однако Эйлер неожиданно обнаружил, что разложение бесконечного произведения (1 - ж)(1 - ®2)(1 - х3)... (1.9) 19) дает степенной ряд 1 1-х-х2 + х5 + х7 -х12-х15 + х22 + х26-х35-х40+..., (1.10) в котором ненулевые показатели степени определяются формулой (1.7) при условии расширения значений ^п(3п — 1) с п G N до п 6 Z. К пятиугольным числам как бы добавляются «пятиугольные по- тусторонние». 19 * 19) Равенство (1.9) и (1.10) весьма примечательный и нетривиальный факт. Строгое обоснование Эйлеру удалось найти лишь через много лет.
20 Глава 1. Отправные точки Эйлер также показал, что последовательность -n(3n — 1), п 6 Z, вплетена в формулу <т(п) = ст{п - 1) + <т(п - 2) - <т(п - 5) — <т(п - 7) + + <т(п - 12) + <т(п - 15) - <т(п — 22) - ст(п -26) + , (Ы1) где гт(п) обозначает сумму всех делителей п, и в правой части (1.11) <т(п - к) = 0, если п - к «7 0. Таким образом, первоначальная несколько пресная и наду- манная геометрическая легенда о пятиугольных числах неожиданно оборачивается глубинными взаимосвязями с анализом и теорией делимости. Нетривиальные взаимосвязи, конечно, требуются со- временному исследователю, избалованному деликатесами. Древ- ние пифагорейцы обходились меньшим (или большим). Опираясь на философское чутье, они приписывали многоугольным числам20^ важную роль в устройстве мироздания. Как бы там ни было, но такими числами занимались многие выдающиеся математики, Ферма, Эйлер, Гаусс, что кажется удивительным ныне, когда чуде- са нивелируются под обыденность. Комбинаторика представляет еще интерес как механизм, по- рождающий малыми средствами огромные числа. Экспоненциаль- ные комбинаторные взрывы фундаментально вплетены в устройство Мироздания, и уж на арифметику влияют так или иначе. Специ- фически в этом отношении выделяется теория Рамсея, каковая пошла от «детской задачи»: среди любых шести человек всегда найдутся трое, которые все — либо знакомы между собой, либо не знакомы друг с другом. То есть: в любом шести-вершинном графе всегда найдется три-подграф, ко- торый либо полный, либо пустой — не содержит ребер вообще. Рамсей доказал, что по любым k,l GN можно указать такое число R, что в любом R-вершинном графе всегда найдется либо 20> Многоугольные числа определяются вложением многоугольников. Интересна золотая теорема Ферма (1670): (3) всякое натуральное число — есть либо треугольное, либо сумма двух или трех треугольных чисел, ... , (5) всякое натуральное число — есть либо пятиугольное, либо сумма от двух до пяти пятиугольных чисел и т. д. Полное доказательство дал Коши лишь в 1813 году.
1.4. На стыке с комбинаторикой 21 полный k-подграф, либо пустой I-подграф2^. Минимальные из та- ких R величины R(k, I) называют числами Рамсея. Соответствующая теория богата обобщениями и большим разнообразием содержательных интерпретаций, но вычислитель- ные успехи удивительно мизерны, О числах Рамсея R(k,l) известно совсем мало. 7?(3, 3) = 6, R(4, 4) = 18. Уже для подсчета Я(5,5) не хватает современных компьютерных мощностей. Известны, правда, диапазоны, Я(5, 5) € [43, 49], Я(6, 6) € [102,165],..., R( 10,10) € [798, 23556], но точное определение упирается в непреодолимые объемы вычислений. То есть сами числа не так велики, но для фиксации их местоположения требуется колоссальная техническая работа, для выполнения которой у Цивилизации нет средств. Фантастическая ситуация. Условие задачи укладывается в строч- ку, R(5, 5) =?, — а все компьютеры мира не могут справиться. Если угодно, пусть будет задача распознавания* 22^'. R(5,5) боль- ше 45? Никто не знает. Поэтому разговоры о гипотетической возможности быстрого'решения задачи при условии ее короткого описания не всегда корректны. Задача R(k, к) > К? экономно описывается, но практически не решается даже при малых к. Однако это, надо полагать, не NP-задшш. Близкая по духу проблематика связана с арифметическими прогрессиями. Ван дер Варден установил следующий факт. По любому к 6 N можно указать такое N, что при любой раскраске каждого числа в диапазоне от 1 до N в один из двух цветов — всегда найдется одноцветная последовательность из к членов, являющаяся арифметической прогрессией. 2!) И более того: если число объектов в совокупности достаточно велико и каждые два объ- екта связывает одно из г типов отношении, то всегда существует подмножество данной со- вокупности, содержащее заданное число объектов, которые связаны отношением одного типа. 22) См. главу 7.
22 Глава 1. Отправные точки С оценкой N по к тут дело обстоит еще хуже. Для к — 3 хва- тает N = 9. Далее начинаются головоломные осложнения. Даже теоретические. Ван дер Вардену пришлось использовать в до- казательстве двойную индукцию, каковая, вообще говоря, выходит за рамки аксиоматики Пеано [5, т. 6]. Соответственно оценки N(k) получились «чудовищные», измеряемые значениями функции Ак- кермана (раздел 1.5). И хотя от двойной рекурсии впоследствии удалось уйти (Саарон Шела, 1987), оценки N(Jt) несколько улуч- шились, но остались за пределами разумного. Все это лежит в русле теории Рамсея, в ядре которой заложен философский тезис: «всякая достаточно большая структура содер- жит регулярную подструктуру любого наперед заданного размера». Сюда притягивается за уши, грешным делом, далекоидущая кон- кретизация: для гарантированного существования жизни требуется лишь, чтобы Вселенная была достаточно велика. 1.5. функция Аккермана Функция Аккермана А(п, п) определяется двойной рекурсией, п +1, если т = 0; А(т, п) = А(т - 1,1), если т > 0 и п = 0; (1-12) _ А(т - 1,А(т, п - 1)), если т > 0 и п > 0, и служит примером вычислимой, но не примитивно рекурсивной функции [5, т. 6], которая фантастически быстро растет. Уже ,65 536 4(4, 4) выражается числом 22 , имеющим в своей десятичной записи цифр больше, чем атомов во Вселенной. А уж / ,65 536 \ 4(5, 5) = А(4, А(5, 4)) = А 4, 22 .(1.13) совсем зашкаливает. С точки зрения арифметики функция Аккермана представля- ет интерес в нескольких отношениях. Числовая двухиндексная последовательность {4(т, п)} являет собой пример стенографи- чески экономной записи сверхбольших чисел, что в принципе
1.5. Функция Аккермана 23 позволяет формулировать утверждения, за доказательство кото- рых не имеет смысла даже браться. Содержит ли {А(т, п)} бесконечно много простых чисел? Чтобы оценить бесперспективность такого рода задач, имеет смысл присмотреться к двойной рекурсии, которая невинно выглядит, но подталкивает в пропасть. Вычисление 4(1,2) можно проследить по схеме 4(1,2) = 4(0, 4(1,1)) = 4(0, Л (О, 4(1,0))) = = 4(0, 4(0,4(0, 1))) = 4(0, 4(0,2) = 4(0, 3) = 4, по далее число «итераций» нарастает с огромной скоростью. Скажем, 4(4, 4) = = 4(3,4(4, 3)). Далее 4(4, 3) = 4(3, 4(4, 2)) = 4(3,4(3,4(4,1))) = 4(3, 4(3,4(3,4(4,0)))) = 4(3,4(3,4(3,4(3, 1)))) = 4(3, 4(3,4(3,4(2,4(3,0))))) = 4(3,4(3,4(3,4(2, 4(2,1))))) . = 4(3, 4(3,4(3,4(2,4(1,'4(2,0)))))) = 4(3,4(3,4(3,4(2, 4(1,4(1,1)))))) = 4(3, 4(3, 4(3,4(2,4(1,4(0, 4(1, 0))))))) = 4(3,4(3,4(3,4(2, 4(1, 4(0,4(0,1))))))) = 4(3,4(3, 4(3,4(2, 4(1, 4(0,2)))))) = 4(3,4(3, 4(3,4(2,4(1,3))))) = 4(3,4(3,4(3,4(2, 4(0,4(1,2)))))) = 4(3,4(3,4(3,4(2, 4(0,4(0, 4(1,1))))))) = 4(3,4(3, 4(3,4(2, 4(0,4(0,4(0, 4(1,- 0)))))))) = 4(3,4(3, 4(3,4(2, 4(0,4(0,4(0, 4(0,1)))))))) = 4(3,4(3, 4(3,4(2, 4(0, 4(0,4(0, 2)))))) = 4(3,4(3,4(3,4(2, 4(0,4(0, 3))))) = 4(3,4(3, 4(3,4(2, 4(0,4))))) = 4(3, 4(3,4(3,4(2, 5)))) ->65536 • = 22 - 3.
24 Глава 1. Отправные точки Схема вычислений демонстрирует сначала привычную картину постепен- ного уменьшения аргументов. Но затем образуется выброс п = 5. Далее время от времени п прыгает на единичку вверх и добирается в конце концов до умо- помрачительных значений 23\ Получается, что для вычисления 4(4,4) надо ,65 536 пройти через 4(3, 2 - 3). Картина безрадостная. Вычисления странно блуждают по аргументам, не обнаруживая признаков упорядоченности. Забегание вперед становится все больше. На каком-то этапе даже возникает подозрение, что петля вычислений может вообще не замыкаться, ставя крест на двойной рекурсии как эффектив- ной процедуре. Однако подозрения не оправдываются. Процесс эффективный, но чересчур долгоиграющий. 1.6. Арифметические гении Арифметика на математическом поле выделяется доступностью для подсо- знания. В некотором роде, конечно. Не всякому числовые фокусы по зу- бам, но существование необыкновен- ных вычислителей о многом говорит — не вполне ясно о чем. Выдающимися способностями арифметического тол- ка обладали Эйлер, Гаусс, фон Нейман, причем Гаусс, по преданию, демонстри- ровал искусство счета еще в трехлетием возрасте, когда математические позна- ния не вмешивались в процесс. Фон Нейман (1903-1957) Без особых математических знаний обходятся и эстрадные феномены-счетчики, не говоря об уникальных вычислителях с пониженными умственными способностями более широкого назначения. Тема слишком интересна и обширна, чтобы ее здесь подробно обсуждать. С одной стороны, известна масса алгоритми- ческих уловок, позволяющих решать неприступные с виду задачи. С другой, — такие рецепты упираются все же в необходимость 23) Строчек в хронологии записи : еще больше.
1.6. Арифметические гении 25 запоминания промежуточных результатов, превышающего порог среднестатистического индивидуума. Так что выход — того или иного калибра — за пределы стандарта здесь налицо. Но объяс- нения материалистического покроя не хотят мистики, и секрет видят в экстраординарной памяти24^. Однако, как бы там ни было, надо признать, что непостижи- мый элемент здесь присутствует. По крайней мере в некоторых ситуациях арифметические манипуляции явно передаются в под- сознание, и вегетативная нервная система, управляющая пищева- рением, эндокринными процессами, дыханием и многим другим, что не по силам компьютеру, обнаруживает талант к арифметике. С дифурами не справляется, а вот числа откуда-то оказываются ей знакомы. Осознаваемая информация временами ныряет из Я в Оно (по Фрейду), и загадочным образом возвращается в перерабо- танном виде. Не всегда и не у каждого это происходит, даже редко и весьма избирательно, но подсознание, взращенное на опыте пе- щерного существования, демонстрирует иногда способности, ко- торым вроде неоткуда было взяться, если полагаться на Дарвина. Парадокс в том, что понятие абстрактного числа подсознанию неведомо, по логике вещей. Уместно напомнить [4]: нивхи, або- s & ригены Сахалина, до недавнего времени имели разные числительные для круглых предметов и продолговатых. В ситуациях «три огурца» и «три помидора» — ничего общего. Поэтому, числа в лоно интуи- ции не имеют входа, как будто. Еще более удивительны арифмети- ческие прозрения теоретического харак- тера, покоящиеся на мистическом фун- даменте. О таковых чаще всего говорят применительно к Рамануджану, фигура eg Рамануджан (1887-1920) z'!) Каковая хотя и поднимается часто до сверхъестественного уровня, остается, все же, в рамках количественного толкования, не требующего изменения философской парадигмы.
26 Глава 1. Отправные точки которого явно выделяется на теоретико-числовой ниве. Порази- тельные формулы Рамануджана нередко связывают с чудесными озарениями, но потом находятся более-менее рациональные объ- яснения. Вопрос в том, какая чаша перевешивает. 1.7. Табличные представления Интересна относительно недавняя гипотеза Гилбрайта (1958). В треугольной таблице в первой строке последовательно выписы- ваются простые числа рг, далее в каждой следующей строке под каждой парой соседних чисел из предыдущей строки записыва- ется абсолютная величина их разности 25\ Миниатюрная северо- западная часть таблицы выглядит так: 2 3 5 7 11 13 17 1 2 2 4 2 4 10 2 2 2 1 2 0 0 (1.14) 1 2 О 1 2 1 Гипотеза состоит в предположении, что каждая строка, ис- ключая первую, начинается с 1. Подозрение проверено по крайней мере для таблицы из 63 418 строк, т. е. для последовательности простых чисел вплоть до р 63 418 - Особый интерес табличных представлений типа (1.14) состо- ит в некотором расширении горизонтов. Обычно ведь изучаемые В математике закономерности и алгоритмы находятся в прокру- стовом ложе простейших стереотипов мышления. .Изучается то, что удобно для изучения. Что легко видится и без напряже- ния мыслится. Что выстраивается в линию, в последовательность однотипных действий. А таблица с взаимозависимыми столбца- ми и строками — это уже двойная рекурсия, еще более-менее 25) Во второй строке стоят разности |рг — рг_, |.
1.7. Табличные представления укладывающаяся в голову, но малоудобная. Числовые же масси- вы, расположенные тем или иным закономерным образом в R3, не говоря об R4 и далее, остаются за бортом анализа, потому что там сам черт ногу сломит. Двумерная организация массивов, конечно, остается в поле зрения. Популярных идей, правда, не ахти сколько. Треугольник Паскаля, магические и латинские квадраты. Треугольник Паскаля возникает следующим образом. Первая горизонталь- ная бесконечная в обе стороны строка содержит одну единицу, остальные нули. В нижеследующих строках каждое число равно сумме двух расположенных над ним чисел. Если теперь нули стереть, остается треугольник 1 1 1 1 2 1 15 10 10 5 1 1 6 15 20 15 6 1 Несмотря на тривиальное устройство объект (1.15) обнаруживает уди- вительное богатство содержания. Вдоль диагоналей оказываются выстроены треугольные, пирамидальные и другие числа 2б\ Встроенными в (1.15) оказыва- ются числа Фибоначчи, Каталана, биномиальные коэффициенты и т. п. На подробностях мы не останавливаемся по принципиальным соображениям. Треугольник Паскаля, все-таки, — частный вопрос (по крайней мере, в данном контексте), о котором подробные сведения легко найти в Интернете. Дополнительная информа- ция, может показаться, и здесь не помешала бы. Но отвлекаясь по каждому поводу, трудно оставаться в фарватере. Что касается магических и латинских квадратов27^, обращение к Интернету здесь еще более уместно. Отметим лишь, что все это 2<?| Треугольные (пирамидальные) числа указывают количества шаров, которые могут быть уложены в виде треугольника (тетраэдра). 27^ Таблица размера п х п, заполненная натуральными числами от 1 до п2, называется магическим квадратом, если суммы чисел во всех ее строках, столбцах и в двух диагоналях
28 Глава 1. Отправные точки не только фокусы. Латинские квадраты, например, используются при построении кодов, исправляющих ошибки [5, т. 4], не говоря об «оккультных свойствах». Этим, в значительной степени, использование .таблиц в тео- рии чисел исчерпывается, тогда как подспудно зреют уникальные плоды. Собственно, обнаруживается странная вещь. Из любой таблицы вылезают поразительные закономерности. Выписываем в строчку nk (1*,2*, 3*,...), под ней строку разностей соседних членов, затем снова строку разностей и т. д. Получаются следую- щие таблицы: 1 2 3 4 5 6 7 111111 1 4 9 16 25 36 49 3 5 7 9 11 13 2 2 2 2 2 1 8 27 -64 125 216 343 7 19 37 61 91 127 12 18 24 30 36 6 6 6 6 п 1 16 81 256 625 1296 2401 15 65 175 369 671 1105 50 110 194 302 434 60 84 108 132 24 24 24 одинаковы. Таблица п х п, заполненная натуральными числами от 1 до п, называется латинским квадратом, если в каждой строке и в каждом столбце находится перестановка чисел от 1 до п.
1.7. Табличные представления 29 1 32 243 1024 3125 7776 16 807 31 211 • 781 2101 4651 9031 180 570 1320 2550 4380 390 750 1230 1830 360 480 600 120 120 Каждый раз таблица «п*» заканчивается (к + 1)-й строкой факториалов к\. И туг начинает казаться, что до теоремы Ферма рукой подать. Временами доходит до анекдотов. Улам как-то на скучном заседании стал записывать на клетчатом листе бумаги натуральные числа вдоль раскручивающейся спирали (fo))) 145 144 143 142 141 140 139 138 137 136 135 134 133 146 101 100 99 98 97 96 95 94 93 92 91 132 147 102 65 64 63 62 61 60 59 58 57 90 131 148 103 66 37 36 35 34 33 32 31 56 89 130 149 104 67 38 17 16 15 14 13 30 55 88 129 150 105 68 39 18 5 4 . 3 12 29 54 87 128 151 106 69 40 19 6 1 2 11 28 53 86 127 152 107 70 41 20 7 8 9 10 27 52 85 126 153 108 71 42 21 22 23 24 25 26 51 84 125 154 109 72 43 44 45 46 47 48 49 50 83 124 155 110 73 74 75 76 77 78 79 80 81 82 123 156 111 112 113 114 115 116 117 118 119 120 121 122 157 158 159 160 161 162 163 164 165 166 167 168 169 и вдруг заметил, что простые числа имеют тенденцию ложить- ся на прямые, идущие под углом ±45°. Развлечение многим понравилось. Помечать клетки с простыми числами поручили
30 Глава 1. Отправные точки компьютерам. Таблицы разрослись до размеров Галактики, а тен- денция все та же, и объяснения пока не имеет, потому что всерьез его никто не искал. На этом фоне успехи нумерологии выглядят вполне законо- мерными. Если уж едва ли не произвольно устроенные числовые массивы обладают чудесными свойствами, то почему бы имени в числовом коде (или даже размеру ботинок) не коррелировать с судьбой индивида. 1.8. О границах теории Задачи на игровом поле натурального ряда N = {1,2,...} вре- менами создают впечатление мешанины, потому что макротече- ния не видны, и теоретический скелет отсутствует. А уж когда утверждается, что высшая арифметика2^ занимается изучением множества целых чисел, £ = {•••>-1,0,1,...}, положение декларативно искажается, ибо £ само по себе никакого глубинного устройства не имеет. Оно у него появляется после привлечения арифметических операций. Поэтому о какой бы то ни было теории можно говорить, лишь подвязывая к £ набор 28) Выражение «высшая арифметика» используется как синоним «теории чисел».
1.8. О границах теории 3I действий {+, —, х,:} или его часть. При этом не ясно становится, какая половина в тандеме {Z, {+,-, х,:}} (1.16) важнее. Не говоря о том, что присутствие Z в (1.16) оказывается в некотором роде ущербным, потому что глаголам (действиям) {+, —, х,:} тесно на территории Z, и площадку приходится так или иначе расширять, в результате чего возникают совокупности рациональных чисел и вообще разные алгебраические поля. Идею полезно уловить в самом начале на каком-либо характерном примере. Возьмем ряд Фибоначчи: 1,1,2, 3, 5, 8,13, 21, 34, 55, 89, 144, 233,..., устроенный по правилу Fn+2 = Fn+l+Fn, (1.17) т. е. каждое последующее число равно сумме двух предыдущих. Объект целочисленный, однако поиск' п -го члена в виде Fn = хп в силу (1.17) приводит к необходимости решения квадратного уравнения х2 - х - 1 = О, корни которого 1 ± 2=1,2 = —; и тогда общее решение F„ — ctx" + с2х2 в силу начальных условий F} = F2 = 1 дается формулой Бинэ Присутствие иррациональностей свидетельствует о местах пролегания маршрута поиска29 30’. Выхода за пределы N здесь не избежать, потому что решение ищется с помощью действий, каковые должны обращаться и согласо- вываться 3°), в результате чего получается универсальный ответ. Попытка следить за «объемными процессами» в плоском целочисленном срезе ничего не дает кроме недоумения. 29-! То же самое можно сказать о целочисленных решениях (2.54) уравнения Пелля с помощью иррационального х/2. 30) Укладываться в прокрустово ложе условия задачи (1.17).
32 Глава 1. Отправные точки Но подключение иррациональности вскрывает не всю правду. Кое-что становится яснее с позиции производящей функции а кое-что — с колокольни матричных манипуляций: 1 Л" = (Fn+l Рп .1 О/ V Fn Fn_\ Примеров подобного сорта будет рассмотрено еще много, но зародыш алгебраического замаха желательно видеть априори. Полезно стать на точку зрения, с которой теория чисел больше интересуется не числами, а действиями. . И тогда мысль будет достаточно раскрепощена, чтобы легко воспринимать подмену комплексных чисел a+ift (в определенных задачах [5, т. 8]), например, матрицами с учетом соответствия при котором условию г2 = — 1 отвечает равенство О 1 -1 О 1 О О 1 1.9. Великая роль обозначений Гениальность позиционной системы31), а„ ... dido = ап • Юп + • • • + «И • Ю + ао, aj < Ю, (1-19) особенно ощутима на фоне римской записи чисел, которая мог- ла бы, став во главе, подорвать благополучие математики. 31) Иногда позиционная запись an ... а, во заключается в скобки.
1.9. Великая роль обозначений 33 Правило (1.19) характеризует десятичную систему, fe-ичная 32) система ' строится аналогично: ап ... «1«о = ап кп + ... + «1 • к + «о, aj < к. (1.20) На первый взгляд трюк (1.20) имеет сугубо стенографическое предназначение, но эффект оказывается намного шире. • Хороший пример — игра «Ним». В каждой кучке по п!; спичек. Двое берут по очереди любое количество (> 1) спичек, но каждый раз только из одной кучки. Кому в итоге нечего брать, — тот и проиграл. Выглядит просто, однако, выигрывающий алгоритм найти — трудно, пока не приходит идея записать все щ- в двоичной системе. Тогда вычисляется поразрядная сумма а всех п* по модулю 2: если сумма единиц в разряде четная, пишется 0; если нечетная — 1. Чтобы выиграть, надо противнику все время оставлять <т из одних нулей. От обозначений многое зависит. Способность ориентировать- ся и двигаться в придуманной реальности определяется качеством символьных средств. Выдающиеся достижения Диофанта тем бо- лее удивительны на фойе использованной им знаковой системы, в которой 202ж2 + 13, 33) например, записывалось как ' ^1Н1аД М1Н11Д. При этом идея позиционной записи чисел уже присутствовала, но цифры изображались буквами, а реализация системы в целом еще не была «доведена до ума». Конечно, тут можно удивляться талантливости Диофанта, освоившего (и во многом придумав- шего) неудобный инструмент, но можно вспомнить также, что * 33 Двоичная система счисления является частным случаем fc-ичной. Представление (1.20) любого числа А однозначно. При делении нацело Л на А в остатке получается ао • При делении частного (полученного в результате предыдущего деления) снова на к — в остатке получается а ।. И так далее. В случае к = 2 делить надо все время пополам — остатки будут пулями и единицами. Например, 33 = 25 + 1, т. е. в двоичной системе 33 = 100 001. 33) Насчет обозначений Диофанта см. [2].
34 Глава 1. Отправные точки кому-то — негры на одно лицо, кому-то — китайцы. В том смысле, что разборчивость среды зависит от привычки и тренировки. Плюс к тому, распространены индиви- дуальные образы мышления вопреки обще- принятым. Тем не менее, внешне узаконен- ная «стенография» играет, все же, ключе- вую роль. Принятой ныне системой алгебраических обозначений мы обязаны Виету. Здесь воз- можны всякие оговорки, потому что Виет вместо А3 + 1АВ = С Виет (1540-1603) писал A cubus + В planum in Al aequatur C solido, но предпринятые им шаги, все-таки, принципиально раскрепостили алгебраическую мысль, приблизив форму записи к современной. 1.10. Геометрические мотивы Поскольку все математические34^ задачи проигрываются на ком- пьютерах, — во взаимосвязях арифметики с любой другой дисци- плиной нет ничего'удивительного. Но наи- более ценны прямые контакты с геометрией, ибо перевод задач на геометрический язык подключает интуицию. В этом направлении, правда, не так много зацепок, но среди них есть фундаментальные. Помимо очевидных параллелей типа ас- социации диофантовых уравнений Пифагор (VI в. дон.э.) а +Ь = с 0-21) 34) И нематематические.
1.10. Геометрические мотивы 35 с прямоугольными треугольниками с целочисленными сторонами (см. раздел 9.3), есть и нетривиаль- ные сопоставления. Один из неординарных результатов подобного сорта — тео- рема Минковского (1896): 1.10.1. Замкнутое выпуклое тело S С IK", симметричное относи- тельно начала координат О, имеющее объем не менее 2п, содержит целочисленную точку, отличную от О. Связь результата с теорией чисел достаточно прозрачна. Если система уравнений или неравенств имеет решение в целых чис- лах, то геометрическое тело, «вырезаемое» этой системой в содержит хотя бы одну точку целочисленной решетки. Из тео- ремы 1.10.1 вытекает ряд важных следствий в теории линейных и квадратичных форм, диофантовых приближений и др. Надо сказать, что Пифагорова интерпретация (1.21), хотя и элементарна, имеет мощный потенциал — достаточно посмот- реть на геометрическое решение (1.21) (раздел 9.3), исчерпыва- ющее все решения. Потом выясняется, что тот же визуальный стиль рассуждений работает в других ситуациях, в результате чего рождается теория эллиптических кривых, модулярных форм, гипо- теза Таниямы и в итоге доказательство теоремы Ферма. А совсем наивное вроде бы понятие конгруэнтного числа, как площади прямоугольного треугольника с рациональными дли- нами сторон, оказывается тесно связанным с весьма глубокими фактами и гипотезами теории чисел (раздел 9.5). Следующий результат, стоящий несколько особняком, при- надлежит П. Леви, выглядит довольно неожиданным и не так легко доказывается.
36 Глава 1. Отправные точки 1.10.2. Пусть Р u Q две точки на плоскости, расположенные на расстоянии 1 друг от друга. Тогда всякая непрерывная кривая35 зб^, соединяющая Р и Q, имеет хорду36/1 параллельную PQ длины 1 а = — п для любого п G N. Если же а не является обратным целому, то найдется кривая, соединяющая Р и Q, не имеющая параллельной PQ хорды длины а. 35^ Можно говорить даже о плоском континууме — ограниченном, замкнутом, связном множестве в Rn. зб) Хордой произвольного континуума С называется любой отрезок прямой, концы которого принадлежат С.
Глава 2 Элементы классики Нам рутину нечем крыть, Сколько слез ни лей, Надо ж как-то дальше жить Средь берез и щей. 9 9 ФО 99999— ое«—ф^оо-о-фф- —ффф-ф-ф^фффф -ффф-ффф—ф-ф-фф фф фф фффффф фффф—ффф-ффф- Ф-ФФФФ-ФФФ--99 ФФФФФФ 9 999 -ФФФ--Ф-ФФФ-ФФФ 9 9999 99 99 9- Классику формируют законы жанра. Так или иначе, в теории чисел сложилось традиционное представление о ядре учения. И хотя положение дел с тех пор сильно поменялось, а концепция усложнилась, базовый комплект инструментов остался прежним. Потому что горизонты рас- ширяются — центр неподвижен. 2.1. Делимость 2.1.1. Наибольшим общим делителем (НОД) целых a,b,...,sEZ называется наибольшее положительное число d=(a,b,...,s), (2.1) делящее нацело каждое из а, Ь,s (z Z. Круглые скобки слишком популярны, чтобы из возникаю- щих ассоциаций каждый раз выбирать правильное толкование. Поэтому вместо (2.1) чаще используется d= НОД (а,
38 Глава 2. Элементы классики особенно при «неожиданном» появлении НОД либо при соседстве с альтернативным использованием круглых скобок. Поиск НОД (а, Ь) обеспечивает алгоритм Евклида, работаю- щий в предположении а > Ъ следующим образом. Сначала а делится на Ъ: a = bqt+r2, после чего b делится на г2: & = r2q2 + г3. Далее остаток г2 делится на г3, — и так до останов- ки итерационного процесса, которая неизбежна, ибо остаток на каждом шаге строго уменьшается. В целом процесс имеет вид: a =bqi+ г2, b = r2q2 + r3, r2 = r3q3+r4, ' < Тп-2 — Tn-iqn-i 4" Гп, , Тп-1 ” Tnqn, неизбежно приводя к результату гп+, = 0 при некоторой п. Просматривал теперь (2.2) сверху вниз, обнаруживаем: общие делители а и Ъ совпадают с общими делителями b и т2, которые, в свою очередь, совпадают с,.общими делителями т2 и г3 и т. д. Таким образом, НОД (а, Ь) = НОД (Ь, г2) = = НОД (г2, г3) = ... = НОД (r„_i,r„) = г„, (2.2) т. е. rn — d оказывается искомым НОД. ► Пример. Поиск НОД (327, 234): 327 = 234 1 + 93, 234 = 93 • 2 + 48, 93 = 48 • 1 + 45, • 48 = 45-1 +3, 45 = 3-15. В итоге НОД (327, 234) = 3.
2.1. Делимость 39 Время работы алгоритма Евклида имеет порядок log3 а, а > b. То есть алгоритм полиномиальный, кубический от длины записи числа а (от количества цифр в а) Если в (2.2) обозначить а = г0, Ъ = г,, то алгоритм Евклида описывается единообразно одной строкой2); Vk = гк+хЧк+1 + Тк+2 (2.3) с заданием первых двух элементов последовательности гк, и пра- вилом остановки: П+2 = 0 => ответ-. гк+]. • Наибольший общий делитель более двух чисел, НОД (а...а„), сво- дится к определению НОД пар чисел: (аьа2) = ф, (ф, а3) = ф,... (ф_,, а„) = dn, (2.4) что дает искомый результат, НОД (а,,..., а„) = dn. (?) Держа схему (2.2) в поле зрения, легко понять, что3) (ah, bh) = (а, &) • h, а также /а (а, Ь) \з’ sJ з где s — любой общий делитель а и Ъ. В частности, / а Ь \ \(а, b) ’ (a, b)) Трудоемкость алгоритмов существенна при работе с большими числами, что харак- терно для криптографии — см. главу 7. С существенной оговоркой, что (2.3) определяет г^.+2 как остаток при деления rj. на г*+|. Приставку НОД перед (•, •) далее опускаем.
40 Глава 2. Элементы классики 2.1.2. Теорема. Всегда можно указать такие u,v gZ, что au + bv = (а, b). (2.5) Иначе говоря НОД (а, Ь) линейно выражается через а и b с помощью коэффициентов u,v 6 Z. « Запуская алгоритм Евклида и просматривая запись (2.2) снизу вверх, действуем следующим образом. Поскольку rn — d, то полагая а, = 1, vt = из предпоследнего равенства (2.2) имеем d = Tn-iU\ +гп_с<и. Полагая далее u2 — vi, = и, — , получаем d = rn_3U2 + Г„-2«2- Продолжая подниматься вдоль (2.2), в итоге приходим к (2.5). ► Приведенное доказательство дает также алгоритм решения уравнения (2.5), опирающийся на алгоритм Евклида и имеющий тот же порядок трудоемкости log а, а > Ъ. Описание процедуры в доказательстве теоремы 2.1.2 не очень хорошо укладывается в голове. И простой пример тут гораздо эффективнее, если объяснять человеку, а не компьютеру. 2.1.3. Пример. Решим уравнение 31и + 23д = 1. Алгоритм Евклида для поиска НОД (31,23): '31 =23-1+8, <23 = 8'2 + 7’ (2.6) 8 = 7 1 + 1, v .7 =7-1. Теперь из третьей строчки (2.6) имеем d = 1 = 8 - 7. Затем 7 = 23 - 8 • 2 из второй строчки (2.6), и остается подставить 8 = 31 -23- 1
2.1. Делимость 41 из первой строки. В результате: 1 = 8- 7 = 8 — (23- 8-2) = 8- 3-23 = = (31 - 23)- 3- 23 = 31-3 -23-4. . Таким образом, решение исходного уравнения: и = 3, v = -4. Интересно при этом, что4\ 3=31“', (-4) = 23"', и это общее правило. Поскольку (-4) = 27, то в качестве обратного элемента 23*1 можно взять также число 27. Гаусс теорему 2.1.2 формулировал несколько иначе: 2.1.4. НОД (а, Ъ) равен минимальному d € N в представлении5^ d — аи + bv, u,v Е Z. В частности, НОД (327,234) = (-5) 327 + 7 • 234 = 3. 2.1.5. В случае (a, b) = 1 числа аиЬ называют взаимно простыми. Из теоремы 2.1.2 вытекает, что а и b взаимно просты в томм случае, когда можно подобрать такие и, V, что au + bv = 1. По поводу обозначений см. разделы 2.7, 3.2. Подчеркнем, что минимум аи + bv имеется- в виду положительный, d 6 N, иначе при и = -6, v — а будет -ab + 6а = 0.
42 Глава 2. Элементы классики Геометрическим отзвуком пар взаимно простых чисел могут служить фигуры Лиссажу. Традиционно фигура Лиссажу представ- ляет собой след гармонически колеблющейся во взаимно пер- пендикулярных направлениях точки, при соизмеримых частотах. При отказе от гармоничности соответствующие фигуры получа- ются более замысловатыми, но все они несут на себе отпечаток взаимоотношений «частот», так или иначе выражаемых отношениями целых чисел. При добавлении третьего направления колебания, перпенди- кулярного первым двум, картинки становятся объемными и пред- ставляют собой узлы, также отражающие информацию о «взаимодействии целых чисел», участвующих в описании колебаний. 2.1.6. Наименьшим общим кратным^ (НОК) целых а,Ь,..., s Е Z называется наименьшее положительное число т = [а,Ь,..., s], Число а считается кратным Ъ, если оно делится на Ъ. В этом случае также пишут: b | а — «Ь делит а», т. е. а делится нацело на Ъ.
2.2. Простые числа как первооснова 43 делящееся нацело на каждое а,Ь,..., s 6 Z. [а, &] = ab (а,Ь)' (?)7) • Аналогично (2.4) НОК (а|,...,ап) сводится к определению НОК пар чисел. Последовательное вычисление [oi, а2] = m2, [т2, а3] = т3,... [тп_ь ап] = тп (2-8) дает искомый результат, НОК (а,,..., ап) = тп. (?) 2.2. Простые числа как первооснова 2.2.1. Число р € N, р 1, называют простым, если оно имеет только два делителя'. .1 и р. Остальные п € N, п 1, называют составными числами. 2.2.2. Теорема Евклида. Простых чисел бесконечно много. Допустим противное, множество простых чисел конечно, Но тогда любой простой делитель числа Р1 'Р2---Рп+ 1 отличается от любого pt,..., рп. ► 7 8'1 Замечание. Когда пишется учебник, пригод- ный, в том числе, чтобы взять его в «Ноев ковчег», изложение организуется дотошно. Все опорные точки, вплоть до мелких типа: Евклид (III в. до н. э.) 7) Произведение ab, безусловно, кратно и а, и Ъ, но (а, Ъ) в ab входит в квадрате, т. е. лишний раз. 8) Из приведенного рассуждения следует, что между я > 2 и я! обязательно есть простое число. Чебышев доказал, что простое число всегда есть между я > 3 и 2я — 2, что влечет при любом к 6 N существование по нрайчей мере трех простых чисел, записывающихся с помощью к цифр [17].
44 Глава 2. Элементы классики 2.2.3. Наименьший отличный от единицы делитель целого, большего единицы, является простым числом 2.2.4. Наименьший отличный от единицы делитель составного числа п не превос- ходит у/п — аккуратно выстраиваются в цепочку. Это совсем не плохоВ 9) 10, но у нас иные целевые установки, и потому кое-что «тривиальное» опускается, а по мере надобности используется как нив чем не бывало. В то же время, необходимо отметить, что роль фактов типа 2.2.3, 2.2.4 невелика лишь при наивном подходе к теории чисел. Всякая же попытка выйти за пределы Z вдруг обнаруживает, что не все тривиальное в обычной арифметике переносится за пределы Z либо переносится «с трудом», см. далее. Для составления таблицы простых чисел, не превосходящих данного N, может быть использовано решето Эратосфена. Рецепт заключается в вычеркивании из ряда 1,2,... ,N сначала всех чисел кратных двум, кроме самой двойки, затем — трем, кроме самой тройки, затем — пяти, кроме самой пятерки 10\ и т. д. По завершении процесса невычеркнутыми остаются все простые числа, меньшие N. Таким образом, простые числа элементарно характеризуются и легко перечисляются. Все как бы на виду, а ухватиться не за что. Не ясны закономерности ряда 2, 3, 5, 7, 11, 13, 17, 19, ... , рг, ... . Кое-что просматривается, но какая-то таинственная часть оста- ется за пределами понимания. В концентрированном виде это проявляется в отсутствии «хорошей» формулы для рг. В указанном ключе написан замечательный учебник Виноградова [7]. Просто, ко- ротко, и все определено. Однако, академический стиль имеет свои минусы. Некоторая монотонность, слабые акценты, да и затрагивать многие темы оказывается не с руки, потому что в избранной тональности потребовалось бы слишком много места для реве- рансов. 10) На каждом следующем этапе выбирается первое невычеркнутое число из «нетрону- тых» ранее.
2.2. Простые числа как первооснова 45 Что такое «формула», и чем она отличается от алгоритма — вопрос растяжимый. И если уж на то пошло, то —• ничем не от- личается. Алгоритмы для вычисления рг, правда, есть, но все они по сути — переборные. Много усилий было потрачено на «полумеры», обеспечиваю- щие эффективную генерацию рг достаточно больших порядковых номеров. Наиболее популярны до сих пор числа Мерсеннап\ р = 2* - 1. (2.9) Если к в (2.9) составное, к = mn, то р делится на 2m - 1. Поэтому (2.9), как гипотетический источник простых чисел, может иметь смысл только лишь в случае простых к, что гарантией простоты р все равно не является, 211 —1 = 23-89. Бесконечна ли совокупность простых чисел Мерсенна — неизвестно. Аналогична ситуация с простыми числами Ферма12^: р = 2* 2 * +1. (2.10) Самородки типа рецепта Миллса (1947), утверждающего су- ществование такого д, что целая часть при любом n Е N является простым числом — канули в Лету. Де- ло в том, что результаты типа (2.11) имеют обнадеживающий вид, но ничего не дают. Ибо вещественное число — суть конечная последовательность цифр, в которой может быть закодировано что угодно: весь список простых чисел, история мировой ци- вилизации, любой перечень теорем и т. п. И таких чудесных, но неуловимых иррациональностей — океан. Однако если их **1 Евклид обнаружил: если 2Р — 1 — простое, то 2₽-,(2,> - 1) является совершенным числом, то есть равно сумме своих собственных делителей (например, 28 = 1+2+4+7+14), а Эйлер доказал, что все четные совершенные числа таковы. Существуют ли нечетные совершенные числа — неизвестно. |2) Среди чисел 2" + 1 простыми могут быть лишь числа вида (2.10). В любом другом случае число 2" + 1 составное. (?) Ферма предполагал все числа (2.10) простыми. Эйлер 2s нашел (без компьютера!), что 2 + 1 делится на 641.
46 Глава 2. Элементы классики искусно замаскировать наподобие (2.11), какое-то время можно дурачить население. Есть также вполне определенные комбина- торные формулы для n-го простого числа|3\ но и они мало полезны с вычислительной точки зрения. Теперь, конечно, есть конкретный полином (п. 1.2.4), поло- жительные значения которого перечисляют все простые числа. Но это не спасает положения. Загвоздка в том, что рг перечисля- ются в запутанном порядке ', да и аргументы соответствующего Р(ж) приходится перебирать, пока не наткнешься на положи- тельное значение Р(х). Зато, правда, когда «наткнешься», число Р(ж) > О гарантированно простое — проверять не надо. В плане обнажения тайны совокупности {рг} многообещающе выглядят гЬормулы Шерка—Серпинского|5> Р2„ = 1 ±Р> ± Рг ± • • ±Ргп-1, (2-12) Р2п+1 = ±Р1±Р2±---±Р2п-1+Р2п, справедливые при подходящей расстановке знаков, каковая, как утверждается, всегда существует. Поначалу возникает впечатление «сорванной маски». Имея первые г про- стых чисел, для получения (г 4- 1)-го — надо лишь в (2.12) правильно расставить знаки. В крайнем случае можно перечислить варианты и выбрать надлежащий. Однако вариантов тут 2Г, что выталкивает в ту же область экспоненциального перебора. Еще ложка дегтя (если не вся бочка) — формулы (2.12) годятся для любой последовательности, которая «хорошо начинается» (первые семь членов, например, совпадают с первыми простыми числами), а потом не слишком быстро растет [18] — не быстрее геометрической последовательности со знаме- нателем 2, что имеет место и для {рг} • Так что устройство совокупности {рг} остается по большому счету загадкой. Некой потусторонней закономерностью, взятой как-будто совсем со стороны и плохо согласованной с природой 131 См. Gandhi J. М. Formulae for the n-th prime // Proc Washington state Univ. Conf, on Number theory. 1971, pp. 96-106. 141А не в порядке возрастания, как хотелось бы. |51 У Шерка вторая строчка (2.12) была не так красива: P2n+i = 1 ±Pi ±Рг ± • • • ±P2n-i + 2ргп-
2.2. Простые числа как первооснова 47 натурального ряда. Словно рг определены в духе инакомыслия инопланетного масштаба: число р € N, р 1, является простым, если из р квадратов нельзя сложить прямоугольник, р ~ ab, a,b^ 1. Формально все правильно, но «орган сложения и умножения» остается вне игры, и феномен {рг} предстает в роли выдумки, привнесенной извне. С тем же успехом можно было потребовать, чтобы из р кубиков нельзя было сложить прямоугольный па- раллелепипед или еще какую-либо хитрую фигуру выдуманного типа16\ Возникла бы другая разновидность чисел и их теория, более или менее удачная. И тогда бы думалось, что простых чисел в N нет. Они, дескать, в голове у «музыканта». Все это может показаться пустым ум- ствованием, но при взаимоотношениях с предметом исследования очень важно понимать, имеем ли мы дело с канарей- кой, которая сама поет, или со скрип- кой, которая только откликается. В пер- вом случае секреты первозданны, во вто- ром — рождаются движением смычка. Ситуация с арифметикой отчасти, ко- нечно, промежуточная. Помимо перво- зданных семян, теперь приходится рас- следовать и сюжеты, запущенные когда- то великими режиссерами. 16) Что стоит в ряду изобретений, где присутствуют совсем дикие плоды фантазии. Например, числа, из римской записи которых можно извлечь два других числа (используя для их записи только имеющиеся знаки), которые будут находиться с исходным в неком заданном отношении.
48 Глава 2. Элементы классики 2.3. Основная теорема арифметики Таковой называют теорему о единственности разложения всякого целого числа на простые множители. 2.3.1. Теорема. Всякое п € N однозначно разлагается в произве- дение простых сомножителей, с точностью до их порядка 17\ Ч Пусть pi — наименьший делитель п. Тогда п = р,П1. Если гц > 1 й рг — его наименьший делитель, то п\ = ргПг- Если n2 > 1... то п2 = рзПз, и так продолжаем, пока не достигнем значения гц = 1. В итоге n=PiP2-..pk- (2.13) Допустим, существует другое разложение на простые сомножители n = q\qi-..qi=P\P2...pk. (2.14) Обе части (2.14) делятся на qt — поэтому какое-то р, делится на gi. Как простое число, р, не имеет нетривиальных делителей, следовательно q: = р,- Аналогично q2 равно какому-то р7 и так далее, до исчерпания либо bcex q,, либо всех р(. Но если qs и р( не кончаются одновременно, — возникает противоречие, что доказывает единственность разложения (2.13). ► Сомножители в (2.13) могут повторяться, в связи с чем кано- ническое разложение записывают в форме П=Р“'Р22 ---Рк- (2-15) Обоснование единственности разложения (2.13) кое-кому представляется излишней роскошью, ибо все доказательство тео- ремы 2.3.1 опирается на два тривиальных — по-крайней мере очень легко устанавливаемых — факта: п. 2.2.3 и 2.3.2. Если произведение делится на простое р, то хотя бы один из сомножителей делится на р. Да и сама теорема 2.3.1 на этом фоне вместе с ее зауряд- ным доказательством выглядит банальной. Но скрытые пружины 17) Разумеется, п 1 предполагается, потому что единица не определяется как простое число. Но мы стараемся избегать тривиальных оговорок, чтобы не загромождать обзор.
2.3. Основная теорема арифметики 49 дают о себе знать при попытке сменить игровое поле. В дру- гих числовых системах возникают новые обстоятельства, о чем далее не раз будет заходить речь. Возможные трудности вскры- ваются элементарным примером короткой арифметики Гильберта на множестве G чисел вида 4k + 1, G = {1, 5, 9, 13, 17, ...}, с единственной операцией обычного умножения, не выводящего из G. Число 693 в G раскладывается на простые множители двумя способами: 693 = 21 • 33 = 9 • 77, что дает пример нетривиального равенства (2.14). Не простые в N сомножители 9, 21, 33, 77 просты в G. Необоснованное применение основной теоре- мы арифметики к объектам иной природы не раз приводило к своеобразным казусам. Ламэ в XIX ве- ке «доказал» последнюю теорему Ферма, жонглируя числами вида «о + + • • • + “п-зС" 2> (2-16) где коэффициенты — целые, а . 2тг . . 2тг с = cos---F * sin —. п п Куммер наступил на те же грабли, не заметив поначалу, что числа (2.16) не разлагаются един- ственным образом на простые множители, подоб- но числам натурального ряда. Но сам же гениально выпутался, дополнив множество (2.16) фиктивными числами (теперь их назы- вают дивизорами). Единственность разложения на простые множители была восстановлена, доказательство заработало, хотя и не на полную мощность — «фикция» привнесла свои трудности. Трюк Куммера работает и в короткой арифметике Гильберта. Единствен- ность разложения числа 693 восстанавливается введением в G фиктивных чисел, удовлетворяющих равенствам ар = 9, 7<1 = 77, «7 = 21, (3S = 33. (2-17)
50 Глава 2. Элементы классики Числа а, [3, у, S фиктивны, конечно, в G, но в окружении N система (2.17) конкретно решается, a = /3 = 3, 7 = 7, <1=11, (2-18) что эмоционально снижает эффект чуда. Но тут надо заметить, что в G числа 3, 7, 11 «вне закона», и ничем не лучше абстрактных а, /3, 5. 2.4. Целая и дробная часть Целая часть [ж] числа х £ R определяется как ближайшее слева целое. Например, [5] = 5; [3,2] = 3; [-2,7] = -3. Той же цели служит обозначение [ж] = [ж]. В противовес [ж] используется округление до ближайшего целого справа: [ж] = [ж] + 1. Дробную часть обозначают фигурные скобки: {ж} = ж - [ж]. {5} = 0; {3,2} = 0,2; {—2,7} = 0,3, О целой и дробной частях как о функциях, казалось бы, и говорить не стоит из-за «ничтожности» феномена. Тем не менее «пустячки» заслуживают выделения в самостоятельные понятия. Вот простейшая иллюстрация их эффективности. 2.4.1. Показатель, с которым простое р входит в разложение числа п\ на простые сомножители, равен где.р* _ наи^ольшая целая степень р, не превосходящая п, т. е. 1 = logn logp
2.4. Целая и дробная часть 51 Ч Число сомножителей в п\ = 1 • 2 ... п, кратных р, равно . Среди них кратных р2 имеется п .Р2. ; кратных р3 п .Р3. и т. д. ► 18) Число 101! делится на Зк, где максимально возможное к равно 101' V = 33+ 11 + 3+ 1 =48. Формула (2.19) принимает участие в различных производных соотношениях. Пусть, например, Q(®) обозначает НОК всех це- лых чисел, не превосходящих х. Разложение Q(x) • Q • Q . (2.20) на простые множители обнаруживает (?), что простое р входит в разложение (2.20) в степени (2.19). Поэтому (пг* \ / Ж \ ( X \ - -Q - 1...Q — =[«]!, (2.21) £ f \ / \ 1*^1 / что с помощью ^а(ж) = loga Q(x) записывают в виде тождества Чебышева (Ж\ (X \ 2 ) + V’a ( j J + • • • = loga[ж]! (2.22) Равносильное определение у>а(ж) = logap. Кстати, V’a(z) =1?a(®) + l?a(vZ»)+^a(\/«) + ---, (2.23) где 1?а(ж) = J21ogap. р$.х Функции ^а(ж) и $а(ж) называют функциями Чебышева^. Соотношения (2.21)-(2.23) являют собой несложные обстоятель- ства, сопровождающие и облегчающие анализ арифметических закономерностей. |8) Иногда «ум заходит за разум». В этом случае полезно рассмотреть ситуацию, Г п 1 в которой ряд (2.19) обрывается на втором слагаемом |_-j j . 19) Обычно полагают а = е.
52 Глава 2. Элементы классики 2.4.2. В случае иррационального а последовательность хк = {ак} всюду плотна на [О, 1]. Факт 2.4.2 есть по сути известная теорема Кронекера: 2.4.3. Для произвольного а £ R и любых х < у всегда можно указать целые тип, такие что2<У> х < та — п<у: (2.24) Ч Считаем |ж - у\ < 1 — в противном случае х и у можно сблизить, ужесточив требование (2.24), — и (х, у) С (0, 1) — иначе для близких х, у (име- ющих одинаковые целые части) условию (2.24) можно удовлетворить, меняя п. Разобьем далее (0, 1) на достаточно большое число равных по длине интер- валов Л, ..., Ад- так, чтобы какой-то интервал Ду попал целиком в промежуток (ж, у). Среди {та - п} при всевозможных тип найдутся тхх — П] и т2а - п2 (mi т2), попадающие в один и тот же интервал ДА. Поэтому2|^ 7 = (ш, - т2)а - (П] - п2) е Д, => J7 е Ду С (ж, у). ► Обращение к иррациональным числам помогает решать це- лочисленные задачи. Здесь удобный случай для демонстрации. 2.4.4. Всегда существует квадрат целого числа, десятичная запись которого начинается с любой наперед заданной последовательности цифр А = ai,..., а^. Декларация 2.4.4 означает, что найдутся такие целые к и р, что А 10р < к2 < (4 + 1) • 10₽. После логарифмирования неравенство переходит в 1g А < 21g к - р < 1g (4 + 1). 20) Иными словами, множество та — п (т, п ё Z) плотно на вещественной прямой при любом иррациональном а. В случае рационального а утверждение 2.4.3, само собой, тривиально. 2|) Равенство (т, - т2)а - (п, - п2) =0 невозможно в силу иррациональности а и т =^п.
2.5. Мультипликативные функции 53 Полагая k = 2m, p = 2q, получаем lg А < 2m 1g 2 - 2q < 1g (A + 1). Далее остается сослаться на теорему Кронекера. ► 2.5. Мультипликативные функции В теории чисел довольно часто возникают мультипликативные функции 0(х), заданные на N, каковые определяются условием 0(ху) = 0(х)0(у), (2.25) с исключением варианта 0(ж) = 0. Из (2.25) сразу следует 0(1) = 1., Ясно также, что произведе- ние мультипликативных функций является мультипликативной функцией. Примером мультипликативной функции может служить 0(ж) = Xs, (2.26) где s — любое вещественное или даже комплексное число. Но дру- гие варианты помимо (2.26) так просто в голову не приходят, пото- му что в интуитивно ожидаемой ситуации непрерывной функции на вещественной прямой другого решения (2.25) собственно нет. На дискретном игровом поле N возможности богаче, см. далее. 2.5.1. Если х — Pi'p^2 • • • Pk* — каноническое разложение числа х, а 0(х) — мультипликативная функция, то ^o(d) = (i + e(pl)+... + o(pa1'))..- d | х ...(l + 0(piO + ... + 0(p“*)), (2.27) где суммирование слева идет по всем делителям22^ числа х. d | х означает «d делит х», т.е. х делится нацело на d.
54 Глава 2. Элементы классики Ч Правая часть после раскрытия скобок превращается в сумму слагаемых вида 0(р^)...0^) = 0^'...р^), где каждое меняется в диапазоне от нуля до Uj. Таким образом все делители J в । въ ъ. a = Pi .. .pk числа х исчерпываются. ► 2.5.2. В частном случае 0(х) = Xs из п. 2.5.1 следует =(1+Р; + ...+РГ) ...(1+pI + ...+pT), d | х что при з ~ 0 дает число делителей г(х), а при s = 1 — сумму делителей S(x) числа х. 2.5.3. Произвольная мультипликативная функция может быть за- дана определением 0(ра) для всех простых р и всех натуральных а, и продолжением в на остальные х = р^'р®1 • р^1: в соответствии с правилом 0^...ра^ = 0(рГ)...0(рП (2.28) • Если 0(х) мультипликативна, то и Т](х) = 0(d) мультипликативна. ' d | х 2.6. Функции Мёбиуса и Эйлера Мёбиус (1790-1868) Функция Мёбиуса р(х) на числах х G N, имеющих каноническое разложение x=PiP2---Pk, (2-29) определяется равной м(®) = (-1/, где t > 1 число простых сомножителей в (2.29). На остальных х G N функция р(х) полагается равной нулю. В случае х = 1 считаем t = 0 => //(1) = 1.
2.6. Функции Мёбиуса и Эйлера 55 Иначе говоря, р(х) = 0, как только в каноническом разложении (2.15) встречается хотя бы один показатель а; 2. Еще говорят: д(ж) = 0, если х не свободно от квадратов23\ т. е. представимо в виде х = а • Ь2. В духе п. 2.5.3 р(х) определяется заданием Др) = -1 на простых р и р(ра) = 0 при а > 2, с последующим продолжением функции на остальные х по правилу (2.28). Несмотря на внешнюю непритязательность функция Мёбиуса играет в теории чисел весьма важную роль, оказываясь тем при- способлением, которое позволяет в одно касание решать массу неудобных вопросов. 2.6.1. Для любой мультипликативной функции 0(х) выполняется соотношение 52 рШ = (1 - ... (1 - <9(рк)), (2.зо) d\x где суммирование идет по всем делителям числа х = р^'р?2 • Pkk Ч Равенство (2.30) есть не что иное как (2.27), записанное для мультипли- кативной функции Дх)0(х) с учетом Др)0(р) = -0(р) и Дрп)0(ра) = 0, если a.j> 1. ► Выбор в (2.30) различных #(ж) порождает серию полезных тождеств. Например, для х = р^'р®2 • • -Р^ > 1 52 = 0, p(d) _ / О / 1\ Л d \ Р1/ "\ Рк) а\х Довольно часто применяется формула обращения Мёбиуса: F(x) = ^f(d) = (2.33) d\x d\x 23) Числа (2.29) называют свободными от квадратов, поскольку они не делятся на квад- раты натуральных п. (2.31) (2.32)
56 Глава 2. Элементы классики которая несмотря на технический характер довольно важна, по- тому что впитывает в себя громоздкие блоки рассуждений, до- ставляющие в неупакованном виде массу неудобств. Ч Доказательство просто, но требует рутинной изобретательности и по- вышенного внимания. Сначала «слева направо»: пусть в (2.33) выполнено левое соотношение (L). Тогда F(-) справа выразим через (L) — возникнет двойное сум- I ® мирование (по делителям </|ж и по делителям s | — ), которое с помощью опре- деленного жонглирования преобразуется в f(x). Внешняя канва выглядит так: Id = 5? д W(«) = 52 52 = л®)- s|s J® I s где последний шаг опирается на (2.31) с уточнением: 52 Д(4) ~ '• <*П Рассуждение «справа налево» проводится аналогично. ► Эйлер (1707-1783) Наиболее известна среди мультиплика- тивных арифметических функций функция Эйлера р(х), измеряющая количество чисел в ряду 0,1,..., х - 1, взаимно простых с х. Для снятия недомол- вок имеет смысл взглянуть на несколько первых значений: р(1) = 1, ^(3) = 2, ?(2) = 1, ¥>(4) = 2, т. е. нуль исключается из игры, а единица — засчитывается вза- имно простой с любым х. Очевидно, 9?(р) = р — 1 на любом простом р, откуда ясно <р{ра) ^ра-\р- 1) =ра(1 -0, aeN, (2.34)
2.7. Арифметика вычетов 57 что, будучи продолжено на любое х = 'р22 •••Рк'1 по (2.28), определяет ф(х) всюду на N (п. 2.5.3) и дает Эйлера24); ф(х) = х (1 —- | ... (1--- \ Pi/ \ Рк правилу формулу (2.35) переходящую в силу (2.32) в ф(х) = х d d\x (2.36) Еще одна неожиданная формула 52 = х d\x получается применением п. 2.5.1 к функции ф(х) с последующим учетом ф(ра) = ра - ра"х для простых р. 2.7. Арифметика вычетов Чрезвычайно важную и полезную роль в целочисленной арифме- тике играют сравнения. Если числа а иЬ при делении на m дают одинаковые остатки, то говорят, что а и b сравнимы по модулю т, и пишут a = 6(modm), (2.37) что равносильно25^ 3 к € Z : а = тк + Ь. (2.38) 24) В частности, 30 = 2-3-5 =» р(ЗО) = Зо(1-0(1-0(1-0 =8; 600 = 23-3-52 р(600) = 60о(1-0(1-0(1-0 =160. 25) В (2.38) часто предполагают Ь < т, т. е. когда Ъ является остатком отделения а на т. Временами ограничение Ъ < т мы подразумеваем и в (2.37), что либо оговаривается, либо ясно из контекста.
58 Глава 2. Элементы классики Обозначение (2.37) излишне громоздко, но укоренилось. Мы будем пользоваться более экономным его эквивалентом a = b, 3 17 5 = 20, 22 = —12, иногда возвращаясь к общепринятому стандарту (2.37). Легко проверяются следующие свойства сравнений: m , a = b => m , , m a = о, о = с => m , m , a =b, c — d => ТП т ТП j a =b, c = d => a + b -- c => m - a = b => m , a = b => m , a = b => b ~ a, a — b = 0, m a = c, । iv । j a + c = b + d, 7Д Z. J a • с = о • d, m , a = c — b, A m , k a = b , , m I. I a + c = b + c, m , a • с = о • c. Все это вместе взятое позволяет говорить об арифметике вычетов, или арифметике остатков. По первому впечатлению .. т ’ „ свойства отношения эквивалентности «=» во взаимодействии с арифметическими операциями полностью аналогичны свой- ствам обыкновенного равенства, но | это не совсем так]. 2.7.1. Обе части сравнения а = b можно разделить на их общий делитель, если последний взаимно прост с т. Ч Если в а — тк + 6 а = ad, b = b'd, и т не делится на d, то вынужденно к — k'd, и тогда а = тк' + Ъ'. ► Если же сравнение делится на число, имеющее общий дели- тель ст, — результат может получиться ошибочным: 20 = 26 после деления на 2 приходит к неверному 10 = 13. Однако 14 = 26 после деления пополам остается верным сравнением 7= 13.
2.8. Рядовые задачи 59 Это незначительное с виду затруднение порождает немало исследований и плодов, преображающих теорию в целом. Определенный интерес представляют одновременные мани- пуляции с левой и правой частью сравнения и самим модулем. 2.7.2. Обе части сравнения а = Ъ и модуль т можно умножить на одно и то же число, а также разделить на любой их общий делитель. 2.7.3. Если а = Ь, а = Ъ, то а = Ь, где s = НОК [т, п]. 2.7.4. Если а = Ь и т = kd, то а = Ъ. 2.7.5. Если а = Ъ и НОД (а, т) = d > 1, то b кратно d. Доказательства перечисленных фактов тривиальны. Но сами факты нуждаются в осознании и фиксации, если думать о сво- бодном владении инструментами сравнений. Из перечисленных выше свойств легко вытекает следующий важный для дальнейшего результат. 2.7.6. Теорема. Если P(si,..., хп) получается из полинома с це- лыми коэффициентами Р(х1,...,хп)^'^а^-^' ,хкп (2.39) заменой в (2.39) коэффициентов и переменных другими, сравнимыми с прежними по модулю т, то Р(хх,...,Хп) =Р(Х!,... ,хп). 2.8. Рядовые задачи Сравнения проходят красной нитью через всю арифметику, по- этому в одном месте об их прикладной значимости не скажешь. В то же время для начала желательна хотя бы простейшая иллю- страция работы инструмента.
60 Глава 2. Элементы классики • Найдем остаток от деления 372009 на 7. 37 = 2 =Ф- 372009 = 22009. А поскольку 8 = 23 == 1 и 2009 = 3 • 669 + 2, то Зу2009 Т_ 22009 _ . g669 9 • Признак делимости иа 9. Поскольку 10 = 1, то N — ап-10“ + on-i Юп +... + о0 = оп +... + Яд. Поэтому N делится на 9 в томм случае, когда на 9 делится его сумма цифр. • Признак делимости на 11. Поскольку 10* = (-1)*, то N — яп • 10п + ап_| • 10“ 1 + ... + flo = (flo + + ••.)- (fl.i + 03 + .. •)• Поэтому N делится на 11 в томм случае, когда на 11 делится его сумма цифр, стоящих на четных местах, минус сумма цифр на нечетных местах. Признак делимости на 11 иного сорта получается из представления N — (°п • • • ®о) ап • Юп + flB-i Юп 1 +... + а0 в виде N — (fliflo) + 100(0302) + 1002(о5О«) +..., откуда ясно N = (fliflo) + (O3O2) + (O5O4) + • • •, потому что 100= 1. • Признак делимости на 7. С учетом 1000 = - I и позиционной записи N = ап ... Оо, имеем N = (a2fl|flo) 4“ ЮОО(о5040з) + lOOO2(flsfl7flo) + ...== = (О2О1О0 + OgOjOo + ...) — (050403 + fliiflioflo + ...). • Уравнение 2х + 7*' = 132 не имеет решения в натуральных х, у, z € N, потому что 2 = -1, 7=1, 13=1. Поэтому 13г = 1 при любом z € N, а левая часть 2* +7’ = (-1)* + 1, т. е. Либо = 0, либо = 2.
2.9. Две системы вычетов 61 2.9. Две системы вычетов Отношение эквивалентности «по модулю т» разбивает Z на клас- сы сравнимых между собой чисел 26 27\' (а)т = {х : х — а 4- кт, к G Z}. Маленький пример, конечно, сильнее общей декларации. В случае т = 6 имеется 6 таких классов: ...,-12, -6,0,6, 12,... ...,-7,-1,5, 11, 17,... Первую строчку (2.40) можно обозначить как (0), либо (-12), либо, в конце концов, как (0 + 6к) при любом к € Z; (1) — это уже вторая строчкагТ>. В общем случае Z разбивается на т классов вычетов. Лю- бые т представителей по одному из каждого класса называются в совокупности полной системой вычетов по модулю т. В качестве «полной системы вычетов» обычно используют 0, (2.41) 2.9.1. Любые т чисел, попарно несравнимые по модулю т, образу- ют полную систему вычетов. 2.9.2. Если НОД (а, т) = 1 и х пробегает полную систему вычетов по модулю т, то ах+ Ъ при любом 6 € Z также пробегает полную систему вычетов по модулю т. Ч Допустим противное: axt + Ь == ахг + 6, — откуда ж, = ж2, что противоречит предположению о различии ж, и х2 и их принадлежности полной системе вычетов. ► В пределах любого класса вычетов — НОД (ж, т) один и тот же (п. 2.7.5). Особую роль играют те классы, в которых НОД (ж, т) = 1. 2б) На классы вычетов, т. е. на фактор-множества. 27) (а) в теории групп обозначает подгруппу, порожденную множеством, в данном случае одним элементом а.
62 Глава 2. Элементы классики Любые m представителей по одному из каждого такого класса называются приведенной системой вычетов по модулю т. Обычно приведенную систему формируют из элементов (2.41). Для т — 28, например, получается: 1, 3, 5, 7, 9, 11,13,15, 17, 19, 23, 25, 27. 2.9.3. В случае простого модуля приведенная система отличается от полной исключением из (2.41) нуля 28\ Роль приведенной системы будет далее прорисовываться в раз- ных аспектах, но по сути все очень просто: уравнение 29^ ах = Ь (2.42) гарантированно имеет решение х при любом Ъ, если а — элемент приведенной системы П. В частности, у любого а £ П есть обрат- ный элемент по умножению, а a~l = 1, — см. раздел 2.11 — и решением (2.42) является х = а~1 • Ь, т.е. х получается как бы делением на а, для чего в обычном понимании а должно быть ненулевым. В срезе «арифметики по модулю» эквивалентом по- нятия «не равно нулю» оказывается «взаимно просто с модулем». Поскольку в ряду (2.41) количество чисел взаимно простых с т измеряет функция Эйлера (р(т), то приведенная система насчитывает ровно (р(т) чисел. Понятно, что: 2.9.4. Любые <р(т) чисел, попарно несравнимые по модулю т и вза- имно простые с т, образуют приведенную систему вычетов. 2.9.5. Если НОД (а, т) = 1 их пробегает приведенную систему вычетов по модулю т,тоах также пробегает приведенную систему вычетов по модулю т. Доказательства утверждений 2.9.1-2.9.5 тривиальны, но они опять-таки (как и ключевые пункты раздела 2.7) нуждаются в осо- 28) В общем случае — исключением числа кратного т. 29) Играющее принципиальную роль во многих прикладных задачах.
2.10. Теоремы Эйлера и Ферма 63 знании и фиксации 30\ Простые и очевидные вещи — самые ко- чые, ибо ускользают, а без них не обойтись. 2.10. Теоремы Эйлера и Ферма 2.10.1. Теорема Эйлера. В случае НОД (а, т) = 1, т > 1: пЧ>(т) т . СЛ - 1 (2-43) Ч Когда х пробегает наименьшие неотрицательные вычеты в приведенной системе вычетов, ® — А ।,..., Л^(,п), (2.44) ах по модулю т пробегает те же значения (2.44) (п. 2.9.5), разве что в другом порядке. Перемножая х т ч т ДЛ] — Дь • • • 9 — Д^(т)? где каждое равно некоторому Л;, имеем а*’(т)А|... Av(m) =/л что после сокращения на А| ... А^(т) = щ дает (2.43). ► 2.10.2. Малая теорема Ферма. В случае про- стого р> 1 « НОД (a, р) = 1: аГ' 1. Теорема 2.10.2 сразу следует из теоремы 2.10.1. Умножая (2.45) на а, имеем (2-45) р р ар — а, (2-46) причем (2.46) справедливо уже и без требования взаимной про- стоты аир, что в определенных условиях имеет свои плюсы. 30) Для чего их полезно прокрутить, пусть даже переливая из пустого в порожнее, но в голове. В книге такие вещи только загрязняют изложение.
64 Глава 2. Элементы классики Результат, конечно, совсем простой (когда сообразишь). _ п । ap = (i+...+i)p = i^±^^+£;^—- равно a где суммирование идет по всем kj < р при условии ki +... + ka = р, и потому все слагаемые под знаком у j делятся на р, если р простое3^. Следовательно, ap = a+p-q, что влечет за собой (2.46). Теперь надо предположить взаимную простоту аир, чтобы (2.46) можно было разделить на а и получить (2.45). Причина обязательного наличия в арифметике вычетов со- отношении типа а = 1 достаточно очевидна. Из-за ограничен- 2 3 ности остатков при делении на т в ряду степеней а, а ,а ,... неизбежны совпадения: ак ™а1. (2.47) И если а взаимно просто ст, то (2.47) можно разделить на а1, что и дает ап = 1 при п — к - I. Однако в (2.45) п вовсе не обязано быть равным р - 1. Здесь обнаруживаются странные на первый взгляд закономерности. Степени 2Л по модулю 5: 2, 4,3,1,2,4,3,1,2,..., действительно, добираются до 1 первый раз при к — 5 - 1, после чего, естественно, все периодически повторяется. Но 2к по моду- лю 7 довольно быстро упирается в единицу: 2,4,1. А по модулю 11 снова требуется р— 1, т. е. 11-1 шагов, 210 = 1. Однако Зк натыкается на единицу раньше, З5 = 1.. Все это может показаться игрой случая, но за кадром тут стоят важные механизмы (см. первообразные корни, индексы). * 31> Ибо тогда р! ----— делится на р. Для составного р соотношения (2.45) и (2.46) • • • • «а• не обязаны выполняться, 5s = 5, 56 = 1.
2.11. Алгебраическая подоплека 65 2.11. Алгебраическая подоплека На арифметические понятия с самого начала полезно смотреть (или хотя бы посматривать) с общих алгебраических позиций. В частности, полную систему вычетов (2.41) естественно интер- *+* претировать как аддитивную группу Zm вычетов по модулю m с элементами32^ 0, 1,2,... , т — 1 и групповым произведением, рав- ным остатку от деления обычной суммы а + b на т. Единицей группы служит нуль. Напомним определения [5, т. 8]. 2.11.1. Группой G называется конечная или бесконечная совокупность элементов, на которой задана групповая операция « », сопоставляющая любой паре элементов а.Ь Г G некоторый элемент с из той же совокупности G: а b = с. При этом групповая операция, называемая обычно умножением, обязана удовле- творять трем условиям'. • Р ' (? ' г) = (р ’ ?) ’ г (ассоциативность). • В группе существует единичный элемент I, обладающий свойством I х = х 1 = х для любого xtG. • Каждый элемент х Е G имеет обратный х 1: X х"' = Х~' • X = I. 2.11.2. Группу G, содержащую п элементов, называют конечной, a |G| = п — ее порядком. Порядок |(?| может быть бесконечным. Подмножество Н С G, образующее группу, — при той же групповой операции, что и в G, — называется подгруппой. Групповое произведение х ... х с п сомножителями обозначают как хп, при этом х° = I. Группа G, в которой все элементы могут быть получены путем последовательного возведения в степень одного элемента а, G ={..., а’2, а~', а°, а, а2,..., ап,...}, (2.48) называется циклической. Если в (2.48) все степени at: (к 0) различны, группа G бесконечна. Конечная группа исчерпывается степенями 32) Вместо О, I, 2,..., т - I можно говорить о фактор-группе Z/mZ. и)Для обозначения групповой операции используются и другие знаки, равно как и отсутствие знака, как при обычном умножении.
66 Глава 2. Элементы классики Минимальное п в равенстве bn = 1 называют порядком или периодом элемента 6 и обозначают через |Ь|. В случае bn =£ 1 при любом п > 0, — считают |Ь| = оо. Групповую операцию обычно называют умножением. Это соответствует мультипликативной точке зрения. Для абелевых (коммутативных) групп, в кото- рых, по определению, а-b — b-а, обычно используется аддитивная терминология. Групповую операцию называют сложением и обозначают знаком +, а едини- цу именуют нулем. Коммутативность групповой операции упрощает теорию. Но надо иметь в виду, что привычка к «мультипликативному мышлению» ме- шает «мыслить аддитивно», и наоборот. При переводе полной системы вычетов (2.41) в лоно теории групп есть соблазн использовать в качестве групповой операции остаток от умножения34^. Но здесь на пути возникают препят- ствия. Во-первых, нуль в (2.41) заведомо необратим, поэтому совокупность О, 1,2,..., т — 1 приходится сокращать до 1,2, 1. (2.49) Во-вторых, не годятся составные модули. В случае, например, т = 6 только два элемента, 1 и 5, имеют обратные, Г1 = 1 (1-1 = 1), 5-1 =5 (5-5 = 1), а произведения 2-3 и 3-4 обращаются в нуль по модулю 6. Поэтому (2.49) рассматривается в качестве мультипликативной группы вычетов по модулю т лишь для простого т. Группа ли это — тоже вопрос. ◄ Первые две аксиомы группы очевидны. Ассоциативность ясна, посколь- ку а-b...h, как и в случае двух сомножителей, равно остатку от деления обычного произведения ab...h на т. Обоснование третьей аксиомы (суще- ствование обратного элемента) — несколько сложнее. Единица обратна сама себе. Далее надо доказать, что любое число х из {2,... ,т - 1} имеет обратное. Рассмотрим т целых чисел, х, х2,..., хт. Ни одно из них не делится на т, поскольку т простое, а х < т. Разделив каждое х1 на т, получим т остатков строго меньших т. Поэтому хотя бы два Остаток отделения обычного произведения ab на т.
2.11. Алгебраическая подоплека 67 числа хп и хк при делении на т дают один и тот же остаток. Отсюда хп-хк = хк(хп~к= 0, а так как хк 0, то хп~к -1=0. Пусть у обозначает остаток от деления числа жп~Л~1 на т, т. е. n-k-1 т х = у. Умножая обе части последнего равенства (сравнения) на ж, получаем n-к т х = ху. Но, как уже показано, хп~к при делении на т дает в остатке единицу. Следо- т J гт m -1 вательно, ху — 1. Поэтому у = х . ► Арифметически более полезна другая конструкция. В ад- дитивной группе Zm вычетов по модулю т помимо сложения вводится умножение а • Ь, равное остатку от деления обычного произведения а и b на т. Тогда класс вычетов по модулю т об- разует кольцо35^ %т, которое в случае простого т является полем. Если т составное, то будет кольцом, имеющим делители нуля (3 • 2 = 0 в Zg), но не полем. Так или иначе, в результате такого обрамления к теории чисел подключается аппарат общей алгебры. И как всегда, более общая точка зрения позволяет видеть причины и закономерности, находящиеся «на другом этаже». 2.11.3. Кольцом называется множество X с двумя бинарными операциями, сло- жения + и умножения , при условии: • X — коммутативная группа по сложению (аддитивная группа кольца). • Умножение ассоциативно36>. • Выполняется дистрибутивный закон, р- (q + r) = р q + p- г, (q + г) р = q р + г р, определяющий взаимодействие сложения и умножения. Ненулевое кольцо не может быть группой по умножению из-за р • 0 = 0 • р = 0. 35) В сущности Zm есть фактор-кольцо Z/mZ. 36) В случае коммутативности умножения кольцо называют киммутативным, а если в X есть единица по умножению, говорят о кольце с единицей. Определение кольца не исключает ситуаций а • Ь = 0 при ненулевых а, Ь. Такие элементы кольца называются делителями нуля. Кольца без делителей нуля (при условии 1^0) называются целостными.
68 Глава 2. Элементы классики Однако ненулевые элементы кольца могут составлять группу по умножению {мультипликативную группу). В этом случае кольцо называется телом, а тело с коммутативным умножением — полем. Поле вместе с любыми двумя элемента- ми а, Ъ содержит также аЬ, а + Ь, а — Ь и а/Ь (при условии b 0)37\ Структура поля гарантирует разрешимость линейных уравнений, что выделяет поля в особо ' благоприятные объекты изучения. Итак, кольцо вычетов Zm представляет собой множество (2.41), на котором заданы сложение и умножение по модулю, a + 6(modm), a-b(modm). Множество (2.41), т. е. {0,1, 2,..., т — 1}, с операцией сло- жения а + b(modm) образует аддитивную группу Z^ кольца Zm. Что касается совокупности (2.41) по умножению а • 6(mod т), то она группой не является. Но элементы (2.41), имеющие обратные по умножению, уже образуют группу, которая называется муль- типликативной группой Z„ кольца Zm. В группу Z^ входят те и только те элементы кольца а & Zm, которые взаимно просты с т, т. е. Zr* — это приведенная группа вычетов. Если т простое, то все элементы (2.41), за исключением нуля, как уже отмечалось, входят в Z„ — и тогда Zx, является полем. В общем случае это не так. Например, Z4X={1,3}, Z6X={1,5), Zg = {1,3,5,7}, Z9X ={1,2,4,5,7,8}, -где Z4 = (3), Z£ = (5), Z, = (2) = (5) — циклические группы, Zg — не цикли- ческая. Повышенное внимание к группам Z^ объясняется тем, что Z^ в случае разложения т = р*1 ... р*‘ на простые множители — есть прямое произведение групп ^(т,-=^), каковые оказываются «структурными блоками». Все группы Z£. цик- лические за исключением Z^.-, fc 3. Порядок группы Z^ равен значению <р(т) функции Эйлера <р. 37) Элемент х = а/Ъ определяется как решение уравнения Ъх = а.
2.12. Цепные дроби 2.12. Цепные дроби Цепной (или непрерывной) дробью называется выражение вида: 1 х = q0 Н----------------j, (2.50) «, +------------,— qi +-----------j---- ft +----------- qn + ' где qo E Z, а все остальные qj E N. Для обозначения (2.50) пользуются также обозначением х = [go; q\, qi, ] Конструкцию (2.50) большая часть населения недолюбливает из-за громоздкости и непривычности. Но она (конструкция) явля- ет собой какую-никакую систему записи чисел, каковая из бездны нашего непонимания кое-что извлекает на поверхность. Ведь если вдуматься, то система записи — это язык, от вы- бора которого зависит, что попадает в поле зрения и что остается скрытым, незамеченным. Позиционная система чисел удобна, но она многое заслоняет, выдвигая на передний план разные задачи инструментального характера: какие цифры стоят на та- ких-то местах, какие свойства не меняются при перестановке цифр и т. п. У динозавра (2.50) другие недостатки, но есть также достоинства. И потому (2.50), как телескоп обзора арифметики, временами заслуживает употребления. Разложение х в цепную дробь дает следующий рецепт. ft = И, ®o = z-ft,
70 Глава 2. Элементы классики Qn — 1 ®п = ?п> 1 где [ж], напоминаем, обозначает целую часть числа х. Для любого рационального ж разложение обрывается по до- стижении некоторого хп = 0. Дробь получается конечной. Ирра- циональные х представляются бесконечными дробями, которые оказываются периодическими в томм случае, когда ж является квадратичной иррациональностью: a Если разложение рационального ж = - сопоставить с алго- о ритмом Евклида (2.2), то легко убедиться, что в обозначениях (2.2) имеем a 1 - = Д + j , q2 +--------------------- <7з +----------j----- qi -I-- 1 <7n-l + Qn т. e. все §i,..., qn из (2.2), как говорится, в одном флаконе, что позволяет говорить о скелете цепной дроби как о ДНК обык- новенной. Как бы там ни было, формальное совпадение остова цепной дроби и набора qj на виду — как и равенство инертной
2.12. Цепные дроби 71 и гравитационной массы — но сделаны ли отсюда все возможные выводы? Наивные ингредиенты более-менее очевидны. Всякая цепная дробь порождает последовательность дробей, «о = q0,si = [g0; q\]>s2 = [g0; qi, &],s„ = [g0; qi, qi, •, q„], , называемых подходящими, которые, разумеется, могут быть пре- образованы в обыкновенные Рк причем легко проследить, что числители и знаменатели Pf;, Qj. меняются по правилу: Рк = Я.кРк-1 + Рк-Ъ (2-51) Qk = 4kQk-\ + Qk-2, Рк а сами s* = — сходятся к х, четные — монотонно возрастая, Qk нечетные — монотонно убывая. При этом значение х все время зажато между соседними s^t и S2/+1- Разница 6к _ _ Рк _ Pk-l _____________ Sk Sk~'~Qk Qk~i~ QkQk-C где 6k = PkQk-\ ~ QkPk-\ Несложные преобразования с учетом (2.51) приводят к 6k = (-1)*. В итоге Sk Sk~' QkQk-x ’ (2-52) откуда 1 1 Qk+\Qk Ql что выделяет подходящие дроби среди остальных следующим свойством. 2.12,1. Теорема. Подходящая дробь — является наилучшим при- Qk ближением х среди всех дробей, знаменатель которых не превосхо- дит Q}-.
.72 Глава 2. Элементы классики Это самый простой, но весьма полезный результат в области диофантовых приближений. а В случае рационального х — - последняя подходящая дробь b Рп 7^—1 — = -. В предпоследней дроби —— обнаруживается неожи- Qn о Qn-i данный феномен: (?) (2.53) 2.13. Диофантовы приближения Теорема 2.12.1 — лишь маленький фрагмент теории диофантовых приближений, в основе которой лежат достаточно простые вопро- сы, с виду бесплодные. Насколько хорошо V2 можно приблизить дробью а/Ь? С любой точностью, очевидно. И тут, казалось бы, надо поставить точку и заняться другими делами. Однако стоит обратить внимание, как вымученные, на первый взгляд, проблемы приводят к постановке интересных задач, а потом и к взаимосвя- зям с другими дисциплинами. Как минимизировать ошибку приближения |\/2—а/Ь\ при ограниченном Ь? Оказывается, существует константа 7, такая что I /» _ «I < 7 I 61 " 62’ и даже две константы, позволяющие ошибку зажать в тиски: 71 < I /х ®| <- 72 ь2 " I &I " Ь2' 3 Г~ В то же время v2 и многие другие числа, особенно трансцендентные, приближаются рациональными дробями гораздо более эффективно. Частично разобраться в причинах помогает 2.13.1. Теорема Лиувилля. Если £ — корень неприводимого3^ полинома f(x) с целыми коэффициентами степени п > 1, то существует константа34^ 7 > О, такая что Р ь I ьп 38) См. раздел 6.2. 39> Зависящая от £.
2.13. Диофантовы приближения В силу неприводимости /(ж) . / a. \ _ |Ana” + An-ia”~'& + I > I I \Ь J ~ 6" bn' Кроме того, с учетом /(£) = 0, имеем = v b)f{x) при некотором ж, скажем, из интервала (£-!,£ + 1)- Таким образом, где 7 — константа в неравенстве |/(ж)| , ж 6 (£ - 1, £ + 1). ► 7 Получается, что характер приближения может служить инди- катором, помогающим классифицировать иррациональные числа. Сразу, конечно, не придумаешь, зачем это нужно. Лиувилль, тем не менее, сообразил, как использовать сей инструмент, и постро- 40) ил трансцендентное число ' 00 е = Е к=\ удовлетворяющее, как легко убедиться, неравенству ТЬ г» £ _ V 1(Г*! < ? ш 4 10Ф+1)!’ которое не вписывается в рамки теоремы 2.13.1, — и потому £ не может быть алгебраическим числом. Возвращаясь к аппроксимации л/2, заметим, что при целых ж, у О ж2 - 2уг О в силу иррациональности л/2. Поэтому минимум |ж2 — 2т/2| равен единице, и наименьшая ошибка приближения |л/2 — х/у\ достигается на решениях урав- нения Пелля^ х2 — 2у2 = 1, 40) Существование каковых в его время было не ясно. 4|) Сыгравшего весомую роль в решении 10-и проблемы Гильберта.
74 Глава 2. Элементы классики обладающего уникальными свойствами [5, т. 6]. Все его целочисленные решения (жл, Уп) вычисляются из xn + V2yn = (\ + V2)n, (2.54) что являет собой показательный пример успешного взаимодействия арифметики натурального ряда с «иррациональными трюками». 2.14. Задачи для обозрения Задачи полезно решать, но и просматривать их не худо для расширения представлений о дисциплине. Речь не столько о ни- жеследующих задачах, которых смехотворно мало, а о самой идее. 1. Для любого простого р и любого многочлена f(x) с целыми коэффици- ентами имеет место сравнение f(x) = f(X»). 2. Гармонический ряд п 1 расходится, но частичные суммы п 1 при п= I П=1 Л' > I целых значений не принимают. 3. Натуральное р > 2 является простым в томм случае, когда (р-2)! -1 делится нар (теорема Лейбница'). 4. Пусть а, Ъ,..., w G N и a + b + ... + w=n. Тогда а! 6!... w! 5. Уравнение 15ж2—7у2 = 9 не решается в целых числах. 6. Если сумма цифр числа не меняется при умножении его на 7, то оно делится на 9. Лейбниц (1646-1716) 7. Уравнение 1! + 2! + ... + х\ = у2 имеет только четыре решения. 8. Уравнение ж4 + у4 = z2 не имеет ненулевых целочисленных решений.
Глава 3 Теория сравнений Выпей водки с Пустотою Тет-а-тет, И настройся по-простому. Нет — так нет. Нижеследующий материал относится к эле- ментам классики, но в главу 2 не помещается из-за диспропорции размеров. Идеология тут проста по замыслу, однако богата результатами, и поднимается местами до таких высот, с кото- рых некоторые глубины видны. При этом уче- ние о сравнениях обеспечивает не отдельные разрозненные прорывы, а дает основу для ре- шения широкого класса арифметических задач. 3.1. Диофантовы уравнения Диофантовыми мы называем полиномиальные уравнения с цело- численными коэффициентами и поиском целочисленных реше- ний. В случае одного неизвестного х это либо уравнение а>п * -Ь а>п~ 1' ~Ь * .. + йо — О', (3-1) либо ап • ж" + an-i 1 + • , т а . . + ЙО — 0. (3-2) В случае (3.1) из представления (ап • х + an-i • х + .. . + at)x = -а0 сразу ясно, что х должно быть делителем «о, и это сводит решение (3.1) к идеологически простому перебору.
76 Глава 3. Теория сравнений Для уравнения х3 + х + 1 = О достаточно проверить лишь две возможности х = ±1. Обе не подходят — решений нет. Для х3 + х + 10 = 0 потенциально возможными, в силу 10 = 2*5, могут быть ±1, ±2, ±5, ±10. Подходит лишь х -2. Что касается уравнений вида (3.2), то они также решаются ограниченным перебором, поскольку все коэффициенты в (3.2) можно заменить остатками от деления на т, и решение х искать ' среди0, 1,..., т - 1 {теорема 2.7.6). Другое дело, что при боль- ших т в дебрях перебора хотелось бы видеть «короткие пути», для чего требуется определенная изобретательность и какая-ни- какая теория. Кроме того, интерес часто представляют не сами решения, а условия их существования. Это заставляет смотреть на проблему под другим углом зрения. Возникают также допол- нительные вопросы: сколько решений, можно ли существенно ' сократить перебор и т. п. Для полиномиальных «уравнений по модулю» с несколькими переменными /(жь ..., жп) = 0 (3.3) ничего по сути не меняется. Переход к остаткам от деления на т сводит поиск решения опять-таки к ограниченному перебору. Разве что идеологическая мотивация усиливается. А вот обычные уравнения (разумеется, целочисленные) /(Ж],...,xn) = 0, (3.4) становятся довольно неудобными объектами — в общем случае даже алгоритмически неразрешимыми 2\ Подсоединив затем к найденным х соответствующие классы вычетов. Понятно, если решение у (3.4) есть, то рано или поздно его можно найти перебором. Но если решения нет, то это принципиально недоказуемо для некоторых уравнений, см. главу 5.
3.2. Сравнения первой степени 77 Разрешимость (3.4) влечет за собой, оче- видным образом, разрешимость (3.3) при лю- бом т. Поэтому, если у (3.3) нет решений при некотором т, это означает неразреши- мость (3.4). Однако если (3.3) разрешимо при любом т, отсюда не следует (как можно бы- ло бы подумать) разрешимость (3.4). Диофант (ок. Ill в.) Уравнение (ж2 * * - 13)(ж2 - 17)(х2 - 221) = О разрешимо при любом т (?), но (ж2 — 13)(ж2 — 17)(ж2 - 221) = 0 не имеет целочисленных решений. 3.2. Сравнения первой степени 3.2.1. Теорема. Уравнение первой степени ах = Ь (3.5) в случае взаимно простых а и т — НОД (a, m) = 1 — имеет единственное решение ' в любой полной системе вычетов. < Если НОД (а, т) = 1 их пробегает полную систему вычетов по мо- дулю т, то и ах пробегает полную систему вычетов по модулю т (п. 3.2.1). Поэтому только при одном х число ах будет сравнимо с Ъ. ► Если же НОД (а, т) = d > 1, то для разрешимости (3.5) обязательно, чтобы Ъ было кратно d (см. п. 2.7.5). При этом а, Ъ и т можно разделить на d (см. п. 2.7.2), в результате чего ситуация сводится к п. 3.2.1. Поэтому справедливо следующее утверждение. 3.2.2. Теорема. Если НОД (а, т) = d > 1 и Ъ не кратно d, уравнение (3.5) неразрешимо^. Если же Ъ кратно d, то (3.5) имеет единственное решение в любой приведенной системе вычетов и d решений в любой полной системе вычетов (по модулю т)5). ^Разумеется, по модулю т. Если х* — решение (3.5), то х* + кт, к £ 1 — все решения уравнения (3.5) в Z. Неразрешимо, в частности, ах = 1. Поэтому элементы а не имеют обратных, если НОД (а, т) = d > 1. 5) Сей факт полезно сопоставить с п. 2.9.5
78 Глава 3. Теория сравнений Обратим внимание, что (3.5) равносильно разрешимости ли- нейного уравнения ах = ту + Ь, т. е. ах - ту = Ь (3.6) с двумя переменными х, у Е Z. Как решать уравнение (3.5)? Из сказанного выше ясно, что мбжно ограничиться случаем НОД (а, т) = 1. Умножая (3.5) на а-1, где а-1 — обратный к а элемент в группе Z^, т. е. дающии в произведении а а — 1, — имеем т -U х = а о. Таким образом, решение получается без всякого перебора, если знать обратный элемент а”1, к поиску которого надо правильно подойти. Конечно, по теореме Эйлера 2.10.1 ™ 1 и» — 1 , Т'е’ откуда ясно а-1 = а^т^х. Но возведение а, быть может, в большую степень <р(т) — 1 — иногда не сахар 6 7\ Достаточно эффективной альтернативой может быть формула (2.53), а также стандартный путь, пролегающий через использование алгоритма Евклида. Дело в том, что по теореме 2.9.2 уравнение-as = 1 имеет единственное решение х = а-1, равносильно единственное ре- шение имеет уравнение ’ ах — ту = 1, (3.7) каковое решается алгоритмомЕвклида (см. доказательство тео- ремы 2.1.2) за ~ log3m арифметических операций. Так что об- ратные элементы (по умножению по модулю) разыскиваются поли- номиально — перебор не требуется. 6’Для возведения в степень по модулю имеются достаточно экономные алгоритмы (см. раздел 3.3). 7) Уже не по модулю, а обычное уравнение в целых числах.
3.3. Алгоритм возведения в степень 79 3.2.3. Китайская теорема об остатках. Каковы бы ни были взаимно простые ni,...,nk Е N и целые х\,...,хк Е N, — существует такое х, что Ж = Ж], »2 Ж = Ж2, • • • 5 х = хк, (3-8) т. е. х, дающее при делении на щ,... ,пк остатки х\,... ,хп. При этом одно из возможных-решений'. ж = ж Xi, ( П \ 1 П где п = псп-)... ,пк, а \ — — обратный в Zn. к элементу —. \ Остальные х, удовлетворяющие (3.8), сравнимы с х по модулю п, д .. 8) и других решении нет п ◄ Элемент — делится на все п, при j ^i. Поэтому П; / п \ 1 nj j xj, j — г, I — 1 Х{ = < \п>/ (0, j£i, что означает х* == Xj при любом j. Отсюда для х из (3.8) имеем ♦ ^3 • х — х =0 при любом ] , * п3 что дает х — х = 0. ► 3.3. Алгоритм возведения в степень В арифметике остатков стандартной операцией является вычисле- ние наименьшего неотрицательного вычета a"(modm) при очень больших значениях тип. Прямолинейная попытка действовать в лоб (вычисляя сначала а" последовательным умножением на а), S' Другими словами, в пределах полной системы вычетов.
80 Глава 3. Теория сравнений конечно, неразумна. Выход из положения заключается в двух про- 9) стых уловках 1. Всякое произведение тут же (не дожидаясь следующего умно- жения) заменяется наименьшим неотрицательным вычетом по модулю т. Тогда в процессе вычислений не возникают числа большие т2. 2; Для вычисления n-й степени а возводится в квадрат, затем в квадрат возводится а2, потом а4, далее а8, ..., — и так пока 2к остается меньше п. После чего задача сводится к возведению а в меньшую степень п — 2 . а'024 = а2'°, а21=а16+4+'. Несложный анализ показывает, что суммарное количество двоичных операций, необходимое для вычисления a"(modm), имеет порядок ~ (log n)(log2 т). 3.4. Полиномиальные сравнения 3.4.1. Если т = 77717722, то полиномиальное сравнение f(x) ™ 0, /(ж) = ап-хп + ап-\ -ж"”' + ..'. +«о, (3.9) выполняется в томм случае, когда выполняется каждое сравнение (см. пп. 2.7.3, 2.7.4) /(ж)™’0, /(ж) = 0. (3.10) Поэтому каждому решению ж = Ж1,Жг,... уравнения (3.9) взаимно однозначно соответствует пара разноименных решений (3.10) из наборов 7П| . . 7712 Ж =Л1,Л2,..., Ж = р,\, р>2, . . . , т. е. ж* О {Аг-, p,j}. Поэтому, если N(m) обозначает число реше- ний сравнения (3.9), a N(mi) и Nfai), соответственно, — число 9 9' Трюки копеечные, но дают огромный эффект.
3.4. Полиномиальные сравнения 81 решений сравнений (3.10) 10\ то N(m) = TV (m ДАТ (m2), что означает мультипликативность функции N(т), и JV(m)=JV(p“‘)...JV(^), где т = р®1Рг2 • • р^11 — каноническое разложение т. Эквивалентность уравнения (3.9) и системы (3.10), наряду с каноническим разложением модуля, объясняет, почему основной интерес представляют сравнения (3.9) по модулю простого числа в некоторой степени. В свою очередь, решение Л*)=0 (3.11) автоматически находится по решению сравнения /(ж) = 0 по простому модулю р. «Автоматически» — не значит без труда. Пусть х i — какое-то решение /(ж) = 0. Все решения тогда: ж = Ж1 + tip, что после подстановки в Л*)=0 (3.12) и разложения левой части (3.12) в ряд Тейлора после отбрасывания членов кратных р2 — принимает вид уравнения /(Ж1) +ptif'(xA) =0, которое однозначно11^ решается относительно.^. В результате определяется решение Ж2 = + tpp сравнения (3.12) по мо- дулю р2. Далее процесс можно продолжать в том же духе, по- следовательно определяя «вырастающие из жр> решения (3.11) 3 4 по модулям р , р , . 10) Каждый раз речь идет о числе решений в пределах соответствующей полной системы вычетов. 113 2 ' Разумеется, по модулю р .
82 Глава 3. Теория сравнений 3.5. Сравнения по простому модулю Из предыдущего раздела ясно, что решение сравнения (3.9) по со- ставному модулю сводится к решению совокупности сравнений по простым модулям вида Л®)=0. (3.13) По поводу (3.13) напомним, что коэффициенты полинома /(ж) можно (теорема 2.7.6) заменить остатками от деления на р, решения ж тоже можно искать только в полной системе вычетов О, 1,..., р — 1. Вдобавок и степень полинома можно уменьшить: 3.5.1. Уравнение (3.13) равносильно уравнению R(x) = 0 степени не выше р — 1, где полином R(x) представляет собой остаток от деления /(ж) на хр — ж. ◄ Из /(ж) = (ж'' — x)Q(x) + R(x) и Xе - х = 0 (малая теорема Ферма) — следует f(x) = R(x). ► Таким образом,в /(ж) = ап • ж" + ап-1 • хп~1 + ... + а0 = 0 (3.14) можно считать п < р, иначе в соответствии с п. 3.5.1 степень уравнения может быть понижена. р 3.5.2. Теорема. Сравнение (3.14), р простое, п < р, ап 0, — имеет не более п решений 12\ различных по модулю р. < Проще всего воспользоваться математической индукцией. При п = 1 утверждение справедливо. Допустим, что факт 3.5.2 имеет место для п— 1. •Покажем, что тогда он справедлив и для п. Пусть Х| корень (3.14). Деление f(x) на х — xt приводит к тождеству f(x) = (х - x^)Q(x) + R, |2) Простота модуля здесь существенна. Сравнение ж2 — 1 =0 имеет 4 решения: ж = 1, 3, 5, 7.
3.6. Теорема Вильсона подстановка в которое х = xt дает /(ж,) = R. А поскольку /(ж,) Е 0, и R = 0, в силу чего (3.14) равносильно сравнению (ж - s ,)<?(.!:) = 0, каковое имеет не более п решений, потому что Q(x) = 0 имеет не более п - 1 решения по индуктивному предположению. ► Полиномиальные сравнения при п > 1 целочисленных ре- шений могут не иметь вообще. Пример: Уж Е Z : ж2 + х + 1 0, 2 5 т. е. ж + ж + 1 = 0 не решается. Корней нет, разложение на мно- жители ж2 + ж + 1 = (ж — Ж[)(ж — Ж2) невозможно. Полином ж2 + ж + 1, таким образом, неприводим по модулю р. Аналогия с теорией обычных многочленов [5, т. 8] сохраняется и далее. Многочлен ж4 + 2ж3 — ж2 + 2, не имеющий корней в Z, разлагается в произведение неприводимых многочленов: ж4 + 2ж3 - ж2 + 2 = (ж2 + ж + 1)(ж2 + ж + 2). 3.5.3. Теорема. Если d делит р — 1, р — простое, то xd = 1 имеет в точности d различных решений. Пусть р — 1 = ds. Тогда хр~’ - 1 = (xd - 1) ((ж1*)'-1 + (хЛу~г + ... + xd + 1) , т. е. - 1 (xd - 1) ((х“у-' + (хЛу-г + ... + xd + 1) . (3.15) Если бы у xd — 1 = 0 было менее d корней, то у полинома справа в (3.15) было бы менее р — 1 корней (по теореме 3.5.2). Но хр~' -1=0 имеет р — 1 различных корней 1,..., р — 1 {малая теорема Ферма), что приводит к противоречию. ► 3.6. Теорема Вильсона Частным случаем (3.13) является двучленное сравнение хр~1-1=0, (3.16)
84 Глава 3. Теория сравнений которое имеет р — 1 решений13 *^: 1, 2, ..., р - I. Если р 2, то р - 1 четно, и (3.16) можно представить в виде - 1)(/^ + 1) =0, что эквивалентно системе двух сравнений jc^-1=0, и + 1 = 0, (3.17) J) 1 14) каждое из которых, в силу теоремы 3.5.2, имеет —— решений \ 3.6.1. Теорема Вильсона 15 16\ В случае простого р — (р - 1)! + 1 = 0. (3.18) ◄ Сравнение ЖГ'~'- 1 = (ж - 1)(ж-2)...(ж-р+1), (3.19) как и (3.16), имеет р - 1 решений 1, 2, ..., р - 1. Раскрывая справа в (3.19) скобки и сокращая ж’’”1 с левым хр~'', получаем уравнение степени р - 2, которое по-прежнему имеет р — 1 решений — многовато по теореме 3.5.2. Поэтому все коэффициенты слева и справа в (3.19) должны быть равны, в том числе свободные члены, т. е. (р-1)! ^=-1. ► |6) Немаловажно, что теорема 3.6.1 обратима. 3.6.2. Если (п - 1)! + 1 = 0, то число п простое. 4 В случае п = аЬ, а, Ь > 1 факториал (п - 1)! делился бы на а, но тогда на а не делилась бы сумма (п - 1)! + 1. ► 13) На основании малой теоремы Ферма. !4i Из теоремы 3.5.2 вытекает, что если — 0 имеет к +1 решений (к и I степени полиномов Д. и //), то сравнения Д.(а) = 0 и fj(x) = 0 имеют соответственно к и I решений. |5* Сформулирована Варингом, сославшимся на Вильсона. Доказана Лаграижелг. 16) Другой вариант доказательства. В группе Z£ только 1 и р - 1 обратны сами себе, ибо '2 р р из а — 1 следует а = ± 1, т. е. либо а = 1, либо а = р — 1. Поэтому числа 2, 3,..., р — 2 разбиваются на пары взаимообратных, откуда 2 • 3 ... (р — 2) =1, что после умножения па р — 1 = — 1 дает (3.18).
3.7. Степенные и квадратичные вычеты 85 Таким образом, делимость (п — 1)! + 1 на п является безоши- бочным критерием, позволяющим отвечать на вопрос, число п простое или составное. Но вычислять факториал в лоб при боль- ших п не по зубам даже компьютеру. В рассматриваемом русле лежит также 3.6.3. Теорема Лейбница. Число п является простым в томм случае, когда (п — 2)! — 1 делится на п [17]. 3.7. Степенные и квадратичные вычеты На общем фоне (3.13) по своей важности выделяются уравнения решения которых — так называемые п-степенные вычеты по мо- дулю т — в некотором роде являются целочисленными корнями х = у/a по модулю т, ( у/а)п = а. Ниже рассматривается про- стейший вариант: х* 2 = а (3.20) в предположении взаимной простоты а и р, т. е. НОД (а, р) = 1. 3.7.1. Те числа а > 0, при которых (3.20) разрешимо, называют квадратичными вычетами по модулю р. Остальные а > 0 {при ко- торых (3.20) неразрешимо) называют квадратичными невычетами по модулю р. Разумеется, не из всех а извлекается корень квадратный в этом смысле. Например, 5 = — 1 (как бы 5 = V-1), но уравнение ж = 7 не решается. р - 1 3.7.2. Теорема. Для простого р > 2 существует ровно —-— Р ~ 1 17) квадратичных вычетов и ------ квадратичных невычетов 1. 17) По модулю 13 числа 1, 2, 4, 9, 10, 12 — квадратичные вычеты, 2, 5, 6, 7, 8, 11 — квадратичные невычеты.
86 Глава 3. Теория сравнений 4 В силу s2 = (р — з)2, что очевидно из (р - s)2 = р2 - 2sp + з2, первая половина квадратов |8) I2, 22,..., (р - I)2 (3-21) .дает при делении на р те же остатки, что и — последняя. Это означает, что р - 1 квадратичных вычетов не может быть более —-—. С другой стороны, числа (3.22) все различны по модулю р, поскольку для любых a,be < 1, 2, ... Р- 1 2 разность а2 — Ь2 = (а - Ь)(а + Ь) не может делиться на р, потому что оба сомножителя (а — Ь), (а + Ь) меньше р. Поэтому остатки отделения чисел (3.22) р - 1 р - 1 насдают------вычетов по модулю р. Оставшиеся —-— чисел из 1, 2, ..., р-1 2 2 будут невычетами. ► 3.7.3. Теорема. Число а является вычетом или невычетом по мо- дулю простого р > 2 в томм случае, когда выполняются соответ- ственно сравнения 1 (3.23) или ^-1. (3.24) с 2 Р (Р ~ 1 \ Ч Если а — вычет, то возведение х = а в I —-— 1 -ю степень приводит к (3.23), — в силу малой теоремы Ферма 1 = а?’-'. Но ар-1 - 1 = (а^ - 1) (а^ + 1) = О, р — 1 по той же теореме Ферма имеет (р— 1) решений, —-— из которых вынужденно p-i р приходятся на второй сомножитель + 1 = 0, т. е. уже на невычеты, удовлетворяющие, таким образом, соотношению (3.24). ► 18) Решения уравнения (3.20) при любом данном а 0 достаточно искать в приведен- ной системе вычетов, полагая х = 1, 2, ..., р— 1. Поэтому все а, различные по модулю р, при которых (3.20) разрешимо, содержатся среди остатков от деления чисел (3.21) на р.
3.8. Символы Лежаццра и Якоби 87 3.8. Символы Лежандра и Якоби Определенной реакцией на несколько не- уклюжую терминологию было введение символа Лежандра для всех а, не кратных р. ли а — квадратичный вычет, и определяемого если а —- квадратичный невычет. Лежандр (1752-1833) Таким образом, символ Лежандра ничего понятийно ново- го не вносит, однако придает рассуждениям стенографическую краткость, а нескладным вычетам/невычетам — визуальную на- глядность при формулировке результатов. В силу теоремы 3.7.3 (0=^- <3-25> 3.8.1. Частным случаем (3.25) является (3.26) Поэтому а = — 1 является квадратичным вычетом лишь для чисел р вида 4k + 1, и — невычетом для р = 4k + 3. Следовательно, х2 + 1 —0 имеет решение в томм случае, когда р = 4k + 1. 3.8.2. что сразу вытекает из (3.25). В частности,
88 Глава 3. Теория сравнений О - С) 3.8.3. Если a = b, то ,' что ясно из определения, но полезно в озвученном виде. 3.8.4. Определение. Пусть Р > 1 нечетно, и Р = р^ ... рт — разложение на простые множители, где pj не обязательно различны', ( а\ целое а взаимно просто с Р. Символ Якоби I — ) определяется как произведение символов Лежандра'. 3.9. Закон взаимности По поводу закона взаимности квадратичных вычетов принято «бить в колокола», обозначая выдающийся характер феномена. 3.9.1. Теорема. Для простых p,q> 2 имеет место равенство (w> (р\ (ч\ Иначе говоря, - = ± I - I, где знак + будет, если хоть одно \Ч) \Р/ из чисел р, q имеет форму 4k + 1. В доказательстве существенную роль играет следующий ре- зультат, схватывающий ядро проблематики. 3.9.2. Лемма Гаусса. Пусть простое р больше 2, целое а не де- лится на р, и р обозначает количество отрицательных чисел среди наименьших по абсолютной величине вычетов чисел Т) — 1 а, 2а, ..., (3.28) / а\ „ Тогда - = (-1/. \Р/
3.9. Закон взаимности 89 Р ~ 1 4 Итак, правило предписывает каждое ka в ряду а, 2а, ..., —-—а заме- нить равным по модулю р числом ряда Р~ 1 2 Р~ 1 2 -1, 1,- (3.29) При этом, как легко убедиться, ни одно число в ряду (3.29) не встретится более одного раза. Перемножая сравнения ka = (±Z), получаем19^ а • 2а... “у « - (±1)(±2)... , что после сокращения на 2, Р~ 1 —приводит к а^(±1)...(±1) = (-!)< ► Лемма Гаусса простой, но очень эффективный инструмент в рассматриваемой области. Вот как она работает в случае а = 2. Ряд (3.28) при а = 2 есть: 2,4,- 1, — и для определения р необходимо определить, сколько чисел при переводе в систему вычетов (3.29) станут отрицательными. Понятно, что отрицатель- ными станут числа большие -р. Полагая р — 8k+r (г = 1, 3, 5, 7), вопрос сводим к определению числа решений у неравенства 1 1,1 - р <2х < р => 2k + - г < х < 4k + - г, 2 4 2 в котором 2k и 4k можно убрать, не нарушая четности числа решений. Поэтому для оценки четности р достаточно рассмат- 1 1 ривать неравенство - г < х < - г, имеющее одно решение при г 4 2 равном 3 или 5, и четное число решений в остальных случаях (ни одного при г = 1, и два при г = 7). Поэтому: 3.9.3. Число 2 является квадратичным вычетом для простых р вида 8k ± 1 и — невычетом для простых ур вида 8k ± 3. Этому соответствует запись :'9) Скобки в (±!) обозначают выбор определенного знака.
90 Глава 3. Теория сравнений Результат был известен еще Ферма', впервые доказан Эйлером, причем весьма замысловатым образом. Так же просто лемма Гаусса 3.9.2 работает и в общем случае при доказательстве теоремы 3.9.1. 4 Чисто технически устанавливается (см. например, [7]) т. е. четность р совпадает с четностью суммы в (3.30). Пусть х, у пробегают значения: Равенство xq = ур невозможно, поскольку р и q неравные простые числа, где а, — число пар (ж, у), удовлетворяющих условию xq < ур, — число пар, удовлетворяющих xq > ур. Таким образом, ъ = 52 — Е и лемма Гаусса 3.9.2, с учетом (3.30), дает 7 что после перемножения приводит к (3.27). ► 3.10. Теорема Шевалле 3.10.1. Теорема Шевалле. Если полином /(ач,..., хп) с нулевым свободным членом имеет степень т, строго меньшую числа пере- менных (т < п), то у сравнения f(xx,...,xn) = 0 (3.31) 20) при любом простом р существует ненулевое решение 20) В котором не все Xj = 0.
3.11. Сумма четырех-квадратов 91 р Ч В предположении противного, f(xt,..., хп) 0, сравнение 1-(/(Ж1,...,Жп)Г' =41(1-4-1) (3.32) является тождеством, в силу малой теоремы Ферма. С другой стороны, (3.32) не может быть тождеством, потому что одноименные коэффициенты полиномов слева и справа в (3.32) не могут быть равны по модулю р, ибо степень полинома слева равна m(p - 1), справа — п(р — 1). Противоречие возникает из-за т < п. Выход из положения один, (3.31) обязано иметь ненулевые решения. ► Теорема 3.10.1 довольно проста, но часто экономит усилия. 3.10.2. Любая квадратичная форма (с целочисленными коэффици- ентами) от п 3 переменных вырождена по любому простому модулю р, т.е. всегда найдутся целые х\,... ,хп (не все Xj = 0), такие что ajjXjXj — 0, п 3. (3.33) i,j=l 4 Доказывать фактически нечего. Достаточно сказать, что все предполо- жения теоремы 3.10.1 выполнены. ► 3.11. Сумма четырех квадратов Для полиномиальных уравнений известно много разрозненных результатов. Некоторые из них стоят на отшибе, другие — вре- мя от времени оказываются в центре внимания. Один из таких то и дело используемых фактов — представимость любого нату- рального п суммой четырех квадратов. Иначе говоря: 3.11.1. Теорема. Уравнение п = х2 + у2 + и2 + w2 (3.34) разрешимо в целых x,y,u,v G Z при любом п 6 N. Разбор полетов удобно начинать с тождества Эйлера (а2 + Ь2 + с2 + d2)(A2 + В2 + С2 + D2) = = (аА + ЬВ + сС + dD)2 + (аВ -bA-cD + dC')2 + + (аС + bD-cA- dB)2 + (aD -ЬС + сВ- dA)2, (3.35)
92 Глава 3. Теория сравнений из которого ясно, как представление суммой четырех квадратов получается для произведения чисел, если каждый сомножитель уже представлен «как надо». Поэтому достаточно уметь представлять четырьмя квадратами простые числа. Заслуживает комментариев само тождество (3.35), способное вогнать в транс своей необозримостью. Как правило, технически громоздкие идеи имеют в подноготной тот или иной секрет. Так и здесь. Тождество (3.35) выражает равенство нормы произведения кватернионов21^ произведению их норм. Справка. Кватернионы являются четырехмерными числами вида Z = а + ip + J7 + kS, где а,Р,^,8 — действительные числа, а 1, г, j, к — четыре базисных единицы, удовлетворяющие соотношениям i2 = j2 = k2 = ijk = -l, откуда следует ij = ~3* = k> Зк = ~kj = г> ki ~ ~3k = 3, что совпадает с правилами векторного умножения единичных ортов {i,j,k} в R3. Сложение и умножение на число определяется обычным (для векторных пространств) образом. Кватернионы вида х • 1 + у г образуют подалгебру, изоморфную алгебре комплексных чисел над полем — действйтельных. 4 Доказательство теоремы 3.11.1 распадается на два этапа. 3.11.2. Некоторое кратное тр (0 < т < р) любого простого р всегда предста- вимо в виде суммы четырех квадратов, тр = а2 + &2 + с2 + d2. (3.36) 2i> О которых, правда, Эйлер еще не знал.
3.11. Сумма четырех квадратов 93 < Достаточно установить разрешимость сравнения22^ ж2 + у2 + 1 = О, (3.37) что равносильно тр = ж2 + у2 + I2 + О2. Li Р ~ 1 Образуем числа ж и —у — 1, где ж и у пробегают значения 0, 1, ..., —-—. При этом никакие ж2 и Ж2, так же как — у2 - 1 и — у% - 1, не могут быть сравнимы по модулю р (см. доказательство теоремы 3.7.2). Но так как чисел каждого вида ж2 и -у2 - 1 имеется (р + 1) штук, а остатков по модулю р только р штук, то какое-то ж2 дает при делении на р тот же остаток, что и -у2 - 1. Это означает разрешимость 3.37 и доказывает п. 3.11.2. > Теперь покажем, что минимальное т в (3.36) равно 1, т. е. если т > 1, то найдется г < т, обладающее тем же свойством, что и т. Для этого а, Ь, с, d в (3.36) заменим равными по модулю т минимальными по абсолютной величине вычетами А, В, С, D, т. е. 1 1 А, В, С, D € --т + 1,..., -т. Поскольку А2 + В2 + С2 + D2 = 0, то существует такое г, что mr = A2+B2 + C2 + D2. (3.38) В силу 1 2 1 1 1 2 1 2 2 тг < -т + -т + -т + -т = т , 4 4 4 4 имеем г < т. Равенство г = т исключено, так как в противном случае все A,B,C,D = ^т, и тогда все , , т2 1 2 a, Ъ, с, d = -т , 4 _ т2 2 , ___ откуда следовало бы тр = т , невозможное из-за простоты р. 1ак что г < т. Наконец, перемножая (3.36) и (3.38) и пользуясь тождеством (3.35), получаем m2rp = (аД + bB + cC + dD)2 + (аВ -. ЬА - cD + dC’)2 + + (аС + bD - сА - dB’)2 + (aD -ЬС + сВ- dA')2, (3.39) что после сокращения на ;тг2 (легко видеть, что все слагаемые справа делятся на т2) дает требуемый результат. ► 22) Считаем р > 2, поскольку в случае р = 2 утверждение З.П.2 очевидно.
94 Глава 3. Теория сравнений Если кому-то описанное рассуждение кажется сложноватым, так доказательство не давалось даже Эйлеру, неудачи которого не менее ценны, чем достижения. Кроме того, надо, иметь в виду, что некоторые доказательства, сотни лет копившие изобретатель- ность по крупицам, шлифовались и редактировались многими поколениями математиков. ' Результат 3.11.1 существенно дополняет теорема Якоби'. 3.11.3. Количество целочисленных решений {x.y.u.v} уравнения (3.34) при любом п G N — равно 8 d при нечетном п и 24 d при четном п. d\n d\n
Глава 4 Первообразные корни Бог создал ее раздетой В забытьи, Онемели даже эти, Соловьи. И теперь одежд не надо Задарма, От нее вон сплошь и рядом Без ума. На полную систему вычетов можно смотреть как на поле с операциями сложения и умно- жения а + &(mod т), a - &(mod т), что — если договориться — освобождает от не- обходимости каждый раз над равенством ставить букву т либо каждую строчку маркировать зна- ком (mod т). Сразу декларируется «все происходит в Zm», после чего используются обычные арифме- тические знаки, а «по модулю т» держится в уме. Такое соглашение в данной главе подразумевается. 4.1. Суть проблематики 4.1.1. Определение. Целое ( называется примитивным корнем1^ по простому модулю р, если ( порождает группу Z*={l,...,p-1}, (4.1) Примитивные корни называют также — первообразными.
96 Глава 4. Первообразные корни т. е. все элементы (4.1) оказываются степенями , Равносильное определение: ( — примитивный корень по простому модулю р, если (р — 1) -- наименьшее положительное число, для которого = 1. (4.2) Выгоды существования примитивного корня очевидны. Груп- па Zp оказывается циклической, все ее элементы 1,...,р — 1 исчерпываются степенями (, . Поэтому, например, умножение а • b в Zp сводится к сложению показателей у сомножителей а = £’, Ъ = (Л Облегчаются доказательства общих.утверждений, й вообще достигается некоторая прозрачность. Насчет прозрачности, конечно, сильно сказано. Потому что при бесхит- ростном подходе обнаруживаются странности, что уже отмечалось в разделе 2.10, и не на все вопросы легко ответить. Например, 2/; по модулю 5, 2к = 2,4,3,1,2,4, 3,1,2,..., первый раз обращается в единицу при k = 5 — 1, после чего все периодически повторяется. Но 2* по модулю 7 обращается в единицу уже на третьем шаге: 2,! = 2,4,1. Зато тройка оказывается примитивным корнем по модулю 7. В порядке возрастания показателей: 3* = 3,2, 6, 4, 5, 1,3, 2,... . Здесь возникает вопрос, всегда ли существуют примитивные корни? Как выяснится — всегда 3\ Иначе говоря, мультиплика- тивная группа Zp обязательно циклическая. Но как она устроена? Сколько имеет подгрупп и что это за подгруппы? Дело ведь в том, что несмотря на простоту индекса р группа Zp имеет р — 1 эле- ментов, а число р — 1 (р > 2) составное, и от его разложения на простые множители многое зависит [5, т. 8]. Но раз число р — 1 все равно составное, почему бы изначально не отказаться от простоты р, и не рассматривать мультипликативные группы Z„- с любым т и количеством элементов равным у’(т). В этом Хорошо бы, конечно, £1, ,..., перечисляли элементы (4.1) в том же порядке, но об этом мечтать не приходится. Однако простые способы их нахождения неизвестны.
4.1. Суть проблематики 97 случае определение примитивного корня приобретает более об- щую форму по сравнению с п. 4.1.1. 4.1.2. Определение. Целое ( называется примитивным корнем по модулю тп, если т ^р(т) т 1 1 npU k < (р(т). Тут загадочных обстоятельств больше. Группы Z4X = {1, 3}, Z6X ={1,5}, Z9X = {1,2, 4, 5, 7, 8} цикличны. Легко проверяется: Z4 = {3), Z£ = {5), Z9 = (2) = {5). Однако Zg = {1,3, 5, 7} — не циклична, а значит, примитивных корней не имеет. Вот начало списка наименьших первообразных корней по модулю т: т <р(т) 2 1 3 2 4 3 5 2 6 5 7 3 8 9 2 10 3 И 2 ' 12 13 2 14 3 Таким образом, в случае составного модуля примитивные ..элементы существовать не обязаны, но «временами» существуют. Когда, сколько штук — так сразу не ясно. Забегая вперед, стоит отметить, что примитивные корни существуют только для моду- лей т вида • т = 2, 4, ра, 2ра, где р > 2 — простое число. Само собой, вокруг помянутого вращается масса близких по природе вопросов. Среди них — знаменитая гипотеза Артина о первообразности любого целого а ± 1, не являющегося точ- ным квадратом, по отношению к некоторому простому модулю ’. Более того, количество таких модулей р для каждого а пред- полагается бесконечным, с указанием асимптотики, о которой нет особого смысла говорить, пока гипотеза не доказана хотя бы в своем простейшем виде. А насчет бесконечности подходящих р, то это не ясно даже для а = 2. Число 2 является примитивным корнем для р = 3, 5, 11, 13, 19, 29, 37, 53, 59, 61, 67, 83, ... Бесконечна ли эта последовательность — никто не знает. 4,1 Легко убедиться, что квадраты а = Ъ2 вообще не годятся.
98 Глава 4. Первообразные корни 4.2. Структура мультипликативной группы Еще раз напомним, что индекс т в свидетельствует лишь о модуле, породившем мультипликативную группу. Число эле- ментов (порядок группы) равно <р(т). В случае простого т — <р(т) = т - 1. 4.2.1. Теорема. В случае простого р в группе существуют примитивные корни, число которых равно <р(р — 1). ◄ Пусть d делит р- 1, и Ф(4) обозначает количество элементов Z* порядка d. Число решений сравнения xd = 1 равно d (теорема 3.5.3). Поэтому Е ф<5) = s|d откуда по формуле обращения Мёбиуса (2.33) s|d где правая часть равна p(d) — см. (2.36). В частности, Ф(р - 1) = р(р - 1). к Дабы короткое доказательство не ввело в заблуждение, ак- центируем неординарность теоремы 4.2.1. Результат был анонси- рован Эйлером, долгое время пребывал во взвешенном состоянии, строгое доказательство в нескольких вариантах дал Гаусс. Имена участников и растянутость процесса во времени в определенной мере свидетельствуют о глубине залегания факта, который и далее привлекал заметное внимание, исторически накопив несколько десятков доказательств. Данное выше простое обоснование до не- которой степени обманчиво, потому что значительную тяжесть берет на себя формула обращения Мёбиуса (2.33), каковая, хотя и технический инструмент, справляется с большими объемами неудобных рассуждений 5\ 5,1 О чем можно судить по неторопливому и довольно прозрачному доказательству в [9].
4.3. Составные модули 99 Приведем иллюстрацию. Поведение элементов х группы Z^ при их после- довательном возведении в степень к = 1,..., 10 выглядит следующим образом 6\ к 1 2 3 4 5 6 7 8 9 10 Is 1 2* 2 4 8 5 10 9 7 3 6 1 Зк 3 9 5 4 1 4к 4 5 9 3 1 5к 5 3 4 9 1 6к 6 3 7 9 10 5 8 4 2 1 1к 7 .5 2 3 10 4 6 9 8 1 8/; 8 9 6 4 10 3 2 5 7 1 2^ 9 4 3 5 1 10s 10 1 Примитивные элементы — их четыре — в рамке. Остальное: Ф(1) = р(1) = 1, ф(2) = <р(2) = 1, ф(5) = р(5) = 4, Ф(10) = р(10) = 4. На примере абелевых групп Zp бывает полезно обдумать общегрупповые понятия [5, т. 8]. Конечно, к теореме Лагранжа (порядок всякой подгруппы делит порядок группы) это мало что добавит, но вот некоторые пружины силовских теорем обнажаются. 4.3. Составные модули Дальнейшее продвижение в области примитивных корней особого смысла не имеет, если на теории чисел свет клином не сходится. Если сходится или заняться нечем сиюминутно — тогда, конечно, другое дело. Однако по большому счету теоремы 4.2.1 вместе с проникновением в ее суть — хватает за глаза. Последующее совсем просто, но местами все же поучительно. 4.3.1. Из примитивного корня ( по простому модулю р > 2 легко сделать примитивный корень £ по модулю ра при любом а > 1. Для этого достаточно в классе вычетов (£)р выбрать любой элемент 6> fell, <- ' Как только х = 1 — строка в таблице дальше не заполняется, ибо все повторяется периодически. Длина заполненной строки равна порядку соответствующего элемента.
100 Глава 4. Первообразные, корни £ — (+зр так, чтобы 1 — 1, безусловно делящееся на р, не делилось на р2, т. е. чтобы к в {Р-1 -\=кр не делилось на р. Опорные пункты обоснования [1,7]: .4.3.2. Для простого р и любого n Е N а — b(modpn) => ар — &p(modp"+1)7\ рп ◄ Сравнение а -—Ъ означает а = Ъ + срп. Поэтому р а? = 6* + СрЬк (с/)* , Й=1 где У2 • • •, очевидно, делится на ря+1. ► 8' 4.3.3. Для простого р > 2 и любых (1 + кр)р = 1 + ftp"”1 (mod р") 9 10\ (4.3) 4.3.4. В случае простого р > 2 и НОД (к,р) = 1 порядок числа [ +кр по модулю рп равен рп~г. ◄ Заменяя в (4.3) п на п + 1, имеем (1 + kp)p = 1 + £p”(modp”+l), откуда (1 + кр)р = l(modpn). Поэтому порядок числа (1 + кр) делит рп~'. Но йз (4.3) следует (1 + кр)р £ l(modpn~2). ► 4 Теперь обоснование п. 4.3.1 элементарно. Достаточно убедиться в спра- 10) ведливости ' — 1 (modp") => р(рп) = рп~'(р ~ 1) I т, где (, — указанный в п. 4.3.1 примитивный корень (пока по модулю р). т) В данном случае стандартное обозначение нагляднее. 8-’ Делимость биномиальных коэффициентов С* на р — простой факт, но он часто используется. Доказывается по индукции с опорой на п. 4.3.2. 10) Напомним, а | Ь означает: а делит Ь.
4.3. Составные модули 101 В силу 1 = 1 + кр, согласно п. 4.3.4 порядок элемента 1 + кр (по моду- лю рп) равен рп~'. Поэтому, если (1 + кр)т = 1 (modp"), то m делится на , т. е. m = рп~' I. Тогда Г = (£Р"”)' = е (mod/), и в силу С = 1 (mod/), будет также = 1 (modp). А поскольку £ — примитивный корень в том числе по модулю р, то (р — 1) 11. Таким образом, /~’(р — 1) | т. ► 4.3.5. Если примитивный корень по модулю pa (а 1, простое р > 2), — нечетное из чисел £ и £ + ра является примитивным корнем по модулю 2ра. ◄ Из двух корней £ и £ +/ — один, ясно, нечетен. С другой стороны, всякое нечетное х, удовлетворяющее одному из сравнений х'1 = 1 (mod/), х'1 — 1 (mod 2/), удовлетворяет и другому. Кроме того, в силу р(р“) = р(2р“), всякое нечетное х, являющееся примитивным корнем по одному из модулей, является примитивным корнем и по другому. ► Что касается простого р = 2 — двойку в арифметике часто приходится рассматривать отдельно, то примитивные корни оче- видны в случае р = 2 и р = 22. Этим, собственно, благоприятные варианты р = 2“ исчерпываются. 4.3.6. Примитивные корни по модулям р = 2а при а 3 не суще- ствуют. ◄ Сначала устанавливается 52М = 1 + 2й-1 (mod 2*), к > 3, из чего выводится, что порядок числа 5 по модулю 2к равен 2к~2. Затем устанавливается, что {±5(: 0 t < 2к~2} является мультипликативной группой по модулю 2*. Подробности в [1, 7]. ►
102 Глава 4. Первообразные корни 4.3,7. Примитивные корни по модулю п существуют в томм слу- чае, когда п = 2,4, ра, 2ра, простое р > 2. (4.4) ◄ Если исключены варианты (4.4) и n = 2/;, k 3, — остается пред- положить п = ab, где а, Ь взаимно просты и каждое больше 2. Но тогда оба значения ip(a) и ip(b) четные, что влечет за собой наличие в обеих группах Z* и Zj элементов порядка 2. Но тогда группа К = Z* х Z* не может быть циклической ► 4.4. Круговые поля В данном контексте интересно обратиться также к круговым по- лям и многочленам [5, т. 8]. Легко видеть, что числа С = cos — -H'sin —, (4.5) ТЬ ТЬ делящие единичную окружность в С на п равных частей, являются циклической группой^ относительно умножения с образующей £. Число (, как и все его степени 2кк . 2&Птг ( = cos------Н sin------, п п удовлетворяет уравнению хп - 1 = 0. Поэтому хп - 1 = (ж - 1)(ж - С)... (ж - С"-1), откуда ясно, что расширение Q(£), называемое круговым полем корней степени п из единицы, является полем разложения для многочлена ж" — 1. Поскольку циклическая группа «имеет право» содержать не более одного элемента порядка 2. 12) Изоморфной аддитивной группе кольца Zn. Умножению в группе (4.5) отвечает сложение в Z^-.
4.4. Круговые поля 103 Число ( представляет собой один из примитивных корней Ег, каковые определяются условиями е" = 1, но при к <п. При этом ряд 1, Ej, £j,(при любом j) исчерпывает все корни (4.5). Поэтому циклическая группа всех корней порождается любым примитивным корнем Ej. Разумеется, если п простое, все корни (k примитивные. Но в случае составного п ситуация не такая простая. Даже подсчет числа примитивных корней требует определенных усилий — это число оказывается равным значению функции Эйлера <р(п). При изучении расширения Q(() важную роль играют круговые многочлены Фп(ж) = (ж-£[)... (ж-£г), Г = у>(п), (4.6) корнями которых служат исключительно примитивные корни из единицы13^. Эквивалент (4.6) п-1 М*) = п (!-<*) (М к=1 Д,п)=1 вскрывает внутренние пружины. Опираясь на (4.7), легко устано- вить формулу14) хп - 1 = П.^(ж), (4-8) d\n дающую индуктивное правило вычисления круговых многочле- нов. Например, в силу (4.8) . . Ж6 - 1 2 Фб(ж) = -----7П-----ТТЛ---:---7V = X - ж + 1. ' (ж - 1)(ж-I-1)(ж2-I-ж-I-1) 13,1 Многочлены Фп(ж) неприводимы над Q. !4' Произведение в (4.8) идет по всем делителям d числа га.
104 Глава 4. Первообразные корни В случае простого п Фп(х) = хп~' + ... + ®+ 1. В общем случае для вычисления Фп(ж) приходится вникать в теоретико-число- вую. специфику. Начало ряда выглядит так: Ф](ж) = х - 1, Ф2(я:) = я: + 1, Ф3(я:) = х2 + х + 1, ФДж) = х2 + 1, Ф6(ж) = х2 - х + 1, Ф8(я:) = ж4 + 1, Фю(ж) = ®4 - X1 +х2 - х + 1. Коэффициенты всех Фп(ж) целочисленны, хотя это не сразу очевидно, но не обязательно равны ±1, как может показаться по началу ряда.
Глава 5 Алгоритмическая неразрешимость Проблемы алгоритмической неразрешимости по- дробно рассматривалась в [5, т. 6]. Для теории чисел важно, чтобы эта тематика бьиа расположена поблизо- сти, как голова для туловища. Налет астральной пустоты И звездной пыли — Теперь мираж. И все мечты Прошли навылет. 5.1. Алгоритмы и вычислимость С помощью трех десятков букв алфавита пишутся литературные шедевры. Комбинациями небольшого количества аксиом и пра- вил исчерпываются математические теории, в том числе контину- альные. Все это в принципе кодируется и переводится в числа. Вселенная в результате оборачивается игрой цифр, что возлагает на арифметику роль науки всех наук. И хотя, как говорил Прокл, «все во всем», менее общее положение «все в арифметике» удоб- нее для осмысления. Выигрыш партии, доказательство теоремы, детективное рас- следование, стихосложение — все это после разработки схемы достижения результата предстает в виде алгоритма, который мо- жет быть описан на любом универсальном языке программирования ’’ Кодирование есть установление соответствия групп символов одного алфавита с груп- пами символов другого алфавита.
106 Глава 5. Алгоритмическая неразрешимость и реализован в виде компьютерного счета2\ На вход алгоритма подается описание задачи и способа ее. решения, что после ко- дирования оказывается некоторым числом п, а после реализации алгоритма получается результат f(ri), опять-таки числовой, кото- рый при желании переводится на другой язык. Вот так корабль алгоритмических вычислений заплывает в гавань арифметиче- ских премудростей, и тут выясняется неотличимость вычислимых функций от алгоритмов. 5.1.1. Определение. Целочисленную функцию f(n) целочисленного 3) аргумента ’ называют вычислимой, если существует алгоритм, вычисляющий значения f(ri), но не обязательно приводящий к ре- зультату. Вычислимая функция, таким образом, не обязана быть вычислимой в обычном понимании. (!) Алгоритм, ее вычисляющий, на некоторых, а то и на всех п может зависать, не давая ответа. Итак, вычислимая функция — это по сути алгоритм на неко- тором языке в некотором алфавите А, Р = а\0.2 ... aN, все a,j £ А, (5.1) при условии что входные и выходные данные кодируются чис- лами. Запись программы вычислений в виде (5.1) позволяет все вычислимые функции перенумеровать, (5.2) Сначала перечисляются все программы из одной буквы, потом из двух, потом из трех и т. д. Нумеруются, таким образом, не функции, а программы, и воз- никает естественная мысль изгнать функции из лексикона, оста- вив алгоритмы. Но принято говорить о функциях, иначе потеря- 2) ' На микроуровневом срезе ясно, что машина всего лишь выполняет четыре арифме- тические операции и простейшие логические. Остальное — это уже системные эффекты. ^Аргумент /(п) может быть векторным, n = {ni,..., п*,}. Функцию /(ni,...,Пд.) в этом случае называют k-местной. Включение запятых в алфавит с последующей переко- дировкой цифрами — позволяет все функции считать одноместными.
5.2. Перечислимость и разрешимость 107 ется возможность в простых ситуациях типа f(ri) = п2 обходиться без упоминания конкретных программ. Поэтому о вычислимой функции говорят как о функции в обычном понимании, но за кад- ром подразумевается наличие алгоритма (правила вычислений). В простых ситуациях это не приводит к недоразумениям. Далее можно иметь в виду следующее уточнение определе- ния 5.1.1: вычислимая функция — это множество эквивалентных алгоритмов, дающих на любом входе п один и тот же результат — определенный или неопределенный. В нумерации (5.2) каждая функ- ция имеет бесконечное число своих представителей (номеров). Напомним также, что определение алгоритма допускает лю- бые программы, в том числе синтаксически неправильные либо зацикливающиеся на всех или некоторых входах. Поэтому сре- ди вычислимых функций обязательно есть — неопределенные на всех или каких-то аргументах. Программы (процедуры), даю- щие ответ f(n) на любом входе п, называют эффективными'*. 5.2. Перечислимость и разрешимость Множество считается перечислимым, если существует эффектив- ная процедура порождения его элементов, и — разрешимым, если существует эффективная процедура для выяснения принадлежно- сти любого п этому множеству. Говорят также, что разрешимое множество распознаваемо. Данные определения легко укладываются в голове, но ими не очень удобно пользоваться. Вот более действенные инструменты. 5.2.1. Определение. Множество X перечислимо, если оно является областью значений либо областью определения вычислимой функции. В таком ракурсе все становится на свои места, но появляются трудности при необходимости гуманитарно судить о вычислимости некоторых аномальных функций. Что касается совпадения результатов работы разных алгоритмов — в общем случае это неразрешимая проблема [5, т. 6]. Эффективно вычислимые функции f(n), вычислимые при любом п, в теории рекур- сивных функций называют общерекурсивными.
108 Глава 5. Алгоритмическая неразрешимость Дефиниция 5.2.1 не сразу увязывается с предыдущим. Если X — область значений f(n), то как порождать его элементы? Процедура «зависнет» на пер- вом же п, при котором значение f(n) не определено. Для параллельного вычис- ления f(n) сразу при всех п требуется (вроде бы) бесконечное число компьюте- ров, что не очень согласуется с представлением о возможной реализации алго- ритма. Но задача все же легко решается с помощью одного компьютера [5, т. 6]. 5.2.2. Определение. Множество X разрешимо, если его характе- ристическая функция, если X G X: в противном случае, вычислима. • Множества квадратов п2; простых чисел; квадратных уравнений с це- лыми коэффициентами, не имеющих действительных корней, — перечислимы и разрешимы. Множество стозначных чисел, встречающихся в десятичной за- писи тг, — перечислимо, но не ясно, разрешимо ли. 5.2.3. Теорема Поста. Для разрешимости X необходимо и доста- точно, чтобы X и его дополнение X были перечислимы. •М Необходимость. Если программа Р определяет, принадлежит п мно- жеству X или нет, то ее последовательная работа на п = 1, 2, ... разбивает натуральный ряд на два списка X и X. Достаточность. Если Р перечисляет X, a Q —- X, то попеременная работа программ Р и Q рано или поздно любое п внесет в один из списков X или X, что Дает разрешающий алгоритм. ► Принципиальную роль в теории алгоритмов играет следую- щий достаточно простой и в то же время выдающийся результат. 5.2.4. Теорема. Существует перечислимое, но неразрешимое мно- жество положительных целых чисел. Ч Пусть Si,S2, —- эффективное перечисление всех перечислимых множеств6). Заметим, если бы все Sn были разрешимы, то и все дополнения Sn входили бы в перечисление S|, S2,... (теорема 5.2.3). Существование перечисления перечислимых множеств следует из наличия перечис- ления (5.2) вычислимых функций, области значений которых и являются множествами St,S2,....
5.3. Диофантов язык 109 Образуем множество D из тех номеров п, которые принадлежат Sn. Таким образом, neDOS, О n£DUSn, откуда следует невозможность 7> D П Sn = 0 и в то же время D U Sn = N. Это означает, что D не совпадает ни с одним Sn, т. е. неперечислимо, а значит (теорема 5.2.3) и неразрешимо. ► Теорема 5.2.4 — краеугольный результат, от которого не так далеко до знаменитой теоремы Гёделя о неразрешимости ариф- метики (п. 5.5.1), и вообще до любых фактов алгоритмической неразрешимости, светящихся единой загадкой. 5.2.5. Теорема. Множество эффективно вычислимых функций не- перечислимо (эффективно не нумеруется'). Допустим, существует такая нумерация /п. Тогда функция ’ 9{п) = fn(n) + 1 заведомо эффективно вычислима, но не присутствует в списке {/„}• ► 5.3. Диофантов язык Машины Тьюринга, рекурсивные функции, нормальные алгоритмы Маркова, системы Поста — все это разные языки, или музы- кальные инструменты, на которых теория алгоритмов звучит по-разному, но сути своей не меняет. Один из таких языков (диофантов) появился относительно не- давно (в связи с решением 10-й проблемы Гильберта [5, т. 6]) и многое перевернул — в лучшую сторону. Диофантова проблематика, подроб- но изложенная в [5, т. 6] и поставленная Тьюринг (1912-1954) 7) Непустота D при любой организации перечисления {5П} следует хотя бы из того, что {5g = N} при каком-то q.
110 Глава 5. Алгоритмическая неразрешимость здесь с педагогическим умыслом впереди паровоза (раздел 1.2), нуждается в некотором расширении обзора. Диофантовы уравнения (1.1), т. е. p(zx,... ,zn) — 0, где р(-) — полином с целыми коэффициентами, обычно переписываются в виде р(а, х) = 0, т. е. р(а,х1,...,хпг) = 0. (5.3) где а = {я|,..., , вообще говоря, векторный параметр, причем все <ц,х, SN = {1,2,...}. Определение 1.2.1: «Множество А положительных векторов диофантово^, если при любом а 6 А и только при a t А уравнение (5.3) разрешимо в целых по- ложительных Xi,..., хт» — устанавливает, казалось бы, жесткие ограничения, и кажется маловероятным, что диофантовыми будут сколько-нибудь нетриви- альные множества. Однако теорема Матиясевича 1.2.3: «Диофантовость множе- ства равносильна перечислимости» — произвела фурор в рядах ма- тематической общественности, уравняв в правах диофантов язык с машиной Тьюринга, и существенно обогатив тем самым ассор- тимент инструментов для изучения проблем неразрешимости 8 9 10\ Собственно, диофантовым языком, позволяющим описывать перечислимые множества, является арифметический язык Lo = {+, х, =, Э }, допускающий Для конструирования высказываний четыре операции: сложение +, умножение х, равенство = и декларацию существования 3 . Язык Lo на вид совсем бедный, тем не менее: «Множество является диофантовым в томм случае, когда оно описывается на языке Lo» (теорема 1.2.5) !0). Тут надо добавить, что средства языка Lo могут значительно пополняться в рамках эквивалентности (п. 5.4.1), что значительно облегчает решение конкретных вопросов. 8) Функция f(x) диофантова, если диофантов ее график <? = {□?!,--- , Хп, у = f(XX, .... Ж„)}. Таким образом, диофантовы уравнения оказались еще одним средством изучения вычислимости. В каком-то смысле — эквивалентным, в каком-то — более эффективным, в каком-то — менее. При опоре на машины Тьюринга процесс вычислений — «не дан в ощущениях». Здесь же инструментом служит полином, который можно «потрогать». 10) Язык До позволяет записать любой полином р(а, х) и делать высказывания 3 х : р(а, х) = 0, откуда ясно, что диофантовы множества — это как раз те множества, которые могут быть выражены в Ln .
5.3. Диофантов язык 111 Особого внимания заслуживает лемма 1.2.2: «Множество А С N диофан- тово в томм случае, когда оно является множеством положительных значений некоторого полинома P(xit... ,xk)». Это простой и в то же время неожиданный результат. Доказательство элементарно. •М Действительно, если А — множество положительных значений поли- нома P(xt,..., х^), то уравнение р(а, xj,... ,хк) = а-Р(ж],..., хк) = О определяет А как — диофантово. Обратно. Пусть А — множество тех а, при которых Q(a, ®i,..., ж() = О разрешимо. Тогда А — множество положительных значений полинома а[1 -<Э2(а, xt,...,xi)]. ► Таким образом (лемма 1.2.2 плюс теорема Матиясевича)'. каждому полино- му Р(ж) отвечает перечислимое множес- тво его положительных значений ' У = Р(х). Поэтому теорема 5.2.4 о существовании перечислимого, но неразрешимого мно- жества, — означает существование такого полинома Р(ж), что при некотором у о по- ложительная неразрешимость уравнения Матиясевич (р. 1947) Q(xi, ...,хк) = Pfa ,...,хк)-уо = О алгоритмически непроверяема. Результат заслуживает особого вы- деления. 5.3.1. Теорема. Существует полином Q(x), не имеющий корней в N, но факт V х Е N : Q(x) 0 алгоритмически непроверяем. Обратим внимание, что: 5.3.2. Множество Т полиномов, не имеющих положительных кор- ней, — неперечислимо, тем более, неразрешимо.
112 Глава 5. Алгоритмическая неразрешимость •М В предположении противного и при учете перечислимости полиномов, имеющих корни 1 множество О’ оказалось бы разрешимо, что гарантировало бы существование распознающего алгоритма, вразрез с отрицательным решением десятой проблемы Гильберта. ► Определенный интерес представляет вопрос о том, насколько сложны полиномы, описывающие диофантовы множества. Ответ в определенной степени удивителен. Для любого диофантова множества А можно указать полином степени п 4 (возможно, с большим числом переменных т) либо т 9 (но, может быть, большим п). Чисел п и т порядка двух-трех десятков, как правило, достаточно для самых сложных случаев. Такого порядка пит достаточно и для записи универсального полинома, генерирующего любое диофантово множество по его номеру. Если Si, S^,... — эффективное перечисление всех перечис- лимых множеств, то универсальный полином U(n, s, х\,..., ж&) перечисляет все Sn, s Е Sn О 3 (ж1;..., xk) : U(n, s, ..., хк) = О, причем U(n, з, х) строится конструктивно. В эквивалентном варианте: существует полином U(n,X\,.. ,,хк), множество положительных значений которого при фиксированном п совпадает с Sn, s Е Sn О 3 (жь ..., xk): s = U(n;xi,..., хк) Л з > 0. При этом имеет место удивительный факт. 5.3.3. Каков бы ни был полином P(z\,..., Zy) (любой размерности), существует полином U(xi,...,xk) фиксированной размерности к, множество положительных значений которого в точности совпадает с множеством положительных значений полинома P(z\,..., z^). Их перечисление обеспечивает обыкновенный перебор.
5.4. Примитивная арифметика 113 5.4. Примитивная арифметика Примитивной арифметикой NZq называют тандем диофантова языка Lo = {+, х, =, Э } и натурального ряда, не считая буквен- ного алфавита. Отрицание, импликация, квантор общности, — исключены. И, главное, исключена математическая индукция — острие арифметики Пеано. В NZq ничего нельзя доказать, можно только проверить разрешимость полиномиального уравнения (пе- ребором). Иначе говоря, все верные утверждения В х : Р(ж) = О, и только они, в NZo доказываются. Возможности языка Lo не так бедны, как поначалу кажется. Вот примеры множеств, описываемых в La. • Множество А пар {а,,а2}, у которых а2 делится на а, («а, делит а2», пишут «а] | а2»), А <=> Зж:а|ж = а2 <=> р(а, ж) = а,ж — а2 = 0. • Множество А упорядоченных пар {а1 < а2}, А <=> Э ж : а( + ж = а2 <=> р(а, х) = х + а\ — а2 — Q. В случае А = {(а,, а2) : а, а2) условие 3 ж : а, + ж = а2 меняется на 3 ж : а, + ж = а2 + 1. • «Множество нечетных чисел» <=> 3 ж : а = 2ж — 1. • «Множество а 2"» О 3 ж,, ж2 : а = ж,(2ж2 + 1). Внимательное рассмотрение примеров создает впечатление о достаточной эффективности подобной техники. Но ее возможности, конечно, ограничены. Если, например, составные числа легко описать параметрическим уравнением а — (х[ + 1)(ж2 +1), то простые числа а € П уже не ясно, как описать. Разумеется, это легко сделать на каком-нибудь более мощном языке. Например, a g П, если и только если (а > 1) ЛУ(ж|,ж2 а) : {а / (Ж] + 1)(ж2 + 1)}, (5.4) но здесь набор инструментов несколько шире, чем в Ъй. Правда, из рассмотренных выше примеров ясно, что в ассортимент La можно включить знаки «больше» и «меньше», что повышает удобства Ьй, но в принципе — сводится к использованию стандартного набора {+, х, =, 3 }.
114 Глава 5. Алгоритмическая неразрешимость Это общая идея. Все, что выражается с помощью {+, х,=, 3 }, можно включать в Lo. Из тех же примеров ясно, что {+, х,=, 3} безболезненно дополняется операцией (свойством) «делимости» («а | &»). Легко видеть, что в Lo можно включить также конъюнкцию и дизъюнкцию (без расширения принципиальных возможностей языка). Действительно, если полиномиальные уравнения Рх = 0 и Р2 = 0 выражают некие свойства в Lo, то (Р, = 0) А (Р2 = 0) Р,2 + Р22 = 0, (Р, = 0) V (Р2 = 0) Р1Р2 = 0. Знаки V, А, в свою очередь, позволяют с удобствами выражать дополнительные возможности. Например, a =£ b <=> (а > &) V (а < 6). Перечисленного достаточно для эквивалентности Lo языку L' = {+, х,=, >, >, |, V, А, 3 }. Но этого все же недостаточно для (5.4), где используется ограниченный квантор общности l2) V <;. Другое дело, что V <; может оказаться — и оказывается (!) — выразимым в языке L1. Еще один вариант записи множества простых чисел: ае .П О (а > 1) А (НОД {а, (а — 1)!} = 1), но здесь другая «неприятность», НОД и факториал. Можно ли выразить эти функции с помощью Ео, — сразу не очевидно. Еще Гёдель доказал, что в языке • Lg = {+, х, =, Л, 3, выразимы любые частично рекурсивные функции. Матиясевич установил более тонкий результат. 5.4.1. Теорема. Языки Lq и Lq эквивалентны. Теорема 5.4.1, решающая заодно десятую проблему Гильберта |3\ показывает, что средства описания вычислимых функций и перечислимых множеств могут i2) Работающий так: V ^пх означает «для всех х гС п». !3* Отрицательное решение десятой проблемы Гильберта дает простой перевод на другой язык факта существования перечислимого, но неразрешимого множества. Последнее означает существование такого полинома Р(хх,..., х^), что разрешимость уравнения Р(хх,..., хё) - у = 0 по Xi,...,Xk при любом положительном у — алгоритмически непроверяема.
5.5. Феномен недоказуемости 115 быть ужаты до чисто арифметического языка Lo, выделяющегося на общем фоне экономностью и фундаментальностью, каковые важны при доказательстве общих теорем. Разнообразие инструментов — существенно в другой ситуации, когда нужно построить конкретную функцию, написать конкретную программу. К заведомо негодным средствам расширения Lq относятся: неограниченный квантор общности V и логическое «не» -ц по- дозрение о непригодности которых возникают естественно. Если проверку истинного высказывания 3 х : Р(х) = 0 алгоритмически реализует обыкновенный поиск, то проверить истинное {->3 х : Р(х) = 0 равносильно V х : Р(х) 0} в общем случае непонятно как. Перевести аромат подозрения в обоснованный запрет не так просто. Спасает «тяжелая артиллерия» — существование неразрешимого уравнения P(sl,...,sft)-y = 0, (5.5) точнее говоря, неперечислимость множества Y тех у, при которых уравнение (5.5) не имеет решения. Но У G Y О Vs: P(s) £ у, либо yeY & -,3s:P(s)=y, и получается, что V и могут выводить за пределы перечислимых (диофанто- вых) множеств. 5.5. Феномен недоказуемости Общий взгляд на проблему доказательства как на поиск цепочки аксиом, ведущей от предположений к выводу теоремы, — сводит задачу к вычислению, но оставляет за кадром принципиальный момент. Существование недоказуемых теорем, как известно, явля- ется следствием существования перечислимых, но неразрешимых множеств. Но как быть, с примитивной арифметикой, где есть только Lq и N, и все доказывается? Точнее говоря, доказываются все верные утверждения 3 ж : Р(ж) = 0, и только они. Других пра- вильных теорем нет — не хватает средств для их формулировки.
116 Глава 5. Алгоритмическая неразрешимость Поэтому примитивная арифметика разрешима. Однако как только Lq дополняется квантором общности V, появляются не- доказуемые теоремы вида Уж :Р(ж) /О, (5-6) к которым никакие «цепочки» не ведут, потому что — откуда танцевать? Нет отправных точек, где бы хоть что-нибудь было ясно «для всех ж». Тогда можно извлечь на свет аксиоматику Пеано с ее математической индукцией, и многие истины (5.6) становятся доказуемыми. Но не все. В стремлении расширить «доказуемое поле» аксиоматику Пе- ано можно дополнить утверждениями типа Уж:Р1(ж)/0,...,Уж:Ру(ж)^0, (5.7) где Pj — конкретные полиномы, и любыми другими аксиомами, что все равно не меняет ситуацию радикально. Недоказуемые истины вида (5.6) остаются 14\ Говорить о недоказуемых истинах во- обще-то не с руки, ибо кто гарантирует истинность? Поэтому Гёдель свой знамени- тый результат формулировал, избегая об- ращения к понятию истины, доступному, на первый взгляд, лишь Всевидящему Оку. 5.5.1. Какова бы ни была совокупность ак- сиом в арифметике, если она непротиворечи- ва, существует такое утверждение А, что ни А, ни его отрицание (^А) — не доказуемы. Гёдель (1906-1978) Под юрисдикцией «закона исключения третьего» это означает: то ли А, то ли -А — истинно, но недоказуемо. !4) Вообще говоря, имея дело с аксиомами типа (5.7), можно стать на синтаксическую точку зрения, считая V просто буквой. Но после кодирования теория все равно отобра- жается в арифметику номеров с возвращением к машинам Тьюринга либо диофантовым инструментам, не допускающим использования неограниченных кванторов общности.
5.5. Феномен недоказуемости 117 В диофантовой кухне возможен более конкретный трюк: V х : Q(x) / О недоказуемо, но истинно, — поскольку из двух противоположных утверждений В х : Q(x) = 0, V х : Q(x) 0, первое, если верно, то проверяемо, хотя бы перебором. Поэто- му вопрос упирается лишь в существование подходящего поли- нома Q(x), что гарантирует теорема 5.3.1. 5.5.2. Теорема. Какова бы ни была непротиворечивая теория, со- держащая арифметику, существует не имеющий положительных корней полином Q(x\,... ,х^), отсутствие у которого целых по- ложительных корней недоказуемо. •М Это, собственно, является переформулировкой теоремы 5.3.1, доказан- ной выше «в две строчки» 15\ ► Теорема 5.5.2 представляет собой по существу обобщение классической теоремы Гёделя. По-соседству с п. 5.5.2 целесооб- разно поставить следующий результат, обеспечивающий акцент на «независимости от аксиоматики». 5.5.3. Теорема. Существует полином Q(x\,... ,Хк), такой что высказывание «У х : Q(x) 7^ 0» истинно, но недоказуемо ни в ка- кой непротиворечивой системе аксиом, включающей примитивную арифметику. Была бы подходящая аксиоматика, существовал бы алгоритм, ибо в совокупности всех алгоритмов есть алгоритмы, реализующие поиск при любой мыслимой системе аксиом. Система аксиом еще не оговорена, не придумана, — а в списке алгоритмов уже есть соответствующая программа. Так же как в списке всевозможных текстов есть все еще ненаписанные романы. ► Разумеется, указать полином Q(x) в теоремах 5.5.2 и 5.5.3 принципиально невозможно. Однако подозрительная территория !5) Краткость тут опирается па многостраничное доказательство теоремы Матиясевича [5, т. 6].
118 Глава 5. Алгоритмическая неразрешимость может быть сужена до параметрической неопределенности, Q(xl,...,xk) = 3 п,у: и(п,у,Х1,... ,хк), где U — конкретный универсальный полином. В контексте теоремы 5.5.3 очевиден следующий результат пессимистического характера. 5.5.4. Теорема. Арифметика неаксиоматизируемо, даже при вклю- чении в систему бесконечного., но конструктивно (перечислимо) за- даваемого множества аксиом. 5.6. Непротиворечивость О порочном круге в устройстве Вселенной свидетельствует вторая теорема Гёделя о непротиворечивости 16\- 5.6.1. Теорема. Если теория Т непротиворечива и содержит в себе арифметику, то непротиворечивость Т недоказуема в Т Теория Т называется непротиворечивой, если в Т не могут быть доказаны две противоположные формулы (теоремы): А и «не А». Здесь под теорией достаточно понимать аксиоматику плюс правила вывода, плюс доказуемые формулы. Вот простой гипотетический сценарий организации противо- речивой системы аксиом, которая так же хороша, как и непроти- воречивая. Вместо истинного, но недоказуемого V х > 0 : Q(x) £ О' (5.8) в аксиоматику может быть добавлено противоположное утвержде- ние «3 х > 0 : Q(x) = 0», причем без ущерба для арифметики, не- смотря на ошибочность. Потому что обнаружить неправильность «3 х > 0 : Q(x) = 0» принципиально невозможно 17\ Разумеется, ни о каком конкретном полиноме этого сказать нельзя, но такой Короткое и достаточно прозрачное доказательство имеется в [5, т. 6]. 17) Иначе это было бы обоснованием недоказуемого «V х > 0 : Q(x) Г
5.7. Универсальные нумерации 119 полином существует. Поэтому — можно угадать, но нельзя гаран- тировать, что догадка правильна. Примерно так и происходит формирование системы аксиом. Имея лишь подозрения об истинности утверждений типа (5.8), мы присовокупляем их к стартовой совокупности аксиом, получая «подозрительную» систему, сидя внутри которой, ничего не можем сказать об истинности фундамента. Что касается глубины пропасти, то теорема 5.6.1 не исключает возможно- сти решения проблемы за счет привлечения дополнительных средств, и такого сорта утверждения о непротиворечивости арифметики получены, например, Ген- ценом добавлением к арифметике трансфинитной индукции. Но гарантировать непротиворечивость расширенной аксиоматики опять-таки нельзя в силу той же теоремы 5.6.1. Необходим следующий акт расширения. Путь ведет в «никуда», и в этом смысле проблема непротиворечивости не имеет абсолютного решения. Однако такого сорта «неполноценные» обоснования все-таки проясняют ситу- ацию. Обыкновенная констатация отсутствия гарантий не дает ощущения края и представления о масштабе бедствия. Расширение аксиоматики показывает ту «малость», которая нужна, чтобы концы сошлись с концами. 5.7. Универсальные нумерации Эффективная нумерация вычислимых функций, /1(ж),...,/п(ж),..., (5.9) позволяет считать двуместную функцию СГ(п,ж) =/п(ж) (5.10) универсальной. Таким образом, существует всего одна вычислимая функция (5.10). (!) Смена в универсальной программе U(n, х) входного слова (числа) п обеспечивает трансформацию U(п, х) в любую другую программу /п (ж). Тут, конечно, есть тонкость. На первый взгляд операция поднятия индекса в аргумент является вопросом орфографии. Но в данном случае функция U(n, х) обязана быть вычислима теми же средствами [машиной Тьюринга, например), ко- торые вычисляют сами функции fn(x). Однако простые способы нумерации программ (типа упорядочения по длине) легко реализуются любыми стандарт- ными в теории алгоритмов средствами. Но при этом иногда требуется некоторая изобретательность. При «неудачной» нумерации полиномов Pt,P2,... индекс
120 Глава 5. Алгоритмическая неразрешимость некуда поднимать. Функция Q(n, х) = Рп(х), вообще говоря, не полином — и требуется определенная эквилибристика, чтобы нормализовать ситуацию18). Среди всевозможных нумераций есть «хорошие и плохие». 5.7.1. Определение. Нумерация и функция U(n,x) называют- ся гёделевскими, если существует всюду определенная вычислимая функция з(п), такая что для любой двуместной функции f(n,x) справедливо* 19^ /(п, ж) = £7(s(n), ж). Первый аргумент в U(n,x) является номером программы в перечислении.(5.9), и в этом смысле п — есть сама программа (однозначно восстанавливаемая по номеру). Поэтому универсаль- ную функцию U (п, х) можно трактовать как механизм, позво- ляющий отвлечься от процесса вычислений и сконцентрировать- ся на маркировке. Алгоритмические вычисления превращаются в игру чисел, а использование гёделевских нумераций делает игру относительно комфортной. Например, по номерам двух функ- ций /j, fj сразу определяется номер их композиции fi(fj), минуя хлопоты последовательного соединения машин Тьюринга либо подходящего объединения полиномов. Универсальные функции облегчают в теории алгоритмов мно- гие рассуждения. Часть трюков подобного сорта консолидируются в инструменты широкого назначения. 5.7.2. Теорема Клини о неподвижной точке. Какова бы ни была вычислимая всюду определенная функция фп), найдется п, при котором U(n, ж) = U(q(n), ж) тождественно по х, где U (п, ж) — гёделевская универсальная функция. 18) Это делается переводом какой-нибудь нумерующей функции (Клини, например) на диофантов язык. 19) При фиксированном п функция f(n, х) — есть некоторая одноместная функция flj'x) в перечислении (5.9). Соответствие к номеру п — и есть функция к = s(ri), которая в общем случае «неизвестно какая». В гёделевСком варианте s(ri) обязана быть вычислимой и всюду определенной.
5.7. Универсальные нумерации 121 < Рассмотрим вычислимую всюду определенную функцию w(n) ~ а(п) = U(n, п), что означает /(n, х) = U(u(n), х) = U(w(n), х). Пусть, в предположении противного, q(n) не имеет неподвижной точки, т. е. q(ri) п при любом п. Тогда u(n) ~ w(n) * g(w(n)) при любом п, что влечет за собой u(n) Ф q(w(ri)). Но от и(п) никакая вычислимая функция — в том числе q(w(n)) — не может отличаться всюду, в силз' a(n) — fn(n). Противоречие завершает доказательство. ► В дебрях неразрешимостей обстановка довольно странная. В некотором роде «все неразрешимо». 5.7.3. Теорема Райса. Любое нетривиальное свойство вычислимых функций алгоритмически неразрешимо. •4 Пусть G — непустое подмножество множества вычислимых функций 1F, не совпадающее с F, и А — множество гёделевских номеров функций из G. Если предположить разрешимость А, то всюду определенная функция ( а, если п € А, _ g(n) = < __ (А дополнение А) [ а, если п € А, где а € А, а € А, — не будет иметь неподвижной точки в смысле 5.7.2. ► Требование «нетривиальное™», фигурирующее в теореме, как видно из доказательства, выполняется, если имеются функции как обладающие этим свойством, так и не обладающие. Таким обра- зом, по программе /п(ж) невозможно в общем случае определить, входит или нет функция в ту или иную категорию. Алгоритмиче- ски неразрешимыми оказываются проблемы выяснения: • Периодичности, ограниченности, порядка роста f(,x). • Конечности множества корней у полинома Р(х). » Конечности множества положительных значений Р(х).
Глава 6 Алгебраическая ниша Лишь то, что мы теперь считаем праздным сном, — тоска неясная о чем-то неземном, куда-то смутные стремленья, вражда к тому, что есть, предчувствий робкий свет и жажда жгучая святынь, которых нет, — одно лишь это чуждо тленья. Н. Минский Подложить в жернова арифметических действий что-нибудь вместо N — довольно естественная идея, и она рано или поздно подталкивает к различным экс- периментам. Вплоть до сложения и умножения мно- гочленов, матриц, геометрических фигур, логических конструкций и даже электрических схем. При этом уда- ленные математические территории начинают взаимо- действовать, порождая согласованное симфоническое звучание и грезы освободиться от оков арифметики. Потом, конечно, тянет обратно. 6.1. Уход в абстракцию и возвращение Очертить границы теории чисел невозможно. Абстрагируясь от це- лочисленной специфики, дрейфуешь в никуда, т. е. в алгебру. На- ука очень полезная, но архистерильная. Подсознанию там скучно, требуется содержательное наполнение. Поэтому интереснее по- средине, где общий замах соседствует с частностями, каковые вокруг арифметики имеют в большинстве числовую природу. На вещественной оси колосится такое разнообразие, что иллю- страции есть на любую тему. К тому же, выясняется не только, чем занимается «сосед», но и его «инопланетные» приспособле- ния находят применение далеко за пределами.
6.2. Многочлены 123 Рецепт вычисления сп числовой последовательности Сп.|.2 = 2cn-|-i 2-Сп, Сд - С| — 1, располагается на комплексной плоскости: (1+г)"+ (!-»)” с» =-------------------, " 2 а ряд Фибоначчи 1,1,2,3,5,8,13,21,..., описывается с помощью иррациональных чисел (1.18). Все подобные «штучки» возникают в рамках обычных схем рассуждений. Неизвестное как-то н обозначается, после чего начинается стандартное \\ JJ «колдовство» типа: если к ж прибавить трам-тара- рам, а потом умножить само на себя и вычесть трах- тарарах, должно получиться то-то и то-то. В резуль- (Ly \\ Jl тате петля умозаключения замыкается, а поскольку что-то с чем-то складывается и на что-то умножа- ' ется, получается алгебраическое уравнение, и зада- ча сводится к вычислению корня полинома. Корень получается целый, если задача корректна, но вот его зависимость от коэффи- циентов полинома не обязана быть «из той же оперы». И в этом один из главных козырей востребованности алгебраических колец и полей чисел, концентрирующий внимание на изучении много- членов и их корней. При этом вроде бы не относящи- еся к делу вопросы типа разложения многочленов на простые множители резонируют в самой арифметике, вы- зывая ассоциации и расширяя гори- зонты. Само собой разумеющиеся ве- щи обретают вдруг совсем другое лицо и направляют мысль к новым берегам. 6.2. Многочлены Многочлены, как результат нанизывания сложений и умноже- ний, естественно возникают в самой арифметике. Но их роль;
124 Глава 6. Алгебраическая ниша конечно, гораздо шире. Многочленом, или полиномом, над полем К называется формальное выражение fn(x). Н- 1Ж Н~ • • • Н~ а>[Х + ciq, (6.1) где ао,..., ап £ К. Сумма и произведение многочленов определя- ются по обычным правилам сложения и умножения, что порожда- ет кольцо многочленов К[ж] Переменная х может принадлежать тому же или другому полю, либо даже оставаться просто символом. Обычное деление в столбик многочлена (6.1) на (х — с) дает в частном некоторый многочлен hn-t(x) и некоторое число г в остатке, что равносильно тождеству /п(®)=.(ж-с)/1п-1(я) + г, полагая в котором х = с, получаем теорему Безу. r = fn(c), в соответствии с которой, если ж = с — корень уравнения fn(x) = 0, то г = О, что в конечном итоге приводит к разложению /„(я) = ап(х - xt)(x - х2)... (ж - хп), (6.2) где Х[,...,хп — корни многочлена fn(x), — если fn(x) рассматривается как многочлен над С. В общем случае проблема разрешимости уравнения fn(x) = 0 — и как следствие, приводимости многочлена /п(ж) — имеет другие толкования. Для сопоставления с теорией делимости чисел естественный интерес представляет полиномиальный аналог. Если многочлены /(ж), <р(х), ^(х) связаны соотношением /(ж) = 9?(ж)^(ж), то 9?(ж) и ^(х) считаются' делителями /(ж). Наибольшим общим делителем (НОД) многочленов /(ж) и д(х) называется такой их общий делитель d(x) = (/(ж), д(ж)), который делится на все другие общие делители многочленов /(ж) и д(х). R[s] — кольцо многочленов всех степеней с действительными коэффициентами, Q[s] — с рациональными.
6.2. Многочлены 125 При договоренности о равенстве единице «старших» коэф- фициентов рассматриваемых многочленов — НОД, с точностью до ±, определяется однозначно. В случае d = (/^) = l многочлены /(ж) и д(х) называют взаимно простыми. НОД (/, д) определяется алгоритмом Евклида, который по структуре ничем не отличается от теоретико-числового. 6.2.1. Всегда можно указать такие многочлены и(х), v(x), что2) f(x)u(x) + g(x)v(x) = ф), d = (f, д'), (6.3) m. e. НОД (/, g) «линейно» выражается через fug. В частности, многочлены /(ж) и д(х) взаимно просты в томм случае, когда можно подобрать такие и(х) и v(x), что f(x)u(x) + g(x)v(x) = 1. (6.4) Аналогом простых чисел служат неприводимые многочлены. Полином /п(ж) называют приводимым над К, если он расклады- вается в произведение двух многочленов ненулевой степени. . » Многочлен х" + 1 приводим в С, х2 + 1 = (я - i)(x + г), но неприводим в R. А полином х2 — 2 = (я — \/2)(ж + >/2) приводим в R, но неприводим в Q. vi Jf * В С неприводимы только многочлены первой степени. * f Любой многочлен степени п > 2 приводим в R, поскольку в разложение (6.2) комплексные корни входят сопряженными парами, а (я — а)(х — а) — есть квадратный многочлен с дей- ствительными коэффициентами. Роль «простых чисел» в R[s] играют, таким образом, многочлены первой и второй степени. » Приводимость многочлена, вообще говоря, не связа- на с существованием корней. Многочлен я4 4- 2х2 + 1 = (я2 + 1)' приводим в поле рациональных чисел, но не имеет в Q ни од- ного корня. 4 При этом степени многочленов и(г), д(ж) строго меньше — соответственно — степеней д(х) и /(г), если степени /(г) и д(х) ненулевые. Доказательство есть в [5, т. 8], ио Оно по сути ничем не отличается от доказательства арифметического аналога 2.1.2.
126 Глава 6. Алгебраическая ниша В случае кольца целых чисел Z неприводимость многочленов определяется точно так же, как и в случае поля, но тут не все- гда возможно деление на старший коэффициент, разве что — на наибольший общий делитель НОД (/) всех коэффициентов (Zq? • • • з • 6.2.2. Лемма Гаусса. В Z[x] НОД (jg) = НОД (/) • НОД (д). ◄ Достаточно рассмотреть случай НОД (f) = = НОД (р) = 1. Пусть f(x) = ^al!xk, g(x)=^PPkxk. fg(x)=^ckxk, и НОД (fg) = d > 1 имеет простой делитель р, т. е. все коэффициенты многочлена fg делятся нар, а у f ид — не все. Пусть а, и bj первые по счету коэффициенты, не делящиеся на р. Тогда — dibj 4“ 4“ Я/i^tbj-t ~ dibj 0 О Гаусс (1777-1855). « ‘ ведет к противоречию. ► Многочлен fn(x) с рациональными коэффициентами непри- водим над Q в томм случае, когда над Q неприводим много- член с целыми коэффициентами, полученный умножением fn(x) на НОК знаменателей всех его коэффициентов. 6.2.3. Многочлен /(ж) = апхп + а„_1Жп-1 + .., 4- в1Ж 4- а0 (6.5) с целыми коэффициентами неприводим над Q в томм случае, когда он не раскладывается в произведение двух многочленов ненулевой степени с коэффициентами из Z 3\ 6.2.4. Критерий Эйзенштейна. Многочлен (6.5), все коэффициен- ты которого — кроме ап — делятся на некоторое простое число р, но ао не делится на р2, — неприводим над полем рациональных чисел. Утверждение 6.2.3 следует из леммы 6.2.2 и сводит решение вопроса о приводимо- сти/неприводимости к целочисленной задаче.
6.2. Многочлены 127 -4 Допустим противное, / = ^ = ( 52 ( 52 с'ж9 ’ где ip и il) многочлены ненулевой степени с целыми коэффициентами. Свобод- ный член а0 = ЬаСо делится на р, поэтому на р делится одно из чисел &о. С — пусть, для определенности, &0- Тогда с0 не делится на р, поскольку а0 не делится на р2. Если бы все Ьк делились на р, то ап делилось бы на р. Поэтому хотя бы' одно Ьк не делится на р, и если взять такое Ьк с минимальным номером к > О, то ак = Ькс,. + Ьк_।Ci + ... + bock не делилось бы на р вопреки предположению п. 6.2.4. ► Известно множество других признаков неприводимости, но критерий 6.2.4 наиболее популярен, и его обычно «хватает». Критерию 6.2.4 удовлетворяет, например, многочлен 7ж5 + 8ж4 - 4ж2 ф 6х - 2, для которого подходит число р = 2. 6.2.5. Если не различать многочлены, получающиеся друг из друга умножением на ненулевую константу из поля К, то всякий мно- гочлен f 6 К[ж] единственным образом разлагается в произведение неприводимых множителей. Неприводимый над Z многочлен f(x) может быть приводим как многочлен над полем вычетов при любом простом р. Таким свойством обладает, например, f(x) = ж4 + 1. •4 Рассмотрим три варианта представления /(я): . ж4 + 1 = (х2 ± I)2 - (у2)х2 = (ж2)2 - (-1). Три числа ±2 и — 1 не могут быть все квадратичными невычетами при любом простом р > 2. Поэтому в одном из трех случаев4-1 /(ж) = р2(ж) - а2ж2 = (р(ж) - аж)(р(ж) + аж). В случае р = 2 имеем ж4 + 1 = (ж + I)4. ► 4) Разумеется, квадратичный вычет а зависит от р.
128 Глава 6. Алгебраическая ниша 6.3. Расширения полей Множество Z можно воспринимать как расширение натурального ряда N с целью операцию сложения сделать обратимой, а + х = Ь -» х = Ь- а. Аналогичный трюк с умножением, ах = b —> х — Ь/а, приводит к разрастанию Z до поля Q рациональных чисел, которое далее можно расширить до R или С, и при мозгах «топологического типа» последний вариант представляется самым лучшим, потому что «все действия выполняются и все уравнения решаются». Однако разрешимость всех полиномиальных уравнений в С с точки зрения обширного класса задач — крупный недостаток, ибо мешает в кучу ситуации разной природы. Не было бы С слишком всеядно, по разрешимости уравнений можно было бы судить о разрешимости числовых задач. Поэтому расширять Q желательно с умом, не прыгая сразу в С. Но и не ограничиваясь слишком близорукими реформами, которые наращивают Z либо Q, не достигая ранга поля или хотя бы кольца. Ч Показательным примером здесь служит известный пассаж в связи с доказательством {Эйлер, 1768) последней теоремы Ферма в частном случае п = 3. История подробно описана в [14]. В данном контексте интерес представляет тот срез, который связан с использованием чисел вида а + bV-3, a,b G Z. Эйлеру потребовалась справедливость импликации: если а1 + 362 — куб целого числа, то существуют такие s,t € Z, что a = s3- 9st2, b = 3s2t - 3t3. (6.6) Обоснование для XVIII века было весьма пикантным. В силу а2 + ЗЬ2 = (а + 6\ЛА)(а-6лЛЗ), (6.7) и тривиального для обычной арифметики факта (6-8) Эйлер полагал, что оба сомножителя в (6.7) — тоже кубы. В частности, а + 6лЛЗ = = (s3-9sf2) + (3s2i-3i3)yA3, з • - «если х = yz. и у, z взаимно просты, то у и z — тоже кубы»,
6.3, Расширения полей 129 откуда, мол, вытекает (6.6). ► Далее с помощью несколько громоздких, но идеологически уже простых соображений Эйлер обосновывал невозмож- ность а2 + ЗЬ2 = z3. Слабое звено здесь опора на (6.8). В случае х, y,z 6 Z результат (6.8) гарантируется основной теоремой арифметики о единственности разло- жения на простые множители, но здесь об- стоятельства другие: 4 = (1 + лЛз) (1 - лЛз) = 2-2, причем 2 и (1 ± л/—-3?) неразложимы в множестве {(а, Ь): а + что легко устанавливается. Тем не менее хороший замах не про-' падает даром. Всякая гениальная ошибка после отбеливания обо- рачивается истиной. 3 3 3 Неразрешимость х + у = z в целых числах естественно начинать с разложения левой части на линейные множители х3 + у3 = (х + уЦх + СуЦх + ^у), (6.9) где ( Е С - один из кубических корней из 1, но не сама 1. Например, (6.10) 3 2 добавлением элемента (6.10) дает кольцо Z(() (2s - у) + уу/~3 ---------------, т. е. Расширение Z чисел х + С,у = r + (6.11) С тем чтобы потом воспользоваться в подходящем расширенном кольце множеств аналогом результата (6.8).
130 Глава 6. Алгебраическая ниша где целые р и q имеют одинаковую четность Невозможность всем сомножителям (6.9) быть кубами в Z(() обосновывается несколько утомительно, но рутинным образом. Кольцевой аксиоматики, кстати, для единственности разложения на про- стые множители — недостаточно. Целесообразное ужесточение требований здесь связано с введением нормы. 6.3.1. Определение. Кольцо R без делителей нуля называется евклидовым1^, если’. (i) Для ненулевых а € R определена целочисленная норма N(a) > 0, rV(0) = 0, причем N(ab) max{N(a),N(b)}. (И) Для любых а,Ъ 0 существует представление а = qb у г, в котором либо г = 0, либо N(r) < N(b). В кольце целых чисел Z нормой может служить N(z) = |z|. В кольце Р[ж| в качестве нормы годится степень многочлена. 6.3.2. Любой элемент евклидова кольца единственным образом раскладывается в произведение простых сомножителей. Что касается проблематики расширения полей, то она более- менее подробно рассматривалась в [5, т. 8] с некоторым уклоном в теорию Галуа. Остановимся на стержневых пунктах. Галуа (1811-1832) Поле F по отношению к любому своему под- полю Р называется расширением Р. Наименьшее по включению поле F = Р(5), содержащее подполе Р и множество S, — называется расширением поля Р на S. В случае, когда S состоит из одного элемента 6, о Р(0) говорят как о простом расширении поля Р. Расширения обычно конструиру- ются добавлением корней полиномов. 6.3.3. Корни ненулевых многочленов f(x) € Р[ж] назы- ваются алгебраическими числами над полемР. И только в случае четных р и q «правильные» числа (6.11) переходят в числа Эйлера а + bV—3. 7> Любое евклидово кольцо является кольцом главных идеалов [5, т. 8]. Любое число, алгебраическое над полем Р, алгебраично и над любым расширением F D Р, но не наоборот.
6.4. Алгебраические расширения и числа 131 6.3.4. Минимальным многочленом числа а над Р называют тот из ненулевых многочленов f(x) € Р[ж], /(а) = 0, — который имеет наименьшую степень (степень а над Р)9^ и старший коэффициент 1. Корни минимального многочлена а над Р называют числами, сопряжен- ными с а. Частным случаем этого определения является обычное понятие комплексно сопряженного числа. Простое расширение Q(V2) кольца Q, полученное присоединением чис- ла V2, состоит из чисел вида а + &л/2; а в случае присоединения х/2 — простым расширением Q оказывается кольцо чисел а + bVl + cVi, где а, Ъ, с G Q. Если говорить о расширениях кольца Q, рассматриваемого как поле, то Q(V2) состоит из элементов а + Ьу/2 , ------7=, а, Ь, с, d € Q, c + dx/2 аОЙ — из элементов а + 6-^2 + с-Уа _ -------77=----^-=, а, о, с, в), о,, ci е Q, at + b, V2 + с, V4 однако в том и другом случае избавление от иррациональности в знаменателе позволяет считать, что расширения Q(V2) и Q(^2) поля Q состоят, как и прежде, из элементов а + bV2 и а + Ь\Р1 + с\^4, соответственно. Аналогичная ситуация имеет место и в общем случае, что фиксируется следующим сразу не очевидным результатом. 6.3.5. Теорема. Пусть алгебраический элемент а над Р имеет степень п. То- гда расширение Р(а) является п -мерным линейным пространством с базисом {1, а, а2..., а”1}, т. е. любой элемент в 6 Р(а) единственным образом пред- ставим в виде Р =Ро+Р\а-(-...+Рп-\О‘п^', все р, € Р. (6.12) 6.4. Алгебраические расширения и числа Из общих определений предыдущего раздела выделяются поля, конструируемые на базе Q. Число а Е С называют алгебраическим (без упоминания над каким полем), если оно является корнем Минимальный (неприводимый) многочлен не может иметь кратных корней. Иначе вместе с /(а) = 0 было бы необходимо f(a) = 0, что противоречило бы минимальности /. Минимальные многочлены чисел —3, i равны: х + 3, хп - 2, х2 + 1.
132 Глава 6. Алгебраическая ниша неприводимого многочлена с рациональными коэффициентами. Если старший коэффициент равен 1 (такие многочлены называют унитарными), а все остальные коэффициенты целые числа, то число а называют целым алгебраическим. 6.4.1. Если а и (3 — алгебраические числа, h(x,y) — произвольный многочлен с рациональными коэффициентами, то h(a, JE) — алгеб- раическое число. Отсюда легко выводится, что алгебраические числа образуют поле, а целые алгебраические числа образуют кольцо. Естественно' задаться вопросом о корнях многочлена с коэф- фициентами из поля алгебраических чисел. Не будет ли раскру- чиваться спираль, чего естественно было бы ожидать? Но круг сразу замыкается. 6.4.2. Любой корень унитарного многочлена /(ж) с целыми алгеб- раическими числами в качестве коэффициентов — является целым алгебраическим числом. < Если а — корень полинома /(ж) = хп + 7П_1®"“1 + ... +7о, то а также корень унитарного полинома с целыми алгебраическими коэффициентами: П (ж" + 7п-1ж’,~1 + • • + То) , где тк- обозначает число, сопряженное 7*; и произведение берется по всем сопряженным числам. ► Большинство результатов о расширениях полей достаточ- но просты, в смысле многоходовости, но из-за непривычности обстановки и диковинности понятий вызывают определенные затруднения у непрофессионалов. И тут есть два выхода из по- ложения. Либо вообще избегать, если имеется возможность, либо прокручивать в голове определения и факты до тех пор, пока мозги не перезагрузятся. Напомним некоторые общие положения. О расширении Р(в|,..., ат) с алгебраическими над Р элементами aj — обычно говорят как о конечном расширении поля Р. Точнее, расширение F Э Р конечно, если F — конечномерное линейное пространство над Р.
6.4. Алгебраические расширения и числа 133 Для любого многочлена f(x) € Р[ж] существует расширение F Э Р, над которым f(x) раскладывается в произведение линейных множителей f(x) = ап(х - ®i)(® -- х2)... (х - хю). При этом полем разложения неприводимого многочлена /(ж) считается наи- меньшее расширение поля Р, содержащее все корни fix). Важную роль играет понятие нормального расширения. Расширение F поля Р называется нормальным, если всякий неприводимый над Р многочлен, имеющий корень в F, разлагается над F на линейные множители. Иначе говоря: расширение F Э ₽ нормально, если любое а входит в S со своими сопряженными числами. * Расширение Q(vz2) не нормально, ибо не содержит всех корней мини- мального многочлена ж3 — 2. Нормальным расширением будет Q( у/2, е2^3’). Весьма неожидан следующий феномен. Например, поле Q(V2, V3) обра- зуют числа вида S — а + 6V2 + с\/3 + ch/б, а, Ь, с, d € Q, каковые, в то же время, исчерпываются линейными комбинациями £ = а + [30 -h ув2 + S63, a,^,y,Se<Q, 6 = у/2 + у/з, поскольку \/2=Д((?3-9-0), \/3 = |(11-0-03), х/б = |(02-5-0). Таким образом, Q(V2, Уз) = Q(V2 + Уз), т. е. расширение Q(x/2, Уз) равно- сильно простому расширению Q с помощью одного элемента 6 = х/2 + а/З, — что выглядит исключением, но является общим правилом. 6.4.3. Теорема о примитивном элементе. Любое алгебраическое расширение F поля Р нулевой характеристики может быть порождено одним примитивным элементом 0, т.е. Р == P(ai,..., ат) = Р(0), каковой может быть выбран в виде линейной комбинации О = S|«i + ... т smam, все Sj € Р, и все корни Xi,...,xn любого многочлена /(ж) с коэффициентами из Р, таким образом, рационально выразкаются через «одну иррациональность» 6: х2 = s0} + • 6 + ... + S(„_1W- • 6п~', все skj е Р.
134 Глава 6. Алгебраическая ниша Пункт 6.4.3 требует пояснения насчет нулевой характеристики. Характери- стикой поля F называется минимальное р в равенстве p-l=J+...-H = 0, (6.13) Р раз где 1 — единица поля F. Если (6.13) невозможно, F называют полем характе- ристики нулью\ Конечное поле классов вычетов по модулю р имеет характери- стику р. 6.4.4. Ненулевая характеристика р всегда является простым числом. •< В противном случае p = s- t,s<p,t<p,~в силу р • 1 = 0 было бы либо s • 1 =0, либо 1-1=0, что противоречило бы минимальности р. ► 6.4.5. Если поле F имеет характеристику р, то р • х = 0 для любого х Е F. Поля вычетов могут быть в той или иной степени непохожи на Zm. Допустим, р(х) — простой элемент (неприводимый полином) в кольце полиномов Р[к]. Если f(x) G Р[х] не делится на р(х), то в Р[х] существует полином f~l(x), такой что f(x)f~i'(x) = 1 (modp(a;)), т. е. f(x)f~](x) — 1 делится на р(х). Поэтому отождествление элементов f(x),g(x) € Р[®], разность которых делится на р(х), превращает кольцо Р[ж) в поле вычетов Р[х] (modp(a;)). 6.5. Теория р-адических чисел Одним из интересных расширений поля рациональных чисел является поле р-одических чисел, введенных Гензелем (1897) для изучения полиномиальных сравнений f(Xl,...,xn) Р=0, (6.14) о роли которых уже говорилось в разделе 3.4. Проблематика достаточно специфична, чтобы браться за ее изучение при отсутствии профессионального интереса. Однако здесь имеется выдающийся ингредиент, проливающий свет на фе- номен вещественной прямой, ставший будничным в результате Иными словами, характеристика поля совпадает с порядком единицы аддитивной группы поля, если порядок конечен, и считается равной нулю, если порядок бесконечен. Конечное поле, разумеется, не может иметь характеристику нуль.
6.5. Теория р -адических чисел 135 настойчивой PR-деятельности. И этот ингредиент жалко упускать с точки зрения общего математического образования. Есть два источника [3, 11], в которых р-адические числа рассматриваются со взаимно дополняющих позиций, и здесь по- вторяться было бы неуместно, тем более что контекст требует соблюдения пропорций изложения. Да и внимание стержневым моментам легче уделить в обстоятельствах, позволяющих игнори- ровать детали, благо есть куда отослать за подробностями. Итак, для простого р и ненулевого ж £ Z положим ordp х равным кратности вхождения р в разложение х на простые множители и огс!р 0 = оо для любого р. Для рациональных х = а/Ь а ordp - = ordp а — ord„ Ь. о Далее на множестве Q рациональных чисел введем семейство норм: ||ж||/> = P-Ordpa:, если х 0, (6.15) и ||0||р = 0- Аксиомы нормы проверяются без особого труда. Конечно, норма (6.15) выглядит чересчур надуманно. Ра- ,.а циональное х записывается в форме х = р -, где целые а, b о не делятся на р, и норма |]ж||р полагается равной р~ . Рас- стояние ||ж — у\\р между числами, таким образом, тем меньше, чем на большую степень рк делится их разность. Тем самым обычная упорядоченность чисел разрушается. И все-таки (6.15) оказывается нормой. Более того (теорема Островского): всякая нетривиальная* 12^ норма на Q эквивалентна 13^ || |1р для некоторого простого р либо р = оо. Поэтому других норм на Q нет. Другое дело, что метрика р(х,у) = ||ж — ?/||р, задаваемая нормой (6.15), в самом деле «аномальна», если судить трафаретно. Причина заключена в том, Например, опЦ 8 = опЦ 24 = 3, ords 24 = 0. 12> Тривиальная норма: ||г|| = 1 для всякого ненулевого х. 13) Об эквивалентности норм см. [5, т. 5].
136 Глава 6. Алгебраическая ниша что (6.15) принадлежит классу неархимедовых норм, характеризуемых усиленным неравенством треугольника: ||® + зД| тах(||а5||, |Ы|). (6.16) Неравенство (6.16), казалось бы, ненамного «хуже» обычного II® + 1/11 Н®11 + IMI, ’ но последствия «катастрофические». Все треугольники оказываются равнобед- 14) г ренными ', а любая точка в круге является его центром. Как бы там ни было, норма есть норма, и с этим новым флагом можно идти путем классического анализа, пополняя множество рациональных чисел Q до полного пространства , являющегося аналогом R. Понятно, для каждого р пополнение Ор — свое. Но где они эти Ор? Хотелось бы расположить их на вещественной прямой, но не тут-то было. Приходится вспомнить, что и обычные вещественные числа — суть'фикция [5, т. 5]. Рациональная последовательность {ж„} изначально определяется как схо- дящаяся, если р(хп, х*) -> 0. Такая дефиниция бесполезна, поскольку априори требует иметь в руках пределы х*, каковыми мы только собираемся попол- нять Q. Поэтому соответствующая эпопея вынуждена базироваться на внут- реннем определении «последовательность сходится, если фундаментальна^». И тогда пределами х* оказываются сами последовательности Коши16\ Правда, в случае обычной нормы II® - S/lloo = 1®-?/1 удается «нарисовать» геометрический образ и отметить на нем фундаментальные последовательности точками пополнения х*. Ничего подобного не получается в случае (6.15), — ^-монотон- ные последовательности мечутся по территории Q, не обнаружи- вая сколько-нибудь упорядоченного с точки зрения R поведения. 14) Если ||а?|| < ||j/||, то в силу (6.16) ||а? - j/|| По той же причине Ill'll = ||а? - (х - y)|| max(||a?||, ||z - у||), откуда ||j/|| ||а? - г/||, потому что ||j/|| ||а?|| не выполняется по предположению. В итоге Ill'll = II® “I'll- 15') Является последовательностью Коши. С учетом того, что эквивалентные последовательности (характеризуемые сходимо- стью разности к нулю) сходятся к одному и тому же х*.
6.5. Теория р-адических чисел 137 В принципе работает та же схема пополнения, но чучело итогово- го полного пространства <Qp совсем не напоминает R. Конечно, есть норма, а значит, есть метрика, топология, непрерывность, — но нет покоя. Все по-другому. Если обычная норма |ж — у\, про- долженная по непрерывности с Q на R, начинает принимать все вещественные значения, то у ||ж — р||р, продолженной ^-непре- рывно с Q на Qp, ассортимент значений сохраняется. С аналогом перехода от R к С ситуация еще хуже. Если расширение поля R до С достигается присоединением всего лишь корня уравнения х2 + 1 =0, что делает разрешимыми лю- бые полиномиальные уравнения, — то отправляясь со стартовой площадки Qp, приходится образовывать бесконечную последо- вательность расширений присоединением корней неприводимых над Qp полиномов, а потом еще замазывать щели для получения аналога комплексной плоскости. Чисто алгебраический путь к р-адическим изыскам начина- ется с построения целых р-адических чисел, каковыми называют бесконечные последовательности вычетов хп по модулю рп, {жге} = {ЖО,Ж1, ... ,хп, 17) удовлетворяющих условию ' Хп (6.17) 6.5.1. Совокупность целых р-адических чисел несчетна. Обычным целым (рациональным) х сопоставляются р-адиче- ские числа {х,..., х,..Сумма и произведение {жга}, {уп} определяются как {хп + уп], {хпУп}- В результате образуется, кольцо Qp целых р-адических чисел. Дальнейшее расширение Qp до поля Rp дробных р-адиче- ских — происходит обычным путем деления целых р-адических рП-Е! |7'Две таких последовательности {жп}, {уп} при условии Vn : хп у — уп, — эквива- лентны, т.е. задают одно и то же число.
138 Глава 6. Алгебраическая ниша чисел друг на друга, для чего в Qp выделяется сначала группа чисел, имеющих обратные по умножению, — и такие числа при- нято называть единицами^, кольца, что вносит, надо полагать, умышленную путаницу, ограждая теорию от непосвященных. За- тем вводится норма (6.15), и расширение Rp до Qp происходит уже на топологической основе. Дискомфорт в связи с теорией р-адических чисел у многих снимается фактом возможной записи любого р-адического чис- ла £ в обратной (справа налево) р-ичной системе: £ = Р w(ao + а\Р + • • • + а-пРп + ••)> (6.18) где все яу находятся в диапазоне [0,р — 1], и Яо 0. Но ил- люзия привычности здесь достигается «обманным» путем. Ряд в (6.18) сходится только в р-адической норме, и потому «без всех этих хлопот» не обойтись, р-адические числа располагаются не в R или С, а на другой планете. Один лишь континуум целых р-адических — выбивает почву из-под ног у подсознания. 6.6. Квадратичные формы Нетрудно видеть, что сравнения (6.14) разрешимы при любом a G N в томм случае, когда /(Ж],...,жп) = 0 (6.19) разрешимо в целых р-адических числах. Большинство практических вопросов теории чисел связано с выяснением разрешимости (6.19) в Z или в Q. Разрешимость в Ор либо в чаще всего служит инструментом достижения цели. Но разрешимость Со (6.20) !8) Так же, как обычную единицу, х 1 — z, Ранее мы такую «группу единиц» называли мультипликативной группой кольца.
6.7. О булевых структурах 139 при любых р' и а так просто в руки тоже не дается и требует тех или иных обходных маневров. В этом отношении бывает эффективен следующий результат [3]. 6.6.1. Если f(xi,... ,хп) — абсолютно неприводимый^ полином с коэффициентами из Z, то уравнение (6.20) разрешимо при любых a G N и любых простых достаточно больших р (больших неко- торого ро). Особый интерес на данном этапе развития теории чисел пред- ставляют уравнения (6.19) второго порядка. Вот один из наиболее известных неординарных фактов в этой области. 6.6.2. Теорема Минковского—Хассе. Уравнение aijXiXj = 0 (все ay 6 Q) (6.21) имеет нетривиальное решение в рациональных числах в томм случае; когда оно нетривиально разрешимо в R и в при любом простом р. Пункт 6.6.2 принципиально уточняет следующий результат. 6.6.3. Уравнение (6.21) с рациональной квадратичной формой от п 5 переменных имеет нетривиальное решение в рациональных числах в томм случае, когда оно нетривиально разрешимо в R. Обобщение теоремы Минковского—Хассе на формы более высокого порядка не проходит [3]. Например, уравнение Зж3 + 4т/3 + 5х3 = 0 нетривиально разрешимо в К и любом но не имеет нетривиальных решений в Q. 6.7. О булевых структурах Чтобы лучше понять ту или иную теорию, ее имеет смысл «поше- велить», переходя, например, к другим числовым полям. Но «ва- рьировать» можно не только игровое поле, но и правила игры, некоторым образом меняя аксиоматику. Подходящими иллюстра- циями богата общая алгебра [5, т. 8]. Показателен пример булевых 191 Неприводимый ни в каком поле.
140 Глава 6. Алгебраическая ниша структур, каковыми называют множество Б с двумя операция- ми: сложения «+» и умножения «•», удовлетворяющих следующим требованиям: 1. Обе операции коммутативны и ассоциативны. 2. Операции дистрибутивны одна относительно другой, т. е. помимо обычного (для кольца) (х + у) • z = х • z + у Z, справедливо (ж • у) + z = (х + z) • (у + z). 3. В В существуют элементы 0 и 1: х + 0 = х, х • 1 = х. 4. Любому элементу х 6 В отвечает такой элемент х~] G В, что: х + ж-1 = 0, х • ж-1 = 1, иначе говоря, обратным элементу х, как по сложению, так и по умноже- нию, оказывается один и тот же элемент х~1. Корреляция с арифметикой довольно очевидна, но отличия в корне меняют облик системы. Одна из известных модельных реализаций булевой алгебры — матлогика с дизъюнкцией и конъюнкцией в качестве «сложения» и «умноже- ния». Универсальный характер имеет другая модель: множество В и некоторая система его подмножеств Зё с обычными операциями объединения, пересече- ния и дополнения, х + у О х U у, ху^хЗу. яГ‘ф>В\ж. Если Зё состоит всего из двух подмножеств, Зё = {0, В), возникает ситуация изоморфная матлогике. Булевы алгебры возникают во внешне весьма несходных ситуациях. На- пример, при введении операций х + у = НОК{ж, у}, х • у = НОД {ж, т/}, я-1 = — х на множестве делителей некоторого числа N, которое представляет собой произведение простых чисел в первой степени.
Глава 7 Эффективность счета Соловья обреченно проклинает ворона, Не знает страсти, бедная, сильней... Невдомек ей, что в кроне весь от горя зеленый Вороной стать мечтает соловей. Сторонники платонической науки территорию кон- кретных вычислений предпочитаю’1' обходить стороной, и рост популярности сугубо практических задач их удру- чает. Однако не стоит забывать, что Великие Теоретики, достаточно упомянуть Эйлера, искали истину и вдохно- вение в трясине численных экспериментов, — уделяя бездну времени рутинному счету. 7.1. PNP-проблематика Компьютеры на базе чисто арифметического языка решают фак- тически любые задачи. При этом бухгалтерские штучки, игра в шахматы, сочинение стихов, медицинский диагноз, экономи- ческии прогноз — сводятся к элементарным вычислениям ’, комплексное изучение которых рождает большое разнообразие прикладных направлений и теоретических проблем. Остановится ли программа счета? Можно ли в принципе так организовать вычисления, чтобы получить ответ на тот или иной вопрос? Существуют ли неразрешимые задачи? Это все из обла- сти алгоритмической неразрешимости (глава 5), где приходится не столько считать, сколько размышлять. Есть также масса заведо- мо разрешимых задач, в которых неясно, как добиться результата Иногда трудно обозримым, но все же элементарным по своей природе.
142 Глава 7. Эффективность счета «кратчайшим» путем, и здесь большая часть вопросов упирается в «PNP-проблематику». Р- и NP-задачам посвящен отдельный том [5, т. 10]. Вкратце суть проблематики заключена в следующем. Краеугольным слу- жит понятие полиномиального счета. Если работа алгоритма2\ решающего задачу с длиной описания х, характеризуется необхо- димостью выполнения /(ж) элементарных операций, то алгоритм считается полиномиальным в случае f(x) = O(xk) (7.1) при некотором к 0, т. е. при условии существования константы С > 0, такой что /(ж) Схк для достаточно больших ж. Так как полиномиальность имеет асимптотический характер, длину описания-и количество операций можно измерять с точ- ностью до умножения на константу. Для измерения ж годится количество битов либо количество символов в любом цифровом алфавите (кроме единичного), необходимое для описания данных задачи. Произвол в определении элементарных операций также весьма велик. Это могут быть арифметические операции, сдвиги головки машины Тьюринга, операторы алголоподобных программ и т. п. Все это не нарушает асимптотики (7.1). Теория алгоритмической сложности опирается обычно на за- дачи распознавания, каковые, по определению, могут иметь только два ответа: «да» или «нет». Существует ли в графе гамильтонов контур! Имеет ли задача линейного программирования решение? Является ли N простым числом? Это все задачи распознавания. Но широко распространены также дискретные экстремальные задачи максимизации целевой функции 3\ Однако: 7.1.1. Если целевая функция принимает не более N значений, то существует процедура решения оптимизационной задачи за log2 N 2) Алгоритм — это программа вычислений на любом универсальном языке програм- мирования. Например, задачи коммивояжера, целочисленного программирования, построения сети дорог минимальной стоимости и т. п.
7.1. PNP-проблематика 143 шагов, на каждом из которых решается соответствующая комби- наторная задача распознавания. Так что задачи распознавания скромно выглядят, но многое охватывают, — и к ним привязываются определения Р- и NP- классов. 7.1.2. Совокупность задач распознавания, которые могут быть ре- шены некоторым полиномиальным алгоритмом, называется классом Р. 7.1.3. Класс NP определяется как совокупность полиномиально про- веряемых задач распознавания , в которых, если решением является ответ «да», то существует «слово» А полиномиальной длины и по- линомиальный от А алгоритм, дающий ответ «да»4 5\ Среди NP-задач есть в некотором роде универсальные, как говорят, — NP-полные, каковые полиномиально эквивалентны друг другу. По определению задача NP-полна, если к ней полино- миально сводится любая другая NP-задача. Поэтому полиноми- альное решение любой NP-полной задачи полиномиально решает все остальные NP-задачи 6\ Вопрос «Р =NP» о совпадении или несовпадении классов Р и NP до сих пор остается открытым, что является крупнейшей математической проблемой, за решение которой учреждена пре- мия в миллион долларов. Тематика сложности вычислений, разумеется, не исчерпыва- 9 ется проблемой «Р =NP». Некоторые задачи не сводятся к распо- знаванию. Перечислительные задачи, например, в которых длина 4) Класс NP традиционно определяется иначе, но разница тут заключена в форме, см. [5, с. 10]. Заложить в определение полиномиальную проверяемость бывает жалко, поскольку тогда будет всем все понятно. 5) Если задача принадлежит классу Р, то и ее дополнение (та же задача с ответом «нет») лежит в Р. В NP-классе симметрия нарушается. Дополнение NP-задачи, вообще говоря, не обязано лежать в NP. Дополнительные к NP-задачам образуют класс co-NP. И потому видимое многообразие труднорешаемых задач — суть многообразие форм единственной задачи. Факт очень простой (см. [5, т. 10]), но до его открытия море труднорешаемых задач представлялось необозримым.
144 Глава 7. Эффективность счета ответа экспоненциально зависит от входа (скажем, перечисление всех циклов графа). Гипотетически труднорешаема задача факто- ризации (разложения на множители) целого N. Задача распозна- вания «существуют ли такие N\ > 1 и > 1, что N = N\N^», — лежит в классе Р как дополнительная задача к выяснению просто- ты числа, что, как теперь стало ясно, достигается за полиноми- альное время (см. далее). Однако в случае N = N\Nz определение TV, и N2 в прокрустово ложе (7.1) пока не укладывается. 7.2. Арифметические NP-задачи Труднорешаемые задачи «выплывают» главным образом из ком- бинаторики и теории графов. В данном случае интересен другой источник, теоретико-числовой. Вот несколько примеров из [8], где за пределы класса Р вылезают невинные с виду вопросы. • Существует ли целое х, при котором N делится на ах + 1 без остатка*! Казалось бы, чего проще, но задача своеобразно труднорешаема (у-полна [8]). • Существует ли решение х < а у сравнения х2 = b (modTV)? Задача NP-полна, но в случае простого N и справедливости расширенной гипотезы Римана — полиномиальна. • Существует ли натуральное с, делящее больше членов последовательности {а,,..., а„}, чем членов последовательности {&15..., Ьт}! Задача NP-полна. • Имеет ли уравнение ах2 + by = с, где a,b,c € N, решение в целых положительных х, у! Задача NP-полна. Для выяснения разрешимости линейного уравнения а^Хк — с достаточно полиномиального времени. к 7.3. Задачи криптографии Криптография придает «платонической» арифметике прагмати- ческую окраску, и об этом целесообразно сказать до обсуждения на вид абстрактных задач типа выяснения простоты числа. 7) О сравнительной сложности задач можно говорить даже в гипотетическом случае P=NP, см. [5, т. 10].
7.3. Задачи криптографии 145 Мало кому известна, но очень широко используема система шифрования RSA8\ опирающаяся на очень простую, и в то же время феноменальную идею. Цифровой текст х шифруется с по- мощью легко вычисляемой функции /(ж) — хе (mod Л-), (7.2) где числа е и N общедоступны — образуют так называемый открытый ключ. При определенных требованиях к {е, N}, о ко- торых сказано далее, функция (7.2) обратима, но f~l вычисляется совсем не просто. Точнее говоря, значения /-1 легко определяют- ся, если известен секрет, без которого расшифровка практически невозможна. В сказанное трудно поверить, ибо для расшифровки сообщения у = /(ж) надо всего лишь решить уравнение Xе = у (modTV), (7-3) но тут собака и зарыта. В RSA обычно полагают N = pq, где р и q — различные простые числа, а показатель е выбирается взаимно простым со значением функции Эйлера <p(N). 7.3.1. В указанных предположениях относительно N и е решение (7.3) единственно и определяется формулой х = yd (mod TV), (7.4) где натуральное d < <p(N) существует и однозначно извлекается из условия de = I (mod <p(7V)). (7.5) Решение (7.5) существует в силу НОД(е,ф(7У)) = 1, а единственность d вытекает из групповых свойств вычетов. 8,1 По первым буквам имен авторов: Rivest R. L., Shamir A., Adleman L. М. Крипто- графические модули RSA используются в MS Windows и сотнях других программных продуктов, связанных с защитой банковской, коммерческой, военной и другой секретной информации. Поэтому все имеют дело с RSA, но не все представляют, что это такое.
146 Глава 7. Эффективность счета В случае N = pq, очевидно, НОД (у, jV) g {1,р, q}. Если НОД(т/,А) — 1, то в силу (7.5) и теоремы Эйлера, хт(к) = । (modJV), имеем yd = xie = х (mod А), что приводит к (7.4). Если же НОД (y,N) = р, то рШ) делится на q>(q), а из (7.3) следует НОД (х, q) = 1. Далее аналогично предыдущему получаем х = yd (mod q) => (7.4). ► По первому впечатлению d мало похоже на секрет. Ибо что мешает разложить N на простые множители, после чего вы- числить V’(-W) и решить (7.5) 9\ определяя d? Иными словами, ключ {е, 2V} содержит полную информацию о секрете. Однако первый же шаг вычисления d сталкивается с необходимостью разложения N на простые множители, что при современных тех- нологиях для больших N оказывается непосильной задачей. Для 200-значного N необходимый объем вычислений имеет поря- док 1023, что выходит за рамки компьютерных возможностей 10 * * * *\ Помимо RSA есть и другие криптографические системы с от- крытым ключом, использующие односторонние функции: f(x) лег- ко считается, а /-1(®) трудновычислима. Правда, интуитивно кажется, что все функции таковы. Если, скажем, значение по- линома у = Р(х) относительно легко вычисляется, то решение уравнения у = Р(х) относительно х дается с большим трудом, если вообще дается. И так почти всегда. Гора одна и та же, но скатываться легко, взбираться трудно. Производные берутся, 9,1 Значение <p(N) легко вычисляется, если известно разложение N на простые мно- жители, ибо ip(p*) = pk~'{p — 1) для простых р, и <p(pq) — pipypiq) для взаимно прос- тых р и q. 10) Авторы RSA для демонстрации силы метода использовали менее устрашающий пример (1978), зашифровав некую фразу (переведенную нумерацией букв в цифровой код) с помощью открытого ключа со 129-значным N и е = 9007, — и объявили премию в 100$ за расшифровку. Премию пришлось выплатить. Работа по расшифровке заняла более полугода (а на приготовление ушло 17 лет), в нее было вовлечено несколько сотен человек и полторы тысячи компьютеров при сетевом взаимодействии. Проделанный объем вычислений превосходил 1015 операций.
7.3. Задачи криптографии 147 интегрирование сопротивляется. Показательная функция воспри- нимается с ходу, логарифм укладывается в голове со скрипом. Так что противоположные направления обычно неравноценны. Одна- ко различия часто эмоциональны, а трудности соизмеримы. Тогда как в данном случае подразумевается фундаментальное различие: /(ж) вычисляется полиномиально, а вычисление /-1(ж) — пере- борная задача, f(x)EP, f~l(x)£NP. Реализация такой возможности остается под вопросом. Не го- воря о возможности P=NP, односторонние функции, годные для криптографического употребления, должны легко вычисляться при наличии дополнительной «секретной» информации — как в RSA. Существование таких функций не доказано, но их «при- зраки» широко применяются, хотя и висит над ними дамоклов меч полиномиальной разрешимости «всех» задач. Вот еще один эталон криптографии: задача формирования секретного ключа абонентами А и В, взаимодействующими по от- крытому каналу связи11). В соответствии с алгоритмом Диффи- Хелмана А и В независимо друг от друга выбирают числа ХА и Хв, и не раскрывая их, с помощью общедоступных а и N вычисляют каждый свое: Ya = аХА (mod N), YB = аХв (mod N), после чего в открытую обмениваются числами YA, YB и вы- числяют, опять-таки каждый свое число, YY', YXb, каковые оказываются равны по модулю N, YBA = ya° = аХлХв (mod АГ), '^Криптография богата уникальными задачами, с виду нерешаемыми. Разве можно поверить, например, в организацию открытого диалога А и В, не дающего подслушиваю- щей стороне никакой информации, тогда как В убеждает А, что ему известен пароль либо решение некой феноменальной задачи. Это из области систем с нулевым разглашением [5, т. 10].
148 Глава 7. Эффективность счета в результате у каждого появляется секретный ключ d = о*'1*" (mod АД, доступный «посторонним» лишь при умении вычислять дискрет- 12\ ный логарифм ', т. е. определять Ха, Хв по значениям Ya, Yb- На сегодняшний день трудоемкость вычисления дискретного алгоритма сопоставима с трудоемкостью факторизации N. Обе задачи с точки зрения неполиномиальной природы остаются под вопросом. 7.4. Тесты на простоту Вычислительные задачи, связанные с классификацией чисел на простые и составные, с конструированием простых и факто- ризацией составных, — затрагиваются в разделах 7.4-7.7 с целью обозначить канву. Детальное рассмотрение предмета потребова- ло бы слишком много места, да и едва ли целесообразно в от- сутствие у читателя профессионального интереса, при наличии какового стоит обратиться к специальной литературе. Проверка делимости N на все простые числа меньшие корня из N — при отрицательном результате гарантирует простоту N, но для больших N практически безнадежна. Количество простых чисел меньших \/7V асимптотически пропорционально VN InVN (глава 8). Поэтому для 100-значного N, а в криптосистемах ис- пользуются значительно большие числа, необходимо проверить около Ю50 / 50 1п 10 ~ 1048 делителей, что абсолютно нереально. 12' Дискретным алгоритмом называют целое х в равенстве ах = b (mod JV), где N — простое число большее двух, а — образующий элемент мультипликативной группы вычетов ZN, и целое b < N. Обычно пишут х = logo Ь.
7.4. Тесты на простоту 149 Источником эффективных тестов служит малая теорема Ферма: для простого N и любого х, взаимно простого с N, xN~l = 1 (mod TV). (7.6) Проверку (7.6) называют тестом Ферма. Равенство (7.6) не яв- ляется необходимым и достаточным условием простоты N. Поэто- му тест Ферма работает с гарантией только в одном направлении: если (7.6) нарушается, то N — составное. В противном случае N может быть простым с некоторой вероятностью, каковая воз- растает при повторении теста с другим основанием х. Однако существуют составные числа Кармайкла, которые проходят тест Ферма для всех х, не являющихся их делителями 13\ Другими словами, N — число Кармайкла, если оно составное и xN~l = 1 для любого х € Zy, где Z^ мультипликативная группа вычетов. Сам Кармайкл установил (1912), что нечетное N является числом Кармайкла в томм случае, когда N=p\p2...pT, г^З, где pj различные простые числа, и ЛГ — 1 делится на Pj — 1 при всех j. Гораздо позже было доказано, что чисел Кармайкла бесконечно много, — поэтому тест Ферма, как тест на простоту, имеет фундаментальный изъян. Изъян не такой уж малень- кий. Например, чисел Кармайкла меньших N — 1017, — более полумиллиона.. На ум приходит, конечно, теорема Вильсона 3.6.1 вместе с ее обращением 3.6.2, объединение которых дает: «(п - 1)! + + 1 = 0 в томм случае, когда п простое». На этот раз критерий работает в обоих направлениях, но беда в другом. Не ясно, как избежать «неполиномиальных вычислений» факториала. Поэтому без лакмусовой бумажки (7.6) не так легко обойтись. Тест Ферма улучшается извлечением квадратного корня из (7.6), в результате чего получается ж(лг-1)/2 = ± j (mod N ф 2, (7.7) что приводит к тесту Леманна: если для какого-либо х < N (7.7) не выполняется, то N — составное. Если выполняется, |3) Но не только числа Кармайкла путают карты.
150 Глава 7. Эффективность счета mN - возможно, простое, причем вероятность ошибки не пре- восходит 0,5. Если (N - 1)/2 опять нечетно, то операцию можно повторить и так далее. На этом пути возникает 7.4.1. Тест Рабина—Миллера, состоящий в проверке выполнения одного из двух условий'. хт = 1 (modlV) либо 3r<k: хтУ = -1 (modN), (7.8) где N нечетно и N — 1 — т-2к, где т нечетно. Критерий (7.8) опять-таки работает с гарантией только в од- ном направлении. Число N, не проходящее тест, — составное. В противном случае N может быть простым с некоторой ве- роятностью. Но что важно, для теста 7.4.1 нет аналогов чи- сел Кармайкла. Более того, доказано, что вероятность ошибки (при ответе «N — простое») не превышает 0, 25. Таким образом, при успешном повторении теста t раз вероятность ошибки равна 4~г. Фактически получается полиномиальный алгоритм, «гаран- тирующий» простоту N со сколь угодно малой вероятностью ошибки. Затем Миллер пошел дальше. 7.4.2. Теорема Миллера. Если верна расширенная гипотеза Рима- на 14) и N проходит тест 7А. 1 при любом х : 1 < х <2 log2 N, то N — простое. Это уже чисто полиномиальный тест на простоту, но пред- положение о справедливости расширенной гипотезы Римана опять портит малину. Таким образом, задача несмотря на колоссальные 14) Обычная гипотеза Римана состоит в предположении, что все нетривиальные нули 00 t дзета-функции, аналитически продолжающей ряд У —, расположены на вертикальной z_/ пз. п=о 1 прямой (г = «Расширенная» — предполагает то же самое у любого ряда Дирихле 00 х(^) У -^у- , см. (8.11), где функция x(s) — характер Дирихле.
7.5. Полиномиальный тест AKS 151 усилия не давалась, хотя и дразнила близостью решения. Опти- мизм постепенно иссякал. На этом фоне полной неожиданностью оказалось открытие полиномиального алгоритма AKS. 7.5. Полиномиальный тест AKS Полиномиальный алгоритм AKS^ проверки числа на простоту уже описывался в общих чертах в [5, т. 10]. Поначалу было намерение изложить суть дела в данном томе более подробно. Но по здравому размышлению стало ясно, что это лишь нарушит избранный уровень детализации, и мало что добавит тем, кто хочет получить общее представление, экономя трудозатраты. Поэтому вопрос далее излагается в том же ключе. При оценке алгоритма AKS важен философский аспект. Прак- тика до сих пор остается в русле алгоритмов, описанных в преды- дущем разделе и им подобных. Но тест AK.S решил вопрос принципиально, что было существенно для PNP-проблематики [5, т. 10]. Центральная идея алгоритма опирается на следую- щий факт. 7.5.1. Натуральное п, при условии НОД (a, n) = 1, является про- стым в томм случае, когда (х - а)п = (хп - a) (mod п). (7.9) п ◄ В разложении (х-а)п — Ckxk(—a)n~k могут не делиться на грс'тое п 1с=0 только крайние слагаемые, причем по малой теореме Ферма а" a (mod п), что и дает (7.9). Если же п составное, п = psq и q не делится на р, то С„ не делится на п — и (7.9) нарушается. ► Теорема 7.5.1 позволяет заменить проверку п на простоту проверкой тождества (7.9). При бесхитростном подходе это ед- ва ли может дать выигрыш, но определенные уловки подтягивают |5'Аббревиатура AKS — по первым буквам имен авторов алгоритма: Agrawal М., Kayal N., Saxena N. Primes in P 2002 (http://www.csc.iitk.ac.in/ncws/primality.pdf).
152 Глава 7. Эффективность счета трудозатраты к полиномиальному уровню. В частности, необ- ходимый перебор значительно сокращается после деления (7.9) на некоторый полином вида хт - 1 и рассмотрения остатков, — что в итоге заменяет (7.9) менее тяжеловесным |6) (ж - а)” = (хп - a) (mod п, хг - 1). (7.10) Главный результат, в несколько модифицированном виде, состоит в установлении следующего факта. 7.5.2. Пусть натуральное п и простое г таковы, что (i) порядок п в группе Zr больше (log2 п)2; («) п не делится на простые числа меньшие г; (н7) тождество (7.10) выполняется для всех а 6 [1, y/r log2 п]. Тогда п — степень простого числа. 7.5.3. На базе 7.5.2 алгоритм AKSработает так'. 1) делимость п на числа от 2 до LO°g2 n)5J проверяется в лоб', 2) ищется г [(log2 ^)5J, для которого выполняется (i) в 7.5.2 |7^; 3) проверяется (н7); 4) проверяется, не извлекается ли из п целый корень. Алгоритм полиномиален, но вычислительной ценности пока не представляет, хотя продолжает обрастать усовершенствовани- ями, снижающими показатель к в (7.1). 7.6. О практике вычислений Теоретическое зондирование гигантских чисел было бы не так ин- тересно без возможностей практической реализации. Даже про- стейшие арифметические манипуляции с многоразрядными об- разованиями требуют специального программного обеспечения. Но это все-таки технические трудности, которые относительно 61 Равенство (7.10) означает существование такого полинома q(x) 6 2[ж], что все коэффициенты полинома (х - а)" - (хп - а) - ?(ж)(жг - 1) кратны п. |7) Подходящее г гарантированно существует — техническая лемма.
7.6. О практике вычислений 153 легко преодолеваются. В то же время криптография нуждает- ся в решении принципиальных задач поиска «астрономического масштаба». Отодвигая в сторону полиномиально неразрешимые пока задачи факторизации (раздел 7.7), достаточно обратить вни- мание на построение больших простых чисел, без чего система- RSA, например, теряет опору. Где взять большие простые р и q, необходимые для формирования открытого ключа {е, N —р- ?}? Задача решается относительно просто, хотя и не без идео- логических затруднений. Возможность полиномиального тести- рования простоты — сводит проблему, казалось бы, к эконом- ному подбору кандидатов на проверку. Но без дополнительных ухищрений тут не обходится. Одна из тропинок пролегает через следующий «изотоп» малой теоремы Ферма. 7.6.1. Пусть N, S — нечетны, N — 1 = R • S и для каждого простого делителя q числа S существует целое х, такое что xN~' = 1, (7.11) а — 1 взаимно просто с N. Тогда каждый простой делитель р числа N удовлетворяет сравнению 2S , Р = I- При этом если R^4S + 2, то N — простое число. Теорема 7.6.1 дает рецепт построения по простому числу S простого N > S2, имеющего в своей записи вдвое больше де- сятичных цифр. Для этого полагается N = R • S + 1, где R выбирается случайно в промежутке S R 4S + 2, до тех пор пока N не окажется простым. Интересно, что на практике рецепт хорошо работает 18\ хотя до сих пор нет теоретических оснований, которые бы гарантировали существование простого N = R • S + 1 в диапазоне S R 4S + 2. |8) Разумеется, пока десятичная запись .V не зашкаливает — остается, например, в пределах тысячи знаков, чего для криптографии более чем достаточно.
154 Глава 7. Эффективность счета Рекордные вычисления больших простых чисел ведутся в на- стоящее время на множестве чисел Мерсенна Мр = 2Р - 1, где р — простое. Успех достигается благодаря узости сектора поиска и вы- сокой эффективности теста Люка—Лемера: 7.6.2. Число Мр.является простым в томм случае, когда Lp-i -0 (mod МД (7.12) где числа Lj. определяются рекуррентным соотношением Lk+i = Ъ).—2, L\ = 4. Ограничимся выводом достаточности. Легко проверяется: Lk = (2 + V3fn-'4(2-V3fn-'\ Таким образом, в случае = 0 (modMp) имеем (2+УЗ)(2^ + (2-Уз/2^=гМ1> при некотором г € N, что после умножения на (2 + х/3)*2Р переходит в (2 + х/3)<2₽'> = гМр(2 + х/3)<2Р"2> - 1. (7.13) Допустим теперь, что Мр составное, т. е. делится на некоторое простое q < у/М~р, и рассмотрим группу G (с умножением по модулю q), состоящую из чисел вида а + Ьу/З при условии, что а, Ь € {0, 1,..., q - 1} и, разумеется, каждый элемент из G имеет обратный того же вида. Очевидно, порядок группы |G[ q2 - 1, а из (7.13) следует, что в G имеет место (2+ х/3)<2Г-1> = -1, откуда (2 + x/3)<2'> = 1. Таким образом порядок элемента 2 + х/З в G равен 2Р. А поскольку порядок элемента не больше порядка группы, то 2Р q2 - 1 Мр = 2Р - 1, что приводит к противоречию. ► Вычислительная сложность экономных реализаций теста Люка—Лемера приближается к19^ O(log2 N log log N) (дляЛГ = 2P - 1). '^Обратим внимание, что вместо экспоненциально' растущей последовательности Tj+i = -kfc — 2 достаточно вычислять Lk+। = Lk — 2 (mod Мр), поскольку критерий (7.12) рассчитывается по модулю Мр.
7.7. Алгоритмы факторизации 155 Это существенно превосходит эффективность универсальных те- стов, пригодных для диагностики любых чисел. Кроме того, в поле зрения тут попадают лишь числа 2Р - 1, что существенно огра- ничивает область поиска. Поэтому именно среди N — 2Р — 1 найдены самые большие простые числа 20\ С гораздо меньшим успехом ведется поиск простых среди чисел Ферма с помощью теста Пепина. Для криптографии числа Мерсенна не представляют интере- са, поскольку их мало и они все на виду (висят в Интернете, см. http://primes.utm.edu/mersenne/). 7.7. Алгоритмы факторизации Разложение составного N на множители пока не укладывает- ся в класс полиномиальных задач, и по-видимому, — так ду- мает большинство — не уложится. Однако криптография, си- дящая на суку «полиномиальной неразрешимости задачи фак- торизации», сильно опасается, особенно квантовых компьютеров [5, т. 10]. Перебор тем не менее удается значительно сократить, ибо в задаче все-таки просматриваются некоторые закономерности. Один из практически эффективных трюков опирается на пред- ставление составного N разностью двух квадратов: /а + Ь\2 /а- Ьх 2 N = а-Ь = [ —- - —- V 2 7 V 2 (7.М) Искать решение (7.14) можно так. Берется наименьший квад- рат ж2, превосходящий N О х = р/ЛЁ| . Далее из найденного ж2 вычитается N. Если из у = ж2 — N извлекается корень z, то N = ж2 - z2 — (ж + z)(x — z), 20) На момент написания данного тома (2009) известно 46 простых чисел Мерсенна, самое большое из них, 243 112609 — 1, имеет в записи почти 13 миллионов десятичных цифр. Группа EFF (Electronic Frontier Foundation, http://www.eff.org/) за нахождение простого более чем 108-значного числа назначила премию в $150 000.
156 Глава 7. Эффективность счета и в случае х - z £ 1 — задача решена. В противном случае берется следующий квадрат после ж2 и т. д. Другой трюк называют «ро-методом Полларда». В кольце Zjy запускается итерационный процесс xfc+i = /(«fc) (7.15) с помощью некоторого отображения / : Zjv -> Zy типа /(ж) = х2 + 1 (mod N), и каждый раз Хк сравнивается с предыдущими Xj до тех пор, пока не найдется пара с НОД (хк - Xj,N) = г > 1, (7.16) что в случае успеха дает собственный делитель N. Выполнение (7.16) означает, что Xj и Хк принадлежат од- ному классу вычетов по модулю г, а процедура (7.15) в случае N = г • q «гоняет» изображающую точку Хк по классам вычетов также по модулю г < N, каковых меньше чем классов по моду- лю N, за счет чего достигается экономия перебора. Кроме того, в действие тут вступают благоприятные вероятностные сообра- жения, а также некоторый фокус, позволяющий на каждом шаге проверять всего лишь один НОД (7.16), а не все с индексами j < к [12]. Но достичь полиномиального уровня даже в вероят- ностном смысле, конечно, не удается.
Глава 8 Распределение простых чисел Главное всегда за кадром. О подспудных механизмах кое-что говорит ста- тистика случайных выбросов. Через некоторое вре- мя грешным делом выясняется, что уже все сказала и больше не говорит. Однако тематика набрала инер- цию, финансируется, прославляется. И какая теперь разница, из-за чего концентрация сил и средств. 8.1. фубые причины Пониманию грубых механизмов в распределении простых чисел способствуют элементарные соображения на пальцах. Количество простых чисел, не превосходящих х, — обо- значают через 7г(ж). При обработке натурального ряда решетом Эратосфена доля чисел в промежутке [ж, х + Дж], делящихся на простое р, равна Дж _ 1 Дж-р р’ / а не делящихся — (1----). Доля же чисел в этом промежутке, \ Р/ не делящихся ни на одно простое число р ж + Дж, равна р(ж) = (8.1) Из записи всех натуральных чисел вычеркивается 1 — первое невычеркнугое число 2 — простое. Далее зачеркиваются числа, делящиеся на 2, число 3 — первое невычеркнугое — простое. И так далее.
158 Глава 8. Распределение простых чисел причем ясно, что «принимают участие» лишь простые р, меньшие у/х, и Дж х, но Дж > еж при некотором малом s > 0. Самих простых чисел на [ж, ж + Дж] будет р(ж)Дж ~ д(ж + Дж) - 7г(ж), т. е. р(ж) играет роль плотности. Для больших р приближенно: 1 — - = е~^р. Поэтому Р Ьр(ж) = -^-^, к Рк где рк обозначает k -е простое число. В промежутке [ж, х + Дж], в силу Дж х, можно считать рк ~ х, и сумма по этому промежутку V-' 1 1 , , Л 2^ г; ~ -№)Ьх, Рк «ь откуда ln/,(a:) = _vl~- f ^du, к Рк Iй что после дифференцирования по х приводит к уравнению р'(х) р(х) dp dx р(х) х р2 х решение которого р(х) = 1/(С + In ж) при больших х переходит в ^) = i’ Что касается тг(ж), то . . Г du х ( 1 г! Л / 1 \ 1 я’(ж) = / >— = >— ) 1 + >— +... + 7-7—I- О ( +1— ) > . (8.2) J In и . In ж ( In ж In ж \1п + ж/ J 2 Для примера, точное значение тг(4000) = 550. Первые три члена разложе- ния (8.2) дают приближение тг(4000) « 554.
8.2. Функции Чебышева и асимптотика 159 8.2. Функции Чебышева и асимптотика Содержание предыдущего раздела не выдерживает строгой кри- тики. В части обоснования. Сам результат (8.2) был известен еще Гауссу, по-видимому, благодаря не вполне убедительным рассуж- дениям. Строгий анализ был начат Чебышевым, использовавшим в своих построениях две функции2^, см. (2.22), (2.23), $(ж) = 52 и = 52 (8.3) Р^Х где р обозначает простое число; х > 0 — не обязательно целое. Если рк — наибольшая степень р, не превосходящая х, то 1пр во второй сумме (8.3) засчитывается, как легко видеть, ровно к раз, причем к = [logp ж], т. е. ^(ж) = y^flogp ж] 1пр. р^.х (8-4) Из определения ясно, что ё0^ равно произведению всех простых р С ж, а ё^х> — НОК всех целых положительных чисел, меньших ж (^ ж). В силу р ж <-> р С у х имеем ^(ж) = $(ж) + $(7ж) + ^(у/х) + • • •, (8.5) причем ряд конечен по причине обнуления $(ж) при ж < 2. Многие числовые функции взаимозависимы из-за общности источников. В частности, V’fa) = 52 Л(п)’ (м п^х где Л(п) — функция Манголъдта^. Функции Чебышева. Л(п) = logp, если n = рк, р — простое, к — целое положительное, и Л(п) = О', если п ф рк.
160 Глава 8. Распределение простых чисел 8.2.1. Теорема. При ж —> оо верхние пределы функций (а также — нижние} , ч ч ч д(ж) »(ж) ф(Х) ж/In ж’ ж ж равны между собой. Ч Из (8.4) следует ^(®) < ^[’ogp®] lnp = lna?y^ 1, р^х т. е. тг(ж) In Хч откуда $(ж) t/)(x) тг(ж) In Ж, что после деления на ж и перехода к верхнему пределу дает х->со ® х->оо ® ж->оо Ж/ In X Далее. При любом v 6 (0,1) и х > 1 выполняется 1?(х) > 1пр, где суммирование идет по р & (х”, х]. С учетом lnp > In xv имеем 1?(х)^р1пх 1 = 1/1пх(тг(х) - тг(х‘/)), Xй <р < X что несложными манипуляциями приводится в итоге к lim sup > v lim sup , V v е (0, 1), ж->оо ® ж->оо X/ In X откуда вытекает обращение неравенств (8.7) в равенства. Равенство нижних пределов устанавливается аналогично. ► (8.7) Результат 8.2.1 довольно простой 4\ но он пробивает брешь в укреплениях натурального ряда. Из п. 8.2.1 довольно легко выводится существование положительных констант А и Л, таких что при достаточно больших ж АГ“ In ж Ж . In Ж Простой по доказательству. Но до этого надо было открыть $ и ф, предвидя в то же время их инструментальную пользу.
8.3. По каналам дзета-функции 161 Чебышев (1850) сузил диапазон до значений А = 0,9, Л = 1,1 ’Г(ж) 5) и доказал, что, если —---имеет предел, то он равен единице ' х/ Ins Существование предела полвека не поддавалось обоснованию, и было установлено Адамаром и Валле-Пуссеном (1896), см. далее. 8.3. По каналам дзета-функции Дальнейший прогресс в изучении 7г(ж) и вообще лабиринтов теории чисел был (и до сих пор) связан с дзета-функцией C(s) - 1 + — + ~ + •••, (8.8) введенной Эйлером и впоследствии назван- ной функцией Римана. Долгое время ((д) изучалась как функция действительного пе- ременного (Эйлер, Дирихле, Чебышев). Суще- ственное углубление результатов произошло в связи с переходом (Риман, 1876) к рас- смотрению C,(s) как функции комплексного аргумента, s = a + ir, Риман (1826-1866), и установлением связи между 7г(«) и нулями ((д). О дзета-функции6^ более естественно читать в среде ТФКП [5, т. 9]. Однако здесь имеет смысл кое-что напомнить хотя бы эс- кизно. Ряд (8.8), равно как и произведение (6)), иногда называют дзета-функцией, но это ошибочно в том смысле, что настоящая Совокупность перечисленных результатов вместе с некоторыми сопутствующими называют-теореиами Чебышева. Дзета-функция имеет равносильное представление в виде бесконечного произведения «•)-£^-п(--?)’ п=! ре?V F 7 что называют тождеством Эйлера.
162 Глава 8. Распределение простых чисел дзета-функция является аналитическим продолжением (6)) на ком- плексную плоскость С с выколотой точкой s = 1, и удовлетворяет функциональному уравнению £(s) = 2V-1 sin — Г(1 — з) £(1 - з). (8.9) Тот факт, что свойства £(s) полностью определяются ее нетривиальными нулями, вытекает из теоремы Адамара о разложении на множители целой функции [5, т. 9]. Правда, сама ((з) — не целая, но тут помогает переход к целой кси-функции Римана ад=(I) ад. Полюс ((з) в точке s = 1 гасится множителем (s — 1), а нули ((з) в точках —2, —4,... аннигилируют с полюсами Г(з/2). Нулевой полюс Г(з/2) ликвидируется.множителем з. В итоге £(з) — полу- чается целой функцией первого порядка, нули которой совпадают с нетривиальными нулями ((з). Применяя далее упомянутую вы- ше теорему Адамара, получаем где а — константа * 8\ рп — нетривиальные нули ((з). Разматывая далее клубок в направлении £(з) => ((з), получаем 1 / \ 00 / \ С(3) = -?*(з - If’r-1 (| + 1)П(1- — ) (8Л°) 2 ^2 / п=Л Рп' где Ъ = |г'(1) + 1п2тг- 1. Здесь Г(«) — гамма-функция Эйлера [5, т. 9]. 8) а = In 2 + In у/х — 1 — 7/2, 7 — постоянная Эйлера.
8.3. По каналам дзета-функции 163 Поскольку ((з) О в полуплоскости a > 1, то из (8.9) следует,'что ((з) при <т < О имеет лишь так называемые тривиальные нули в точках s = -2k, k — 1,2,.... Осталь- ные (нетривиальные) нули ((з) сосредото- чены в вертикальной полосе a G [0, 1], при- чем их бесконечно много и все они ком- плексные. Адамар и Валле-Пуссен сузили полосу до (г £ [0,1), т. е. «на копейку», но это гарантировало, наконец-то, 7г(ж) —--------> 1 при х -> оо, X In X Адамар (1865-1963) откуда следует, между прочим, Рп п/1пп при п —> оо9\ где рп — n-е простое число. Затем последовали многочисленные уточнения границ ну- лей С(з) и, как следствие, уточнения остаточного члена в асимпто- тических формулах для 7г(ж) и ф(х). Сужение диапазона до <т= 1/2 остается до сих пор пределом мечтаний. Гипотеза Римана о расположении всех нетривиальных нулей на прямой а = 1/2 — нерешенная (2009) математическая проблема «номер один». Имеется множество аргументов «за» общего характера, начиная от доказанной бесконеч- ности числа нулей с действительной частью а = 1/2, и заканчивая различными довольно тонкими оценками. Вопрос остается открытым, но уже мало кто сомневается, что предположение верно. Особенно в связи с численными экспе- риментами. Все первые 1013 нетривиальных нулей — нумерация идет в порядке возрастания модуля мнимой части — лежат на прямой а = 1/2. Кроме того, два «пробных» миллиарда нулей в районе нуля с номером 1024 также лежат «где надо». Ссылка есть в [5, т. 9]. При этом существуют сколь угодно длинные последовательности п, п+ 1,п + 2, ...,п + т, не содержащие простых чисел. Например, fe! + 2, kl + 3,..., fe! + k.
164 Глава 8. Распределение простых чисел Многие связи ((«) с арифметикой лежат на поверхности. = - У~^[тг(п) -,тг(п - 1)] in (1 п=2 ' 00 Г / 1 \ / 1 \' = V тг(п) In ( 1--------) - In ( 1 - --------— I = “ ' ' \ П‘ J \ (п + 1)' J n=2 L ' ' ' ' ' z J s dx x(xi - 1) 1 • Перемножение в - Ф) теоремы арифметики дают и учет основной 1 Ф) д(п) ибо, как легко убедиться, У 1 = т(п)- ЦУ=П • Наконец, Из перечисленного, надо полагать, возникает хотя бы прибли- зительное представление о направленности проблематики с уче- том инструментального обеспечения. Для пристального изучения предмета нужна специальная литература и готовность преодоле- вать трудности.
8.4. Характеры Дирихле 165 8.4. Характеры Дирихле Тождество Эйлера (6)) дает еще одно доказательство бесконечт ности множества простых чисел. В предположении противного произведение (6)) при s —> 1 + 0 имело бы конечный предел, а ряд стремился бы к расходящемуся гармоническому. Такой изотоп доказательства легко не заметить за ненадобностью. Тем бо- лее интересно, как идея .работает в дру- гих обстоятельствах, где рассуждение Ев- клида (п. 2.2.2) терпит фиаско. Дирих- ле (1837) задействовал схему для обос- нования бесконечности множества про- стых чисел в арифметической прогрессии с разностью d и первым членом а, при условии а < d и НОД (a, d) = 1. Для это- го он ввел мультипликативные периоди- ческие функции х(п~) (характеры Дирихле по модулю d), обладающие свойствами: Дирихле (1805-1859) х(п) £ 0, х(п + d) = х(п), X(nl) = х{п)х{Ц, каковые, при заданном d, существуют в количестве cp(d) штук. Характеры Дирихле обладают богатым набором плодоносящих свойств, благодаря чему широко применяются в разных областях математики. Их исход- ная ориентация на арифметические прогрессии сохраняет значение. Среди хФ) характеров10^ есть главный — Хо(п) (для каждого d свой), равный 1 при НОД (n, d) = 1, и равный 0 при НОД (п, d) 1. Вот кое-что из «плодоносящего» ассортимента. Х*’(Й)(«) = Хо(п) Ъ = 1 0 n(mod d) ч ’ Ь х(М = < 0 X(mod d) х ’ (Vx), если x = Xo, если x Xo, если k = 1 (mod d), если k 1 (mod d). IO) Для их построения Дирихле развил конструктивный метод построения.
166 Глава 8. Распределение простых чисел Наконец, свойство ортогональности'. ( 1, если n = k (mod d), > , %(«)*(*) = S n ,,, , . x(mod<z) I °’ если n / k (mod d), позволяющее выделять в N данную арифметическую последовательность и ра- ботать с ней. В качестве обобщения ((s) Дирихле рассмотрел эль-функцию1 анализируя которую, установил бесконечность множества про- стых чисел в любой12) арифметической прогрессии. Более того, простых чисел в таких прогрессиях настолько много, что сумми- рование их обратных величин дает расходящийся ряд 8.5. Постулат Бертрана Помимо асимптотического поведения интерес представляют так- же результаты, гарантирующие наличие простых чисел в тех или иных диапазонах. 8.5.1. Постулат Бертрана. Между любым n > I и 2п всегда заключено простое число . 00 ")ряд (8.11) — один из рядов Дирихле ^^ann~s [5, т. 9], значение которых для п~ I арифметики заключается в специфике их перемножения: где внутреннее суммирование идет по всем разложениям п в произведение двух сомножи- телей, что неким образом ухватывает мультипликативное устройство натуральных чисел. Из оговоренных выше. '^Возможно, между любым п > 117 и п + у/п всегда заключено простое число (гипотеза Шинцеля [17]).
8.5. Постулат Бертрана 167 Чебышев Жозеф Бертран (1821-1894) (1822-1900) Бертран Рассел (1872-1970) Факт 8.5.1 в виде гипотезы был выдвинут Жозефом Бертра- ном 14) и доказан Чебышевым (1850). Ниже приводится доказатель- ство Рамануджана 15\ Ч Достаточно установить 1б' 1?2(2п) — »?2(п) > 0, (8-12) ибо разность (8.12) равна сумме логарифмов простых чисел между п и 2п. В сйлу (8.5) ^г(2п) - 2^i(V2n) = ?J2(2n) - i?2(x/2n) + i?2(-vz2n) - $2(-У2п) + ..., откуда 1?2(2п) ^>2(2п) —2^2(х/2п), а из (8.3) следует 1?2(к) < Кроме того, несложное манипулирование с (8.4), (8.5) и тождеством Чебышева (2.22), — приводит к f 2п\ i/>i(2n) - + i/>2 ( у J > log2 C2n. Перечисленное в конечном счете дает неравенство 1?2(2п) - 02(п) > log2 С2п - ( у } - 2i/)2(V2n), (8.13) что с учетом легко проверяемого неравенства — < С"п < 4" и некоторых 2п дополнительных соображений обеспечивает (8.12) для п > 512. Справедливость п. 8.5.1 для остальных п проверяется в лоб. ► 14) Но не Бертраном Расселом. |5) По книге Шнирельмана [22]. 16) Где i?2(n) — функция Чебышева, см. (8.3). Индекс 2 свидетельствует о выбор: основания логарифмов а = 2.
168 Глава 8. Распределение простых чисел Приведенное несколько скомканное рассуждение не предна- значено служить доказательством, читаемым с листа 17\ Тут лишь контуры. Не экономии18^ чернил ради, а потому, что результат давно известен, доказательства в избытке разбросаны там и сям, главный же интерес заключен не в манипуляциях, а в функци- ях Чебышева, инструментально плодотворных на широком поле. Поэтому жонглирование неравенствами здесь — всего лишь ма- териальная реализация, тогда как «асимптотическое подобие» (теорема 8.2.1) функций и ^(®)> log X составляет идеологическую основу одного из подходов к стати- стике простых чисел. |7) Более развернутое обоснование есть в [21, 22]. ,8) Каковая в данном случае совсем копеечная.
Глава 9 От Ферма до Уайлса Вижу я по губам — извилиной, По надменности их усиленной, По тяжелым надбровным выступам'. Это сердце берется — приступом! Марина Цветаева Последняя теорема Ферма о неразрешимости в целых х, у, z уравнения хп + уп = zn, п>2, (9.1) конечно,, выдающееся явление в теории чисел. Три с половиной века утвержде- ние оставалось гипотезой, однако называлось теоремой. Доказательство пока слишком длинно для изложения в учебной литературе, но здесь имеется масса поучительных сопровождающих течений, значение которых, быть может, пре- восходит роль самого заключительного аккорда. Ферма (1601-1665) Танияма (1927-1958) Уайлс (р. 1953) 9.1. Общая картина Между Ферма и Уайлсом помимо Таниямы, сыгравшего роль ката- лизатора успеха, заслуживают почестей фигуры разного калибра: Эйлер, Гаусс, Ламе, Куммер, Коши, Софи Жермен, Шимура, Фрей,
170 Глава 9. От Ферма до Уайлса тельства теоремы Софи Жермен (1776-1831) Рибет, — да всех и не перечислишь. Отдельного упоминания достоин Тейлор , устранивший в паре с Уайлсом пробелы доказа- заключительном этапе. Пересказывать всю историю нет смыс- ла, и тем более — возможности. О послед- ней теореме Ферма пишутся книги, причем не только математического толка [20], при этом все равно многие пласты остаются нетронутыми. За рамками чисто математи- ческого содержания здесь масса поучитель- ного материала. Психологический аспект, личностный, ну и вообще «как течет река жизни». И как решаются проблемы — от- дельными людьми или сообща «за кадром». При углублении в процесс трудно от- делаться от ощущения, что взаимодействие идей как-то дири- жируется извне. Какие-то загадочные источники определяют ход событий, и все оказывается так переплетено и синхронизовано, что целое не делится на части. Конечно, для подобных впе- чатлений нужна концентрация на проблеме, а то и сто грамм. Поверхностный взгляд требует меньше усилий и дает большую свободу для интерпретаций. Обычные причитания по поводу колоссального влияния тео- ремы Ферма на теорию чисел нередко ставят предмет с ног на го- лову. Неразрешимость (9.1) сама по себе никакой серьезной роли не играет, представляя собой обыкновенный пример в бесконеч- ном ряду неразрешимых уравнений. И было бы, кстати, гораздо интереснее и полезнее, окажись факт принципиально недоказу- емым, см. теорему 5.3.1. Тогда бы у бессмысленных, но в то же время полных смысла попыток фиксации истины был бы в за- пасе безбрежный океан времени, а не какие-то жалкие 360 лет, на которые хватило теоремы Ферма. О полезности здесь можно Бывший аспирант Уайлса.
9.1. Общая картина 171 вести речь более в космическом смысле, нежели математическом: Азарт, сумасшествие, вдохновение — вот что дают великие задачи. Теорема Ферма уберегла от казино и наркотиков столько народу, что арифметические достижения меркнут на этом фоне. Да и не так уж велики эти достижения, как их обычно пре- возносят. Крупное идеологическое завоевание, собственно, одно; куммеровская теория идеальных чисел2* (раздел 9.2). Эллиптиче- ские кривые и гипотеза Таниямы (разделы 9.3, 9.4) имеют другие источники, и там теорема Ферма просто попалась по ходу дела, и не устояла. Что касается остального «колоброжения вокруг», то многочисленные результаты здесь рутинны и малозначительны. В то же время в совокупности они порождают показательный историко-философский феномен, дающий образцы возможных арифметических аномалий. Хлопоты в связи с (9.1) постоянно заставляли думать о поиске контрпри- мера. Однако было ясно, что в случае Xя + уя = zn необходимо х, у, z > п. ◄ Действительно, если z х + а, а 1,то хя + уп = хя + пхп~1а + ... + пхап~' + а", откуда уп > пхя~'. Аналогично Xя > пуп~', что в конечном итоге приводит к х,у, z > п. ► Таким образом, когда неразрешимость (9.1) была установлена вплоть до п = 100 000, стало ясно, что контрпример можно искать, лишь рабо- тая с числами как минимум порядка ц)500000. Но это не добавляло оптимизма, поскольку, вопреки остальному жизненному опыту, исключения в арифме-- тике нередко обнаруживались в астрономическом удалении от близлежащих территорий. Эйлер, например, вслед за (9.1) предположил неразрешимость хп + уп + ип = zn, хп +уп +ип + vn = zn и т. д. (9.2) Очень естественная гипотеза, кстати. Потому что если теорема Ферма — представитель некой общей закономерности, а не случайный осколок 3\ то схема Эйлера (9.2) прямо-таки напрашивается. Тем не менее в компьютерный век нашелся контрпример 2 682 4404 + 15 365 6394 + 18 796 7604 = 20 615 6734, 2) Которые теперь называют дивизорами. 3) Как, собственно, и оказалось.
172 Глава 9. От Ферма до Уайлса потом более экономный 95 8004 + 217 5194 + 4 1 4 5604 = 42 2 4814, но все равно слишком большого калибра. И это всего лишь рядовой эпизод в цепи исполинских пустяков теории чисел, в которой безделушки часто неот- личимы от мировых истин. Чем знаменитая теорема Ферма отличается от ма- ло кому известного пифагорова кирпича'! Существу- ет ли прямоугольный параллелепипед с целочислен- ными ребрами, диагоналями граней и главной диаго- налью? Никто не знает. Тогда как вопрос навскидку ничем не хуже теоремы Ферма. Имеет ли решение х, у, z, и, v, w, з € N система уравнений: х2 + у2 = иг, X2 +z2 = V2, 2 2 2 у + Z = 11) , х2 + у2 + Z2 = S2. (9.3) Конечно, тут не хватает лаконичности (9.1), но есть симметрия и взаимосвязь со знакомыми обстоятельствами. Тем не менее обременить себя исследованием (9.3) мало желающих. Тут нужен либо исторически сложившийся ажиотаж, либо вера в фундаментальную природу 'задачи, либо хорошая денежная премия. На фоне вышесказанного вполне понятен скепсис большей части математиков, сопровождавший гипертрофированный энту- зиазм дилетантов. Лузин (1883-1950) Вот что пишет Н. Н. Лузин в письме И. М. Вино- градову (от 16.04.1946): «Очарование имени Fermat для меня отнюдь не связано с его „последним предложением", но с его многосторонней деятель- ностью как предшественника Декарта в изобрете- нии аналитической геометрии, как предшествен- ника Ньютона и Лейбница в изобретении анали- за бесконечно малых». И далее: «Что же касается до его. „ последнего предложения", то лично у меня к нему интерес всегда был равен нулю. Тяготение к нему отрицательно характеризует человека, сра- зу помещая его вне круга истинных философов и ученых. <...> Это в лучшем случае — только спорт, если не говорить о вещах много худших».
9.2. Дивизоры Куммера 173 Личность Ферма, в первую очередь как математика, на про- тяжении веков представляла особый интерес в связи с его «не- погрешимостью». Почти все, оставшееся без доказательств, впо- следствии подтвердилось. На ошибочных предположениях, типа простоты чисел 22 + 1, Ферма никогда не настаивал. Поэтому его известное замечание о найденном доказательстве неразреши- мости «ж" + уп = zn» было воспринято всерьез, и «факт» был назван теоремой. Серпинский [17] нашел три ошибочных утвер- ждения Ферма4), и это породило некоторый вздох облегчения, потому что после трех веков безуспешных попыток решения «хп + уп = zn» хотелось верить, что и Ферма иногда ошибался. В цитированном выше письме Лузин писал: «Был ли у Fermat особый метод в его творческих актах по Теории Чисел? Метод живой, не исчерпанный личными достижениями самого Fermat, но утраченный уже для его современ- ников, и тем более для потомков? Я не колеблюсь для самого себя отвечать утвердительным „ДА“, хотя вполне понимаю формальную позицию тех, кто отвечает отрицательным „НЕТ“. <...> Те казавшиеся раньше невероятными открытия в истории наук, которые делаются сейчас, достаточно поучительны и совершенно наглядно говорят о том, что научные факты не только приобретаются, но и утрачиваются. Дабы не быть тривиальным, я упомяну только об утраченном методе Frenicle’n распознавания простоты или непростоты числа в 40-50 знаков в течение 2-х суток. <...> Метод Frenicle’x утерян по вине автора, утратившего интерес к „числам11 и ушедшего в духовное звание*. 9.2. Дивизоры Куммера Доказательство Эйлером теоремы Ферма для п = 3, раздел 6.3, служит естественным источником обобщения. Схематично идея выглядит так. Если ( обозначает первообразный корень п-й степени из 1, — п > 2 можно считать простым, — то хп+уп = zn равносильно уравнению П(ж+^)= 2;П’ к=0 £ _ e'L-ri/n (9-4) В частной переписке.
174 Глас.-, 9. От Ферма до Уайлса каковое можно рассматривать в кольце Z(£) чисел ао + + • • • + ап-\СП '> (9-5) в котором все сомножители в (9.4) взаимно просты — и будь в Z(£) выполнена теорема о единственности разложения чисел (9.5) на простые сомножители, — все х + Ску в силу (9.4) были бы n-ми степенями, что, отчасти громоздко, но без незаурядных трюков, приводило бы к противоречию. Возникающее на этом пути препятствие заключается в том, что теорема о единственности разложения на простые сомножи- тели в Z(£) не всегда работает. В рамках современной алгебраиче- ской парадигмы напрашивается мысль: так расширить Z(0, чтобы не нарушить взаимной простоты сомножителей (9.4), но при этом восстановить единственность разложения на простые сомножи- тели. Идею реализовал Куммер5\ добавив к Z(£) идеальные числа, так называемые (теперь) дивизоры. Конечно, скоро сказка сказывается... Теория дивизоров — отдельная глава, о которой можно либо иметь отдаленное пред- ставление, либо уж погружаться с головой. Всякая середина тут обременительна при отсутствии результата. 9.3. Эллиптические кривые Теорему Ферма естественно рассматривать в контексте общей про- блематики разрешимости диофантовых уравнений. В то же время специфика Хп + Yn = Zn после деления уравнения на Zn приводит его к виду хп + уп = \ (9.6) 5) Наступивший поначалу на те же грабли, что и Эйлер, а потом Ламе.
9.3. Эллиптические кривые 175 с рациональными х = X/Z, у = Y/Z, что сводит исходную проблему к вопросу о рациональной разрешимости (9.6) 6 7\ Конечно, переход к (9.6) напоминает старый анекдот о теле? грамме в Академию наук: «Доказал теорему Ферма тчк Главная идея — переносим Zn левую часть тчк». Тут вырисовывается нечто похожее. Какая разница, казалось бы, рассматривать «эк- Бивалентные» вопросы о рациональной разрешимости (9.6) либо о целочисленной — Xn + Yn = Zn. Как говорится, что в лоб что по лбу. Тем не менее, другой язык расширяет возможности. Выгоды появляются уже в простейшем случае п = 2. Пифагоровы тройки типа (3, 4, 5) давно известны, но как перечислить все решения X1 + Y2 = Z2?. Диофант в своей «Арифметике» исчерпал задачу: Любая простейшая пифагорова тройка имеет вид т2 - п2, 2тп, т2 + п2, (9.7) где т и п — два взаимно простых целых положительных числа, разность которых т — п положительна и нечетна. На современном координатно-гео- метрическом языке обоснование Дио- фанта выглядит следующим образом. Рациональные решения (9.6) — суть рациональные точки Р — (х, у), лежа- щие на окружности ж2 + */2 = 1, (9.8) и все эти точки Р можно получить в ре- зультате пересечения с окружностью (9.8) прямых I = {(х, у) : у = ах - 1}, б) С точностью до очевидных оговорок. Если Хп +Yn = Zn имеет решение X, Y, Z е N, то и kX, kY, kZ при любом k G N будет решением. Поэтому достаточно говорить о решениях при условии НОД (X, Y, Z) — 1. Соответственно, в (9.6) подразумеваются х,у 0. Все это уточнять каждый раз не только утомительно, но и вредно, ибо загрязняется картина. 7) Пифагорову тройку (а, 6, с) называют простейшей при условии НОД (а, 6, с) = 1.
176 Глава 9. От Ферма до Уайлса имеющих рациональные коэффициенты наклона а. Подставляя у = ax — 1 в (9.8), получаем Полагая далее а — —, приходим к пифагоровым тройкам (9.7). m Мы не останавливаемся на деталях, поскольку все расставля- ется по местам простыми уточнениями. Диофанту обоснование далось с гораздо большим трудом, ибо в то время координатная связь алгебры с геометрией еще не была придумана, и вместо пря- мых и коэффициентов наклона приходилось говорить о «взятых с потолка» заменах переменных 8\ Здесь же (в рамках декартовой идеологии) переход от целочисленной задачи к рациональной подключает новые категории мышления, позволяющие комфорт- но и надежно решать задачу. Общая задача о рациональной разрешимости уравнения у) = ^2 а^У3 = 0 (9-9) *4 с целочисленными коэффициентами a,ij, — охватывающая (9.6), — обладает уникальными и весьма неожиданными свойствами. Особую, и даже главенствующую роль в семействе (9.9) — играют эллиптические кривые^, описываемые в канонической форме уравнениями вида ?/2 = ж3 + а®2 +/?® + 7, (9.10) к каковым сводится описание любых неособых кривых G(u, и) = 0 8) При этом не вполне ясно оставалось, исчерпаны ли все решения. Степенью монома х’у^ называют сумму показателей г + а степенью полинома (9.9) — максимальную степень монома, входящего в сумму. '°' Название, создающее дискомфорт беспричинности, инициировано связью с эллип- тическими интегралами и функциями, возникшими первоначально в задаче измерения дуги эллипса. Связь с первоисточником впоследствии сошла на нет.
9.3. Эллиптические кривые 177 третьей степени — с помощью замен переменных, выражаемых рациональными функциями. Неособыми считаются кривые, не имеющие особых точек (возврата, само- пересечения), и в описании F(x, у) = 0 которых — многочлен F(x, у) не распа- дается в произведение двух других многочленов меньших степеней. Уточнения и детали есть, например, в [13, 15]. Соответствующие кривые в плоскости (ж, у) выглядят приблизительно так: Приятная неожиданность в связи с эллиптическими кривы- ми заключается в следующем. Если прямая L пересекает график (9.10) С в двух рациональных точках (ж,, у\), (®2,Z/2),TO и третья точка пересечения (жз, 2/з), коли таковая имеется, также рацио- нальна, т. е. рациональны обе координаты, и это позволяет — с учетом вертикальной симметрии кривых С — «размножать» рациональные решения уравнения (9.10). Для этого через рациональные точки Р и Q проводится пря- мая, пересекающая С в точке S, затем S зеркально отражается
178 Глава 9. От Ферма до Уайлса относительно оси х, порождая точку S', после чего новую ра- циональную точку дает тот же трюк с точками Р и S , и т. д. Операция получения S' по точкам Р и Q, S' = P*Q, называется «сложением» Р и Q с помощью (9.10). Интересно, что рациональные точки на эллиптической кривой по такой операции образуют некую группу G11 12. «Сложение» Р и Р опреде- ляется с помощью касательной в точке Р, которая указанным выше образом дает точку S' = 2Р = Р * Р. Тем самым определяется точка кР при любом к G N. Вертикальные касательные и секущие «пересекают» С, так полагают, в бесконечно удаленной точке е, которая, будучи так определенной, является единицей |2* группы G*. Детали (рациональность P*Q при рациональных Р и Q, существование обратных элементов, ассоциативность операции «*») требуют обоснования, но достигаются средствами школьной математики. Все это при беглом изложении производит впечатление рути- ны, тем не менее, феномен выдающийся. Кривые (9.10) третьей степени вдруг нежданно-негаданно определяют группу, приводя все рациональные решения (9.10) во взаимодействие между собой. Устройство G11 тоже до некоторой степени удивительно. Отправ- ляясь от точки Р и выстраивая ряд Р, 2Р, ЗР,... , (9.11) Н) Пополненные бесконечно удаленной точкой, являющейся, декларативно, точкой пересечения всех вертикальных прямых. 12) Либо нулем, если используется аддитивная терминология.
9.3. Эллиптические кривые 179 можно столкнуться с двумя возможностями. Либо ряд (9.11) на некотором шаге п обрывается 13\ оказывается пР =- е, либо — не обрывается, но гарантии исчерпания последовательностью (9.11) всех рациональных точек на кривой, конечно, нет14\ От- правляясь от другой точки Q, можно получить совокупность Q, 2Q, 3Q,..., отличную от (9.11). Пуанкаре (1901) предполагал, что группа G" любой эллипти- ческой кривой имеет конечный ранг. Иначе говоря: 9.3.1. На любой кривой (9.10) имеется конечное число рациональных точек ,РГ, таких что любая рациональная точка Р на этой кривой представима в виде Р = TtiPi + ... 4- nrPr + Т, где Т — точка конечного порядка. Факт доказан (1922) и называется теоремой Морделла. До 1976' года не ясно было, какова может быть группа кручения Т, состо- ящая из точек конечного порядка. Проблему решил Мазур. 9.3.2. Теорема Мазура. Конечный порядок п точки Т всегда лежит в диапазоне п 12, причем п 11, и на кривой (9.10) не может быть более 16 рациональных точек конечного порядка. Результат, вообще говоря, потрясающий, и отдает глубиной, как все трудно извлекаемое и не совсем понятное. Загадочность эллиптических кривых подчеркивает следующий феномен. 9.3.3. Число рациональных точек на любой неособой кривой (9.9) порядка га > 3 — конечно. (!) То есть эллиптические кривые (п = 3) принципиально вы- деляются на общем фоне кривых n-й степени, что по большому |3) В этом случае говорят, что точка Р имеет конечный порядок. Порядком Р называют минимальное п в равенстве пР = е. 14) Хотя не исключено.
180 Глава 9. Or Ферма до Уайлса счету удивительно и даже сверхъестественно. Утверждение 9.3.3 родилось сначала как гипотеза Морделла (1931), теперь это тео- рема Фальтингса (1983). Конечно, насчет сверхъестественности п. 9.3.3 сильно сказа- но. Размышление над проблемой обнаруживает эвристику, «при- близительно ведущую к цели», иначе Морделлу не удалось бы нащупать гипотезу. Определенная часть удивления по поводу п. 9.3.3 исчезает с учетом рассмотрения только неособых кривых. Если бы, например, многочлен F(x, у) распадался в произведение Fi(x,y)F2(x,y), где Fi(x, у) = 0 определяло бы подходящую эллиптическую кри- вую, то рациональных точек на (9.9) было бы сколько угодно. 9.4. Гипотеза Таниямы и теорема Ферма Гипотеза Таниямы, доказанная Уайлсом, заключается в утвержде- нии «всякая эллиптическая кривая является модулярной». О модулярности сказано ниже, но в данном контексте это даже не так важно, поскольку формальные определения тут мало что добавляют к пониманию происходящего. Просто костыль мо- дулярных форм оказался удобен на пути к доказательству теоремы Ферма. Неожиданно вдруг выяснилось, что эллиптическая кривая у1 = ж3 + (апЬп - апсп - Ьпсп)х + апЬпсп (9.12) при условии ап + Ьп = сп не может быть модулярной вопреки гипотезе Таниямы. Выяснилось, конечно, не сразу все. Сначала Танияма (1955) выдвинул свою сумасшедшую гипотезу, в которую трудно было поверить, — причем к теореме Ферма это не имело никакого отношения на тот момент. «Гипотеза» пролежала в безвестности около 20 лет и лишь с середины 70-х годов прошлого века стала обретать большее правдоподобие благодаря работам Шимуры.
9.4. Гипотеза Таниямы и теорема Ферма 181 Затем Г. Фрей пришел к мысли (1985) о немодулярности кривой (9.12) в случае „П . >П П a + о = с , тем самым связав ниточкой теорему Ферма с гипотезой Таниямы. Чуть позже К. Рибет обратил эту связь в теорему, после чего ста- ло ясно, что обоснование «гипотезы» автоматически доказывает теорему Ферма. И тут настала очередь Уайлса, восемь лет фактически тайно занимавшегося обоснованием гипотезы Таниямы, и в 1993 го- ду объявившего о получении соответствующего доказательства. Не обошлось без драматического поворота. В доказательстве бук- вально накануне публикации обнаружилась брешь, на заделку которой (совместно с Тейлором) ушел еще год. Окончательный вариант доказательства был опубликован в 1995 году, и часть на- селения потеряла опору в жизни, ибо наличие крупных нерешен- ных задач, как выясняется, играет важную роль в устойчивости психики. Теперь несколько слов о модулярности. Модулярной группой Г называют группу дробно-линейных преобразований y(z), Функции, тем или иным образом ассоциированные с Г, также называют моду- лярными. В этом формате получают свое определение модулярные эллиптические кривые [13], сыгравшие окаянную роль в судьбе Таниямы'^. В рамках соответ- ствующего определения к модулярной эллиптической кривой предъявляются весьма жесткие требования, и всем априори казалось (не считая Таниямы), что автоматически выполняться они никак не могут. В этом, собственно, и заклю- чался накал драматургии. |5> Танияма, видимо, прикоснулся к «запретным плодам», в результате чего покончил с собой, не дожив до триумфа своего предвидения. В предсмертном письме он писал: «Что касается причины самоубийства, то она не вполне понятна мне самому, и во всяком случае не является результатом чего-нибудь конкретного. Могу лишь сказать, что нахожусь в таком умонастроении, что утратил всякую уверенность в моем будущем». И далее: «...я не могу отрицать того, что мой поступок отдает предательством, но прошу отнестись к нему снисходительно, как к последнему поступку, который я совершаю по своей воле». Через месяц покончила с собой его невеста.
182 Глава 9. От Ферма до Уайлса 9.5. Конгруэнтные числа Если говорить о взбудораженной выше тематике, то интерес здесь представляют не только и не столько втекающие потоки, сколько уходящие кругами по воде «за пределы». Эллиптические кривые заслуживают внимания не только из-за соприкосновения с тео- ремой Ферма. Тут возникает резонанс с широким кругом явлений. Чудесные феномены оказываются разбросаны здесь и там. Взять хотя бы конгруэнтные числа, известные еще древним грекам. 9.5.1. Определение. Рациональное число г называется конгру- энтным, если существует прямоугольный треугольник площади г с рациональными длинами сторон. В качестве конгруэнтных достаточно рассматривать целые г, сво- бодные от квадратов 16\ Явление конгруэнтности, как ни странно, оказывается тесно связанным с весьма глубокими фактами и ги- потезами теории чисел. 9.5.2. Число г конгруэнтно в томм случае, когда на эллиптической кривой 2 3 2 у = X -г X существует рациональная точка бесконечного порядка. Факт 9.5.2 довольно простой, хотя и сюрприз. Однако алго- ритмически проблему конгруэнтности это не решает. Описание (9.7) пифагоровых троек позволяет алгоритмически перечислить все конгруэнтные числа, но появления г при таком перечислении можно ждать сколь угодно долго. Поэтому существование решающего алгоритма остается под вопросом, хотя есть серьезная кандидатура: 9.5.3. Критерий Таннела. Нечетное п 6 N, свободное от квадра- тов, конгруэнтно в томм случае, когда уравнение п = 2х2 + у2 + 32г2 !6' Если г 6 Q конгруэнтно, и х, у — катеты соответствующего треугольника, то треугольник с катетами С,х, (у имеет площадь £2г. При этом ( всегда можно выбрать так, чтобы (2г было целым, свободным от квадратов.
9.5.' Конгруэнтные числа 183 имеет ровно вдвое меньше целочисленных решений, нежели уравнение п = 2х2 + у2 + 8г2. А четное п G N, свободное от квадратов, конгруэнтно в томм случае, когда уравнение - = 4ж2 + у2 + 32? имеет ровно вдвое меньше целочисленных решений, нежели уравнение о о э — = 4х 4~ у + 82 . Поскольку все решения перечисленных уравнений определяются пере- бором, критерий 9.5.3 в принципе может служить решающим алгоритмом, но пока остается лишь «почти доказанным». Если п конгруэнтно, утверждения о решениях перечисленных уравнений гарантированно выполнены. В обратном направлении рецепт 9.5.3 упирается в гипотезу Бёрча—Свиннертон-Дайера>7\ согласно которой ранг эллиптической кривой совпадает с кратностью нуля 2 = 1 так называемого Д-ряда этой кривой, см. [15]. На конгруэнтные числа интересно, конечно, посмотреть. Первое по счету 3 20 конгруэнтное п € N равно 5. Площадь 5 имеет треугольник с катетами -, —. Пифагорова тройка (3, 4, 5) определяет треугольник с площадью ? 3 • 4 = 6. 2 Дальнейшие вычисления довольно быстро приводят к астрономическим выклад- кам. Скажем, число 157 оказывается конгруэнтным, но подходящий треугольник имеет [13] весьма «громоздкие катеты»: 6 803 298 487 826435 051 217 540 411 340 519 227 716 149 383 203 ° “ 411 340 519 227 716 149 383 203 ’ “ 2 166 655 569 371 461 309 610 ’ 17) Одна из семи проблем тысячелетия, за решение которой Математический институт Клея учредил (2001) премию в миллион долларов.
Глава 10 Определения и результаты Все течет не туда, Если жаждешь чего-то до боли, Все течет поперек Ожиданьям наивнейших грез. Не нырнет поплавок, Если взглядом его ты неволишь, Не отступит беда, Не дождавшись отсутствия слез. Глава занимает промежуточное положение между оглавлением и собственно содержани- ем, содействуя решению нескольких задач. Во- первых, нумерация опорных точек (определе- ний и теорем) совпадает с исходной, благода- ря чему легче найти соответствующий резуль- тат в основном тексте. Во-вторых, достаточно быстро можно получить хотя бы отдаленное представление о предыдущих главах. В-третьих, некоторые принципиальные факты извлекают- ся на свет в чистом виде. 10.1. Простые и составные числа / 2.2.1. Число р G N, р 1, называют простым, если оно имеет только два делителя: 1 и р. Остальные п 6 N, п / 1, называют составными числами. •/ 2.2.2. Теорема Евклида. Простых чисел бесконечно много. J Для составления таблицы простых чисел, не превосходящих данного N, может быть использовано решето Эратосфена. Рецепт заключается в вычеркива- нии из ряда {,2,...,N
10.1. Простые и составные числа 185 сначала всех чисел кратных двум, кроме самой двойки, затем — трем, кроме тройки, затем — пяти, кроме самой пятерки, и т. п. По завершению процесса невычеркнутыми остаются все простые числа меньшие N. / Много усилий потрачено на «полумеры», обеспечивающие эффективную генерацию рг достаточно больших порядковых номеров. Наиболее популярны до сих пор числа Мерсенна'. р = 2*-1. Если к в р = 2/" — 1 составное, к = тп, то р делится на 2т — 1. Поэтому р = 2* — 1, как гипотетический источник простых чисел, может иметь смысл только лишь в случае простых к, что гарантией простоты р все равно не является. •/ 1.3.1. По любым двум последовательностям цифр а\,...,ап и Ъ\,..., ... ,Ьт, при условии Ът € {1, 3, 7, 9}, всегда можно указать простое число с деся- тичной записью а>\ ... ап .. .by ... Ът, т. е. существуют простые числа, десятичная запись которых начинается и закант чивается любыми наперед заданными последовательностями цифр, за исключением последней, Ът ^{2, 4, 5, 6, 8}. / 1.3.2. Теорема Эйлера. Сумма 111 1 — —----1----F • • • 4-1- • • Р Р\ Р2 Рг и произведение JJ(1 - 1/р)-1 — расходятся. pGP / 2.3.1. Теорема. Всякое п g N однозначно разлагается в произведение простых сомножителей, с точностью до их порядка: „ Л1 Of) Oil. п=Р: Р2 -"Рь , что называют каноническим разложением п. j 2.3.2. Если произведение делится на простое р, то хотя бы один из со- множителей делится на р. Ф Существуют сколь угодно длинные последовательности п, п + 1, п + 2,..., п + т, не содержащие простых чисел. Например, к\ + 2, к\ + 3,..., fc! + к.
186 Глава 10. Определения и результаты 10.2. Теория делимости / 2.1.1. Наибольшим общим делителем (НОД) целых а,Ъ,..., s EZ называется наибольшее положительное число d = (a,b,..., s), делящее нацело каждое из а, Ъ,... , s G Z. / Поиск НОД (а, &) обеспечивает алгоритм Евклида, работающий в пред- положении а > Ъ следующим образом. Сначала а делится на Ь: а = bqt + г2, после чего Ь делится на г2: b = r2q2 + r3. Далее остаток г2 делится на г3, — и так до остановки итерационного процесса, которая неизбежна, ибо остаток на каждом шаге строго уменьшается. В целом процесс имеет вид: 'а = bq{ + т2, Ъ =r2q2+r}, r2 =r3q3+r4, < Тп-2 ~ Тп-Дп-i 4" Тп, L тп-\ Tnqn, неизбежно приводя к результату rn+i = 0 при некотором п, НОД (а, Ъ) = гп. У Наибольший общий делитель более двух чисел, НОД (а,,..., ап), сводится к определению НОД пар чисел: (й|, йз) ^2» (d2, а3) — d3,... (dn-i, ап) — dn, что дает искомый результат, НОД (аь..., а„) = dn. / 2.1.2. Теорема. Всегда можно указать такие u,v Е Z, что au + bv = НОД (а, Ь). . Иначе говоря, НОД (а, &) линейно выражается через а и b с помощью коэффици- ентов u,v Е Z.
10.3. Арифметические функции 187 / 2.1.4. НОД (а, Ь) равен минимальному положительному d g N в пред- ставлении d = au + bv, u,v € Z. •A 2.1.5. В случае (a,b) = 1 числа a и b называют взаимно простыми. Из теоремы 2.1.2 вытекает, что а и Ъ взаимно просты в томм случае, когда можно подобрать такие и, v, что аи + bv = 1. / 2.1.6. Наименьшим общим кратным'^ (НОК) целых а,Ь,..., s g Z называется наименьшее положительное число ' т — [а, Ь,..., s], делящееся нацело на каждое а,Ь,..., s g Z. 10.3. Арифметические функции / Целая часть [ж] числа х g R определяется как ближайшее слева целое. Например, [5] = 5; [3,2] =3; [-2,7] =-3. Той же цели служит обозначение [ж] = [®]. В противовес [ж] используется округление до ближайшего целого справа'. Г®1 = [ж] + 1. Дробную часть обозначают фигурные скобки', {ж} — х — [®]. ' {5} = 0; {3,2} = 0,2; {-2,7} =0,3. / 2.4.1. Показатель, с которым простое р входит в разложение числа п! на простые сомножители, равен где р* — наибольшая целая степень р, не превосходящая п, т.е. logn logp Число а считается кратным Ь, если оно делится на Ь. В этом случае также пишут: b | а — «& делит а», т. е. а делится нацело на Ь.
188 Глава 10. Определения и результаты / 2.4.2. В случае иррационального а последовательность хк = {ак} всюду плотна на [0,1]. Равносильно: для произвольного a G R и любых х < у всегда можно указать целые тип, такие что х < та — п < у (теорема Кронекера). У Мультипликативные функции 0(х), заданные на N, определяются условием 0(ху) = 9(х)9(у), с исключением варианта 0(х) = 0. / 2.5.1. Если х = р“'р“2 ...р£‘ — каноническое разложение числа х, а 0(х) — мультипликативная функция, то Е 0(d) = (1 + 0(р.) + ... + 0(ра{')) ... (1 + 0(рк) +... + 0(р?)), d]x где суммирование слева идет по всем делителям числа х. У В частном случае 0(х) = х‘ из п. 2.5.1 следует Е — 0 +pi + ••• +р?|Л) • • • 0 +р1 + ••• +р**л)> d\x что при в = 0 дает число делителей г(х), а при в = 1 — сумму делителей S(x) числа х. У 2.5.3. Произвольная мультипликативная функция может быть задана определением 0(ра) для всех простых р и всех натуральных а, и продолжением 0 на остальные x=pa:'PE--Plk в соответствии с правилом в(ра1'...рГ)^е(рГ)...о(рП У Функция Мёбиуса р(х) на числах х € N, имеющих каноническое разло- жение Х=Р\Р2 Рк, определяется равной р(х) = (—1)(, где t > 1 число простых сомножителей в разложении. На остальных х € N функция р(х) полагается равной нулю. В случае х = 1 считаем t = 0 р(1) = 1.
10.4. Сравнения и вычеты 189 / 2.6.1. Для любой мультипликативной функции 0(х) выполняется соот- ношение Е = (1 - 0(р]))... (1 - 0(рк)), d\x где суммирование идет по всем делителям числа х = р,''р?2 ... pkk. В частности, Е = °> d|s / Формула обращения Мёбиуса’. гм = Е d\x d\x •/ Наиболее известна среди мультипликативных арифметических функций функция Эйлера, измеряющая количество чисел в ряду 0, 1,..., х — 1, взаимно простых с х. Формула Эйлера: 1 1------ Рк •/ Другие свойства: »>(г) = *Е^’ Е^)=ж- d|a: dfx 10.4. Сравнения и вычеты / 'Если числа а и Ь при делении на т дают одинаковые остатки, то говорят, что а и Ь сравнимы по модулю т, и пишут а = Ь (modm), что равносильно 3 k € Z : а = тк + 6.
190 Глава 10. Определения и результаты Обозначение a = b (mod m) излишне громоздко, но укоренилось. Мы используем более экономный его эквивалент пг а = ь, 5 : = 20, 22 = -12. / т г. а, = о ч_ пг ч пг л Ь = а, а — Ъ — 0, т 1 1 пг а = о, о = с пг а = с, ттг 1 пг , а = Ь, с — d а + с = b + d,- пг 1 m 1 а — о, с = d а-с ™b-d, а + о = с пг ч а = с~ Ь, пг , а — Ъ „fc m чк а = b , пг ч а — Ъ а, + с — b -j- с, пг ч а = о пг ч а - с = Ь' с. •У 2.7.1. Обе части сравнения а = Ъ можно разделить на их общий делитель, если последний взаимно прост с т. 2.7.2. Обе части сравнения а = Ь и модуль т можно умножить на одно и то же число, а также разделить.на любой их общий делитель. 2.7.3. Если а = Ь, а = Ь, то а = Ь, где s = НОК[т, п]. 2.7.4. Если а = Ь и т = kd, то а = Ь. 2.7.5. Если а = Ь и НОД (а, т) = d > 1, то Ь кратно d. У 2.7.6. Теорема. Если P(xlt..., хп) получается из полинома с целыми коэффициентами Р(х},..., хп) = ^2 °*..• • ’ (10л) заменой в (10.1) коэффициентов и переменных другими, сравнимыми с прежними по модулю т, то Р(Ж|,... ,ж„) =P(Xi,...,Xn). У Отношение эквивалентности «по модулю т» разбивает Z на классы сравнимых между собой чисел, на классы вычетов'. (а)т = {х:х = а + кт, к € Z}.
10.4. Сравнения и вычеты 191 В общем случае 7L разбивается на т классов вычетов. Любые т представителей по одному из каждого класса называются в совокупности полной системой вычетов по модулю т. В качестве «полной системы вычетов» обычно используют 0, 1,..., т — 1. / 2.9.1. Любые т чисел, попарно несравнимые по модулю т, образуют полную систему вычетов. У 2.9.2. Если НОД (а, т) = 1 их пробегает полную систему вычетов по модулю т, то ах \- b при любом & € Z также пробегает полную систему вычетов по модулю т. У Особую роль играют те классы, в которых НОД (х, т) = 1. Любые тп представителей по одному из каждого такого класса называются приведенной системой вычетов по модулю т. / Уравнение т 1. ах = о гарантированно имеет решение х при любом Ь, если а — элемент приведенной системы П. В частности, у любого а € П есть обратный элемент по умножению, а - а = 1, — и решением ах = о является т -| , х = а -о, т.е. х получается как бы делением на а, для чего в обычном понимании а должно быть ненулевым. В срезе «арифметики по модулю» эквивалентом понятия «не равно нулю» оказывается «взаимно просто с модулем». У 2.9.4. Любые <р(т) чисел, попарно несравнимые по модулю т и взаимно простые с т, образуют приведенную систему вычетов. У 2.9.5. Если НОД (а, т) = 1 и х пробегает приведенную систему вычетов по модулю т,то ах также пробегает приведенную систему вычетов по модулю т. У 2.10.1. Теорема Эйлера. В случае НОД (a, m) = 1, т > 1: 0»>(m) m j / 2.10.2. Малая теорема Ферма. В случае простого р > 1 и НОД (а,р) = 1: ар~' *= 1.
192 Глава 10. Определения и результаты 10.5. Алгебра и теория чисел / Полную систему вычетов естественно интерпретировать как аддитив- ную группу Ът вычетов по модулю m с элементами 0, 1,2,... ,m-1 (10.2) и групповым произведением, равным остатку от деления обычной суммы а + b на т. Единицей группы служит нуль. / При переводе полной системы вычетов в лоно теории групп есть соблазн использовать в качестве групповой операции остаток от деления обыч- ного произведения ab на т. Но здесь возникают препятствия. Во-первых, нуль в (10.2) необратим, поэтому совокупность 0, 1, 2,..., т -1 приходится сокра- щать до 1,2,..., т-1. (10.3) Во-вторых, не годятся составные модули, ибо тогда не все элементы (10.3) имеют обратные. / В аддитивной группе Z„ вычетов по модулю т помимо сложения вводится умножение а • Ь, равное остатку от деления обычного произведения а и Ъ на т. Тогда класс вычетов по модулю т образует кольцо Zm, которое в случае простого т является полем. Если т составное, то Zm будет кольцом, имеющим делители нуля (3 • 2 = 0 в Z6), но не полем. Так или иначе, в результате такого обрамления к теории чисел подключается аппарат общей алгебры. И как всегда, более общая точка зрения позволяет видеть причины и закономерности, находящиеся «на другом этаже». Таким образом, кольцо вычетов Zm представляет собой множество (10.2), на котором заданы сложение и умножение по модулю, а + Ь (mod тп), a-&(modm). Множество {0, 1, 2,..., т - 1}, с операцией сложения a + & (niodm) образует аддитивную группу Z„ кольца Zm. А совокупность (10.2) по умножению а-Ь (modm) группой не является. Но элементы (10.2), имеющие обратные по умножению, уже образуют группу, которая называется мультипликативной группой Z^ кольца Ега. В группу Z)), входят те и только те элементы кольца a £ Z,„, которые взаимно просты с т, т. е. Zi) — это приведенная группа вычетов. •/ Повышенное внимание к группам Zp, объясняется тем, что Z^ и случае разложения т = рк' ...pkl на простые множители — есть прямое произведение групп Z£. (т, = р^), каковые оказываются «структурными блоками». Все группы Z* циклические за исключением Z*4, к 3. Порядок группы Z.^ равен значению <р(т') функции Эйлера р.
10.6. Первообразные корни 193 10.6. Первообразные корни / 4.1.1. Определение. Целое ( называется примитивным корнем по про- стому модулю р (примитивные корни называют также — первообразными), если С, порождает группу Zpx = {l,...,p-1}, (Ю.4) т. е. все элементы (10.4) оказываются степенями (к, Ю = к1№,--.,Г1} = ^. / Выгоды существования примитивного корня очевидны. Группа Z* оказывается циклической, все ее элементы 1,...,р— 1 исчерпываются степе- нями (*. Поэтому, например, умножение а • Ъ в Z* сводится к сложению показателей у сомножителей а = , b = С,3, что облегчает доказательства, и обеспечивает некоторую прозрачность. / В общем случае (не обязательно простого модуля) понятие примитив- ного корня приобретает более общую форму: 4.1.2. Определение. Целое Q называется примитивным корнем по модулю т, если 2L , и £* -4 j при ]. < ip(m). В случае составного модуля примитивные элементы существовать не обя- заны, но иногда существуют, только для модулей т вида т = 4,ра, 2ра, где р > 2 —- простое число. / 4.2.1. Теорема. В случае простого р в группе (Ю.4) существуют прими- тивные корни, число которых равно р(р — 1). / 4.3.1. Из примитивного корня Q по простому модулю р> 2 легко сделать примитивный корень £ по модулю ра при любом а > 1. Для этого достаточно в классе вычетов (()р выбрать любой элемент £ = ( + зр так, чтобы — 1, безусловно делящееся на р, не делилось на р2, т. е. чтобы к в -1=кр не делилось на р. j 4.3.5. Если $ примитивный корень по модулю ра (а 1, простое р > 2), — нечетное из чисел £ и £+ ра является примитивным корнем .по модулю 2ра.
194 Глава 10. Определения и результаты •У 4.3.6. Примитивные корни по модулям р = 2° при а 3 не существуют. 43.1. Примитивные корни по модулю п существуют в томм случае, когда п = 2, 4,ра, 2ра, простое р > 2. 10.7. «Арифметика» многочленов / Многочленом, или полиномом, над полем К называется формальное выражение fn(x) = апхп + ап_ххп~' + ... + ахх + а0, (10.5) где а0,..., ап € К. Сумма и произведение многочленов определяются по обыч- ным правилам сложения и умножения, что порождает кольцо многочленов К[ж| (К[ж] — кольцо многочленов всех степеней с действительными коэффициен- тами, <0>[ж] — с рациональными). Переменная х может принадлежать тому же или другому полю, но может оставаться просто символом. / Полиномиальный аналог числовой теории делимости расширяет гори- зонты представлений о математике. Если многочлены f(x), р(х), ф(х) связаны соотношением /(ж) = р(х)ф(х), то ^(ж) и р(х) считаются делителями /(ж). Наибольшим общим делителем (НОД) многочленов /(ж) и д(х) называется такой их общий делитель d(a:) = (/(ж),5(ж)), который делится на все другие общие делители многочленов /(ж) и д(х). При договоренности о равенстве единице «старших» коэффициентов рас- сматриваемых многочленов — НОД, с точностью до ±, определяется одно- значно. В случае d = (/, д) = 1 многочлены /(ж) и д(х) называют взаимно простыми. НОД (/, д) определяется алгоритмом Евклида, который по структуре ничем не отличается от теоретико-числового. / 6.2.1. Всегда можно указать такие многочлены и(х), v(x), что /(ж)и(ж) + <?(ж)и(ж) = d(x), d = (/, g), т. е. НОД (/, д) «линейно» выражается через fug. В частности, многочлены f(x) и д(х) взаимно просты в томм случае, когда можно подобрать такие и(х) и v(x), что f(x)u(x) +g(x)v(x) = 1. / Аналогом простых чисел служат неприводимые многочлены. Полином /„(ж) называют приводимым над К, если он раскладывается в произведение двух многочленов ненулевой степени.
10.8. Расширения полей 195 Многочлен ж2 + 1 приводим в С, х2 + 1 = (ж - г)(ж + г), но неприводим в R. А полином х2 - 2 = (ж - х/2)(ж + х/2) приводим в R, но неприводим в Q. , Приводимость многочлена не связана с существованием корней. Много- член ж4 + 4ж2 + 3 = (ж2 4- 1)(ж2 + 3) приводим в поле рациональных чисел, но не имеет в Q ни одного корня. / 6.2.2. Лемма Гаусса. В Z[x] НОД (fg) = НОД(/) НОД(д). / 6.2.3. Многочлен (10.-5) с целыми коэффициентами неприводим над Q в томм случае,' когда он не раскладывается в произведение двух многочленов ненулевой степени с коэффициентами из Z. / 6.2.4. Критерий Эйзенштейна. Многочлен (10.5), все коэффициенты которого — кроме ап — делятся на некоторое простое число р, но а0 не делится на р2, — неприводим над полем рациональных чисел. Е 6.2.5. Если не различать многочлены, получающиеся друг из друга умно- жением на ненулевую константу из поля К, то всякий многочлен f G К[ж] единственным образом разлагается в произведение неприводимых множителей. 10.8. Расширения полей Различные числовые поля рассматриваются в [5, т. 8] и здесь в разделах 6.3, 6.4. Тема важна не столько отдельными результатами, сколько самим подходом-. / Множество Z можно воспринимать как расширение натурального ряда N с целью операцию сложения сделать обратимой. Аналогичный трюк с умножением приводит к разрастанию Z до поля Q рациональных чисел, ко- торое далее можно расширить до R или С, и тогда «все действия выполняются и все уравнения решаются». Однако разрешимость всех полиномиальных урав- нений в С с точки зрения некоторых задач — серьезный недостаток, поскольку в промежуточных полях по разрешимости уравнений можно судить о разреши- мости числовых задач. Поэтому расширять Q желательно с умом, не прыгая сразу в С. / Тематика многогранна, и, как и вся общая алгебра, плохо укладывается в голове. Поэтому знакомиться с ней лучше не по стенографическим заметкам. Полезно ознакомиться с упоминаемым в разделе 6.3 примером использования Эйлером чисел вида а + Ьу/^-З. См. также раздел 9.2 о дивизорах.
196 Глава 10. Определения и результаты 10.9. Теория р-адических чисел / Поле Q, р-адических чисел введено Гензелем для изучения полиноми- альных сравнений f(x\,..., хп) == 0. / Неудобно, когда теория излагается без предварительной оценки ее роли и значения. Тут, конечно, легко ошибиться, и многое зависит, откуда смотреть. Классический учебник Виноградова [7] обходится вообще без упо- минания р-адических чисел, а в солидной монографии [3] они пронизывают содержание насквозь. Однако для новичка имеет смысл отметить, что пробле- матика достаточно специфична, чтобы браться за ее изучение при отсутствии профессионального интереса. Но надо иметь в виду, что это не фрагмент на от- шибе теории чисел, а один из магистральных путей. / Вкратце суть дела сводится к следующему. Для простого р и ненулевого х € Ъ вводится числовая характеристика ordp х, равная кратности вхождения р в разложение х на простые множители, и ordp 0 = оо для любого р. Для рациональных х = а/Ь а ordp -.= ordp а - ordp Ь. Далее на множестве Q рациональных чисел определяется семейство норм: ЦжЦу =p"ordrI, если х £ 0, (10.6) и||0||р = 0. Если вдуматься, нормы (10.6) абсурдны. С обычной упорядоченностью не согласуются, все треугольники оказываются равнобедренными, а любая точка в круге — его центром. И все-таки.это нормы. Более того (теорема Островского): всякая нетривиальная норма на Q эквивалентна || • ||г для некоторого простого р либо р = оо. Поэтому других норм на Q нет. / Далее теория развивается путем классического анализа, пополняя множество рациональных чисел Q до полного пространства Qp, являющегося аналогом R. Об интуитивной противоестественности р-адических чисел коротко написано в разделе 6.5, со свойствами и результатами лучше знакомиться по специальной литературе, см. [3, И]. 10.10. Диофантовы уравнения / В диофантовых уравнениях спрятана вся математика, см. главу 5. / Диофантовыми называют полиномиальные уравнения вида
10.10. Диофантовы уравнения 197 где р(-) — полином с целыми коэффициентами — например, + 32, — решения тоже подразумеваются целыми. Часть переменных обычно выделяется в качестве параметров, и уравнение переписывается в виде р(а, х) = 0, т. е. p(a,xt,... ,хт) = 0, где параметр может быть векторным, а = {а,,..., ак}, причем все а„ X, € N = {1,2,...}. / 1.2.1. Множество А положительных векторов называется диофанто- вым, если при любом а € А и только при а € А уравнение р(а, х) = 0 разрешимо в целых положительных xt,... ,хт. Диофантовы функции определя- ются как функции, график которых диофантов. 1.2.2. Лемма. Множество А С Я диофантово в томм случае, ко- гда оно является множеством положительных значений некоторого полинома Р(ж1>... ,хк). Г 1.2.3. Теорема Матиясевича. Диофантовость множества равносильна его перечислимости. / Теорема Матиясевича представляет собой выдающийся результат, ре- шающий мимоходом 10-ю проблему Гильберта и показывающий, что язык диофантовых уравнений является универсальным алгоритмическим языком, та- ким же как машина Тьюринга. •А Из теоремы 1.2.3 вытекает, например, следующий результат. 1.2.4. Существует полином, множество положительных значений которого совпадает с множеством простых чисел, и такой полином может быть конструк- тивно указан. У Диофантовы множества удобно характеризовать также с помощью «разрешенных» операций арифметического языка 2>о = {+, х, —, 3 }, допускающего для конструирования высказываний четыре операции: сложе- ние +, умножение х, равенство = и декларацию существования 3 . / 1.2.5. Теорема. Множество является диофантовым в томм случае, когда оно описывается на языке Lo.
198 Глава 10. Определения и результаты •/ 5.3.1. Теорема. Существует полином Q(x), не имеющий корней в N, но факт V х € N : Q(x) ф 0 алгоритмически непроверяем. •/ 5.3.2. Множество полиномов, не имеющих положительных корней, — неперечислимо, тем более, неразрешимо. •/ Каков бы ни был полином P(zit..., z^) (любойразмерности), существует полином U(x\,..., х{.) фиксированной размерности k, множество положительных значений которого в точности совпадает с множеством положительных значений полинома P(z\,..., Zff) (раздел 5.2). 10.11. Диофантовы уравнения и вычеты / Наряду с диофантовым уравнением а„ • х + оя_ 1 • х -J-... -J- Oq ~ 0, (10.7) часто рассматривается уравнение оп • х + оя_[ • хп + ... + о0 — 0. (10.8) / В случае (10.7) из представления (оя • жп + Оя_| • х + ... + Oj)s = — о0 сразу ясно, что х должно быть делителем а0, и это сводит решение (10.7) к идеологически простому перебору. Что касается уравнений вида (10.8), то они также решаются ограниченным перебором, поскольку все коэффициенты в (10.8) можно заменить остатками от деления на т, и решение х искать среди 0, 1,..., т — 1 (теорема 2.7.6). Для полиномиальных «уравнений по модулю» с несколькими переменными ничего по сути не меняется. Переход к остаткам от деления на т сводит поиск решения опять-таки к ограниченному перебору. / 2.9.2. Теорема. Уравнение первой степени ах = Ь (10.9) в случае взаимно простых а и т — НОД (а, т) = 1 — имеет единственное решение (по модулю т) в любой полной системе вычетов. •/ 3.2.2. Теорема. Если НОД (а, т) = d > 1 и b не кратно d, урав- нение (10.9) неразрешимо. Если же b кратно d, то (10.9) имеет единственное решение в любой приведенной системе вычетов и d решений в любой полной системе вычетов (по модулю т).
10.12. Цепные дроби 199 / 3.4.1. Если т — т1т2, то полиномиальное сравнение /(ж) = 0, /(я) = ап • я" + а„_1 • я"-1 + ... + а0, выполняется в томм случае, когда выполняется каждое сравнение /(я) 0, /(я) =2 0. / О квадратичных вычетах, а также о символах Лежандра и Якоби лучше читать непосредственно в разделах 3.7, 3.8, — там и так коротко, а дальнейшее сокращение тут непродуктивно. / 3.10.1. Теорема Шевалле. Если полином /(Я|,..., яп) с нулевым свобод- ным членом имеет степень т, строго меньшую числа п переменных, то у сравнения f(x},...,xn) =0 при любом простом р существует ненулевое решение, в котором не все Xj =0. / 3.10.2. Любая квадратичная форма (с целочисленными коэффициентами) от п У 3 переменных вырождена по любому простому модулю р, т. е. всегда найдутся целые я,,..., хп (не все Xj = 0), такие что п У7 an%iXj — 0, п 3. ij=i / 3.11.1. Теорема. Уравнение п = я2 + у2 + и2 + v2 разрешимо в целых x,y,u,v 6 Z при любом n € N. 10.12. Цепные дроби / Цепные дроби — население не любит. Неудобный аппарат, громоздкий. И все же тут какие-то загадки из глубины выносятся на поверхность. / Цепной (или непрерывной) дробью называется выражение вида: 1 я = ?0 +---------------j---------, !, +------------j------ ft -----------j----- ft +----------- ft» + ' •
200 Глава 10. Определения и результаты где go € Z, а все остальные 6 N. Для обозначения пользуются также обозначением х = [<?о; <71, <7г, • ••]• / Разложение х в цепную дробь дает следующий рецепт. до — 1Ж1, ®о — ж ” <7о, d Если разложение рационального х = - сопоставить с алгоритмом Евклида (2.2), то легко убедиться, что в обозначениях (2.2) имеем а b=q' + 1 <?2 Н----------------------- 9з +--------------- <?4 Н------ 1 <7n-i Н----- Яп т. е. все q\,...,qn из (2.2), как говорится, в одном флаконе, что позволяет говорить о скелете цепной дроби как о ДНК обыкновенной. / Всякая цепная дробь порождает последовательность дробей, so = qo,sx = [g0; 9i], s2 = [?о! ?i, ®],«» = ko! 9i, «2, , 9»], •• •, называемых подходящими, которые, разумеется, могут быть преобразованы в обык- новенные Рк / 2.12.1. Теорема. Подходящая дробь является наилучшим приближе- Qk нием х среди всех дробей, знаменатель которых не превосходит Q/..
10.13. Алгоритмическая неразрешимость 201 10.13. Алгоритмическая неразрешимость / Проблемы вычислимости и доказуемости подробно, но коротко и, хо- чется надеяться, ясно — рассматриваются в [5, т. 6], а также более сжато — здесь в главе 5. Тематика ныне весьма популярна, но вне территории арифметики,.ка-' ковая остается пока в традиционных рамках, — и в мозгах очень важно сломать соответствующие перегородки, чтобы родственные области пришли во взаимо- действие. Поэтому всякое дополнительное упоминание алгоритмических струн в рамках арифметики подталкивает стороны ко взаимному оплодотворению. / 5.1.1. Определение. Целочисленную функцию /(п) целочисленного ар- гумента называют вычислимой, если существует алгоритм, вычисляющий значе- ния f(n), но не обязательно приводящий к результату. Таким образом, вычислимая функция — это алгоритм на некотором языке в некотором алфавите А, Р = aia2... aN, все € А, (10.10) при условии что входные и выходные данные кодируются числами. Соответ- ственно записи (10.10) все вычислимые функции можно пронумеровать, /i(n),..., А(п),... . (10.11) Сначала перечисляются все программы из одной буквы, потом из двух, потом из трех и т. д.* 2* / 5.2.1. Определение. Множество X перечислимо, если оно является областью значений либо областью определения вычислимой функции. • / 5.2.2. Определение. Множество X разрешимо, если его характеристи- ческая функция вычислима. • / 5.2.3. Теорема Поста. Для разрешимости X необходимо и достаточно, чтобы X и его дополнение X были перечислимы. • / 5.2.4. Теорема. Существует перечислимое, но неразрешимое множество положительных целых чисел3\ 2) ' Таким образом, вычислимая функция — это множество эквивалентных алгоритмов, дающих на любом входе один и тот же результат — определенный или неопределенный. В нумерации (10.11) каждая функция имеет бесконечное число номеров. В качестве програм- мирующего инструмента (языка) обычно используется машина Тьюринга [5, т. 6]. 3) Это краеугольный результат теории алгоритмов.
202 Глава 10. Определения и результаты • / 5.2.5. Теорема. Множество эффективно вычислимых функций непере- числимо (эффективно не нумеруется)^. • / Теорема Матиясевича 1.2.3: «Диофантовость множества равносильна перечислимости» — произвела фурор в рядах математической общественности, уравняв в правах диофантов язык с машиной Тьюринга, и существенно обогатив тем самым ассортимент инструментов для изучения проблем неразрешимости. А факт 5.3.1 существования полинома Q(x), не имеющего корней в N, для которого утверждение V х € N : Q(x) Ф 0 принципиально недоказуемо, — фактически усилил теорему Гёделя, освободив ее от несколько метафизического толкования. / Что касается существования недоказуемости, то феномен является следствием наличия перечислимых, но неразрешимых множеств. Удобная интер- претация тут связана с некоторым изменением угла зрения, поскольку говорить о недоказуемых истинах как-то не с руки, ибо кто гарантирует истинность, кро- ме Всевидящего Ока! Поэтому Гёдель свой знаменитый результат формулировал, избегая обращения к понятию истины: / 5.5.1. Какова бы ни была совокупность аксиом в арифметике, если она непротиворечива, существует такое утверждение А, что ни А, ни его отрицание (-iA) — не доказуемы5'. • Г Следующие две теоремы с точки зрения теории алгоритмов фактически ни чего не добавляют к п. 5.5.1, но на территории матлогики смотрятся как поразительные достижения. 5.5.3. Теорема. Существует полином Q(x\,, xk), такой что высказывание <<i х : Q(x) 0» истинно, но недоказуемо ни в какой непротиворечивой системе аксиом, включающей примитивную арифметику. 5.5.4. Теорема. Арифметика неаксиоматизируемо, даже при включении в си- стему бесконечного, но конструктивно (перечислимо) задаваемого множества аксиом. •/ Еще один важный аспект — вторая теорема Гёделя о непротиворечивости'. 5.6.1. Теорема. Если теория Т непротиворечива и содержит в себе арифме- тику, то непротиворечивость Т недоказуема в Т. Программы, дающие ответ f(n) на любом входе п, называют эффективными. Эффективно вычислимые функции f(n), вычислимые при любом п, в теории рекурсивных функций называют общерекурсивными. Под юрисдикцией «закона исключения третьего» это означает: толи А, толи -А — истинно, ио недоказуемо.
10.14. PNP-проблематика 203 Результат считается очень сложным, и приводится обычно без доказатель- ства, — например, в фундаментальном манускрипте Клини [10], где редактор перевода дает все же обоснование в приложении на 50 страницах! В [5, т. 6] приводится короткое доказательство (в пределах страницы). •/ Тесную связь теории алгоритмов с арифметикой обеспечивает техно- логия универсальных нумераций, напрямую сводящих все к игре чисел. Цен- тральная идея совсем проста. Эффективная нумерация вычислимых функций, №), ...,fn(x),..., , 6) позволяет считать двуместную функцию ' U(n,x) = fn(x) универсальной. Получается, существует всего одна вычислимая функция. 10.14. PNP-проблематика / Если работа алгоритма, решающего задачу с длиной описания х, характеризуется необходимостью выполнения /(я) элементарных операций, то алгоритм считается полиномиальным в случае /(я) = О(хк) при некотором к 0, т. е. при условии существования константы С > 0, такой что /(я) С Схк для достаточно больших я. / 7.1.1. Если целевая функция принимает не более N значений, то суще- ствует процедура решения оптимизационной задачи за log2 N шагов, на каждом из которых решается соответствующая комбинаторная задача распознавания. • / JJA.l. Совокупность задач распознавания, которые могут быть решены некоторым полиномиальным алгоритмом, называется классом Р. А 7.1.3. Класс NP определяется как совокупность полиномиально проверя- емых задач распознавания, в которых, если решением является ответ «да», то существует «слово» А полиномиальной длины и полиномиальный от А алгоритм, дающий ответ «да» . • / Среди NP-задач есть в некотором роде универсальные, как говорят, — NP-полные, каковые полиномиально эквивалентны друг другу. По определению задача NP-полна, если к ней полиномиально сводится любая другая NP-задача. б) Включение запятых в алфавит с последующей перекодировкой цифрами позволяет все k-местные функции /(ге,,..., nj.) считать одноместными. 7' Дополнительные к NP-задачам образуют класс co-NP.
204 Глава 10. Определения и результаты / Вопрос «Р =NP» о совпадении или несовпадении классов Р и NP до сих пор остается открытым, что является крупнейшей математической проблемой. • / Задачи выяснения простоты jV и возможности факторизации N вза- имно дополнительны, и обе принадлежат классу Р (раздел 7.5), но это стало ясно лишь в результате титанических усилий. Путь к полиномиальному ал- горитму AKS вкратце описан в разделе 7.4, но приведенные там результаты имеют не только историческое значение, но и практическое, потому что их фактическая эффективность остается пока выше AKS. / Факторизация N полиномиальна как задача распознавания, но остается до сих пор труднорешаемой как задача поиска разложения N -- NtN2. 10.15. Распределение простых чисел / Количество простых чисел, не превосходящих х, — обозначают че- рез тг(ж). Соображения «на пальцах» приводят к оценке плотности распределе- ния простых чисел в окрестности большого х: соответственно Г du х ( 1 г! / 1 \) , , к(х) = / ----= ——<14---------г ... + —г--И О (—гтд— Jr- (10.12) ' J Inu Ins [ Ins Ins. \ln + s/j 2 / Строгий анализ (10.12) был начат Чебышевым, использовавшим в своих построениях две функции $(s) = У? 1ПР и ^(ж) — У2 Р^х pi^x где р обозначает простое число; х > 0 не обязательно целое, и установившим следующий результат. 8.2.1. Теорема. При s —> оо верхние пределы функций (а также — нижние) я(х) $(s) ф(х) s/lns’ s’ s’ равны между собой. А если пределы существуют, то равны единице. Существование предела долгое время не поддавалось обоснованию, и было установлено Адамаром и Валле-Пуссеном (1896). Дальнейший прогресс в изуче- нии tt(s) был (и до сих пор) связан с дзета-функцией, см. раздел 8.3.
10.16. Эллиптические кривые 205 / Помимо асимптотического поведения интерес представляют также результаты, гарантирующие наличие простых чисел в тех или иных диапазонах. 8.5.1. Постулат Бертрана8'. Между любым n > 1 и 2п всегда заключено 9) простое число 10.16. Эллиптические кривые / Эллиптическая кривая в канонической форме описывается уравнением вида у2 = х3 + ахг + /Зх 4- 7, (10.13) каковое производит впечатление мелкой частности. Однако при копеечном с ви- ду замахе удар получается рублевым. Под юрисдикцию (10.13) попадает много задач далеко не третьего порядка. Например, как выяснилось, эллиптическая кривая 2 „3 । /Лпгп ji г.пп\м । у = х + (а о —ас — ос )х + а о с при условии ап + Ъп = сп не может быть модулярной вопреки гипотезе Таниямы, которую обосновал Уайлс, и доказал тем самым теорему Ферма. У Неожиданно оказалось, что простейшие геометрические манипуля- ции с эллиптической кривой определяют своеобразное сложение, по которому рациональные точки на кривой образуют группу, характеризуемую серией уди- вительных результатов. / 9.3.1. Теорема Морделла. На любой кривой (10.13) имеется конечное число рациональных точек Р\,... ,РГ, таких что любая рациональная точка Р на этой крйвой представима в виде Р — ПцР} + ... + п,.Рг + Т, где Т — точка конечного порядка. У 9.3.2. Теорема Мазура. Конечный порядок п точки Т всегда лежит в диапазоне п С 12, причем п Ф 11, и на кривой (10.13) не может быть более 16 рациональных точек конечного порядка. / Загадочность эллиптических кривых подчеркивает следующий феномен. 8'Доказан Чебышевым. Возможно, между любым п > 117 и п + у5г всегда заключено простое число (гипотеза Шинцеля).
206 Глава 10. Определения и результаты 9.3.3. Число рациональных точек на любой неособой кривой 52 аНх'У3 = 0 ij порядка п > 3 — конечно'0). У Эллиптические кривые резонируют с широким кругом явлений. Вот один из феноменов. 9.5.2. Число г конгруэнтно") в томм случае, когда на эллиптической кривой 2 3 2 У = X - Т X существует рациональная точка бесконечного порядка. 10) То есть эллиптические кривые (п — 3) принципиально выделяются на общем фоне кривых n-й степени. Рациональное число г называется конгруэнтным, если существует прямоугольный треугольник площади г с рациональными длинами сторон.
Сокращения и обозначения •«I и ► — начало и конец рассуждения, темы, доказательства (?) — предлагает проверить или доказать утверждение в качестве упраж- нения, либо довести рассуждение до «логической точки» (!) — предлагает обратить внимание «в томм случае» — «в том и только том случае» (а, Ъ) = НОД (а, Ь) — наибольший общий делитель чисел а и & [а, &] = НОК [а, &] — наименьшее общее кратное чисел а и & А => В — из А следует В х £ X — х принадлежит X X U Y, X П Y, X\Y — объединение, пересечение и разность множеств X С Y — X подмножество Y, в том числе имеется в виду возможность X С Y, т.е. между X С Y и X СУ различия не делается ~ — отношение эквивалентности, определяемое контекстом; в случае изоморфизма вместо ~ чаще используется знак обыкновенного равенства = 0 — пустое множество Q — .замыкание Q Q = — граница Q 2а — множество всех подмножеств множества Q N — множество натуральных чисел {1,2,...} Z — группа целых чисел {..., —1, 0, 1,...} по сложению
208 Сокращения и обозначения Zp — аддитивная группа вычетов по модулю р Zp — мультипликативная группа вычетов по модулю р R = (—оо, оо) — вещественная прямая Р — множество простых чисел Q — множество рациональных чисел R" -- n-мерное евклидово пространство С — комплексная плоскость [а] — целая часть числа a |_а] — округление числа а до целого в меньшую сторону, т. е. |_aj = [а] Га| — округление числа а до целого в большую сторону {а} — дробная часть числа a {a)m — класс вычетов по модулю т: {а}т = {ж : ж = а + km, к € Z} 3 — квантор существования V — квантор общности 1х — тождественное отображение X -> X Ж[ж] — кольцо многочленов с действительными коэффициентами 0[ж] — кольцо многочленов с рациональными коэффициентами 2[ж] — кольцо многочленов с целыми коэффициентами |С?: Я| — индекс подгруппы Н в группе G х — a (modp) — ж и а при делении на р дают одинаковые остатки; либо частный случай: ж равно остатку при делении а на р х = а — равносильно ж = a (modp)
Сокращения и обозначения 209 а | b — «а делит Ь», т. е. b делится нацело на а т(я) — число делителей числа х р(х') — функция Мёбиуса ip(x) — функция Эйлера рг — г-е по счету простое число
Литература 1. Айерлэнд К., Роузен М. Классическое введение в современную теорию чисел. М.: Мир, 1987. 2. Башмакова И. Г. Диофант и диофантовы уравнения. М.: Издатель- ство ЛКИ/URSS, 2007. 3. Боревич З.И., Шафаревич И.Р. Теория чисел. М.: Наука, 1985. 4. Босс В. Интуиция и математика. 3-е изд. М.: Издательство ЛКИ/ URSS, 2008. 5. Босс В. Лекции по математике. Т. 1: Анализ; Т. 2: Дифференциальные уравнения; Т. 3: Линейная алгебра; Т. 4: Вероятность, информация, статистика; Т. 5: Функциональный анализ; Т. 6: От Диофанта до Тью- ринга; Т.7: Оптимизация; Т. 8: Теория групп; T9: ТФКП; Т. 10: Пе- ребор и эффективные алгоритмы; Т. 11: Уравнения математической физики; Т. 12: Контрпримеры и парадоксы; Т. 13: Топология. М.: URSS, 2004-2009. 6. Ван дер Варден Б. Л. Алгебра. М.: Наука, 1979. 7. Виноградов И. М. Основы теории чисел. М.: Наука, 1965. 8. Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. М.: Мир, 1982. 9. Дэвенпорт Г. Высшая арифметика. Введение в теорию чисел. М.: Наука, 1965. 10. Клини С. К. Введение в метаматематику. М.: Книжный дом «Либро- kom»/URSS, 2009. 11. Коблиц Н. р-адические числа, р-адический анализ и дзета функции. М.: Мир, 1982. 12. Коблиц Н. Курс теории чисел и криптографии. М.: ТВП, 2001. 13. Коблиц Н. Введение в эллиптические кривые и модулярные формы. М.: Мир, 1988. 14. Постников М. М. Введение в теорию алгебраических чисел. М.: Наука, 1982. 15. Прасолов В. В., Соловьев Ю. П. Эллиптические функции и алгебраи- ческие уравнения. М.: Факториал, 1997.
Литература 211 16. Рибенбойм П. Последняя теорема Ферма. М.: Мир, 2003. 17. Серпинский В. Что мы знаем и чего не знаем о простых числах. М.: Физматгиз, 1963. 18. Серпинский В. 250 задач по элементарной теории чисел. М.: Просве- щение, 1968. 19. Серр Ж.-П. Курс арифметики. М.: Мир, 1972. 20. Сингх С. Великая теорема Ферма. М.: МЦНМО, 2000. 21. Чандрасекхаран К. Введение в аналитическую теорию чисел. М.: Мир, 1974. 22. Шнирельман Л. Г. Простые числа. М.: Госиздат техн.-теор. лит, 1940. 23. Эдвардс Г. Последняя теорема Ферма. Генетическое введение в ал- гебраическую теорию чисел. М.: Мир, 1980.
Предметный указатель Аддитивная группа Z^ 68 -- кольца 67 алгебраическое число 131 алгоритм 105 - AKS 151 — Диффи—Хелмана 147 — Евклида 38, 125 — полиномиальный 142 арифметика Lo 113 — вычетов 58 — остатков 58 — примитивная ИЗ Булева структура 140 Взаимно простые- многочлены 125 1еделевская нумерация 120 — функция 120 гипотеза Артина 97 — Гилбрайта 26 — Римана 163 — Шинцеля 166 группа 65 — абелева 66 — вычетов аддитивная 65 — конечная 65 — модулярная 181 — циклическая 65 - С 68 групповая операция 65 Делители нуля 67 десятая проблема Гильберта 13 дзета-функция 161 дивизор 174 диофантов язык 110 диофантова функция 12 диофантово множество 12 — уравнение 11 диофантовы приближения 72 — уравнения 75 дискретный логарифм 148 дробь непрерывная 69 — цепная 69 Задача NP-полная 143 — факторизации 144 задачи распознавания 142 закон взаимности 88 золотая теорема Ферма 20 Идеальные числа Куммера 174 Каноническое разложение 48 квадратичный вычет 85 — невычет 85 кватернион 92 класс co-NP 143 - NP 143 - Р 143 — вычетов 61 кодирование 105 кольцо 67 — евклидово 130 — коммутативное 67 — с единицей 67 — целостное 67 короткая арифметика Гильберта 49 кратность 42
Предметный указатель 213 критерий Эйзенштейна 126 круговое поле 102 круговой многочлен 103 кси-функции Римана 162 Латинский квадрат 28 лемма Гаусса 126 Магический квадрат 27 малая теорема Ферма 63 минимальный многочлен а над Р 131 многочден 124 — неприводимый 125 — приводимый 125 моном 176 мультипликативная группа выче- тов 66 ----кольца 68 Наибольший общий делитель 1'24 натуральный ряд 30 норма неархимедова 136 нумерация гёделевская 120 Обратный элемент 78 ограниченный квантор общности 114 односторонние функции 146 основная теорема арифметики 48 открытый ключ 145 Первообразный корень 95 перечислимое множество 107 период элемента 66 пифагоров кирпич 172 подгруппа 65 поле 68 — разложения 133 — характеристики нуль 134 полином 124 полная система вычетов 61 порядок 179 — группы 65 — элемента 66 постулат Бертрана 166 приведенная система вычетов 62 примитивный корень 95, 103 — элемент 133 проблема Гольдбаха 15 — чисел-близнецов 15 пятиугольные числа 18 Разрешимое множество 107 распознаваемость 107 расширение конечное 132 — нормальное 133 — поля 130 — простое 130 решето Эратосфена 44 ро-метод 156 ряд Фибоначчи 31 Символ Лежандра 87 — Якоби 88 система счисления двоичная 33 сопряженное число 131 сравнимость по модулю 57 степень а над Р 131 Тело 68 теорема Безу 124 — Вильсона 84 — Гёделя о непротиворечивости 118 — Евклида 43 — китайская об остатках 79 — Клини 120 — Кронекера 52 — Лагранжа 12 — Лейбница 85 — Мазура 179 — Миллера 150 — Минковского 35 — Минковского—Хассе 139
214 Предметный указатель — Морделла 179 — о неподвижной точке 120 — о примитивном элементе 133 — Островского 135 — Фальтингса 180 — Шевалле 90 — Эйлера 18, 63 — Якоби 94 теоремы Чебышева 161 теория непротиворечивая 118 — Рамсея 20 тест AKS 151 — Люка—Лемера 154 — Рабина—Миллера 150 — Ферма 149 тождество Чебышева 51 — Эйлера 91, 161 • треугольник Паскаля 27 Универсальный полином 112 унитарный многочлен 132 уравнение Пелля 73 Формула Бинэ 31 — обращения Мёбиуса 55 — Эйлера 57 формулы Шерка—Серпинского 46 функции Чебышева 51, 159 функция Аккермана 22 — вычислимая 106 — Мёбиуса 54 — Мангольдта 159 — модулярная 181 — мультипликативная 53 — общерекурсивная 107 — Римана 161 — универсальная 119 — Эйлера 56 — эффективно вычислимая 107 — к-местная 106 Характеристика поля 134 характеры Дирихле 165 Целое алгебраическое число 132 Числа Мерсенна 45 — Ферма 45 число Кармайкла 149 — простое 14, 43 — свободное от квадратов 55 — совершенное 45 — составное 14, 43 — целое 137 — р-адическое 134 Эллиптическая кривая 176 эффективная процедура 107 р(х) 54 тг(®) 157, 204 т(х) 54 ip(x) 56 S(x) 54 Zm 65
_ . . .. . •v-sv.-w.'.«л-:-.- WiSTia URSS.ru URSS.ru URSS.ru Другие книги нашего издательства: МАТЕМАТИКАМ Ж* Ж’ URSS Босс В. Интуиция и математика Книга раскрывает существо многих математических идей и явно представляет собой новый шаг в области популяриза- ции науки. Неожиданно просто и коротко передается смысл фундаментальных результатов. Сложные факты предстают в интуитивно ясном виде. Стиль изложения необыкновенно экономен. Интонация дружественная. Для широкого круга читателей. В первую очередь для сту- дентов и преподавателей, инженеров и научных работников. И даже для старших школьников, которые сумеют обойти незначительные вкрапления высшей математики. Оре О. Приглашение в теорию чисел. Вейль А. Основы теории чисел. Вейль Г. Алгебраическая теория чисел. Хинчин А. Я. Тфи жемчужины теории чисел. Хинчин А. Я. Цепные дроби. Ожигова Е. 11. Что такое теория чисел. Понтрягин Л. С. Обобщения чисел. Жуков А. В. Вездесущее число «пи». Карацуба А. А. Основы аналитической теории чисел. Гельфанд А. О. Трансцендентные и алгебраические числа. Гельфонд А. О. Решение уравнений в целых числах. Ферма П. Исследования по теории чисел и диофантову анализу. Дирихле П. Г. Л. Лекции по теории чисел. Дедекинд. Р. Непрерывность и иррациональные числа. Ингам А. Э. Распределение простых чисел. В. Босс. Наваждение Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия. Т. 1-3. Грин Б. Элегантная Вселенная. Пер. с англ. Грин Б. Ткань космоса. Пер. с англ. Пенроуз Р. НОВЫЙ УМ КОРОЛЯ. О компьютерах, мышлении и законах физики. - В Тел./факс: <499) 135-42-4Б, <499) 135-42-16, E-mail: URSS@URSS.ru http://URSS.ru Наши книги можно приобрести в магазинах: «Библио-Глобус» (и. Лубянка, ул. Мяснициая, б. Тел. (495) 625-2457) «Московский дои иниги» (и.Арбатсиая, ул,Новый Арбат, 8. Тел. (495) 203-8242) «Молодая гвардия» (и.Поляниа, ул. Б. Полянка, 28. Тел. (495) 238-5001, 780-3370) «Дои научно-технической иииги» (Ленинский нр-т, 40. Тел. (495) 137-6019) «Дои книги на Ладожской» (и. Бауманская, ул. Ладожская, 8, стр.1. Тел. 267-0302) «Гнозис» (и. Университет, 1 сум. корпус МГУ, коми. 141. Тел. (495) 939-4713) «У Кентавра» (РГГУ) (и. Новослободская, ул. Чаянова, 15. Тел. (499) 973-4301) «СПб. ДОИ иниги» (Невский ир„ 28. Тел. (812) 448-2355) tRSsimiBiiiuissiru;
В «Лекциях по математике» В. Босса вышли тома: 1. Анализ. 2. Дифференциальные уравнения. 3. Линейная алгебра. 4. Вероятность, информация, статистика. 5. Функциональный анализ. 6. От Диофанта до Тьюринга. 7. Оптимизация. 8. Теория групп. 9. ТФКП. 10. Перебор и эффективные алгоритмы. 11. Уравнения математической физики. 12. Контрпримеры и парадоксы. 13. Топология. 14. Теория чисел. о Из отзывов читателей: Дается то, чего недостает. Общая картина, мотивация, взаимосвязи. И самое главное — легкость вхождения в любую тему. Содержание продумано и хорошо увязано. Громоздкие доказательства ужаты до нескольких строчек. Виртуозное владение языком. Готовятся: «Нелинейный анализ». «Теория множеств». ОПмвм в ццм г«№ Й&О»®® ©»®» ПоВВЖЯ'Ж® я® «МОД 9 785397 0 1044 информационного наводнения инструменты вчерашнего дня перестают работать. Поэтому учить надо как-то иначе. «Лекции» дают пример. JIxokou ли, хороший — покажет время. QLo в любом случае, это продукт нового поколения. ‘file же «колеса», тот же «руль», та же математическая суть, - но по-другому. 7$. ТЬосс Чтобы усвоить предмет, надо освободить его от деталей, обнажить центральные конструкции. Это тяжелая работа, которая в «Лекциях» проделывается автором. НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА E-mail: URSS@URSS.ru Каталог изданий в Интернете: http://URSS.ru Тел./факс: 7 (499) 135-42-16 URSS Тел ./факс: 7 (499) 135-42—46 7664 ID 105546 URSS.ru