Text
                    Классические
НАПРАВЛЕНИЯ В МАТЕМАТИКЕ
Введение
в современную
теорию чисел
Ю. И. Манин, А. А. Панчишкин


Классические НАПРАВЛЕНИЯ В МАТЕМАТИКЕ Ю. И. МАНИН, А. А. ПАНЧИШКИН Введение в современную теорию чисел Москва МЦНМО 2009
УДК 511 ББК 122.130 М23 Манин Ю. И., Панчишкин А. А. М23 Введение в современную теорию чисел.— М.: МЦНМО, 2009.— I 552 с.: ил. ISBN 978-5-94057-511-5 Предлагаемая читателю книга — это переработанная и дополненная версия кни- ги «Теория чисел I. Введение в теорию чисел» Ю. И. Манина и А. А. Панчишкина (Москва, ВИНИТИ, 1989), и её английского перевода (Encyclopeadia of Mathe- matical Sciences, v. 49, Springer-Verlag, 1995). Книга состоит из вводных глав к раз- личным разделам теории чисел. Все главы объединены общей концепцией: вместе с читателем пройти от наглядных примеров теоретико-числовых объектов и задач, через общие понятия и теории, развитые на протяжении долгого времени, к неко- торым новейшим достижениям и видениям современной математики и наброскам для дальнейших исследований. Новые разделы, написанные для данного издания, включают в себя сжатое изложение доказательства Уайлса большой теоремы Фер- ма, недавно открытый полиномиальный алгоритм проверки на простоту числа, обзор счёта рациональных точек на многообразиях и другие сюжеты; заключительная часть книги посвящена арифметическим когомологиям и некоммутативной геометрии. ББК 122.130 Первый тираж издания осуществлен при финансовой поддержке Российского фонда фундаментальных исследований по проекту №04-01-14095. Юрий Иванович Манин, Алексей Алексеевич Панчишкин ВВЕДЕНИЕ В СОВРЕМЕННУЮ ТЕОРИЮ ЧИСЕЛ Редактор С. О. Горчинский Подписано в печать 22.04.2009 г. Формат 60 х 90 V16- Бумага офсетная. Печать офсетная. Печ. л. 34. Тираж 1500 экз. Заказ № 15993 Издательство Московского центра непрерывного математического образования. 119002, Москва, Большой Власьевский пер., 11. Тел. (499) 241-74-83. f Отпечатано по CtP-технологии в ОАО «Печатный двор» им. А. М. Горького. 197110, Санкт-Петербург, Чкаловский проспект, 15. Книги издательства МЦНМО можно приобрести в магазине «Математическая книга», Большой Власьевский пер., д. 11. Тел. (499) 241-72-85. E-mail: biblio®mccme.ru J © Манин Ю.И., Панчишкин А. А., 2009. ISBN 978-5-94057-511-5 © МЦНМО, 2009. I
Оглавление Предисловие......................................................... 11 Введение............................................................ 13 Часть I. Задачи и приемы Глава 1. Элементарная теория чисел.................................. 21 §1.1 . Задачи о целых числах. Делимость и простота................. 21 1.1.1. Системы счисления ..................................... 21 1.1.2. Простые и составные числа.............................. 22 1.1.3. Основная теорема арифметики и алгоритм Евклида......... 25 1.1.4. Вычисления с классами вычетов.......................... 26 1.1.5. Квадратичный закон взаимности и распознавание простоты числа ........................................................ 29 1.1.6. Распределение простых чисел ........................... 32 §1.2 . Диофантовы уравнения первой и второй степени................ 37 1.2.1. Уравнение ах + by = с.................................. 37 1.2.2. Диофантовы системы линейных уравнений.................. 38 1.2.3. Уравнения второй степени............................... 40 1.2.4. Принцип Минковского—Хассе для квадратичных форм ....... 43 1.2.5. Уравнение Пелля........................................ 45 1.2.6. Представление целых чисел и квадратичных форм квадратичны- ми формами.................................................... 46 1.2.7. Связь с аналитической теорией чисел ................... 51 1.2.8. Эквивалентность бинарных квадратичных форм............. 54 §1.3 . Кубические уравнения........................................ 56 1.3.1. Проблема существования рационального решения........... 56 1.3.2. Сложение точек на кубической кривой.................... 57 1.3.3. Строение группы рациональных точек на кубической кривой . . 59 1.3.4. Кубические сравнения по простому модулю ............... 66 § 1.4. Задачи о континууме: приближения и непрерывные дроби....... 68 1.4.1. Диофантовы приближения иррациональных чисел............ 68 1.4.2. Ряды Фарея............................................. 69 1.4.3. Непрерывные (цепные) дроби............................. 70 1.4.4. ЗЬг-эквивалентность чисел.............................. 71 1.4.5. Периодические цепные дроби. Решение уравнения Пелля .... 72 §1.5 . Диофантовы приближения и иррациональность................... 73 1.5.1. Идеи доказательства иррациональности числа £(3)........ 73
4 Оглавление 1.5.2. Мера иррациональности числа........................... 74 1.5.3. Теорема Туэ—Зигеля—Рота, трансцендентные числа, диофантовы уравнения......................................... 75 1.5.4. Вывод тождеств (1.5.1) и (1.5.2)...................... 77 1.5.5. Рекуррентные последовательности ап и Ьп .............. 78 1.5.6. Трансцендентные числа и седьмая проблема Гильберта.... 80 1.5.7. Работа Ю. В. Нестеренко о [610] ..................... 80 Глава 2. Некоторые приложения элементарной теории чисел............ 81 §2.1 . Разложение и кодирование с открытым ключом.................. 81 2.1.1. Временные затраты для разложения чисел................ 81 2.1.2. Односторонние функции и кодирование с открытым ключом . . 81 2.1.3. Криптосистема с открытым ключом....................... 82 2.1.4. Статистика и массовое производство простых чисел...... 84 2.1.5. Вероятностные методы проверки на простоту............. 85 2.1.6. Проблема дискретного логарифма и протокол обмена ключами Диффи—Хэллмана .............................................. 86 2.1.7. Вычисление дискретного логарифма для эллиптических кривых над конечными полями (ECDLP)................................. 86 §2.2 . Детерминированные проверки на простоту..................... 87 2.2.1. Тест на простоту Адлемана—Померанса—Румели: основные идеи......................................................... 88 2.2.2. Гауссовы суммы и их использование в тестах на простоту .... 89 2.2.3. Детальное описание теста на простоту.................. 94 2.2.4. Простые числа лежат в классе Р ....................... 97 2.2.5. Алгоритм М. Аграваля, Н.Каяля и Н.Саксены.............101 2.2.6. Практические и теоретические доказательства простоты. Алгоритм ЕСРР (Elliptic Curve Primality Proving), построенный Ф. Морэном, [142]..................................... 101 2.2.7. Арифметические прогрессии из простых чисел ...........102 §2.3 . Разложение больших чисел на множители......................103 2.3.1. Сравнение сложности тестов на простоту и разложения чисел на множители................................................ 103 2.3.2. Разложение чисел и квадратичные формы ................104 2.3.3. Вероятностный алгоритм CLASNO.........................105 2.3.4. Метод цепных дробей (СFRAC) и вещественные квадратичные поля........................................................ 107 2.3.5. Использование эллиптических кривых.....................НО Часть II. Идеи и теории Глава 3. Индукция и рекурсия.......................................115 §3.1 . Элементарная теория чисел с точки зрения логики.............115 3.1.1. Элементарная теория чисел.............115 3.1.2. Логика................................................116 §3.2 . Диофантовы множества.......................................117
Оглавление 5 3.2.1. Перечислимость и диофантовы множества...................117 3.2.2. Диофантовость перечислимых множеств.....................118 3.2.3. Свойства диофантовых множеств...........................118 3.2.4. Диофантовость и уравнение Пелля.........................119 3.2.5. График экспоненты диофантов.............................119 3.2.6. Диофантовость и биномиальные коэффициенты...............120 3.2.7. Биномиальные коэффициенты как остатки...................120 3.2.8. Диофантовость факториала................................120 3.2.9. Факториал и алгоритм Евклида ...........................121 3.2.10. Дополнительные результаты..............................121 §3.3 . Частично рекурсивные функции и перечислимые множества.......122 3.3.1. Частичные функции и вычислимые функции..................122 3.3.2. Простейшие функции......................................122 3.3.3. Элементарные операции над частичными функциями .........122 3.3.4. Частично рекурсивное описание функций...................123 3.3.5. Другие рекурсивные функции..............................125 3.3.6. Дальнейшие свойства рекурсивных функций.................127 3.3.7. Связь с множествами уровня..............................127 3.3.8. Связь с проекциями множеств уровня......................128 3.3.9. Теорема Матиясевича.....................................128 3.3.10. Существование некоторых биекций........................128 3.3.11. Операции на примитивно перечислимых множествах ........130 3.3.12. Функция Гёделя.........................................130 3.3.13. Свойства перечислимых множеств ........................131 §3.4 . Диофантовы множества и алгоритмическая неразрешимость.......131 3.4.1. Алгоритмическая нераспознаваемость и неразрешимость....131 3.4.2. План доказательства теоремы Матиясевича.................132 Глава 4. Арифметика алгебраических чисел............................134 §4.1 . Алгебраические числа: реализации и геометрия................134 4.1.1. Присоединение корней многочленов .......................134 4.1.2. Расширения Галуа и элементы Фробениуса..................136 4.1.3. Тензорное произведение полей и геометрическое изображение алгебраических чисел......................................... 138 4.1.4. Единицы, логарифмическое отображение и регулятор........141 4.1.5. Точки решетки в выпуклом теле...........................142 4.1.6. Вывод теоремы о единицах из леммы о выпуклом теле......144 §4.2 . Разложение простых идеалов, дедекиндовы кольца и нормирования. . . 145 4.2.1. Простые идеалы и однозначность разложения на множители . . 145 4.2.2. Конечность числа классов................................147 4.2.3. Разложение простых идеалов в расширениях ...............148 4.2.4. Разложение простых идеалов в циклотомических полях .....150 4.2.5. Простые идеалы, показатели и нормирования...............152 §4.3 . Локальные и глобальные методы...............................154 4.3.1. р-адические числа.......................................154 4.3.2. Приложения р-адических чисел к решению сравнений.......158
6 Оглавление 4.3.3. Символ Гильберта........................................159 4.3.4. Алгебраические расширения поля и поля Тэйта ............161 4.3.5. Нормализованные нормирования ...........................163 4.3.6. Точки числовых полей. Формула произведения .............165 4.3.7. Адели и идели...........................................167 4.3.8. Геометрия аделей и иделей...............................170 §4.4 . Теория полей классов..........................................174 4.4.1. Абелевы расширения поля рациональных чисел..............174 4.4.2. Элементы Фробениуса числовых полей и отображение взаимно- сти Артина.................................................... 177 4.4.3. Теорема Чеботарёва о плотности простых идеалов..........179 4.4.4. Закон разложения и отображение взаимности...............179 4.4.5. Ядро отображения взаимности.............................180 4.4.6. Символ Артина...........................................181 4.4.7. Глобальные свойства символа Артина......................181 4.4.8. Связь символа Артина и локальных символов...............183 4.4.9. Свойства локального символа ............................184 4.4.10. Явная конструкция абелевых расширений локального поля и вы- числение локального символа .................................. 185 4.4.11. Абелевы расширения числовых и функциональных полей .... 188 §4.5 . Группа Галуа в арифметических задачах.........................191 4.5.1. Деление круга на п равных частей .......................191 4.5.2. Расширения Куммера и символ степенного вычета...........195 4.5.3. Когомологии Галуа.......................................198 4.5.4. Когомологическое определение локального символа.........201 4.5.5. Группа Брауэра, закон взаимности и принцип Минковского—Хассе..............................................203 Глава 5. Арифметика алгебраических многообразий.......................209 §5.1 . Арифметические многообразия: схемы конечного типа над кольцом це- лых чисел.............................................................209 5.1.1. Решение уравнений и кольца..............................209 5.1.2. Множество решений систем................................209 5.1.3. Пример: «язык сравнений»................................210 5.1.4. Эквивалентность систем уравнений........................210 5.1.5. Решения системы как гомоморфизмы К-алгебр...............210 5.1.6. Спектр кольца ..........................................211 5.1.7. Функции на спектрах.....................................211 5.1.8. Топология пространства Spec А...........................212 5.1.9. Схемы...................................................215 5.1.10. Точки схемы со значениями в кольцах....................217 5.1.11. Решение уравнений и точки схем ........................217 5.1.12. Теорема Шевалле .......................................218 5.1.13. Некоторые геометрические понятия.......................219 §5.2 . Геометрические методы изучения диофантовых уравнений..........221 5.2.1. Основные вопросы........................................221
Оглавление 7 5.2.2. Геометрическая классификация ..........................223 5.2.3. Существование рациональных точек и препятствия к принципу Хассе..........................................................224 5.2.4. Конечные и бесконечные множества решений...............227 5.2.5. Число точек ограниченной высоты .......................230 5.2.6. Высота и геометрия Аракелова...........................233 5.2.7. Рациональные многообразия..............................234 §5.3 . Эллиптические кривые, абелевы многообразия и линейные группы. . . . 236 5.3.1. Алгебраические кривые и римановы поверхности...........236 5.3.2. Эллиптические кривые...................................238 5.3.3. Кривая Тэйта и ее точки конечного порядка..............245 5.3.4. Теорема Морделла—Вейля и когомологии Галуа.............247 5.3.5. Абелевы многообразия и якобианы........................252 5.3.6. Формула Зигеля и числа Тамагавы........................259 §5.4 . Диофантовы уравнения и представления Галуа..................266 5.4.1. Модуль Тэйта эллиптической кривой......................266 5.4.2. Теория комплексного умножения .........................268 5.4.3. Характеры /-адических представлений....................271 5.4.4. Представления в характеристике р.......................272 5.4.5. Модуль Тэйта числового поля ...........................273 §5.5 . Теорема Фальтингса и проблемы конечности в диофантовой геометрии 276 5.5.1. Сведение гипотезы Морделла к гипотезе Шафаревича ......276 5.5.2. Теорема Шафаревича.....................................278 5.5.3. Переход к абелевым многообразиям.......................279 5.5.4. Проблемы конечности и гипотеза Тэйта...................281 5.5.5. Сведение гипотез Тэйта к свойству конечности для изогений . . 282 5.5.6. Высота Фальтингса—Аракелова............................284 5.5.7. Гипотеза Т и поведение высоты при изогениях............287 Глава 6. Дзета-функции и модулярные формы...........................289 §6.1 . Дзета-функции арифметических схем...........................289 6.1.1. Определение дзета-функций .............................289 6.1.2. Аналитическое продолжение дзета-функций................291 6.1.3. Схемы над конечным полем и теорема Делиня..............291 6.1.4. Дзета-функции и тригонометрические суммы...............295 §6.2 . L-функции, теория Тэйта и явные формулы.....................300 6.2.1. L-функции рациональных представлений Галуа.............300 6.2.2. Формализм Артина ......................................302 6.2.3. Пример: дзета-функция Дедекинда........................305 6.2.4. Характеры Гекке и теория Тэйта.........................306 6.2.5. Явные формулы..........................................314 6.2.6. Группа А. Вейля и ее представления ....................316 6.2.7. Дзета-функции, L-функции и мотивы .....................318 §6.3 . Модулярные формы и эйлеровы произведения....................324 6.3.1. Связь между алгебраическими многообразиями и L-функциями 324 6.3.2. Классические модулярные формы..........................325
8 Оглавление 6.3.3. Приложение: кривая Тэйта и полустабильные эллиптические кривые .......................................................327 6.3.4. Аналитические семейства эллиптических кривых и конгруэнц- подгруппы.....................................................329 6.3.5. Модулярные формы относительно конгруэнцподгрупп.......329 6.3.6. Теория Гекке..........................................332 6.3.7. Примитивные формы ....................................337 6.3.8. Обратная теорема в форме Вейля........................339 §6.4 . Модулярные формы и представления Галуа.....................344 6.4.1. Сравнения Рамануджана и представления Галуа ..........344 6.4.2. Связь с конструкцией Эйхлера—Шимуры ..................346 6.4.3. Гипотеза Шимуры—Таниямы—Вейля ........................347 6.4.4. Гипотеза Берча—Свиннертона—Дайера.....................348 6.4.5. Гипотеза Артина и параболические формы................355 6.4.6. Модулярные представления над конечными полями.........358 §6.5 . Автоморфные формы и программа Ленглендса...................359 6.5.1. Связь классических модулярных форм с теорией представлений 359 6.5.2. Автоморфные Л-функции ................................363 6.5.3. Принцип функториальности Ленглендса...................366 6.5.4. Автоморфные формы и гипотезы Ленглендса ..............367 Глава 7. Большая теорема Ферма и семейства модулярных форм.........369 §7.1 . Гипотеза Шимуры—Таниямы—Вейля и высшие законы взаимности . . . 369 7.1.1. Задача Пьера де Ферма (1601 —1665)................... 369 7.1.2. Ошибка Г. Ламе........................................370 7.1.3. Краткий обзор замечательного доказательства Уайлса ...371 7.1.4. STW-гипотеза .........................................373 7.1.5. Связь с квадратичным законом взаимности ..............373 7.1.6. Полное доказательство STW-гипотезы ...................374 7.1.7. Модулярность полустабильных кривых ...................377 7.1.8. Структура доказательства теоремы 7.13 (полустабильной STW- гипотезы)..............................................378 §7.2 . Теорема Ленглендса—Туннелла и модулярность по модулю 3.....380 7.2.1. Представления Галуа: подготовка.......................380 7.2.2. Модулярность по модулю р..............................382 7.2.3. Переход от параболических форм веса один к параболическим формам веса два........................................383 7.2.4. Предварительный обзор этапов доказательства теоремы 7.13 о модулярности.........................................384 §7.3 . Модулярность представлений Галуа и универсальные кольца деформа- ций ...............................................................385 7.3.1. Представления Галуа над локальными нётеровыми алгебрами 385 7.3.2. Деформации представлений Галуа........................386 7.3.3. Модулярные представления Галуа........................388 7.3.4. Допустимые деформации и модулярные деформации.........390 7.3.5. Универсальные кольца деформаций.......................392
Оглавление 9 §7.4 . Основная теорема Уайлса и критерии изоморфизма локальных колец. . 394 7.4.1. Идеи доказательства основной теоремы 7.33 ............. 394 7.4.2. Сюръективность отображения cps..........................395 7.4.3. Построения универсального кольца деформаций ............396 7.4.4. Набросок построения универсального кольца модулярных де- формаций Ts....................................................397 7.4.5. Универсальность и теорема плотности Чеботарёва..........399 7.4.6. Критерии изоморфизма локальных колец....................399 7.4.7. Второй критерий изоморфизма локальных колец и /-структуры 400 §7.5 . Шаг индукции по Уайлсу: применение критериев и когомологии Галуа 401 7.5.1. Шаг индукции по Уайлсу при доказательстве основной теоремы 7.33 ................................................... 401 7.5.2. Формула, связывающая #Ф/?Е и #Ф/?Е,: подготовка.........403 7.5.3. Группа Зельмера и Ф/?Е..................................404 7.5.4. Инфинитезимальные деформации............................404 7.5.5. Деформации типа ........................................406 §7.6 . Относительный инвариант, основное неравенство и минимальный случай 410 7.6.1. Относительный инвариант.................................410 7.6.2. Основное неравенство ...................................412 7.6.3. Минимальный случай......................................414 §7.7 . Окончание доказательства Уайлса и теорема об абсолютной неприво- димости .............................................................416 7.7.1. Теорема об абсолютной неприводимости ...................416 7.7.2. От р = 3 к р = 5........................................419 7.7.3. Семейства эллиптических кривых с фиксированным р5,£.....420 7.7.4. Окончание доказательства................................422 Часть III. Аналогии и вйдения Глава 111-0. Вводный очерк части III: мотивировки и общее описание . . 427 §111.1 . Аналогии и различия между числами и функциями: точка на бесконеч- ности, архимедовы свойства и т.д.....................................427 III. 1.1. Формула Коши о вычетах и формула произведения .......427 III. 1.2. Арифметические многообразия..........................428 III. 1.3. Бесконечно малые окрестности слоев ..................428 §111.2 . Геометрия Аракелова, слой над бесконечностью, циклы и функции Гри- на (по Жилле—Суле)...................................................429 III.2.1. Арифметические группы Чжоу............................430 III.2.2. Арифметическая теория пересечений и теорема Римана—Роха .........................................431 III.2.3. Геометрическое описание замкнутых слоев над бесконечностью 433 §Ш.З. Теория ^-функций, локальные множители для оо, Г-множители Серра и общее описание дзета-функций, как определителей арифметических Фро- бениусов: программа Денингера........................................435 III.3.1. Архимедовы L-множители................................437 III.3.2. Формулы Денингера.....................................437
10 Оглавление §111.4. Предположение, что недостающие геометрические объекты —неком- мутативные пространства.............................................438 I1I.4.1. Типы и примеры некоммутативных пространств и как с ними обращаться. Некоммутативная геометрия и арифметика.438 III.4.2. Общие сведения о спектральных тройках................442 Ш.4.3. Содержание части III: описание основных этапов данной про- граммы ..................................................443 Глава 8. Геометрия Аракелова и некоммутативная геометрия (по К. Конзани и М. Марколли, [2771)............................... 446 §8.1 . Униформизация Шоттки и геометрия Аракелова..................446 8.1.1. Мотивировки и контекст работы Конзани—Марколли ........446 8.1.2. Аналитическая конструкция вырождающихся кривых над пол- ными локальными полями и геометрия Аракелова (по Мамфор- ду, см. [601]) ...............................................447 8.1.3. Группы Шоттки и новые перспективы в геометрии Аракелова . . 452 8.1.4. Гиперболические тела с ручками.........................456 8.1.5. Геометрия Аракелова и гиперболическая геометрия .......459 §8.2 . Когомологические конструкции, архимедов оператор Фробениуса и ре- гуляризованные определители.........................................463 8.2.1. Архимедовы когомологии ................................463 8.2.2. Локальный множитель и архимедовы когомологии...........467 8.2.3. Когомологические конструкции...........................468 8.2.4. Дзета-функция специального слоя и кручение Райдемайстера 469 §8.3 . Спектральные тройки, динамика и дзета-функции...............472 8.3.1. Динамическая теория на бесконечности...................475 8.3.2. Гомотопический фактор..................................476 8.3.3. Фильтрация ............................................478 8.3.4. Гильбертово пространство и градуировка.................479 8.3.5. Алгебра Кунца—Кригера .................................479 8.3.6. Арифметические поверхности: гомологии и когомологии....482 8.3.7. Архимедовы множители с точки зрения динамики ..........484 8.3.8. Динамическая теория для кривых Мамфорда ...............484 8.3.9. Когомологии пространства УУ(Д/Г)г......................488 8.3.10. Спектральные тройки и кривые Мамфорда.................491 §8.4 . Редукция по модулю оо.......................................492 8.4.1. Гомотопические факторы и «редукция по модулю бесконечно- сти» .........................................................492 8.4.2. Отображение Баума—Конна................................494 Литература..........................................................496 Предметный указатель................................................546
Предисловие Данная книга — переработанная и дополненная версия книги «Теория чисел I. Введение в теорию чисел» Ю. И. Манина и А. А. Панчишкина, из- данной в 1989 г. в Москве (издательство ВИНИТИ) [72], а также англий- ского перевода [549] 1995 г. (Springer-Verlag). Исходно книга была задумана как часть большого проекта «Encyclope- dia of Mathematical Sciences». Соответственно, нашей задачей было напи- сать ряд вводных эссе к различным главам теории чисел и провести чита- теля от наглядных примеров теоретико-числовых объектов и задач через общие понятия и теории, развитые на протяжении долгого времени многими исследователями, к некоторым ключевым моментам современной матема- тики и важным, порой еще смутным, наброскам для будущих поколений. При подготовке данного издания, мы попытались сохранить исходную концепцию нетронутой. Представлено много точных определений, но ино- гда отсутствуют детали и полные доказательства. Мы попытались показать логику теоретико-числовой мысли и осветить широкий контекст, в котором совершаются многие конструкции, но для более детального изучения соот- ветствующего материала читателю рекомендуется обратиться к исходным статьям или другим монографиям. К сожалению, из-за недостатка времени и места нам пришлось опустить много значительных результатов. Новые разделы, написанные для этого издания, включают в себя сжа- тый образ доказательства Уайлса большой теоремы Ферма и описание соответствующей техники, возникающей из сочетания различных теорий изложенных во второй части книги; часть III целиком посвящена ариф- метическим когомологиям и некоммутативной геометрии; также в книгу включен обзор счета точек на многообразиях с большим числом рацио- нальных точек, недавно открытый полиномиальный алгоритм проверки на простоту и некоторые другие сюжеты. Более детальное описание содержания книги, а также советы для даль- нейшего чтения находятся во введении. Авторы с радостью выносят глубокую благодарность проф. М. Мар- колли за ее существенное содействие при подготовке последней части но- вого издания. Мы очень благодарны проф. Анри Коэну за его помощь по улучшению книги, особенно главы 2. Особую благодарность мы хотим выразить проф. Ю. Чинкелю за очень полезные советы, замечания и улуч- шения; он любезно переписал §5.2 для данного издания. Мы благодарны Р. Хиллу и А. Гевиртцу за редактирование некоторых новых разделов это-
12 Предисловие го издания, а также Ст. Кюнляйну (Саарский Университет) за детальный список замечаний по первому изданию. Мы выражаем глубокую благодарность Институту Фурье (UJF, Gre- noble-1) и Математическому институту Макса Планка (Бонн) за велико- лепные условия для работы и замечательную атмосферу. Мы также очень благодарны Рут Аллевельт, Катрионе М. Бирн и Мар- тину Петерсу (издательство Springer-Verlag) за их внимание к нашей ра- боте и за практическую помощь. Авторы сердечно благодарят С. О. Горчинского за очень большую ра- боту по подготовке издания нашей книги. Ю. И. Манин А. А. Панчишкин
Введение Теория чисел среди математических дисциплин выделяется скорее пси- хологической установкой, чем предметом «целые числа». Более сильное утверждение было бы неверным: в теоретико-числовых работах исследу- ются и алгебраические, и трансцендентные числа; или, вообще, не числа, а, скажем, аналитические функции очень специального вида {ряды Дири- хле, модулярные формы}', или геометрические объекты {решетки, схемы над Z). Принадлежность результатов статьи к теории чисел определяется принятой автором системой ценностей: если арифметика в нее не входит, то и статья не теоретико-числовая, хотя бы в ней шла речь исключительно о сравнениях и классах вычетов; если же входит, то что угодно — дина- мические системы или теория гомотопий — может оказаться мощным тео- ретико-числовым инструментом. Только по этой причине комбинаторика и теория рекурсивных функций обычно не считаются теоретико-числовы- ми дисциплинами, а теория модулярных форм считается. В этой книге мы будем понимать теорию чисел широко. К тому есть серьезные основания. Прежде всего, целые числа образуют первичную материю математики вообще (точнее, одну из двух первопричинных материй; вторая — это «фи- гуры», геометрия). История элементарной теории чисел поэтому столь же длинна, как история всей математики, а историю современной математики можно было бы условно начинать с того момента, когда «числа» и «фигу- ры» прочно объединились в идее координатизации, которая, по замечанию И. Р. Шафаревича, лежит в основе алгебры, см. [108]. Далее, целые числа как универсум идеи дискретного являются также универсумом любых логических конструкций, в том числе любых математи- ческих рассуждений, оформленных как таковые. Мы подчеркиваем, что ма- тематика как акт индивидуального творчества, конечно, к логике не сводит- ся, но в коллективном сознании нашей эпохи существует в виде потенци- ально завершимой огромной и точной логической конструкции. Если этот образ постоянно размывается его, так сказать, нежизненностью, то и вос- станавливающие его тенденции сильны; сейчас к ним добавились компью- терная реальность с ее чрезвычайно жесткими требованиями к логической структуре математической продукции в виде программного обеспечения. Пониманием того, что свойства целых чисел суть свойства дискрет- ного вообще и, стало быть, свойства мира математических рассуждений
14 Введение в частности, мы обязаны математике двадцатого века, в первую очередь Гильберту и Гёделю. При желании это понимание может быть оформлено внутри математики в виде теоремы о том, что задача доказуемости внутри любой формальной системы равносильна задаче о разрешимости в целых числах подходящего диофантова уравнения (см. ниже). Этот парадоксаль- ный факт — свидетельство того, что теория чисел, будучи малой частью математического знания, в потенции все это знание содержит. Если зна- менитая метафора Гаусса о теории чисел нуждается в оправдании, его можно усмотреть в цитированной теореме. Если бы мы поставили перед собой (неразрешимую) задачу дать очерк теории чисел в целом, то, следуя довольно традиционным принципам клас- сификации, мы могли бы разделить его примерно на следующие части. • Элементарная теория чисел. • Арифметика алгебраических чисел. • Теоретико-числовая структура континуума (теория приближений, трансцендентные числа, геометрия чисел в стиле Минковского, метриче- ская теория чисел и т. д.). • Аналитическая теория чисел (круговой метод, экспоненциальные суммы, ряды Дирихле и явные формулы, модулярные формы). • Алгебро-геометрические методы в теории диофантовых уравнений. • Разное («мусорный ящик»). Мы, однако, предпочли другую систему акцентов и разделили этот ма- териал, опустив (по незнанию или недостатку места) огромное количество важных результатов, на три следующие части. Часть I. Задачи и приемы. Отбирая материал для этой части, мы исходили из следующего. В теории чисел, как ни в какой другой области математики, велика роль изобретательства, математического остроумия, которое может про- явить молодой человек с минимумом знаний или профессионал с иной подготовкой. Элементарных задач, до сих пор нерешенных или полуре- шенных, очень много. Теоретико-числовое воспитание — это воспитание вкуса; никто не может сказать заранее, что проблема о дружественных числах — плохая задача, а гипотеза Ферма — хорошая, но за нее нельзя браться с голыми руками. В элементарной теории чисел накоплен набор поставленных и решен- ных классиками задач (гл. 1), впоследствии выросших в теоремы, и прие- мов работы, впоследствии ставших большими теориями. Более того, этот ^«...Mathematik ist die Konigin von Wissenschaften und Arithmetik die Konigin von Mathematik. ...in alien Relationen sie wird zum ersten Rank erlaubt». Gauss. («Математика — царица наук, а теория чисел — царица математики. Она часто оказывается служанкой астрономии и других естественных наук, но во всех отношениях она возводится в высший ранг». Гаусс. Sartorius von Waiterhausen. Gauss zum Gedachtniss. (Лейпциг, 1856), c. 79.)
Введение 15 набор пополняется, хотя и реже, чем хотелось бы: пример тому — дока- зательство иррациональности числа £(3) по Апери. Знакомство с таким набором, вероятно, полезно любому профессионалу. Чтобы не ограничиваться очень давно известными результатами, мы подчеркнуто внимательны к алгоритмической стороне дела, а также к та- ким современным приложениям теории чисел, как кодирование с открытым ключом (гл. 2). Вообще, теоретико-числовые методы обработки информа- ции, ориентированные на компьютерную математику (например, быстрое преобразование Фурье), — это область, в которой классическая элемен- тарная теория чисел молодеет и приобретает новое дыхание. Часть II. Идеи и теории. Здесь мы хотели изложить последующее состояние ряда теоретико-числовых концепций, в которых частные приемы и задачи систематизируются, аксиоматизируются и попадают в монографии и книги, ориентированные на экспертов. Элементарная теория чисел с такой точки зрения состоит из всех тео- рем, которые можно вывести из аксиом Пеано, самым сильным средством среди которых является аксиома индукции. В такой формулировке она приобретает математический вкус и долго развивается как часть матема- тической логики — теория рекурсивных функций. С доказательством за- мечательной теоремы Матиясевича в ней выделился законченный тео- ретико-числовой фрагмент — теория диофантовых множеств, — который достоин завершать любой курс элементарной теории чисел. Диофантовым множеством называется любое подмножество натураль- ных чисел, которое совпадает с проекцией на одну из осей множества це- лых решений диофантова уравнения от нескольких переменных. Теорема Матиясевича утверждает, что любое множество, порождаемое алгоритмом (на техническом языке — перечислимое), диофантово. В частности, тако- во множество номеров доказываемых теорем любой формальной системы, скажем, всей аксиоматизированной математики (гл.З). Следующая крупная глава современной арифметики (гл. 4) связана с расширением области целых чисел до области целых алгебраических чи- сел. Последняя не является конечно порожденным кольцом, и сходство с классической арифметикой сохраняют лишь ее подкольца, состоящие из целых чисел конечных расширений поля Q. Исторически необходимость расширения кольца Z была вызвана прямыми арифметическими нужда- ми, скажем, для исследования уравнения Ферма методом спуска очень полезна теория делимости в кольце, порожденном корнями из единицы. Но постепенно на первый план выдвигалось принципиально новое обстоя- тельство— существование фундаментальной группы симметрий теории чи- сел— группы Галуа поля всех алгебраических чисел Gal(Q/Q). Вероятно, Гаусс был первым, кто ясно понял это. Уже в его юношеской работе о по-
16 Введение строении правильных многоугольников подчеркнуто, что возможность по- строения циркулем и линейкой зависит не от видимой геометрической сим- метрии задачи, а от глубоко скрытой симметрии Галуа. Его последующее глубокое обдумывание квадратичного закона взаимности (семь или восемь доказательств!) показывает, что он предвидел его истинную роль в совре- менной теории полей классов. К сожалению, в современных курсах эле- ментарной теории чисел обычно не объясняют, почему квадратичный закон взаимности есть нечто большее, чем красивый курьез. Суть же дела состо- ит в том, что простые числа, традиционный материал арифметики, имеют второе, скрытое воплощение в виде элементов Фробениуса в группе Га- луа. Как таковые, они действуют в качестве симметрий на алгебраические числа, и понимание этого действия кодирует много больше теоретико-чис- ловых фактов, чем обычные сведения о распределении простых чисел в Z. Следующие две главы этой части нашего обзора посвящены алгеб- ро-геометрическим методам, дзета-функциям схем над целыми числами и модулярным формам. Три эти дисциплины, тесно связанные, доставля- ют основной арсенал технических средств для исследования диофантовых уравнений. Для геометра алгебраическое многообразие есть множество всех реше- ний полиномиальной системы уравнений, скажем, над комплексными чис- лами. У него есть целый ряд инвариантов, прежде всего топологических: размерность, числа Бетти, группы (ко)гомологий; далее, аналитических: геометрический род, когомологии степеней канонического пучка, модули, наличие групповой структуры и т. п. Важнейший принцип состоит в том, что эти инварианты определяют качественные черты соответствующей ди- офантовой задачи: может ли система уравнений иметь бесконечное мно- жество решений, как оно велико, каково поведение числа решений ограни- ченного размера, какими алгоритмами можно изучать его структуру и т. д. (см. гл. 5). Это лишь принцип, а не теорема; но его конкретные воплоще- ния принадлежат к самым важным достижениям теории чисел двадцатого века: программа А. Вейля и ее реализация А. Гротендиком и П. Делинем, доказательство гипотезы Морделла Г. Фальтингсом. Дзета-функции (см. гл. 6) — это аналитическая техника для превра- щения качественных утверждений в количественные. Самым принципиаль- ным средством в этой технике являются «явные формулы», восходящие к Риману, который в своем знаменитом мемуаре открыл третье (историче- ски второе) лицо простых чисел — нули дзета-функции. Двойственность, связывающая нули различных дзета-функций с решениями диофантовых уравнений над конечными и алгебраическими полями, находится в центре внимания современной арифметики. Модулярные формы со времен Эйлера и Якоби доставляли красивые и загадочные теоретико-числовые результаты; одно только сравнение ко-
Введение 17 эффициентов Фурье тэта-ряда и его разложения в линейную комбинацию рядов Эйзенштейна и параболических форм позволяет получить массу за- мечательных тождеств. Последние десятилетия значительно прояснили то, что посредством преобразования Меллина модулярные формы дают также ключ к аналитическим свойствам различных дзета-функций. Материал, заслуживающий включения в эту центральную часть обзора, огромен, и мы слишком многое обошли молчанием или упомянули скоро- говоркой. Мы опустили также классические методы, многократно изло- женные в монографиях, такие как круговой метод Харди—Литлвуда и метод тригонометрических сумм Виноградова, в надежде, что они найдут отражение в других статьях в общем контексте аналитической тео- рии чисел (см. [108], [45], и т. д.). Мы едва затронули вопросы, связанные с диофантовыми приближениями и трансцендентными методами, в част- ности знаменитые методы Гельфонда—Бейкера и Гельфонда—Шнайдера (см. [341], [614], [149], [817], [228], [190] и т. д.). Программа Ленглендса имеет целью проникновение в структуру группы Галуа поля алгебраических чисел и завязывает в сложный узел гипотетические свойства представлений этой группы, дзета-функции и модулярные (автоморфные) формы. Наконец, в конце второй части мы попытались дать обстоятельное опи- сание чудесного доказательства Уайлса великой теоремы Ферма, а также гипотезы Шимуры—Таниямы—Вейля, являющегося удивительным при- мером сочетания различных глубоко развитых теорий, таких как алгеб- раическая теория чисел, теория колец, алгебраическая геометрия, теория эллиптических функций, теория представлений, теория Ивасавы и теория деформаций представлений Галуа. Уайлс использовал много сложной тех- ники и идей, принадлежащих ему и многим другим математикам (К. Рибет, Г. Фрей, И. Хеллегуарш, Ж.-М. Фонтен, Б. Мазур, Х.Хида, Ж.-П. Серр, Дж. Туннелл и др.). Это поистине историческое событие подвело итог целой эпохе в теории чисел и в то же время открывает новый период развития, который тес- но переплетается с осуществлением общей программы Ленглендса. Дей- ствительно, гипотеза Таниямы—Вейля может быть рассмотрена как спе- циальный случай общего предполагаемого соответствия Ленглендса между арифметическими алгебраическими многообразиями (мотивами), представ- лениями Галуа и автоморфными формами. Часть III. Аналогии и видения. Эта часть была задумана как ил- люстрация некоторых общих интуитивных идей, стоящих за современным взглядом на теорию чисел. Один из таких сюжетов можно было бы на- звать аналогии между числами и функциями. Мы включили под этим заголовком введение в некоммутативную геометрию, геометрию Аракело-
18 Введение ва, программу Денинигера, идеи Конна о формуле следа в некоммутатив- ной геометрии и нулях дзета-функции Римана, и т. д. Отметим прекрас- ную книгу [427], которая представляет собой обзор определяющих гипотез в арифметической алгебраической геометрии. Они включают в себя гипо- тезы Бейлинсона, гипотезу Берча—Свиннертона-Дайера, Шимуры—Та- ниямы—Вейля, гипотезы Тэйта и др. Обратим также внимание на работы [795], [849], [545], [546] о многообещающих достижениях в области ги- потез Старка. В геометрии Аракелова пополнение арифметической поверхности до- стигается за счет расширения группы дивизоров формальными линейны- ми комбинациями «замкнутых слоев над бесконечностью». Двойствен- ный граф любого такого замкнутого слоя может быть описан в терминах бесконечной связки ограниченных геодезических в гиперболическом теле с ручками, снабженном униформизацией Шоттки. В последней главе 8, во многом основанной на недавних работах Катерины Конзани и Матиль- ды Марколли, рассматривается арифметическая поверхность над кольцом целых элементов числового поля со слоями рода g > 2. Можно исполь- зовать теорию Конна, чтобы связать гиперболическую геометрию с архи- медовыми когомологиями Денингера и когомологиями конуса локальной монодромии V вокруг арифметической бесконечности. Мы используем стандартную систему ссылок внутри книги. Рекомендуемая дальнейшая литература Множество интересных докладов по теории чисел содержится в трудах международных математических конгрессов в Мадриде, 2006 г., в Пекине, 2002 г., в Берлине, 1998 г., и в Цюрихе, 1994 г. (см. [652], [651], [650]). Довольно подробное представление о развитии различных областей теории чисел можно получить из следующих докладов на семинаре Бурба- ки: [312], [165], [345], [624], [235], [728], [193], [729], [625], [377], [475] [531], [816], [112], [338], [575], [257], [203], [544], [323], [483], [218], [413], [635], [636], [241], [258], [259], [170]. Более детальное изложение теории алгебраических чисел, диофантовой геометрии и теории трансцендентных чисел можно найти в томах «Теория чисел»-2, -3, и -4, вышедших в серии «Современные проблемы матема- тики. Фундаментальные направления» (либо в томах Number Theory II, III и IV в Encyclopaedia of Mathematical Sciences) см. [52], [504], [341]. Существует также великолепная монография И.Нойкирха [612], допол- ненная книгой [613]. Рекомендуется книга [126] по арифметической гео- метрии, возникшая после летней школы для аспирантов в Математическом институте в IAS/Park City.
ЧАСТЬ I ЗАДАЧИ И ПРИЕМЫ
ГЛАВА 1 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ЧИСЕЛ §1.1. Задачи о целых числах. Делимость и простота 1.1.1. Системы счисления. Запись натурального числа п по основа- нию т, m = {dk-\dk-2--d\do)rn, означает, что n = dk-\mk X-Vdk_2mk 2 4-...4-do, где dt — цифры по основанию т (целые числа от 0 до т — 1). Число цифр, которое требуется для записи числа п по основанию т, равно k = [logm п\ 4- 1 = + Г L m J Llog/nJ где log % обозначает натуральный логарифм числа х > 0. Удобный способ выполнения операций сложения и умножения над натуральными числами, применяемый в компьютерах, состоит в использовании записи натураль- ных чисел по основанию т = 2. Двоичная цифра (т. е. 0 или 1) называет- ся «бит» (английское «bit» — это сокращение от «binary digit»). Анализ школьных способов сложения и умножения натуральных чисел «в стол- бик» показывает, что для сложения двух чисел, записанных с помощью k и / бит, / < k, требуется k булевых операций (бит-операций), состоящих в сложении соответствующих цифр с запоминанием и переносом в следу- ющий разряд, в то время как для умножения этих чисел нужно не более чем 2kl бит-операций, см. [461], [469]. Число бит-операций характеризу- ет в основном время, которое затрачивается компьютером для выполнения этих действий. Любопытно, что существует быстрый метод для умножения двух чисел, записанных с помощью не более чем k бит, который требует O(k log log log/г) бит-операций вместо O(k2) при умножении в столбик, см. [461]. Кроме того, имеется нижняя оценка: не существует способа перемно- жения двух произвольных чисел, запись которых занимает не более чем k бит, за время, меньшее чем (k log &/(log log &)2). Время, которое требуется для перехода от двоичной записи числа п к записи по основанию т, легко оценивается величиной O(k2) = 000g2 /г), поскольку для этого требуется
22 Элементарная теория чисел [Гл. 1 O(k) делений с остатком, для каждого из которых нужно O(kl) бит-опе- раций (при делении в столбик), где / — число бит для записи числа т (например, / = 4 для т = 10, так как 10 = (1010)2). Указанные способы сложения, умножения, деления с остатком нату- ральных чисел, а также перехода от записи по одному основанию к записи по другому основанию являются примерами алгоритмов, т. е. процедур для проведения вычислений, явно описанных шаг за шагом, см. [74], [357], [70], [544]. Полиномиальным алгоритмом мы будем называть такой ал- горитм для проведения вычислений с натуральными числами п\, П2, ..., пГ, записанными с помощью k\, /?2, ...» kr бит, что число требуемых для его выполнения бит-операций оценивается величиной O(kdl ...kdr) (для целых чисел d\, d2, ..., dr). В приведенных примерах алгоритмы являются поли- номиальными, см. [469], [461], [544], [675]. 1.1.2. Простые и составные числа. Два факта, которые лежат в ос- новании теории чисел, безусловно, таковы: а) каждое целое число п > 1 до- пускает единственное представление в виде п = pf1 Р22 ••• Р“г♦ где Pi < ••• ... < рг — простые числа, а, >0—целые числа (основная теорема ариф- метики), б) простых чисел бесконечно много. Прежде чем практически находить такое разложение для заданного числа п, необходимо уметь от- личить простое число от составного. Наиболее древний алгоритм отде- ления простых чисел от составных — это решето Эратосфена (примерно 274 г. до н. э.). Если п — простое число, то этот алгоритм дает также и все простые числа, меньшие п, а для составного п позволяет установить наи- меньший простой делитель (см. [21], [469]), хотя работает медленно: число операций в общем случае превышает /г/2, т. е. экспоненциально зависит от длины записи числа п. Бесконечность числа простых чисел была немного раньше установлена Евклидом (около 300 г. до н. э.): если бы множество простых чисел было конечным, то, умножив все эти числа друг на друга и прибавив к результату 1, мы получили бы число, не делящееся ни на одно простое число, а это невозможно. Другое доказательство этого факта (по Эйлеру) состоит в рассмотрении следующего произведения по простым числам р: п('4) =п('4+?+-)' р 4 7 р 4 Если бы было лишь конечное число простых чисел р, то из однозначно- сти разложения натуральных чисел п на простые множители следовало оо бы, что число (1.1.1) должно совпадать с суммой ряда 52 м-1, который, как известно, расходится, что приводит к противоречию.n=l Более быстрый способ распознавания простоты числа нашел Фибонач- чи (1202 г.): для этого достаточно разделить п на все натуральные числа, не превосходящие [у/п\ (см. [21], [815], [114]), и число операций деле-
§1.1] Задачи о целых числах. Делимость и простота 23 ния с остатком, необходимых для определения простоты числа п, сразу же уменьшится и не будет превосходить [\/п]. Следующий большой сдвиг, произошедший в проблеме проверки простоты, связан с тем, что в середине XVII столетия была установлена следующая теорема. Теорема 1.1 (малая теорема Ферма). Пусть а, п— произвольные взаимно простые числа. Тогда если п — простое число, то справед- ливо сравнение ап~' = 1 (modл), т. е. ап~{ - 1 делится на п. (1.1.2) Условие (1.1.2), вообще говоря, не обеспечивает простоты числа п, а лишь позволяет установить, что п составное, если это условие не вы- полнено, хотя в последнем случае не дается никакого разложения числа п на множители. Число п называется псевдопростым по основанию а, если НОД(а, п) = 1 и выполнено сравнение (1.1.2). Составные числа п = 561 = = 3 • 11 • 17, 1105 = 5-13-17, 1729 = 7-13-19 являются псевдопростыми для всех а, взаимно простых с п. Такие числа называются числами Кар- михаэля (Кармайкла), см. [469], [524]. Множество таких чисел беско- нечно— это доказано в работе [4]. Отметим, что для числа п, свободного от квадратов, условие того, что р — 1 делит п — 1 (для всех р | п), эквива- лентно тому, что п — число Кармихаэля. Однако большим преимуществом необходимого условия простоты (1.1.2) является быстрота его проверки. Дело в том, что вычисление больших сте- пеней ат (mod п) удобно делать по методу «повторного возведения в квад- рат». Если т = п — 1 = 12* 1 4“ 2 4“... 4* do — двоичное представление числа п - 1 с dk-\ = 1 и di = 0, 1, то определим последовательно числа г\ = а и г2 (mod л), если dk-\-i = 0, G+1 = < ar2 (mod л), если dk-\-i = 1. В результате ап~[ = rk (modл), так как ап~х = (... ((a2+rf*-2)2a^-3)2 ...)ad°. Алгоритм возведения в степень работает очень быстро: он является полиномиальным, требуя не более чем 3[log2 п\ умножений по модулю п для нахождения числа г^, так как k = [log2 п\ 4- 1. Более того, эта теорема, а также ее обобщения и частичные обращения являются одной из основ- ных составляющих современных быстрых методов проверки простоты натуральных чисел.
24 Элементарная теория чисел [Гл. 1 Эта идея была использована в недавней работе М. Аграваля, Н. Каяля и Н. Саксены: полиномиальный вариант условия (1.1.2) привел к быстрому детерминированному алгоритму проверки на простоту (за полиномиальное время O(log/z)12+e), см. §2.2.4. Любопытно, что появление малой теоремы Ферма было связано с рас- смотрением чисел Fn = 22П — 1, причем Ферма считал, что все они простые, хотя смог это проверить лишь для п < 4. Однако в следующем столетии Эйлер нашел разложение на множители числа F$ = 4294967297 = 641 х х 6700417. Ни одного нового простого числа Ферма больше не бы- ло найдено, и многие математики считают сейчас, что их больше нет, см. [627]. История поисков больших простых чисел связана с простыми числа- ми Мерсенна вида Мр — 2Р — 1, где р —другое простое число. Причи- на этого состоит в следующем критерии Люка\ число Mk (k 2) тогда и только тогда является простым, когда оно делит число Lk-\, где чис- ла Ln определяются рекуррентным соотношением L\ =4, Ln+\ = L2—2 (так что £2 = 14, £3 = 194, £4 = 37634, ...). Поэтому простоту числа Mk проверить значительно легче, чем простоту других чисел того же поряд- ка. Числа Мерсенна играют важную роль и в некоторых других пробле- мах теории чисел. Евклид обнаружил, что если число 2Р — 1 — простое, то число 2Р-1(2Р — 1) является «совершенным», т. е. равно сумме своих собственных делителей (например, 6=1 + 2 + 3, 28 =1+2 + 4 + 7+14, 496 =1 + 2 + 4 + 8+16 + 31 +62+124 + 248), а Эйлер доказал, что все четные совершенные числа имеют указанный вид. Неизвестно, существу- ют ли вообще нечетные совершенные числа. Интересно, что это один из обескураживающих примеров, по-видимому, разумного вопроса, который еще не привел к появлению никаких новых областей, идей или приемов в теории чисел. Первые восемь простых чисел Мерсенна были известны Эйлеру (для р = 2, 3, 5, 7, 13, 17, 19, 31). В последнее время простота многих чисел Мерсенна проверена с помощью компьютеров, например сорок второе из- вестное число Мерсенна, открытое Мартином Новаком 26 февраля 2005 г., равно 225964951 - 1. Оно имеет 7816230 десятичных знаков. Поэтому оно является не только самым большим известным простым числом Мерсенна, но и вообще самым большим простым числом, найденным на сегодняш- ний день1). В главе 4 будут рассмотрены некоторые другие современные методы проверки на простоту, в частности использующие эллиптические кривые (алгоритм ЕСРР, построенный Аткиным и Морэном). О См. новые достижения и историю этого вопроса на http://www.mersenne.org и http://mathworld.wolfram.com/news/; например, два предыдущих числа равны 20996011 и 24036583. Другой недавний результат — разложение М953 (Ф. Бар, Йенс Франке и T. Клейньюнг (2002 г.)). — Прим. Ю. Чинкеля и А. Коэна.
§ 11] Задачи о целых числах. Делимость и простота 25 1.1.3. Основная теорема арифметики и алгоритм Евклида. Для це- лых чисел а и b запись а | b обозначает, что а делит Ь, т. е. для некоторого целого числа d имеем b = ad\ если р — простое число и а — неотрицатель- ное целое число, то запись ра || п означает, что ра — это наивысшая сте- пень числа р, делящая п. При этом число d называется р-показателем числа п и обозначается ordpAi. Теорема об однозначности разложения произвольного натурального числа п в произведение простых чисел (с точ- ностью до порядка сомножителей) эквивалентна своему следствию: если некоторое простое число р делит ab, то р | а или р | Ь. Другое следствие состоит в методе отыскания всех делителей числа п, записанного в виде произведения степеней простых чисел: делители являются произведениями тех же простых чисел р в степенях, не превосходящих ordp п. Наиболь- ший общий делитель НОД(а, Ь) целых чисел а и b — это наибольшее целое число [21], [469], делящее одновременно а и Ь: НОД(а, 6) = П pmin^rdp^)’ordp^\ р Аналогично наименьшее общее кратное НОК(а, Ь) чисел а и b — это на- именьшее положительное целое число, делящееся одновременно на а и Ь: НОК(а, b) = pmax<ordp^’ordp^\ р Если разложения целых чисел а и b в произведение простых чисел неизвестны, то для нахождения НОД(а, Ь) можно воспользоваться до- вольно быстро работающим алгоритмом, который называется алгорит- мом Евклида и состоит в следующем: в предположении, что а b 1, вычисляется последовательность хо, *2, •••, где хо = а, =Ь и x/+i равно остатку от деления х/_ i на х/, до тех пор пока не получено х^ = 0; в результате НОД(а, b) — Xk-\ совпадает с последним ненулевым остат- ком. Число делений с остатком в алгоритме Евклида не превосходит 51og10max{|a|, |&|} («теорема Ламе»), см. [461], [848]. Наибольшее чис- ло делений с остатком реализуется для двух последовательных чисел Фи- боначчи а = Uk, b = Uk-\, где при i 1, щ> = и\ = 1. Из ал- горитма Евклида следует и быстрый способ нахождения таких целых чи- сел А и В, что Аа + В6 = НОД(а, Ь). (1.1.3) Для этого находим последовательно такие числа А/ и В/, что xz- = Azxo + 4- В/Xi, полагая Ao = В\ = 1, Ai — Bq = 0, Az_|_i = А/_! - tAt, Bt+\ = Bz-i - tBi, для i 1, где t определено из равенства xi+i = xz-i — tx\. Поскольку Xk-\ = = НОД(а, b), мы получаем решение уравнения (1.1.3): А = A^-i, В = Bk~\.
26 Элементарная теория чисел [Гл. 1 Алгоритм Евклида дает способ доказательства основной теоремы ариф- метики в форме эквивалентного ей утверждения о том, что если р | ab, то р | а или р | Ь, где р — простое число, а, b — целые числа. Действитель- но, если р\а, то НОД(а, р) = 1 по определению простого числа и в силу алгоритма Евклида имеем аи + pv = 1 для некоторых целых чисел и и v. Умножая обе части на Ь, получаем равенство abu + pbv = b, из которого видно, что р | Ь. 1.1.4. Вычисления с классами вычетов. С точки зрения алгебры, множество целых чисел Z является коммутативным ассоциативным коль- цом с единицей, т. е. множеством с двумя коммутативными и ассоциа- тивными операциями (сложение и умножение), связанными друг с другом законом дистрибутивности: для любых a, b, с е Z выполняется равенство a{b + г) = ab + ас. Понятие делимости в кольцах связано с понятием иде- ала. Идеалом / в коммутативном ассоциативном кольце R называется подмножество в /?, замкнутое относительно сложения, содержащее вместе с произвольным элементом ас/ и его противоположный элемент: —а € /, а также замкнутое относительно умножения на произвольные элементы из кольца. Идеал вида / = aR называется главным идеалом, порожденным эле- ментом а, и обозначается символом (а). Тогда отношение делимости а | b в кольце /?, т. е. соотношение b = ас для некоторого с е R, равносильно включению соответствующих главных идеалов: (b) С (а) (или b е (а)). В кольце Z деление с остатком на наименьший положительный элемент в идеале / / {0} показывает, что все идеалы главные, т. е. всякий ненуле- вой идеал / имеет вид (N) = NZ для натуральных чисел N > 1. При этом идеалы, максимальные по включению, в точности соответствуют простым числам. Остатки от деления на N подразделяют все целые числа на непе- ресекающиеся классы a = a + ?VZ, множество которых также образует кольцо, обозначаемое Z/NZ = Z/(/V) = {0, Т, ..., ЛГЙ}. Часто в задачах теории чисел вычисления в кольце Z можно сводить к вы- числениям в кольце вычетов Z/NZ. Это доставляет ряд удобств, напри- мер, на многие элементы из Z/?VZ можно делить, оставаясь в пределах этого кольца (в отличие от целых чисел, где всегда определено только деление на ±1). Действительно, если число а взаимно просто с N, т. е. НОД(а, N) = 1, то класс а обратим, так как в этом случае согласно урав-
Задачи о целых числах. Делимость и простота 27 нению (1.1.3) существуют такие целые числа х, у, что ах + Ny = 1, по- этому а • х = Г. Так получаются все обратимые элементы кольца вычетов Z/WZ, которые образуют группу по умножению, обозначаемую (Z/WZ)X. Порядок этой группы, т. е. число таких элементов а, что НОД(а, N) = 1 и 1 < а < N - 1, обозначается <р(ЛО {функция Эйлера). Название проис- ходит из обобщения малой теоремы Ферма, принадлежащего Эйлеру: аф(Л/) _ f в кольце z/?VZ, т. е. глл (1L4) ' = 1 (mod/V) для таких элементов а, что НОД(а, N) = 1. Вот простое доказательство: если Р = П F a€(Z/WZ)x, be(Z/nZ)* то отображение В i—> аВ является перестановкой множества (Z//VZ)X, по- этому произведение J] (ab)=cFw fl b совпадает с обратимым элементом Р, деление на который показывает, что ^ф(ло _ f Мы часто будем пользоваться записью a = b (mod /V) для целых чисел а, b и натурального числа /V, которая означает, что а = В в кольце Z/?VZ, т. е. N делит разность целых чисел а и 6, см. [21]. Если число N разложено в произведение N = N\ = ... = Nk попарно взаимно простых чисел, то имеется разложение Z/WZ^Z/W1Z® ...®ZMZ (1.1.5) в прямое произведение колец, что эквивалентно китайской теореме об остатках: для любых вычетов at (modM), найдется такое целое число а, что а = а/ (modiVi) (i — 1, ..., k). Практический поиск чис- ла а можно быстро осуществить, применяя повторно алгоритм Евклида. Положим Mi = N/Ni, тогда числа Л4, и /V/ по условию взаимно просты, т. е. НОД(Л4/, Ni) = 1, и в силу алгоритма Евклида (1.1.3) существуют та- кие целые числа X/, что Х/Л), = 1 (mod/V,). Положим теперь k a = Y^aiXiMi. (1.1.6) 1 = 1 Тогда мы видим, что для каждого i все члены в сумме (1.1.6), кроме /-го члена, делятся на Nj, поскольку Nj | Mi при / i. Следовательно, число а искомое, так как для всех i мы имеем a = aiMiXi=at (modM). Кроме того, из разложения (1.1.5) вытекает и разложение мультипликативной
28 Элементарная теория чисел [Гл. 1 группы'. (Z//VZ)X ^(Z/^Z)xe...®(ZMZ)x, (1.1.7) из которого, в частности, следует, что ср(Л/) = <p(/Vi) • • ср(Л/*). В специальном случае, когда N = q — простое число, кольцо вычетов Z/pZ является полем: в нем обратим любой элемент, отличный от нуля. Часто это поле обозначается символом F^. В этом случае группа (Z/pZ)x циклическая, т. е. она совпадает с множеством степеней некоторого (неод- нозначно определенного) элемента t = tq. Не существует ни одного эффек- тивного (т. е. полиномиального) алгоритма нахождения таких первообраз- ных корней. Напомним гипотезу Артина (о первообразных корнях): если а е Z не равно —1 или совершенному квадрату, то количество М(х, а) таких про- стых чисел р^х, что а является первообразным корнем по модулю р, ведет себя асимптотически как С(а)тс(х), где С(а) константа, зависящая только от а, а определение функции тс(х) см. в п. 1.1.6 (другая знаме- нитая гипотеза Артина (о голоморфности Л-рядов) будет обсуждать- ся в п. 6.4.5). В частности, существует бесконечно много таких простых чисел р, что а является первообразным корнем по модулю р. До сих пор никто не доказал эту гипотезу даже для случая одного выбранно- го а. Существуют частные результаты, например о бесконечности мно- жества таких простых чисел р, что порядок числа а делится на наиболь- ший простой множитель числа р — 1 (см., например, [593], [403], и [206]). Также до сих пор неизвестен эффективный алгоритм вычисления дис- кретного логарифма, (или индекса) x = ind/(a), определяемого для обратимого вычета a (mod q) по формуле a = tx (modq), 0<%<р-1. (1.1.8) Важнейшим открытым вопросом является само существование такого ал- горитма. Однако в том случае, когда все простые множители числа q — 1 невелики, существует удобный способ нахождения дискретного логарифма ind/(a) (см. [469], с. 98). Прежде всего, для каждого простого числа р, делящего q — 1, вычисляются корни степени р из единицы Гру. = ;№-1)/р (/ =0, 1, .... р - 1), в мультипликативной группе (Z/pZ)x (для вычисления высоких степеней t используется метод повторного возведения в квадрат из п. 1.1.2). Пусть таблица вычетов rpj уже составлена для всех р | (q - 1) и q - 1 = = П р^р —разложение числа q — 1. В силу китайской теоремы об р\(я-1) остатках (1.1.5) достаточно найти х (mod ра₽) для всех р | (q - 1). За-
§1.1] Задачи о целых числах. Делимость и простота 29 фиксируем р, а = ctp > 0 и будем искать х (mod ра) в виде х = х0 4-Xip + ... 4-%а-1Ра-1 (mod ра) (0^xz<p). Для нахождения первой цифры Хо вычисляется степень a{q~[^p е (Z/pZ)x, которая является корнем степени р из единицы, так как aq~{ = 1 (modp). Из сравнения а = tх (mod q) вытекает, что a(q-l)/p _ tx(q-\)/p = tx0(q-\)/p = Гр^ (mod^ Поэтому, сравнивая q^-^/p с элементами таблицы {rpj}, полагаем xq рав- ным тому значению /, для которого a^q~^p = rpj (modp). Чтобы найти следующую цифру х\, заменим а на ai = a/tx\ Тогда ind/(fli) = ind/(a) - xq = x} p + ... 4- xapa-1 (mod pa). Поскольку ai является р-й степенью, получим, что а^/р = 1 (mod?) и а(<7-1)/р2 = ^(х-х0)(<7-1)/р2 = ^(Х|+х2Р+...)(<7-1)/р = {Х\((]-\)/р _ Гр* Затем Х[ находится как такое значение /, для которого а^“9/₽2 = = rpj (modp). Остальные цифры xz находятся по индукции. При фиксированных q и t одну и ту же таблицу можно использовать для вычисления дискретных логарифмов различных элементов (алгоритм Сильвера—Полига—Хэллмана, см. [469]). Неудобство возникает, если число q — 1 делится на большое число р, из-за большого размера табли- цы {rpj}. На трудоемкости вычисления в общем случае дискретного ло- гарифма (так же как и разложения на множители) основаны интересные приложения к вопросам охраны информации (криптографии), см. §3.1 ([315], [410], [114], [619], [620], [374]). 1.1.5. Квадратичный закон взаимности и распознавание простоты числа. Пусть р и q — нечетные простые числа. Тогда согласно выдаю- щейся теореме, установленной Гауссом, если р = q = 3 (mod 4), то разре- шимость сравнения х2 = р (mod q) равносильна неразрешимости сравне- ния х2 = q (mod р). Во всех остальных случаях, если одно из сравнений разрешимо, то и другое разрешимо. Этот квадратичный закон взаимно- сти Гаусса использовался им для составления обширных таблиц простых чисел. Более тонкое, чем сравнение (1.1.2) малой теоремы Ферма, необ- ходимое условие простоты, применявшееся Гауссом, основано на свойстве цикличности мультипликативной группы (Z/azZ)x для простых чисел п. Из- влекая для нечетного простого п квадратный корень из левой и правой частей сравнения (1.1.2), мы получаем а(л-1)/2 = 1 или —1 по модулю п
30 Элементарная теория чисел [Гл. 1 в зависимости от того, является ли а квадратом по модулю п или нет, т. е. а(«-0/2 = Q) (modл), (1.1.9) где —символ Лежандра: для простого числа п по определению если а = 0 (mod/г), если а = b2 (mod л), b е (Z/mZ)x , иначе. Заранее мы не знаем, простое число п или составное, и в условии (1.1.9) вместо символа Лежандра используется символ Якоби который вводится для нечетного положительного числа п и любого целого числа а, определенного по модулю п: если дано разложение п = р\... р^ на простые множители (которые могут повторяться), то по определению где —символ Лежандра. Хотя в определении (1.1.10) участвует раз- ложение числа п на простые множители, фактическое вычисление этого символа не требует знания такого разложения и делается очень быстро. Для этого применяется расширенный квадратичный закон взаимно- сти ,п 1Ч 1Ч и два его дополнения где Р, Q — нечетные взаимно простые натуральные числа, а также свой- (а 1 а,о \ / а,\ \ ( а? \ Т-» —= I -jj-H Вычисления проводятся по той же схеме, что и в алгоритме Евклида, и требуют не более чем С logmax(P, Q) делений с остатком. Число п называется эйлеровым псевдопростым по основанию а, если НОД(а, п) = 1 и выполнено условие (1.1.9). Оказывается, не существует эйлеровых псевдопростых чисел п, аналогичных числам Кармихаэля: если для всех а, а е (Z/mZ)x выполнено сравнение (1.1.9), то п являет- ся простым числом. Этот факт легко выводится из китайской теоремы об остатках применительно к мультипликативной группе (Z/mZ)x. Более то- го, недавно найдены любопытные свидетельства в пользу предположения о том, что для составного числа п наименьшее число а, для которого уело-
§ 11] Задачи о целых числах. Делимость и простота 31 вие (1.1.9) не выполняется, не превосходит 2 logп log logп (см. [815]). Именно условие (1.1.9) лежит в основе быстрых современных способов распознавания простоты числа я, рассмотренных в гл.2, см. [114], [578], [524], [15]. В отличие от распознавания простоты, гораздо труднее разлагать на множители «случайные» большие числа, см. §2.3. В заключение этого пункта отметим, что поиски «явных формул» для простых чисел были традиционным предметом занятий бескорыстных лю- бителей теории чисел на протяжении долгого времени. Эйлер указал мно- гочлен х2 + х + 41, принимающий длинный ряд только простых значений. Но давно было известно, что множество значений многочлена /(х>, ... ..., хл) е Z[xi, ..., хп\ в целых точках не может состоять лишь из простых чисел, например, потому что если р, q—два достаточно больших про- стых числа, то сравнение f(x\, ..., хл) = О (mod pq) разрешимо (бесконеч- но многими способами). Тем не менее, оказалось, что множество простых чисел совпадает с множеством положительных значений, которые прини- мает при неотрицательных целых значениях аргументов многочлен степени 25 от 26 переменных — букв английского алфавита при неотрицательных целых значениях переменных: F(a, b, с, d, е, f, g, h, /, /, k, I, m, n, o, p, q, r, s, t, u, v, w, x, y, z) = = (k + 2){ 1 - [wz + h + j - q]2 - [(gk 4- 2g 4- k + 1)(Л 4- /) 4- h - z]2 - - [2n + p + q + z - e]2 - [ 16(£ + 1)3(£ + 2)(n + I)2 4- 1 - f2]2 - - [e3(e 4- 2)(a 4- I)2 4- 1 - o2]2 - [(a2 - l)p2 4- 1 - x2]2 - - [16r2p4(a2 -1)4-1- u2]2 - - [((a 4- u2(u2 - a))2 - 1)(л 4- 4dp)2 4- 1 - (x 4- cu)2]2 - - [n 4-1 4- v - y]2 - [(a2 - I)/2 4- 1 - m2]2 - [ai 4- k 4- 1 - I - i]2 - - [p 4- l(a - n — 1) 4- b(2an 4- 2a - n2 - 2n - 2) - m]2 - - [q 4- y(a - p - 1) 4- s(2ap 4- 2a - p2 - 2p - 2) - x]2 - - [z 4- pl(a - p) + t(2ap - p2 - 1) - pm]2}. (1.1.13) Этот многочлен был предложен в работе [444] (см. также гл. 3). Отметим индуктивное определение простых чисел с помощью рекуррентной форму- лы из работы [356] Рл+1 — 1 1 (1 (—1)г — log2 I 4- 2Р‘\-Р‘г _ 1 \ г=1 1^/1 п (1.1.14) полученное средствами комбинаторики.
32 Элементарная теория чисел [Гл. 1 1.1.6. Распределение простых чисел. При первом взгляде на табли- цу простых чисел нельзя объяснить, почему одно число является простым, а другое составным. В поисках закономерностей распределения простых чисел многие математики составляли большие таблицы простых чисел. В таблице Пелля 1668 г. перечислены все простые числа до 105. Лемер опубликовал ставшую широко известной таблицу простых чисел до 107 [522]. Современные таблицы [645] позволяют быстро определить просто- ту любого числа п < 25 • 109 с помощью необходимого условия простоты из малой теоремы Ферма 2Л-1 = 1 (mod я) и содержат все псевдопростые числа Ферма п <25- 109, т. е. составные числа, для которых выполнено указанное сравнение. Более интересен вопрос о законах, определяющих поведение простых чисел. Существование таких закономерностей обнаруживается, если изоб- разить график функции тс(х) — Card {р простое | р < х}. Эта функция увеличивается на 1, если х — простое число. Уже на графике функции тс(х), х 100, видно, что, за исключением небольших колебаний, тс(х) возрастает вполне регулярно, см. рис. 1.1. Если же расширить область определения от 100 до 50000, то эта регулярность становится особенно отчетливой, см. рис. 1.2. 10000 20000 30000 40000 50000 х Рис. 1.2 Другой способ выяснения закономерностей распределения простых чисел состоит в вычислении отношения х/тс(х), которое при больших х оказывается близким к logx (см. табл. 1.1). Глядя на эту таблицу, можно заметить, что при переходе от одной степени 10 к последующей отношение х/тс(х) увеличивается примерно на 2,3 «log 10; действительно, справедливо соотношение TtW~i^7’ т‘е' 1 ирн*-*00’ (1.1.15)
§ 111 Задачи о целых числах. Делимость и простота 33 Таблица 1.1 X к(х) х/к(х) 10 4 2,5 100 25 4,0 1000 168 6,0 10000 1229 8,1 100000 9592 10,4 1 000000 78498 12,7 10000000 664 579 15,0 100000000 5761455 17,4 1 000000000 50847543 19,7 10000000000 455052512 22,0 которое называется асимптотическим законом распределения про- стых чисел. Его предположил Гаусс в пятнадцатилетием возрасте при изу- чении таблицы простых чисел. Однако доказано оно было лишь в 1896 г. Адамаром и Валле Пуссеном аналитическими методами [42], [649], [45]. Первый выдающийся результат на пути к обоснованию асимптотического закона был получен в 1850 г. П. Л.Чебышёвым [98], который показал, что 0,89-^- < л(х) < 1,11-^—. logx log* Его доказательство использует свойства делимости биномиальных коэф- фициентов и элементарно, т. е. не использует теории функций комплексной переменной. Элементарное доказательство асимптотического закона полу- чили Сельберг и Эрдёш в 1949 г. [705], [96]. Еще более точное прибли- жение функции к(х) предположил сам Гаусс. Составляя вручную таблицы простых чисел, он заметил, что в окрестности достаточно большого чис- ла х простые числа встречаются среди всех натуральных чисел с частотой, близкой к l/(logx), и предложил приблизить тс(х) интегральным лога- рифмом Li(x) = J log/ Это наблюдение Гаусса уточнил Риман [677]. Он пришел к выводу, что вероятность того, что некоторое большое число х является простым, бу- дет с большей точностью задаваться функцией 1/logx, если учитывать не только сами простые числа, но и их степени, причем квадрат простого числа считать за половину простого, третью степень — за треть и т. д. Это приводит к следующему приближению, см. [850], [677], [675]: тс(х) + |тс(>/х) 4- |тс(\/х) + ... « Li(x). z о Эту зависимость можно обратить, воспользовавшись свойствами функ- ции Мёбиуса \i(n), которая является функцией натурального аргумента п (1.1.16)
34 Элементарная теория чисел [Гл. 1 и определяется следующим образом: ' 1, если п = 1, , ч 0, если п делится на квадрат простого числа, и(я) = . (—1) , если п есть произведение k различных простых чисел. (1.1.17) Обозначим функцию, стоящую в левой части формулы (1.1.16), через F(x): 00 1 F(x)=12 пк(х'/л)- Л=1 (1.1.18) Тогда справедливо соотношение п—\ (1.1.19) которое приводит к формуле Римана для количества простых чисел я(х)«/?(х) = £^1л(х'/я). п=\ (1.1.20) Доказательство соотношения (1.1.19) выводится из следующего свойства функции Мёбиуса [21]: _ 1, если п = 1, d|n [0, если л >1. (1.1.21) Действительно, преобразуем правую часть формулы (1.1.20), учитывая со- отношение (1.1.21): £ mF(x'/n) = £(^ £ = л=1 п=\ х т=\ 7 п=1 т=1 = f f ни) = «М. и=1 т\и и=1 х d\u 7 что и требовалось. Приведенное вычисление является примером преоб- разования Мёбиуса, основанного на свойстве (1.1.21), которое часто ис- пользуется в элементарной теории чисел и доказывается несложным ком- бинаторным рассуждением. Именно, пусть п = П!=1 РР > где Pi —различ- ные простые числа. Тогда d | п и [1(d) = (—1)\ если d является произве- дением в точности k различных простых чисел из заданного множества
§ 1.П Задачи о целых числах. Делимость и простота 35 всех s простых делителей числа п. Такая возможность реализуется в точ- ности для Q) различных делителей числа п. Если d делится на квадрат одного из чисел р,, то = 0, и при s > 1 (т. е. п > 1) мы получаем £>(«) = i>l)*Q) = (1 - I)2 = о, d\n k=0 что доказывает соотношение (1.1.21). Функцию, стоящую в правой части формулы (1.1.20) в честь Римана обозначают через /?(х). Как видно из табл. 1.2, взятой из работ [675], [676], [850], /?(х) представляет собой удивительно хорошее приближение к тс(х): Таблица 1.2 X Л(х) л(х) 100000000 5761455 5761552 200000000 11 078937 11079090 300000000 16252325 16252355 400000000 21336326 21336185 500000000 26355867 26355517 600000000 31324703 31324622 700000000 36252931 36252719 800000000 41 146179 41 146248 900000000 46009215 46009949 1000000000 50847534 50847455 Для функции /?(х) можно использовать выражение с помощью ком- плексного логарифмического интеграла Н(х), определенного равенством .. u~cv ez li(e“+w) = ~dz (1.1.22) — oo+w При х>2 функция Н(х) отличается от Li(x) на константу li(2)« 1,045. Функция Римана /?(х) = £^Н(х1/п) = /1=1 = li(x) - li(x1/2) - li(x1/3) - | li(xI/5) + li(xl/6) - ... Л u □ D является целой функцией переменного log(x), заданной быстро сходящим- ся степенным рядом: V—> /?(х) = 1 + > —----------тт, v 7 Z-/ т\тЦт + 1) /и=1 (1.1.23)
36 Элементарная теория чисел [Гл. 1 где х = е‘, OQ C(S)=^n-s= И (l-p-s)-‘ (1.1.24) п=\ р простое — дзета-функция Римана (ряд (1.1,24) абсолютно сходится при Re(s)> 1). В заключение этого пункта отметим, что, хотя Риман и не доказал асимптотического закона распределения простых чисел, он сделал нечто гораздо более удивительное — дал явную формулу для точного значения тс(х). Эта формула выглядит так: 00 я = ВД - р(х») + 5 (ai _“|og|j - Iog2, (1.1.25) где суммирование ведется по корням дзета-функции Римана C(s), ана- литически продолженной на все числа s G С, 5 1, а Fo(x)= |im ^+A+FSX~^ обозначает функцию, которая получается, если несколько сгладить сту- пенчатую функцию (1.1.18). Формула (1.1.25), опубликованная Риманом в 1859 г., была доказана Мангольдтом в 1895 г. Отметим, что ряд по р в формуле (1.1.25) лишь условно сходится и порядок суммирования за- дается абсолютной величиной корней р [45], [292]. Корни эти (помимо так называемых «тривиальных» корней р = —2, —4, —6, ..., дающих незначительный вклад в общую сумму) являются комплексными числа- ми с вещественной частью, заключенной между 0 и 1; первые десять из них таковы [850], [675], [676]: Р1 = ^ + 14,134735/, pi = - 14,134735/, р2 = | + 21,022040/, Р2 = 5 - 21,022040/, рз = | + 25,010856/, рз = ^ - 25,010856/, р4 = 1 + 30,424878/, р4 = 1 - 30,424878/, р5 = 1 + 32,935057/, р5 = 1 - 32,935057/. Легко показать, что если £(р) = 0, то и £(р) = 0. Из формулы (1.1.25) сле- дует оценка тс(х) - li(x) = О(хе logx), (1.1.26)
§ 1.2] Диофантовы уравнения первойи второй степени 37 Где 0 = sup Rep. Если бы было известно, что 0 < 1, то оценка (1.1.26) была бы нетривиальной. К сожалению, известно лишь, что на прямой Re(s) = 1 нет корней, см. [431], [45]. Знаменитая гипотеза Римана о том, что ве- щественная часть нетривиального корня равна 1/2, еще никем не доказана. Из нее следовало бы, что справедлива оценка тс(х) = li(x) + О(х^2 log %). Однако эти вопросы уже далеко выходят за рамки элементарной тео- рии чисел (см. также монографии [ВК94], [ВоОб]). Явные формулы типа формулы Римана—Мангольдта и дзета-функции будут обсуждаться ниже, см. часть II, гл. 6, §6.2. § 1.2. Диофантовы уравнения первой и второй степени 1.2.1. Уравнение ах + by = с. В этом параграфе все буквы (коэф- фициенты и неизвестные в уравнениях) означают целые числа. Докажем, что множество /(а, Ь) = {с: уравнение ах + by = с разрешимо (в целых числах)} имеет вид dZ, где d — наибольший общий делитель чисел а и Ь. В са- мом деле, нетрудно проверить, что если q, С2 € /(а, Ь), то Ci ± С2 € /(а, Ь) и ес\ е 1(а, Ь) для всех е € Z. Все числа с из множества /(а, Ь) делятся на общие делители чисел а и 6, а значит, и на d = НОД(а, Ь), причем из алго- ритма Евклида (1.1.3) следует, что d е 1(а, Ь). Следовательно, /(а, Ь)— идеал кольца Z, совпадающий с (d) = dZ (см. п. 1.1.4). Таким образом, уравнение ах + Ьу=с (1.2.1) разрешимо, только если d делит с: с = de. Конкретное решение находит- ся с помощью алгоритма Евклида: если аХ + bY = d, то а(еХ) + Ь(еУ) = с и числа xq = еХ, у$ = еУ удовлетворяют уравнению (1.2.1). Теперь мы по- лучили все целочисленные решения: X = Хо - у = уо + (b/d)t, где t — произвольное целое число. Действительно, из равенств ах + by = с, ахо + Ьуо = с следует, что ax + by — (axQ + Ьу0) = a(x-xQ) + b(y - у 0) = 0, у -уо= - , и из взаимной простоты чисел a/d и b/d следует, что у — z/o = (a/d)t Для некоторого целого числа /, следовательно, xq — х = (b/d)t. Уравне-
38 Элементарная теория чисел [Гл. 1 ние (1.2.1) дает первый пример общей проблемы: для системы уравнений Л1(Х1, ...» хп) = 0, ...» Fm(x\, хп) = 0, (1.2.2) заданной целочисленными многочленами F/(xi, ..., хп) € Z[xi, ..., хп], най- ти все целочисленные (или все рациональные) решения. Для уравнения (1.2.1) задача нахождения рациональных решений тривиальна. Если в си- стеме (1.2.2) все уравнения Fi = 0 линейные, то и для нее все рациональ- ные решения легко находятся последовательным исключением неизвест- ных (например, по методу Гаусса). 1.2.2. Диофантовы системы линейных уравнений. Опишем общий прием нахождения всех целочисленных решений системы (целочисленных) линейных уравнений, записанной в матричной форме Ах = Ь, (1.2.3) где fan а12 ... aln\ fхЛ fbA 4= .................. €Mm,n(Z), х = I ... I , b = ... . am2 ••• amn J \Xn J \bmj С помощью теории элементарных делителей матрицы эта задача также сводится к применению алгоритма Евклида. Элементарным преобразова- нием над Z строк матрицы назовем преобразование, при котором к некото- рой строке прибавляют другую, умноженную на целое число, а остальные строки не меняют. Проверяется, что применение такого преобразования эквивалентно умножению исходной матрицы слева на некоторую матрицу U е SLm(Z) (целочисленную матрицу с определителем, равным 1). Анало- гичное преобразование столбцов равносильно умножению матрицы спра- ва на V е SL^Z). Матрицы U, V имеют вид Е/ДХ) = Е + Хе,; (где X — целое число, а матрица в/; имеет единственный ненулевой элемент в /-й строке, /-м столбце, равный 1) и называются элементарными матрицами над Z. Применение нескольких таких преобразований с элементарными матрицами ^ESU(Z), Vi,..., V/GSU(Z) приводит матрицу к виду UAV (U = V = V\ ... V/, а целочислен- ные решения соответствующей системы уравнений UAVy = Ub (1.2.4) и исходной системы (1.2.3) взаимно однозначно соответствуют друг другу по формуле х = Vy. Теперь наибольший общий делитель d\ элементов мат- рицы А можно найти повторным применением алгоритма Евклида к ее элементам а^, используя элементарные преобразования строк и столбцов и при необходимости меняя знак строки так, что преобразованная матри-
§ 1-2] Диофантовы уравнения первойи второй степени 39 ца Д' примет вид (dx 0 ... 0\ А' = ° л А[ \0 / Д'= и'AV'. Затем то же рассуждение можно повторить для Л' и воспользоваться индукцией. Полученная в результате матрица примет диагональный вид /d\ 0 0 ... 0\ dz = UAV. (1.2.5) \о ...... О/ Теперь мы получаем решение преобразованной (а поэтому и исходной) целочисленной системы линейных уравнений: 0/М , У\ = I • \Уп/ где при / = 1, ..., г целые числа yt находятся из простейших соотноше- ний diyi = Ci, с = Ub, а при / > г, а = 0 принимают произвольные целые значения. Критерий совместимости над Z системы уравнений (1.2.4) те- перь очевиден: он определяется условиями di | q для всех i г, С/ = 0 при i > г. Числа di называются элементарными делителями матрицы А, а d\ ...-di совпадают с наибольшими общими делителями всех миноров порядка i матрицы А, так что di | dz+i при i = 1, ..., г — 1. Поэтому си- стема (1.2.4) (и (1.2.3)) совместна над Z в том и только в том случае, когда у матрицы Л и у расширенной матрицы (А\Ь) совпадают НОД всех миноров порядка i, i = 1, 2, ..., т. Отсюда следует и такая формулировка критерия совместности над Z системы (1.2.3): для этого необходимо и достаточно, чтобы была разрешима соответствующая система сравнений Ах = b (mod N) по любому натуральному модулю W > 2. Критерий такого рода называется принципом Минковского—Хассе и часто встречается в задачах диофан- товой геометрии, см. п. 1.2.4 и §4.5, 5.3. Гораздо менее простым является вопрос о поиске «наименьшего» це- лочисленного решения, который относится к большому направлению, на- зываемому геометрией чисел, Зигель [751], [93] показал, что система линейных уравнений а/1%1 4-... + ainXn = 0 (z = 1, ..., т), п> т, где aij — целые числа, не все равные нулю и ограниченные величи- ной В, имеет нетривиальное целочисленное решение (хь ..., хп) с коорди-
40 Элементарная теория чисел [Гл. 1 натами, ограниченными величиной 1 4- (пВ)т^п~т}, Если строки матрицы А = (aij) линейно независимы, a d —наибольший общий делитель мино- ров порядка т матрицы Л, то более точная верхняя граница для решений имеет вид (d-1 ^/det(/lT • А))[^п~т}. Обобщение этой оценки на алгебра- ические числовые поля было предложено Бомбьери и Ваалером в работе [185] с использованием тонких результатов геометрии чисел (теория Мин- ковского последовательных минимумов квадратичных форм, см. [220]. Трудной и важной для приложений является задача о поиске реше- ния линейной диофантовой системы в неотрицательных целых числах (задача целочисленного линейного программирования). Отметим такой ее вариант, как задача укладки рюкзака: для данного множества нату- ральных чисел {а,} (/ = 1, ..., п) и b найти набор чисел еь ..., гп е {0, 1} с условием 52^8/ — Ь (см. [469], [525]). Трудность решения этой задачи i=\ (в смысле количества необходимых операций) нашла любопытные прило- жения в криптографии — теоретическом шифровании, см. гл. 2. 1.2.3. Уравнения второй степени. Для диофантова уравнения п п f(x\, Х2, хп) = 52aiix‘xi + 52Ьм + с = 0 (1.2.6) Kj /=1 находить целочисленные решения значительно труднее, чем рациональные, хотя и эта задача уже нетривиальна. Известный пример связан с рацио- нальной параметризацией окружности х2 + у2 = 1 по формулам уни- версальной подстановки 2/ 1 — t2 х = ^~р' У = Т+Р <X = COS<P> i/ = sin(p« ^ = tg(<p/2)), (1.2.7) из которой следует описание всех примитивных пифагорейских троек (X, У, Z), X2 + У2 = Z2, НОД(Х, У, Z) = 1, по формулам X = 2ии, У = = и2 — v2, Z = и2 4- V2, где и > v > 0 — взаимно простые числа противо- положной четности. Для этого надо в формулах (1.2.7) положить t = u/v, X=xZ, Y=yZ, Z = u2 + v2. Вообще, при отыскании рациональных решений уравнения (1.2.6) удобно перейти к квадратичной форме п F(X0, Х\, ...,%«)= 52 hX‘Xi = м=о п п = 52 faXiXj + 2 52 МХ0 + /ооХо2, (1.2.8) ij=\ i = \
§ 1.2] Диофантовы уравнения первойи второй степени 41 где fa = f ji = ач/2, если 1 < i < j п, fu = аи, /о; = Ао = Ь,/2, если i = = 1, 2, п, foo = с. Для этого надо заменить неоднородные коорди- наты X], хп на однородные Xq, Х\, .Хп по формулам X, = х,Хо (/ = 1, 2, ..., п). Квадратичная форма F(X) является однородным много- членом второй степени, который удобно записывать в матричной форме F(X)=XT4fX, Хт = (Хо, *1, с матрицей Ар = ([^). Если существует рациональное решение Х° Ф (0, ..., 0)т уравнения F(X) = 0, то говорят, что F представляет нуль над полем рациональных чисел. Это уравнение определяет квадрику Qp, которую мы будем рассматривать как гиперповерхность в комплексном проективном пространстве СР2: Qf = {(z0 :zi : ...:z„) e CP" | F(z0, zb z„) = 0}. Напомним, что пространство СР2 состоит из прямых (zo : : zn) в век- торном пространстве Сл+1, проходящих через начало координат, с на- правляющим вектором (zo, Zj, ..., zn) ± (0, ..., 0). Рациональное реше- ние Х° = (Х§, X°, ..., Х^) (0, ..., 0) определяет точку (Х° : Хр :...: Х^) на квадрике Qp. Остальные рациональные точки (рациональные реше- ния) легко найти: они совпадают с точками пересечения квадрики Qp со всевозможными прямыми, выходящими из Х° в направлении вектора с ра- циональными координатами. Надо только, чтобы точка Х° не была «вер- мут шиной» на Qp, т. е. чтобы выполнялось равенство (Х°) 0 хотя бы для одного i = 0, 1, ..., п. Если это условие выполнено для всех точек квадри- ки Qp, то такая квадрика называется невырожденной; это равносильно тому, что матрица AF G Мп+[ (Q) формы F невырождена: det Ар 0. Гео- метрически этот прием означает проектирование квадрики Qp на гипер- плоскость с центром в точке Х° = (Xq : Х^ :...: X®) («стереографическая проекция»). Если У0 = (Yq : У^ :...: У°) — другая точка с рациональны- ми координатами, то точки прямой, проходящей через Х° и У0, имеют вид Х04-^У°, где и, v — параметры на этой (проективной) прямой, при- чем (и : и) = (1 : 0) отвечает решению Х°: F(X®, Xf\ ..., Х%) = 0. Подбе- рем рациональное значение v 0 и и G Q так, чтобы выполнялось равен- ство F(uX® + уУ°) = 0. Поскольку F(uX®) = u2F(X°) = 0, применим разложение Тейлора много- члена F(Xq, Х\, ..., Хп) в точке иХ°: m2F(X°) + uv + и2Л(У°) = 0.
42 Элементарная теория чисел [Гл. 1 Если F(y0) = 0, то положим v = 1, и = 0. Если F(YQ) / 0, то находим v = -uJ2^(X°)Y^/F(Y°). (1.2.9) Случай, когда из формулы (1.2.9) получается v = 0, отвечает касанию квадрики Qf и данной проективной прямой. Случай F(YQ) =0 отвеча- ет в неоднородных координатах «асимптотическому направлению», когда вторая точка пересечения прямой и квадрики «уходит на бесконечность», соответствуя бесконечному значению неодно- а родного параметра t = v/u на прямой. При- мером рассмотренной конструкции, записан- ным в неоднородных координатах, явля- , ’ ются формулы (1.2.7): чтобы найти все па- J► ры (х, у) рациональных чисел, для кото- I рых х2 + у2 = 1, х / 0, у / 0 и точка (х, у) лежит в первом квадранте плоскости, рас- смотрим прямую / с угловым коэффициен- Д(0 -1) том /, проходящую через точки (0, -1) и (х, у) (см. рис. 1.3). Если х, у е Q, то и t е Q. Об- рис 1 з ратно, если параметр t рационален, то коорди- наты точки пересечения прямой / с указанной на рисунке единичной окружностью определяются как корни квадратно- го уравнения с рациональными коэффициентами, причем один из корней известен и отвечает точке (0, —1), а второй дает формулы (1.2.7). При нахождении рациональных решений уравнения F(X0,^i, ...,%«) = 0 (1.2.10) с квадратичной формой (1.2.8) можно считать, что форма F диагональна: метод Лагранжа выделения полных квадратов дает замену переменных X = CY с рациональной невырожденной матрицей С е Мп+\(Q), det С / 0, Ут = (Ко» , ¥п), Для которой F(X) = G(Y) = а0У02 + ai У2 + - + anY^, G(Y) = Y\CjAfC)Y, а0, ai,....a„eQ. Для однородных уравнений типа (1.2.10) нет существенной разницы между их целочисленными и рациональными решениями: после умножения на подходящее целое число любое рациональное решение становится цело- численным, и его можно считать примитивным, т. е. имеющим взаимно простые в совокупности координаты. Наиболее фундаментальным фактом теории квадратичных форм над полем рациональных чисел является сле- дующий результат.
§ 1.2] Диофантовы уравнения первойи второй степени 43 1.2.4. Принцип Минковского—Хассе для квадратичных форм. Теорема 1.2. Цело численная квадратичная форма F(xi, ..., хп) ранга п представляет нуль над полем рациональных чисел тогда и только тогда, когда сравнение F(x\, ..., хп) = 0 (mod/V) имеет при- митивное решение для всех натуральных чисел N и форма F пред- ставляет нуль над полем вещественных чисел (т. е. она неопреде- ленная), см. [14], [222]. Конечно, утверждение «только тогда» тривиально: достаточно рассмот- реть по модулю N и над К целочисленное решение (xj, х%, ..., хл), кото- рое, как сказано, можно считать примитивным; примитивность решения сравнения по модулю N означает, что хотя бы одна из координат взаимно проста с N (обратима в кольце вычетов Z/WZ). Приведем красивое дока- зательство этой теоремы для случая, рассмотренного Лежандром: п = 3, F(xi, х2, x3) = aixf+ а2*2+азХз (aia2a3/0) (см. [14], [432], теорема Лежандра). Неопределенность формы означает, что не все коэффициенты а\, а%, а3 одного знака. Умножив форму при необходимости на — 1, мы придем к слу- чаю, когда два коэффициента положительны, а один отрицателен. Кроме того, мы можем считать числа а\, а%, аз целыми, свободными от квадратов и взаимно простыми в совокупности, так как их можно сократить на наи- больший общий делитель. Далее, если, например, а\ и а2 имеют общий простой делитель р, то, умножив форму на р и взяв рх и ру за новые переменные, мы получим форму с коэффициентами а\/р, а%/р и раз. По- вторяя этот процесс несколько раз, мы заменим нашу форму формой вида ах2 + by2 - cz2, (1.2.11) в которой целые положительные числа а, b и с попарно взаимно просты (и свободны от квадратов). Пусть теперь р — какой-нибудь простой дели- тель числа с, отличный от 2. Можно показать, что поскольку для исходной формы F существует примитивное решение сравнения F(x) = 0 (mod р1) для любого / > 1, сравнение ах2 + £н/2 = 0 (mod р) имеет нетривиальное решение (хо, Уо). Следовательно, можно предполагать, что z/o^O, и вы- полняется разложение на множители ах2 + by2 = ау^'(ху0 + ух0)(ху0 - ух0) (mod р). Аналогичные разложения имеют место по модулю нечетных р, делящих коэффициенты а и Ь, а при р = 2 выполняется сравнение ах2 + by2 - cz2 = (ах + by - cz)2 (mod 2). Таким образом, для любого простого числа р, делящего 2abc, существу- ют линейные формы и от х, у, z с целыми коэффициентами
44 Элементарная теория чисел [Гл. 1 такие, что F = (mod р). Теперь с помощью китайской теоре- мы об остатках (см. п. 1.1.4) найдем такие линейные формы Цх, у, z) и М(х, у, z) над Z, чтобы L(x, у, z) = L(p)(x, у, z) (mod р), Л4(х, у, z) = М(р)(х, у, z) (mod р) для всех р | abc, и мы получим ах2 + by2 - cz2 = Цх, у, z)M(x, у, z) (modabc). (1.2.12) Будем придавать переменным %, р, z целые значения, удовлетворяющие условиям О^хсУЬс, 0^p<\/ac, §^z <Vab. (1.2.13) Если исключить из рассмотрения тривиальный случай а = b = с = 1 (см. п. 1.2.3), то не все числа Vbc, Vac, Vab целые и число троек (%, р, z), удовлетворяющих условиям (1.2.13), строго больше чем Vbc • Vac • Vab = = abc. Следовательно, для некоторых двух различных троек (хь у\, Z\) и (*2, //2, 22) справедливо сравнение L(x\, у 1, Zi) = Цх2, //2» 22) (mod abc), откуда в силу линейности формы L получаем Цх^, Уо, 20) = 0 (modabc) (1.2.14) для хо = Xi - Х2, ро = У\ ~ У2, 20 = Zi - 22. Из сравнений (1.2.12), (1.2.14) вытекает, что axQ + bz/o - cZq = 0 (modabc), (1.2.15) а из неравенств (1.2.13) для (xj, у\, z\), (Х2, у%, 22) имеем |xq| < Vbc, |ро| < < Vac, |zo| < Vab. Поэтому имеют место неравенства -abc < axfj + bz/o - czq < 2abc, а из сравнения (1.2.15), таким образом, следует, что справедливо одно из двух равенств axo + byo - czq = 0 (1.2.16) или же ахо + byQ - czq = abc. (1.2.17) В случае (1.2.16) теорема доказана; если же выполнено равенство (1.2.17), то доказательство следует из тождественного преобразования a(xozo + Ьу0)2 + Ь(рО2о - ах0)2 - c(z$ + ab)2 = 0. Решение является нетривиальным, по крайней мере при z2 4- ab 0, а при Zq 4- ab = 0 тройка (zq, a, 0) является нулем.
§ 1-2] Диофантовы уравнения первойи второй степени 45 В формулировке Лежандра диофантово уравнение а\х2 4- й2%2 + аз*з = О имеет нетривиальное целочисленное решение в том и только в том случае, когда разрешимы сравнения х2 = -а2йз (modai), х2 = -а]а3 (mod02), x2 = -aja2 (modаз), причем предполагается, что aj, a2, аз — свободные от квадратов попарно взаимно простые целые числа, не все одинакового знака. Можно дока- зать, что рациональная квадратичная форма от пяти и более переменных всегда представляет нуль над Q, если, конечно, она невырождена, т. е. не сводится к форме от меньшего числа переменных. В общем случае суще- ствуют эффективные методы, чтобы установить, представляет ли квадра- тичная форма рациональный нуль. Эти методы основаны на информации, которую можно извлечь из вещественных и конгруэнциальных рассмотре- ний. Однако кольцо вычетов Z//VZ может иметь делители нуля, что делает утомительным обращение со сравнениями, и применяется другой подход, связанный с формулировками в терминах р-адических чисел, который будет рассмотрен ниже (см. п. 4.2.5, 4.3.1, 5.3.5 и [222]). 1.2.5. Уравнение Пелля. Для неоднородных задач разница между це- лыми и просто рациональными решениями существенна. Например, если d — натуральное число, то рациональные решения уравнения х2 — dy2 = \ (1.2.18) находятся тривиально. Уравнение (1.2.18) в целых числах, где d —число, свободное от квадратов, известно как уравнение Пелля. Допустим, что уравнение (1.2.18) имеет нетривиальное решение (хо, //о)» *о > 0, z/o > 0. Это решение называется наименьшим, если при х = xq, у = уо линей- ная форма х 4- у/dy принимает наименьшее значение на множестве всех целых положительных решений уравнения (1.2.18). Не существует двух наименьших решений: если предположить, что таковы (xj, у\) и (х2, //2), то Xi - Х2 = (z/2 - y\)Vd, что противоречит иррациональности чис- ла \fd. Можно показать, что всякое решение уравнения (1.2.18) име- ет вид (±хл, ±//л), где хп 4- \fdyn = (хо 4- y/dyo)n, п — натуральное чис- ло, (хо, //о) — наименьшее решение. Наиболее естественное доказательство основано на рассмотрении множества чисел а 4- b\/d с рациональными а и Ь. Это множество является полем, которое обозначается К =Q(y/d) и представляет собой векторное пространство размерности 2 над Q. Мно- жество А = Z 4- Z\/d —подкольцо в /С Рассмотрим отображение <ра: 0 и-> 1—> ар умножения элемента ре Д’ на фиксированное число ct = а + b\/d; тогда сра — это линейное преобразование поля К над Q (например, в ба-
46 Элементарная теория чисел [Гл. 1 зисе {1, \fd} матрица <ра равна ). Определитель det<ра называют (алгебраической) нормой числа а и обозначают Na = N/c/Q(a) = а2 - db2. По свойствам определителей N(ap) = Na• Лф (a, 0 € К). (1.2.19) Теперь наша задача свелась к тому, чтобы найти все элементы a € Д, для которых N(a) = 1. Из свойства (1.2.19) следует, что это множество являет- ся группой по умножению, в которой положительные элементы образуют циклическую подгруппу: {аеД|а>0, N(a) = 1} = (%о + где (%о, Уо) — наименьшее решение с положительными коэффициентами хо, Уо- В классической теории чисел известно несколько способов нахождения наименьшего решения, один из них описан ниже в § 1.4 и основан на поиске наилучших приближений иррационального числа y/d рациональными чис- лами х/у. Совершенно иной способ предложил Лежен Дирихле: в 1837 г. он нашел связь решений уравнения Пелля со значениями тригономет- рических функций. К примеру, для d = 13 из его формулы следует, что *о + yvfd = т)2, где . 2к . 5к . 6к П = sin i3sin 13Sin 13 sin eQ(vT3) 13 Sln 13 sm 13 к . Зк . 4к см. [316], [14], [560]. Позже Кронекер в 1863 г. дал явную формулу для %о + yvfd через специальные значения эллиптических функций (см. [480], [754], [838]). Решение самых общих уравнений второй степени с двумя неизвест- ными в целых числах с помощью целочисленных замен переменных можно свести к уравнениям типа уравнения Пелля. 1.2.6. Представление целых чисел и квадратичных форм квадра- тичными формами. Пусть f(x\, ...,хп), g(y\, ->-,Ут)— целочисленные квадратичные формы с матрицами А = АТ € Л4Л(Й) и В = Вт € Mm(Z): п f(x) = f(x\, ..., xn) = 57 aijXiXj = Л[х] = хтЛх, i./=l g(y) = g(yi.......Ут) = £ bijyiy, = B[i/] = y*By,
§ 12] Диофантовы уравнения первойи второй степени 47 где приняты обозначения А[х]=хтАх, В[у] = утВу, хт = (xj, ..., х„), у1 = (t/j, ..., ym). Будем говорить, что квадратичная форма f пред- ставляет форму g над Z, если для некоторой целочисленной матрицы С € Мп,т^А выполнено тождество f(Cy) = g(y), т. е. А[С]=В. (1.2.20) В частности, при т = 1 пусть g(y) — by2, тогда определение (1.2.20) эк- вивалентно тому, что f представляет над Z число Ь\ для некоторых целых чисел ri, ..., сп, выполнение соотношения f(c\, ..., cn) = b. Рассмотренное выше уравнение Пелля является частным случаем го- раздо более трудной задачи о представлении целых чисел квадратич- ными формами. Лагранж доказал, что всякое целое число b > 0 предста- вимо суммой четырёх квадратов. Этот факт выводится из более трудной теоремы Гаусса о том, что целое положительное число b тогда и только тогда является суммой трех квадратов, когда оно не является числом вида 4Л(8/ — 1), где k, / е Z. Действительно, отсюда вытекает, что если b > 0 — целое число, то его можно записать в виде 4*а, где а не делится на 4, и при а = 1, 2, 3, 5, 6 (mod 8) число а есть сумма трех квадратов и это же верно для Ь. Если это не так, т. е. а = 7 (mod 8), то а - 1 явля- ется суммой трех квадратов; в этом случае а является суммой четырех квадратов и это же верно для Ь, см. [720], [222]. Пусть rk(n) = Card{(ni, ..., n^)eZ^ | п2 4-... + п2 = п} (1.2.21) — число представлений п в виде суммы k квадратов. Так, например, гг(5) = = 8, поскольку 5 = 22 + I2 = 22 + (-1)2 = (—2)2 + I2 = (—2)2 + (-1)2 = = I2 + 22 = (-1)2 + 22 = I2 + (—2)2 = (-1)2 + (-2)2. В большом числе случаев найдены формулы для чисел представлений гь(п) (обширную литературу см. в книге Л. А. Когана [47]). Приведем лишь классический результат Якоби, см. [603], [720], [121]: r4(n) = 1 d|n если n нечетно, если п четно. (1.2.22) d\n, d нечетно Метод доказательства этой теоремы основан на введении производящей функции для чисел r*(n): ^2rk(n)qn= = 0(т)*, п=о (щ..nk)e%k
48 Элементарная теория чисел [Гл. 1 1ДС - - 2 9(т) = qn (q = ехр{2гат}) (1.2.23) — тэта-функция, которая рассматривается как голоморфная функция на верхней комплексной полуплоскости Н = {т е С 11т(т) > 0} и обладает рядом замечательных аналитических свойств. Эти свойства позволяют однозначно охарактеризовать 04(т) как эле- мент некоторого конечномерного векторного пространства голоморфных функций на Н, а именно модулярных форм веса 2 относительно группы Го (4), где Го(Л/) = €SL2(Z)| Л/делите}. (1.2.24) Другими словами, голоморфный дифференциал 04(т)^т не меняется при дробно-линейных преобразованиях т (ат 4- 6)(ст + d)-1 с матрицей /а ( ) е Го(4) и удовлетворяет условиям регулярности роста в «парабо- ле d J лических вершинах»; подробнее такие функции будут рассмотрены ниже, см. §6.3. Конечномерность пространства позволяет однозначно восста- новить все коэффициенты Фурье функции 04(т) по двум первым, откуда выводятся формулы (1.2.22). Этот прием является очень общим: для поло- жительно определенной квадратичной формы /(хь ..., х&) = Л[х], 2az/, an G Z, можно составить тэта-ряд оо 9(т; /)= S е(/(х)т) = ^г(/; n)q", (1.2.25) xe%k «=о где , е(т) = ехр{2тит} = q, r(f; ri) = Card {х G V | /(х) = п} — число представлений целого числа п 0 квадратичной формой /; то- гда ряд (1.2.25) является некоторой модулярной формой веса k/2 на верхней комплексной полуплоскости, что позволяет получать различные точные формулы для чисел r(f; п). Последние достижения в представлении целых чисел в виде суммы квадратов, сделанные Г. Шимурой, можно найти в [745], [746]. Приведем одну из точных формул, принадлежащую А. Н. Андрианову (см. [4], [94]): если f = х2 + у2 4- 9(z2 4- /2), то 0(т; f) является модуляр- ной формой веса 2 относительно Го(36) и для простого числа р, (р, 6) = 1, выполняется равенство р— 1 о Л/; /’) = 5(P + 1)-|Z(411); 0-2.26) х=0 Р в сумме справа стоит символ Лежандра, см. п. 1.1.4.
§ 1.2] Диофантовы уравнения первойи второй степени 49 Традиционной областью применения производящих функций являет- ся комбинаторика и теория разбиений. Пусть р(п) — число разбиений натурального числа п в сумму натуральных неубывающих слагаемых: р(1) = 1: 1 = 1; р(2) = 2: 2 = 2, 1+1; р(3) = 3: 3 = 3, 2 + 1, 1 + 1 + 1; р(4) = 5:4 = 4, 3 + 1, 2+2, 2+1 + 1, 1 + 1 + 1 + 1; р(5) = 7:5 = 5, 4 + 1, 3+2, 3+1 + 1, 2+2+1, 2+1 + 1 + 1, 1 +1 +1 +1 +1. Тогда для производящей функции для р(и) справедливо тождество Эй- лера (см. [226], [121]): 1 + ^p(n)qn = J](l при|?|<1. (1.2.27) п=1 т=1 Действительно, непосредственное перемножение показывает, что П(1 -qmr' = ГР1 +<7'" + <72,п+<73'"+ •••) = = (1 +<7 + <72 + <73 + ...) х (1 + + ...) х ... ... х (1 + qk+ q2k+ q3k + ...) х ...= ^i+2«2+3a3+...( яз^О- а р(п) как раз и есть число решений в целых числах а\, а%, аз, ..., ^0 «уравнения с бесконечным числом переменных» а\ 4“ 2ci2 4” Заз — п. Оказывается, тэта-ряды квадратичных форм тесно связаны с бес- конечными произведениями типа (1.2.27): к примеру, при |^| < 1, z /0 справедливы тождества (см. [121]) znqn2 = [J(l — q2m+2)(l + zq2m+l)(l + z-lq2m+l) (Якоби), п=—oo т=0 \^qn(n+\)/2 __ J^J(1 _g2m)(i (Гаусс), n=0 m=\ которые следуют из более общего тождества Коииг. 1 (1 - д)(1 — qa)...(\ — aqn~l)tn = -гт- (1 - atqm) (1-<?)(1-<72)...(1-<?«) U (l-tqr*’ при |<?| < 1, |/| < 1, аеС. (1.2.28)
50 Элементарная теория чисел [Гл. 1 В последнее время было открыто много новых тождеств, содержащих бес- конечные произведения и связанных с квадратичными формами и систе- мами корней простых алгебр Ли, а также с характерами простых ко- нечных групп, см. [536]. Впечатляющим примером использования производящих функций явля- ется данное Борчердсом [186] доказательство гипотез Конвея и Нортона о связях между т. н. простой группой монстра М (а также другими про- стыми спорадическими группами) и модулярными функциями. Эта группа является наибольшей простой конечной спорадической группой, ее поря- док равен 808017424794512875886459904961710757005754368000000000 = = 246 • З20 • 59 • 76 • II2 • 133 • 17 • 19 • 23 • 29 • 31 • 41 • 47 • 59 • 71. Размерность наименьшего нетривиального неприводимого комплекс- ного представления группы М равна 196883, что на 1 меньше первого нетривиального коэффициента в (/-разложении знаменитой эллиптической модулярной функции j(q). На самом деле j(q) = q~l + 744 + 196884? + 21493760?2 +..., и другие коэффициенты в разложении функции j оказываются простыми комбинациями размерностей (или, другими словами, следов тождественных операторов) представлений группы М. Конвей и Нортон предположили в [281], что функции jg(q), получае- мые при замене следов тождественных операторов на следы выбранного элемента g из М, являются модулярными функциями «рода нуль». Други- ми словами, если Gg— подгруппа в SL2(IR), оставляющая инвариантным jg(q), то фактор верхней половины комплексной плоскости по Gg явля- ется сферой без конечного числа точек, соответствующих параболическим вершинам группы Gg, см. §6.3. Доказательство этих гипотез настолько же выдающееся, насколько и они сами, исходно названные лунными гипотезами. Оно использует тео- рию вертексных алгебр и обобщенных алгебр Каца—Муди, см. [475]. Оказывается, некоторые вопросы квантовой теории поля связаны с мо- дулярными свойствами (/-разложений, см. [318]. Например, открытым во- просом является модулярность следующего (/-разложения: Хх'лх+вх+с __________ где Х = (хь ...,x„)eZn, л>1, (q)m = (l-q)(\-q2)-...-(l-qm), Ае е M„(Q), В е Qn, с е Q (это было сообщено А. Коэном в беседе с одним из авторов).
§ 1.2] Диофантовы уравнения первойи второй степени 51 Свойства симметричности производящих рядов были также использо- ваны Уайлсом при доказательстве большой теоремы Ферма и гипотезы Шимуры—Таниямы—Вейля (см. [841], [798], [289] и гл. 7). В этом за- мечательном доказательстве традиционный метод доказательства от про- тивного представлен в следующем виде: если ар +bp = ср, abc^O для простого числа р > 5 (где (а, 6, с) — примитивное решение), то с трой- кой чисел (а, 6, с) можно связать некоторую производящую функцию f = = faj),c ’ Н —► С, определенную на верхней полуплоскости Пуанкаре Н. Ее задание рядом Фурье с первым коэффициентом, равным 1, объясняется в §7.1. Оказывается, эта функция обладает слишком большим количе- ством симметрий, заключающихся в том, что она является параболической модулярной формой веса 2 и уровня 2, и, следовательно, f = 0 (см. §6.3), что противоречит построению f. 1.2.7. Связь с аналитической теорией чисел. Помимо рассмотрен- ных точных тождеств, существуют разнообразные методы получения асимп- тотических оценок для чисел типа г(/, и) и р(п) при п —► сю, в частности метод Харди—Литлвуда {круговой метод), его варианты и обобщения (см. [19], [20], [22], [56], [426], [108], [312] Эти методы связаны с тем, что коэффициенты а{п) некоторого произ- водящего ряда Л(т) = a(n)qn (q = ехр{2шт} = е(т)) л=0 можно находить с помощью интегральной формулы Коши = h $ F{x)q~n~{ dq. (1.2.29) |<7|=г<1 Последующие рассуждения можно успешно применять ко многим слу- чаям, когда окружность радиуса один является «естественным» контуром для функции F(t), а корни из единицы, лежащие на этом контуре, являются «наихудшими существенными особенностями» (иллюстрирующим приме- ром является правая часть равенства (1.2.27)). Идея заключается в том, чтобы разбить область интегрирования на две части: 1\ (вклад корней из единицы относительно малой степени) и /2 (все остальное), а потом попы- таться доказать, что /2 намного меньше, чем 1\, Для изучения асимптоти- ческого поведения области 1\ и для оценки /2 часто используются точные или приближенные функциональные уравнения на F(t), формула сумми- рования Пуассона и т. д. Например, для оценки р(п) Харди, Литлвуд и Рамануджан положи- ли г = е~2^п2. В терминах переменной т они предложили интегрировать по отрезку Ln = {т = х + iy | 0 х 1, у = 1/гг2}, который они раздели- ли на две части следующим образом: 1\ является объединением попарно
52 Элементарная теория чисел [Гл. 1 непересекающихся отрезков = {х | |х - p/q \ < l/2qn* (8 > 1)}, где p/q пробегает все рациональные числа между 0 и 1, знаменатель которых не превосходит п\ /2 является дополнением к 1\. Применительно к тождеству (1.2.27) это дает асимптотическую форму- лу Харди—Рамануджана рк\п pln> = waj + где (см. [226]). Позднее этот метод был усовершенствован К. Радемахером, который нашел точную формулу, выражающую р(п) через бесконечную сумму, сла- гаемые в которой соответствуют (всем) корням из единицы. Для квадратичных форм с использованием кругового метода А. В. Ма- лышев получил следующий важный результат [56]: пусть k 4, Дхь ... ..., Xfc) — положительная целочисленная форма определителя d,n — нату- ральное число. Тогда для г(/; п) при п —> оо имеет место асимптотическая формула k/2 r(f; п) = + О(^/4+3/2«*/4"1/4П где //(/; п) — «особый ряд» задачи, полученный в результате подсчета интеграла по /1, а О-константа зависит лишь от k и е > 0, причем //(/; п) является произведением вида rootf; «)> р где r„(/;n)= lim p-m<*-‘> Card{x е (Z/pmZ)* I ftx) = 0 (mod р"1)} т—>оо — р-адическая плотность, a r^f; п) — некоторая вещественная плотность решений уравнения /(х) = п, и основной вклад в величину г(/; п) получается поэтому за счет «поднятия» решений в ТЪ/pm7L и в R (см. также п. 5.3.6). Отсюда при выполнении некоторых условий сравни- мости для п и / следует представимость формой f числа п при п > C(d). Для малого числа переменных k = 2, 3 этот метод, однако, не работает и требуются более тонкие подходы (см. [54], [30], [94], [55], [703]). Существенное видоизменение и упрощение было внесено в круговой метод И. М. Виноградовым (см. [19], [20], [22] ). Он предложил заменить
Диофантовы уравнения первойи второй степени 53 Рис. 1.4 тэта-ряд типа (1.2.25) конечной тригонометрической суммой $N(V,f) = ^2 e(/WT)- \xt\<N (1.2.30) которая при ограничении на вещественную ось является очень интерес- ной быстро колеблющейся функцией переменного т Е R (см. рис. 1.4, 1.5, изображающие в некотором масштабе графики функций cos(2tc£2/az), sin(2TcZs3//z), п = 5, п = 3; хорошо видны «пики» этих графиков в ок- рестностях рациональных точек с небольшими знаменателями). Из свойств ортогональности если /г = 0, если h Е Z\{0}, (1.2.31) получается, что 1 § О/v (т; f)e(-nx)dx = Card{x = (xj, ..., x^) E Z* | /(x) = n, |xj < N} о (ср. с формулой (1.2.29) и равенством =2шйт). Круговой метод в форме Виноградова позволил ему доказать, что каж- дое достаточно большое нечетное число является суммой трех простых
54 Элементарная теория чисел [Гл. 1 чисел (в 1742 г. Гольдбах предположил, что каждое четное число, боль- шее 2, является суммой двух простых чисел), а также существенно умень- шить число слагаемых G(k) в проблеме Варинга (1770 г.) о представлении больших натуральных чисел суммой k-x степеней. Полученное Карацу- бой [46] улучшение оценки Виноградова составляет k(2 log/? + 2 log log & + + 12). Интересные результаты об асимптотике G(k) по отношению к k log/? были получены Р. С. Воаном и Т.Д. Вооли (см. [809], [810]). Более подробные рассмотрения, связанные с техникой аналитической теории чисел, выходят за рамки нашей книги, и мы отсылаем читателя к монографиям [20], [22], [86], [10], [426], [226], [108]. Отметим только, что подсчет числа решений диофантовых уравнений с помощью соотно- шений ортогональности типа (1.2.31) встречается в теории чисел в самых различных вариантах, см. ниже §5.1, 5.2. Этот прием привел к широко- му распространению тригонометрических сумм типа (1.2.30) (в частности гауссовых сумм, сумм Якоби и Клостермана, см. §2.2) в арифметиче- ских задачах. Использование гармонического анализа в арифметике сейчас активно развивается в некоммутативном многомерном варианте. К примеру, дву- мерным арифметическим аналогом соотношений ортогональности (1.2.31) является построение базиса Гекке в пространствах модулярных форм, ортогонального относительно скалярного произведения Петерсона (см. §6.3). 1.2.8. Эквивалентность бинарных квадратичных форм. Две квад- ратичные формы f, geZfxi, ..., хп] называются целочисленно эквива- лентными, если они представляют друг друга над Z (см. п. 1.2.6). Будем обозначать форму f(x, у) = Ах2 + Вху + Су2 (Л, В, С е Z) так- же через (Л, В, С). Форма f(x, у) = (Д, В, С) называется примитивной, если числа А, В, С EZ взаимно просты в совокупности. Дискриминант
§ 12] Диофантовы уравнения первойи второй степени 55 формы f(x, у) равен Д = В2 — 4АС. Назовем f(x, у) и g(x, у) собствен- но эквивалентными, если для некоторой матрицы \ ] е SL2(Z) вы- / / полняется равенство ftx, У) = g(mx + ^у, kx + ly). Гаусс установил, что множество С1(Д) классов собственной эквива- лентности примитивных форм дискриминанта Д О конечно и является конечной абелевой группой относительно закона композиции квадра- тичных форм, если Д не является квадратом. Для определения закона композиции рассматривается квадратичное поле К = <9(\/Д) = = {х + yy/d Iх, у е Q}, где d — число, свободное от квадратов. Тогда Д = De2, где D — дис- криминант квадратичного поля /С, D = d при d = \ (mod 4) и D — Ad при d = 2, 3 (mod 4), а с — некоторое натуральное число. Любой эле- мент а = х + y\/~d € К является корнем характеристического многочлена t2 - 2xt + (х2 - dy2) = - а)(/ - а') (х, у € Q), где а' = х - y\/d — элемент, сопряженный к а, Тг(а) = а + а' = 2х, N(a) = = аа' = х2 - dy2 — след и норма числа а. Элемент а называется целым над Z, если Тг(а), N(a) € Z; множество всех целых элементов а € К обра- зует кольцо О = (1, о) = {т + то | т, п € Z}, где о = \/d при d = 2, 3 (mod 4), и о = (1 + \/d)/2 при d = 1 (mod 4). Для произвольного натурального числа с определено также подкольцо Ос ~ Z + сО = (1, со). Дробным идеалом над Ос называется такая ад- дитивная подгруппа М = (а, р) = {та + яр | т, л € Z} С /С, что ОСМ С М и {а, р} линейно независимы над Z. Произведение ММ\ дробных идеалов М = (а, р), М\ = (аь Pi) также является дробным иде- алом над Ос, который как абелева группа порожден произведениями aaj, aPi, росi, ррi. Дробные идеалы над Ос образуют абелеву группу по умноже- нию с нейтральным элементом Ос = (1, со). Сопоставим каждому дробно- му идеалу М над Ос некоторую квадратичную форму дискриминанта Д = = De2. Пусть N(M) = Card Ос/М — норма дробного идеала М = (a, Р) с С Ос над Ос. Будем считать, что базис {а, р} упорядочен условием на Y — —p/a: Im у > 0 при d < 0 и Irr y > О при d > 0, где 1гг у — у — ирраци- ональная часть числа у = х + y\/~d. Поставим в соответствие базису {а, р}
56 Элементарная теория чисел [Гл. 1 квадратичную форму f(x, у) = Ах2 + Вху + Су2 = Можно проверить, что /(х, у) — примитивная целочисленная форма дискриминанта А = В2 - 4АС. Назовем дробные идеалы Л4 и М\ эквивалентными в узком смыс- ле, если М = уМ\ для некоторого y€/(x, N(y)>0 (при d <0 условие N(y) >0 выполняется всегда). Тогда имеется взаимно однозначное соот- ветствие между классами собственной эквивалентности бинарных прими- тивных форм дискриминанта А = De2 и классами эквивалентности в узком смысле дробных идеалов над Ос. Указанное взаимно однозначное соответ- ствие задает естественную групповую структуру на множестве С1(А), от- носительно которой нейтральный элемент представлен квадратичной фор- мой / = (1, 0, -А/4), если А четно, или (1, 1, (1 - Д)/4), если А нечетно. В вычислениях обычно используются приведенные формы (Л, В, С), для которых А > 0, -А В < А, НОД(Л, В, С) = 1. Если А < 0, то С1(Д) = 1 в точности для следующих значений: -А = 4, 8, 3, 7, 11, 19, 43, 67, 163 при с = 1; 16, 12, 28 при с = 2; 27 при с = 3 (см. п. 5.4.1). § 1.3. Кубические уравнения 1.3.1. Проблема существования рационального решения. Для це- лочисленных кубических форм F(X, Y, Z) от трех переменных уже не известно никакого общего алгоритма, позволяющего установить суще- ствование нетривиального решения над Q, хотя изучено большое число конкретных уравнений, например уравнений вида aX3 + t>Y3 + cZ3 = 0 (см. [707], [708]). Оказывается, для кубических форм перестает, вооб- ще говоря, выполняться принцип Минковского—Хассе: уравнение ЗХ3 + + 4У3 + 5Z3 = 0 не имеет нетривиальных решений в целых числах, хотя имеет вещественные решения, и для всех натуральных N > 1 сравнение ЗХ3 + 4У3 + 5Z3 = 0 (modAO имеет примитивное решение. Нарушение принципа Минковского—Хассе может быть измерено численно при помо- щи группы Шафаревича—Тэйта, см. §5.3. В 80-х гг. Д. Р. Хит-Браун [402] установил, что любая невырожденная кубическая форма от 10 и более переменных с целыми коэффициентами представляет рациональный нуль (невырожденность формы F(X\, Х2, ... ..., Хп) означает, как и в п. 1.2.3, что форма F и одновременно все ее произ- водные (dF/dXi)(X\, ..., Хп) не имеют общих нетривиальных комплексных
§ 1-3] Кубические уравнения 57 нулей). Ч. Хооли [424] доказал принцип Минковского—Хассе для невы- рожденных кубических форм от девяти переменных. До этого Давенпорт и Бёрч показали, что существуют невырожденные кубические формы от 9 переменных, не представляющие нуль над Q. Интересен общий факт о формах нечетной степени d, установленный Бёрчем: если число перемен- ных N N(d) (N(d) зависит только от d), то существует нетривиальный нуль над Q, см. [158]. Эти важные результаты получены круговым методом из п. 1.2.7 (см. [108], [312]). 1.3.2. Сложение точек на кубической кривой. Кубическая форма F(X, У, Z) задает кривую С на проективной плоскости Р2: C = {(X:Y : Z) elP2 \ F(X, Y, Z) = 0}, (1.3.1) причем мы считаем, что координаты в форме (1.3.1) — комплексные чис- ла. Если на С лежит хотя бы одна рациональная точка О и кривая С — невырождена, то можно найти такую обратимую (бирациональную) замену переменных (над полем Q), после которой форма F примет вид Y2Z - X3 - aXZ2 - bZ3 (a, be Q) (1.3.2) (вейерштрассова форма), причем точка О перейдет в решение (0:1:0) для формы (1.3.2), а условие невырожденности для кривой (1.3.1) станет эквивалентно тому, что 4а3 4- 2762 0. Невырожденная кубическая кривая с рациональной точкой называется эллиптической кривой. В неоднородных координатах (х, у) (X = xZ, У = yZ) уравнение кривой (1.3.2) примет вид у2 = х3 -|- ах 4- Ь, (1.3.3) причем кубический многочлен справа не имеет кратных комплексных кор- ней (его дискриминант — 4а3 - 27b2 отличен от нуля), а точка (0:1:0) в этой записи станет бесконечно удаленной точкой. Существует красивый геометрический способ превратить множество рациональных точек C(Q) на кривой С в абелеву группу с нейтральным элементом О е C(Q) («метод секущих и касательных»), см. [109], [221] и [465]. Если Р, Q eC(Q), то проводим через Р и Q проективную прямую, пересекающую С в однознач- но определенной третьей точке Р' е C(Q); затем проводим прямую через О и Р', а точку ее пересечения с С назовем суммой точек Р и Q, обозна- чив ее P+Q (см. рис. 1.6). Аналогично определяется точка 2Р=Р+Р, если использовать касательную, проходящую через точку Р (см. рис. 1.7). Если Р = (х\, у\), Q = (x2,yi) в неоднородных координатах, причем х2, то Р 4- Q = (%3, Уз), где Хз = -Х| -х2+ Р1 ~У2) , Уз = У' — хз)~У1- (1-3.4) \Xj — %2 ' Х| — %2
58 Элементарная теория чисел [Гл. 1 /Зх2 + а\2 Зх2 + а Ч1 /1 о с\ х3 = -2х!-h 1-^—1 , //3 = 2jZ1 (*1 “* * * * * * * * хз) + //ь (1.3.5) Если Xi = Х2, но у\ — -у?, то точка Р + Q = О бесконечно удаленная; она выбрана нейтральным элементом группового закона, поэтому в данном случае Р = - Q (см. также [460]). Описанный метод дает возможность размножать рациональные точки Р € C(Q), рассматривая кратные пгР е C(Q), а также их суммы с другими точками (если таковые имеются). Для вырожденных кубических кри- вых описанный метод неприменим. Пусть, к примеру, С: #2 = х2 + х3 (1.3.6) — кривая, изображенная на рис. 1.8. Тогда любая прямая, проходящая че- рез точку (0,0), имеет лишь одну точ- ку пересечения с кривой С: если урав- нение прямой у = /х, то мы получаем из уравнения (1.3.6), что х2(/2 - х - 1) = 0. Рис. 1.8 Корень х = 0 соответствует точке (0, 0); кроме того, мы имеем еще один корень х = f2 - 1. Из уравнения прямой мы получаем, что у = t(t2 - 1). Поэто- му, хотя и нельзя определить групповой закон, как выше, мы находим все рациональные точки на С с помощью рациональной параметризации: х — t2 - 1, у = t(t2 - 1). Вообще, кривая С: f(x, у) = 0, допускающая па- раметризацию х = cp(Z), y=ty(t) с помощью некоторых рациональных функций с коэффициентами из поля К, называется рациональной над К.
§ 1.3] Кубические уравнения 59 Это означает, что соотношение /(<р(/), ф(0) = 0 выполняется тождественно относительно независимой переменной t. 1.3.3. Строение группы рациональных точек на кубической кри- вой. Наиболее выдающаяся особенность метода секущих и касатель- ных— это возможность сводить нахождение всех рациональных решений кубического уравнения (1.3.1) к нахождению лишь конечного их числа. Точнее, имеет место следующий результат. Теорема 1.3 (теорема Морделла). Абелева группа C(Q) конечно порождена (см. [591], [221], [592], [500], [730] и приложение Ю. И. Ма- нина к [602]). Согласно теореме о строении конечно порожденных абелевых групп имеется разложение C(Q) = A х Zr, где А — конечная подгруппа всех то- чек кручения, Z(r) — произведение г бесконечных циклических групп; чис- ло г называют рангом кривой С над Q. О группе кручения А уже давно бы- ло кое-что известно. Так, Нагелль и позднее Лутц [535] получили следую- щий интересный результат, дающий одновременно метод для явного опре- деления точек кручения конкретных кривых: если Р = (хр, ур) — рацио- нальная точка кручения на кривой, заданной уравнением у2 = х3 + ах + Ь, то её координаты хр и ур являются целыми числами, причём ур равно или 0, или какому-нибудь делителю дискриминанта D = -4а3 - 27b2 дан- ной кривой. В 1976 г. Б. Мазур доказал, что подгруппа кручения А над Q может быть изоморфна лишь одной из пятнадцати групп Z/mZ (т^ 10, т= 12), Z/2Z х Z/2vZ (v 4), (1.3.7) причем все возможности реализуются (см. Мазур [557]). Вычисление ранга г остаётся открытой проблемой. Местр построил примеры кривых ранга, не меньшего 14 (см. [572]), где приведен так- же сравнительно простой пример кривой С: у2 + 9767// = х3 4- 3576х2 + 4- 425х — 2412 с рангом г > 9 !). Имеется предположение о том, что ранг может быть сколь угодно велик. В своем обзоре [561] Мазур связывает это предположение с гипотезой Сильвермана (см. [757]) о том, что для любого натурального числа k найдётся свободное от кубов целое положи- тельное число, которое по крайней мере k различными способами может быть представлено в виде суммы двух кубов. 0 Мартин и Макмиллан (2000 г.) нашли эллиптическую кривую ранга не ниже 24: / + ху + у = хз _ 120039822036992245303534619191166796374% + 4- 504224992484910670010801799168082726759443756222911415116 (другие примеры см. на сайте http://www.math.hr/~duje/tors/rankhist.htnil). —Прим. Ю. Чинкеля.
60 Элементарная теория чисел [Гл. 1 Примеры. 1. Кривая С задается уравнением у2 + у = х3 — х, целочис- ленное решение которого даёт пример, когда произведение двух последо- вательных целых чисел равно произведению некоторых других трёх по- следовательных чисел. Тогда группа Д тривиальна, а группа точек C(Q) (с бесконечно удаленной точкой в качестве нейтрального элемента) яв- ляется бесконечной циклической группой, причем в качестве её образу- ющей можно взять точку Р = (0, 0). Точки вида тР указаны на рис. 1.9. В любопытной табл. 1.3 из обзора Мазура, приведенной с его любезного разрешения, указаны абсолютные величины Х-координат (в примитивной однородной форме) точек вида тР, причем т пробегает нечетные числа от 9 до 59. В этом легко убедиться с использованием PARI (см. [151]) > е = ellinit([0, 0, 1, —1,0]) > q = [0, 0] > for (k = 4, 29, abs( numerator( ellpow(e, q, 2 * k + 1)[1]))). Тот факт, что последние цифры строк этой таблицы почти точно ло- жатся на параболу, не случаен и связан со свойством квадратичности высоты точек на эллиптических кривых (см. п. 5.3.2).
§ 13] Кубические уравнения 61 Таблица 1.3 20 116 3741 8385 239785 59997896 1849037896 270896443865 16683000076735 2786836257692691 3148929681285740316 342115756927607927420 280251129922563291422645 804287518035141565236193151 743043134297049053529252783151 3239336802390544740129153150480400 2613390252458014344369424012613679600 12518737094671239826683031943583152550351 596929565407758846078157850477988229836340351 2385858586329829631608077553938139264431352010155 56186054018434753527022752382280291882048809582857380 2389750519110914018630990937660635435269956452770356625916 65008789078766455275600750711306493793995920750429546912218291 8633815035886806713921361263456572740784038065917674315913775417535 43276783438948886312588030404441444313405755534366254416432880924019065 5930760454696426589489567617397943244827292346871145123187277732858766713896 2. Пусть кривая С задана уравнением z/2 + // = х3 — 7х + 6 Тогда C(Q) = Z3, а свободные образующие этой группы даются решениями (1, 0), (2, 0), (0, 2). (см. [210]). 3. Таблица 1.4 была любезно подготовлена для настоящего издания книги Анри Коэном, использовавшим компьютерную программу PARI, [151]. В таблице содержатся ранги г и порождающие групп Мордел- ла—Вейля кривых X3 + У3 = AZ3 при натуральных бесквадратных числах А < 500; она исправляет и уточняет таблицы Зельмера (см. [707], [708]), приведенные в первом издании данной книги, см. [549]. Отметим три значе- ния А = 346, 382, 445, для которых Коэн доказал, что г = 1, однако метод точек Хегнера для вычисления образующих (см. §6.4.4) занимает слишком много времени. Тем не менее, это вычисление было выполнено Кр. Делоне (Лион), см. таблицу 1.5. К настоящему времени такие таблицы продолжены до А < 70000 (Сте- фенс). Как заметил с их помощью Дон Загир, доля кривых с рангом г = 0 составляет примерно 38,3%, с рангом г = 1 — примерно 48,9%, с чётным рангом г >2 — примерно 11,7%, а с нечетным рангом г^З — пример- но 1,1%, причем с ростом А процентное соотношение этих случаев слабо меняется.
62 Элементарная теория чисел [Гл. 1 Таблица 1.4 Число образующих g и базисные решения уравнения X3 + У3 = AZ3, где А свободно от кубов и А 500 А g (X, Г, Z) А g (X, Г, Z) 6 1 (37, 17,21) Q4 1 (15642626656646177, 7 1 (2, -1, 1) -15616184186396177, 9 1 (2, 1, 1) 590736058375050) 12 1 (89, 19, 39) 97 1 (14, -5, 3) 13 1 (7, 2, 3) 98 1 (5, -3, 1) 15 1 (683, 397, 294) 103 1 (592, -349, 117) 17 1 (18, -1,7) 105 1 (4033, 3527, 1014) 19 2 (3, —2, 1), (5, 3, 2) 106 1 (165889, -140131, 25 767) 20 1 (19. 1, 7) 107 1 (90, 17, 19) 22 1 (25469, 17299, 9954) 110 2 (181, -71, 37), (629, 251, 134) 26 1 (3, -1, 1) 114 1 (9109, -901, 1878) 28 1 (3, 1, 1) 11 i (5 266097, -2 741617, 30 2 (163, 107, 57), (289, -19, 93) 1 1 1029364) 31 1 (137, -65, 42) 117 1 (5, —2, 1) 33 1 (1853, 523, 582) 194 1 (184223499139, 10183412861, 34 1 (631, -359, 182) 1 40 37045412880) 35 1 (3, 2, 1) 124 2 (5, -1, 1), (479, -443, 57) 37 2 (4, -3, 1), (10, -1, 3) 126 2 (5, 1, 1), (71, -23, 14) 42 1 (449, -71, 129) 127 2 (7, -6, 1), (121, 120, 7) 43 1 (7, L2) 130 I (52954777, 33728183, 49 1 (И, -2, 3) 11285694) 50 1 (23417, -11267, 6111) 132 2 (2089, -901, 399), (39007, 51 1 (730511,62641, 197028) -29503, 6342) 53 1 (1872, -1819,217) 133 1 (5, 2, 1) 58 1 (28747, -14653, 7083) 134 1 (9, 7, 2) 61 1 (5, -4, 1) 139 1 (16, —7, 3) 62 1 (11,7, 3) 140 1 (27 397, 6623, 5301) 63 1 (4,-1, 1) 141 1 (53 579249, -52310249, 65 2 (4, 1, 1), (191, -146, 39) 4 230030) 67 1 (5353, 1208, 1323) 142 1 (2 454839, 1858, 530595) 68 1 (2 538 163, -472663, 620505) 143 1 (73, 15, 14) 69 1 (15409, -10441,3318) 151 1 (338, -95, 63) 70 1 (53, 17, 13) 153 2 (70, -19, 13), (107, -56, 19) 71 1 (197, -126, 43) 156 1 (2627, -1223, 471) 75 1 (17351, —11951, 3606) 157 1 (19964887, -19767319, 78 1 (5563, 53, 1302) 1 142148) 79 1 (13, —4, 3) 159 1 (103750849, 2 269079, 84 1 (433, 323, 111) 19151 118) 85 1 (2 570 129, —2 404889, 330498) 161 1 (39, -16, 7) 86 2 (13, 5, 3), (10067, -10049, 399) 163 2 (11,-3, 2), (17,-8, 3) 87 1 (1 176498611, -907929611, 164 1 (311 155001, -236283589, 216266610) 46913867) 89 1 (53, 36, 13) 166 1 (1 374582733040071, 90 1 (1241, -431,273) -1 295038816428439, 91 2 (4, 3, 1), (6, -5, 1) 136834 628063958) 92 1 (25903, -3547, 5377) 169 1 (8, —7, 1)
§ 1.3) Кубические уравнения 63 Продолжение таблицы 1.4 А g (X, Y, Z) А g (X, Y, Z) 170 1 (26353, 14957, 5031) 229 1 (745, -673, 78) 171 1 (37, 20, 7) 231 1 (818567, -369503, 129186) 172 1 (139, -103, 21) 233 1 (124253, -124020, 3589) (2 419913540753, 1 587207- 236 1 (248957, 209827, 47 106) 17/ 1 867247, 468227201 520) 238 1 (53927, 3907, 8703) (110623913,8 065063, 241 1 (292, -283, 21) 1 /о 1 19668222) 244 1 (99, -67, 14) 179 1 (2 184480, -1 305053, 357833) 9 (571049, -511271, 59787), 180 1 (901, 719, 183) ZH'O z (2 043883,-1 767 133, 182 2 (11,5, 2), (17, 1,3) 230685) 1 QQ о (14, 13, 3), (295579, -190171, 247 1 (20, -11,3) loo 2 46956) 94Q 1 (275 657 307 291 045 075 203- (56182393, 15590357, 1 684958997, -275522784- 186 1 9 911895) 968298556737485593813, 187 1 (336491, -149491, 57070) 4 974480998065387679- 1 (1Q 1 (135477799, -116157598, 603368524) 1Уо 1 16825599) 251 1 (4284, -4033, 373) 195 1 (68561, -54521,9 366) 254 2 (19, -1,3), (587, 437, 104) 197 1 (2339, -2142, 247) 258 1 (2 195839, -2 047231, 198156) 198 1 (1801, -19, 309) 259 1 (13, -5, 2) 201 2 (16, 11,3), (3251, 124, 555) i (36326686731 109813, 202 1 (2 884067, 257437, 491652) ZOU 1 9 746422253537867, OAQ Г) (229, 32, 39), (2426, -2165, 5 691827727610864) zUo 2 273) 267 1 (861409, -342361, 130914) 205 1 (8191, -6651, 1094) 269 1 (800059950, -786434293, 206 1 (5211, -4961,455) 45728263) 209 2 (52, -41,7), (125, -26,21) 271 2 (10, -9, 1), (487, -216, 73) О1 Л (1387, 503, 237), (3961, -2071, 273 2 (19, 8, 3), (190,-163, 21) Z1U 2 633) 974 i (111035496427236122887, 211 1 (74 167, 66458, 14925) Z/ -43257922194 314055637, О1 О (337 705939853, -315091- 16751 541 717010945845) Z12 1 652237, 32429956428) 97е! 1 (424560439, -309086839, (64313150142602539525- Z / о 55494828) 213 1 717, 46732 739212871 851- 277 1 (209, -145, 28) 099283, 12000095230802- 278 1 (13, 3, 2) 028099750) 279 1 (7, -4, 1) 01 л (307277703127, -244 344- 9Я9 2 (117217, -96913, 13542), 214 1 663377, 40697090945) ZOZ (2 814607, 1 571057, 215 1 (6,-1, 1) 452772) 217 2 (6, 1, 1), (9, -8, 1) 283 1 (7, -5, 1), (279469, -61469, 9Я4 (7 722 630 462 000 896 449 941 - 218 2 46270) Zo^t i 136589, -1 293813622621- (17, 10, 3), (168704, -36053, 939303367981, 1 174877- 219 2 27897) 194 362 780 234 594 343 698) 222 1 (5 884 597, 858653, 972855) 285 1 (18989, 1531,2886) 223 1 (509, 67, 84) 286 1 (323, 37, 49) ООО < (46323521, -27319949, 287 1 (248, 121, 39) zzo 1 7 024059) 289 1 (199, 90, 31)
64 Элементарная теория чисел [Гл. 1 Продолжение таблицы 1.4 А g (X, Y, Z) А g (X, Y, Z) 294 1 (124559, -103391, 14118) 1 (1 909159356457, 295 1 (34901, -16021,5068) ООО 1 -1 746345039913, 301 1 (382, 5, 57) 165073101648) 303 1 (2 659949, 67051,396030) 366 1 (2 08027, -1 675277, 228885) 305 1 (86, -81, 7) 367 1 (42349, 526, 5915) 306 1 (6697, -3943, 921) 370 2 (7, 3, 1), (70523, 19387, 9861) 308 1 (199, 109, 31) 372 1 (2 717893, 630107, 379470) qna 9 (20, 7, 3), (272540932, 373 1 (1604, -1595, 57) ОмУ -142217089, 38305371) 377 1 (469, -237, 62) 310 1 (5 011613, -190493, 740484) 379 2 (15, —7, 2), (917, -908, 39) 313 1 (22, -13, 3) 380 1 (1009, -629, 127) 314 1 (241, -223, 21) 382 1 316 1 (7, -3, 1) 385 1 (20521, -17441,2054) Q 1 О 1 (6 462443919765751305499, 386 1 (9, —7, 1) ОIУ 1 -6 182025219694143438- 387 1 (8, -5, 1) 499,472407353310304- 388 1 (4659, -3287, 553) 561 590) 4Q0 9 (3043, 467, 417), (4373, -863, 321 1 (13 755277819, 8 670272669, OaU 597) 2 164318002) 4Q1 1 (590456252061289, 322 1 (1873, 703, 278) ОУ 1 1 80084 103077 160) 323 1 (252, 71, 37) 1 (4 045451855513988711059, 325 1 (128, 97,21) ОуО 1 2 369 372 172 284 459 347 309, 330 1 (1621, 1349, 273) 597 046 969 413 536 968 336) 331 1 (И, -ю, 1) 1 (1 439245 403, -573627403, 333 1 (397, -286, 49) иУЧ- 1 192088390) 9 (7, —2, 1), (390997, 260243, 395 1 (7891, -7851, 266) ООО 61 362) 4QA 1 (46789273, -37009657, 337 1 5 074314) 1 (1 392097139, -345604139, 397 2 (12, -11, 1), (360, 37, 49) ооУ I 198626610) 399 2 (22, 5, 3), (401, 328, 63) 341 1 (6, 5, 1) 409 । (585699417548405371, 342 2 (7, -1, 1), (1253, -1205, 86) T’UZ 102798361240815491, 9 (16543, 8297, 2454), (389699, 79502362839530631) От’О -190979, 53292) 403 1 (53, -22, 7) 346 1 407 2 (7, 4, 1), (33733, -33634, 939) 9 (40283, -15227, 5622), 409 1 О^тО (2 706139, 425861,385230) 4 1 1 1 (186871897, 49864 103, 349 1 (23, -14,3) Ч1 I 1 25292280) 355 1 (2 903959, 2 617001, 492516) 413 1 (2575, -2103, 266) 1 (15026630492 061476041- 414 1 (68073157, 32528843, ООО 947013, 4 709632 110011- Ч 1 ч 1 9 454410) 335573393177, 2 098221- 418 1 (76267, 25307, 10323) 141580681446554 589) 49Л 9 (2213, 1567, 327), (10459, 357 1 (19207, 6497, 2742) т-ZU -6679, 1263) 358 1 (7 951661, 2 922589, 1 138095) 421 1 (19690, 4699, 2639) осп 1 (77 517180, 50972869, 422 1 (15, 1,2) ООУ 1 11855651) 425 1 (2393, 1007, 326)
§ 1-3] Кубические уравнения 65 Окончание таблицы 1.4 А g (X, Г, Z) А g (X, Y, Z) 427 1 (25, -16, 3) 457 1 (41,31,6) 428 1 (1 294057, -1 190053, 104013) 458 1 (953039, -761375, 97482) 429 1 (16739, 14 149, 2598) ДАЛ I (248 768189, -234795689, 430 1 (5 989967,3 449393, 841204) чии 1 17466345) 431 1 (701, -270, 91) 462 2 (3779, 379489), (11969, -7811, 433 2 (37, 35, 6), (223, -222, 7) 1389) Л9£ 9 (32779, -1459, 4326), (3 784- 463 1 (403, -394, 21) 049,2 981071,570276) ДАА 1 (1 212356942047, -1 197- Л Q& о (19, 17, 3), (1 330019, 1 072217207, 52307828958) ‘too Z -1 224071, 105957) 466 1 (464 540708319337302841, Л Qft 1 (12636764083, 11 127850973, 88798763256715446551, ЧоО 1 979215602) 60057801943830995598) 439 1 (571, -563, 26) 467 1 (1170, -763, 139) 441 1 (13, 11,2) 468 2 (7, 5, 1), (859, -763, 74) АЛЛ 1 (4 174254535499, -726500- 469 2 (13, -12, 1), (26, -17, 3) ЧЧЧ 1 109131,546201297768) 473 1 445 474 1 (568871, -453689, 57627) 44А о (23, -5, 3), (4 286417, 477 2 (89, 70, 13), (12040, -11881, Т’Т’О £ —4 285265, 52212) 523) 447 1 (4 405301, -382301, 576030) 481 1 (43, 29, 6) 449 1 (323, 126, 43) 483 1 (2 401741, 1 945259, 352830) 450 1 (21079, 11 321,2886) 484 1 (236521, -176021,25235) ЛАО 1 (851498679025552429, 485 1 (8, -3, 1) 404 1 224535817 897760071, 490 1 (193229, -73159, 24039) 111 626 729 681 785 675) 4QQ 1 (8 432715268961, -1 057596- ЛА7 9 (23, 4, 3), (50167097, Чои 1 310369, 1 066758076384) ЧЭО Z 39331207, 7 447188) 494 1 (59, -33, 7) 4^4 1 (753 389 202 595 029 867 852- 495 1 (342361, -57241,43212) “тиН 1 290245746241 110629, 497 2 (55, 16, 7), (7411, -6772, 579) -204264638826527324- доя о (611 137, -490123, 60543), 892641927694862943879, ЧУо (16811001, -15250751, 97368775947767167139- 933765) 892682703702288385) 499 1 Таблица 1.5 Базисные решения уравнения X3 4- У3 = AZ3 для А = 346, 382, 445 А г |(Х, У, Z) 346 1 (47 189 035 813 499 932 580 169 103 856 786 964 321 592 777 067, 42 979 005 685 698 193 708 286 233 727 941 595 382 526 544 683, 8 108 695 117 451 325 702 581 978 056 293 186 703 694 064 735) 382 1 (58 477 534 119 926 126 376 218 390 196 344 577 607 972 745 895 728 749, 16 753 262 295 125 845 463 811 427 438 340 702 778 576 158 801 481 539, 8 122 054 393 485 793 893 167 719 500 929 060 093 151 854 013 194 574) 445 1 (362 650 186 970 550 612 016 862 044 970 863 425 187, -58 928 948 142 525 345 898 087 903 372 951 745 227, 47 432 800292 536072 666333861 784516450 106)
66 Элементарная теория чисел [Гл. 1 4. Кривая С: у(у + 1) = х(х — 1)(х + 2) имеет ранг, равный двум, а кри- вая С: у (у + 1) = х(х — 1)(х + 4) имеет ранг г = 2, ср. с уравнением кривой ранга 1 из примера 1. 5. Рассмотрим кривую у2 = х3 + 877х. Как показано в [229], образую- щая по модулю кручения группы рациональных точек на этой кривой имеет х-координату _ 37549428127162193105504069942092792436201 Х ~ 6215987776871505425463220780697238044100 ’ Это дает определенное представление о трудностях «наивного» элемен- тарного подхода для нахождения точек бесконечного порядка на эл- липтических кривых (см. [221], [238], [239]). 1.3.4. Кубические сравнения по простому модулю. Пусть р — про- стое число, F(Xo, Х2) € Z[Xi, Х2, Хз] — кубическая форма, невырож- денная по модулю р. Это значит, что для любого поля /<, содержащего поле вычетов Fp (т. е. поля характеристики р), следующие формы степе- ни 3 и 2: _ др F, (/ = 0,1,2) С/Л/ не имеют общих нетривиальных нулей над /<, где Г(*о, XbX2)eFp[X0, Xi, Х2] обозначает форму, полученную из F рассмотрением ее коэффициентов по модулю р, см. [57], [465], [466]. Как над полем рациональных чисел, простые алгебро-геометрические идеи можно применить и к полю К положительной характеристики. В этом случае нормальная форма становится несколько более сложной. Сделав замену проективных координат и перейдя к неоднородной форме записи, мы всегда можем привести уравнение F = 0 к виду у2 + а\ху + а$у = х3 + azx2 + щх + а§, причем «ь а2, 03» а±, а^еК и Д = -^8 - 8b% - 27Ь% + 962Мб / 0, где 62 = 0i+402, 64 = 204 + 0103, 6б = аз + 40б- сз Также используется обозначение /? = где с4 = Ь2 - 2464, = -bl + З66264 - 216&6- Затем это уравнение может быть еще упрощено при помощи преобразо- ваний вида х и2х' + г, у t—> и3yf + su2x'r + / , и получается следующее (см. [791], [466]).
§1.3] Кубические уравнения 67 1. Если р / 2, 3, то у2 = х3 + а4% + а6 с Д = -16(4а3 + 27а|) / 0. (1.3.8) 2. При р = 2 условие / = 0 равносильно тому, что а\ = 0, и уравнение преобразуется к следующему виду: если а\ /0 (т. е. / ^0), то, выбирая подходящие г, мы можем получить а\ = 1, аз = 0, а± = 0 и уравнение принимает вид у2 + ху = х3 + а%х2 + аб, (1.3.9) где условие гладкости задается просто неравенством Д 0. Предположим теперь, что а\ = 0 (т. е. / = 0). В этом случае уравнение преобразуется в У2 + азУ = х3 + щх + а6, (1.3.10) и условие гладкости в этом случае задается неравенством аз 0. 3. Если р = 3, то у2 = х3 -и д2х2 + а4х + Яб (1.3.11) (в этом случае кратные корни также недопустимы). В однородных координатах во всех случаях добавляется «бесконеч- но удаленное решение» О = (0: 1 : 0). Как посчитать число решений таких кубических сравнений? Ясно, во-первых, что число этих решений, обра- зующих вместе с точкой О абелеву группу C(FP), не превосходит 2р + 1: точка О и не больше 2р пар (х, у), удовлетворяющих условиям (1.3.8) (1.3.9), (1.3.10) и (1.3.11) при р = 2, 3, так как для каждого такого х € Fp найдутся не больше двух значений t/eFp. Однако лишь половина эле- ментов из F* являются квадратами, поэтому можно ожидать, что лишь в половине случаев из элемента х3 -h ах + b можно извлечь квадратный корень у (предположив, что элементы х3 + ах + b разбросаны случайно в поле Fp, см. [469], с. 157). Более точно, пусть /(х) = —символ Ле- жандра (см. п. 1.1.5), определение которого означает, что число решений уравнения у2 = и в поле Fp равно 1 + у(ы), тогда мы получаем следующую формулу для числа решений кубического сравнения: CardC(Fp) = 1 + (1 + х(х3 + ах + £>)) = р + 1 + 5? Х(*3 + ах + ь)- хе^р хе^р Коблиц в [469] сравнивает взятие суммы со «случайным блужданием», при котором делается шаг вперед, если /(х3 + ах + b) = 1, и шаг назад, если х(х3 + ах -I- Ь) = — 1. Из теории вероятностей известно, что рассто- яние от исходной точки после р шагов при случайном блуждании будет иметь порядок у/р. И действительно, это так: сумма всегда ограничена величиной 2у/~р.
68 Элементарная теория чисел [Гл. 1 Теорема 1.4 (теорема Хассе, |400|). Пусть Np = CardC(Fp), тогда |Afp-(p + l)|^2/p. Элементарное доказательство этого факта было дано в 1956 г. (см. [57]). С тех пор было развито множество других доказательств, как ал- гебро-геометрических, так и элементарных. Обзор элементарных методов можно найти в [90], [91], [92]. Проблемы распределения автоморфизмов Фробениуса для различ- ных р, а также распределения разности Np — (р + 1) (см. [506]) связа- ны с гипотезой Сато—Тэйта (см. гл. I в [716] и п. 6.5.1) 0. Структура абелевой группы Е^р) точек на эллиптической кривой ис- пользуется во многих арифметических вопросах. В частности, случай, когда эта группа циклическая большого порядка, приводит к проблеме ECDLP («Elliptic curve discrete logarithm problem», проблема дискретного логарифма для эллиптической кривой), которая очень важна для прило- жений в криптосистемах с открытым ключом, см. [466]. § 1.4. Задачи о континууме: приближения и непрерывные дроби 1.4.1. Диофантовы приближения иррациональных чисел. Поскольку число \/2 иррационально, квадратичная форма х2 — 2у2 не обращается в нуль при целых значениях х, у, отличных от нуля; наи- меньшее значение |х2 — 2у21, которое может достигаться при таких х, у, равно 1: х2-2//2 = ±1, (1.4.1) что приводит к уравнению Пелля, имеющему бесконечно много решений, (см. п. 1.2.5): Эти решения дают все лучшие и лучшие приближения к числу д/2 с ро- стом у (см. [561], с. 209). Этот список состоит из всех наилучших при- ближений числа д/2 в следующем смысле: рациональная дробь а/b (Ь > 0) называется наилучшим приближением числа а, если для всякой другой рациональной дроби c/d с тем же или меньшим знаменателем выполнено условие |da - с| > |&а - а\ (Q<d^b, a/b^c/d). ^По поводу доказательства гипотезы Сато-Тэйта в 2006 г. Л. Клозелем, М. Харрисом, Н. Шеферд-Бароном и P. Тэйлором (L. Closel, М. Harris, N. Shepherd-Baron and R. Taylor), см. http://en.wikipedia.org/wiki/Sato-Tate_conjecture; Clozel L., Harris M., Taylor R. Automorphy for some ^-adic lifts of automorphic mod £ Galois representations. Taylor R. Automorphy for some ^-adic lifts of automorphic mod £ Galois representations, II; Harris M., Shepherd-Barron N., Taylor R. A family of Calabi-Yau varieties and potential automorphy.
§ 14] Задачи о континууме: приближения и непрерывные дроби 69 Таблица 1.6 X У х/у 1 1 1,0 3 2 1,5 7 5 1,4 17 12 1,416... 41 29 1,4137... 99 70 1,41428... 239 169 1,414201... 577 408 1,414215... 1393 985 1,4142132... 3363 2376 1,4142136... Из определения следует несократимость дроби а/b, дающей наилучшее приближение. Все решения (х, у) уравнения (1.4.1) получаются из наи- меньшего по правилу х + у/2у = (1 + х/2)я. Это пример следующего общего принципа: получить все решения неко- торой диофантовой проблемы из конечного их числа [561]. Ниже будет указан ряд случаев, в которых этот принцип выполнен. 1.4.2. Ряды Фарея. Один из способов поиска хороших приближений связан с рядами Фарея порядка л, где — возрастающая после- довательность всех несократимых дробей, расположенных между 0 и 1, знаменатели которых не превосходят п\ ?п = {а/Ь | 0 а b п, (a, b) = 1}. (1.4.2) Эти дроби (без названия) упоминались в круговом методе в п. 1.2.7. Ряд Фарея порядка п = 5 имеет вид: Г1 1121323411 У’5- 15’ 4’ 3’ 5’ 2’ 5’ 3’ 4’ 5’ 1 Г Теорема 1.5 (1397 ]). Для любого вещественного числа а найдет- ся такой элемент а/b е Fn, что |а-(аЛ)1^ +!))• (1.4.3) Идея доказательства этой теоремы состоит в том, чтобы превратить отрезок [0,1] в окружность, склеив 0 и 1, а затем построить специальное разбиение окружности с помощью точек Фарея. Точка Фарея Р — это по а 4- а' . определению медианта двух последовательных членов ряда Фарея ~7, е Fn, так что ~ < Р < Аркой Фарея называется дуга получен- ной окружности, соединяющая две соседние точки Фарея. Доказательство
70 Элементарная теория чисел [Гл. 1 (1-4.4) (1.4.5) теоремы следует теперь из того факта, что длина арки Фарея, содержащей представителя а/b, заключена между числами В свою очередь, эта оценка получается из свойства a'b - b'a = 1 двух соседних членов ряда Фарея. В этой теореме число а не обязательно ир- рационально, так что мы получаем также сведения о приближении рацио- нальных чисел рациональными же числами с меньшими знаменателями. При иррациональном а из теоремы следует, что неравенство имеет бесконечно много решений а/b. Например, если а/Ь — наилучшее приближение числа а, то неравенство (1.4.4) следует из неравенства (1.4.3) при п = Ь. Быстрый способ нахождения наилучших приближений даёт теория непрерывных дробей, с помощью которой доказывается, что для иррациональных чисел 0 более сильное неравенство h -I * I Ь I у/БЬ^ имеет бесконечно много решений а/Ь. 1.4.3. Непрерывные (цепные) дроби ([95], [291], [397]). Если а € К — произвольное вещественное число, то определим последователь- ность целых чисел а, и действительных чисел а/ по правилам ао = [ао] (целая часть числа ао: ао — 1 < [ао] ао), az+i = l/(az- — az), af+i = [af+i ] (i 0). Так получается (простая) цепная дробь: 1 1 а = ао + а2 + • 1 1 Um Н----- am+l которая более компактно записывается в виде ot = [a0; at, а2, ..., ат, am+i] (1.4.6) a = ао Н-—г ——г... ——г-----. а1 + 1^2+1 I am+l Число am+i называют остатком цепной дроби (1.4.6). Если в формуле (1.4.6) удалить am+i, то получится конечная цепная дробь Ст = [ао; ад ... ..., ат], которая называется подходящей дробью (конвергентной) по- рядка т и представляет собой рациональное число Ст = Ат/Вт, где числа
§14) Задачи о континууме: приближения и непрерывные дроби 71 Ат и Вт можно последовательно вычислить, исходя из начальных условий Л-2 = В-i = 0, Л-i = В_2 = 1 и рекуррентных соотношений Л*+1 =cik+\Ak + Ak_\, (1.4.7) Bjfc+i = a^\Bk + Bk-\ (k = -1, 0, 1, ...). Если число а иррационально, то otm / 0 для всех т е N, подходящие дроби чётного порядка образуют возрастающую, а нечетного порядка—убываю- щую последовательность; обе эти последовательности сходятся к числу а. Результат предельного перехода записывается в виде (бесконечной) цеп- ной дроби a= [a0; а2, ...» ak, ...]. Цепная дробь конечна тогда и только тогда, когда a — рациональное чис- ло. Доказательство всех этих фактов почти непосредственно вытекает из соотношений (1.4.7): проверяется, что BkAk-i - АкВк_\ =(-!)*. k>\, (1.4.8) ВкАк-2 - АкВк_2 = (-1)* 1ак, Ak-i Ак _ (-1)* Ак 2 Ак (-Г)к~'ак П49) Bk-\ &k BkBk_\' Вй_2 Bk BkBk_2 Степень приближения числа а подходящими дробями также устанавлива- ется с помощью соотношений (1.4.9): справедливы неравенства 1 I Ат\ 1 Вт(Вт 4- Bm+1) I Вт\ ВтВт^\' (1.4.10) из которых следует описание всех наилучших приближений числа а как подходящих дробей Ат1Вт, т^Л. 1.4.4. $Ь2-эквивалентность чисел. Рассмотрим остатки цепной дроби a = [ao; aj, a2l = [aoi 01,^2, ...» 0m-i> Из определений следует, что + Дт-2 Вт-\^т + Вт-2 (1.4.11) Числа а и 0 € К называются 5Ь2(2)-эквивалентными, если a = j для некоторой матрицы (а € SL2(Z) (т. е. a, b, с. d G Z, ad — be = 1). \с dj Равенство (1.4.11) показывает, что числа а и (-l)mam эквивалентны, /1 л q\ f(~^)mAm-i Ат-2\ так как в силу соотношения (1.4.8) имеем I I € SL2(Z). \(— 1) Вт-\ Bm-2J
72 Элементарная теория чисел [Гл. 1 Поэтому для эквивалентности чисел аир необходимо и достаточно, что- бы совпадали некоторые их остатки (теорема Серре, см. [95]). Так, все рациональные числа SL2(Z) эквивалентны. 1.4.5. Периодические цепные дроби. Решение уравнения Пелля. Рассмотрим бесконечную периодическую непрерывную дробь периода k, а = [а0; аь а*0_ь а*0, а*о+А_1], (1.4.12) периодичность означает, что а^т — вт при т &о- Тогда а является квад- ратичной иррациональностью, что вытекает из соотношения (1.4.11) для остатков. Пример. Разложение \/3 в цепную дробь имеет вид х/З = [1; 1,2, 1,2, 1,2, ...]. Действительно, цепная дробь справа, очевидно, удовлетворяет уравне- нию х = 1 Ч-----j—, т. е. 2х + х2 = 3 + 2х, откуда следует, что х = \/3. Практически удобно использовать следующий алгоритм для построения подходящих дробей и остатков квадратичной иррациональности вида а = (Ро + УЛ/)/(?о (для свободного от квадратов натурального числа N), где Pq, Qo, N— це- лые числа, причем предполагается, что Qq делит N — Р%. Именно, положим последовательно ^/+1 = aiQi ~ Pli Qi+\ — (N — P^+^/Qi, i = 0, 1, 2, ... Тогда все Р/, Qi — целые числа, Qt делит N — Р?^ и В отличие от быстро возрастающих числителя и знаменателя подходя- щей дроби Ci —Ai/Bi, числа Pi и Qi сравнительно небольшие. Так, если |Ро| < VNy 0 < Qo < то для всех i 1 имеем (см. [675], [461]) 0<P/<xZv, 0<Qt<2y/N, A?-NB? = (-l)i+'Qi+i. На z-м шаге вычисления проводятся в четыре действия: 1) Pi+l = [x/V] - Ri (Ro = 0), 2) Q,+1 = (N - P?+i)/Qi (<?-> = (N - Po2)/<?o), 3) ai+i = [(Pi+i + [V?V])/(?i+l],
§1.5] Диофантовы приближения и иррациональность 73 4) /?/+1 = остаток от деления + [\/W] на Q/+i. Этот алгоритм можно эффективно применять для поиска наименьшего решения уравнения Пелля\ если а2 — Nb2 = 1, то а2 1 + N, b2 1, \1-Vn\ =_______!____<—— \ь I b(a + b^N) 2b2jN' поэтому в силу п. 1.4.3 дробь а/b является одной из подходящих дробей для иррациональности \/N. Пример. Наименьшее решение уравнения х2 — 43у2 = 1: х = 3482, у = = 531. Оно найдено с помощью вычислений, представленных в табл. 1.7. Таблица 1.7 i —2 -1 0 1 2 3 4 5 6 7 8 9 at 6 1 1 3 1 5 1 3 1 1 Pi 0 6 1 5 4 5 5 4 5 1 Qi 1 7 6 3 9 2 9 3 6 7 Ri 0 5 1 2 1 1 2 1 5 0 Ai 0 1 6 7 13 46 59 341 400 1541 1941 3482 Bi 1 0 1 1 2 7 9 52 61 235 296 531 Д? - 43B? —7 6 -3 9 —2 9 -3 6 —7 1 § 1.5. Диофантовы приближения и иррациональность 1.5.1. Идеи доказательства иррациональности числа ^(3). Уди- вительным математическим открытием последнего времени, показавшим большие нераскрытые возможности элементарных методов в теории чи- сел, явилось доказательство иррациональности числа оо С(3) = £>-3, Л=1 найденное французским математиком Апери, впервые изложенное им в июне 1978 г. на конференции Journees Arithmetiques (в Люмини, Марсель). Мы следуем неформальному изложению этого доказательства Ван дер Поортеном [648], который отмечает первоначальное недоверие к доказа- тельству, воспринятому многими сначала как набор таинственных утвер- ждений. 1. Для любых чисел а\, а<^ ... выполняется равенство Z-,(x + fll)...(x + a*) х- U ' Я=1
74 Элементарная теория чисел [Гл. 1 2. Справедливо соотношение = "5;'1 3. Рассмотрим рекуррентное соотношение: п3ип - (З4м3 - 51м2 + 27м - 5)u„-i + (м - 1)3м„_2 = 0, м > 2, (1.5.3) и пусть Ьп — последовательность, определенная начальными условиями ft0= 1, =5 и соотношением (1.5.3). Тогда все числа Ьп целые. Пусть ап — последовательность, определенная соотношением (1.5.3) и началь- ными условиями ао = 0, а\ = 6. Тогда знаменатели рациональных чисел ап делят 2[1, 2, ..., м]3, где [1, 2, ..., м] обозначает наименьшее общее крат- ное чисел 1, 2, ..., м. 4. Последовательность ап1Ьп сходится к £(3) достаточно быстро, что позволяет установить иррациональность числа £(3). Кроме того, для е > 0 и всех целых чисел р, q > 0 при достаточно большом q справедливо нера- венство К(3) - || > 0= 13,41782... (1.5.4) Имеет место разложение в непрерывную дробь С(3) =-----------------------^-6------------------, (1.5.5) Р(0)--------------------------------------- Р(1)-------------------------------- (n - I)6 р(п - 1)------------ р(п) - ... | 4096 I л6 3105-1 ” (З4л3 + 51л2 + 27л + 5)—| ГСК = 6 I 1 I 64 | 729 ’ 5-1 117-1 535-1 1436-1 1.5.2. Мера иррациональности числа. В §1.4 отмечена связь свой- ства числа р быть иррациональным с существованием бесконечно многих хороших рациональных приближений p/q, т. е. таких приближений, что выполнено неравенство к (гН?2’ Аналогично устанавливается следующее достаточное условие иррацио- нальности: если существует 8 > 0 и такая последовательность {pn/qn} ра-
§ 1-5] Диофантовы приближения и иррациональность 75 (1.5.6) циональных чисел {рп/Яп} /Р, что то р — иррациональное число. Применение этого критерия дает интерес- ную меру иррациональности числа: если |р — — I < и последователь- 1 1 ность qn монотонно возрастает таким образом, что qn < q*n+* при боль- ших п и х > 0, то для любого фиксированного е > 0 и всех достаточно больших целых чисел р, q > 0 справедливо неравенство |в _ 1 >_______!_____ Г qn Г ^UW(S-x)+e- Интересен случай, когда qn возрастает геометрически, т. е. qn, С, а > 0. Тогда в качестве х можно взять сколь угодно малое положительное чис- ло, а показатель степени в формуле (1.5.7) переходит в число 1 + (1/8), называемое также степенью иррациональности числа р. Любопытно, что метод Апери оказался применим также и к числу (1.5.7) оо 2 №) = 52„-2 = i., Л=1 трансцендентность которого давно известна. Однако из доказательства Апери вытекает неравенство 6'= 11.85078... (1.5.8) для е > 0 и всех достаточно больших q, и установлено, что степени ирра- циональности чисел £(3) и к2 не больше чем 0' и 0 соответственно. 1.5.3. Теорема Туэ—Зигеля—Рота, трансцендентные числа, дио- фантовы уравнения (см. [684], [290], [89], [93], [ПО], [561]). Эта знаменитая теорема утверждает, что если р — алгебраическое чис- ло, т. е. корень многочлена f(X) = апХп + ап_\Хп 1 +... + а0 (fl; € Z), то для произвольного фиксированного е > 0 и достаточно больших чисел q справедливо неравенство Другими словами, если взять произвольные положительные константы С и е, то найдется лишь конечное число приближений х/у числа р, удовле-
76 Элементарная теория чисел [Гл. 1 творяющих неравенству В частности, если неравенство (1.5.6) имеет место для последователь- ности с 8> 1, то число р трансцендентное (т. е. не алгебраическое). Но, оказывается, лишь подмножество трансцендентных чисел нулевой меры выделяется этим условием. Отметим, что теорема Туэ—Зигеля—Рота имеет очень важные прило- жения в теории диофантовых уравнений, объяснить которые проще всего на примере конкретного уравнения, например X3-5Y3 = m (т/0) (1.5.11) для некоторого фиксированного целого числа т. Это уравнение по ви- ду напоминает уравнение Пелля, однако его степень больше двух. Если (х, у) — решение уравнения (1.5.11), то справедливо неравенство (с=л (L512) Однако если выбрать е > 0 так, что 2 + е < 3, то из теоремы Рота вытека- ет, что решений неравенства (1.5.12), а значит, и уравнения (1.5.11) лишь конечное число. Используя алгебро-геометрические приемы, но основы- ваясь по существу на тех же идеях, Зигель установил следующий общий результат. Теорема 1.6 (Зигель, 1929 г.). Пусть f(X, Y) — некоторый непри- водимый многочлен с целыми коэффициентами. Тогда уравнение /(X, У) = 0 (1.5.13) имеет только конечное число целочисленных решений, за исключе- нием двух следующих специальных случаев'. а) кривая f(X, Y) = 0 допускает рациональную параметризацию', при подстановке в уравнение (1.5.13) ненулевых рациональных дро- бей X = p(t)/q(t), Y = r(t)/s(t) е Q(0 это уравнение превращается в тождество', б) проективизация кривой (1.5.13) имеет не более двух точек на бесконечности. В частности, лишь конечное число целочисленных решений имеет урав- нение Туэ /(х, у) = т, где /(х, у) е Z[x, у] —неприводимая форма степе- ни п 3. А. О. Гельфонд (см. [28]) показал, что эффективная граница для числа решений уравнения Туэ может быть получена, если иметь доста- точно хорошие нижние оценки для модуля линейной формы от логариф- мов алгебраических чисел оц, ..., (с целыми коэффициентами). Такие
§ 1.51 Диофантовы приближения и иррациональность 77 оценки были получены Бейкером, и с их помощью был решен ряд важ- ных арифметических задач. К числу этих задач, помимо решения и оценок числа решений диофантовых уравнений (см. [89], [91], [695], [614], [490], [491 ]), относятся также эффективные оценки чисел классов эквивалентно- сти квадратичных форм и чисел классов алгебраических числовых полей (см. [146], [770], [771]). Эффективная верхняя граница (см. [614] [89], [749]) yv < хи < exp exp exp exp 103 была получена методом Бейкера для уравнения Каталана xv -уи = \, которое является примером экспоненциального диофантова уравнения. Систематические сведения о таких уравнениях можно найти в книге [749]. В 1843 г. Каталан поставил вопрос, являются ли числа 8 и 9 един- ственными последовательными совершенными степенями. Недавнее реше- ние этой проблемы П. Михайлеску (давшим утвердительный ответ) стало одним из самых ярких арифметических достижений за последние пять лет, см. [577], [170]. 1.5.4. Вывод тождеств (1.5.1) и (1.5.2). Прежде всего, равенство к У а,а2 а,_, 1 _ ata2 ак^ (1.5.14) (х + а,)...(х + аА) х (х+ а1)...(х+ ак) легко устанавливается, если записать правую часть в виде Ло - Л/g Д1Д2 ... ak-\ (х + ... (х + а^) и заметить, что каждый член в сумме слева равен Ak—\ — Аь. Теперь со- отношение (1.5.1) непосредственно вытекает из равенства (1.5.14). Далее, положим х = я2, = — k2 и возьмем k < К < п — 1. Тогда мы получим y-l (-I)!2 _ J_____________________(—1)п~'(и—I)!2 __1_ _ 2(— 1)я~‘ (я2-I2)... (я2 —&2) /г2 /г2(/г2— I2)... (/г2 — (п— I)2) /г2 Напишем гп= 1 k\(n - k)\ 2 k3(n + k)l , тогда (— l)fe-1 (£ - I)!2 (я2- I2)... (я2 —/г2)
78 Элементарная теория чисел [Гл. 1 и мы получаем * «-1 /V 1 /V / 1И-1 ^252(-1)Л(елЛ-ея-1л) = ^^з -2Z2 /2п\ = л=1 Л=1 л=1 п=\ п\п) = £<- 1)‘(е«.« - е») = £ —ТУТКЖ + £ ЧЧ <к515> •=' “ЧТЮ -О Теперь второе тождество (1.5.2) вытекает из этого равенства (1.5.15), если заметить, что сумма стремится к нулю при N -* ос 1.5.5. Рекуррентные последовательности ап и Ьп. Напишем рекур- рентное соотношение (1.5.3), которому удовлетворяют ап и Ьп: nzan - Р(п - 1)ал-1 + (п - 1)3а„_2 = О, п3Ьп - Р(п - 1 )£>„-! + (п - 1)3г>„_2 = о, где Р(п — 1) = р(п) = 34л3 — 51 п2 + 27п — 5. Если умножить первое ра- венство на Ьп_\, а второе на ап_\ и вычесть одно из другого, то мы получим n3(anbn_i - an-ibn) = (п — l)3(an-ibn_2 - ап_2Ьл-\). Вспомним начальное условие а\Ьц — а^Ь\ = 6- 1 -0-5 = 6, из которого выводится равенство апЬп_\ -ап-\Ьп = -^ (1.5.16) и тривиально получается соотношение 1= Т. <к5-|7> k=n+l При этом надо действовать по индукции, начав с равенства с(3)-^=с(3). Величину чисел Ьп нетрудно оценить с помощью соотношения Ьл - (34 - 51П-’ +27п"2 - 5п~3)Ьп-1 + (1 - Зп"1 + Зп~2 - п~3)Ьл_2 = 0. Поскольку «линеаризованный характеристический многочлен» этого со- отношения равен х2 - 34х + 1 и имеет корни 17 ± 2л/2 = (1 ± л/2)4, мы
§1.5] Диофантовы приближения и иррациональность 79 получим bn = O(an), a = (l+v/2)4. Если теперь принять на веру утверждение о том, что числа Ьп целые, а знаменатели чисел ап делят 2[1, 2, ..., /г]3, то уже легко закончить до- казательство. Положим Рп =2[1, 2, п]3ап, qn =2[1, 2........п]36я, где рп, qn gZ. Величину [1, 2, ..., п\ можно оценить, пользуясь законом распределения простых чисел в самой грубой форме: 1 Тогда р^х [1, 2, pl|og"/|ogPl JJnwпп/108,1 = еп. р^п р^.п Следовательно, qn = О(апе3п) , а значит, |С(3) - ^| = <Ж~2) = O(a-2n) = O(q~^) с константой 8 = (loga - 3)/(loga + 3) = 0, 080529 ...> 0. По критерию иррациональности из п. 1.5.2 мы получаем утверждение (1.5.6), в котором степень иррациональности не больше чем 1 + (1/8) = 0. Утверждение о знаменателях чисел ап и Ьп — один из трудных шагов доказательства. Апери доказал этот факт, явно построив последователь- ности ап и Ьп: л=о 2т*(п\(п + т\ (1.5.18) где п k Сп-к = 52 + 52 т=\ т=\ Утверждение о том, что числа ап целые, следует из этих формул, а оцен- ку знаменателей чисел Ьп дает следующий факт: все числа 2[1, 2, .... п]Ч,*(" + *) целые. Доказательство проводится с помощью оценки наибольшей сте- пени, в которой каждое простое число р входит в знаменатель каждого слагаемого в сумме (1.5.18), определяющей cn,k- Дальнейшие свойства иррациональности значений дзета-функции в по- ложительных нечетных целых числах изучались недавно в работах [678], [855], [145], см. также [854]. В частности, В. В.Зудилин доказал, что по крайней мере одно из чисел £(5), £(7), £(9), £(11) иррационально.
80 Элементарная теория чисел [Гл. 1 Производятся интересные попытки доказать иррациональность кон- станты Эйлера, а также понять ее арифметическую природу, см. [765]. В работе [159] константа Эйлера у интерпретируется как экспоненциаль- ный период. При этом по определению кольцо периодов Р порождается числами вида <о, где X — гладкое алгебраическое многообразие размер- ности d, определенное над Q, D СХ —дивизор с нормальными пересе- чениями, gjgQ^(X)— алгебраическая дифференциальная форма степени d на X, а у G //^(Х(С), D(C); Q), см. гл. 5. Это кольцо было предложено М. Л. Концевичем и Д. Б. Загиром в [476] (см. также [301]). 1.5.6. Трансцендентные числа и седьмая проблема Гильберта. По- лезно сравнить приведенное элементарное доказательство с развитой тео- рией трансцендентных чисел, т. е. чисел, не являющихся корнями мно- гочленов с рациональными коэффициентами. Существование таких чисел установлено Лиувиллем в 1844 г.; затем Эрмит доказал трансцендент- ность числа е (1873 г.), а Линдеман (1883 г.) — трансцендентность числа тс (см. [147], [614], [110]). В рамках общей теории А. О. Гельфонда [27]) и Шнайдера получено решение седьмой проблемы Гильберта, см. [417], [93]: доказать, что «степень аР при алгебраическом основании а и алгеб- раическом иррациональном показателе 0, как, например, число 2^, или ек = /-2/, есть всегда или трансцендентное число, или по крайней мере иррациональное»; «...считаем очень вероятным, что такая функция, как, например, показательная, которая, очевидно, для всех рациональных зна- чений аргумента z принимает алгебраические значения, с другой стороны, будет всегда принимать для алгебраических иррациональных значений z трансцендентные значения». Изложение теории трансцендентных чисел выходит за рамки нашей кни- ги, и мы рекомендуем читателю фундаментальную монографию А. Б. Шид- ловского [110] и прекрасную книгу Н. И. Фельдмана [93], содержащую по- дробное изложение вопросов, относящихся к решению седьмой проблемы Гильберта. 1.5.7. Работа Ю. В. Нестеренко о [610). Одним из наиболее впе- чатляющих достижений в теории трансцендентных чисел за последнее де- сятилетие является работа Ю. В. Нестеренко об алгебраической независи- мости чисел тс и см. [610] и [611]. Этот результат основан на изуче- нии степени трансцендентности поля, порожденного числами, связанны- ми с модулярной функцией /(т). Также, все тем же сильнейшим методом, в [610] установлена алгебраическая независимость чисел к, и В процессе доказательства этого результата исходная проблема сводит- ся к нахождению оценки на меру алгебраической независимости чисел тс
ГЛАВА 2 НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ЭЛЕМЕНТАРНОЙ ТЕОРИИ ЧИСЕЛ § 2.1. Разложение и кодирование с открытым ключом 2.1.1. Временные затраты для разложения чисел. Для того чтобы перемножить два простых числа р < q, используя их двоичное разложение, достаточно произвести C(log^)2 битовых операций (см. п. 1.1.1). Предпо- ложим теперь, что нам дано произведение п = pq и требуется найти исход- ные числа р и q. Если р ~ q ~ у/п, то наивный перебор всех чисел d < у/п потребует более чем . । Су/п = С ехр{ log /г I делений с остатком. Такой экспоненциальный рост времени работы де- лает невозможным разложение даже относительно небольших чисел, по крайней мере пока не будут придуманы более эффективные алгоритмы. Например, рассмотрим разложение (1071 - 1)/9 = 241573142393627673576957439049 х х 45994811347886846310221728895223034301839. (2.1.1) -При определенном терпении числа в правой части можно перемножить на листке бумаги за один или два часа. Тем не менее, разложение полу- ченного результата методом перебора займет около Ю10 лет работы (при учете того, что одно деление занимает 10“9 секунд; см. [759], [633], [848], [16]). Впервые разложение (2.1.1) было найдено в 1984 г. при помощи супер- компьютера CRAY и самых передовых методов разложения чисел, которые позволили сделать эту задачу если не дешевой, то по крайней мере выпол- нимой. 2.1.2. Односторонние функции и кодирование с открытым клю- чом. Можно рассматривать двоичную запись числа п = pq как некото- рое послание, которое может быть также закодировано и разными дру- гими способами, например через двоичные записи чисел р и q. Правила перехода от одной формы записи к другой могут быть названы с точки зрения теории информации шифрованием и расшифровкой. Экспери- ментально установлено, что некоторые легко вычислимые функции очень трудно обратить (их называют односторонними функциями). Поэтому
82 Некоторые приложения элементарной теории чисел [Гл. 2 естественно пробовать использовать такие функции в криптографии. На- помним, что криптография изучает проблемы обращения с информацией, связанные с сохранением и нарушением секретности сообщений. Одно- сторонние функции используются в так называемых схемах шифрования с открытым ключом, которые были предложены с семидесятых годах XX в., совершив настоящую революцию в этой области. Перед тем как объяснить работу таких схем, необходимо обратить вни- мание на то, что, тем не менее, не существует ни одной теоретической нижней оценки на сложность вычислений, которая бы подтверждала наше экспериментальное наблюдение о том, что сложность разложения чисел намного превосходит сложность перемножения. В принципе, нельзя ис- ключать возможность того, что в конце концов найдется очень эффектив- ный алгоритм разложения чисел (или обращения какой-нибудь другой из односторонних функций). Это является одной из основных проблем тео- рии вычислительной сложности (см., например, [357], [315] [252], [114], [16]). Если, однако, считать верным этот экспериментальный факт, то его можно использовать для построения новых систем кодирования с многими замечательными свойствами. Опишем теперь первую «криптосистему с открытым ключом», открытую Л. Аллеманом, Р. Ривестом и А.Шамиром в 1978 году, см. [114], [115]. 2.1.3. Криптосистема с открытым ключом. Предположим, что су- ществуют пользователи U\, U%, U3, ... Время от времени некоторой паре пользователей необходимо обменяться сообщениями, которые должны оставаться секретными для всех остальных пользователей. В классической криптосистеме они должны сначала разделить между собой ключи и держать их в секретности. Система с открытым ключом обходит последнее ограничение: для секретного попарного общения до- статочно использования лишь доступной всем информации. Такая система может быть построена следующим образом. 1. Каждый пользователь (// выбирает два больших простых числа pi и qt вместе с двумя остатками в/, di (modfl/), где щ — ptqt, так, чтобы выполнялось условие ezdz = 1 (mod<p(Aiz)), где <p(ttz) = (pz - l)(pz - 1) обо- значает функцию Эйлера (см. 1.1.4). 2. Числа (в/, rii) объявляются всем пользователям. Утверждается, что практически невозможно вычислить dz, зная лишь (в/, щ), так что числа di можно рассматривать как секретные данные, известные лишь одному пользователю (/,. Действительно, покажем, что эффективный алгоритм нахождения di должен был бы также эффек- тивно раскладывать на множители числа я/, что предположительно яв- ляется невыполнимо сложным. Предположим, что нам известны чис- ла di. Тогда ср(/г/) делит eidi — 1. Если бы мы знали сами числа <p(flz), то мы бы могли легко найти pz и pz, поскольку pz + pz = щ + 1 — <p(nz)
§ 2.11 Разложение и кодирование с открытым ключом 83 и pi - qi = \/(р/ + qi)2 - 4iti. Можно показать, что уже знание числа, кратного <р(м/), достаточно для нахождения pi и р, (см. [578], [815]). 3. Предположим теперь, что пользователь Ui желает передать поль- зователю U} зашифрованное сообщение, являющееся последовательно- стью битов. Сначала он разделяет эту последовательность на блоки дли- ны [log2 rij], а затем рассматривает каждый блок как некоторый остаток т (modn7) и наконец шифрует его как остаток b = те> (modtt;). Таким образом, пара (я/, в/) служит, как шифрующий ключ /-го пользователя (напомним, что она известна всем). 4. Получив зашифрованное сообщение, пользователь Uj дешифрует каждый блок b (mod л/), вычисляя остаток bdi (mod/z7) (напомним, что ему известен дешифрующий ключ dj). Это легко проверить при помощи малой теоремы Ферма (см. п. 1.1.4). Ясно, что детали этой схемы могут меняться до бесконечности. На- пример, можно построить процедуру аутентификации («электронная под- пись»), которая имеет вид секретных посланий от пользователя (// к поль- зователю Uj, позволяющих пользователю Uj убедить третью сторону («су- дью»), что послания действительно отправлены пользователем Ui, а не подделаны самим Uj. Это может оказаться решающим для некоторых фи- нансовых протоколов. Обозначим через Ei отображение шифрования посланий, адресованных к пользователю Ui, и через Di —дешифрование. Тогда Е/ является обще- известным, в то время как Ц известно лишь самому пользователю Ui. Для любого послания М имеем О/(Е/(Л4)) = Л4 и Е/(Ц(Л4)) = М. Поль- зователь Ui, посылающий свое послание М пользователю Uj, использует в качестве своей подписи S = Di(M) и передает для Uj его зашифрован- ный вариант Ej(S). В свою очередь, пользователь Uj вычисляет сначала S = Dj(Ej(S)), а потом M = Et(S), используя открытый ключ Е/. Адресат может убедить судью в том, что послание М действительно пришло от пользователя Ui, поскольку, лишь только применяя Е/, возможно преоб- разовать S в исходное содержательное послание М. С другой стороны, адресат не может подделать подпись S, поскольку ему не известно Di. Рассмотрим теперь шифрование с открытым ключом с точки зрения теории чисел, а не теории информации. Мы покажем, как некоторые клас- сические теоретико-числовые результаты могут быть применены к двум конкретным проблемам в этой области. Проблема 1. Как находить большие простые числа? Необходимо отметить, что нам действительно необходим эффективный метод массового производства «достаточно случайных» больших простых чисел, для того чтобы пользователь мог вычислить (при помощи мощного компьютера) его собственную пару (р/, qi), будучи уверенным в том, что другой пользователь получит другую пару.
84 Некоторые приложения элементарной теории чисел [Гл. 2 Проблема 2. Как разлагать большие числа? Эта проблема является центральной для третьей стороны, желающей взломать данную криптосистему, а также, разумеется, для ее разработчи- ков, желающих обеспечить ее надежность (см. [315], [114], [448]). По словам А. Уайлса [842], одним из изменений в теории чисел за по- следние двадцать лет является то, что она стала частично прикладной об- ластью (возможно, следует сказать, что она вновь стала применяемой на практике наукой, как и более чем две тысячи лет назад). Криптосисте- мы с открытым ключом изменили наш взгляд на сохранение секретности и шифрование. Система RSA зависит от практической сложности разло- жения чисел. Стоящие с семнадцатого века вопросы построения больших простых чисел, проверки на простоту и разложения чисел на сомножители ставят теперь новые и конкретные проблемы. Насколько могут быть быст- рыми алгоритмы нахождения ответов на эти вопросы? Проблема проверки на простоту уже решена (см. п. 2.2.4, п. 2.2.6). Две другие проблемы еще не получили своего теоретического решения, тем не менее, первая из них кажется более простой, чем другая. 2.1.4. Статистика и массовое производство простых чисел. Асимп- тотический закон распределения простых чисел (или теорема о простых х числах) утверждает, что к(х) ~ (см. п. 1.1.6). Таким образом, можно начать с наивного предположения о том, что если N не слишком мало по сравнению с х, то между х и х + М должно быть около TV/ logx простых чисел. Например, если наименьшее простое число, следующее за х, огра- ничено величиной х + (logx)M, то можно просто последовательно прове- рить х, х + 1, х + 2, ... Сложность нахождения простых чисел будет тогда того же порядка, что и сложность используемого алгоритма проверки на простоту. Если можно положить М = 1, то для нахождения простого числа порядка около 2100 надо будет сначала построить случайное число х того же порядка, а потом проверить около (log 1О,оо)/2 « 115 нечетных чисел. Если существует тест на простоту для у, сложность которого является многочленом от log у, то это становится выполнимой задачей. Ниже мы обсудим эффективные вероятностные тесты на простоту. Следует заметить, что, тем не менее, такое отсутствие больших про- межутков между простыми числами не является доказанным и, возможно, даже неверно. Все известные результаты о промежутках между простыми числами дают верхние оценки, являющиеся лишь степенями от х (см. [404], [421], [850]). Приведем некоторые из них: (2.1.2) л(х + х9) - тс(х) С(0)^
§2.1] Разложение и кодирование с открытым ключом 85 при 0> Н/20, где С(0) является положительной функцией. Для почти всех х известен более сильный результат: л Г0 тс(х + %0) — тс(х) > 0,15--, logx если 0 > 1/12. Интересное обсуждение больших промежутков между простыми чис- лами можно найти в [675], с. 84, а также в [421] и [850]. 2.1.5. Вероятностные методы проверки на простоту. Некоторые из современных эффективных методов проверки на простоту на самом деле проверяют более простое свойство, связанное с понятием псевдопростых чисел Эйлера (см. п. 1.1.5). Напомним, что п называется псевдопростым числом Эйлера по модулю 6, если п и b взаимно просты и 6(П-1)/2 = Q) (mod/г). (2.1.3) Простые числа являются псевдопростыми по модулю любого числа Ь: это следует из того факта, что (Z/nZ)x —циклическая группа (см. п. 1.1.5). Сразу же видно, что сравнение (2.1.3) не выполнятся при составном п по крайней мере для половины остатков в ^L/nL}*. Вероятностный тест на простоту, основанный на этом замечании, заключается в проверке срав- нения (2.1.3) скажем, для нескольких сотен случайно выбранных чисел Ь. Числа я, прошедшие такой тест, иногда называются «коммерческими про- стыми числами». Коммерческие простые числа используются в криптоси- стемах с открытым ключом, несмотря на то что, строго говоря, их простота не была установлена никаким тестом. Оказывается, их простота может быть выведена из предположения ис- тинности обобщенной гипотезы Римана о нулях L-функции Дирихле. А именно, из этой гипотезы можно вывести, что выполнение сравнения (2.1.3) для всех b < 2(logn)2 влечет за собой простоту числа п (см. [578], [815]). Для того чтобы проверить это условие, достаточно произвести O((logfl)4+c) делений с остатком для любого выбранного е > 0. Этот алгоритм проверки на простоту, называемый тестом на про- стоту Соловэя—Стрессена, имеет много интересных вариантов, на- пример тест Миллера—Рабина (см. [764]), [578], [655], [675], [699], [469]). Он основан на следующем понятии строгой псевдопростоты. Предположим, что число п является псевдопростым по модулю Ь, так что bn~[ = 1 (mod л). Вычислим теперь все последовательные квадратные корни из правой и левой частей, т. е. для i — 1, ..., s, где число t = (п - 1)/2S нечетно. Если п — простое число, то первый остаток в этой последовательности, отличный от 1, должен быть равен -1. Будем назы- вать число п строго псевдопростым, если либо Ь* = 1 (mod и), либо для
86 Некоторые приложения элементарной теории чисел [Гл. 2 некоторого 0 < г < s выполняется равенство b2'1 = -l (modга). (2.1.4) Тест Миллера—Рабина заключается в проверке этого условия для мно- жества случайно выбранных чисел Ь. Ф.Морэн заметил в работе [589], что на практике алгоритм Мил- лера—Рабина требует довольно много времени, поскольку необходимо вычислять много экспонент от остатков. Более быстрый метод ЕСРР обсуждается в п. 2.2.6. В п. 2.2.4 описывается недавно открытый важный теоретический факт, утверждающий, что простые числа могут быть распознаны за полино- миальное время. Это было сделано в работе М. Аграваля, Н.Каяля и Н.Саксены [117], которые заметили, что полиномиальный вариант малой теоремы Ферма (1.1.2) приводит к быстрому детерминированному алго- ритму тестирования на простоту: время этого алгоритма равно O(log12 /V), где для функции /(/V), зависящей от N, выражение б(/(А)) обозначает O(t(N) • po/g(log/(/V))), где poly — некоторый многочлен. 2.1.6. Проблема дискретного логарифма и протокол обмена клю- чами Диффи—Хэллмана. Обмен ключами по Диффи—Хэллману явля- ется первой опубликованной криптосистемой с открытым ключом [315]. Для того чтобы передать важную информацию Бобу, Алиса использует этот алгоритм следующим образом: вместе с Бобом они выбирают простое число р и целое число g, которое имеет порядок р - 1 по модулю р (т. е. gp~l = 1 (mod р), но gn 1 (mod р) для любого положительного числа п < р — 1). Алиса выбирает случайное число п < р, а Боб выбирает слу- чайное число т< р. Алиса посылает Бобу число gn (mod р), а Боб посы- лает Алисе число gm (mod р). Теперь Алиса вычисляет секретный ключ: s = gmrl = (gm)n (mod р). Аналогичным образом Боб вычисляет свой секретный ключ: s = gmn = (gn)m (mod р). Потом Алиса использует ключ s и посылает Бобу зашифрованный вариант своего послания. Боб, который также знает ключ s может его дешифро- вать. Другие лица могут знать оба числа gn (mod р) и gm (mod р), но они не смогут использовать их для достаточно быстрого получения т, и, или gmn (mod р). 2.1.7. Вычисление дискретного логарифма для эллиптических кри- вых над конечными полями (ECDLP). Структура абелевой группы на точках E(FP) эллиптической кривой используется во многих арифмети- ческих вопросах. В частности, тот случай, когда эта группа циклическая
§ 2.2] Детерминированные проверки на простоту 87 большого порядка, приводит к проблеме ECDLP (эта аббревиатура возни- кает от английского выражения «Elliptic curve discrete logarithm problem», «Проблема дискретного логарифма для эллиптической кривой»), которая является очень важной для приложений к криптографии с открытым клю- чом, см. [466], [471], [472], [352], [570], [473]. Эта идея была независимо предложена Нилом Коблицом и Виктором Миллером в 1985 г., и с тех пор было проведено огромное число исследований на эту тему. Вычисли- тельная задача, от которой зависит надежность криптосистем, заключается в проблеме дискретного логарифма для эллиптических кривых: если даны эллиптическая кривая Е над конечным полем F7 и две точки Р, Q € E(¥q), то требуется найти такое целое число X (при условии, что оно существу- ет), что Q = [Х]Р. Если размер поля q достаточно большой и если эллип- тическая кривая Е не относится к одному из специальных типов, то эта вычислительная задача считается очень сложной. Многочисленные применения арифметической алгебраической геомет- рии к криптографическим конструкциям обсуждаются в [352], [570] и во многих других замечательных источниках, в частности в [470], где так- же рассматриваются некоторые детали проблемы вычисления порядков групп точек на эллиптической кривой. Например, для криптографии имеют значение такие старые теоретико-числовых вопросы, как существование бесконечного числа простых чисел Софи Жермен и простых чисел Мер- сенна. § 2.2. Детерминированные проверки на простоту Вероятностные проверки на простоту, осуществляемые за полиноми- альное время, существуют уже много лет. Имеется хорошо известный де- терминированный алгоритм, работающий за почти полиномиальное время ((logn)logloglogrt), построенный Адлеманом, Померансом и Румели (1983 г.), см. [114], [524], [252], и алгоритмы с использованием случайных последо- вательностей, построенные Гольдвассером и Килианом ([375], [376]), Ат- кином и Морэном ([142]), а также Адлеманом и Хуангом ([116]), которые устанавливают как простоту, так и разложимость за полиномиальное время от всех входных данных. Этот метод доказательства простоты, использу- ющий эллиптические кривые и называющийся ЕСРР, был в дальнейшем развит Ф. Морэном, см. [587]. В августе 2002 г. М. Агравалем, Н. Каялем и Н. Саксеной из ПТ (Ин- дийский технологический институт, Канпур) был найден детерминирован- ный полиномиальный алгоритм. Среди прочего, в этом параграфе мы рас- скажем и об этом результате. Опишем некоторые детерминированные проверки на простоту.
88 Некоторые приложения элементарной теории чисел [Гл. 2 1. Адлеман, Померане и Румели (1983): этот алгоритм имеет субэкспо- ненциальное время работы, но доказательство того, что он правильно ра- ботает, безусловно (т. е. не использует ни одной не доказанной гипотезы). 2. Открытие последнего времени, утверждающее, что простые чис- ла распознаваемы за полиномиальное время, сделанное М. Агравалем, Н.Каялем и Н.Саксеной, которые нашли, что полиномиальный вариант малой теоремы Ферма (1.1.2) приводит к быстрому детерминированному алгоритму проверки на простоту: время этого алгоритма равно O(log12 ri), где для функции /(я), зависящей от я, выражение О(/(я)) обозначает O(t(n) • poly(\ogt(n))). 3. Эллиптические кривые и доказательство простоты, алгоритм ЕСРР (это сокращение от английского выражения «Elliptic Curve Primality Prov- ing», «Доказательство простоты при помощи эллиптической кривой»), построенный Ф. Морэном, см. [142], [587], [588]. 2.2.1. Тест на простоту Адлемана—Померанса—Румели: основные идеи. Существует два основных варианта этого алгоритма, см. [114], [524], [252]: более простая, вероятностная версия и детерминированная версия. Время работы детерминированной версии ограниченно величиной (logn)clogloglogn, где с является эффективной константой. Степени этого выражения растут настолько медленно, что эта оценка может быть названа «почти полиноми- альной». Все предыдущие детерминированные проверки на простоту име- ли экспоненциальное время работы (например, тест Полларда, описанный в работах [639], [675], требует около пВ+е = ехр{ + е) logn} операций). Данный алгоритм состоит из следующих этапов. 1. Проверяется ряд условий, обобщающих сравнение (2.1.3) для сим- вола Якоби. Если число п не удовлетворяет ни одному из этих условий, то оно составное. 2. Если число п проходит первый этап, то тест строит небольшое мно- жество целых чисел, содержащее все делители г числа и, не превосходя- щие \/п. Остается проверить, делится ли п на хотя бы одно число из этого списка. 3. Множество возможных делителей г определяется по их остаткам по модулю целого числа $ > у/п, которое, в свою очередь, является произ- ведением нескольких различных простых чисел q. Вследствие китайской теоремы об остатках (см. соотношение (1.1.5)) достаточно задать г (modt?) для каждого числа q, делящего $.
§ 2.2] Детерминированные проверки на простоту 89 4. Каждое число q, делящее s, удовлетворяет следующим условиям: q— 1 является произведением нескольких различных простых чисел, взятых из фиксированного множества {ро, , р*}. Эти простые числа называются начальными простыми, а числа q называются евклидовыми простыми числами, поскольку они построены методом, используемом в доказатель- стве Евклида бесконечности множества простых чисел: q = 1 + Ро°р“' ... р^", а,=0или1. Для того чтобы оценить время работы, необходимо использовать одну трудную теорему из аналитической теории чисел (см. [649]), из которой следует, что даже для небольшого числа начальных простых чисел про- изведение всех евклидовых простых чисел, порожденных ими, может быть очень большим. Более точно, при заданном п можно построить множество начальных простых чисел {ро, ..., р&}, произведение t которых ограничено величиной , , , log(nC2logloglog'') (п>ее), (2.2.1) тогда как произведение соответствующих евклидовых простых чисел огра- ничено снизу величиной у/п: S= Д q > у/п, (2.2.2) где С2 является вычислимой положительной константой. Заметим, что в данной ситуации число евклидовых простых чисел ограничено сверху величиной тс(/ + 1) < t + 1. Для любого п 1О350 можно положить t = = 2 • 3 • 5 • 7 • 11 • 13 • 17 • 19. 5. Для нахождения г (mod q) в действительности используется вычис- ление дискретного логарифма ind(r, g, q) для всех возможных г по отно- шению к фиксированной образующей g группы (Z/pZ)x. Эти логарифмы, в свою очередь, определяются через их остатки ind(r, g, q) (mod pj, где pz- пробегает все начальные простые числа. Это вновь следует из китайской теоремы об остатках. Опишем теперь этот алгоритм более детально. 2.2.2. Гауссовы суммы и их использование в тестах на простоту. Для нечетного q критерий Эйлера =q(n-\)/2 может быть за- писан в виде (п \ л —1 </ —1 п—1 = (-1)^-(modл), (2.2.3) что дает формулу для вычисления символа квадратичного вычета числа п по модулю q. В обсуждаемом здесь алгоритме используются обобщения этой формулы для символа вычета произвольной р-й степени по модулю начальных простых чисел р. Для того чтобы объяснить эти обобщения,
90 Некоторые приложения элементарной теории чисел [Гл. 2 необходимо ввести понятие гауссовых сумм, которые были изначально ис- пользованы в одном из доказательств Гаусса квадратичного закона взаим- ности (см. ниже). Число решений сравнения хр = а в группе (Z/(?Z)X вычисляется при помощи характера Дирихле порядка р по модулю q, который является гомоморфизмом /: (Z/(?Z)X -*СХ. Каждый такой характер определяется образом ехр{£ • 2ш/р} образующей g группы (Z/(?Z)X. Число таких харак- теров равно р, если р делит q - 1, и 1 в противном случае. Для простого числа q имеем равенство Card{x е (Z/«7Z)x|xp =а}= Х<«)- (2.2.4) xlxp = l В частности, для р = 2 эта сумма равна 1 + (a/q). Сумма в правой части вы- ражения (2.2.4) становится равной нулю тогда и только тогда, когда /(а) / / 1 для некоторого /. Это происходит, только если р | (q — 1) и а не являет- ся р-й степенью по модулю q. Если р не делит q — 1, то обе части равны 1. Наконец, если р|(р — 1), и а является р-й степенью, то обе части равны р. Один из походов к гауссовым суммам заключается в их рассмотрении как дискретных аналогов гамма-функций T(s), которые задаются интегралом °о , ф)=$еЛ!7 (2.2.5) о у при Re(s) > 0. Здесь подынтегральное выражение равно произведению ад- дитивного квазихарактера группы К (т. е. гомоморфизма у ь-► е~у) и муль- типликативного квазихарактера у ь-► ys группы Кх. Оно интегрируется по множеству положительных чисел по отношению к мультипликативной ин- вариантной мере dy/y. Для того чтобы получить гауссову сумму, надо заменить К на Z/WZ для некоторого N > 1, е~у на аддитивный характер Z/MZ —> Сх : у = = ехр{2к//дг}, a ys на мультипликативный характер /: (Z/?VZ)X —> Сх. Ха- рактер Дирихле /: Z—>С, соответствующий / и также обозначаемый че- рез х, определяется как /(я) = х(а (m°d М) ^ля (а, ЛА) = 1 и %(а) = 0 для (а, ЛО > 1. По определению гауссова сумма G(x) равна л/—1 0(x) = ExW- (2.2.6) Х=1 Для а е Z часто используются следующие обозначения: /v-i Ga(X) = ExW- Х=1 Вследствие своей очевидной схожести формулы (2.2.5) и (2.2.6) определя- ют функции с многими похожими свойствами.
§2.2] Детерминированные проверки на простоту 91 Для того чтобы их сформулировать, нам потребуется важное понятие примитивного характера Дирихле. Характер / примитивный по моду- лю N, если он не индуцирован ни с какого характера по модулю М для некоторого собственного делителя М числа N. Эквивалентно, ограниче- ние х на каждую подгруппу Нм = ((1 +MZ)/(1 + /VZ))X не тривиально. Для примитивного характера / выполняются равенства Gfl(x) = x(a)G(X) (a€Z), (2.2.7) GW = X(-1)G(X), (2.2.8) |G(x)|2 = /V. (2.2.9) Свойство (2.2.7) соответствует интегральной формуле ^e~a!)ys^-=a-sr(s) (Re(s) > 0), о у а свойство (2.2.9), записанное в виде G(x)G(x-1) = х(—1)Л/. соответствует функциональному уравнению Г($)Г(1 -S) = S Sill Из равенств (2.2.7)—(2.2.9) сразу же выводится квадратичный закон взаимности. Докажем, например, основную формулу (?)(')=<2-210» где / и q — нечетные простые числа. Сначала заметим, что символ квад- ратичного вычета х(а) = является примитивным характером Дирихле по модулю q. Соответствующая квадратичная гауссова сумма G(x) явля- ется элементом циклотомического кольца алгебраических чисел R = Z[CJ. В любом коммутативном кольце выполняется сравнение (а + Ь)1 = = al + bl (mod//?), так как биномиальные коэффициенты С{ делятся на /. Поскольку х1(а) = х(я) = ±1, имеем G(x)' = Gz(xz) (mod//?), GZ(XZ) = x(7)G(x). так что G(x)z-' = (|) (mod//?). (2.2.11) С другой стороны, x = X» и из свойства (2.2.9) следует, что G(x)2 = x(-1)9 = (-1)^^. (2.2.12)
92 Некоторые приложения элементарной теории чисел [Гл. 2 2/ —1 Выражая левую и правую части формулы (2.2.11) как G(/) “2”, получаем д-i /-1 /-1 // \ (-1)= (i) (mod//?). (2.2.13) Наконец, из соотношения (2.2.13) и критерия Эйлера /-i fl\ = (~) (mod/) следует свойство (2.2.10). Также для Z//VZ существует аналог бета-функции = f (Re(s), Re(/) > 0). 0 У Эта функция называется якобиевой суммой, построенной по двум харак- терам Дирихле х, ф (mod/V). По определению ЛХ>Ф) = 52 Х(ХЖ1-Х)= 52 ХО/ЙхФЙ1+//) (2.2.14) х (modAf) у (mod/V) (равенство этих двух выражений может быть установлено при помощи за- мены переменных у(\ — х) ь->х, х(1 +//)»-> у\ Если /, ф и /ф являются примитивными характерами по модулю N, то АХ-Ф) = ^^=ЛФ-Х). (2-2.15) что соответствует классическому равенству B(s, t) = Г($)Г(/)/Г($ + /). Действительно, вычислим произведение О(Х)О(Ф)= 52 Х(да(Ф)= 52 ХФМ^Ф«С(Ф). (2.2.16) х (mod N) х (mod /V) Применяя соотношение (2.2.7), получаем Фиус/ф) = олф) = 52 у (modW) так что выражение (2.2.16) становится равным 52 (хФ)(х)Фш*1+г/) = 52 Ф(//)С1+ихФ) = х,у (mod/V) у (mod/V) = 52 Ф(Л(1+//)О(хФ) = ЛФ>х)О(хФ). у (mod N)
§2.2] Детерминированные проверки на простоту 93 Установим теперь некоторые полезные сравнения, используемые в те- сте на простоту. Пусть р и q — два простых числа, p\(q — 1), / — харак- тер Дирихле порядка р по модулю q. Выберем образующую t = tq группы (Z/pZ)x и положим г]р = х(^). Это примитивный корень р-й степени из единицы, a G(x) € R = Z[£₽, = Z[£PJ. Пусть теперь I — простое число, отличное от р и q. Из соотношения (2.2.7) выводится, что G(X)Z =/(/)-'G(/) (mod//?). (2.2.17) Применяя последовательно это сравнение р — 1 раз, получаем G(x)/P"' Х(0-/₽ ' G(X/₽ ) (mod//?), поэтому G(x)z₽"-'=x(/)‘l (mod//?), (2.2.18) так как lp~{ — 1 (mod p). Теперь соотношение (2.2.18) можно переписать в виде _ ___ (G(x)p)(Z₽-'-,)/'’ = x(0 (mod//?), что обобщает формулу (2.2.13). Важно то, что G(x)p принадлежит меньшему кольцу Z[£p] (для р =2 это в точности Z). Более того, G(/)p можно выразить через суммы Якоби: при р > 2 имеем р-2 G(x)₽ =Х(~ П Лх» X*)- (2-2.19) /=1 Для доказательства этого тождества достаточно почленно перемножить формулы для i = 1, 2, ..., р — 2, учитывая, что соотношение (2.2.8) может быть за- писано в виде G(/p-1)G(x) = G(x)G(x) = х(“0^- Равенство (2.2.19) используется в сочетании со следующим сравнени- ем, доказанным Ивасавой (см. [437], теорема 1): Лх“- X*) = (mod(X)2), где (X) = (1 - £р) является простым идеалом в кольце Z[£p]. Таким об- разом, G(X)P = -Х(-(mod (X)2), (2.2.20) что становится точным равенством при р = 2.
94 Некоторые приложения элементарной теории чисел [Гл. 2 2.2.3. Детальное описание теста на простоту. 1. На предварительном этапе (см. §2.2.1 (4)) вычисляется число t = = П-=о Pi> являющееся произведением начальных простых чисел, удовле- творяющих соотношениям (2.2.1) и (2.2.2): t < (logw)C2loe|og|°g'1, S= J] q > \/п. qj-\\t Как уже было замечено, для п < 1О350 можно положить / =2-3-5-7-11 х х 13-17-19. В общем случае для отыскания t используется метод проб и ошибок, а простота евклидовых простых чисел проверяется примитив- ным перебором. Поскольку каждое число q ограничено величиной t + 1, а количество чисел q ограничено величиной тс(/ + 1) < / + 1, предваритель- ный этап требует не более чем (logtt)C3,oglog,og'z операций для некоторой эффективной константы сз. Также на этом этапе следует проверить, что (я, s) = (п, t) = 1 (иначе число п составное, и алгоритм останавливается). 2. Теперь необходимые условия для простоты, по существу имеющие вид (2.2.18), могут быть проверены для каждой такой пары р, р, что р | (р - 1), q | s, и для каждого характера Дирихле / (modp) порядка р. Удобно менять q при фиксированном р. Для каждого q вычисляется по- рождающая tq группы (Z/pZ)x. Характеры Дирихле соответствуют прими- тивным корням из единицы т)р. Условие простоты, соответствующее тройке (р, X)» заключается в следующем: =т](Х) (modn/?). (2.2.21) где т)(х) является р-м корнем из единицы (вследствие соотношения (2.2.18) для простого числа п выполняется равенство т)(/) = /(л)). Для провер- ки формулы (2.2.21) надо разложить левую часть по Z-базису кольца R = Z[£p, и сравнить ее покоординатно с правой частью. 3. Если выполняются все сравнения (2.2.21), то вычисляется множе- ство, содержащее виртуальные простые делители г числа п, не превос- ходящие у/п. Объясним сначала, как это делается в простейшем случае, когда пр~{ — 1 не делится на р2 ни для какого р. В этом случае имеем просто г = nl (mod s) для некоторого / е {0, 1, ..., /}. Действительно, если г\п, то положим гР-1 _ 1 /р(г) ='р_, _ ‘ (modp), /p(r)eZ/pZ. (2.2.22) Тогда 1Р (гг') = 1Р (г) + 1Р (г'), 1Р (n) = 1. (2.2.23)
§ 2.2] Детерминированные проверки на простоту 95 Если число г простое, то из соотношения (2.2.18) следует, что G^rP~' (mod г/?). Представим (rp~l - l)/(np_| - 1) в виде а/b, где b = 1( (mod р)), так что lp(r) = а( (mod р)). Из формул (2.2.21) и (2.2.22) вытекает равенство Х(г) = Х(г)" = G(X)'’(rP’'-|) =г)(Х)а (modrR), и, наконец, X(r) = 71(x)Z',,r) (г >2). (2.2.24) Из аддитивности (2.2.23) следует, что равенство (2.2.24) выполняется во- обще для всех делителей числа я, а не только для простых. В частности, при г — п получаем т)(х) = /(и), поскольку lp{ri) = 1. Итак, мы установили, что если пр~х — 1 не делится на р2, то для любой тройки (р, р, х) имеем равенство х(Н = х(«)/₽(г)- так что г = и! (modp), где i = lp(r) (mod р) для всех р. 4. В общем случае выполняется равенство пр~} — 1 = phu, 1, где р не делит и. Вычисления становятся более длинными, но время работы по- прежнему ограниченно выражением (logfl)cloglog,og'z для, возможно, очень большой константы с. Вновь для каждой тройки (р, р, /) имеется сравне- ние (2.2.21): G(X)₽h“ = П(Х) (modлЯ)- h = h(p,q,y)^\. Определим ш(х) как наименьшее такое i е {1, 2, ..., /г}, что G(x)p M срав- нимо со степенью £р по модулю nR. Если ш(/) > 2, то число О(/)рИх) м = = (С(х)р)рИХ) 2“ принадлежит кольцу Z[£p], для которого можно выбрать Z-базис в виде {1, £>р, ..., £р-2}. Также на данном этапе надо проверять следующие дополнительные условия: для каждого j е {0, 1, ..., р — 1} по крайней мере один из коэффициентов элементов С(х)рИх) “ — взаимно (2.2.25) прост с п по отношению к данному базису. Если это утверждение неверно, то число п составное, поскольку оно имеет нетривиальный общий делитель с одним из коэффициентов.. В про- тивном случае, как и выше, можно доказать, что rp~x = 1 (mod pw^) для всех г | /г, и что при данном р для всех троек (р, р, /) выполняется равенство Х(г) = x(v7) для некоторого i е {0, 1, ..., (2.2.26)
96 Некоторые приложения элементарной теории чисел [Гл. 2 где v (mod q) — однозначно определенный остаток, для которого X(v) = г)'(х), Т)'(Х) = С(х)рИХ)И (mod nR). (2.2.27) Также можно определить корень из единицы /(v) G Z[£p], используя яко- биевы суммы (см. [524]). Выберем такие a, b G Z, что р2 не делит ab(a + Ь), р2 не делит ((а + Ь)р - ар - Ьр) (например, а = b = 1 при р < 3 • 109, р / 1093, 3511). Используя соотно- шение (2.19), можно доказать, что Чх) =Лха, X*) (modnZ[Cp]). 5. Теперь надо соединить все вычисления для получения такого остат- ка v по модулю s, чтобы каждый потенциальный делитель г | п, г < у/п, удовлетворял сравнению г = vl (mods) для некоторого /, 0 < i < t. Ввиду китайской теоремы об остатках достаточно найти для каждого q | s такую степень k, что v = tq (modg). С этой целью для каждого p\(q — 1) вы- берем характер /, для которого /(/^) = ^р. Из соотношения (2.2.27) сле- дует равенство /(/*) = £* =т]'(х)» которое определяет k (mod р) и, нако- нец, v (mods). 6. Остается проверить, делит ли п какое-нибудь из чисел Г/, определя- емых соотношениями г-i = V (mod s), 0 п < s, 0 < i /, Число п, прошедшее все эти проверки, является простым. На практике этот алгоритм является очень быстрым (см. [252], [15]). Проверка простоты часто может быть проведена быстрее за счет следу- ющего элементарного соображения.. Если s не делится ни на один квадрат и делит п — 1, а для каждого qi\s существует такое a, G (Z/mZ)x, что НОД(а-л-|)/?‘ - 1, п) = 1, а"-' = 1 (modn), (2.2.28) то каждый простой делитель р числа п сравним с 1 по модулю s. Действи- тельно, из соотношений (2.2.28) следует, что порядок элемента в группе (Z/pZ)x равен р/. Так как pz|(p - 1), получаем, что s|(p - 1). В частности, если s > у/п, то число п простое. Разумеется, чтобы приме- нить это наблюдение, необходимо знать достаточно большой делитель s числа п — 1. Вариант этой идеи используется в некоторых схожих проверках на про- стоту в [524], [375] и в ЕСРР, см. §2.2.6. Этот прием также использовался в доказательстве того, что /?юз1 является простым числом (см. [847]), где
§ 2.2] Детерминированные проверки на простоту 97 Rn == (10" — 1 )/9. Известно, что при меньших значениях п простыми явля- ются лишь только /?2, /?23 и /?317- Очень нетривиальное разложение на простые сомножители числа /?71 было задано равенством (2.1.1). После работы Гольдвассера и Килиана Аткиным и Морэном был раз- работан общий тест на простоту, который имеет вероятностно полиноми- альное время (более подробное обсуждение ЕСРР см. в [142], а также в конце этого параграфа). Адлеман и Хуанг изменили в [116] алгоритм Гольдвассера—Килиана и получили алгоритм с использованием случай- ных последовательностей, работающий за полиномиальное время и всегда отвечающий, является ли входное число простым. 2.2.4. Простые числа лежат в классе Р. Теперь мы расскажем о не- давно сделанном открытии, утверждающем, что простые числа можно рас- познать за полиномиальное время (см. [117]). Оно принадлежит М. Аг- равалю, Н.Каяле и Н. Саксене, которые заметили, что полиномиальный вариант малой теоремы Ферма (1.1.2) приводит к быстрому детерминиро- ванному алгоритму проверки на простоту: время этого алгоритма задается функцией O(log12fl), где для функции /(и), зависящей от и, выражение б(/(я)) обозначает O(t(ri} • po/z/(log/(fl))). Этот алгоритм основан на следующем полиномиальном варианте малой теоремы Ферма (1.1.2). Теорема 2.1. Пусть р и а — такие целые числа, что НОД(а, р) = 1. Тогда число р простое в том и только том случае, если (х - а)р = хр - a (mod pZ[x]). Пусть требуется проверить простоту числа п. Если п простое, то, оче- видно, тест Test(a, г): (х - а)п=хп - a (mod (хг - 1, п)) (2.2.29) достигнет цели (т. е. выдаст ответ «истина») для всех целых чисел а и г. Результат Аграваля—Каяля—Саксены утверждает, что, наоборот, если Test (а, г) является истиной для всех целых чисел а и г в промежутке 0 < г <С log6 п, 0 < a log4 п и п не имеет ни одного простого сомножителя <С log4 п, то п — простое число или степень простого числа. Здесь и ниже все константы, подразумеваемые в знаке <С, являются абсолютными. Так как выполнение теста Test(a, г) требует времени не более чем O(r2 log3 п) или даже О(г1 log24"5 п), если использовать быстрое преоб- разование Фурье для перемножения многочленов и чисел по модулю п, это, как и требовалось, дает детерминированный полиномиальный алгоритм, поскольку очевидно, что проверка того, является ли п нетривиальной сте- пенью, может быть сделана за полиномиальное время. Напомним, что быстрое преобразование Фурье (обозначаемое FFT от английского сло- восочетания «Fast Fourier Transform») является быстрым алгоритмом, сво-
98 Некоторые приложения элементарной теории чисел [Гл. 2 Я дящим от О(г2) к O(r log г) число перемножений коэффициентов, требу- I емых для перемножения двух многочленов степени г, а также сводящим I от O(logn2) к O(logn log log я) время перемножения двух целых чисел по модулю п. На самом деле результат, доказанный Агравалем, Каялем и Сак- ? сеной, несколько более сильный: он утверждает, что возможно точно найти : единственное число г <С log6/г, для которого выполнение Test(a, г) для всех а log4 п является достаточным для установления простоты п. Это улучшает наибольшее возможное время работы алгоритма от O(log18+c п) до O(log12+c п). По известной гипотезе о плотности множества простых чисел Софи Жермен реальное время работы равно всего лишь O(log6+e п) (простые числа Софи Жермен — это такие нечетные простые числа q, что г = 2q + 1 также является простым): Предположение 2.2 (о плотности множества простых чисел Софи Жермен). #{^ < х: q и 2q 4- 1 простые} ~ С -- log2 х Заметим, что здесь имеется очевидная аналогия с асимптотическим за- коном распределения простых чисел (1.1.15) (т. е. с соотношением для плотности множества всех простых чисел, меньших или равных %): х: q простое} ~ К • :-Х-. log2x Более точно, результаты Аграваля—Каяля—Саксены, из которых сле- дует вышесказанное утверждение, заключаются в следующем. Будем обо- значать через Р(т) наибольший простой делитель целого числа т, а через ог(т) —порядок элемента т (mod г), где г произвольное простое число, не делящее т. Предложение 2.3. Для любого п существует такое простое число г < log6 л, что Р(ог(п)) 2 Jr log л. Предложение 2.4. Пусть целое число п и простое число г\п удо- влетворяют следующим условиям'. а) Р(ог(п)) > I, б) Test(a, г) является истиной для а = 1, 2, ..., /, в) у числа п нет простых делителей, меныиих I, где I = 2jr\ogn. Тогда п является степенью простого числа. Доказательство использует результат Фуври [347] и Бэйкера—Хар- мэна [148], утверждающий положительность плотности множества про- стых чисел г, для которых Р(г — 1) > г2/3. Этот результат, доказываемый при помощи теории решета, является сложным, но не столь неожиданным, поскольку легко видеть положительность плотности множества таких це- лых чисел пг, что Р(т) > т2^ (или даже Р(т) > тс при любом фиксиро- ванном с< 1). Действительно, количество целых чисел т^х, имеющих
§2.2] Детерминированные проверки на простоту 99 простой делитель q > хс для с равно £2 1х/<71, что асимптотиче- xc<q^x q простое ски равно log( 1/с)х при большом х. Покажем, что при достаточно большой абсолютной константе С для каждого целого числа п существует простое число г, удовлетворяющее условиям (2 log п)6 О (С log и)6, ог (п) > г^3, Р(г-\)> г2/3. (2.2.30) Действительно, из только что сформулированного результата следует, что количество простых чисел г < х = (С log/г)6, для которых Р(г - 1) > г2/3, , х C6logrt6 „ не превосходит стс(х) ~ log(Cnj'* Где С является некоторой абсолютной константой. Для количества простых чисел, меньших (2 log /г)6, выполняет- ся оценка <С , для количества чисел г < х, для которых оЛп) г1/3, loglogn „д, с г \ , C4l°gn5 имеется оценка — -—р—, поскольку все такие простые числа г делят число g g г1/3 а для количества простых делителей числа N имеется оценка / log/2 x2/3logn = С4 log/г5 X—j log(/ log п) log log/г log log n ' Из этого следует, что для достаточно, большой константы С существует „ м log л6 по крайней мере |Og п простых чисел, удовлетворяющих условиям (2.2.30). Пусть г — такое простое число и q = Р(г — 1). Тогда q является простым числом, делящим г — 1, но не делящим (г — 1 )/ог(п} (поскольку (г — 1)/ог(я) < г2/3 < q), так что q делит ог(п) и Р(ог(л)) О f2/3 2л/г log/2. □ Идея доказательства предложения 2.4 заключается в рассмотрении це- лых чисел п1 р1 и nk р1 ив установлении того, что существуют две различ- ные пары (/, /) и (6, /), для которых nl pi =nkpl (mod г). Положим q = P(pr(ri)). Так как q — простое число, оно должно де- лить ог(п) для некоторого простого делителя р числа п. Расширение полей К =FP[£], где £ является нетривиальным r-м корнем из единицы, имеет степень d = ог(р) q. Пусть G — подгруппа в /<х, порожденная С — 1, £ — 2, ..., £ — /. Тогда выполняется неравенство |G|>( { ), (2.2.31)
100 Некоторые приложения элементарной теории чисел [Гл. 2 поскольку элементы (£ - l)d,(C - 2)^2... (^ - l)d' (d{ 0, ^di < d) груп- пы G попарно различны (линейные функции х— 1, ..., х — I являются различными неприводимыми многочленами по модулю р вследствие пред- положения в), и £ не может удовлетворять полиномиальному уравнению степени меньше d). С другой стороны, утверждается, что |G|<n2^, (2.2.32) когда п не является степенью р, и это доказывает утверждение, так как из неравенства (2.2.31) и из того, что d^ q I, следует неравенство Для доказательства неравенства (2.2.32) обозначим через os (s е Z) ав- томорфизм поля /<, при котором £i->£s. Для любого g^K* выполня- ется равенство vp(g) = gp, а для любого g € G выполняется равенство a«(g) = gn вследствие предположения б). Поэтому vs(g) = gs для любо- го числа s вида пр1. Пусть S = {npi: 0 0*}- Если п не является степенью числа р, то эти элементы попарно различны, |S| > г и мы мо- жем найти s s', s € S, для которого s = s' (mod г). Но тогда gs = os(g) = = Os' = gs • Взяв в качестве g образующую циклической группы G, из это- го можно вывести, что |G| |s — s'| < п2^, что и требовалось доказать. Таким образом, алгоритм проверки простоты заключается в следую- щем. Вначале проверяется, что ни один из корней n^k (2 < k < log2 ri) не является целым. Потом последовательно проверяются простые числа Г > 4 log2 п, пока не будет найдено такое, для которого г — 1 имеет простой делитель q 20*logn, удовлетворяющий сравнению n{r~x^q ф 1 (mod г). По предложению 2.3 для наименьшего такого г выполняется оценка г <С log6 п. Теперь проверяются условия б) и в) предложения 2.4; п является простым тогда и только тогда, когда оба они выполняются. Замечание 2.5. Заметим, что наименьшее г, удовлетворяющее усло- вию предложения 2.3, не только удовлетворяет условию г <С log6 п, но также очень близко к минимальному возможному значению Го = [4log2]. Например, занимающая две строки программа для PARI проверяет, что для п = Ю300 + 1 подходит уже число 1908707, являющееся вторым про- стым числом, большим го» и что при п = 10'1 + 1 (/ ^ 300) для достижения результата никогда не надо проверять более чем 10 простых чисел ли- бо рассматривать числа, большие чем го + 186 (общее время вычисление составляет около 2 секунд на стационарном компьютере SUN). Данная версия была предложена Дэном Бернстайном, который слегка улучшил исходный вариант от 6 августа 2002 г.; его вклад заключается в использовании неравенства ( п2^, см. [588], [161] и [589].
§2.2] Детерминированные проверки на простоту 101 2.2.5. Алгоритм М.Аграваля, Н. Каял я и Н. Саксены. (см. [117, с. 4], и [589, с. 4]). Вход: целое п > 1 если (я имеет вид ab, b > 1) выход СОСТАВНОЕ; г := 2; пока (г < п) { если (г простое) { если (г делит л) выход СОСТАВНОЕ; найти наибольший простой делитель q для г — 1; г —1 если 4v/rlog2 м) и (п ч (mod г)) остановка; г := г + 1; для а = 1 до 2y/r log2 п если ((х — а)п = (хп — a) (mod(xf — 1, я))) выход СОСТАВНОЕ; выход ПРОСТОЕ; Теорема 2.6. Данный алгоритм выводит ПРОСТОЕ тогда и только тогда, когда п является простым числом. Замечание 2.7. На практике всегда можно найти число г порядка O((logAi)2), удовлетворяющее условиям алгоритма. Это приводит к оценке на сложность вида O((logfl)6) в наилучшем случае. 2.2.6. Практические и теоретические доказательства простоты. Алгоритм ЕСРР (Elliptic Curve Primality Proving), построенный Ф. Морэном, 1142]. Вопросы практического доказательства простоты чисел с тысячами знаков, а также массового производства больших про- стых чисел подробно обсуждаются в [589]. Ф. Морэн заметил, что даже алгоритм Миллера все-таки достаточ- но длинный, поскольку в нем необходимо считать экспоненты от остат- ков. Величина (log/г)6 из алгоритма AKS подсказывает порядок степени многочленов, с которыми приходится работать. На практике почти все- гда можно найти г = c(log2 я)6, где с ^64. Например, если п = 2512, то в наилучшем случае г = 64(log2 я)6 = 224 > 16 • 106, и это приводит к ра- боте с плотными многочленами, занимающими более 1 гигабайта, что уже очень сложно. Предположим, что мы хотим доказать простоту числа п — 109 + 7 (ко- торое действительно является простым). Используя реализацию алгоритма AKS, предложенную Е.Томе, с процессором GMP 4.1 на персональном компьютере с 700 MHz, положим г = 57287, что приведет к $ = 14340
102 Некоторые приложения элементарной теории чисел [Гл. 2 (см. [589]). Каждое промежуточное вычисление занимает 44 секунды, из- за чего общее время составляет более чем 7 дней. Если использовать непосредственно условие (2.2.29), то можно положить (г, q, s) = (3623, 1811, 1785), и тогда работа займет 1,67 х 1785 секунд, т. е. около 49 минут. Наилучшей тройкой является (г, q, s) = (359, 179, 4326), которая приводит к общему времени, равному 6 минут 9 секунд. Можно сравнить эти алгоритмы с алгоритмом, использующем якобиевы суммы (описание этого алгоритма, очень похожего на описанный в §2.2.1 см. в [249]), а также с другим эффективным алгоритмом, а именно с ЕСРР (Elliptic Curve Primality Proving), построенным Ф. Морэном. Алгоритм ЕСРР действительно очень быстро получает ответ на вопрос простоты (за время O((log/z)4)). В нем используются эллиптические кри- вые Е над Z/azZ и элементарное наблюдение о сравнениях (2.2.28), при- мененное к группам типа E(Z/mZ). Эта программа выводит длинный спи- сок чисел, из которого следует строгое доказательство простоты исходного числа. Общая идея заключается в построении убывающей последователь- ности простых чисел, в которой из простоты следующего числа вытекает простота предыдущего. Алгоритм ЕСРР позволяет даже доказать простоту чисел, занимающих 512 бит, за 1 секунду, занимающих 1024 бит — за 1 минуту, а занимаю- щих 10000 бит — за разумное время (составляющее около одного месяца). В соответствии с [589] кажется, что даже если удастся уменьшить число г в алгоритме AKS, это все равно не предоставит алгоритма, более эффек- тивного на практике, чем ЕСРР 2.2.7. Арифметические прогрессии из простых чисел. Одно важное открытие, сделанное в [383] Б. Ж. Грином и Т. Тао, утверждает, что мно- жество простых чисел содержит арифметические прогрессии произволь- ной длины (см. [783], [379], а также http://primes.utm.edu/top20/, где приведены интересные численные примеры длинных арифметических про- грессий из простых чисел). Гипотеза о том, что существует сколь угодно длинная арифметическая прогрессия из простых чисел, всегда была широко известным классиче- ским фольклором. В истории теории чисел [314], написанной Диксоном, говорится, что около 1770 г. Лагранж и Варинг оценили, насколько боль- шой может быть разность арифметической прогрессии из L простых чисел. В [383] было доказано, что существуют арифметические прогрессии любой длины. Доказательство состоит из трех основных частей. Первая из них — теорема Шемереде, утверждающая, что любое подмножество множества целых чисел, имеющее положительную плотность, содержит арифметические прогрессии произвольной длины. Вторая — некий принцип переноса. Он позволяет вывести из теоремы Шемереде, что любое под- множество достаточно псевдослучайного множества положительной отно-
§ 2.3] Разложение больших чисел на множители 103 сительной плотности содержит прогрессии произвольной длины. Третьей составляющей является недавний результат Голдстона и Йильдирима, см. [373]. Используя его, можно поместить простые числа внутрь псевдослу- чайного множества, состоящего из «почти простых» чисел и имеющего положительную относительную плотность. В 1993 г. Морэн, Притчар и Тиссен (см. [590]) показали, что 11410337850553 + 46090986942006 является простым числом для k = 0, 1, ..., 21. В 2003 г. Маркус Фринд нашел пример арифметической прогрессии той же длины, состоящей из больших чисел: 376859931192959 + 185492797690206, 6 = 0, 1, ..., 21. Основная теорема из [383] доказывает обсуждаемую выше гипотезу. Теорема 2.8 (теорема 1.1 из |383|). Множество простых чисел содержит арифметические прогрессии длины 6 для всех 6. Также был установлен несколько более сильный результат. Теорема 2.9 (теорема 1.2 из [383]). Пусть А — произвольное под- множество в множестве простых чисел положительной относи- тельной верхней плотности, т. е, limsupTt(W)-1 |Д Г) [1, А/]| > 0, /V—>оо где тс(Л7) обозначает количество простых чисел, меныиих или рав- ных N. Тогда А содержит арифметические прогрессии длины 6 для всех k. § 2.3. Разложение больших чисел на множители 2.3.1. Сравнение сложности тестов на простоту и разложения чи- сел на множители. Пусть п > 1 —целое число. Задача нахождения таких чисел a, b > 1, что n = ab, может быть разделена на два шага: сначала надо установить их существование (это решается любым тестом на про- стоту), а потом явно их найти (т. е. совершить разложение). На практике, тест на простоту, описанный в п. 2.2.1, не дает конкретных делителей чис- ла п. Действительно, если число п не проходит этот тест, то это значит, что оно не удовлетворяет одному из необходимых условий из п. 2.2.3 (б), так что алгоритм останавливается, до того как мы доходим до этапа вычисле- ния возможных делителей. Следовательно, такой алгоритм раскладывает на множители лишь простые числа и те числа п, у которых есть маленькие делители, а именно делители чисел s и t, определяемых в п. 2.2.1.
104 Некоторые приложения элементарной теории чисел [Гл. 2 Как было упомянуто в §2.1, эффективный алгоритм разложения на множители можно использовать для взламывания стандартных криптоси- стем с открытым ключом. По этой причине разложение чисел стало при- кладной задачей, привлекающей немало усилий и средств (см. [633], [759], [469]). Тем не менее, время работы наилучшего известного алгоритма раз- ложения уже не позволяет разложить число м, являющееся произведением двух 150-значных простых чисел. Теоретическая оценка (см. [250]) на вре- мя работы имеет порядок ехр | Уу logn-« (2.3.1) и для 300-значного числа п это потребует биллионы лет. Это заставило Одлыцко спросить, показывает ли оценка (2.3.1) реальный уровень слож- ности проблемы разложения чисел или просто мы не замечаем чего-то существенного, см. [633]. В любом случае, прогресс в разложении некоторых конкретных боль- ших целых чисел (см. [848], [815]) в основном происходит благодаря но- вым техническим возможностям или параллельным вычислительным схе- мам, а не открытию идейно новых алгоритмов. Последние достижения см. в [544]. 2.3.2. Разложение чисел и квадратичные формы. Если п = х2 - у2, то в большинстве случаев х — у является нетривиальным делителем числа п. Это простое замечание приводит к «алгоритму разложения Ферма», который в общем случае требует О(пУ2) операций, но более эффективен, если п является произведением двух мало отличающихся чисел t и s. Тогда п = х2 - у2, где х = (/ + s)/2, у = (t — s)/2. Данный алгоритм заключается в вычислении х2 — п для всех значений х, начиная от [у/п] + 1, пока не будет найден совершенный квадрат. Подобные рассуждения могут быть полезны и в других задачах (см. [204]). Также этот прием можно обобщить, используя другие квадратичные формы в алгоритмах разложения чисел ([469], [675]). Рассмотрим мнимое квадратичное поле Q(\/—м). Пусть число п сво- бодно от квадратов. Обозначим через С/(А) группу классов идеалов это- го поля (см. п. 1.2.8, п. 4.2.2). Элементы этой группы можно отождествить с классами Z-эквивалентности примитивных положительно определенных квадратичных форм вида Дх, у) = ах2 -I- Ьху + су2 с отрицательным дис- криминантом А = Ь2 — 4ас, где А = — п, если п = 3 (mod 4), и А = —4м, если п = 1 (mod 4) (здесь предполагается, что п нечетно). Обозначим через а = (а, Ь, с) такую форму. Будем называть форму а амбиговой, если она принадлежит одному из типов (а, 0, с), (а, а, с) или (а, Ь, а) (см. [358], [739]). Дискриминант амбиговой формы обладает явным разложением:
§2.3] Разложение больших чисел на множители 105 —Д = 4ас (соответственно а(4с - а), (2а - Ь)(2а + Ь)) при а = (а, 0, с) (соответственно (а, а, с), (а, Ь, а)). Можно легко увидеть, что выполня- ется и обратное утверждение (см. [14]): разложение такого типа числа Д определяет амбигову форму. С другой стороны, существуют независимые методы построения амбиговых форм, которые основаны на следующем свойстве: неопределенные формы представляют элементы второго порядка в группе классов С/(Д). В 1971 г. Д.Шэнкс придумал довольно быстрый алгоритм, позволяющий разложить п за О(п{^) операций и определить структуру группы С/(Д). Этот метод использует аналитическую формулу, открытую Дирихле: Ц1,Ха) = ^= WA) = |С/(Д)|). Здесь Хд(т) = (“У a L(l, /д) является значением в точке s = 1 для Л-функции Дирихле сю х)=52 x(m)m~s=Па - x(p)p-s)-1- т=\ р Приближенная формула верна с относительной ошибкой меньше 0,1% при 132000. Элемен- ты группы классов строятся при помощи таких малых простых чисел р, что ) = 1. Они представлены формами Fp = (р, Вр, Ср), коэффициен- ты которых удовлетворяют соотношению Д = В2 — 4рСр и которые мо- гут быть найдены из условия Д = В2 (mod р). Зная число классов /г(Д) = = |С/(Д)|, удается построить элементы второго порядка, начиная с эле- мента х = Fp, вычисляя его наибольшую нечетную степень, делящую /г(Д), а потом последовательно возводя в квадрат, пока на получится 1. 2.3.3. Вероятностный алгоритм CLASNO (см. ([644], [733]). Идея использования группы С/(Д) в алгоритмах разложения чисел может быть существенно развита. Данный алгоритм не требует вычисления /г(Д), и его время работы оценивается величиной L = exp{^logAi • log log /г}, которая растет медленнее, чем любая положительная степень числа п. Предпо- ложим для начала, что простые делители числа /г(Д) малы, или, скорее, что /г(Д) делит k\ для некоторого малого k. Возьмем случайный элемент х е С1(А), скажем х = Fp при некотором р, для которого (Д/р) = 1, и вы-
106 Некоторые приложения элементарной теории чисел [Гл. 2 числим = хнечетная степень 4^a k\. тогда Среди последовательных квадра- тов, начиная с В&, должен найтись элемент порядка 2. Нам необходимо знать точное значение k\ можно лишь надеяться, что некоторое малое k подойдет. Если нам удастся найти его, то мы разложим Д за O(k) операций. В противном случае можно попробовать применить тот же самый прием для поля Q(y/—ап), где а является некоторым малым числом, свободным от квадратов. Для того чтобы обосновать эту процедуру в общем случае, можно пред- положить, что для переменной а число классов /г(Да) поля Q(\/—an) ведет себя как случайное число, меняющееся в некоторой окрестности числа п^2 (эта оценка следует из формулы Дирихле). Потом можно оценить вероят- ность того, что /г(Да) составлено лишь из малых простых чисел. Для этого обозначим через Ф(х, у) количество натуральных чисел, не превосходя- щих х и не делящихся ни на одно из простых чисел, не меньших чем у (их можно назвать «//-гладкими»). Положим k = La, а > 0. Вероятность того, что случайное число порядка я1/2 будет //-гладким, равна Ф(м1//2, /Д/я1/2. Теперь надо изучить поведение функции Ф(х, у)/у. Дикман (см. [420]) показал, что оно существенным образом зависит от значения log х/log//. А именно, для любого и > 0 существует предел lim^-^oo Ф(//“, у)/у. Этот предел называется функцией Дикмана р(и) и однозначно определяется сле- дующими свойствами: р(и) = 1 при 0 < и 1, р,(и) = -р(ц~-1-) прим>1. В точке и= 1 функция р(и) непрерывна. При и-*оо имеем р(и) = и(-1+о(1)Д Де Брейн ([208]) доказал, что W, у) = у“?(и) (1 + Ое (1о^ 1))), где у 2, 1 < и < (log //)3/5-е для некоторого положительного е. Тем не менее, в нашем случае L* растет медленнее, чем любая поло- жительная степень числа я, так что теорема Дикмана неприменима. Необ- ходимая оценка была получена лишь недавно: ^(n^2,La) = n^/L^4^\ См. детали в [420]. Возвращаясь к изначальному алгоритму разложения чисел на множи- тели, мы видим, что при заданном k = [La] его время работы ограничено величиной La, а вероятность успеха составляет около Л-1/4а. Следова- тельно, общее число попыток должно быть около Л1/401, а общее время работы ограничено выражением £/*-ь(1/4«)4-е, е > о. Эта оценка минимальна
§2.3] Разложение больших чисел на множители 107 при а = 1/2 (т. е. k = Л1/2), и тогда результат составляет Разумеется, теоретически процесс может никогда не закончиться при очень плохих п, но это маловероятно. Приведем пример оценки —— ~и и, когда и существенно меньше, чем у (ее простое доказательство см. в [466, с. 137]). Пусть у & 106 (так что тс(//) « 7 • 104, a log у «14) и х « 1048. Тогда отношение натуральных чисел, не превосходящих х и являющихся произведением простых чисел, не превосходящих у, составляет около 1/224. 2.3.4. Метод цепных дробей (CFRAC) и вещественные квадра- тичные поля (см. [469], [848], [675], [845]). Улучшая метод Ферма, по- пытаемся найти такие решения х, у сравнения х2 = у2 (mod/г), что х не сравнимо с ±у (mod я). Тогда либо НОД(х 4- у, п), либо НОД(х - у, п) является нетривиальным делителем числа я, так как п делит (х 4- у)(х — у), но не делит ни х 4- у, ни х - у. Будем искать х среди произведений та- ких чисел X/, что наименьший по абсолютной величине остаток х2 (mod я) является произведением малых простых чисел. Пусть у также является произведением этих простых чисел. Более точно, рассмотрим множество В = {р\, р2, ..., ph}, все элементы которого являются простыми числами, кроме, возможно, числа р\, которое может быть равно -1. Будем назы- вать такое множество базисом разложения для п. Также будем называть В-числом каждое такое целое число Ь, что наименьший по абсолютной ве- личине остаток b2 (mod я) является произведением (степеней) элементов из В. Пусть xz является семейством В-чисел, a az = П/=1 Р^' —соответ- ствующие минимальные остатки чисел х2 (mod я). Положим ez = (е/i, е/2, • • •, e/л) е Fg, где ez/ = az/ (mod 2). Предположим, что сумма векторов ez равна нулю (mod 2). Пусть х = Пх/ (mod л), h </ = ГИ'’ /=1 где i Тогда х2 = у2 (mod п). Пример 2.10. ([466, с. 133]). Пусть п = 4633, В = {—1, 2, 3}. Тогда X! = 67, Х2 = 68, хз = 69 являются В-числами, поскольку 672 = -144 (mod 4633), 682 = -9 (mod 4633), 692 = 128 (mod 4633). Более того, е। = (1, 0, 0), €2 = (L 0, 0), ез = (0, 1,0), так что можно поло- жить х = Х1Х2 = 67,68 = —77 (mod 4633), с — 2Y23Y3 = 2332 = 36. Помимо
108 Некоторые приложения элементарной теории чисел [Гл. 2 этого, —77 не сравнимо с ±36 (mod 4633). Итак, мы получаем нетриви- альный делитель 41 = НОД(-77 + 36, 4633) числа п = 4633. Разумеется, если нам не повезет, то может случиться, что х = = ±у (mod я). Тогда надо выбрать новые элементы X/ или даже новый ба- зис В. Эффективный метод поиска В-чисел использует цепные дроби ве- щественных квадратичных иррациональностей. Пусть х > 1 —веществен- ное число, х = [ао» #1, • ••] —его разложение в цепную дробь. Положим Ai/Bi = [ао, ai, ..., aj. Эти подходящие дроби могут быть вычислены из рекуррентных соотношений А_% — В-\ — 1» ^-1 = ^-2 = 0 и Л/ = а/Л,-1 + + Л/_2, Bi = atBi-\ ± Bi_2. Из равенства Aj _ Л/4-1 _ z . у-4-1 1 Bi В^ 1 j BiBi+{ следует, что |Л2 -х2В2|<2х, (2.3.2) поскольку -х| • |у+х| <5,2д-Г-(2х + В частности, можно найти разложение в цепную дробь для х = у/п при помощи алгоритма, описанного в § 1.4, и а, образуют периодическую по- следовательность. Так как Л2 = Л2 - пВ? (mod а), неравенство (2.3.2) по- казывает, что абсолютное значение наименьшего остатка Л2 (mod а) огра- ничено величиной 2 у/п, которая может помочь при поиске В-чисел. Одна- ко числа Л/ быстро становятся большими даже по отношению к а, и для упрощения вычислений Л2 (mod п) используется сравнение Л2_! = (-1)‘ф (modn), (2.3.3) где Qi является знаменателем числа х, = (у/п + Pi)/Qi для Л2 (mod /г), т. е. у/п = [ао, аь аг, ..., az, xj. На самом деле, формально применяя рекуррентные соотношения к у/п, мы получаем /- _ х __ Aj-\Xj + Aj-2 __ Aj[y/n + PjAj-i QjAj-2 Bi-\xt + Bi-2 Bi-iy/n + PiBi_} ± Q/B/-2 Сравнивая коэффициенты при 1 и у/п, получаем QiAi-2 + В/Л/-1 = aBz-i, QiBi-2 + PiBi_\ — Л/-1.
§ 2.3] Разложение больших чисел на множители 109 Разрешая эту систему относительно Qi, мы видим, что (Д_2В/-1 - =пВ?_| - Л?_]. Но коэффициент при Qi равен (-1/-1. Это доказывает сравнение (2.3.3). Напомним также, что Л, Qi могут быть вычислены при помощи одного очень эффективного метода, который мы сформулируем в несколько изме- ненном виде. Пусть %о = (Л) + \/n)/Qo— квадратичная иррациональность, для которой Qo делит п — Р%. Положим X/ = (Р/ + y/n)/Qi. Тогда Pi+i= щ Qi - Pi, щ = [Pi + y/n/Qi ], (2.3.4) Qz + l — Qi-\ 4“ (Pi ~ + (2.3.5) Это следует непосредственно из равенства X/+i = l/(xz- — az), или Pj 4- у/п _ Q/+1 Qi Pi^+Vf Если данный метод не обеспечивает требуемое количество В-чисел, то можно повторить вычисления для ап вместо п, где а — малое число, сво- бодное от квадратов. Число требуемых операций оценивается выражением La/8/2 = ехр|У| log /г log log (ср. с п. 2.3.3). Практическая эффективность этого алгоритма была про- демонстрирована его применением к числу Ферма Fq = 2128 — 1 (см. [597], [845]). Опишем теперь построенный Шэнксом элегантный алгоритм SQUFOF, который также основан на арифметике вещественных квадратичных полей (см. [675], [845]). Он состоит из двух этапов. 1. В формулах положим (2.3.4), (2.3.5) хо = у/п, т. е. Ро = О, Qo= 1- Будем вычислять хт, пока не дойдем до такого нечетного числа т, что Qm_\ — t2 для некоторого натурального числа t. Из сравнения (2.3.3) следует, что A2rn_2 = t2 (mod я). Предположительно, при помощи алго- ритма Евклида исходя из этого можно найти делитель числа п, равный НОД(Лт_2 ± / , п). Тем не менее, на практике Лт-2 обычно бывает слиш- ком большим, для того чтобы его можно было вычислить непосредственно, так что в этом случае наша тактика должна быть изменена. 2. Положим Ро = Qo = Л Хо = (^о 4- \fn)/Q^ и будем вычислять «хвосты» разложения в цепную дробь для хЬ, а именно X/ = (Pi + \/n)/Qi. Будем повторять это до тех пор, пока не найдется такое xqi что Pq = Pq+\. Из формулы (2.3.4) и (2.3.5) будет следовать, что aqQq = 2Pq, Qq делит п - P2q.
110 Некоторые приложения элементарной теории чисел [Гл. 2 Следовательно, либо Qq, либо Qq/2 делит п. Если этот делитель тривиаль- ный, то надо заменить п на ап для малого а и повторить все вычисления за- ново. Используя обычный калькулятор для разложения числа, не превос- ходящего 109, удобно записывать промежуточные результаты в виде таб- лицы. Таблица 2.1 изображает ход вычислений для м = 11111 = 41 -271. В общем случае q составляет около мг/2 (в нашем примере мг = 7, р = 4). Данный алгоритм основан на том факте, что порядок дробного идеала (1, %о) в группе С1 (4м) равен двум, и на втором этапе неявным образом вы- числяется соответствующая амбигова форма. Число операций оценивается величиной я1/4. Поскольку Таблица 2.1 0 1 2 3 4 5 6 7 105 2 2 4 5 2 7 0 105 67 87 97 88 94 81 1 86 77 46 37 91 25 = 52 37 3 1 1 3 81 104 73 25 82 82 5 59 98 107 41 107 ~ _ 82 + х/ТТТТТ _ х/ТТТТТ 41 ~Л+ 41 ’ идеал (1,%4) соответствует неявной форме (41,0,-11111/41), или (41, 0, —271), дискриминант которой равен 4м. 2.3.5. Использование эллиптических кривых. Общая идея исполь- зования вычислений в конечных группах (например, в группе классов) для разложения числа м нашла самые неожиданные реализации при помощи различных типов групп. 1. (р — 1)-мепгод Полларда. Предположим, что у числа м имеется та- кой простой делитель р, что порядок группы (Z/pZ)x «гладкий», т. е. р — 1 делит k\ для не очень больших k, скажем, k < 100000. Тогда можно посту- пить следующим образом: последовательно вычислить = 2z! — 1 (тобм), используя рекурсивное соотношение = (az + l)z+1 - 1 (modM) и най- ти наибольший общий делитель НОД(м^, м); он будет делится на р ввиду малой теоремы Ферма. Это условие не выполняется, если не существует числа р | м, для которого р — 1 гладкое (см. [639]). В качестве подходя- щей замены можно попробовать использовать мультипликативную группу полей Fpr порядка рг — 1. Так, при г = 2 получаем (р -h 1)-алгоритм Вил- льямса (см. [844]). 2. Гораздо более широкие перспективы использования различных ко- нечных групп для алгоритмов разложения чисел открывают эллиптиче- ские кривые над конечными полями. Их использование приводит к од-
§ 2.3] Разложение больших чисел на множители 111 ному из наиболее быстрых известных алгоритмов разложения чисел, тре- бующему O(L1+s) операций, см. [526]. Выберем случайную эллиптическую кривую Г и точку Р на ней. Для этого выберем случайные целые числа а, xq, Уо и положим b = у$ — 4х$ — ах0, Р = (х0, у0). Тогда Р = (xq, Уо) —точка на кривой, определяемой уравнением Г: у2 = 4х3 4- ах 4- b (см. п. 1.3.3). Это эллиптическая кривая над®, если кубический многочлен в правой части не имеет кратных корней. Также можно предположить, что дискриминант этого многочлена взаимно прост с п\ иначе либо мы получаем нетривиальный делитель числа л, либо следует изменить кривую. На проективной плоскости кривая Г определяется однородным урав- нением y2Z = 4Х3 = aXZ2 + Z3 (X = xZ, У = yZ). Взяв его по модулю простого числа р, получаем эллиптическую кривую над = Z/pZ. Ее нулем является точка Ог = (0 : 1 :0), а порядок груп- пы T(Fp) равен р + 1 — ар, причем выполняется неравенство \ар \ < 2у/~р (теорема Хассе, см. п. 1.3.3). Теперь, предположив, что (р + 1 — ар) | k\ для некоторого р\п и ма- лого k, вычислим последовательно координаты точек Pi = i\P (mod п) на проективной плоскости над Z. Простое число р должно делить Z-коор- динаты точки Pk, а также НОД(/г, Z&). Если нам повезло, то O(k) опе- раций приведут к нетривиальному делителю числа п. Иначе следует взять новую кривую, не тратя много времени на безуспешный выбор («страте- гия ранних прерываний»). Для того чтобы оптимизировать выбор числа k при каждой пробуемой кривой, а также число попыток, возьмем р — п^. Вероятность успеха при k = [£/] составляет около ^(^А ^”) ~ г -р/2а+о(1) (см. п. 3.3). Следовательно, мы рассмотрим Z?/2a случайных эллиптиче- ских кривых с отмеченными точками, в то время как для каждой из них число операций может быть оценено величиной La. Общее число опера- ций Ла+3/2а минимально при а = уф/2. В наихудшем случае a = 0 = 1/2, получаем е > 0. Отметим, что наши оценки основаны на следующей эвристической ги- потезе: порядки групп r(Fp) ведут себя по отношению к свойству гладко- сти как случайные числа, взятые в интервале (р — 2у/р 4- 1, р + 2у/р 4- 1). Вера в эту гипотезу усиливается изучением классов изоморфных эллипти- ческих кривых по модулю простых чисел, см. [526].
112 Некоторые приложения элементарной теории чисел [Гл. 2 Также следует заметить, что были построены еще некоторые крипто- системы, использующие эллиптические кривые, см. [466]. Существует построенный Диксоном вероятностный алгоритм (см. [317]), грубая оценка времени работы которого составляет около O(LV^), а также несколько вероятностных алгоритмов, использующих линейные или квадратичные решёта, с ожидаемым временем работы О(ЛЛ) и O(L) соответственно, см. [643], [815]. Много других интересных алгоритмов и компьютерных программ можно найти в книге Ризеля [675]. Также там можно найти некоторые эвристи- ческие аргументы в пользу существования алгоритмов, которые должны были бы быть намного более быстрыми, чем любой из ныне существую- щих. Более поздняя информация о разложении больших целых чисел и но- вые рекорды могут быть найдены в [250] и на Web-странице Ф. Морэна.
ЧАСТЬ II ИДЕИ И ТЕОРИИ
ГЛАВА 3 ИНДУКЦИЯ и РЕКУРСИЯ §3.1. Элементарная теория чисел с точки зрения логики 3.1.1. Элементарная теория чисел. Почти весь материал, изложен- ный в первой части, относится к элементарной теории чисел (ЭТЧ). Объем этого понятия можно определить строго, прибегнув к средствам матема- тической логики, однако для это нужно ввести нормальный язык ариф- метики и фиксировать принятую систему аксиом (ту или иную версию аксиом Пеано). Чтобы не входить в неуместные подробности, мы ограни- чимся интуитивными указаниями. В ЭТЧ есть исходные понятия и аксио- мы, формализующие интуицию о натуральных (или целых) числах, а также методы конструкции новых понятий и методы доказательств. Основное средство конструкции — рекурсия. В простейшем случае предположим, что мы хотим определить какое-то свойство Р(п) натурального числа п. Делая это методом рекурсии, мы объясняем, как узнать, истинно или ложно свойство Р(п + 1), если мы уже знаем истинность или ложность свойств Р(1), ..., Р(п). Скажем, свойство «п,— простое число» можно определить так: «1 не простое; 2 не простое; п -h 1 ^3 — простое чис- ло, если никакое из простых чисел среди 1, 2, ..., п не делит я+ 1». Аналогично основное средство доказательства в ЭТЧ — индукция. Что- бы доказать методом индукции утверждение «V п Р(п) истинно», мы до- казываем, скажем, свойство Р(1) и импликацию «V п из Р(п) следует Р(п+ 1)». Еще в первых исследованиях аксиоматики теории чисел (Пеано, Френе) было установлено, что все эмпирические относимые к ЭТЧ понятия (дели- мость, простое число), функции (число делителей, функция Эйлера <р(я), тс(х)) и теоремы (малая теорема Ферма, квадратичный закон взаимности и др.) могут быть соответственно построены рекурсией или доказаны по индукции [682], [70]. Иногда случается, что результат допускает элементарную формулиров- ку, но его элементарное доказательство неизвестно. Например, асимпто- х тический закон распределения простых чисел к(х) ~ при желании можно сформулировать элементарно, считая, что х пробегает лишь нату-
116 Индукция и рекурсия [Гл. 3 ральные значения, и заменив logx, скажем, на VOi его элементарное доказательство было получено лишь в конце сороковых годов Сельбергом, тогда как аналитическое доказательство было известно к тому времени уже полвека. 3.1.2. Логика. Логическое исследование ЭТЧ привело к новым кон- кретным теоретико-числовым результатам, о которых будет рассказано ниже, но, возможно, еще важнее было то обстоятельство, что стало го- раздо яснее место ЭТЧ внутри математики вообще. Мы подчеркнем три аспекта. 1. ЭТЧ как математическая дисциплина принципиально не может быть «самодостаточной». Как бы ни выбрать ее систему аксиом, всегда будут существовать элементарно формулируемые и истинные, но элементарно не доказуемые арифметические утверждения (см. [369]). Поэтому исторически сложившаяся практика пользоваться для уста- новления теоретико-числовых фактов анализом (Эйлер, Якоби, Дирихле, Риман, Харди и Литлвуд и др.), геометрией (Минковский, Эрмит и др.), алгебраической геометрией (А. Вейль, Гротендик, Делинь и др.) и, вообще, любыми средствами имеет глубокие основания. 2. ЭТЧ с помощью формальной логики может служить для модели- рования любой аксиоматизированной математической дисциплины внутри элементарной теории чисел (Гёдель). При таком моделировании мы забываем о содержательном смысле определений и теорем нашей теории и оставляем информацию лишь об их формальной структуре и о синтаксических правилах вывода одних утвер- ждений из других. Перенумеровав методом Гёделя все синтаксически правильные утвер- ждения натуральными числами, мы затем можем написать программу, или алгоритм, перечисления всех доказуемых результатов нашей теории (ее теорем). Моделью теории, таким образом, становится определенная с по- мощью (многократной) рекурсии функция /: Z+ —>Z+ (первое Z+— это номер порождаемой теоремы, второе — номер утверждения теории). Вме- сто того чтобы спросить, доказуема ли теорема номер п, мы можем спро- сить, разрешимо ли уравнение Дх) = п. Хотя уравнение Дх) = п определяется в терминах ЭТЧ, оно, вообще го- воря, далеко не диофантово, ибо функция f не является многочленом. Как показано в замечательном ряде работ, завершенном Ю. В. Матиясевичем (см. [554]), можно тем не менее заменить получившуюся задачу на эк- вивалентную диофантову (десятую проблему Гильберта), а именно най- ти такой многочлен с целыми коэффициентами РДхь ..., хш; я), что раз- решимость уравнения — n эквивалентна разрешимости уравнения РДх; п) = 0, хе (Z+)"2. Отыскание Pf по f при этом вполне эффектив- но (так же как отыскание f по системе аксиом исходной теории).
§ 3.2] Диофантовы множества 117 В этом смысле проблема доказуемости любого математического ре- зультата эквивалентна теоретико-числовой задаче стандартного вида. (Чи- татель, привыкший думать не о «доказуемости», а об «истинности», дол- жен в этом месте сознательно проявить некоторую разумную осторож- ность. После теоремы Гёделя—Коэна о независимости, скажем, контину- ум-гипотезы от стандартных аксиом теории множеств ему должно быть ясно, что «истинность», в отличие от «доказуемости», есть скорее фило- софское понятие, и мы не можем ожидать его точного сведения к матема- тическому определению.) 3. ЭТЧ доставляет рамки для точной формулировки и исследования понятий алгоритма и (полу)вычислимой функции, причем эти понятия, воплощенные в теории рекурсивных функций, являются много более уни- версальными, чем это можно было бы ожидать a priori (тезис Чёрча см. [70], [682], [88]). Теория рекурсивных функций имеет как общематематическое, так и прикладное значение. Ее методами доказывается и теорема Матиясеви- ча, сформулированная выше. В следующем параграфе мы сформулируем некоторые основные ре- зультаты теории рекурсивных функций, которые представляют непосредст- венный теоретико-числовой интерес. После этого будут приведены точные определения и некоторые сведения о доказательствах. § 3.2. Диофантовы множества 3.2.1. Перечислимость и диофантовы множества. Определение 3.1. Подмножество Е С (Z+)m, т 1, называется дио- фантовым, если существует такой многочлен с целыми (или, что то же самое, с натуральными) коэффициентами Р(/1, ..., tm\ Xi, ..., хл), что (6, ..., tm)eE <=> 3 (хь ...,xn)e(Z+)n, P(t, х) = 0. Всякое диофантово множество Е перечислимо в следующем нефор- мальном смысле слова: имеется детерминированный алгоритм, который по мере работы в каком-то порядке выписывает все члены этого множества (формальное определение дано в следующем параграфе). Действительно, будем перебирать систематически все элементы множества (Z+)'”-M, под- ставлять их в Р и, если получится нуль, выписывать первые т координат. Мы получим растущий список элементов множества Е, в пределе исчер- пывающий Е.
118 Индукция и рекурсия [Гл. 3 | f 3.2.2. Диофантовость перечислимых множеств. Теорема 3.2. Наоборот, любое перечислимое множество Е дио- фантово. Определяющий его многочлен Р может быть эффективно построен по описанию алгоритма, порождающего Е. Поскольку a priori кажется, что перечислимых множеств гораздо боль- ше, чем диофантовых, ясно, что в доказательстве придется устанавливать диофантовость некоторых неожиданных множеств. Дж. Робинсон обна- ружила, что эта задача облегчается, если постулировать диофантовость множества {(а, Ь, с)\а = Ьс}, а Ю. В. Матиясевич [75] обосновал этот по- следний шаг. Ниже мы продемонстрируем несколько красивых примеров, используемых при этой конструкции, которые являются чисто теорети- ко-числовыми, но сначала сформулируем следующее общее свойство. 3.2.3. Свойства диофантовых множеств. Предложение 3.3. Класс диофантовых множеств содержит мно- жества уровня многочленов с целыми коэффициентами и замкнут относительно операций конечного прямого произведения, конечно- го пересечения и проекции. Это следует прямо из определения. Достаточно заметить, что если мно- жества Е, F С (Z+)m отвечают полиномам Р, Q соответственно, то Е П/7 отвечает Р2 + Q2, EUF отвечает PQ, а Е х F отвечает Р2 + Q2, где Q получается из Q переименованием первых т переменных. Приведем теперь ключевую арифметическую лемму о диофантовости множества, связанного с решениями уравнения Пелля (важно, что одна из координат растет как экспонента другой). Пусть х2 — dy2 — 1 — уравнение Пелля (d е Z+ — целое число, не яв- ляющееся полным квадратом). Его решения (х, у) е (Z+)2 образует цикли- ческую полугруппу относительно закона композиции: если (xi, у\) — реше- ние с наименьшей первой координатой, тогда любое другое решение имеет вид (х„, уп); где п € Z+ и хп + y„Vd = (Xi +z/iVd)n. Число п назовем номером решения (ср. с п. 1.2.5). Координаты хп, уп растут экспоненциально с ростом п, так что множе- ство решений уравнения Пелля, а также его проекции на оси хну являются диофантовыми множествами логарифмической плотности. Это еще не то, что нужно: основная трудность состоит в том, чтобы включить номер реше- ния п в число координат диофантова множества — только тогда мы полу- чим возможность применить дальнейшие соображения. Это и делается ниже. Удобно использовать d = а2 - 1, а е Z+, когда (х\, у\) = (а, 1). Урав- нение х2 — (а2 — I)//2 = 1 назовем a-уравнением. Определим две последо- вательности хп(а), уп(а) как координаты его л-решения: хя(а) + yn(a)Va2 - 1 = (а + Va2 - 1)". &
§3.2] Диофантовы множества 119 Формальное определение хп(а) и уп(ц) как многочленов от а легко дать ин- дукцией по п. Тогда Хл(а), уп(а) будут иметь смысл для всех п € Z и а € С. В частности, хл(1) = 1, уп(\) = п; при этом все выводимые ниже формулы останутся справедливыми. 3.2.4. Диофантовость и уравнение Пелля. Предложение 3.4. Множество Е: у = yn{d), а > 1, в (у, п, (^-про- странстве является диофантовым. Идея диофантова восстановления п по (//, а) состоит в замечании, что в силу сравнения уп(а) = п (mod (а - 1)) пара (у, а) однозначно определяет п, если только п < а — 1. Чтобы перей- ти к общему случаю, введем вспомогательное Л-уравнение с большим А и его я-е решение, которое определяется так, чтобы использовать п лишь в диофантовом контексте. Кроме основных переменных у, п, а, вводятся шесть вспомогательных: х; х', £/'; A; Xj, yi. Положим далее Е1: у л, а > 1; Е3: у' = 0 (mod 2x2z/2); Е5: А = а + х/2(х/2 - а); Ет. у \ - у = 0 (modx'2); £2: х2 - (а2 - I)//2 = 1; Ец \ х'2 — (а2 - Ijy12 = 1; £6: х2 - (А2 - l)i/? = 1; Е6: у\ =п (mod2y). При этом все множества £ диофантовы и рг£' = £, где £' = f)?_|£,. Для проверки этого факта используются следующие свойства: yk(a) = k (mod (а - 1)); (3.2.1) если a = b (mode), то yn(a)==yn(b) (mode); (3.2.2) если yi(a) = у,(а)хп(а), а > 1, то i = / или i = —{ (mod 2n); (3.2.3) если у,(а)2 \у,(а), то у, (а) | /. (3.2.4) Свойства (3.2.1)—(3.2.4) выводятся из равенства Хп±т(а) = хп(а)хт(а) ± (а2 - \)уп(а)ут(а). хп±т(а) = ±хп(а)ут(а) + хт(а)уп(а). 3.2.5. График экспоненты диофантов. Докажем, что множество Е: у = ап в (у, а, ^-пространстве диофантово. Достаточно проверить диофантовость множества Ео = Е П{а: а> 1}. При а > 1 индукцией по п в обозначениях (3.2.4) легко получается нера- венство (2а - 1)" <yn+i(a) (2а)п.
120 Индукция и рекурсия [Гл. 3 Отсюда выводится, что ап = [i/n+i (Na)/yn+\(Л/)] при достаточно большом N. Точнее, Eq есть проекция множества Е\: а>1; 0<yn+i(N)y - yn+i(Na) <yn+i(у); N>4n(y + Q; и диофантовость множества Е\ получается тогда с помощью введения три- виальных вспомогательных соотношений у1 = уп+\{К) и у = yn+\(Nd). 3.2.6. Диофантовость и биномиальные коэффициенты. Предложение 3.5. Множество Е: г — n^k, в (г, k, ^-про- странстве диофантово. 3.2.7. Биномиальные коэффициенты как остатки. Лемма 3.6. Если и > nk, то биномиальный коэффициент ра- вен остатку от деления [(« + l)n/uk] на и. Доказательство вытекает из формулы бинома п k-\ (u+\y/uk= £ + /=/?+! z=0 поскольку первая сумма делится на и, а последняя меньше единицы при и > nk. Доказательство предложения 3.5 проводится по той же схеме, в кото- рой вспомогательные переменные — это и, v, а соотношения таковы: Е1: и > nk\ Е2: v — [(« + l)n/uk]; Eq: r = v(modu); Е$: г <v\ Eq: n^k. 5 Из леммы непосредственно следует, что Е = рг (J Ez. Диофантовость Е\ /=1 следует из диофантовости экспоненты; диофантовость Е3, Е4 и Eq очевидна. Диофантовость множества Е2 становится очевидной, если представить Е2 в виде (и + 1)" ukv < (и + 1)" + uk и снова воспользоваться диофантовостью экспоненты. 3.2.8. Диофантовость факториала. Предложение 3.7. 1. Множество Е: m = k\ диофантово. 2. Множество . в пространстве (х, у, р, q, k) диофантово. Доказательство является некоторым усложнением рассуждений из п. 2.2.6, 2.2.7, причем используется следующая лемма.
§3.2) Диофантовы множества 121 3.2.9. Факториал и алгоритм Евклида. Лемма 3.8. 1. Если k>0 и п> (2k)M, то 2. Пусть а>0 — такое целое число, что а = 0 (mod (qkk\)) и а> >2p~[pk+i. Тогда = a-I[a2*+I(l +а-2)р/‘7] + a~2)p/q]. Доказательство леммы следует из несложных элементарных выкладок, а предложение 3.7 доказывается по той же схеме. 3.2.10. Дополнительные результаты. Установленные выше диофан- товы представления непосредственно используются в доказательство об- щей теоремы Матиясевича. С другой стороны, их же можно использовать при рассмотрении промежуточных экспоненциально-диофантовых пред- ставлений интересных конкретных множеств. В качестве примера рассмот- рим простые числа. По теореме Вильсона число р простое о (р — 1)! + 1 делится на р. Поэтому множество простых чисел является проекцией мно- жества решений системы уравнений [ р = f +1. [ ар - bq = 1, которое диофантово в силу диофантовости множества, задаваемого равен- ством q = /!. Любое диофантово подмножество Е с Z+ совпадает с множеством всех натуральных значений некоторого многочлена с целыми коэффициентами (на подходящем октанте (Z+)/v). Действительно, если Е — проекция мно- жества P(t\ Xi, ..., хп) = 0, то Q(t; Х\, ..., хп) = /(1 - Р2) — подходящий многочлен. Так можно построить многочлен Q, множество натуральных значений которого состоит в точности из простых чисел. (Нужно заме- тить, однако, что Q будет принимать также бесконечно много других целых неположительных значений, и избежать этого нельзя.) Числа Фибоначчи образуют последовательность 1, 1, 2, 3, 5, 8, ...; = +ип. Дж. Джоунз нашел, что, в отличие от простых чисел, эта последовательность совпадает с множеством положительных значений мно- гочлена пятой степени от двух переменных несложного вида (см. [70]) 2а46 + a3b2 - 2a2b3 - а5 - ab4 + 2а. Хотя, как мы уже отмечали, вопрос о доказуемости любой теоремы в принципе сводим к диофантову уравнению, конкретные задачи могут быть
122 Индукция и рекурсия [Гл. 3 сведены к диофантову уравнению в явном виде. Мы отсылаем читателя к очень интересной и информативной статье [294]. В этой статье, в част- ности, дана диофантова форма гипотезы Римана и проблемы четырех красок. § 3.3. Частично рекурсивные функции и перечислимые множества 3.3.1. Частичные функции и вычислимые функции. В этом пара- графе приводится точное определение класса частичных функций из (Z+)m в (Z4-)22, который считается адекватной формализацией класса (полу)вы- числимых функций и позволяет дать определение перечислимых множеств. Через D(f) обозначается область определения частичной функции /, см. [682], [70]. 3.3.2. Простейшие функции. Введем функции sue: Z+ —> Z4", suc(x) =x + 1; jW. (z+)rt-*Z+, 1(Л)(Х!, ..., xn) = 1, n>0; pif: (Z+)" ..., xn) = Xi, n 1. 3.3.3. Элементарные операции над частичными функциями. 1. Композиция (или подстановка). Она ставит в соответствие паре функций f из (Z+)m в (Z+)" и g из (Z+)" в (Z+)p функцию h = go f из (Z+)m в (Z+)p, которая определяется так: D(go f) = = {х е (Z+r: х е D(/), ZW € D(g)}, (g ° /)(х) = g(f(x)) (x e D(g о /)). 2. Соединение. Эта операция ставит в соответствие частичным функ- циям ft из (Z+)m в (Z+)"', z = 1, ..., k, функцию (/i, ..., fk) из (Z+)m в (Z+)n‘ х ... х (Z4")'2*, которая определяется так: О((Л,...,/,)) = О(Л)п...пО(/д (/ь /*)(*!, ...» Хт) = (/1(хЬ ..., Хт), ..., /ИХ1, ..., Хт)). 3. Рекурсия. Эта операция ставит в соответствие паре функций f из (Z4")'2 в Z4- и g из (Z4")'24’2 в Z функцию h из (Z4")'24’1 в Z4", которая определяется рекурсией по последнему аргументу: /i(xi, ...,хл, l) = /(xi, ...,хл) (начальное условие); ft(xi, ..., хл, k + 1) = g(xj, ..., хп> k, /z(xi, ..., хл, k)) при k 1 (рекурсивный шаг).
§ 3.3] Частично рекурсивные функции и перечислимые множества 123 Область определения D(h) описывается также рекурсивно: (хь...,х„, 1)еО(/г) о (хь .... х„) €£>(/); (xi, хп, k + 1) € D(h) (xi, х„) € £>(/) И (%1, ..., хп, k, /z(xj, ..., хл, /г)) € D(g) при k 1. 4. Операция р. Эта операция ставит в соответствие частичной функ- ции f из (Z+)'z+1 в Z+ частичную функцию h из (Z+)n в Z+, которая определяется так: D(h) = {(Х|, х„) е (Z+)m: Зхл+1 > 1 f(xit хп, х„+)) = 1 и (xi....хп, k) € D(f) для всех k xn+i}, /г(Х|, ..., х„) = min{x„+i: f(xh ...,хп, х„+() = 1}. В общих чертах роль операции [1 состоит во введении функций, задан- ных «неявно». Кроме того, она позволяет вводить в вычисление перебор объектов для отыскания нужного объекта в бесконечном семействе. Три особенности операции р следует отметить немедленно. Выбор минимального числа у, для которого f(xi, ..., хл, у) = 1 требу- ется, конечно, для обеспечения однозначности функции h. Область определения функции h на первый взгляд представляется ис- кусственно суженной: если, скажем, Дхь ..., хл, 2) = 1, a f(xj, ..., хл, 1) не определено, мы считаем функцию /z(xi, ..., хп) не определенной, а не равной 2. Причина этого состоит в желании сохранить интуитивную полу- вычислимость функции h. Наконец, все описанные операции, кроме операции ц, если их приме- нять ко всюду определенным функциям, дают в результате всюду опреде- ленную функцию. Для [1 это, очевидно, не так: это единственная операция, ответственная за возникновение частичных функций. 3.3.4. Частично рекурсивное описание функций. Определение 3.9. 1. Последовательность частичных функций Д, ... ..., fa называется частично рекурсивным (соответственно примитивно ре- курсивным) описанием функции fa = /, если f\ — одна из простейших функций; fi для всех i 2 либо является простейшей функцией, либо получается применением одной из элементарных операций к некоторым из функций /1, ..., fi-\ (соответственно одной из элементарных операций, кроме [1). 2. Функция f называется частично рекурсивной (соответственно при- митивно рекурсивной), если она допускает частично рекурсивное (соответ- ственно примитивно рекурсивное) описание.
124 Индукция и рекурсия [Гл. 3 Многочлены с положительными значениями. Сначала установим рекурсивность сумм и произведений. 1. Сумма sum2! (Z+)2 —► Z+, (xi, x2) + *2- Рекурсия no x2 исходя из начального условия Х\ + 1 = suc(xi) посред- ством рекурсивного шага х\ -F k + 1 = suc(sum2(xi, k)). 2. Сумма sumn: (Z+)rt —>Z+, (xj, ..., xn) У^Х/, n 3. Считая известным, что функция sum^-i рекурсивна, получаем sumrt с по- мощью соединений и композиции: sumrt = sum2 o(sum„_! о (prf, ..., pr^_j), xrt). Другой вариант — рекурсия по хп исходя из начального значения sue о osunirt-i посредством рекурсивного шага: п-1 У X! + k + 1 = suc(sumrt(xi, ..., xrt_i, k)). Эта многозначность рекурсивных описаний, даже «естественных», будет все возрастать. 3. Произведение prod2: (Z+)2 —► Z+, (xj, х2) xix2. Рекурсия по х2 исходя из начального условия xj посредством рекурсивного шага x\(k + 1) =x\k + xi = sum2(xi&, Xi). 4. Произведение prodrt: (Z+)n —>Z+, (xi, ..., хл) —>xi, ..., xn, 03: prodZI = prod2o(prodrt_1(pi7, ..., pr^), xn). 5. «Вычитание единицы»: Z+ —►Z4", x - 1, если x 2, x >—> x — 1 = < 1, если x = 1. Рекурсия применяется к функциям /: Z+-*Z+, f = 1Ь£ = рф (Z+)3—>Z+: (xb x2, x3) ~x2, в результате получается функция ft(xj, х2) = х2 — 1, поэтому х — 1 = рг^ ° о h о (х, х), где х = рг{ (х). 6. «Усеченная разность» (Z+)2 -»Z+: (xi, х2) •—> xj - х2 = xj — Х2, если Xi > х2; 1, еслих^хг. (3.3.1)
§3.3] Частично рекурсивные функции и перечислимые множества 125 Эта функция получается применением рекурсии к функциям /(xi) = xi - 1, g(X\, х2, х3) = х3 - 1. Пусть F: (Z+)n—>Z+, где F — любой многочлен от Х[, ...,хп с це- лыми коэффициентами, принимающий только значения из Z+. Если все коэффициенты многочлена F неотрицательны, то F есть сумма произве- дений функций pif: (xi, ..., хп) х/. Иначе F = F+ - F~, где коэффици- енты многочленов F+ и F~ неотрицательны, а значение неусеченной раз- ности во всех точках из (Z+)n совпадает со значением усеченной разности — F~ по предположению о многочлене F. В дальнейшем будет ис- пользоваться рекурсивность функций (х\ - х2)2 + 1 или h = (/ - g)2 + 1, где функции /, g рекурсивны: Этот прием позволяет отождествлять «мно- жество совпадения» f = g с «множеством 1-уровня» h = 1, с которым удобнее работать. 3.3.5. Другие рекурсивные функции. «Ступенька»: = * при X Хо, при х > хо; a, b, х е Z+. При хо = 1 она получается рекурсией с начальным значением а и по- следующим Ь. В общем случае s“f(x) = sf'b(x + 1 — Х0). Определим функцию гет(х, у) = остаток от деления у на х, лежащий в [1, х] (у нас нет нуля!). Имеем гет(х, 1) = 1; гет(х, у + 1) = < если гет(х, у) = х; sue о гет(х, у), если гет(х, у) / х. Применим следующий искусственный прием. Рассмотрим ступеньку s(x) = 2 при х 2, s(l) = 1 и положим <р(х, у) = s((rem(x, у) - х)2 + 1). Очевидно, гет(х, у) х <=> <р(х, у) = 1, гет(х, у) = х <=> <р(х, у) = 2, откуда следует, что гет(х, у 4- 1) = 2suc(rem(x, у)) - ср(х, у) suc(rem(x, у)). Итак, мы получили определение rem рекурсией.
126 Индукция и рекурсия [Гл. 3 Обобщением этого приема является «рекурсия с альтернативами»: h(x\, ...,хп, 1) = /(Х|, хл); (3.3.2) h(X\, ..., Хл, k + 1) = £((Х1, ..., Хл, Й, /l(X], ..., хл, k)), если выполнено условие G(xi, ..., х„, /г), i = 1, ..., т. Взаимоисключающие условия С, приведем к виду Ci выполнено о epi (xi, ..., хп\ k\ h(x\, ..., хп, k)) = 1 (3.3.3) (всюду определенная рекурсивная функция, принимающая только значения 1 и 2). Тогда рекурсивный шаг можно описать так: т h(x\, ..., хп, k + 1) = 2^2gi(xi, хп, k, й(Х|, ..., хп, k)) - <=1 (3.3.4) т Е (&•?;)(* 1...хп, k, й(хь .... хл, /г)). i=i Этот прием позволяет установить примитивную рекурсивность следу- ющих функций, которые понадобятся в дальнейшем. Неполное частное: qt(x, у) = < у целая часть х У 1 если - > 1, х У 1 если - < 1. х Имеем qt(x, 1) = 1; qt(x, у + 1)= qt(x, у)+ 1, если гет(х, у + 1) / х, если гет(х, у + 1) / х, у + 1 / х, если у + 1 = х. К стандартному виду (3.3.3) условия приводятся с помощью функций s((rem(x, у + 1) - х)2 + 1), $((гет(х, у 4- 1) - х)2 + 1) os((x - у - I)2 -h 1), s((x -у - 1)2 + 1), где s(l) = 1, s(x>2) = 2; §(!) = 2, s(x^2) = l,
§3.3] Частично рекурсивные функции и перечислимые множества 127 Функция radx— целая часть у/х. Имеем rad(l) = 1; rad(x + 1) = radx, rad x + 1, если qt(radx + 1, x + 1) < radx + 1, если qt(radx + 1, x + 1) = radx + 1. Эти условия приводятся к стандартному виду (3.3.2) похожим образом. Функция min(x, у): {min(x, ц), если х < ц, min(x, у) + 1, если х > у. Функция тах(х, у) определяется аналогично. 3.3.6. Дальнейшие свойства рекурсивных функций. Если функция Дхь ..., хл) рекурсивна, то функции Хп Хп 5/ = ^2/(Х1....Pf = П /(X), ...,х„_|,/г) k=\ k=\ рекурсивны. Кроме того, рекурсивны функции, которые получаются из f а) любой перестановкой аргументов; б) введением любого числа фиктивных аргументов; в) отождествлением членов любой группы аргументов (Дх, х) вместо Дх, у) и т. д.). Отображение f: (Z+)m —> (Z+)n рекурсивно, если и только если все его компоненты рг? о f рекурсивны. Определение 3.10. Множество Е с (Z4")'2 называется перечислимым, если существует такая частично рекурсивная функция /, что Е = D(f) (об- ласть определения). Обсуждение в §3.1 и 3.2 показывает, что интуитивный смысл пере- числимости таков: существует программа, которая распознает элементы х, принадлежащие Е, но, возможно, не умеет распознавать элементы, не при- надлежащие Е. Позже будет дано другое описание перечислимых мно- жеств, которое объяснит этимологию названия: это множества, все эле- менты которых могут быть получены (возможно, с повторениями и неиз- вестном порядке) с помощью некоторой «порождающей» их программы. Из свойств частично рекурсивных функций вытекает следующий про- стой факт. 3.3.7. Связь с множествами уровня. Предложение 3.11. Следующие три класса множеств совпадают'. а) перечислимые множества; б) множества уровня частично рекурсивных функций; в) множества \-уровня частично рекурсивных функций.
f 128 Индукция и рекурсия [Гл. 3 --------------------------------------------------------------- j Гораздо более трудным утверждением является следующий результат и его следствия. ; 3.3.8. Связь с проекциями множеств уровня. Теорема 3.12. Следующие два класса множеств совпадают'. а) перечислимые множества; б) проекции множеств уровня примитивно рекурсивных функций со значениями в Z+. Среди примитивно рекурсивных функций содержатся многочлены с ко- эффициентами из Z+. Напомним, что диофантовыми множествами на- зываются проекции множеств уровня таких многочленов и что теорема Матиясевича теперь может быть сформулирована точно. 3.3.9. Теорема Матиясевича. Теорема 3.13. Перечислимые множества диофантовы, следова- тельно, эти два класса совпадают. Ниже в этом параграфе изложен план доказательства теорем 3.12 и 3.13. Назовем временно проекции уровней примитивно рекурсивных функций примитивно перечислимыми множествами. В первой части доказательства теоремы 3.12 устанавливается, что примитивно перечислимые множества перечислимы, а во второй части — обратное включение. Итак, пусть f(x\, ..., хп, хл+1, • ••, *п+т)— некоторая примитивно ре- курсивная функция, Е — проекция ее 1-уровня на первые п координат. Построим явно такую частично рекурсивную функцию g, что Е = D(g). Разберем отдельно три случая в зависимости от коразмерности проек- ции: т = 0; 1 или т 2. Случай а): т = 0. Тогда множество Е является множеством 1-уровня функции f и перечислимо по предложению 3.3.7. Случай б): т= 1. Положим g(Xf, .... хп) = min{хя+|: f(xi.хп, xn+i)= 1}. Очевидно, функция g частично рекурсивна и D(g) = Е. Случай в): т 2. Мы сведем этот случай к предыдущему с помощью следующей леммы, важной во многих других вопросах и имеющий принци- пиальный интерес (отсутствие понятия размерности в «рекурсивной гео- метрии»). 3.3.10. Существование некоторых биекций. «Лемма 3.14. Для всех т 1 существует такое взаимно однознач- ное отображение Z+ —► (Z+)m, что а) функции = примитивно рекурсивны для всех I, 1 / ^т; б) обратная функция (Z+)m —>Z+ примитивно рекурсивна.
§3.3] Частично рекурсивные функции и перечислимые множества 129 Использование леммы. Применим лемму в ситуации п. 3.3.9 в). Так, положим (при т 2) £(*1....хп, у) = f(xit ...,хп, t^(y).t™(y)). Очевидно, функция g примитивно рекурсивна вместе с f. Легко прове- ряется, что множество Е совпадает с проекцией 1 -уровня функции g на первые п координат. Так как это проекция коразмерности 1, мы свели этот случай к уже разобранному. Доказательство леммы. Случай т = 1 тривиален. Проведем индукцию по т, начиная с т = 2. Конструкция /(2). Сначала построим явно т(2): (Z+)2 -*Z+, положив т(2)(Х1, х2) = ^((%1 + х2)2- X) — Зх2 + 2). Легко проверяется, что если пронумеровать пары (хь Х2) € (Z+)2 в «кан- торовском порядке», расположив их по возрастанию xi + хг, а внутри группы с данным Xi +*2 — по возрастанию хь то t(2)(xi, Х2) будет как раз номером пары (х\, Х2) в этом списке. Тем самым, функция т(2) вза- имно однозначна и примитивно рекурсивна (следует использовать п. 3.3.4 и рекурсивность функции qt из п. 3.3.5 для учета 1/2). Восстановление пары (xi, Х2) по ее номеру у является элементарной задачей и приводит к следующим формулам для обратной функции /(2): t(24y)=y~^ \12У~74~12 ( у/2У~1~12 +1)’ t?4y)=^2y-74-± ~№(у) + 2. Здесь [z] обозначает целую часть числа z. Проверка примитивной рекур- сивности этих функций проводится с помощью результатов и приемов из п.3.3.4-3.3.6. Конструкция т^З. Предположим, что функции уже построены и проверены их свойства. Положим, прежде всего, Т(т)(Х|, .... хт) = т<2)(т(т-|)(Х1.хот_1), хт). Ясно, что функция т(т) примитивно рекурсивна и взаимно однозначна. Ре- шив уравнение Т(2)(т(,"_|)(Х1, ...» Хт-1), Хт) = у в два приема, получим для обратной функции формулы = 42)(«/)< = ^-‘^(У^ 1 < i пг - 1. По индуктивному предложению функции примитивно рекурсивны.
130 Индукция и рекурсия [Гл. 3 Этим доказана лемма и завершена первая часть доказательства теоре- мы 3.12. Вторая часть доказательства. Установим, что всякое перечисли- мое множество примитивно перечислимо. Начнем со следующего легко проверяемого свойства класса примитивно перечислимых множеств. 3.3.11. Операции на примитивно перечислимых множествах. Лемма 3.15. Класс примитивно перечислимых множеств замкнут относительно следующих операций', конечное прямое произведение, конечное пересечение, конечное объединение, проекция. Пусть теперь Е — некоторое перечислимое множество. Реализуем его как 1-уровень частично рекурсивной функции f из (Z+)n в Z+ по предло- жению 3.3.7 и заметим, что для доказательства примитивной перечислимо- сти множества Е достаточно проверить примитивную перечислимость гра- фика Г/ С (Z+)rt х Z+. Действительно, ясно, что Е является множеством 1-уровня проекции на первые п координат множества Г/ П [(Z+)n + {1}]. Кроме того, множество {1} с Z+ примитивно перечислимо по свойствам из п. 3.3.4, и если мы докажем, что множество Г/ примитивно перечислимо, то из леммы 3.3.11 будет следовать то же самое для Е. Итак, окончательная редукция нашей задачи выглядит так: доказать, что графики частично ре- курсивных функций f примитивно перечислимы. С этой целью проверяет- ся, что а) графики простейших функций примитивно перечислимы; б) если даны функции с примитивно перечислимыми графиками, то у функции, ко- торая получается из них применением одной из элементарных операций, также примитивно перечислимый график. Устойчивость относительно рекурсии и [i-оператора является наиболее тонким фактом. Для этого используется следующая красивая и полезная лемма. 3.3.12. Функция Гёделя. «Лемма 3.16. Существует примитивно рекурсивная функция Gd(fc, /) {функция Гёделя) со следующим свойством', для любого N G G Z+ и любой конечной последовательности а\, ..., а^ eZ+ длины N существует такое f G Z+, что Gd(£, t) = а* при всех k, \ {иными словами, Gd(&, t)) — это такая последовательность функций от аргумента k, пронумерованная значениями параметра t, что любая функция от k на сколь угодном большом интервале 1,... ,N мо- жет быть представлена подходящим членом последовательности). В доказательстве сначала удобно положить gd(u, k, t) = rem(l + kt, и) и показать, что функция gd обладает тем же свойством, что и Gd, если разрешить подбирать {и, t) G (Z+)2. После этого можно будет положить Gd(£, у) = gd(/}2)(z/), k,
§ 3.4] Диофантовы множества и алгоритмическая неразрешимость 131 где /(2): Z+ —> (Z+)2— изоморфизм из леммы 3.3.10. Избавление от лиш- него параметра и в Gd(£, /), по сравнению с gd(u, k, t), несущественно. 3.3.13. Свойства перечислимых множеств. Теорема 3.3.8 показыва- ет, что если множество Е перечислимо, то существует программа, «порож- дающая Е» (ср. с п. 3.3.6). Действительно, пусть Е — проекция на первые п координат 1-уровня примитивно рекурсивной функции /(xj, ..., хл, у). По- рождающая Е программа должна перебирать векторы (х\, ..., хл, у), ска- жем в канторовском порядке, вычислять f и подавать на выход (х\, ..., хп) в том и только в том случае, когда f = 1. В силу примитивной рекурсивно- сти функции /, порождающая программа рано или поздно выпишет любой элемент множества Е и ничего кроме него и не может навечно застрять на элементе, не принадлежащем Е. Однако если Е пусто, мы этого можем никогда не узнать. Множество Е с (Z+)rt называется разрешимым, если оно и его до- полнение перечислимы. Интуитивно это означает, что есть программа, по каждому элементу множества (Z4")'2 выясняющая, принадлежит ли он Е или нет. Эти множества можно охарактеризовать как множества уров- ня общерекурсивных всюду определенных частично рекурсивных функций или же как множества, характеристическая функция которых рекурсивна. Чтобы установить эти свойства, используется следующий результат. Предложение 3.17. Для того чтобы частичная функция g из (Z+)n в Z+ была частично рекурсивной, необходимо и достаточно, чтобы ее график был перечислим. § 3.4. Диофантовы множества и алгоритмическая неразрешимость 3.4.1. Алгоритмическая нераспознаваемость и неразрешимость. Прежде чем объяснить, как доказывается теорема 3.13 о совпадении класса диофантовых множеств и класса перечислимых множеств, приведем несколько интересных приложений этой теоремы. Из логики известно су- ществование перечислимых, но не разрешимых множеств. Из объединения этого результата, теоремы 3.13 и тезиса Чёрча вытекает неразрешимость десятой проблемы Гильберта (см. п. 3.1.2). Прежде всего, любое натуральное число есть сумма четырех квадра- тов целых чисел (теорема Лагранжа, п. 1.2.6). Поэтому разрешимость уравнения f(x\, ..., хп) = 0 в (Z+)n равносильна разрешимости уравнения f(l+52^- •••’1+&0 =0 ' Z=1 /=1 '
132 Индукция и рекурсия [Гл. 3 в Z4". Следовательно, достаточно установить алгоритмическую неразре- шимость массовой проблемы «распознавания наличия решений» в (Z+)\ Пусть Е с Z+ — перечислимое, но неразрешимое множество. Предста- вим его в виде проекции на /-координату множества 0-уровня многочле- на ft = /(/; xi, ..., хп) = 0, f е Z[/, xi, ..., хп]. Уравнение До = 0; /о € Z+, разрешимо, если и только если t^eE. Согласно общему принципу (тезис Чёрча) интуитивная вычислимость эквивалентна частичной рекурсивно- сти функции. Отсюда вытекает, что соответствующая массовая пробле- ма для семейства {ft} алгоритмически разрешима, если и только если характеристическая функция множества Е вычислима. Однако по вы- бору Е это неверно: хотя Е перечислимо, дополнение к Е не перечис- лимо. Таким образом, разрешимость в целых числах нераспознаваема уже для подходящего однопараметрического семейства уравнений. Число неиз- вестных в нем (и вообще коразмерность проекции, подразумеваемой в тео- реме 3.3.9) может быть сведено до 9 (Ю. В. Матиясевич). Точный минимум неизвестен, его нахождение — очень интересная проблема. 3.4.2. План доказательства теоремы Матиясевича. Временно вво- дится класс множеств, промежуточный между перечислимыми и диофан- товыми. Чтобы определить его, рассмотрим отображение, которое ста- вит в соответствие каждому подмножеству Е с (Z+)n новое подмножество F С (Z+)n по следующему правилу: (xi, ..., хп) е F о V k € [1, хп\ (xi, ..., хп_ 1, k) € Е. В этом случае будем говорить, что Е получилось из Е применением ограни- ченного квантора общности по я-й координате. Аналогично определяется применение по любой координате. Определение-лемма. Рассмотрим следующие три класса подмно- жеств в (Z4")'2 при всевозможных п. I. Проекции множеств уровня примитивно рекурсивных функций. II. Наименьший класс множеств, содержащий множества уровня многочлена с целыми коэффициентами и замкнутый относительно операций конечного прямого произведения, конечного объединения, конечного пересечения, проекции и ограниченного квантора общ- ности. III. Проекции множеств уровня многочленов с целыми коэффици- ентами. Тогда а) Класс I совпадает с классом перечислимых множеств, а класс III — с классом диофантовых множеств; множества класса II будем называть D-множествами; б) Справедливы включения'. I D II D III.
§3.4] Диофантовы множества и алгоритмическая неразрешимость 133 Завершающие шаги теоремы Матиясевича состоят из редукций, подоб- ных уже описанным. Критическое место — доказательство того, что класс диофантовых множеств замкнут относительно применения ограниченного квантора общности. Здесь и используются диофантовы представления кон- кретных множеств, построенных в § 1.2, для проверки того, что применение функции Гёделя не нарушает диофантовости. Отметим, что в [647] Б. Поонен изучал десятую проблему Гильберта для больших подколец в Q в связи с гипотезой Мазура о многообразиях над Q, для которых топологическое замыкание рациональных точек име- ет бесконечно много компонент (до сих пор не известно ни одного такого многообразия). Для поля рациональных чисел десятая проблема Гильберта является большим открытым вопросом. При попытках нахождения ответа на него использовались два общих подхода: один заключается в изучении аналогичного вопроса для других глобальных полей (таких, как поле ра- циональных функций ₽<?(/) над конечным полем) и в переносе методов на поле Q; другой заключается в поиске доказательств для очень больших подколец в Q. Связь этой проблемы с арифметической и алгебраической геометрией была изучена в [419], см. также [748].
ГЛАВА 4 АРИФМЕТИКА АЛГЕБРАИЧЕСКИХ ЧИСЕЛ §4.1. Алгебраические числа: реализации и геометрия 4.1.1. Присоединение корней многочленов. Идея расширения по- ля рациональных чисел возникла, в частности, благодаря попыткам ре- шить конкретные диофантовы уравнения. Использование иррациональных чисел, являющихся корнями многочленов с рациональными коэффициен- тами, часто позволяет привести такие уравнения к более удобной форме. Интегрирующий пример связан с уравнением Ферма (см. [14], [87], [325], [665]) xn+yn=zn (п>2). (4.1.1) Неразрешимость уравнения (4.1.1) в ненулевых целых числах при п > 2 была установлена в работе Уайлса [841], а также в работе Уайлса и Тэйло- ра [798] о гипотезе Шимуры—Таниямы—Вейля и большой теореме Фер- ма, см. гл. 7. Уайлс использовал сложную технику и идеи, принадлежа- щие ему и многим другим математикам (К. Рибет, Г. Фрей, И. Хеллегуарш, Ж.-М. Фонтен, Б. Мазур, Х.Хида, Ж.-П. Серр, Дж. Туннелл и др.). Это поистине историческое событие подводит итог целой эпохе в теории чисел. Заметим, что еще до работы Уайлса Фальтингс доказал (см. гл. 5, § 5.5), что число примитивных решений (х, у, z) (т. е. таких, что НОД(х, у, z) = = 1) конечно для всех п > 2. Если п— нечетное простое число, то левая часть уравнения (4.1.1) преобразуется в произведение: п—1 П(х +£*</) = 2я, (4.1.2) /?=0 где £ = ехр{2тс//гг} — первообразный корень степени п из 1. Используя свойства делимости произведения в левой части уравнения (4.1.2), можно доказать, что уравнение (4.1.1) неразрешимо в целых числах, не делящих- ся на п (т. е. установить первый случай теоремы Ферма'. n\xyz), если предположить, что в кольце R = Z[£] справедливо свойство однозначности разложения на простые множители (Куммер). Однако это свойство выпол- нено далеко не всегда: Масли и Монтгомери [553] нашли все такие п\ их
§4.1] Алгебраические числа: реализации и геометрия 135 оказалось 29: из них простыми являются п = 3, 5, 7, 11, 13, 17, 19. Тем не менее, до работы Уайлса справедливость первого случая теоремы Ферма была установлена для бесконечно многих простых чисел, см. [113], [347], [380]. Пусть а — некоторый комплексный корень неприводимого многочлена ftx) = хп 4- ап-\хп~] + ... + ао € Q[x] с рациональными коэффициентами at € Q. Если k = Q(ot) — наименьшее поле, содержащее а, то любой его элемент 0 имеет вид 0 = г(а), где г(х) — многочлен степени degr(x) < п, а правила действий в Q(ot) таковы, как с остатками по модулю многочле- на f в кольце многочлен. Другими словами, имеется изоморфизм поля k с факторкольцом Q[x](f), и k является я-мерным Q-векторным простран- ством (с базисом 1, а, ..., ал-1). Выбор базиса дает еще одну реализацию элементов поля k как квадратных матриц размера п х п: элементу 0 € k от- вечает матрица линейного отображения срр: х 0х. В базисе 1, а, ..., ал-1 эндоморфизм <ра записывается матрицей (сопровождающая матрица) /0 0 .. . 0 —а0 \ 1 0 .. 0 — а\ д« = 0 1 .. . 0 - аг \0 0 .. а наименьшее подкольцо алгебры матриц Mn(Q), содержащее Ла, отож- дествляется с k. Каждый элемент 0 € k является корнем характеристиче- ского многочлена эндоморфизма <рр, его определитель и след обозначаются N(0), Тг(0) и называются соответственно нормой и следом элемента 0. Би- линейная форма В: k х k -* Q, определенная по правилу В(и, о) = Tr(iw), является невырожденной. Элемент 0 € k называется целым, если коэффи- циенты Ь[ характеристического многочлена det(X • 1Л - <рр) = Х" + ftn-iX"-1 + ... + 60 € Q[X] — целые рациональные числа. Это условие равносильно тому, что коль- цо Z[0] — конечно порожденная абелева группа. Множество всех целых чисел поля k будет обозначаться О = Ok, и оно также является конечно порожденной абелевой группой — свободным Z-модулем с базисом , ... ..., Определитель билинейной формы В(и, v) в таком базисе назы- вается дискриминантом D = Dk поля k и не зависит от выбора базиса Z-модуля О^ Идея выполнения символьных операций над корнями многочленов при- вела к теории алгебраических расширений полей, для которых можно про- вести рассмотренные конструкции. Если k с К — два поля и размерность [К : k] конечна, то для любого элемента 0 € К аналогично определяют-
136 Арифметика алгебраических чисел [Гл. 4 ся N/</fe(P) и Тгкд(р). Требование невырожденности формы Вк/ь(ц, v) = = Тгкд(иг>) является одним из определений сепарабельного расширения. В этом случае всегда можно найти такой элемент у € К, что К = &(у) (тео- рема о примитивном элементе) [494], [108]. Присоединение корней всех неприводимых многочленов из &[Х] к ос- новному полю k приводит к конструкции алгебраического замыкания k. Это поле, однозначно определенное с точностью до изоморфизма и состо- ящее из элементов, алгебраических над k, само алгебраически замкнуто: любой многочлен f(X) е &[Х] имеет корень а € k, если deg / > 0. Когда пи- шут Q, то часто имеют в виду конкретную реализацию этого поля в виде множества всех комплексных чисел z € С, являющихся корнями много- членов с рациональными коэффициентами. 4.1.2. Расширения Галуа и элементы Фробениуса (см. [494], [530]). В общей ситуации пусть K/k — конечное сепарабельное расширение, k с К С k. Тогда K/k называется расширением Галуа, если для всех вложений X: К —*k над k (т. е. Х(х) = х при х € k) выполнено условие \(К) = К. В этом случае автоморфизмы X: К —> К над k образуют группу G(K/k) — Aut(K/&) порядка п = [К : k], которая называется группой Га- луа, а расширение K/k называется тогда расширением Галуа. В дальней- шем результат действия о е G(K/k) на элемент х е X будет обозначаться х°, либо ох, так что выполнено равенство (то)(х) = т(ох), хта — (х°)т (ле- вое действие G(K/k) на X). Теорема 4.1 (основная теорема теории Галуа). Существует вза- имно однозначное соответствие между подгруппами Н с G(K/k) и промежуточными полями L, k с Lc К, определенное по правилу Н »-> Кн = {X е К: х° = х для всех о € И}, HL — {о е G(K/ky. х° = х для всех х е L}. При этом соответствии нормальные подгруппы Н < G(K/k) отвеча- ют расширениям Галуа L/k, причем G(L/k) = G(K/k)/Ht. Пример 4.2 (конечные поля). Пусть К = F^— конечное поле из q элементов, тогда q = pf и F7 — векторное пространство степени / над простым подполем Fp = Z/pZ [530]. Для любого целого числа г > 0 в ал- гебраическом замыкании F^ содержится ровно одно расширение поля F^ степени г, _ F^r = {х € F^: xq = х}, так как xqf~{ = 1 для всех элементов мультипликативной циклической группы F*r. Поэтому расширение F^r/F^ является расширением Галуа, причем группа Галуа циклическая порядка г, G(Fr/F?) = {l, Fr9, F^ .... Fr;-1}, где Fr^ : х xq —автоморфизм Фробениуса.
§ 4.11 Алгебраические числа: реализации и геометрия 137 Пример 4.3 (круговое поле). Пусть Z>m— первообразный корень степени т из 1, тогда поле Km = QKm) содержит все корни многочле- т— 1 на Хт - 1 = П “ £т) и поэтому является расширением Галуа. Если z=0 о € G(Km/Q), то элемент тоже должен быть первообразным корнем степени т из 1, так что о^т — (а, т) = 1. Если £* —другой перво- образный корень, то о(£*) = £*а; поэтому сопоставление ома (modm) дает каноническое отображение G(ftm/Q) —»(Z/mZ)x, которое является изоморфизмом. Для доказательства достаточно установить, что круговой многочлен т—\ <м*)= П /=1 О',т)=1 — неприводимый многочлен над Q. Во-первых, Хт - 1 = П ФДХ), поэтому d\m Фт(Х) = П (Xm/d - l)u(d) € Z[X] — функция Мёбиуса). Неприводи- d\m мость устанавливается с помощью редукции многочленов Z[X] —* FP[X] по модулю р: f(X) »-> /(X) G FP[X] и с помощью эндоморфизма Фробениу- са /(X)»—> Т(Х)Р — Т(Хр) в кольце FP[X]. Предположим противное: пусть многочлен Фт(Х) приводим и Фт(Х) = МХ)...[г(Х) — его разложение на неприводимые многочлены в кольце Z[X]. Докажем, что для всех a (modm), (a, m) = 1, если = 0, то и fi(C^) = 0. Вос- пользуемся существованием такого простого числа р, что р = а (modm). Многочлен Хт — 1 взаимно прост со своей производной тХш-1_в кольце FP[X], так как р\т, а следовательно, многочлены /ДХ), ..., Jr(X) по- парно взаимно просты. Если теперь /Д^) = 0 для какого-нибудь // 1, то = 0, и поэтому fi(X) делит fj(Xp), а значит, f\(X) делит f j(Xp) = = (fj(X))p. Это противоречит взаимной простоте многочленов /ДХ) и f ДХ). Заметим, что нетрудно избавиться от предположения о существовании р с условием р = а (modm): для этого рассматривается разложение на простые множители а = р*1 ... p$s и редукция по модулю pz, / = 1, ..., s, см. [14], [494], [230], [501], [821]. Напомним, что характером Дирихле х по модулю m называется гомо- морфизм х- (Z/mZ)x —*СХ, который часто рассматривается как функция на множестве Z, причем х(х) = х(х mod если (х, m) = 1, и х(х) = 0, если (х, m) > 1 (см. п. 2.2.2). Согласно доказанной теореме существует канонический изоморфизм G(Km/ty) = (Z/mZ)x, поэтому характер Ди- рихле х задает гомоморфизм рх: Gal(Q/Q)—>СХ с помощью проекции Gal(Q/Q) Gal(Km/Q).
138 Арифметика алгебраических чисел [Гл. 4 Теорема 4.4 (теорема Кронекера—Вебера). Для любого гомомор- физма конечного порядка р: Gal(Q/Q) -* Сх существует такой ха- рактер Дирихле х, что р = рх, см. [101], [137], [230]. Эквивалентная формулировка: любое расширение Галуа К/Q с комму- тативной группой Gal(K/Q) (абелево расширение) содержится в некотором круговом расширении. Замечательно то, что элементы группы Галуа Gal(/(m/Q) отвечают про- стым числам р (точнее, р (mod m)) для р | т. Наиболее глубокие резуль- таты алгебраической теории чисел связаны с обобщениями теоремы Кро- некера—Вебера. Например, Серр и Делинь установили соответствие меж- ду такими неприводимыми двумерными представлениями р: Gal(Q/Q) —► —> GL2(C), что det р = рх для нечетного характера Дирихле и прими- тивными параболическими формами веса один (см. §6.4) (теорема Серра—Делиня). Предположительно это соответствие является взаимно однозначным и представляет собой двумерный вариант теоремы Кроне- кера—Вебера. 4.1.3. Тензорное произведение полей и геометрическое изобра- жение алгебраических чисел. Чтобы получить удобную геометрическую реализацию поля алгебраических чисел k, мы используем тензорное произ- ведение k 0 R. Конструкции, использующие тензорное произведение полей и колец, очень распространены в алгебраической теории чисел, поэтому мы начнем с более общего результата. Теорема 4.5 (теорема о тензорном произведении полей). Пусть K/k — конечное сепарабельное расширение, К = £(у), L/k— некото- рое другое расширение, причем т i=\ — разложение на неприводимые множители в кольце L[X]. Тогда имеет место изоморфизм колец К ®kL = П£ ’ i=\ где Li = L[X\/(gi(X))— конечные расширения поля L, содержащие К (при вложении Xi*. К Li), Ыг(у)) = r(X) (mod &•(%)) (см. [225], [230]). Доказательство этой теоремы проводится подобно доказательству ки- тайской теоремы об остатках: элементы г(у) 0^ I (/ е L, г(Х) е &РФ al
§4.1] Алгебраические числа: реализации и геометрия 139 порождают К L, а изоморфизм задается формулой r(Y) ®k I ~ (/rW (mod gx (X)), ..., /r(X) (mod ^(X))) Следствие 4.6. Для любого элемента 0 е К рассмотрим его харак- теристический многочлен /р(Х) е k[X] в расширении K/k и характе- ристические многочлены fa е ЦХ] элементов Х/(0) е Ц над L. Тогда т /р(Х) = П /рДХ). В частности, /=1 т ЛАк/*(Р) = ПМд,/д(Х/(₽)), (4.1.3) i=\ т Тгк/А(р) = ПТг^^(Р))- С4-1-4) /=1 Если в качестве L взять k, то т = п и Хь ...» \п — все различные вло- жения Xj: К —* k, ^Х) = (Х-Х^))...(Х-^))- Поэтому для любого 0 € K/k мы имеем п п *МР) = Пм₽), Тгк/* = Ех< <4-15) Z = 1 Z = 1 Геометрическое изображение алгебраических чисел получается, если положить E = R, /C=Q(y), k = Q. Пусть /Y(X) = (X — yi)... (X - yr,) х х(Х2 + oqX + 0i)... (X2 + аГ2Х + 0Г2) — разложение минимального много- члена /Y(X) € Q[X] для у на неприводимые многочлены над полем действи- тельных чисел, тогда К = Q(y) ® = ^Г1 х СГ2 (4.1.6) (изоморфизм R-алгебр) или К R = Rn (изоморфизм R-векторных про- странств) и п—Г\ Н-2г2. Пусть Xi, ..., ХГ1, ..., ХГ1+Г2 — вложения из п. 4.1.2, тогда набор X = (Xi, ..., ХГ1+Г2) задает вложение К в Rn, а все вложения поля К в поле комплексных чисел таковы: X1, ..., Хг।, Х^। 1, х^। 1, •. •, Хг। _|_f2, Xf। _|_f2. Решеткой M в векторном пространстве R" будем называть такую дис- кретную подгруппу McRrt, что факторгруппа Rn/Af компактна (в есте- ственной топологии). Любая решетка М С R" является свободной абеле- вой группой, натянутой на какой-нибудь базис в], ..., еп в R".
140 Арифметика алгебраических чисел [Гл. 4 Если О — кольцо целых элементов поля /(, то можно проверить, что его образ М = Х(О) С является решеткой, причем DK = (-4)'2 vol2(R"/X(O)), (4.1.7) где DK— дискриминант поля К (см. п. 4.1.1), а vol^/Al)— объем основного параллелограмма {£/=1 xiei'- 1} решетки М = (еь ... ..., еп) по обычной мере Лебега в R". Пусть, например, К = Q(a) — квад- ратичное поле, где а2 = d и целое число d свободно от квадратов. Тогда вычисление характеристического многочлена элемента £ = а + 6а (где а, b — рациональные числа) показывает, что <9 = Z[(o], где со = 1 и D% = d при d = 1 (mod 4), (о = а и D^=^d при d = 2, 3 (mod 4). Если d положительно, то геометрическим изображением числа £=a + 6a будет точка Х(£) = (а + by/d, а — by/d). В случае мнимого квадратичного поля (d < 0) изображением числа £ = a + 6a будет точка a + iby/\d\ на комплексной плоскости. Поскольку Z[o] = (1, со), при положительном d мы имеем vo1(R2/Z[q] ) = если d = 1 (mod 4), если d = 2, 3 (mod 4), а при отрицательном d получаем vo1(C/Z[g>]) = < если |d| = 3 (mod4), если \d \ = 1, 2 (mod 4). Вид решетки целых чисел квадратичного поля в R2 иллюстрирует рис. 4.1 для d = -1 и рис. 4.2 для d = 2. Рис. 4.2 Рис. 4.1
§4 11 Алгебраические числа: реализации и геометрия 141 4.1.4. Единицы, логарифмическое отображение и регулятор. В кольце Z есть только два обратимых элемента: 1 и —1. Группа единиц, т. е. обратимых элементов, кольца целых элементов Or поля алгебраиче- ских чисел К устроена менее тривиально, но ее строение поддается пол- ному описанию. Эта группа обозначается или Ек, а к нахождению ее элементов сводится ряд интересных задач элементарной теории чисел, например решение уравнения Пелля (п. 1.2.5) x2-dy2 = l (4.1.8) (где натуральное число d свободно от квадратов). Действительно, если ре 0%, то Np и (Np)-1 =N(P-1) — целые рациональные числа, поэтому Np = ±1. Наоборот, если р е Or и Np = ±1, то ре Следовательно, любое решение уравнения (4.1.8) в целых числах х, у дает некоторую еди- ницу р = х + у а. вещественного квадратичного поля К = Q(ot), а2 = d, так как Np + (х + y\/d)(x - y\fd\ Из общей теоремы Дирихле о строении группы единиц произвольного поля алгебраических чисел К следует, в частности, что для К = Q(Vd) выполняется равенство Е% = {±ел: п е Z}, где е — фундаментальная единица (она однозначно определена тре- бованием, что число Xi(е) = a + b\/d наименьшее с условием Xi(e) > 1). Так, множество решений уравнения (4.1.8) в целых числах отождествляет- ся с подгруппой в Ек, имеющей вид {ieg/м € Z}, где ео = *о + У№ отвечает наименьшему решению (хо, уо), однозначно определенному условием ми- нимальности числа Xi (ео) = хо + y<yfd > 1. Для описания группы единиц в общем случае используется вложение X: К К К = ВТ2 х Cf2 и ло- гарифмическое отображение /: (BV1 х С2)х ->1Г1+Г2, где если i Oi, то Л (х) = log|х|, //: Rx —* R, а если i > ц, то /<(х) = log|х|2, li: Сх —> R. При отображении / о X умножение элементов в поле пере- ходит в сложение векторов пространства КГ1+Г2. Если х € /(, то мы знаем, что ________ _________________ Nx = X! (х)... ХГ1 (х) • ХГ1+1 (х)Хг,+j (х)... ХГ1+Г2 (х)ХГ1 +Г2 (х) в силу соотношения (4.1.3), поэтому Г1+Г2 /,(Х,(х)) = log|Nx|. 1=1 В частности, образ /Х((9£) группы единиц лежит в гиперплоскости V = l(Xi, ...,хГ1+Г2)еГ’+Г2 О+Г2 У? х‘=о 1=1
142 Арифметика алгебраических чисел [Гл. 4 V = Rr, г = Г\ 4- Г2 - 1. Ядром отображения /: (К Oq R)x -* Rfl+f2 явля- ется компактное подмножество {±1р X Sr2 cF1 X С2 = где S = {z е C/|z| = 1} — окружность. Следовательно, логарифмическое отображение дает довольно эффективный способ изображения группы еди- ниц: ядро отображения /X: Е/< —»Rri+r2 состоит лишь из конечного чис- ла элементов (корней из единицы, лежащих в /(). Действительно, только конечное число элементов дискретного множества Х(О/<) попадает в ком- пактное множество Кег/ CF. Основная теорема о строении группы единиц (Дирихле) — это утверждение о том, что образ ГК(Ек) является (полной) решеткой в V = Rr (г = r\ 4- - 1). Другими словами, найдут- ся такие элементы ei, ..., ег е Ек, что любая единица е Е Е/< однозначно представляется в виде е = ...гпггу где щ eZ,r^ — некоторый корень из 1, лежащий в /С В частности, элементы еь ..., ег мультипликативно незави- симы: /X(ei), ..., /Х(ег) образуют базис векторного пространства V. Рас- смотрим теперь объем vol( V//X(E/<)) основного параллелепипеда решетки единиц (по мере подпространства V, заданной мерой Лебега в R"). Тогда величина tzl//nzc vol(V//X(Ez<)) Як =------7=т=т— vr + 1 называется регулятором поля и равна абсолютной величине опреде- лителя /1X1 (Е1) /2X2(21) ••• //]-+-Г2 Х/-|-+-Г2 1) /1X1 (е<) /2X2(2,-) • •• //|4-/-2Х/-1+г2(2/-) (Г1+Г2) 1 (ri 4-гг) 1 • •• (п 4-г2) 1 4.1.5. Точки решетки в выпуклом теле. Сейчас мы опишем геомет- рическую идею, на которой основано доказательство теоремы о единицах и других интересных фактов (оценки дискриминантов). Теорема 4.7 (лемма Минковского о выпуклом теле). Пусть М— решетка в R", А = vol(Rrt/M), и пусть XcF — центрально сим- метричное выпуклое тело конечного объема v = vol(X). Тогда если v >2пА, то существует элемент а € Л4 А X, а 0. Для доказательства удобно рассмотреть решетку 2М с R" с объемом фундаментального параллелепипеда vol(Rrt/2M) = 2" А. Тогда при есте- ственном проектировании тела X С R" на фундаментальный параллелепи- пед Rn/2M обязательно возникнут самоперекрытия образа тела X, так как vol(X) больше объема фундаментального параллелепипеда. Поэтому най- дутся две такие различные точки Zi, Z2 € X, Z\ Z2, что Z\ = Z2 (mod2M), т. е. (zi — Z2}/2 е М. Мы получаем требуемое: точка (zi — Z2}/2 / 0 лежит
§4.1) Алгебраические числа: реализации и геометрия 143 в теле X в силу его выпуклости и центральной симметричности, т. е. 2\ -Z2 = Z! 4- (~Z2) 2 2 (если z G X, то и —z € X). Вот примеры выпуклых тел, к которым применяется лемма Мин- ковского. Пусть х° = (х?, .... х° +,2) € К ®Q R, IN(x°)I = П |х?1 П K+iI2 / °- /=1 /=1 Положим 1Г(х°) = {х е К |х;| < |х?|, i = 1, .... г( + г2}- Для положительного числа а положим (J(a) = х е К R £М + 252 Ixr.-b/l < а <=1 /=1 Вычисление объемов этих тел показывает, что уо1(1Г(х0)) = 2Г|лГ2|М(х°)|, vol(t/(a)) =2г'(^у2^. (4.1.9) Применяя к ним и к решетке М = \(Ок) лемму Минковского (при Д = = 2~Г2у/\Вк\ в силу соотношения (4.1.7)) получаем, что а) для произвольных констант с, > 0 (/ = 1, ..., и 4- г2) с условием i=\ j=\ найдется такой ненулевой элемент cte Ок, что |Х/(а)|<С/ (f = 1, ...,/4 4-г2), (4.1.10) для этого надо взять х° G К R с |х?| = Ci (/ = 1, ..., r\ 4- г2) и a G lF(x°); б) для а (nlQ) 2У|О/(|) найдется элементр G Ок, Р/ 0, из мно- жества U(а), т. е. jj|X/(P)| + 2j;|kr)+/(p)|<a, /=1 /=1 откуда в силу неравенства между средним арифметическим и средним гео- метрическим следует оценка (4.1.И)
144 Арифметика алгебраических чисел [Гл. 4 из которой вытекает оценка для дискриминанта \DK \ > f-У'2 — = f^yr2—е2'2-0/(6л) (0 < 0 < 1) 1 Kl V4/ (п!)2 \4/ 2тт показывающая, что \Dr\ растет вместе с п. Приведем другие замечательные следствия леммы Минковского. Теорема 4.8 (теорема Эрмита, 1863 г.). Существует лишь конеч- ное число алгебраических числовых полей с заданным значением дис- криминанта. Теорема 4.9 (теорема Минковского, 1891 г.).Если K/Q, то Рк|>1. Доказательства этих теорем см. в [836]. Из приведенной оценки для дискриминанта следует, что для больших п справедливо неравенство |1/7г > (7,3)Г1/7г(5,8)Г2/7г, но в настоящее вре- мя установлены значительно более сильные оценки для дискриминанта: |> (188)r,/"(41 )Г2/" (при больших л), см. [618], [53], полученные с помощью аналитических свойств дзета-функции Дедекинда и явных фор- мул (см. п. 6.2.3, 6.2.5). 4.1.6. Вывод теоремы о единицах из леммы о выпуклом теле. Рас- смотрим гиперповерхность Тс = {х е К 0 К: |Nx| = с} (для фиксированно- го с > 0), которая переходит при логарифмическом отображении в гипер- плоскость Г г1+г2 V'logc = < У € КГ|+Г2: 52 у‘ = logc р I Z = 1 J Группа единиц Ек действует на Тс посредством умножений на Х(е), е G Ек, которые при логарифмическом отображении переходят в сдвиги на векторы /Х(е), переводящие V^gc в себя. Число орбит этого действия на множестве Тс П Х(С\) конечно для любого фиксированного с. Действительно, доста- точно установить, что если N(ot) = N(0) = с eZ и а = £ (mode) в кольце Ок, то а/£еЕ/(. Для этого заметим, что а делит свою норму N(a) = c, поэтому число а а лежит в Ок', аналогично а/£ G Ок, т. е. а/£ G Ек=О^. Воспользуемся теперь результатом п. 4.1.5 и возьмем какое-нибудь тогда для любого элемента х G Тс найдется такой отличный от нуля эле- мент a G Ок, что Х(а) G №(х). Воспользуемся этим фактом, для того что- бы доказать, что факторгруппа V//X(E/<) компактна, т. е. что множество
§4.2) Разложение простых идеалов,дедекиндовы кольца и нормирования 145 V = Vo полностью покрывается сдвигами некоторого ограниченного мно- жества на векторы вида /Х(е), геЕк. Это свойство достаточно доказать для любой гиперплоскости, параллельной V, например для Viogc, вместо Vo. Для произвольного а € Ок, а 0, рассмотрим множество Ус(а) с Vjogc, состоящее из всех таких у = l(x) е Vjogc, что Х(а) € №(х). Тогда множества Ус(а) ограничены, Ус(ае) = Ус(а) + /Х(е) для е е Ек и из леммы о выпук- лом теле следует, что любой элемент у € V|ogc содержится в каком-либо из множеств Ус(а). С другой стороны, мы уже знаем, что существует лишь ко- нечное число классов элементов а € Ок с нормой |N(oc) | < с относительно ассоциированности, т. е. действия группы Е&. Тогда если {а/} — конечная система представителей этих классов, то искомое ограниченное множе- ство— это, например, объединение |J Ус(а/). Это доказывает утверждение о компактности, а дискретность следует из аналогичного свойства множества Х(Оу<) и того обстоятельства, что на каждой поверхности Тс логарифмическое отображение является сюръективным открытым отоб- ражением на V|ogc. § 4.2. Разложение простых идеалов, дедекиндовы кольца и нормирования 4.2.1. Простые идеалы и однозначность разложения на множите- ли. Первоначальной целью теории идеалов Дедекинда было стремление распространить идеи и результаты Куммера об уравнении Ферма на более общий класс показателей. Пусть R — коммутативное кольцо с единицей. Идеалом а кольца R называется подгруппа ас/? аддитивной группы коль- ца с условием Ra с а. Идеал а называется простым, если из включения ab е а следует, что либо аеа, либо b е а, т. е. факторкольцо R/a не имеет делителей нуля. Идеал вида (а) = Ra для ае R называется главным иде- алом, тогда условие делимости b на а в кольце R эквивалентно включению b € (а). Символом (а/), i е /, обозначается наименьший идеал, содержащий все элементы а/, i € /. Элемент к е R называется простым, если из ра- венства тс = Ьс следует, что либо Ь, либо с — обратимый элемент кольца R. Причина неоднозначности разложения на простые элементы в кольце свя- зана с тем, что простому элементу к не всегда отвечает простой идеал (к). Пример 4.10. Пусть R = тогда имеется два существенно раз- личных разложения на простые элементы: 21 = 3 • 7 = (1 + 2\/-5)(1 - 2\/-5). Проверка показывает, что никакие отношения различных сомножителей не лежат в кольце R. Однако однозначность разложения можно восстановить, если перейти от простых элементов к простым идеалам. Действительно,
146 Арифметика алгебраических чисел [Гл. 4 следующие идеалы являются простыми’. р! = (3, 7=3-1), Рз = (7, 7=5-3), Р2 = (3, 7=5-2), р4 = (7, 7=5 - 4). Это следует из разложений X2 + 5= (X - 1)(Х -2) (mod3), X2 + 5 = (X - 3)(Х - 4) (mod 7), например, /?/Р1 = Z[X]/(3, X - 1, X2 + 5) *£ F3[Х]/(Х - 1) *£ F3, поскольку (X — 1, X2 + 5) = X — 1 в кольце Рз[Х]. Аналогично доказыва- ется, что имеют место разложения (3) = р1р2, (7) = рзр4, (1+27=5) = р1рз, (1 - 27=5) = р2р4, и разложение (21) = Р1Р2Р3Р4 является уже однозначным разложением в произведение простых идеалов, но идеалы (3), (7), (1 + 2\/^5), (1 — 2\/^5) не простые. Дедекиндовым кольцом называется коммутативное ассоциативное кольцо с единицей без делителей нуля, в котором выполнено свойство од- нозначности разложения ненулевых идеалов в произведение простых иде- алов. Эквивалентно требовать, что кольцо R нётерово (т. е. каждый его идеал конечно порождён), целозамкнутое (содержит все целые над R элементы из своего поля частных) и все ненулевые простые идеалы мак- симальны (т. е. /?/р — поле). Можно доказать, что кольцо Z|\A3| из нашего примера дедекиндово. Вообще, из приведенной характеризации дедекиндовых колец следует, что для произвольного числового поля /(, [Д': Q] < оо, кольцо целых чисел О % является дедекиндовым. Отсюда же видно, что никакое собственное под- кольцо таковым уже не является из-за нецелозамкнутости. Например, кольцо Z[\/5] не дедекиндово: идеал (1 - \/5) вообще нельзя разложить в произведение простых идеалов, однако большее кольцо = ОК уже дедекиндово, К = Q(x/5). Таким образом, в этом классе колец можно построить хорошую тео- рию делимости, рассматривая вместо элемента кольца а соответствующий главный идеал (а), а вместо простых элементов — простые идеалы. Од- нако класс дедекиндовых колец весьма узок, хотя хорошую теорию дели- мости можно построить в гораздо более широком классе колец. Например,
§4.2] Разложение простых идеалов,дедекиндовы кольца и нормирования 147 в кольце многочленов k[x\, ..., хп\ над полем k имеет место однозначность разложения на простые элементы (неприводимые многочлены), но неверно свойство существования и единственности разложения идеала в произве- дение простых идеалов. Например, идеал (х2, у) С k[x, у] вообще не имеет такого разложения. Этим, в частности, объясняется недоверие к простым идеалам Дедекинда со стороны Кронекера, который стал развивать другую идею изучения делимости, основанную на теории показателей, которая будет описана ниже (см. п. 4.2.5 и §4.3). Историю спора между сторонни- ками Дедекинда и Кронекера прекрасно описал Г. Вейль [823]. Дробные идеалы. Пусть пока Ок — кольцо целых чисел в поле К, [К : Q] < оо. Назовем дробным идеалом такой ©/(-подмодуль а С К, что аа С О к для некоторого а € К х. Тогда из свойства дедекиндовости выво- дится, что вместе с а будет дробным идеалом и подмодуль а~' = {хеК: хаСОк}. Если а, b—дробные идеалы, то ab С К также дробный идеал. Таким обра- зом, дробные идеалы образуют мультипликативную группу 1к с единичным элементом О к. Из дедекиндовости кольца Ок вытекает, что //< является свободной абелевой группой, базисом которой служат ненулевые простые идеалы р С ©/<: каждый идеал а € //< однозначно записывается в виде а = Р?...р^ (M/eZ). Нормой простого идеала р называется число элементов конечного поля ©к/р : Np = |©/</р|, а норма произвольного элемента а € //< определяется по мультипликативности. Если а = (а) — главный идеал, то N(a) = |Noc| = = |N/</qoc|: умножение на а является эндоморфизмом решётки ©к, и можно проверить, что абсолютная величина его определителя совпадает с индек- сом его образа: (©/< : (a)) = N((a)). 4.2.2. Конечность числа классов. Каждому элементу а€Кх мож- но однозначно сопоставить идеал (а)е//<, и мы получим гомоморфизм Кх //(. Образ этого гомоморфизма называется группой главных иде- алов и обозначается Рк- Факторгруппа С1к = 1к/Рк называется группой классов идеалов. Следующий результат — это ещё одно следствие леммы Минковского. Теорема-определение 4.11. Группа (31% конечна, а её порядок \С1К\ = hx называется числом классов идеалов поля К, см. [14] [230]. Действительно, если некоторый класс идеалов представлен элементом а^1к, тогда можно считать, что a С ©к (при необходимости можно за- менить а на Ма, где М — натуральное число, и избавиться от всех зна- менателей). Согласно лемме Минковского (см. п. 4.1.5), найдётся такой (2 \ г2 у- y|D/<|Na. Поскольку
148 Арифметика алгебраических чисел [Гл. 4 а — идеал, мы имеем С а, или Ок с а-1 а. Теперь видно, что индекс (а-1а: Ок) = (Ок : аа-1) ограничен сверху константой (?) так как _____ (OK-.aa-') = \N(a)\Na-1 <(±) Ут Если а' — произвольный дробный идеал, содержащий Ок, и (а': Ок) = г, то г~[Ок За' D Ок- Но ясно, что число промежуточных дробных идеа- лов а' между Ок и г~*Ок конечно. Отсюда следует теорема, поскольку индекс г принимает лишь конечное число значений. Позже мы увидим, что эта теорема и теорема о единицах не только име- ют схожие доказательства (использующие лемму Минковского), но и яв- ляются частями общего результата о строении группы иделей числового поля (см. [230], [836]). Число классов играет исключительно важную роль в теории чисел. На- пример, условие 1гк = 1 равносильно тому, что в кольце Ок разложение на простые элементы однозначно. Другой пример: теорема Куммера из п. 4.1.1 о первом случае теоремы Ферма справедлива и для таких простых показателей п, что Ьк не делится на п, где К = О(ехр{2ш/п}) — круговое поле. Возможность получить формулы для числа классов Iik связана с дзе- та-функцией Дедекинда (см. соотношения (6.2.20)—(6.2.25)). На протяжении многих лет был сделан целый ряд эксперименталь- ных и эмпирических наблюдений насчет группы классов числовых полей. А. Коэн и X. В.Ленстра младший предложили в [251] один эвристиче- ский принцип, который успешно предсказывает статистическое распре- деление группы классов идеалов мнимых квадратичных числовых полей, а также вполне вещественных абелевых числовых полей. Из гипотезы Ко- эна—Ленстры следует много численно проверенных фактов, см., например, [517], где также обсуждается связь с теоремой Леопольдта о зеркальном отражении (Spiegelungssatz); см. [527]. 4.2.3. Разложение простых идеалов в расширениях. Если К — чис- ловое поле с кольцом целых Ок и р — простое число, то главный идеал (р) = рОк разлагается в произведение простых идеалов: (p) = p*'p*’...ps4 (4.2.1) Вид разложения (4.2.1) для простых чисел р является важнейшей ха- рактеристикой поля К\ если, скажем, K/Q — расширение Галуа, то поле К однозначно определяется по множеству таких р, что (р) = Р1Р2 •••₽«» п = [/( : Q] (произведение п различных простых идеалов). Эти простые числа называются вполне распадающимися в К. В общем случае зада- ча определения вида разложения (4.2.1) для всех р является очень труд- ной и связана с наиболее глубокими проблемами алгебраической теории
§4.2] Разложение простых идеалов,дедекиндовы кольца и нормирования 149 чисел («некоммутативная теория полей классов», см. ниже §6.4). Одна- ко для абелевых расширений К D Q, т. е. расширений Галуа с коммута- тивной группой G(K/Q), такое разложение известно; оно зависит от кон- грунэнц-условий на р, т. е. только от вычета числа р по модулю некоторо- го натурального числа, связанного с данным полем. Дадим явное описание разложения простых идеалов для круговых полей К = Q( л/Т) и квадра- тичных полей К = Q(V/d). Это можно сделать с помощью очень общего приема, применимого к расширению R С S двух коммутативных целостных колец, причем предполагается, что S — конечно порожденный /?-модуль. В этом случае каждый элемент а € S является корнем унитарного мно- гочлена f(X)eR[X] (со старшим коэффициентом, равным 1). Например, можно взять ftX) = MX) = r, + an_1r,-| + ... + ...a0, а, € R (характеристический многочлен). Пусть р— максимальный идеал в R. Че- рез а обозначим образ элемента а в факторкольце S/pS. Теорема 4.12 (теорема о разложении максимального идеала). Предположим, что для некоторого элемента cteS справедливо ра- венство S/pS = (/?/р)[а] и п = deg /а(Х) = dim/?/p S/pS. Выберем такие унитарные многочлены g\ (X), ..., gr(X) е /?[Х], что Ш = gi ёг№ег (modp/?[X]) (4.2.2) и gi(X) (modp/?[X]) различны и неприводимы в кольце (/?/р)[Х]. Тогда идеалы ф/ = (р, £/(а)) максимальные и справедливо разложение pS = ^f’ ...^. (4.2.3) Доказательство утверждения о максимальности идеалов ф/ следует из изоморфизма S ~ RW ~ (R/P)[X] Ъ £i(X),P giW и неприводимости многочленов gi(X) (modp/?[X]), а разложение (4.2.3) — из аналога теоремы о тензорном произведении (см. п. 4.1.2) -3.5^ (/?/р) = Ц— при d = 2, 3 (mod 4), Пример 4.12 а. Квадратичные расширения К = Q(Vd) (d € Z свобод- но от квадратов), О % = Z[g>], где Q = /o(X)=X2-d W = ^_L, мх) = х*-х-^- при d = 1 (mod4).
150 Арифметика алгебраических чисел [Гл. 4 Результат о разложении простых чисел в К удобно формулируется в терминах квадратичного характера у# поля /С По определению /к — единственный примитивный характер Дирихле порядка 2 по мо- дулю \Dk\ с условием хк(-1) = sgnD/(, где Dk —дискриминант поля Dk = 4d или d при d = 2, 3 (mod 4) или d = 1 (mod 4) соответственно. Этому условию удовлетворяет характер (см. [14], гл. 2) (idl)’ если d = 1 (mod 4), X*W = < (_ i и*-n/2 ( (_ l)(x2-l)/8+(x-l)(d'-1)/4 если d = 3 (mod 4), если d — 2d\ df = 1 (mod 2) Тогда разложение простых чисел р в Ок имеет вид {РР\ р^р' и Np = Np' = p прихк(р) = 1, р, Np = р2 (т. е. р остается простым) при Хк(р) = -1, р2, Np = p при хк(р) = 0. Для доказательства надо применить теорему с R = Z, S = Ок, а = о и посмотреть на разложение квадратичного многочлена f^(X) (mod р), ко- торый либо имеет два различных корня, либо неприводим, либо имеет крат- ный корень над в указанных трех случаях, в зависимости от равенств /И/7) = 1» Хх(Р) = или Хк(Р) = 0- Этот результат можно переписать в виде тождества (ср. с. п. 6.2.3) П(1 - Np-S) = (1 - P"s)(l - xK(p)p~s) (sec). (4.2.4) р|(р) Пример 4.13 б. Круговое поле К = Кт = Q(Cm). Воспользуемся тем обстоятельством, что Ок = Z[£m], и рассмотрим расширение Z[Cn] М причем в качестве /а(Х) возьмем Фт(Х) (п. 4.1.2). Доказательство совпа- дения Ок с Z[£m] довольно тонкое, хотя и элементарное: оно использует вычисление дискриминанта кольца R — Z[£m], равного /тт ’ \Р\т ) см. [14]. 4.2.4. Разложение простых идеалов в циклотомических полях. Теорема 4.15. 1. Пусть р\т, тогда р/? = pi •... • pr, Np,- = pf,
§4.2] Разложение простых идеалов,дедекиндовы кольца и нормирования 151 где pz С R — различные простые идеалы, причем число f равно по- рядку элемента р (modm) в (Z/mZ)x и f • г = <р(т). 2. Если т= р*' -... - p*s, то />,/? = (₽!^ = р!', где <р(р“') = - 1), а число f равно порядку элемента pi (тоАтр^1) в №1тр~*1Т}* и f'rf = <p(mp“a'). Доказательство. Отметим прежде всего, что для простых иде- алов р с Ок число f = logp Np совпадает со степенью расширения конеч- ных полей [Ок/р: Z/pZ], а также с порядком автоморфизма Фробениу- са х »—> хр, порождающего циклическую группу порядка f — группу Галуа G((<9/</p)/(Z/pZ)). Применив далее теорему о разложении, мы видим, что достаточно установить вид разложения многочлена Фт (X) (mod р) в коль- це FP[X] на неприводимые многочлены. Из этой теоремы вытекает, что вид разложения идеала (р) на про- стые идеалы зависит только от значения р (modm). В частности, идеал (р) вполне распадается в ОКт <=> р = 1 (modm). Полезное наблюдение состоит в том, что разложение идеала (р) в Окт определяется действием элемента Фробениуса Frp в кольце Окт/(р), причем в случае р] т этот элемент может рассматриваться как элемент группы Галуа'. (Frp: - р (mod т) е (Z/mZ)x = G(^/Q). Для дальнейших приложений полезно переформулировать результат теоремы 4.15 с помощью характеров Дирихле /: (Z/mZ)x -*СХ. Кон- дуктором характера / называется наименьшее такое натуральное чис- ло т(х), что гомоморфизм / можно определить по модулю т(/), т. е. про- пустить х через естественную проекцию: (Z/mZ)x Д (Z//n(x)Z)x Д Сх. Соответствующий характер /о (modm(/)) называется примитивным ха- рактером Дирихле, ассоциированным с /. Тогда теорема 4.15 равносильна тождеству (см. п. 6.2.3) f[(l-Np-s)= П (l-xo(p)p"s) (see). (4.2.5) р|р x(modm) Действительно, из теоремы вытекает, что левая часть имеет вид (1 — p~^s)r при р\т и (1 - p~f'sY' при р | т, где f — порядок р (modm) в (Z/mZ)x (соответственно /'— порядок остатка р (modm') в (Z/m'Z)x, где т' = mp“ordp(m)). Остается проверить, что при р\т справедливо тож-
152 Арифметика алгебраических чисел [Гл. 4 дество (1-ГУ = П (1-х(р)7). (4.2.6) X (mod т) Пусть [1/ — группа корней степени f из 1, тогда \-Т<= П(!-С7). Если учесть, что для любого £ € р; существует ровно г таких характеров X (modm), что /(р) = С то отсюда вытекают (4.2.6) и (4.2.5) [14], [495], [720]. 4.2.5. Простые идеалы, показатели и нормирования. Альтернатив- ный подход к теории делимости возник из анализа понятия тс-показателя ordK а элемента а / 0, a G R для простого элемента к из кольца R с од- нозначным разложением на множители: ordK а — это наибольшая степень элемента тс, делящая а в /?, и имеет место разложение а = ... nkrr, где ki = ordK/ а, е G Rx —обратимый элемент из R. Функция ordK однозначно продолжается на поле частных К коль- ца R до гомоморфизма ordK: /<х —> Z, так что выполнены следующие свой- ства: 1) ordK(afe) = ordK а + ordn b Ча, b e К x, 2) ordK(a + b) min(ordKa, ordK6) Va, b e K\ 3) а делит b в R <=> ordK a ordR b Vit', 4) izR = {a e R: ordK a > 0} простой идеал в /?, 5) /? = {x e /<х : ordKx OVk} U {0}. Обобщая, можно для произвольного поля К ввести понятие показате- ля v как функции v\ Кх —*Z, удовлетворяющей условиям: 1) v(ab) = v(a) + v(b) Ча, b G /< x, 2) v(a + b) min(v(a), v(b)) 4a, b eKx. Чаще вместо v используется нормирование |x|p,u: для фиксированного р, 0 < р < 1, положим |х |рд> = ри(х), |0|р,у = 0. Определение 4.16. Нормированием | • | поля К называется такая фун- кция х и-► |х| с неотрицательными значениями, что 1) \ab\ = \a\-\b\4a,beKx, 2) \a + b\^\a\ + \b\4a,beK\ 3) |х| =0 х = 0. Нормирование называется неархимедовым, если вместо условия 2) вы- полнено более сильное: 2') \а + b\ max(|a|, \Ь\)Ча,ЬеКх. Так, функция | • |р,у является неархимедовым нормированием по опре- делению. Нормирование вида |х| = |х|рл, называется дискретным. Приме-
§ 4.2] Разложение простых идеалов,дедекиндовы кольца и нормирования 153 ром такого нормирования является р-адическое нормирование \а/Ь\р = = pwdpb-ordpa 2) поля Q. Обычная абсолютная величина |х| числа х е Q задает (архимедово) нормирование Q. Если | • | — неархимедово нормирование поля К, то подмножество О — = {х е К: |х| 1} является кольцом с единственным максимальным идеа- лом р = {х € О: |х| < 1}, которое называется кольцом нормирования. Для дискретного нормирования | • | = | • |р,и показателя v используется обозна- чение /?(У) = О, р(У) = р, причем р(У) — главный идеал, порожденный любым таким элементом к € К, что и (тс) = 1, т. е. u(n) = 1. Теперь теорию делимости на целостном кольце R с полем част- ных К можно строить с помощью семейства показателей = М» если выполнены следующие условия: 1) а делит b в R о v(a) v(b) Vv € а; 2) для всех аеК* выполняется равенство v(a) = 0 для почти всех v еЕ (т. е. кроме конечного их числа); 3) множество R(V) = {х € К : и(х) 0} U {0} определяет v однозначно; 4) /?= П *(»)• Если такое семейство Е существует, то определена группа дивизоров Т> = Т>ъ как свободная абелева группа с базисом Е, элементы которой записываются аддитивно как ^kivi или мультипликативно как П₽*Ь и определен гомоморфизм 1 1 div: К х -> Р, div(x) = [J p“w. v es Класс колец с теорией делимости существенно шире класса деде- киндовых колец и допускает чисто алгебраическую характеризацию. При этом для построения показателей используется лишь часть ненулевых про- стых идеалов кольца. Если попытаться для простого идеала р С R опре- делить показатель v, положив v(a) = min{tt 0: а е р"} для а € /?, то это удастся лишь тогда, когда локализация /?р (относительно р) кольца R явля- ется нётеровым целозамкнутым кольцом с единственным ненулевым про- стым идеалом, где /?р = {х = £:а, beR, 6£р}. Идея использования нормирований вместо простых идеалов, возник- шая при изучении алгебраических чисел, оказалась весьма плодотворной в алгебраической геометрии, развитие которой, в свою очередь, привело к ряду открытий в самой теории чисел (см. ниже гл. 5 и 6). В заключение этого параграфа отметим, что все нормирования поля Q имеют вид либо |х|а (0 < а < 1), где |х| — обычная абсолютная величина
154 Арифметика алгебраических чисел [Гл. 4 числа xeQ, либо |х|* (а>0), где |х|р— р-адическое нормирование числа х е Q {теорема Островского, (см. [14], [230])). § 4.3. Локальные и глобальные методы 4.3.1. р-адические числа. Идея расширения поля Q в теории чисел встречается в различных вариантах. Например, вложение Q С R часто да- ет полезные необходимые условия существования решений диофантовых уравнений над Q и над Z. Важное свойство поля R — его полнота: любая фундаментальная последовательность {ocrt}rt=i в R имеет предел а (фун- даментальность означает, что для произвольного е > 0 малы абсолютные величины |ал - ат| < е для всех п, т, больших некоторого натурального числа N = N{z)). Кроме того, все элементы R являются пределами фунда- ментальных последовательностей {ая}^, ал € Q. Аналогичная конструкция существует и для всех р-адических норми- рований | • |р поля Q (см. §4.2): I * |р • Q = {х € R |х 0} \а/Ь\р = р^ь~^а, |0|р=0, и приводит к полю р-адических чисел Qp dQ. Эта общая конструкция «присоединения пределов фундаментальных последовательностей» отно- сительно некоторого нормирования | • | поля k называется пополнением. В результате получается поле k с нормированием, также обозначаемом | • |, причем поле k полное, a k однозначно вкладывается в k в виде всюду плотного подполя с сохранением нормирования, см. [14], [463]. Как отмечено в конце §4.2, все нормирования поля Q сводятся ли- бо к абсолютной величине, либо к | • |р, поэтому все пополнения поля Q— это либо поле действительных чисел, либо поля р-адических чисел Qp. Использование всевозможных вложений Q С Qp (р — простое число) и Q С R часто значительно упрощает ситуацию в арифметических зада- чах. Замечательный пример дает теорема Минковского—Хассе, см. [14], [222], [230]. Уравнение Q(xi, х2, ..., хл) = 0, (4.3.1) заданное квадратичной формой Q(xi, х2, ..., хл) = 'LaijXiXj, а1} € Q, имеет нетривиальное решение в рациональных числах в том и только в том слу- чае, когда оно нетривиально разрешимо над R и над Qp для всех простых чисел р. Для нахождения решений уравнений над Qp можно эффективно применять приемы, взятые по аналогии из анализа над R, такие как «ме- тод касательных Ньютона» {лемма Гензеля, см. п. 4.3.2). Наиболее
§4.3] Локальные и глобальные методы 155 простым способом можно ввести р-адические числа как выражения вида а = атрт+ am+ipm+l + ..., (4.3.2) где ai е {0, 1, ...» р - 1} — цифры (по основанию р), а т € Z. Удобно за- писывать а в виде последовательности цифр, бесконечной влево: {т— 1 нулей ... 1 ат ООО... 00(Р), если т О, ,..а\а^а_\ -..ат(Р), если т < 0. Эти выражения образуют поле, в котором операции выполняются так же, как для натуральных чисел п = + а\р + ... + агрг, записанных по ос- нованию р. Следовательно, в этом поле лежат натуральные, а потому и все рациональные числа. Например, -1 = (р - 1) + (р - 1)р + (р - 1)р2 + ... = ...(р - 1)(р - 1)(Р); = а0 + аор + а0р2 + ... = ...аоаоао(Р). Если п € N, то выражение для — п = (— 1) • п вида (4.3.2) получается, если перемножить указанные выражения для —1 и для п. Вообще, если а € Q, то запишем а = с - где а, с € Z, b е N, 0 а < Ь, т. е. а/Ь — правиль- ная дробь. Тогда по элементарной теореме Эйлера р^ — 1 =bu, u € N, поэтому а _ аи ~b~ 1 - рф(^) ’ причем аи < bu = рг — 1, г = <р(6). Теперь мы видим, что запись по основа- нию р числа аи имеет вид аг-\ -..а^, следовательно, выражение (4.3.2) а _ для числа а = с — - получается как сумма выражения для с е Z и а -- = ...а^аг-\ ...а^аг-\ • г цифр Г цифр Например, для р = 5 имеем 9 о 5 о . 5-2232 о - , 7 _=2--=2 + -;—с = 2, а = 5, Ь = 7, причем 2235 = 32412(5) = 3 • 54 + 2 • 53 + 4 • 52 + 1 • 5 + 2, поэтому у = ...324120324120324122(5).
156 Арифметика алгебраических чисел [Гл. 4 Нетрудно проверить, что пополнение поля Q относительно р-адической метрики | • \р отождествляется с полем «р-адических разложений» вида (4.3.2). При этом |ос|р = р-т, где в выражении (4.3.2) ат ^0 (см. [462]). Любопытно сравнить разложения (4.3.2), «бесконечные влево», с раз- ложениями действительных чисел а € К, «бесконечными вправо»: a = amam-i ...ао, a_j... = am10m 4- am_j 10m-1 + ... + ао 4- a\ 10-1 4-..., где di € {0, 1, ..., 9} — цифры, am / 0. Разложения такого типа по любому натуральному основанию приводят к одному и тому же полю R; при этом они неоднозначны, к примеру, 2,000... = 1,999... Разложения (4.3.2) все- гда однозначно определены, что создает дополнительные вычислительные удобства. Поле является полным метрическим пространством с тополо- гией, определенной системой «открытых дисков» вида Ua(r) = {х: |х - а\ < г} (х, a € Qp, г > 0) (или «замкнутых дисков» Da(r){x: |х - а\ < г}). При этом и t/a(r), Da(r) являются открыто-замкнутыми множествами с топологической точки зре- ния. Важное топологическое свойство поля Qp — его локальная компак- тность: все диски конечного радиуса компактны. В этом проще всего убедиться на языке последовательностей, показав, что каждая последова- тельность элементов диска Da(r) имеет в этом же диске предель- ную точку. Эта предельная точка легко ищется с помощью р-адических цифр (4.3.2) последовательно, справа налево, и используется тот факт, что у всех элементов число знаков «после запятой» ограничено фиксиро- ванным числом. В частности, диск = £>о(1) = U: |х|р 1} = {х = а0 + ахр + а2р2 4-...} — компактное топологическое кольцо, элементы которого называются це- лыми р-адическими числами, при этом Zp совпадает с замыканием мно- жества обычных целых чисел Z в Qp. Кольцо Zp является локальным, т. е. имеет единственный максимальный идеал pZp = 1) с полем выче- тов Zp/pZp = Fp. Множество обратимых элементов единиц кольца Zp — это Z* =Zp\pZp = {х: |х|р = 1} = {x = a0 + aip + а2р2 + ...: а0 ^0}. Для каждого элемента х € Zp определен его представитель Тейхмюлле- ра о(х) = lim хр (предел всегда существует и удовлетворяет уравнению п—>оо <о(х)р = о(х), и справедливо сравнение х = о(х) (mod р)). Например, для
§4.3] Локальные и глобальные методы 157 р = 5 имеем о(1) = 1; <о(2) = 2 + 1 • 5 + 2 • 52 + 1 • 53 + 3 • 54 + ...; о(3) = 3 + 3 • 5 + 2 • 52 + 3 • 53 + 1 • 54 + ...; о(4) = 4 + 4 - 5 + 4 - 52 + 4 - 53 + 4 - 54 + ... = -1; w(5) = 0. Кольцо Zp можно описать еще как проективный предел колец Ап = Z/pnZ относительно гомоморфизмов редукции <рп: Ап —> Ап~\ по мо- дулю рп~х. Последовательность (4.3.3) образует проективную систему, занумерованную целыми числами п 1. Проективный предел системы (4.3.3) — это кольцо limA« со следующим п универсальным свойством: однозначно определены такие гомоморфизмы проекции пл: Пт —► Ап, что для произвольного кольца В и системы го- п моморфизмов фл: В —> Ап, согласованных друг с другом условием фл—1 = = ° фл при п 2, существует единственный гомоморфизм ф: В А, для которого фл = Т1п ° ф , см. [462], [720]. Для кольца Zp построение гомомор- физмов проекции Т1п: Zp —> Ап и проверка универсального свойства выте- кают из записи его элементов с помощью «цифр» (4.3.2). Аналогично Z* =lnn(Z/p'IZ)x ' п (проективный предел групп). Для описания группы Z* положим v = 1, если р > 2, и v = 2, если р = 2, и определим и = Up = {х € Z* : х = 1 (mod pv)} = £>, (p"v). Тогда U = Zp (изоморфизм мультипликативной и аддитивной групп). Для построения этого изоморфизма заметим, что U U/Up\ п и определим изоморфизмы конечных групп арп: и/ирП ^Z/pnZ, (4.3.4) положив ((1 + Pv)fl) = a (mod рп) (а е Z). Простая проверка показывает, что отображения (4.3.4) корректно опреде-
158 Арифметика алгебраических чисел [Гл. 4 лены и являются изоморфизмами. Таким образом, группа U — это тополо- гическая циклическая группа, в качестве образующей которой можно взять 1 + pv. Другое доказательство следует из свойств функции, определенной оо степенным рядом log( 1 + х) = (— \)пЛЛхп/п которая задает изоморфизм из U на pZp. Л=1 Справедливы разложения Q* = рг X Z£, Z* = (Z/pvZ)x X и. (4.3.5) 4.3.2. Приложения р-адических чисел к решению сравнений. Воз- никновение р-адических чисел в работах Гензеля было тесно связано с проблемой решения сравнений по модулю рп, а применение их к тео- рии квадратичных форм его учеником Хассе привело к элегантной фор- мулировке теории квадратичных форм над рациональными числами, не использующей рассмотрений в кольцах вычетов вида Z/рп%, работать с которыми утомительно из-за наличия делителей нуля. Из представле- ния кольца Zp в виде проективного предела Zp = limZ/p^Z вытекает, что ' п если /(xi, ..., хп) € Zpjxi, ..., хп], то сравнения /(xi, ..., хп) = 0 (mod рп) разрешимы при любом п 1 тогда и только тогда, когда уравнение /(xi, ..., хп) = 0 разрешимо в целых р-адических числах. Эти решения можно находить с помощью р-адического варианта метода касательных Ньютона. Теорема4.17 (лемма Гензеля). Пусть f(x)eZp[x]—многочлен од- ной переменной х, /'(х) € %р[х] — его формальная производная и для некоторого ао € Zp выполнено начальное условие |Дао)///(ао)2|р<1. (4.3.6) Тогда существует единственное такое а € Zp, что /(а) = 0, |а - а0|р < 1. Доказательство проводится с помощью рассмотрения последователь- ности " /'(«п-1) и ее предела а с учетом формального разложения Тейлора многочлена /(х) вточкех = ал_1 (см. [225], [14], [720]). Например, если /(х) = хр~х - 1, то любое ао е {1, 2, ..., р - 1} удо- влетворяет условию |/(ао)|р < 1, в то время как /'(ао) = (р - l)aQ-2 0 (mod р), поэтому начальное условие (4.3.6) выполнено. Корень а сов- падает при этом с единственным представителем Тейхмюллера числа
§4.3] Локальные и глобальные методы 159 а0 : а = <о(ао). Описанный метод применим и к многочленам многих пе- ременных, но уже без сохранения единственности находимого решения, см. [14], [463], а также [462], [720]. Еще одно приложение леммы Гензеля связано с описанием квадратов поля для произвольного элемента а = ртс € Q* (m € Z, v € Z*), свойство быть квадратом в равносильно тому, что а) если р > 2, то т € 2Z и v = v (mod р) е ((Z/pZ)x)2 (т. е. = 1, где (--0 —символ Лежандра (см. п. 1.1.5)); б) если р = 2, то т € 2Z и v = 1 (mod 8). Разрешимость уравнения х2 = а в Qp в условиях а) и б) выводится из леммы Гензеля, а необходимость их вытекает из более тривиальных рассмотрений по модулю р и по модулю 8. Как следствие мы получаем, что факторгруппа а) при р >2 изоморфна Z/2Z х Z/2Z с системой представителей {1, р, V, vp}, (^) = -1; б) при р = 2 изоморфна Z/2Z х Z/2Z х Z/2Z с системой представи- телей {±1, ±5, ±2, ±10}. 4.3.3. Символ Гильберта. В этом пункте мы допускаем значение р = оо и считаем тогда, что Qoo = IR. Символ Гильберта (символ норменного вычета) / fa'b\ fa,b\ . (а, Ь)=[ ) = [ —) =(а, Ь)р \ р / Р ' для а, b е Q* определяется равенством {1, если форма ах2 + by2 — z2 имеет нетривиальное решение в — 1 в противном случае. Ясно, что (а, Ь) зависит только от а, Ь по модулю квадратов. Существует несимметричная форма этого определения. Именно, (a, b) = 1 тогда и толь- ко тогда, когда а = z2 — by2 для некоторых у, z е Q₽. (4.3.7) Действительно, из соотношения (4.3.7) следует, что (1, у, z) — нетривиаль- ный нуль квадратичной формы ax2 + bx2-z2. Наоборот, если (хо, z/o, ^о) — некоторый нетривиальный нуль, то остальные нули получаются с помощью
160 Арифметика алгебраических чисел [Гл. 4 геометрического приема проведения секущих через точку (хо, //о» <^о) с на- правляющим вектором, имеющим координаты из Qp (см. п. 1.2.3). Поэтому можно считать, что xq 0, тогда у = роДо, z = Zq/xo удовлетворяют со- отношению (4.3.7) Локальные свойства символа Гильберта'. а) (а, Ь) = (Ь, а); (4.3.8) б) (aiа2, Ь) = («I, Ь)(а2у Ь), (а, bib2) = (a, b])(a, Ь2); (4.3.9) в) если (а, b) = 1 для всех Ь, то а € (Qp)2; (4.3.10) г) (а, -а) = 1 для всех а; (4.3.11) д) если р 2, оо и |а|р = \Ь\Р = 1, то (а, b) = 1. (4.3.12) В частности, при фиксированном b все ау для которых (a, b) = 1 об- разуют группу по умножению. Уравнение (4.3.7) выражает тот факт, что а является нормой из квадратичного расширения Qp(Vb)/Qp (см. [14], [222], [230], [720]). Вычисление символа Гильберта позволяет полностью решить «гло- бальный» вопрос о представлении нуля рациональными квадратичными формами (с помощью теоремы Минковского—Хассе). Если, скажем, Q(x, у, z) = ах2 + by2 + cz2 (a, b, с € Q, с / 0), (4.3.13) то форма (4.3.13) представляет нуль над полем Q <=> для всех р (включая р = оо) выполняется равенство (-a/c, -b/c)p = 1. Этот критерий являет- ся весьма эффективным, так как \а\р = \b\p = 1 для почти всех р, причем в этом случае (a, b)p = 1, если р /= 2, оо, согласно свойству (4.3.12). Вы- пишем теперь таблицу для (а, Ь)р\ Таблица 4.1 Символ Гильберта для р > 2. Здесь и обозначает такое число v Е Z, что = — 1, а е = 1, если —1 Е (Qp )2 (т. е. если р = 1 (mod 4)), и е = — 1 в противном случае ь а 1 V Р ри 1 4-1 4-1 4-1 4-1 V 4-1 4-1 -1 -1 Р 4-1 -1 е -е ри 4-1 -1 —е е Глобальное свойство символа Гильберта (формула произведения). Пусть a, b е Qx. Тогда (a, b)p = 1 для почти всех р и П (а, 6)р = 1. (4.3.14) р (включая р=оо)
§4.3| Локальные и глобальные методы 161 Формула (4.3.14) равносильна квадратичному закону взаимности (см. п. 1.1.5). Действительно, по свойству (4.3.12) имеем |а|₽ — \b\p = 1 для почти всех р, и в этом случае (a, b)p = 1, если р 2, оо. Обозначим левую часть равенства (4.3.14) через /(а, Ь). По свойствам (4.3.9) имеем f(a(a2, b) = f(ai, b)f(a2, b), f{a, bib2) = f(a, bi)f(a, b2), и можно проверить, что f(a, b) = 1, когда а и b пробегают множество об- разующих группы Qx: —1,2, q — нечетное простое число. Таблица 4.2 Символ Гильберта в случае р = 2 ь а 1 5 -1 -5 2 10 —2 -10 1 4-1 4-1 4-1 4-1 4-1 4-1 4-1 4-1 5 4-1 4-1 4-1 4-1 -1 -1 -1 -1 -1 4-1 4-1 -1 -1 4-1 4-1 -1 -1 -5 4-1 4-1 -1 -1 -1 -1 4-1 4-1 2 4-1 -1 4-1 -1 4-1 -1 4-1 -1 10 4-1 -1 4-1 -1 -1 4-1 -1 4-1 —2 4-1 -1 -1 4-1 4-1 -1 -1 4-1 -10 4-1 -1 -1 4-1 -1 4-1 4-1 -1 В дальнейшем нам понадобится также следующее глобальное свойство нормирований | • |р и | • |оо, аналогичное формуле (4.3.14). Формула произведения для нормирований. Пусть aeQx, тогда |а|р = 1 для почти всех простых чисел р и П Ир = 1- (4.3.15) р (включая р=оо) Действительно, если а € Qx, то а = ± П pVp(a\ р^оо где vp(a) е Z и vp(a) = 0 для почти всех р. Тогда |a|p = p~Vp{a} при оо и |a|oo = pVp{a}. Р^Ж Более подробно глобальные свойства нормирований рассматриваются в п. 4.3.6. 4.3.4. Алгебраические расширения поля и поля Тэйта. Пусть К/Qp — конечное расширение. Тогда К порождается над примитивным
162 Арифметика алгебраических чисел [Гл. 4 элементом а е К, причем а — корень многочлена f(x) = xd + ad-iXd~l + ... + а0 € Qp[x] степени d = [/< : Qp]. Нормирование | • \р поля Qp допускает единственное продолжение на К, определенное формулой l₽lp=(/|NW(₽)|p, (4.3.16) где Nk/qp(0) — алгебраическая норма элемента (3 € К. Эта формула одно- значно определяет нормирование | • |р на алгебраическом замыкании Qp поля Единственность продолжения несложно выводится из локаль- ной компактности поля как конечномерного векторного пространства над Qp: все нормы поля К над Qp эквивалентны (как и для пространства R"), а из мультипликативности следует, что они просто совпадают. Од- нако проверка неравенства \а -h b\p < тах(|а|р, |6|р) для а,Ь^К менее тривиальна (см. [230], [836]). На Q^ определена функция ordp р = - logp |р|р, согласованная с опре- делением ordp на Qp. При этом ordp(/<x) — аддитивная подгруппа в jZ (согласно соотношению (4.3.16)), поэтому ordp/e = -Z, р е где е — натуральный делитель числа d, называемый индексом ветвления расширения K/typ. Положим Ок = {х е К: \х\р 1}, рк = {х е К: \х\р < 1}, (4.3.17) тогда рк — максимальный идеал в Ок и поле вычетов Ок/рк являет- ся конечным расширением простого поля Fp степени f (степень инер- ции), причем выполнено равенство d = е • f. Для каждого элемента х е Ок определен его представитель Тейхмюллера G)(x) = lim xpf\ о(х) = х (rnodpx), (4.3.18) п—*оо удовлетворяющий уравнению ^(x)pf = о(х). Отображение со задает гомо- морфизм группы обратимых элементов О*=Ок\рк = {хеОК'. Ир = 1} кольца Ок на группу корней степени pt — 1 из 1 в К, обозначаемую [1р/_н а также изоморфизм Ырк)* со;. (4.3.19)
§4.3] Локальные и глобальные методы 163 Строение мультипликативной группы Кх описывается аналогично раз- ложениям (4.3.5): если [Д' : Qp] = dy то /e=irzxO*, Окх“№)хх1/к, (4.3.20) где тс — образующая главного идеала рк (произвольный элемент тсе/Сх с условием ordp тс = 1/е), (/к={хе^: |х-1|р<1} = О1(Г;/0. Эта группа несложно описывается как прямое произведение d экземпля- ров аддитивной группы и конечной группы, состоящей из корней из 1 р-примарной степени, содержащихся в /(. Пример 4.18. Если е= 1, то расширение K/Qp называется нераз- ветвленным. В этом случае f = d и представители Тейхмюллера порож- дают расширение К над Q₽, поэтому К = Qp(v/T), где N = pd — 1. Если e = d, то расширение K/typ называется вполне разветвленным. К примеру, если £— примитивный корень степени рп из 1, то Qp(C)/Qp вполне разветвлено степени d = рп — рп~{ =у(рп\ причем (ср. с п. 4.2.4) = (4.3.21) Поле Тэйта. Для р-адических чисел существует развитая теория ана- литических функций, в которой роль поля комплексных чисел играет поле Ср = Q₽, определяемое как пополнение поля Qp по его единственному нормированию с условием \р\р = р-1. Оказывается, что поле Ср алгеб- раически замкнуто. Положим G) р - {х Е Ср: |х|р 1}, р = {х с Ср: |х|р < 1}. Тогда Ор и р уже не компактны и поле Ср не локально компактно. Кроме того, (9р/р = ₽р. 4.3.5. Нормализованные нормирования. Если F — произвольное локально компактное поле, то можно утверждать, что его топология зада- ется некоторым нормированием. Этот факт выводится из существования на каждой локально компактной топологической группе G меры Ха- ара d{i, т. е. меры, инвариантной относительно групповых сдвигов х gx (х, g е G): /(x)dp(x) = f(x)d[i(gx) = f(g~l x)d[i(x) G G G для всех интегрируемых функций f: G —> R. Такая мера определена од- нозначно с точностью до положительной константы. Общая конструкция меры d[i нам не понадобится (см. [822]), и мы укажем лишь конкретные ее примеры.
164 Арифметика алгебраических чисел [Гл. 4 Если G = R (аддитивная группа), то d\i = dx (мера Лебега) и d(x4-a) = = dx, а ей. А если G = Rx — мультипликативная группа, то d\i = dx/x. Если G = С, z = х + iy € С, то d\i = dx dy. Если K/Qp — расширение степени d и q = pi —число элементов поля вычетов то мера d[x аддитивной группы однозначно определяется числом d\i = ц(О/() = с > 0; при этом [i(a 4- рк) = cq~x, так как все множества а 4- рк (а е ) имеют одинаковую меру Ок = U (а 4- рк). a (mod рк) Вообще, для п е Z и а е К имеем V(a + pnK) = cq-n. (4.3.22) Всякая мера d[i на аддитивной группе локально компактного поля F определяет нормирование || • ||: F —дляаЕ Fx число ||ос|| есть мно- житель, на который отличаются две меры Хаара d[i(x) и d[i(ax) на F: p(atO = l|a|m (4-3.23) где U — некоторое открытое множество положительной меры p(L/) = §<Mx). и Свойство мультипликативности ||оср|| = ||а||.||р|| (а,реЛх) (4.3.24) непосредственно следует из равенства (4.3.23). Если топология поля F недискретна (т. е. не все подмножества открыты), то можно проверить, что диски конечного радиуса Dr(d) = {х: ||х - а|| г} компактны и при этом функция || • || непрерывна, а значит, и ограничена на любом таком диске, в частности, || 1 +ос|| С для ||ос|| 1 (4.3.25) для положительной константы С 1. Из оценки (4.3.25) получаем нера- венство ||«4-р|| ^Стах(||а||, ЦРЦ) Va.peF, (4.3.26) более слабое, чем в определении нормирования в §4.2. Такие функции называются обобщенными нормированиями. Если, например, F — С, то возьмем U = {z = х 4- iy'. |z| < 1}, тогда \l(wU) = |ш|2[л(£7), где |ш|2 = ww, и неравенство (4.3.26) выполнено с С = 4. Однако если для всех п е N выполнено неравенство ||/г|| < 1, то С = 1, так что || • || — неархимедово нормирование. В частности, для расширения K/Q>p, [/С : Q₽] = d, положим U = OK, a = (meZ,veOxK),
§4.3] Локальные и глобальные методы 165 гдерк = (тс). Тогда ||ос|| = q т = р ?т. Поскольку р = кеи(и е (9£), мы по- лучаем Цр||=Ге = р-е/, а с другой стороны ||р||=р(ре>к)/р(е>к) = \ок/Рок\-' = P~d, откуда получается доказательство формулы d = ef. 4.3.6. Точки числовых полей. Формула произведения. Два (обоб- щенных) нормирования || • ||i и || • ||2 некоторого поля F (см. п.4.3.5) на- зываются эквивалентными, если ||x||j = ||х||£ для всех х е F и констан- ты с > 0. Класс эквивалентных нормирований поля F называется точкой поля F и обозначается буквой v, а символом Fv обозначается пополнение поля F по одному из эквивалентных нормирований в классе v. Теорема Островского (см. §4.2) означает, что точки поля Q — это v — р (р — простое число) или х = оо. Если точка v неархимедова, то той же буквой v обозначается показатель поля F, нормализованный условием v(Fx) = Z. Перечислим точки конечных расширений F поля Q. Для этого доста- точно построить продолжения нормирований поля Q на расширение F, поскольку ограничение любого нормирования поля F на подполе Q дает одно из известных нормирований поля Q. Более общим образом, пусть F/k — конечное сепарабельное расширение поля k с нормированием | • (например, k = Q и v = р или v = оо), Дх) € k[х] —неприводимый много- член степени n = [F : k], корнем которого является примитивный элемент а расширения F/k, и пусть т Лх) = П^М (£/(*)€ Цх]) (4.3.27) /=1 — разложение многочлена Дх) в произведение различных многочленов gj(x), неприводимых над L, где L = kv (пополнение относительно v). В силу теоремы о тензорном произведении (см. п. 4.1.3) имеет ме- сто изоморфизм колец F^kL^Y[Lj, (4.3.28) /=1 где Lj =L[x]/(gi(x)) — конечное расширение поля L, в которое вклады- вается поле F с помощью Х7-: F F L-+ Lj. В п. 4.3.4 мы видели, что на Lj существует единственное нормирование, продолжающее | • |„ с L = kv (где оно задано как на пополнении). Будем обозначать это нормирование поля Lj тем же символом | • и определим
166 Арифметика алгебраических чисел [Гл. 4 нормирование | • \vj на поле F, положив l₽k/ = |X/(P)|v (4.3.29) для 0 е Fx. Несложно показать, что нормирования | • \vj различны и что они явля- ются единственными такими продолжениями нормы | • |у на поле F, что при этом изоморфизм (4.3.28) является изоморфизмом топологических колец. Таким образом, существует не более чем n=[F : k] продолжений норми- рования | • |у поля k на F, которые совершенно явно задаются форму- лой (4.3.29), если считать, что разложение (4.3.27) известно, и учесть, что по формуле (4.3.16) мы имеем 1МР)1> = "У№.д(Мр))|„ (itj = [Li : L] = deggy (x) —локальная степень). Чтобы получить соответствующее нормализованное нормирование || • ||vj, надо положить llPIk/ = |Nby/UMP))l для р е Fx. Тогда для 0 G Fx справедливо равенство т ПН₽1Ь./ = 1^/*(₽)Ь. (4.3.30) Z=1 т поскольку Nf/jt(P) = П Мд.д(Р) в силу формулы (4.1.3). /=1 Формула произведения для нормализованных нормирований. Пусть &/Q— конечное расширение, a G kx и | • |у пробегает все нормализованные нормирования поля k. Тогда [oc|u = 1 для всех V, кроме конечного их числа, и справедливо равенство ПН = 1- (4.3.31) V Этот факт устанавливается с помощью формулы (4.3.30), в которой надо вместо F/k положить &/Q, учесть, что N^(a)eQx, и применить формулу произведения (4.3.15). Глобальные поля. Так называются поля, которые являются либо конеч- ными расширениями поля Q (числовые поля), либо конечными сепарабель- ными расширениями поля F^(/), где F7 — поле из q элементов и элемент t трансцендентен над F7 (функциональные поля положительной характери- стики), см. [138], [137], [836], [225], [143].
§ 4.3] Локальные и глобальные методы 167 Во всех глобальных полях имеют место формула произведения и схо- жее описание всех нормализованных нормирований. Многие задачи о нату- ральных числах имеют полезные аналогии в функциональных полях. Эти аналогии изучаются более успешно методами алгебраической геометрии и являются богатым источником для интуиции применительно к числовому случаю (см. §4.5, 5.2, 6.5 и предварительный обзор части III). 4.3.7. Адели и идели. В арифметических вопросах кольцо Z полез- но рассматривать как решетку в R, т. е. дискретную подгруппу аддитив- ной группы локально компактного поля R с компактной факторгруппой R/Z, изоморфной окружности. Оказывается, для произвольного глобаль- ного поля k можно канонически построить такое «наименьшее» локально компактное кольцо А*, содержащее k как решетку (т. е. k — дискретное подкольцо в Afe с компактной аддитивной факторгруппой А*/£). Кольцо А*, называемое кольцом аделей поля k, строится с использованием вло- жений k kv (где v пробегает множество Е = Е* всех точек поля k) как подкольцо в произведении [J kv, состоящее из всех бесконечных векторов v GS а = («и)иеЕ» € kv, у которых со, € Ov для почти всех v (согласно п. 4.3.6 число архимедовых точек v не больше чем п = [k : Q], поэтому почти все точки v е Е неархимедовы и определено компактное подкольцо Ov С kv, если k — числовое поле): Afe = J а = (otj € kv: ctv е Ov для почти всех v I. (4.3.32) L z?gs J Топология пространства А& определяется открытыми множествами вида = (4.3.33) ves v&s где S пробегает конечные подмножества S С Е, a Wv —открытые подмно- жества в kv. Множество компактно (имеет компактное замыкание), если все множества Wv ограничены, поэтому А& является локально ком- пактным топологическим кольцом, в которое k вложено диагонально: k Э а (..., а, а, .. .)иег Е Afe С kv (в силу п. 4.3.6 мы имеем |а|у = 1 для а е kx и почти всех v е Е). Отме- тим, что полное произведение П kv слишком велико и не является локаль- но компактным: по определению топологии произведения проекция любо- го открытого множества У С на kv совпадает со всем kv для по- чти всех и, поэтому множество U никогда не является компактным, имея некомпактный образ при непрерывном отображении проектирования на
168 Арифметика алгебраических чисел [Гл. 4 координату kv. Приведенная конструкция называется ограниченным топо- логическим произведением топологических пространств kv относительно системы компактных подмножеств Ov, определенных для почти всех ко- ординат v. Сходимость последовательности где = (<*n,v)v к р = (ру)у с Ай означает, что для любого е>0 и для любого конечно- го множества S С Е найдется такое натуральное число W, что выполнены следующие условия: l)^v-^eOv Vn>N Vv£S, 2) |ал,у - pjv < е Чп > N Vu е S. Каждый ненулевой главный адель а, т. е. а = (..., а, а, .. .)„ е k с Afe, (4.3.34) можно отделить от нуля окрестностью вида (4.3.33), где S = {vgE: а^<9у}, поэтому поле k дискретно в Ай- Компактность факторгруппы АйД име- ет содержательное объяснение с точки зрения теории двойственности Понтрягина локально компактных коммутативных топологических групп: факторгруппа АйД изоморфна группе k всех непрерывных характеров дискретной группы k. Напомним, что для локально компактной коммута- тивной группы G группа ее непрерывных характеров G = Homcontin(G, S1) (4.3.35) (где S1 = {z С Сх : |z| = 1}) также является локально компактной группой, причем Слл = G, и точной последовательности групп 1 — Gj — G -+ G2 -> 1 с непрерывными гомоморфизмами отвечает точная последовательность 1 G2 — G Gj — 1 групп характеров. При сопоставлении G G конечные группы переходят в конечные, дискретные группы — в компактные и обратно, а для связной группы G группа G не имеет кручения. Если Н С G — замкнутая подгруппа, то ее аннулятор /У3- = {х е G: xW = 1} (4.3.36) изоморфен (G/Hy\ В простом примере Z С R имеем Z = S1, S1 = Z, а группа R самодвой- ственна: R = R (числу t е R отвечает характер х »—> е2ш/х), причем Z1 = Z. Можно проверить, что аддитивная группа Ай самодвойственна и эле- менту a G Ай отвечает характер (0 х(а(3)) G Ай, где / — произвольный фиксированный нетривиальный характер Ай с условием x(fe) = 1, при этом й^^ = (АйД)л.
§ 4.3] Локальные и глобальные методы 169 Рассмотрим подробнее A = Aq для случая k = Q. Для а = (ау)еА определяются дробные части {ау} (при v = р надо воспользоваться циф- ровой записью (4.3.2) и положить {ар} = а_\р~1 + ... + атрт при т < 0). Тогда для почти всех v имеем {ау} = 0 и число {ос} = Е{ау} рационально. Характер / е А определяется по формуле ₽ >-> ехр{-2та{роо}} • ЭД ехр{2та{р„}}, (4.3.37) и для всех 0 е Q имеем /(0) = 1. Для каждой компоненты v определен характер 0н-> I—> ехр{2тс£{р}} (0 е QJ, задающий самодвойственность локально компакт- ного поля (у = р, оо) аналогичным образом: элементу t е отвечает характер х /у(/х). Отсюда же следует описание факторгруппы A/Q = R/Z х Zp, (4.3.38) р которое устанавливается вычитанием из аделя а € А его дробной части {а} = ^{aJeQ. (4.3.39) и/оо Факторгруппа А/Q из формулы (4.3.38) компактна по теореме А.Н. Ти- хонова о произведении компактов. Для произвольного числового поля k полезно использовать изоморфизм топологических колец Afc = k Aq, (4.3.40) из которого следуют изоморфизм аддитивных групп А^+) = (А^)", п — = [k : Q], а также утверждения о дискретности подгруппы k С А& и ком- пактности факторгруппы А&/&. Можно проверить также, что аналогичный изоморфизм имеет место для произвольного расширения глобальных полей F/k:AF^F®kAk. (4.3.41) Группа иделей (см. [230], [836]). Множество обратимых элементов любого коммутативного кольца R образует группу /?х по умножению, в ко- торой топология задается с помощью вложения х »—> (х, х-1) в топологиче- ское произведение R х /?, для того чтобы взятие обратного элемента было непрерывной операцией. Группой иделей Jk поля k называется группа об- ратимых элементов А£ кольца аделей А*. Группа Jk представляет собой ограниченное топологическое произведение групп k* по отношению к компактным подгруппам (9х, заданным для неархимедовых нормирова- ний v е Е.
170 Арифметика алгебраических чисел [Гл. 4 Я 4.3.8. Геометрия аделей и иделей. Вложение элементов числового I поля k в его кольцо аделей А& во многом напоминает геометрическое изоб- I ражение целых чисел О = Ok в виде решетки в R-алгебре 1 Z?oo = /2 0qIR= ©С'2, (4.3.42) j u|oo f Эту аналогию можно провести значительно дальше. Рассмотрим меру Ха- | ара [1 на локально компактной (аддитивной) группе А*, которую можно ' задавать на открытых множествах вида (4.3.33) по формуле = (4-3.43) ues где [jlv(Ov) = 1 при v {оо (т. е. если v — неархимедова точка), d\iv = dx при kv = R (мера Лебега), d[iv = \dz Л dz\ =2dxdy при kv = С Э z = х + iy. Если (3 — {(%} G Jk — произвольный идель, то его содержанием называ- ется множитель |р|, на который отличаются две меры Хаара [1(£х) и [1(х) на А&: р(Рх) = |р|р(х). ‘ (4.3.44) Из описания (4.3.43) меры р ясно, что |Р| = П1Ри|и, где | • |„ — норма- р лизованное нормирование из класса точки v: |x|u =х, если xekv=R, \z|у = zz, если z G kv = С. На компактной факторгруппе А^/й определим меру р с помощью обще- го понятия фундаментального множества: если Г — дискретная подгруппа в локально компактной группе G, то под фундаментальным множеством X для G по модулю Г понимается полное множество представителей классов смежности, обладающее дополнительными свойствами измеримости. С по- мощью ограничения меры Хаара а группы G на подмножество X получа- ется однозначно определенная мера Хаара на G/Г, которая обозначается той же буквой, причем a(G/T) = а(Х). Построение фундаментального множества X для А&/&: выберем Z- базис <01, ..., группы целых элементов О С k, который также является базисом векторного пространства = k R над R и задает изомор- П физм 0: R" —^оо по формуле 0((«i, ..., ип)) = £ Если обозначить 1=1 через / промежуток 0 < t < 1 в R, то 0(/л) является фундаментальным параллелограммом решетки О в (см. п. 4.1.3). Теперь в качестве X возьмем Х = В(1п) х (4.3.45) ufoo (фундаментальное множество для А^Д).
§4.3] Локальные и глобальные методы 171 Для доказательства заметим, что множество 4- k всюду плотно в Afe. Это утверждение известно как теорема об аппроксимации и являет- ся вариантом китайской теоремы об остатках (см. п. 1.1.5). Далее, koo х —открытая подгруппа в Afe, значит, для любого х е Afe най- дется такое число т) е k, что х — т) е х П Ov. Условие того, что неко- торый другой элемент г)' е k обладает таким же свойством, равносильно тому, что т) - т)' е Ov для всех неархимедовых точек и, т. е. т) - т)' е О. По- этому при подходящем выборе т) можно считать что проекция элемента х — т) на koo лежит в 0(/л): у^ = 0(и), и е /л, причем и определяется этим однозначно, что и требовалось. Первое приложение построенной меры на Afe/fe — простое доказатель- ство формулы произведения (4.3.31): если 0 е kx с Jk — главный идель, то 0&х = kx в Jk и 0 определяет гомеоморфизм фактора Afe/fe, следовательно, две меры Хаара ц(0х) и [i(x) должны совпасть, т. е. в силу соотношения (4.3.44) мы получаем IPI = П 1Р“ 1“ = И(₽А*А)/И(А*/Л) = 1. V Вычислим меру [i(Afe/&). Вид фундаментального множества (4.3.45) по- казывает, что для этого достаточно вычислить объем фундаментального параллелограмма 0(/") в k^, что уже было сделано в п. 4.1.3 ((4.1.7)), и мы получаем н(А*А) = |п*|,/2. (4.3.46) где Dk = det(Tr(0/0;)) — дискриминант поля k (мы учли при этом, что ме- ра d\iv на koo = Rri ф С2 = отличается степенью 2 от меры Лебега и|оо на компоненте kv = С, когда d\iv(z) =<2dxdy = \dz A dz\ для z = x 4- iy 6 eC^^). Рассмотрим величину, равную (9 \ Г 2 -) |£>а||/2, (4.3.47) тс/ которая важна для выяснения вопроса о наличии ненулевой точки 0 ре- шетки k с Afe, лежащей в параллелотопе, т. е. множестве вида У(С) = {х = (х„)„е A*: VueS*, |xv|B (4.3.48) где с = (cv) — набор положительных чисел, почти всех равных 1 и опреде- ленных для всех точек v поля k. Лемма 4.19 (Блихфельдт). Пусть числа cv таковы, что П^>с = (?)'°М« Тогда найдется точка 0 е kx П И(с) с Afe.
172 Арифметика алгебраических чисел [Гл. 4 Доказательство. Рассмотрим вспомогательное множество V(c'), где с' = (с') (u € Е), с' = cv, если v — неархимедова точка, с' = у, если kv = К, с'= у, если£и=С. Тогда объем V(c') легко вычисляется: p(V(c')) = Q)'2 > 1^11/2- V Другими словами, мера множества V(c') больше меры фундаментально- го множества для А^Д, стало быть, найдутся две различные точки у, //' € И(с'), имеющие одинаковый образ в k, т. е. у — у' € k и мы получаем для числа p = z/ — yf е kx следующие оценки: |р|у max(|z/Jy, |z/'|u) < cVl если v — неархимедова, |Р|р sj2max(|i/u|u, |«/'|u) если kv =К, IP|U < 4max(|i/u|u, |z/'|a) s£ca, если =C. Лемма доказана. Обратимся теперь к строению группы иделей. Рассмотрим гомомор- физм | • |: Jk —► переводящий у = (yv)v е Jk в \у \ = П \yv|„. Обозначим V через его ядро, тогда J^ является замкнутой подгруппой, а в силу форму- лы произведения (4.3.31) мы получаем kx cJk- Важнейшим результатом теории числовых полей является следующая теорема. Теорема 4.20. Факторгруппа J^/k^ компактна. Доказательство выводится из леммы Блихфельдта подобно выводу теоремы Дирихле о единицах из леммы Минковского о выпуклом теле (см. п. 4.1.6). Эта теорема эквивалентна объединению теоремы Дирихле о едини- цах и теоремы о конечности числа классов (см. п. 4.1.6, 4.2.2), которые сами легко выводятся из этой теоремы с помощью рассмотрения следую- щих отображений. Дивизориальное отображение. Пусть Ik — группа дробных идеалов (дивизоров), т. е. свободная (аддитивная) группа с множеством неархиме- довых точек в качестве базиса. Определим div: Jk —> Ik. div((xD)) = v(xv) • v, (4.3.49) v]oo
§ 4.3] Локальные и глобальные методы 173 где v обозначает, как было условлено, показатель для точки v с услови- ем v(kx) = Z. Тогда заметим, что div(J^) = 4, поскольку изменение одной лишь архимедовой компоненты хж = (хУ)и|сю иделя х е Jk не меняет div(x). Если div(£x) = Pk — подгруппа главных идеалов в дискретной группе 4, то мы получаем эпиморфизм div: J^/k* —► Ik/Pk = Clk компактной группы на дискретную, образ которого компактен и дискретен, а поэтому и конечен. Логарифмическое отображение и S-единицы. Пусть S с — ко- нечное множество точек, содержащее множество всех архимедовых точек. Множество таких элементов т)Е/гх, что |т)|у = 1 для всех v£S, образует группу по умножению, которая обозначается Es и называется группой S-единиц. Теорема4.21 (теорема о S-единицах). Группа Es является прямой суммой конечной циклической группы и свободной абелевой группы ранга s — 1, где s — число точек в S (см. [495]). Доказательство подобно доказательству теоремы Дирихле (см. п. 4.1.4). Рассматривается логарифмическое отображение Г. Jk~+ (4.3.50) s раз (где —аддитивная группа вещественных чисел), задаваемое формулой /((•^и)и) = (• • •» ...)v^5. Это отображение непрерывно, а его образ содержит некоторый базис век- торного пространства Rs (если S = Еоо, то отображение / сюръективно). С помощью отображений (4.3.49) и (4.3.50) несложно описать фун- даментальные множества для 4/6 х и J^/kx (см. [836, с. 137—139]), а также вычислить объем у(/^//гх) относительно меры Хаара у на про- исходящей из разложения (4.3.51) Iх I в котором Y — —мера Хаара на Д, V определенная условиями YV(OX) = 1, если v — неарихмедова точка, dyv(x) = |х| —1 dx, если kv = R, хей, dyv(z) = (zz)-1 \dz A dz\, если z e C = kv. Тогда справедлива формула y(j'k/kx) = 2fl (2it)r2hR/w = xk, (4.3.52)
174 Арифметика алгебраических чисел [Гл. 4 причем h = \Clk\ — число классов поля k, R=Rk— регулятор, aw=wk— число корней из 1, содержащихся в k, см. п. 4.1.3. Эта формула означает, что для каждого числа т> 1 в R множество С(т) в 4/&х, определен- ное с помощью неравенств С(т) = {х € 4/йх : 1 |х| т}, имеет меру, равную y(C(m)) = Xk \ogrn. (4.3.53) Величины /?, /г, D, т. е. регулятор, число классов и дискриминант, являются важнейшими инвариантами числового поля k. Эти величины, участвующие в формулах объемов фундаментальных множеств (4.3.46) и (4.3.52), не независимы: согласно глубокому результату Брауэра—Зигеля (см. [492], [500]) для последовательности, состоящей из числовых полей km степени AZm = [^m-Q] И удовлетворяющей условию Пт/ log\Dkm I -+ 0 при т —> оо, справедлива асимптотика Rkm) ~ log(|DAJ1/2). (4.3.54) Группа классов иделей Ck=Jk/k* играет ключевую роль в описании всех абелевых расширений числового поля (теория полей классов), см. §4.4. Если k = Q, то имеют место изоморфизмы VQx=R^ х ]]Z*, (4.3.55) р 4/Qx=IIzp- (4.3.56) р Они легко устанавливаются с помощью деления иделя а € Jq на его диви- зор div(a) = pvp^p\ который в данной ситуации является рациональным р числом; в результате получается элемент а ♦ sign(aoo) div(a)-1 из правой части формулы (4.3.55). § 4.4. Теория полей классов 4.4.1. Абелевы расширения поля рациональных чисел ([137], [230], [836]). Один из центральных объектов алгебраической теории чисел — полная группа Галуа G = G(Q/Q) поля Q всех алгебраических чисел над Q, а также ее подгруппы Н С G конечного индекса, отвечающие конечным расширениям &/Q: _ H = Gk = G(Q/k) с G.
§ 4.4] Теория полей классов 175 С топологической точки зрения G является компактной вполне несвязной группой с топологией проконечной группы (проективного предела конечных факторгрупп): G=HmG/G* = HrnG(fc/Q), где Gk — подгруппы, отвечающие нормальным конечным расширениям &/Q, которые тем самым замкнуты и открыты в G. Теория полей классов доставляет чисто арифметическое описание максимальной абелевой (хаусдорфовой) факторгруппы G£b = Gk/Gck, где Cck — замыкание коммутанта группы G&, причем это описание дается для всех групп Галуа G£b произвольных глобальных (числовых и функциональ- ных) полей k. Одна из форм описания группы G£b состоит в вычислении всех характеров (одномерных комплексных представлений) полной группы Gk- Топологическое строение бесконечных групп Галуа подобно строению компактных аналитических групп Ли над полем р-адических чисел Q₽, таких как SLn(Zp), Sprt(Zp) и др. Идея применения аналитических ме- тодов, теории представлений групп и алгебр Ли к изучению групп Галуа бесконечных расширений получила большое развитие в последние десяти- летия и связана с некоммутативными обобщениями теории полей классов (см. §6.5). Опишем вначале группу Gq, основываясь на теореме Кронекера—Ве- бера о том, что любое абелево расширение поля Q, т. е. расширение &/Q с коммутативной группой Галуа G(£/Q), содержится в некотором поле де- ления круга Кт = Q(Cn), где ^т — примитивный корень из 1 (см. п. 4.1.2). Имеет место изоморфизм (Z/mZ)x Gm = Gal(Kw/Q). (4.4.1) сопоставляющий классу вычетов a (modm) € (Z/mZ)x, (а, т) = 1, авто- морфизм о = оа = фт(я) € Gm, заданный условием =£“. Арифмети- ческий изоморфизм (4.4.1) позволяет рассматривать характеры Дирихле /: (Z/mZ)x —>СХ как одномерные представления рх: G—>СХ груп- пы G посредством разложения рх: G Gm Ь (Z/mZ)х Л Сх, (4.4.2) где G Gm — гомоморфизм ограничения, рх = X ° ° причем каж- дый характер р: G —> Сх имеет такой вид: р = рх для некоторого /. К при- меру, квадратичное расширение k = Q(Vd) содержится в круговом расши- рении <Q>(C|d|)» гДе D = Dk — дискриминант поля k, что легко усмотреть непосредственно: если х = /d — квадратичный характер поля k, a G(x) — его гауссова сумма, то G(x)2 = D, а поэтому G(x) = ±VD е K\d\’, налом-
176 Арифметика алгебраических чисел [Гл. 4 ним, что /о — однозначно определенный квадратичный примитивный ха- рактер по модулю |О| с условием xo(“l) = sgnD. Поле k отвечает по теории Галуа подгруппе Кегр С Gq, р = pXD, индекса 2. Максимальное абелево расширение Qab является по теореме Кронеке- ра—Вебера объединением всех Кт, поэтому его группа Галуа совпадает с проективным пределом групп Gm = (Z/mZ)x, т. е. Gab^lim(Z/mZ)x, где проективный предел берется по гомоморфизмам проекции (Z/miZ)x —► —> (Z/m2Z)x для m2 | т\. Следовательно, группа Gab совпадает с группой П Zx обратимых элементов кольца Z = П Zp (проконечного пополнения р р кольца целых чисел). Более инвариантная формулировка основана на введении кольца аделей А и его мультипликативной группы J = Ах —группы иделей (см. п. 4.3.7, 4.3.8). Группа J состоит из таких бесконечных векторов 0t = («оо; «2, «3, •••) €КХ х JjQp, . р что ар е Zp для почти всех р, причем топологическое произведение U\ — = RX х IfZp открыто, а факторгруппа Ax/Gi дискретна. Согласно соот- р ношению (4.3.55) мы имеем 7/Qx =Я£ х П^х, где — мультиплика- р тивная группа положительных чисел. Группа Gab изоморфна тогда факторгруппе группы //Qx по ее связной компоненте: Gab = fl Z* “ //R*Qx. (4.4.3) р Для установления этого изоморфизма важно то обстоятельство, что эле- менты всех групп Gm, а значит, и Gab имеют арифметическую природу и отвечают простым числам. Именно, каждому простому числу р, не деля- щему т, отвечает элемент Фробениуса о = : Си Ст- Множество всех простых чисел, переходящих в фиксированный элемент а е Gm, бесконечно по классической теореме Дирихле о простых числах в арифметической прогрессии: оно совпадает с множеством простых чисел вида р = а + km (k € Z), где а = фт(а). Автоморфизм а называется элементом Фробени- уса Frp по следующей причине: если рассмотреть кольцо От = всех целых элементов из Кт, то на факторкольце От1р®т автоморфизм <зр действует как автоморфизм Фробениуса Frp(x) = хр. При этом вид разло- жения идеала рОт на простые идеалы зависит только от образа простого числа р в группе Галуа Gm (см. п. 4.1.2). Идея сопоставления просто-
§4.4] Теория полей классов 177 му числу (простому идеалу) элемента группы Галуа (Э. Артин) приводит к изоморфизму (4.4.3), в котором элементу Фробениуса Frp отвечает класс иделя пр = (1, 1, ..., 1, р, 1, ...) b//R*Qx. Полю Кт отвечает открытая подгруппа t/m = K;x]J(l+/nZp)X X П2₽С/, р\т р\т причем Gm = J/UmQ*, см. [496]. Именно в таком виде этот результат удоб- но переносить на общий случай группы G|b для конечных расширений &/Q. Заметим, что множество всех примитивных характеров Дирихле можно отождествить с дискретной группой характеров конечного порядка группы классов иделей посредством проекции W = JR^ х JJZX —> (Z/mZ)x S Gm, p поскольку такие характеры тривиальны на связной компоненте R^. Абе- левы расширения поля Q взаимно однозначно соответствуют открытым подгруппам в //R*QX, каждая из которых есть пересечение ядер конеч- ного числа характеров Дирихле. 4.4.2. Элементы Фробениуса числовых полей и отображение вза- имности Артина. Пусть К — числовое поле, [/< : Q] = п, ~ мно“ жество всех конечных точек (нормализованных дискретных нормиро- ваний) поля /(, которые однозначно отвечают простым идеалам / О в кольце целых элементов Ок поля /(: pv = {xeOK: |х|у < 1}. Поле вычетов k(v) = Ок/pv конечно, и число его элементов равно Nv = = Puegu, где pv =charfc(u), f — степень поля k(v) над FPo. Нормализо- ванное™ нормирования | • |„ означает, что для х е Ок выполняется равен- ство v(x) = - logafo |x|v (|x|v = Nv~v{x)). (4.4.4) Индекс ветвления ev точки v — это число v(pv), и имеет место разложе- ние рОк = П Pv- v,v(p)>0 Пусть L/K — конечное расширение Галуа с группой Галуа G(L/K), и пусть w — некоторая точка поля L, которая продолжает точку v поля К. Определим действие группы Галуа G(L/K) на нормированиях w (точнее, на множестве точек поля L) по формуле w аш, = |х |oi.
178 Арифметика алгебраических чисел [Гл. 4 Если точки и, w неархимедовы, ру, — соответствующие им простые идеалы, то ош определяется идеалом Автоморфизм Галуа о € G(L/K) дает изоморфизм пополнений aw: Lw —> Low как нормирован- ных пространств над Kv- Группа разложения Gw вводится как подгруппа Gw = {с € G(L/K): ow = ш} с G(L/K). (4.4.5) По определению Gw = {a G G: атш = w} = тС^т-1. С другой стороны, из конструкции продолжения нормирований выводится, что действие группы Галуа G(L/K) на множестве точек w, делящих v, транзитивно; следова- тельно, все подгруппы Gw С G(L/K) сопряжены (см. [836]). Группой инерции lw С Gw называется ядро естественного гомомор- физма Gw = G(LW/Kv) —> G(l(w)/k(v)) — поле вычетов точки w). Факторгруппа Gw/Iw = G(l(w)/k(v)) порождается элементом Фробениуса: G(l(w)/k(v)) = (Fray) ’ FrIiy(x) = xNv. Нормирование w называется нераз- ветвленным, если Iw = {1}; тогда Gw = (Fr^,); из определений следует, что Frw = т-1 Fr^y т, и в этом случае определен класс сопряженности элемента Fr^y в группе G(L/K), зависящий только от точки v. Принтом все неархи- медовы точки, кроме конечного их числа, неразветвлены; для таких точек v положим Гь/к(и) = (класс сопряженности Fr^, w | v). (4.4.6) Если группа G(L/K) коммутативна, то правая часть равенства (4.4.6) со- стоит из одного элемента. Закон взаимности Артина указывает расположение элементов Фро- бениуса Fl/k(v) в коммутативных группах Галуа G(L/K). Пусть S — конеч- ное множество точек поля /(, включающее все неархимедовы точки, а так- же точки, разветвленные в L/К. Обозначим через Is свободную (муль- типликативную) абелеву группу с образующими ру для точек v £ S. Тогда сопоставление v Fl/k\v) G G(L/K) продолжается до гомоморфизма Fl/k-!S -*G(L/K), (4.4.7) который называется отображением взаимности Артина, Fl/k (П Р"Л = П Fl/kW1'. (4.4.8) \u£S / v&S Теория полей классов дает явное описание ядра гомоморфизма (4.4.7) (см. п. 4.4.5). Утверждение о сюръективности отображения взаимности (4.4.7) было открыто раньше и вытекает из общей теоремы Чебота- рёва о плотности простых идеалов; эта теорема представляет собой далекое обобщение теоремы Дирихле о простых числах в арифметической прогрессии (см. [229], [720], [716], [231]).
§4.4] Теория полей классов 179 Пусть Р — некоторое подмножество в множестве Е^ всех неархимедо- вых точек поля /С Для каждого целого числа х 1 обозначим через ах(Р) число таких точек v е Р, что Nv х. Говорят, что множество Р имеет плот- ность а 0, если существует предел lim х—>оо ах(Р) ах&к) = а. (4.4.9) Не всякое множество имеет плотность. Например, если К = Q, а Р — мно- жество простых чисел, первая десятичная цифра которых равна 1, то Р вообще не имеет плотности. По теореме о распределении простых чисел имеем ах(Е^) ~ x/logx, поэтому условие (4.4.9) эквивалентно асимптотике ах(Р) = ax/logx + o(x/logx). (4.4.10) 4.4.3. Теорема Чеботарёва о плотности простых идеалов. Теорема 4.22. Пусть L/K — конечное расширение Галуа числово- го поля К и X — подмножество в G(L/K), инвариантное относи- тельно сопряжения. Обозначим через Рх множество точек v е Е^, неразветвленных в L таких, что класс элемента Фробениуса v ле- жит в X: Fl/k(v)cX. Тогда плотность Рх существует и равна Card X/ Card G(L/K). Доказательство основано на аналитических методах; вводится поня- тие аналитической плотности (плотности Дирихле) множества Р как предел lim (4.4,11) -,+ М А) Доказательство существования и вычисление предела для множества Р = Рх можно провести с помощью L-функций Артина (см. п. 6.2.2); отсюда уже выводится утверждение о плотности множества Рх в смыс- ле (4.4.9) (см. [230], [492]). 4.4.4. Закон разложения и отображение взаимности. Если L/K — абелево расширение, то закон разложения простого идеала ру в Ol полно- стью определяется порядком f элемента Fl/k(v) € G(L/K)\ в этом случае . где$ = (0(£//<):(о)), причем f = f(wt/v) = deg^/degv = = [l(Wi): &(v)] —относительная степень поля классов. Этот факт вы- текает из транзитивности действия группы Галуа G(L/K) на точках w, де- лящих v. В частности, точка v полностью распадается (т. е. f = 1 и точка v неразветвлена) тогда и только тогда, когда Fl/r(v) = 1 € G(L/K). Из теоремы 4.22 видно, что конечное расширение Галуа L/K однознач- но определяется (в фиксированном алгебраическом замыкании /() множе- ством Spl^ точек, вполне распадающихся в L/K. Закон взаимности
180 Арифметика алгебраических чисел [Гл. 4 Артина дает, в частности, описание этого множества, если расширение L/К абелево. Для неабелевых расширений пока существуют лишь приме- ры описания Spl^; однако эти примеры служат основанием весьма общих гипотез {программа Ленглендса, см. §6.5), определяющих одни из ос- новных направлений исследований в современной алгебраической теории чисел. 4.4.5. Ядро отображения взаимности. Прежде чем сформулировать точный результат о ядре отображения (4.4.7), напомним, что относительная норма Njl/k (ш) точки w из конечного расширения L/К числового поля К определяется как р^и) (или f(w/v) • v в аддитивных терминах), где f{w/v) = degay/degv — [/(ш): &(v)] = logNu — относительная степень поля классов вычетов. Кроме того, рассмотрим дивизориальное отображение (см. формулу (4.3.49)) divs: V-/s, divs(a) = П Р„(а) е Is, vgS где S — множество, состоящее из всех архимедовых точек v е и то“ чек v, разветвленных в расширении L/К. Пусть L/K — абелево расшире- ние числового поля К, f = П₽^ — некоторый идеал в (3%, делящийся на достаточно высокие степени r(v) простых идеалов ру, разветвленных в L. Для каждой архимедовой точки v е ^2^ зафиксируем вложение а ь- a{v) е С, К Kv С С, индуцирующее нормирование V, и пусть = {и € : Kv — К, = С для w/v}. Определим подгруппы Pl/kWF С Is: PA/K(f) = {divs(a): аеКх, а = 1 (modf), > 0 Vu е Е^к}, (4.4.12) = (4.4.13) — подгруппа, порожденная относительными нормами простых делителей тех точек v (или ру), которые неразветвлены в L/K. Теорема 4.23 (закон взаимности Артина). Пусть L/K — абелево расширение. Тогда KerFL/K=PL/K{f)^L/K(j). (4.4.14)
§4.4] Теория полей классов 181 Следствие 4.24 (описание группы Галуа). Для абелева расширения L/К отображение взаимности (4.4.7) индуцирует изоморфизм 4.4.6. Символ Артина. Рассмотрим группу иделей Jr и определим сюръективный гомоморфизм (., L/К): 4 G(Л//0, s м (s, L/K), (4.4.15) с помощью отображения взаимности (4.4.7). Для произвольного иделя s eJf( подберем такой главный идель a G /Сх, что |ocsy - 1 |v < е для v G S и для достаточно малого е > 0. Определим дивизор (см. формулу (4.3.49)) div(as) = € /S- V Тогда символ Артина определяется равенством (s, L/K) = = FL/K(<Hv(as)). (4.4.16) Следует особо подчеркнуть, что для корректной определенности сим- вола Артина на иделях (см. формулу (4.4.16)) существенно, что выполнен закон взаимности на идеалах в форме (4.4.14). Действительно, условие на элемент а в соотношении (4.4.16) выполнено, если div(a) G Pl/kW) при подходящем выборе f. Теперь закон взаимности (4.4.14) переходит в утвер- ждение о том, что Кегф/ук совпадает с Kx^l/k^l> где Nl/rJl— подгруппа относительных норм иделей из = (ПNU//<„(РшЛ • (4.4.17) /у Таким образом, символ Артина из формулы фдд (4.4.16) определен для классов иделей s еСц =Jr/K\ причем Fl/k(v) = ^l/k(s(v)\ где s(y) — это класс иделя (..., 1, тсу, 1, ...), где € Кх —локальная униформизу- ющая, т. е. элемент, удовлетворяющий условию у(тсу) = 1. Гомоморфизм фл/к • Ск G(L//Q непрерывен, и его ядро открыто-замкнуто опять в си- лу соотношения (4.4.14). 4.4.7. Глобальные свойства символа Артина. Пусть Н — подгруппа некоторой конечной группы G, тогда определен гомоморфизм переноса Ver: G/[G, G] Н/[Н, Н], (4.4.18) для которого Ver(g[G, G]) = П /z(g, г), где г пробегает систему предста- reR вителей левых смежных классов R для G/Н, а элемент /z(g, г)еН опре- делен условием gr = gr h(g, г), где gr G R— представитель для gr в R.
182 Арифметика алгебраических чисел [Гл. 4 1. Существует взаимно однозначное соответствие между открытыми подгруппами U с С к и конечными абелевыми расширениями L/K, причем символ (4.4.16) индуцирует изоморфизм Cr/U —> G(L/K), ядро U которого совпадает с норменной подгруппой: U — Nqk(Cl) (см. формулу (4.4.17)). 2. Пусть К'/К — произвольное конечное расширение. Тогда для а е Сц> справедливо равенство (N^/Ha), L/K) = (a, LK'/K'). (4.4.19) 3. Пусть L'/K — конечное нормальное расширение, L/K — его макси- мальное абелево подрасширение и /С — промежуточное подполе в L'/K, над которым поле L' абелево. Тогда (a, L'/K') = Ver(a, L/K), (4.4.20) где Ver—гомоморфизм переноса (4.4.18). 4. Пусть L'/K — (нормальное) подрасширение расширения L/K, тогда для всех а е С к справедливо равенство (a, L'/K) = (а, L/K). (4.4.21) 5. Пусть а — изоморфизм поля К на а/С, o€Aut/(. Тогда для всех а € С % справедливо равенство (аа, gL/gK) = а(а, Л/Л)а"1. (4.4.22) Черта в предыдущих формулах означает ограничение автоморфизма на подполе (см. [230], [467], [137], [836]). Эти свойства позволяют распространить определение символа Артина на бесконечные абелевы расширения L/K. Соответствие s (s, L/K) = lim(s, Lv/K), (4.4.23) V где Lv/K пробегает все конечные подрасширения L/К, позволяет опреде- лить при помощи свойства 4 отображение из С& в G(L/K), образ которого всюду плотен. Поскольку подгруппы конечного индекса в С к и G(Kab /К) находятся во взаимно однозначном соответствии, группа G(Kab/К) изо- морфна проконечному пополнению группы Сц и совпадает с факторгруп- пой группы Ск по ее связной компоненте, а гомоморфизм удовлетворяет правилам преобразования 2, 4, 5. Отметим, что другой подход к теории полей классов был развит Й. Ной- кирхом, см. гл. 4—6 в [612]. Для проконечной группы G, на которой определен сюръективный гомо- морфизм d \ G —> Z, и для G-модуля А, на котором определено «гензелево нормирование, связанное с d», можно построить элементарным образом
§4.4] Теория полей классов 183 гомоморфизмы взаимности; если к тому же А удовлетворяет так называ- емой аксиоме полей классов (утверждение о нулевых по номеру и (— 1)-х когомологиях Л), то гомоморфизмы взаимности являются изоморфизмами. Из такой абстрактной теории полей классов можно вывести как глобаль- ную, так и локальную теории полей классов, а также классическую форму- лировку глобальной теории полей классов, использующую лучевую группу классов вместо иделей. Подход Нойкирха позволяет меньше использо- вать когомологические методы, необходимые для построения теории полей классов. 4.4.8. Связь символа Артина и локальных символов. Предполо- жим, что символ Артина на иделях (4.4.16) существует. Для конечного абелева расширения L/К, неархимедовой точки v поля и ее продолже- ния w на поле L рассмотрим пополнения Kv и Lw и группу разложения G. cG(L/K), G^G(M^), которая в абелевом случае не зависит от выбора w. Рассмотрим вложение iv • Ку * проекцию на v-компоненту jv: —> Ку , где iv отображает хЕ Ку в элемент из У#, у которого ^-компонента равна х, а остальные компоненты равны 1. Положим фи = §l/k ° — (*, Lw/Kv)v. (4.4.24) Тогда можно проверить, что образ гомоморфизма ф лежит в группе раз- ложения Gy. Гомоморфизм фу: Ку —► Gv называют локальным гомо- морфизмом Артина (или гомоморфизмом норменного вычета). Если х = (Ху) G /к, то справедливо разложение <к/Нх) = П'Мх*)’ (4-4.25) V поскольку х = lim (JJ /и(Ху)\ S Ves ) (предел по возрастающему семейству {S} конечных множеств точек поля К). Произведение (4.4.25) на самом деле конечно, так как если компонен- та Ху является и-единицей и точка v неразветвлена, то xv является нор- мой в Lw/Kv‘- для некоторого элемента yw£tw имеем xv = причем существование такого элемента устанавливается по лемме Гензеля (см. п. 4.3.2). Таким образом, знание локальных отображений Артина фу эк- вивалентно знанию глобального отображения Артина $l/k- В класси- ческих работах локальные отображения изучались при помощи глобальной теории; в частности, было показано, что они зависят только от локального
184 Арифметика алгебраических чисел [Гл. 4 расширения Lw/Kv и не зависят от глобального расширения L/К, из ко- торого они были выведены. Современное изложение теории полей классов (например, в работах [230], [836]) в этом смысле противоположно клас- сическому: сначала дается независимая и чисто локальная конструкция отображений 9.: К* ->GV = G(LV/KV)4 (4.4.26) где Lv —некоторое конечное расширение поля Kv- Затем доказывается, что произведение 0у удовлетворяет тем свойствам, которые однозначно ха- v растеризуют гомоморфизм фд/к, причем важнейшая часть доказательства состоит в проверке формулы произведения: 0у (а) = 1 для всех а е К х. (4.4.27) V В случае квадратичного расширения L = K(\/b) образ Qv(a) принадлежит группе {±1} = Gal(L/K) и совпадает с символом Гильберта, определенным в п. 4.3.3, а формула произведения, установленная в п. 4.3.3, эквивалентна квадратичному закону взаимности Гаусса, который тем Самым становится частным случаем общего закона взаимности Артина (4.4.14). Конструкция отображения (4.4.26) для произвольных абелевых расши- рений Ли/Ку обычно проводится средствами теории когомологий Галуа (см. §4.5, а также [713], [714], [230], [467], [52]). Более непосредствен- ную конструкцию 0у не так давно предложил Хазевинкель [401], [41]. Оно основано на явном анализе когомологических конструкций в малых раз- мерностях, ср. с подходом Нойкирха, [612]. 4.4.9. Свойства локального символа. Для символа % = ф. = (•, Lw/Kv).Kx ~^GV эти свойства вполне аналогичны свойствам 1—5 из п. 4.4.7 с заменой Gk на G(L/K) на Gv и фдд на 0у. Кроме того, гомомор- физм 0у отображает группу единиц Uv = О* поля Kv на группу инерции Iw С Gv. Если Lw/Kv неразветвлено, то для любого а е К* имеем ер(а) = Fr"<a), (4.4.28) где Fry € Gy —элемент Фробениуса расширения и показатель v поля Kv нормализован условием u(Kyx) = Z. Так же как и фдд, локальный сим- вол можно перенести на бесконечные абелевы расширения и определить гомоморфизм 0у: К* —> G(K*b/Kv), где КуЬ— максимальное абелево рас- ширение Ку, и мы получаем описание группы Галуа G(K*b/Kv) = (К*)л Z х О* (4.4.29)
§4.4) Теория полей классов 185 (здесь Л обозначает проконечное пополнение). При изоморфизме (4.4.29) группа Галуа G(K^/Kv) — G(fqv/¥qv) максимального неразветвленного рас- ширения К™ поля Kv переходит в Z, а группа инерции !w = Iv изоморфно отображается на всю группу единиц О*: (4.4.30) (поле К™ можно определить как максимальное расширение поля /(, для которого продолжение показателя v (см. п. 4.3.4) удовлетворяет условию ^nr)x)=Z). Ниже приведена замечательная явная конструкция максимального абе- лева расширения К„ь локального неархимедова поля Kv, обобщающая описание Q^b с помощью присоединения корней из 1 к полю Qp. 4.4.10. Явная конструкция абелевых расширений локального поля и вычисление локального символа (см. [533], [230], [399], [713], [100], [238], [49]). Рассмотрим сначала модельный пример поля Qp, у которого любое абелево расширение содержится в круговом, т. е. Qpb = Qp(l^oo)» где Гоо = U Wn, Wn = {£ G = 1}, U^oo — множество всех корней из п>1 единицы из Qp. Пусть Wpoo = |J —подмножество всех корней из 1 ш>0 р-примарной степени, a = |J Wn— подмножество корней из 1 степе- ней, не делящихся на р. Тогда Гоо = Voo X Гроо, Qp(roo) = Qp(Koo). Qp(^poo) и имеет место разложение G(Qpb/Qp) = G(Qp(V00)/Qp) х G(Q,(W»/Q,). (4.4.31) Здесь Qp(Kx>) — максимальное неразветвленное расширение (см. пример из п.4.3.4), для которого vp(Qp(Voo)x) = Z и G(Q,( VoJ/Qp) G(FP/FP) *Z = (Frp), (4.4.32) а поле Qp(lFpoo)=UQp(W,pm) является объединением всех вполне развет- т вленных абелевых расширений Qp. Группу Галуа G(Qp(IFpoo)/Qp) можно описать с помощью ее действия на множестве Wp^ корней из 1 р-при- марной степени; для этого заметим, что Епс1Гроо ^Zp, AutU^poo ^Zx, сопоставив р-адическому числу а = ао + а\р -I- а%р2 + ... € Zp в цифро- вой записи (1.3.2) эндоморфизм [<*]:£»—► для £ G Wpoo: ^det^o+a|P+...+Qm_1P"-') если Wpm с Wpao
186 Арифметика алгебраических чисел [Гл. 4 Из действия группы Галуа на группе №роо получается гомоморфизм V G(Qp(lTpoo)/Qp) Aut (4.4.33) который можно назвать одномерным р-адическим представлением Га- луа (циклотомическим представлением), причем (4.4.33) — изоморфизм. Оказывается, локальный символ 9р(а) = (a, Qpb/Qp) € G(Qpb/Qp) для произвольного элемента а = рти (те %, и € Z*) можно описать с помо- щью изоморфизмов (4.4.32) и (4.4.33): Ег™ на поле ОДЦ»), -1] на поле Qp(U^poc). Содержательный альтернативный подход к этой конструкции состоит в том, чтобы рассмотреть множества Е рОО U т^\ Ма) = < Epm = {w = ^-\:^eWpm}, являющиеся группами относительно операции, заданной формулой + W2 + Ш1Ш2 (^1, W2 € Ероо), причем для всех w € Ер^ имеем |ш|р < 1. При этом Ер состоит из корней многочлена fp(X) = (X + 1)р - 1 = рХ + (Qx2 +... + ХР, который после деления на X становится неприводимым (по условию непри- водимости Эйзенштейна), а его корни порождают поле <Q)p(Ep) степени р - 1 над Qp. Рассмотрим итерации многочлена fp(X)\ fp2(X) = fp(fp(X)) = ((X + l)P -V)P -1, fpm(X) = fp„-,(fp (X)). Тогда группа Epm совпадает с множеством корней многочлена fpm (X) и изо- морфна p~rnTtp/rLp\ очевидные вложения Ерт сЕ рт+\ при этом изомор- физме становятся вложениями p~mZp/Zp с р~т~Хг£>р/г£>р, и мы видим, что Epoo^Qp/Zp, EndEpoo = ZP, Qp(Epoo) = Qp(U^poo), а изоморфизм (4.4.33) принимает вид 8p: G(Qp(Epoo)/Qp)^i AutEpoo ^Z^. (4.4.34) Аналогичное построение можно провести для любого конечного рас- ширения Kv поля Qp с кольцом нормирования Ov, максимальным идеалом
§4.4] Теория полей классов 187 ру = (тс) с образующей тс, и (тс) = 1, и q = |Ou/pv |- Рассмотрим многочлен ДХ) = /л(Х)=кХ+ХЛ (4.4.35) тогда многочлен [К(Х)/Х = тс + Х^-1 неприводим по критерию неприводи- мости Эйзенштейна. Последовательно определим итерации Тогда множества корней многочленов fKm(X), Whm = {xeKv: = (4.4.36) вложены друг в друга, т. е. W^m С ^Дт+i, и на них можно определить структуру группы, изоморфной р^"т/(9у(= Оу/р^), относительно которой вложения множеств С W^m^\ становятся вложениями групп p~m/(9y с Ср7т-1/(9и- В результате получается группа, аналогичная группе всех корней из 1 р-примарной степени: ^/.ое= U wf.m = Kv/Ov, (4.4.37) гп^Л и определено действие элементов а € Ov = End/C/C^ на U^tOO, обознача- емое символом [a]/: хм [а]/Х, причем справедливо равенство [к]Дх) = = /я(х). Действие группы Галуа на корнях многочленов fKrn(X) дает некоторое представление, аналогичное (4.4.33): G(KV/KV) Aut ГЛоо О*. (4.4.38) Обозначим символом Кк поле, отвечающее ядру гомоморфизма (4.4.38), тогда Кп — абелево расширение поля Kv в силу изоморфизма V G(KM^O*, (4.4.39) и мы получаем описание всех абелевых расширений поля Kv- К„ь = = К™ - Кп, где К™ = KviVoo) — максимальное неразветвленное расшире- ние поля Kv (Кх> — группа всех корней из 1 степени, не делящейся на р), G(K"r/Kv) * Z = (РгД (4.4.40) К- = U Kv(W[m)— объединение всех вполне разветвленных абелевых tn^\ расширений поля Kv- Описание символа норменного вычета 1. Для иеО* элемент Qv(u) = (u, Kk/Kv)v действует на с помо- щью элемента [w-1]/. 2. Символ норменного вычета (тс, Kn/Kv)v равен 1.
188 Арифметика алгебраических чисел [Гл. 4 3. Символ 0у(а) элемента а = тсти (т G Z, и G О*) действует на К™ как Fi; е G(KSr/Kv). Замечательная особенность конструкции группового закона на множе- стве состоит в том, что поле Кк не зависит от выбора униформизую- щей тс и многочлена f{X) G Ov [X], от которого лишь требуется выполнение следующих свойств 1) f(X) = кХ (mod deg 2), (4.4.41) 2) f(X)=Xq (mod тс). (4.4.42) Более того, вместо многочлена f можно использовать любой элемент мно- жества Fn степенных рядов f(X) G СЦ[Х]] со свойствами (4.4.41), (4.4.42). Построение указанного группового закона проводится с помощью тео- рии формальных групп {формальные законы Любина—Тэйта). 4.4.11. Абелевы расширения числовых и функциональных полей. Для поля рациональных чисел Q теорема Кронекера—Вебера (п. 4.4.1) также дает явное описание всех абелевых расширений с помощью действия группы Галуа на корнях из 1, которые можно рассматривать как специаль- ные значения экспоненты: = ехр{2тс//л}. Аналогичная теория существу- ет и над мнимым квадратичным полем К = Q(\Zd), абелевы расширения которого строятся с помощью действия группы G(K/K) на точках конеч- ного порядка эллиптической кривой с комплексным умножением (точнее, на координатах этих точек, см. §5.4), что составляет содержание тео- рии комплексного умножения. В более классических терминах абелевы расширения описываются с помощью специальных значений эллиптиче- ских функций и /-инвариантов, соответствующих решеткам с комплекс- ным умножением. Действие группы Галуа на эти значения явно описывает- ся в терминах арифметики мнимого квадратичного поля («Jugendtraum», «мечта юности» Кронекера), см. замечательную книгу С. Влэдуца [812]. Знаменитая двенадцатая проблема Гильберта состоит в том, чтобы для произвольного числового поля К, [К : Q] < оо, указать способ построения всех абелевых расширений с помощью действия группы Галуа на специ- альные значения некоторых специальных функций (таких как экспонента и эллиптические функции). Определенный прогресс в решении этой проблемы достигнут для по- лей СМ-типа, т. е. вполне мнимых расширений вида К = F{\T^a) вполне вещественного поля F. Это означает, что F порождено корнем многочлена с рациональными коэффициентами, который над R разлагается на линей- ные множители, а число atF вполне положительно, т. е. положительно для любого вложения F в R. Эта теория основана на изучении многомер- ных абелевых многообразий с комплексным умножением на элементы из К. Для вещественных квадратичных полей К описание некоторых абелевых
§ 4.4] Теория полей классов 189 расширений составляет содержание теории «вещественного умножения» Шимуры. Однако в указанных случаях ситуация менее удовлетворительна, чем для Q и для мнимого квадратичного поля /(, так как эти конструкции не дают всех абелевых расширений основного поля. Иное положение дел в функциональном случае конечного расширения поля рациональных дробей F<7(7). Здесь имеется превосходное описание всех абелевых рас- ширений К в терминах эллиптических модулей В. Г. Дринфельда (и соот- ветствующих им эллиптических функций в положительной характеристике, см. [35]). Этот результат является наглядным примером аналогии между числами и функциями. Идея описания расширений поля К с помощью действия G(K/K) на некоторых группах и на других алгебраических объектах является очень плодотворной: на ней основаны многие примеры явного построения и неа- белевых расширений основного поля /С Полное описание таких расшире- ний в терминах представлений Галуа и связанных с ними объектах анализа и алгебраической геометрии является составной частью грандиозной про- граммы Ленгледса, см. §6.5. Основное содержание новой книги Йосиды [849] составляет изучение специальных значений, задаваемых экспонентой производной в s = 0 ча- стичной дзета-функции выбранного класса идеалов а в числовом поле F. Такие специальные значения являются важными инвариантами, которые гипотетически связаны с единицами абелевого расширения числового поля и должны были бы давать ответ на двенадцатую проблему Гильберта. Пусть F — вполне вещественное поле, т. е. F 0 R = R" как R-алгебра. Следуя Шинтани, специальные значения в неположительных целых точках частичной дзета-функции ^(а, «) = Е N^~S lea ICOF являются рациональными числами, которые могут быть выражены в тер- минах некоторых производящих рядов, обобщающих производящий ряд для чисел Бернулли, см. [747]. Эти производящие ряды связаны с некоторыми неканонически опреде- ленными «разложениями на конусы» в F 0R (см. также [414], гл. I). Предполагаемые абсолютные периоды описываются в [849] в терми- нах функции, геометрически строящейся исходя из разложения на конусы, чей главный член задается периодами абелевых многообразий СМ-типа для произвольного СМ-поля, что является более явной формой гипотезы Колмеца [256]. На данный момент о СМ-периодах известно крайне мало, единствен- ным содержательным фактом для F = Q является классическая формула
190 Арифметика алгебраических чисел [Гл. 4 Чоула—Сельберга, ... -а\2 тт тл (a\w*W/2h , (L'(0, х)1 KP/((zd, id)2 ~ П г h) = d • exPj zkx) Г где К —мнимое квадратичное поле с дискриминантом -d, w — число кор- ней из единицы в /(, h — порядок группы классов Д', / — характер Дири- хле, соответствующий К [233], а рк(., .) — это множитель из разложений Шимура—Йосиды для абсолютных периодов. Также, используя якобиан кривой Ферма, Г. В. Андерсон обнаружил, что в случае циклотомических полей СМ-периоды связаны с логарифмической производной Л-функций Дирихле в s = 0: т)€б- где Г) — характер Дирихле, а— произвольное комплексное вложение поля /(, и [1(a) — ±1 или 0 (см. [120]). В 1970-х и 80-х годах Гарольд Старк (см. [774]) высказал гипоте- зы о значениях в s = 1 и s = 0 комплексных Л-рядов Артина, связанных с расширениями числовых полей К/F. Систематический подход к гипоте- зам Старка представлен в книге Тэйта, см. [795]. В общих словах, эти ги- потезы рассматривают специальные значения Л-функции Артина числовых полей и их аналогов, связывая их с некоторыми «регуляторами S-единиц» и аналогичными объектами. Более точно, гипотеза S (о единицах), обсуждаемая в главе II в [849], формулируется в терминах частичной дзета-функции lGOF,(l^=e связанной с элементом а из группы Галуа СаЦ/С//7) абелевого расширения К вполне вещественного поля F, разветвленного только над одной бес- конечной точкой F (здесь обозначает символ Артина). Гипотеза S утверждает существование такой единицы е в /(, что ^(0, а) = е° для каждого a G Gal(^F)- Существует метод, позволяющий вывести ги- потезу S о единицах из следующей гипотезы о действии группы Галуа: /£(Х)\° = с(х°) V (х) ) *(Х°)‘
§ 4.5] Группа Галуа в арифметических задачах 191 Здесь х € G обозначает (неабелевый) неприводимый характер расширения Галуа К поля F с конечной группой Галуа G = Gal(/(/F), с(х) — главный член разложения в ряд Тэйлора его L-функции Артина в s = 0: L(s, х, K/F) = Cids'™ + O(srW+1), 0 < r(x) e Z, а /?(х) обозначает обобщенный регулятор, который является определите- лем матрицы размера г(х), состоящей из линейных комбинаций с алгебра- ическими коэффициентами абсолютных значений единиц поля /С За последнее время получены важные достижения в изучении инвари- антов лучевой группы классов вполне вещественного поля F и в их ариф- метических интерпретациях (обобщение теоремы Штикельбергера, обоб- щение дедекиндовых сумм как некоторых коциклов и т. д.) Недавно в ра- ботах [545], [546] была дана интерпретация гипотез Старка, использу- ющая понятия из некоммутативной геометрии. § 4.5. Группа Галуа в арифметических задачах 4.5.1. Деление круга на п равных частей. Задача деления круга на п равных частей (см. [358], [29]) по форме является геометрической, однако ее решение, данное Гауссом, существенно опиралось на арифметические рассмотрения. Построение правильного семнадцатиугольника — это пер- вое математическое открытие Гаусса, записанное им в дневник 30 марта 1796 г., за месяц до того, как ему исполнилось 19 лет. До этого были известны способы построения правильного треугольника, пятиугольника, пятнадцатиугольника, а также тех многоугольников, которые получаются из них путем последовательного удвоения числа сторон. С алгебраической точки зрения построение правильного n-угольника эквивалентно тому, что- бы на комплексной плоскости построить корни степени п из 1, т. е. корни уравнения Г1- 1=0, (4.5.1) имеющие вид 2 к/? . 2к& Г 2k/Zz lai i / л с с* = cos----h i sin — = exp<----k k = 0, 1, ..., n - 1. (4.5.2) n n r I n ) Предположив, что задан отрезок единичной длины, можно при помощи циркуля и линейки строить новые отрезки, длина которых получается из длин имеющихся отрезков при помощи следующих операций: сложения, вычитания, умножения, деления и извлечения квадратного корня. После- довательное проведение этих операций позволяет строить любое число,
192 Арифметика алгебраических чисел [Гл. 4 лежащее в таком поле L, которое является объединением башни квадра- тичных расширений L = Lm Э...ЭЛ1 dLq = Q, (4.5.3) где di еЦ, и можно доказать, что никакие другие точки комплексной плоскости не могут быть построены циркулем и линейкой ИСХОДЯ ТОЛЬКО ИЗ ТОЧКИ 2=1. Поэтому способ построения величины z = а (если он существует) дол- жен быть основан на построении башни полей вида (4.5.3) для поля L, порожденного множеством корней неприводимого многочлена f(X) G Q[X] с одним из корней, равным а (поле разложения многочлена /). По теории Галуа квадратичному расширению L\/Q отвечает подгруппа Gi = G(L/L\), имеющая индекс 2 в группе всех симметрий Галуа Go = G(L/Q) множества корней многочлена f(X). Действие подгруппы G\ разбивает это множество на две части, причем сумма всех элементов каждой части лежит в по- ле L\ и порождает его, являясь инвариантной относительно автоморфиз- мов из Gj. На следующем шаге каждую из этих частей надо разбить на две части с помощью действия на корни элементами подгруппы G% = G(L/Li) (индекса 2 в Gi) и т. д., пока не получим подмножество корней, состоящее из одного элемента z = а. Например, для корня из единицы а = Ei из соотношения (4.5.2) непри- водимый многочлен /(X) — это круговой многочлен ФЛ(Х), корни которого Zk ((&, п) = 1) являются примитивными, а симметрии Галуа имеют вид Оа • ~ £ka (mod л) (# (Z//1Z) ). Для п = 5 имеем Go = {оъ ог, <*з» а подгруппа Gi = {oi, aj дает раз- биение множества примитивных корней на две части: {ei, £4} и ез}. При этом Фб(х) = х4 + х3 + х2 + х + 1, откуда следует, что sf 4* £1 4“ 1 4* Е| 1 4~ Е2 ^ = 0. Положив и = £1 + £4, мы получим, что 2 । in —14“ х/5 — 1 — х/5 и 4" и — 1 = 0, £1 4“ £4 = -2---’ Е2 4“ Ез = -------, откуда следует построение правильного пятиугольника. В случае п= 17 интуиция Гаусса подсказала ему способ группировки корней многочлена Ф17(х) =х16 4-х15 4-... 4- 1 с помощью симметрий, хотя теории Галуа еще не существовало! Группа симметрий Go = (Z/17Z)X является циклической порядка 16 с образующей 3 (mod 17) (первообразный корень), и идея Гаус- са состояла в том, чтобы перейти к более удобной нумерации корней (см. рис. 13). Присвоим корню Zk новый номер / (обозначается €[/]), если k = 3l (mod 17), / = 0, 1, ..., 15, и пусть Г/ обозначает автоморфизм а^.
§4.5] Группа Галуа в арифметических задачах 193 Рис. 4.3 Тогда TiE[m] = е[т+1 ] (m, / (mod 16)) (4.5.4) и соответствующие подгруппы имеют вид Go = {7b, Гь ..., Г15}, G2 = {70, Г4, Г8, Г12}, Gj = {То, Г2, , Г14}, G3 = {To, Г8}. Приведем реализацию только что описанной идеи. Прежде всего заметим что £1 4-е2 + ... -Нею = £[0] +£[1] "Ь ••• + Е[15] = “1 (4.5.5) (сумма геометрической прогрессии). Обозначим через om,r сумму корней ер] с теми номерами /, которые дают остаток г при делении на т. Получаем <*2,0 = Е[0] + Е[2] + ••• + Е[14] = У7 ^/£[0], Г/GGi <*2,1 =Е[1] +Е[3] + •••+Е[15] = 5? W’ Г/GGi Из равенства (4.5.5) видно, что <*2,0 “И <*2,1 = “К и почленное перемножение показывает, что <*2,0 ‘ <*2,1 = 4(С[0] + £[1 ] + ... + £[15]) = “4. Теперь, воспользовавшись теоремой Виета, мы найдем о2>о и o2j как корни квадратного уравнения х2 4- х - 4 = 0: х/17—1 — д/Т7—1 <*2,0 = 2 <*2,1 = 2
194 Арифметика алгебраических чисел [Гл. 4 они порождают поле К\ = Q(x/17). Мы учли, что О2,о><*2,ь в каждую из сумм корни входят со своими сопряженными, и в первом случае на- до сложить и удвоить вещественные части чисел 8ь 82, 84, 8в, а во вто- ром — чисел ез, 85, 8б, с?. Подобным же образом имеем 04,0 + 04,2 = аг.о, C4j + 04,3 = 02,1, и перемножение с помощью формулы (4.5.4) показыва- ет, что 04,0 * <*4,2 = <*2,о + <*2,i = “1, значит, 04,0, <*4,2 — корни уравнения х2 + <*2,о* -1-1=0, порождающие поле <4о = | • (/17- 1 + \/з4-2/Т7), <42 = | • (VT7 - 1 - ^/34 — 2л/17). Точно так же <4! = 1 . (-/17- 1 + т/з4 + 2/17), <43 = | • (-/17 - 1 - Уз4 + 2У17). Аналогично находим <4,0 = S[0] + Е[8] = 2 COS | • (о2,0 + (<4о)2 - 4О4,| ) = = | (/17 - 1 + ^34-2/17) + | • д/17 4- 3/Т7 - У170 + 38/17, что уже дает возможность построить правильный 17-угольник при помощи циркуля и линейки. В общем случае я-угольника с п = 2гр[1 ... prss, где pi —нечетные про- стые числа, мы видим, что G(Q(^)/Q)^(Z/mZ)x. Рассмотрение башни (4.5.3) квадратичных расширений показывает, что возможность построения правильного /г-угольника равносильна тому, что число |(Z/ziZ)x| =<p(n) = 2r~'(p1 - l)p['-l...(ps - 1)рр-' является степенью двойки, т. е. п = 2Гр\ ... ps, причем все pi — простые числа вида pt = 2т‘ + 1. Из простоты числа pz следует также, что пока- затель nti сам должен быть степенью двойки, так как mz делит pt — 1 по теореме Лагранжа для циклической группы (Z/pzZ)x, и мы получаем, что построение возможно только для чисел вида п = 2Гр\ •... • ps, где pt — простые числа Ферма, о которых шла речь в п. 1.1.2. Доказательство этого утверждения Гаусс не опубликовал: «Хотя границы нашего сочинения не позволяют привести это доказательство, мы думаем, что надо все же на это
§ 4.5] Группа Галуа в арифметических задачах 195 указать, для того чтобы кто-либо не пытался искать еще других случаев, кроме тех, которые указаны нашей теорией... и не тратил бы зря своего времени». 4.5.2. Расширения Куммера и символ степенного вычета ([225], [230], [467]). Пусть дано поле К, содержащее примитивный корень сте- пени т из 1, где т — фиксированное натуральное число, которое не де- лится на характеристику поля /(. Покажем, что циклические расширения L/К степени, делящей т,— это так называемые куммеровы расширения К(\/а)/К (ае К). В приложениях поле К является либо числовым, либо его пополнением. Любое расширение L/К, содержащее корень а много- члена Хт - а, содержит все его корни а, Пусть а — элемент группы Галуа G(K( у/а)/К). Пусть выбран корень а уравнения Хт = а. То- гда автоморфизм а вполне определен, если известен образ элемента а при действии а: а° = £*а. В частности, если а — элемент порядка т в муль- типликативной группе К* /(К*У\ то многочлен Хт — а неприводим и аг является m-й степенью только в том случае, если т | г. В этом случае отображение (modm) дает изоморфизм группы Галуа G(K(\/a)/K) на циклическую группу Z/mZ. Пусть теперь L — произвольное циклическое расширение степени т поля К. Явно построим такой элемент b е К, что L = K(y/b). Пусть а — образующий элемент циклической группы G(L/K), и пусть L = КМ для примитивного элемента у € L. Тогда элементы у, у°, ..., у°™ образуют базис L над полем К. Образуем сумму т-\ (4.5.6) s=0 Тогда р° = £-1|3 и 0 0, поскольку элементы у, у°, ..., у°т ' линейно неза- висимы над К; следовательно, [}т € К и 0Г £ К при 0 < г < т, т. е. 0m = b является элементом порядка т в факторгруппе Кх/(К*)т, и предыдущее рассуждение показывает, что поле К($) является циклическим расширени- ем степени т, содержащимся в L, так что L = К( у/b). Подобным же обра- зом проверяется, что два циклических расширения К( \/а) и K(y/b) поля К одинаковой степени совпадают тогда и только тогда, когда а = Ьгст для некоторых с е К и г е Z, где (г, m) = 1. Приведенные утверждения мож- но объединить в одно, сказав, что для данного поля К D р™ и его группы Галуа Gr = G(K/K) имеет место изоморфизм /<хЖхГ^Нот(Ск,^), (4.5.7) где е /<: С™ = 1} и char К )(т (изоморфизм Куммера). Для по- строения изоморфизма (4.5.7) по данному аеКх выберем такой элемент
196 Арифметика алгебраических чисел [Гл. 4 Y е К\ что у"1 = а и тогда для о е Gk формула <ра(о) = y°/y будет зада- вать некоторый гомоморфизм <ра: Gk Тот факт, что этим задается изоморфизм (4.5.7), вытекает из общей теоремы Гильберта 90 о кого- мологиях мультипликативной группы: Hx(Gk, Кх) = {0} (см. п.4.5.3). Пусть теперь — числовое поле, С /(, р = — простой диви- зор, отвечающий неархимедовой точке v поля К. Разложение просто- го дивизора р поля К в поле К(\/а) сводится к изучению расширения Kv(\/a) локального поля (по теореме о продолжении нормирований, см. п. 4.3.6). Можно считать, что а лежит в кольце Ок целых элементов поля /<, и предположим, что р\та. Тогда разложение максимального идеа- ла р с Ок определяется по разложению многочлена Хт - a (modp) над полем Ок/р (по лемме из п. 4.2.3); это разложение состоит из попарно различных неприводимых множителей степени /, где f — степень поля классов вычетов, т. е. наименьшее такое натуральное число, что сравне- ние at =хт (modp) разрешимо в <9к/р. При этом идеал р неразветвлен в L = К( у/а) и р = •... • tyWr (f • г = m). В частности, дивизор р вполне распадается, если f = 1, т. е. сравнение хт = a (modp) разрешимо. Определим символ степенного вычета. Для этого рбозначим через S множество точек поля /(, которые или делят т, или являются архимедо- выми, а для элементов ai, ..., а/ G /<х обозначим через S(a\, ..., а/) мно- жество всех элементов из S, а также тех нормирований v, для которых |a/|v 1 при некотором /. Для a G /<х и точки v £ S(a) определим символ степенного вычета 6 с помощью равенства v \v ) v ’ (4.5.8) где L = K(y/a), ?l/k(v) £G(L/K)— глобальный символ Артина (см. п. 4.4.6). Число Gpm не зависит от выбора у/a, и можно проверить, что <4м> Согласно определению Fqk(v) как элемента Фробениуса равенство (4.5.8) равносильно сравнению (v/a)Nu-1 = (modpy), из которого вытекает, что т | (Nv — 1) и a(Nv-D/m = (modpy) (4.5.10) (обобщенный критерий Эйлера), поскольку группа (Ov/pv)x является циклической порядка Nv — 1. Для произвольного дивизора ь = П р"<и) е /S(a) I
§ 4.5] Группа Галуа в арифметических задачах 197 (а\ гт (а\п^ положим - = II - , тогда a£S(a)W (^a)Fw(b> = (4.5.11) где FL/K(b)— глобальный символ Артина, и выполняется равенство Ш = (ь-ь'е (45|2> Для любого простого дивизора v S(a) эквивалентны следующие утвер- ждения: " ©=' 2) сравнение хт = a (modpy) разрешимо при х е Ov\ 3) уравнение х171 = а разрешимо при х е Kv (решение сравнения из утверждения 2 можно поднять до решения уравнения из утверждения 3 по лемме Гензеля над кольцом Ov, см. п. 4.3.2). Для целого идеала b с Ок значение символа (-) зависит только от a (mod b), если а еОк- Таким образом, определен характер степени т\ хь: (Ок/Ь)х-^, Xb(a) = (f). (4-5.13) Кубический закон взаимности. Пусть К = Q(Cs) = Q(\/~3), т = 3. Тогда Ок = Z[C3] — кольцо главных идеалов и если р = ру = (тс) для про- стого элемента тс, то для кубического символа будем использовать обо- значение вместо Назовем простой элемент тс примарным, если тс = 2 (mod 3), т. е. или к = q — простое рациональное число, q = 2 (mod 3), или Ntc = р = 1 (mod3), тс = 2 (mod3). Можно проверить, что среди обра- зующих р, р{3, существует ровно одно примарное число. Пусть pi = (tcj), р2 = (тег), TCi, тс2 — примарные числа и Npj ^Np2/3. Тогда справедлив закон взаимности (см. [328], [432]) (?)=©• <4'544’ Биквадратичный закон взаимности. Пусть ги = 4, К = Q(0, Ок = = Z[z] — целые гауссовы числа. Назовем элемент а е Ок примарным, если <х = 1 (mod(l +/))3. Тогда проверяется, что в каждом простом идеа- ле р, р{2, можно выбрать примарную образующую, причем единственным образом. Если pi = (tci), р2 = fe), tcj, тег — взаимно простые примарные числа, то справедлив закон взаимности (см. [328], [432]) f Е1Л = ])(№-!)/4M(Nn2-l)/4) (4 5 15) \К1 / \К1 /'
198 Арифметика алгебраических чисел [Гл. 4 4.5.3. Когомологии Галуа. Теория когомологий групп дает регулярный способ извлечения арифметической информации из групп Галуа, действую- щих на различных объектах: алгебраических числах, классах иделей, точ- ках алгебраических многообразий и алгебраических групп и др., см. [712], [713], [714], [230], [432], [467], [50], [836]. Пусть G — некоторая ко- нечная (или проконечная) группа, действующая на некотором G-модуле А (с дискретной топологией). Группы когомологий G с коэффициентами в А определим с помощью комплекса коцепей. Рассмотрим абелевы группы C°(G, А)=А, Cn(G, Л) = | f: G х х G —»А: f непрерывно, n > 11 п раз (сложение функций поточечное, а непрерывность функции f е Cn(G, А) означает, что функция f(g\, ..., gn) зависит только от смежного класса элементов gi по некоторой открытой нормальной подгруппе в G). Формула (dnf)(gl....gn+l) = glf(g2, •••, gn+l) + п + $2(-l)'7(gb •••’ &gi+i’ •••- £«+') + (- 1)"+1/(gi. ". Sn) (4.5.16) i=l определяет гомоморфизм dn: Cn(G, Л) -* Crt+I(G, Л), причем справедливо равенство dndn-\ = 0. Группа Zn(G, Л) = Кегб/л называется группой я-коциклов, а группа Bn(G, Л) = Irndfl-i (при п 1) — группой я-кограниц; в силу свойства dndn_\ = 0 имеем Bn(G, Л) с Zn(G, Л) и определены группы когомоло- гий {Kerdrt/Imdrt-i при п^ 1, 1 (4.5.17) Kerdo прил = 0. Если п = 0, то HQ(G, А) = AG = {а е A: ga = a для всех g е G}. (4.5.18) При п = 1 назовем отображение f: G —> А скрещенным гомоморфиз- мом, если для всех g\, gzt G справедливо равенство f(gig2) = f(gi) + gif(g2). (4.5.19) Скрещенный гомоморфизм распадается, если при некотором фиксиро- ванном a G А его можно записать в виде f(g) = a — ga и Н[(й,А) яв- ляется факторгруппой группы всех скрещенных гомоморфизмов из G в А
§4.5] Группа Галуа в арифметических задачах 199 по подгруппе, образованной распадающимися скрещенными гомоморфиз- мами. Если действие G на А тривиально, то Hl(G, Л) — это группа всех обыкновенных гомоморфизмов (с условием непрерывности). При п = 2 элементы группы //2(G, Л) взаимно однозначно соответству- ют классам эквивалентности расширений группы G с помощью А\ для рас- ширения 0->Л->С->С->1 (4.5.20) и для всех g е G выберем некоторое поднятие g в G (т. е. выберем сечение g^g проекции G—>G). Определим функцию f: GxG—*A, f(g\, gz)€A, равенством gl-g2 = f(gl, g2)gl~g2- (4.5.21) Тогда функция f является 2-коциклом группы G со значениями в А, Если заменить выбор представителей g (т. е. выбор сечения G -* G), то f изме- нится на кограницу, значит, класс функции f в //2(G, Л) зависит только от расширения (4.5.20). Группа //2(G, Сх) называется также мультиплика- тором Шура группы G. Если L/K — расширение Галуа с группой Галуа G = G(L/K), действующей на G-модуле Lx, то //2(G, L)x интерпретиру- ется как группа Брауэра, см. п. 4.5.5. Для действия группы Галуа G = G(L/K) на Lx справедлива следующая теорема. Теорема 4.25 (теорема Гильберта 90). Имеет место равенство Hl(G(L/K),Lx) = {l}. Идея доказательства этого важного факта та же, что и в описании циклических расширений из п. 4.5.2. Пусть /: G-> Lx —произвольный скрещенный гомоморфизм, feZl(G, Lx). В мультипликативной записи это означает, что для всех g, h eG имеем f(h)g = f(gh)/f(g) G Lx. Под- берем такое число b^Lx, что для всех geG выполняется равенство [(g) = Ь/Ьё. Для этого выберем примитивный элемент у расширения L/K, так что числа yg(g G G) образуют базис L над /(, поэтому число b = Ylf(^hheL heG отлично от нуля. Применив к обеим частям равенства (4.5.21) элемент gtG, получим bg = X = Е f^eh = Ag)“' E f^h)xeh = Kgr'b heG heG heG (по формуле левого действия (уЛ)£ = (g, h G G)). Этот прием усред- нения известен также как построение резольвенты Лагранжа в тео- рии разрешимых расширений полей (использование нормального бази-
200 Арифметика алгебраических чисел [Гл. 4 са не является здесь необходимым если заметить, что гомоморфизмы g: L* —> Л*, х —> х§ линейно независимы над L по теореме Артина о харак- терах (Е. Artin), поэтому найдётся у € Л*, такой, что b не равен нулю). Свойства групп когомологий. 1. Для произвольной точной последовательности G-модулей 0—>А—>С^0 определена точная последовательность когомологий О -> //°(G, Л) //°(G, В) -> /7°(G, С) /У1 (G, Л) — — №(G, B)^H'(G, С)^> H2(G, А)Hn(G, Л)-> -+Hn(G, B)-^Hn(G, C)^Hn+l(G, Л)—>... (4.5.22) Пример 4.26 (теорема Куммера). Пусть поле К содержит группу всех корней из 1 степени т из К и char К не делит т. Для произвольного расширения Галуа L/К с группой Галуа G = G(L/K) отображение х хт задает гомоморфизм G-модулей v: Лх —> Лх, и имеется точная последова- тельность Переходя к когомологиям (4.5.22), мы получаем точную последователь- ность tf°(G, pw) -+ tf°(G, Lx) tf°(G, Lx) -+ ^//1(G,^)^//I(G,LX)^... (4.5.23) Так как G действует на тривиально, группа Н1 (G, рт) совпадает с груп- пой Hom(G, pm), и, очевидно, является частью группы L\ неподвижной относительно действия группы G = G(L/K): (LX)G = Кх. Кроме того, HQ(G, = и H'(G, Lx)= 1 по теореме Гильберта 90. В результате получается точная последовательность 1 Кх Л #х -► Hom(G, рш) - 1, равносильная изоморфизму Куммера Kx/(/<x)^Hom(G,^). 2. Пусть Н — открытый нормальный делитель в G, А — некоторый G-модуль, тогда имеется точная последовательность 0—>H'(G/H, AH)^Hl(G, Л)—Л), (4.5.24) где Inf обозначает гомоморфизм инфляции, который происходит из рас- ширения коцикла f на G/Н до коцикла J на G со значениями в А77 с А,
§4.5] Группа Галуа в арифметических задачах 201 a Res — гомоморфизм ограничения, который дается ограничением коцик- лов на подгруппу Н с G. 3. ^-произведения. Пусть А, В, С —три G-модуля и задано G-инва- риантное спаривание о: А х В —> С (т. е. для любых g е G, аеА, b €В, выполняется равенство g(aob) = gao gb). Например, если А = В — неко- торое кольцо, на котором группа G действует тривиально, то умножение в А является таким спариванием. Любое G-инвариантное спаривание А х В С индуцирует для п 0 и т 0 некоторое билинейное отображение Hn(G, А) х Hn(G, В) /Г+7С, С), (4.5.25) которое называется ^-произведением и определено на коциклах по сле- дующему правилу. Если f G Cn(G, Л), е Cm(G, В), то коцепь (f°f')(gl, •••. gn+m) = f(gi, •••, gn)°(gl gn}f'{gn+\, gn+m) (4.5.26) является коциклом, имеет место равенство dn+m(f о /') = dnf о /' 4- (-1)7 о dmff и формула =ТИ' eHn+m(G, С) корректно определяет ^-произведение (4.5.25). Справедливо равенство а Д^р = (-1УД„+т(а р). (4.5.27) Если Л = В = С — коммутативное кольцо, на котором G действует три- виально, a G Hn(G, Л), р G Hm(G, Л), то ач>р = (-1)лтроа. (4.5.28) 4.5.4. Когомологическое определение локального символа. Пусть К — конечное расширение поля р-адических чисел Q₽. Локальный символ Артина является отображением 9: /Сх -+ = lim G(L/X) (4.5.29) 7” мультипликативной группы /<х в группу Галуа максимального абелева рас- ширения (т. е. объединения всех абелевых расширений L/K)\ он был опи- сан в §4.4 с привлечением мощных глобальных средств — закона вза- имности Артина. Однако, как отмечалось, символ 0 можно определить независимо и чисто локально, а затем из его свойств уже вывести глобаль- ный закон взаимности, доказав формулу произведения (4.4.27).
202 Арифметика алгебраических чисел [Гл. 4 Определим для данного aG/(x его образ 0(a) = 0^д(а) G G(L/K) (в расширении L/К) с помощью характеров / G Hom(G(L//(), Q/Z); эле- мент 0(a) конечной абелевой группы G(L/K) однозначно определен, если заданы все значения /(0(a)) для всех характеров /. Заметим, что Hom(G(L//(), Q/Z) = H'(G(L/K), Q/Z), и воспользуемся точной последовательностью 0 Z -> Q Q/Z О, из которой получается изоморфизм А,: Н1 (G(L/K), Q/Z) H2(G(L/K), Z), (4.5.30) если написать длинную когомологическую последовательность (4.5.22) и учесть, что когомологии однозначно делимой группы Q тривиальны: H\G(L/K), Q) = {0} при/^1. Мы видели в п. 4.5.3, что //'(С(Л//ОЛХ) = {0}. Кроме того, имеют место следующие фундаментальные факты о когомоло- гиях мультипликативной группы: а) H3(G(L/K), Lx) = {0}; б) существует вложение inv/(: tf2(G(L/K), Lx) — Q/Z. (4.5.31) Образ элемента 0 G H2(G(L/K), Lx) при вложении (4.5.31) называется инвариантом элемента 0. Для конечного расширения L/К группа H2(G(L/K), Lx) циклическая и имеет порядок [L : АГ]. Теперь рассмотрим спаривание Lx х %-+LX ((х, т)^хт), которому отвечает ^-произведение групп когомологий H°(G(L/K), Lx) х H2(G(L/K), Z) - H2(G(L/K), Lx), причем Hq(G(L/K), Lx) = Kx, ^eH2(G(L/K),%) и ач>Д1Хее//2(О(Л//0, Lx) при ae Kx. Положим X&L/K (a)) = 'nv* (a A i x). (4.5.32)
§4.5] Группа Галуа в арифметических задачах 203 Тогда 0л/к(а) — корректно определенный элемент группы G(L/K) и, пере- ходя к проективному пределу, можно определить элемент 9(a) = lim 0д,/к (а) е G^ L исходя из следующего свойства согласованности. Рассмотрим башню (абе- левых) расширений Галуа К С L' с L, и пусть G = G{L/K), Н = G(L/U). Пусть — характер группы G/Н и /— соответствующий характер груп- пы G. Тогда если ae^x индуцирует элемент sa = 0£/к(а) G G и эле- мент s' е G/Н при проекции G —> G/H, то x(sa) = X^a)- Это следует из определения инварианта xC$a) = inv/((a о Al/) и того факта, что отобра- жение инфляции переводит /7 (соответственно Aj/') в характер / (соот- ветственно в Al/), с использованием коммутативной диаграммы (L')x)----125----* //2(G, Lx) (4.5.33) Q/Z Содержательное определение inv^ и свойство согласованности связаны с группой Брауэра и будут приведены в следующем пункте. Эта согла- сованность и позволяет определить символ (4.5.29). Если в поле К содержится корень степени т из единицы Си, то можно определить символ норменного вычета (а, 0) степени т для а, 0 G /<х условием 0L/HP)^ = (a,P)v^ (4.5.34) в котором L = K{\/a) — циклическое расширение, 0^д(0)— локальный символ (4.5.32). Значения (а, 0) являются корнями из единицы степени т и удовлетворяют следующим условиям: 1) (аа', 0) = (а, 0)(а', 0); 2) (а, 00') = (а, 0)(а, 0'); 3) (а, 0)(0, а) = 1; 4) из равенства (а, 0) = 1 для всех 0 е /<х следует, что a G (Кх)т 5) (а, 0) = 1 тогда и только тогда, когда 0 является нормой в расши- рении K(qfa)/K. Символ (а, 0) можно интерпретировать как [J-произведение некото- рых одномерных групп когомологий. Вычислениям этого символа посвя- щены работы [49], [100]. 4.5.5. Группа Брауэра, закон взаимности и принцип Минковско- го—Хассе. Напомним сначала основные сведения о группе Брауэра про- извольного поля К (см. [538], [66], [713], [726], [97]).
204 Арифметика алгебраических чисел [Гл. 4 Конечномерная алгебра А над полем К называется простой цен- тральной над К, если существует такое п 1, что А К = Мп(К) (К — алгебраическое замыкание поля К, а Мп—алгебра (п х я)-матриц). Тен- зорное умножение индуцирует на множестве (классов с точностью до изо- морфизма) центральных простых К-алгебр структуру коммутативной по- лугруппы. Следующее отношение эквивалентности превращает ее в группу: алгебра А эквивалентна В, если существуют такие m, п 1, что алгебра А Мт(К) изоморфна В Мп(К). Все матричные алгебры над К эк- вивалентны друг другу и составляют нулевой класс. Класс алгебры Л°, инверсной к А (т. е. состоящей из тех же элементов, что и Л, и с тем же сложением, но с умножением в обратном порядке), обратен классу А. Действительно, каноническое отображение А Л° —> End/< А (эндомор- физмы линейного пространства Л), которое ставит в соответствие элементу х 0 у € А Л° умножение на х слева и на у справа, является изомор- физмом: либо его ядро тривиально, либо алгебра А Л° проста, а ее раз- мерность совпадает с размерностью End/< Л, т. е. с (dim# Л)2. Группа классов эквивалентности центральных простых алгебр над К называется группой Брауэра поля К и обозначается ВгК. Она допуска- ет еще следующее когомологическое описание. Пусть L/K — некоторое расширение поля К. Оно называется полем расщепления К-алгебры Л, если А L = Mn(L). Эквивалентные алгеб- ры имеют общие поля расщепления. Пусть Вг(К, L) — подмножество груп- пы Брауэра, состоящее из классов алгебр с полем расщепления L. Оно является подгруппой. Предположим теперь, что L/K — расширение Галуа с группой Галуа G = G(L/K). Тогда можно установить следующий фунда- ментальный изоморфизм: Вг(Л\ L)^H2(G, L*). (4.5.35) Он допускает различные описания. Мы укажем одно из них, так называемую конструкцию «скрещенных произведений». Оно состоит в явном построе- нии центральной простой алгебры над К по заданной «системе факторов», т. е. по коциклу {ag^} е Z2(G, Lx). Эта алгебра строится так: Л = ф Leg, geG egeh = agyhegh для всех g, h eG4 ega = g(a)eg для всех g e G. Ее размерность над К, очевидно, равна [L: К]2. Мы опускаем проверку всех нужных свойств конструкции; отметим лишь, что ассоциативность ал- гебры А равносильна тому, что коцепь «структурных констант» {аё^} является в действительности коциклом.
§4.5] Группа Галуа в арифметических задачах 205 Условие расщепления алгебры А над расширением L имеет важные арифметические приложения. Положим N = п2 и выберем какой-нибудь базис {ан а/v} в А над /(. Если воспользоваться изоморфизмом F:A®KR^Mn(K), (4.5.36) то все элементы N а = Xia'1 е (х/ е К) i = \ станут матрицами F(a) G Мп(К). Тогда можно проверить, что отображе- ния т(а) = tr(F(a)), v(a) = det(F(a)) являются полиномиальными функци- ями от %1, ..., xyv с коэффициентами в основном поле и называются соответственно приведенным следом и приведенной нормой элемента аеА [836], т(а) = 1д(%1, • • • ♦ *n) — линейная форма, v(a) = Фл(хь %2, ..., xn) — однородный многочлен степени п. Поскольку F(ab) = F(a)F(b) при изоморфизме (4.5.36), мы имеем v(ab) = = v(a) • v(b). Но в алгебре с делением любой ненулевой элемент а обратим, поэтому Ф/| не представляет нетривиального нуля над полем К. Однако если А 0 = Mn(L), то Фд представляет нетривиальный нуль над Ц при этом изоморфизме решения уравнения ФД%1, ..., xN) =0 (х/G Л) (4.5.37) в точности соответствуют вырожденным матрицам. Опишем теперь локальный инвариант (см. [230], [713]) inv/(: Вг/< —Q/Z (4.5.38) в том случае, когда К — это конечное расширение поля Qp. Пусть А — центральная алгебра с делением (тело) над полем К,[А : К] = п2. По- казатель v = vr поля К единственным способом продолжается до пока- зателя Va на Л, совпадающего с v на центре К алгебры А. Например, можно сначала продолжить v на полные поля /((а) для а G А и воспользо- ваться согласованностью таких продолжений по свойству единственности продолжения нормирований на конечные расширения полных полей. Рас- сматривая редукцию алгебры А по модулю показателя va, можно прове- рить, что А содержит максимальное коммутативное подтело L, неразветв- ленное над центром /(. При этом элемент 8 g Вг/(, соответствующий А, расщепляется над L, т. е. 8 G H2(G(L/K), Lx). Неразветвленное расши- рение L/К не единственно в Л, однако все такие расширения сопряже- ны по теореме Сколема—Нётер. Эта теорема утверждает, что любой
206 Арифметика алгебраических чисел [Гл. 4 изоморфизм L в А над К индуцирован некоторым внутренним автомор- физмом алгебры А. Следовательно, существует такой элемент Л, что = L и внутренний автоморфизм х уху”1, ограниченный на подпо- ле Л, совпадает с автоморфизмом Фробениуса Гг^д. Более того, элемент у определяется однозначно с точностью до множителя из группы Lx. Пусть Va : Ах —> -Z— продолжение vr на А, Тогда можно определить inv# 8 как п /1 \ образ элемента г>д(у) в группе (-Zj/ZcQ/Z. Это определение можно сформулировать иначе, заметив, что отображение х »—> упху~п равно Ег2д и поэтому тождественно, так как n = [L:K]. Следовательно, элемент ул коммутирует с элементами из L и чп = с е Lx, VaM = ±vA(Yn) = ^va(c) = ^vi№- (4.5.39) Поэтому inv8=^ (c = k1lu), где u e — униформизующий элемент в L, т. e. = 1, Vl(u) = 0. Перейдем к глобальному случаю и рассмотрим расширение Галуа чис- ловых полей L/К с группой Галуа G = G(L/K). Для точки v поля К пусть Gv С G обозначает группу разложения некоторого продолжения w точ- ки v на L; мы знаем, что подгруппа Gv однозначно определена по и, если расширение L/К абелево (см. §4.4). Вложение L-+ Lw индуцирует гомо- морфизм фр: H2{G, L*)-*H2(Gv, L*). (4.5.40) Проверяется, что для элемента ote//2(G, Lx) образы сраа обращаются в нуль для почти всех v (кроме конечного их числа): если у коцикла {agth} £ Z2(G, Lx), представляющего а, все значения ag^ принадлежат Ох и расширение Lw/Kv неразветвлено, то Hl(Gv, Ох) = 0 при i 1. Этот факт выводится из точной последовательности когомологий, соответству- ющей точной последовательности 1 ~^ОХ ^Lx —> Z —* 0, и является вариантом леммы Гензеля (п. 4.3.2). Таким образом, существует корректно определенное отображение H2(G,L*)^®H2(Gv,L*), (4.5.41) V где w — фиксированное продолжение точки v и суммирование произво- дится по всем простым точкам v поля /(. В этой ситуации локальные ин- варианты inNKv-.H2(Gv,Lx)^Q/Z
§ 4.5] Группа Галуа в арифметических задачах 207 индуцируют отображение ®/72(Gv, L*)-^Q/Z, (4.5.42) V которое определяется как суммирование локальных инвариантов. Локально-глобальный принцип Минковского—Хассе утверждает, что последовательность 0 H2(G, Лх) - ©//2(G“, L*) -> Q/Z, (4.5.43) V полученная с помощью отображений (4.5.41) и (4.5.42), точна. Точная последовательность (4.5.43) играет ключевую роль во многих вопросах арифметики. Например, утверждение о том, что отображение (4.5.41) является вложением, равносильно тому, что для формы приве- денной нормы \>(а) = Фд(%1, х2, ...,х„2) (4.5.44) справедлив принцип Минковского—Хассе, т. е. она представляет нетри- виальный нуль над полем L тогда и только тогда, когда она представляет нетривиальный нуль над всеми его пополнениями. Утверждение о точности в среднем члене ф//2(би, Л*) полностью описывает классы алгебр с делением Л, расщепляемые над L. Они взаимно однозначно соответствуют наборам чисел 0 < i(v) < п, сумма которых делится на п; при этом для некоторой алгебры А с классом 8 G H2(G, Lx) выполняется условие inv^ cpv(8) = i(v)/n G (l/n)Z/Z. Наконец, утверждение о том, что для 8 G H2(G, Lx) всегда выполнено равенство $2inv*» (ч*0 <8)) = ° € Q/z- V эквивалентно, в сущности, формуле произведения для локальных симво- лов (4.5.38) и глобальному закону взаимности. Действительно, если а = (ау)у G Jr —некоторый идель, то глобальный символ Артина 0(а) G Gfi определяется как предел 0(a) = lim П ОДаД S uGS причем произведение конечно, а локальные символы 0у(ау) задаются усло- вием x(%(«v)) = inv/(0(a„ Д,х) (4.5.45) (см. соотношение (4.5.32)) для всех характеров / е №(G^, Q/Z). Если же a G /<х, т. е. ay = a G Кх для всех V, то для произвольного характера / G H}(G^, Q/Z) имеем хШМ =52'пУ/<»(о(ч-'Л|х)=0> \ V / V
208 Арифметика алгебраических чисел [Гл. 4 | так как элемент a4>Alxe//2(G^,Q/Z) лежит в глобальной группе Брауэра. В случае, когда расширение L/К циклическое, с помощью чисто кого- мологических приемов строится канонический изоморфизм H\G(L/K}, Lx)^Kx/Nl/kL* (4.5.46) и из точной последовательности (4.5.43) вытекает следующий результат. Теорема 4.27 (теорема Хассе о нормах). Если ае Кх, L/K — цик- лическое расширение, то ae^t/xL* тогда и только тогда, когда а £ ^lw/kvLw для всех точек v поля К. В частности, пусть G — группа порядка 2, так что L = K(Vb). Тогда Nl/k(x + y\/b) = х2 — by2, и потому а представимо в форме х2 — by2 то- гда и только тогда, когда такое представление локально существует всюду. Отсюда следует, что квадратичная форма Q(x, у, z) над К от трех пе- ременных имеет нетривиальный нуль над К тогда и только тогда, когда она имеет нетривиальный нуль в каждом пополнении поля К. Переходя к произвольному п, мы можем получить теорему Минковского—Хассе о том, что квадратичная форма имеет нуль тогда и только тогда, когда она локально имеет нуль всюду (см. [230], [222]). Как было отмечено Б. Морозом (Математический институт Макса Планка, Бонн), теорема Хассе о нормах имеет место и для некоторых нециклических расширений, что доставляет интересные примеры выполне- ния принципа Минковского—Хассе, в то время как теорема 6.11 на с. 309 из [85] дает интересные когомологические условия для выполнения теоре- мы Хассе о нормах.
ГЛАВА 5 АРИФМЕТИКА АЛГЕБРАИЧЕСКИХ МНОГООБРАЗИЙ §5.1. Арифметические многообразия: схемы конечного типа над кольцом целых чисел 5.1.1. Решение уравнений и кольца ([64], [71], [109], [108], [195]). Изучение алгебраических уравнений—древнейшая математическая наука. В новые времена мода и удобство диктуют обращение к кольцам. Замена системы уравнений некоторым кольцом является шагом, аналогичным рас- смотрению конечных расширений полей вместо корней конкретных много- членов. Рассмотрим систему уравнений X: Fi(Tj) = 0 (ielJeJ). Здесь /, J — некоторые множества индексов, Tj — независимые перемен- ные, Fi — многочлены из кольца Кольцо К называется основным кольцом или кольцом констант. О системе X говорят, что она определе- на над К- Что следует называть решением системы X? Одно определение напрашивается: решение есть такой набор элементов (/;), / € /, кольца /(, что Fi(tj) = 0 для всех i е /. Однако это определение слишком ограничи- тельно: нас могут интересовать решения, не принадлежащие /(, например комплексные корни многочлена с рациональными коэффициентами. Вооб- ще, пусть L — некоторая /(-алгебра. 5.1.2. Множество решений систем. Определение 5.1. Решением системы X со значениями в /(-алгебре L называется такое семейство элементов tj^L, что Fi(tj) = O для всех i е /. Множество всех таких решений обозначается X(L). Поскольку любое кольцо является Z-алгеброй, для любой системы с целыми коэффициентами можно рассматривать ее решения в любом кольце. Пусть /: L\ —> L2 — гомоморфизм К-алгебр, т. е. отображение, кото- рое одновременно является гомоморфизмом /(-модулей и колец. Сопо- ставляя каждому решению (/7) системы X со значениями в Ц решение (/(/;)) этой же системы со значениями в L2, получаем отображение мно- жеств X(L\) ^X(L2).
210 Арифметика алгебраических многообразий [Гл. 5 5.1.3. Пример: «язык сравнений». Пусть п — целое число вида 4m + 3. Вот классическое доказательство того, что п не является сум- мой двух квадратов целых чисел: иначе было бы разрешимо сравнение + Г22 = 3 (mod 4): простейший перебор показывает, что это не так. С на- шей точки зрения, это рассуждение означает следующее. Пусть X: 7’|2 + 7’22-« = 0 (K = Z). Мы хотим доказать, что X(Z) = 0. Рассмотрим гомоморфизм редукции Z —> Z/4Z; он определяет отображение множеств решений X(Z) —>X(Z/4Z). Если бы множество X(Z) было непусто, то и X(Z/4Z) было бы непусто, а это не так. Вообще, для любой системы уравнений X с целыми коэф- фициентами справедливо следующее определение: если X(L) = 0 для ка- кого угодно нетривиального кольца L (в котором 0^ 1), то и X(Z) = 0. Практически обычно проверяются конечные кольца Z/mZ и поле ве- щественных чисел R. Более правильным с теоретической точки зрения является рассмотрение р-адических полей и кольца аделей (см. гл. 4, §4.3). Ряд самых глубоких результатов теории диофантовых уравнений связан с вопросом, когда верно обратное утверждение («принцип Мин- ковского—Хассе»). Прототипом их является теорема Лежандра', пусть K = Z, Х:а17’12 + а27’22 + а37’з2 = 0; если X(Z) = {(0, 0, 0)}, то хотя бы для одного из колец L = Z/mZ (т / 0, 1) или L = R имеем X(L) — {(0, 0, 0)} (см. [14], гл. 1, §7; гл. 1, п. 1.2.4). 5.1.4. Эквивалентность систем уравнений. Определение 5.2. Две системы уравнений X, Y с одними и теми же неизвестными, заданные над кольцом /(, называются эквивалентными, если X(L) = Y(L) для любой К-алгебры L. Среди систем уравнений, которые эквивалентны данной, мы можем рассмотреть «самую большую», которая однозначно определяется. Пусть Р — идеал в кольце многочленов К[Т/], порожденный левыми частями си- стемы уравнений X : {/Д7)] = 0}. Легко понять, что система уравнений, полученная приравниванием к нулю всех элементов идеала Р, эквивалент- на данной системе уравнений и является максимальной в том смысле, что если к ней добавить еще одно уравнение F = 0, в ней не содержащееся, то получится новая, не эквивалентная данной система. Чтобы в этом убедить- ся, достаточно в качестве /(-алгебры L взять факторкольцо К[Т']/Р, где Т- — независимые переменные. В этом кольце решением исходной системы будет tj = Т- (mod Р), в то время как F(tj) = 0, потому что F Р. 5.1.5. Решения системы как гомоморфизмы К-алгебр. Резюмируя сказанное, имеем X(L) = Нот/<(Л, L), где А = K[Tj]/P, Нот^ — множе- ство гомоморфизмов /(-алгебр.
§5.1] Арифметические многообразия 211 Система X называется совместной, если X(L) / 0 для некоторой нену- левой /(-алгебры L, и несовместной в противном случае. Доказанное пред- ложение показывает, что система X несовместна лишь в том случае, когда ее алгебра нулевая, т. е. 1 е Р. Итак, установлена эквивалентность двух языков: (система уравнений X над коль-1 ( К-алгебра А с выделенной 1 1 цом К с неизвестными Г7, jeJ j 1 системой образующих /у, jeJ j * Г решение системы X1 Г гомоморфизм К-алгебр [ в/(-алгебре A j [ A-+L При использовании языка колец нет необходимости рассматривать фиксированную систему образующих (/;). Опуская ее, мы отождествляем системы уравнений, получающиеся друг из друга взаимно обратной заме- ной множества неизвестных. Каждый элемент кольца А играет роль одной из «неизвестных»; значение, которое эта неизвестная принимает в дан- ном решении системы, совпадает с ее образом при гомоморфизме А —> L, соответствующем этому решению. В традиционной алгебраической геометрии рассматривается алгебра- ически замкнутое поле К = К и аффинное алгебраическое многообразие Z <^Кп определяется как множество нулей некоторой системы многочле- нов Fi(T\, ..., Тп) еК[Т\, ..., Тп]. При этом кольцо регулярных алгебраи- ческих функций А = K[Z] на множестве Z описывается как факторкольцо К[Т\У ..., Tn]/Pz по идеалу Pz всех многочленов, обращающихся в нуль на Z. Такие кольца характеризуются как конечно порожденные кольца над К без нильпотентных элементов. Отказ от такого ограничения на А позволяет перейти к построению абстрактной теории многообразий (схем), основополагающая идея которой состоит в том, чтобы превратить любое (коммутативное) кольцо А в кольцо (модифицированных) функций на неко- тором топологическом пространстве Spec Л (спектре кольца). 5.1.6. Спектр кольца. Определение 5.3. Множество всех простых идеалов кольца Л, отлич- ных от Л, называется спектром кольца А и обозначается Spec А. Элемен- ты х е Spec Л называются точками спектра и обозначаются также рх с А. Напомним, что простота идеала рх означает, что факторкольцо А/рх не имеет делителей нуля; его поле частных обозначается через /?(х). 5.1.7. Функции на спектрах. Пусть /еЛ и хе Spec А Положим /(%) = f (mod рх); мы считаем, что Дх) принадлежит полю частных /?(х) кольца А/рх. В дальнейшем, говоря о функциях на Spec Л, мы обычно подразуме- ваем элементы из А; таким образом, всякой точке х е Spec Л приписано свое поле /?(х), и этим полям принадлежат значения функций на Spec Л.
212 Арифметика алгебраических многообразий [Гл. 5 Разным элементам кольца могут соответствовать одинаковые функции на спектре; их разность тогда представляет нулевую функцию, т. е. принад- лежит всем простым идеалам. Все нильпотентные элементы заведомо со- держатся в этом пересечении; верно и обратное, см. [195], [691]. По этой причине в традиционной теории кольца функций на алгебраических мно- гообразиях не содержат нильпотентов. Превратим теперь Spec Л в топологическое пространство. Минималь- ное условие согласованности топологии с имеющимся набором функций состоит в том, чтобы множество нулей любой функции было замкнутым. 5.1.8. Топология пространства Spec А. Для любого семейства элементов ЕсА обозначим через H(E)cSpecA множество всех точек хе Spec А, для которых /(х) = О при всех feE. Тогда множества V(E) составляют систему всех замкнутых множеств некоторой топологии про- странства Spec А, которая называется топологией Зарисского или спек- тральной топологией, см. [374]. Любой гомоморфизм колец <р: А—>В индуцирует непрерывное отоб- ражение а<р: Spec В —> Spec А, при котором для у е Spec В выполняется равенство (a<p)(z/) = <р—1 (Pz/), причем <р“1 (ру) — простой идеал кольца А. Множество V(E) само является спектром: V(E) = Spec(A/Pf), где Ре — идеал, порожденный всеми элементами f е Е, а канонический гомомор- физм А —> А/Ре отвечает замкнутому вложению V(E) Spec А. Открытые подмножества U с Spec А все получаются из «больших от- крытых множеств» вида U = D(f) = Spec А [ 1//], являющихся дополнени- ями к V(f): для любого Е С А имеем Spec А \ И(Е) = U £)(/). Пространства Spec А имеют очень неклассическую топологию: они, как правило, неотделимы. Если х е Spec А —любая точка, то ее замыкание имеет вид {%} = р| V(E) = V ( U еА = V(px) = {у е Spec А, ру D рх}, ЕСрх \ЕСрх / т. е. пространство {х} изоморфно Spec А/рх, и только точки, соответствую- щие максимальным идеалам, замкнуты. Отношение у е {х} выражают ино- гда, говоря, что у есть специализация точки х: оно равносильно включе- нию рх с ру. Если кольцо А не имеет делителей нуля, то (0) е Spec А — точка, замыкание которой есть Spec А («общая точка»). Таким образом, точки спектра лежат как бы на разных уровнях. Выше всех находятся за- мкнутые точки; на следующем уровне — точки, специализации которых за- мкнуты, ..., на z-м уровне — точки, специализации которых принадлежат уровням с номерами < (/ — 1). Вершина этой перевернутой пирамиды — «общая точка» (0), если А не имеет делителей нуля, или конечное число точек, если А—любое нётерово кольцо. Наглядные представления, свя-
§5.1] Арифметические многообразия 213 занные с этой картинкой, лежат в основе теории размерности в алгебраиче- ской геометрии. Последовательность точек xq, х\, хп топологического пространства X называется цепочкой длины п с началом xq и концом хп, если xi /x/+i и является специализацией точки х, (для всех I > О, iп — 1). Высотой точки х е X называется верхняя грань длин цепочек с началом х. Размерностью dimX топологического пространства X назо- вем верхнюю грань высот его точек. Например, в пространстве X = SpecA[7i, ..., Тп] (К — поле) имеется цепочка длины /г, соответствующая цепочке простых идеалов (0)c(7i)c С...С(71, ..., 7Л). Поэтому dimX ^п. Аналогично dim SpecZ[7j, ..., Тп] имеется цепочка (0) с (р) С (р, 7\) С (р, 7j, Т^) С ... На самом деле в обоих случаях имеет место точное равенство. Истоки этого опреде- ления размерности можно проследить у Евклида: (замкнутые) точки огра- ничивают линии, линии ограничивают поверхность и т. д. Рассмотрение топологического пространства Spec А одновременно с кольцом А является богатым источником геометрической интуиции не толь- ко в традиционной ситуации /(-алгебр функций на алгебраических множе- ствах (над алгебраически замкнутым полем К), но и для колец арифме- тического типа, которые можно определить как факторкольца вида Z[7j, ..., Тп]/Р для некоторого идеала Р. Отсюда возникают интересные аналогии между числами и функциями. Например, целые расширения колец во многом аналогичны накрыти- ям комплексных многообразий (в частности, римановых поверхностей). Пусть <р: R с S — целое расширение колец, так что S — конечно порож- денный /?-модуль. Тогда соответствующее накрытие а<р: SpecS -* Spec/? сюръективно, причем подмножество SpmS максимальных идеалов S так- же отображается сюръективно на Spm/? (см. [64], [109]). Для xGSpec/? слой (аср)-1(х) описывается как SpecS/<p(px)S. Для х G Spm /? строение S/q(px)S описывается теоремой о разложении мак- симального идеала (см. п. 4.2.3). В частности, неразветвленность °<р в точке х G Spm/? (т.е. когда аср не имеет кратных точек на (а<р)“1 (х)) озна- чает, что факторкольцо S/q(px)S не имеет нильпотентов и является прямой суммой полей. Пример 5.4. На рис. 5.1 (см. [109], т. 2, с. 12) изображено накры- тие fl<p: SpecZ[z] —> SpecZ, отвечающее целому расширению ZcZ[z], z2 = —1. Если со и со' — общие точки пространств SpecZ и SpecZ[z], то (а%>)—1 (со) = со'. Остальные точки пространства SpecZ замкнуты и отве- чают простым числам. По определению (а<р)”1 ((р)) состоит из простых идеалов Z[Z], делящих р. Эти идеалы главные; их число равно двум, если р = 1 (mod 4), и равно одному, если р = 2 или р = 3 (mod 4). Мы видим, что единственная точка ветвления накрытия аср — это точка (2) кратности
214 Арифметика алгебраических многообразий [Гл. 5 Spec Z[/] (2+0 (3+2z) SpecZ -о----------о-----о----о-----о-----о— —«си (2) (3) (5) (7) (11) (13) Рис. 5.1 два. Отметим, что пространства SpecZ и SpecZ[z] одномерны (как и ал- гебраические кривые), причем пространство SpecZ по многим признакам аналогично римановой сфере (проективной прямой Р!(С)). Эта аналогия иллюстрируется двумя глубокими результатами алгебраической теории чи- сел. Первый из них — теорема Минковского (1891 г.) о том, что у поля Q отсутствуют неразветвленные расширения, а второй — теорема Эрмита (1957 г.): у числового поля К, [/С, Q] < оо, существует лишь конечное чис- ло расширений L/К заданной степени с фиксированными точками ветвле- ния (см. п. 4.1.5). Применительно к римановым поверхностям аналогичные факты утверждают отсутствие у римановой сферы неразветвленных на- крытий, а также конечность числа неизоморфных накрытий данной степени компактной римановой поверхности X произвольного рода gx, неразветв- ленных вне конечного множества S точек поверхности X. Эти утверждения несложно выводятся из формулы Гурвица для рода gy компактной ри- мановой поверхности У, накрывающей X: 2gY-2 = deg(/)(2gx - 2) + ^(еР - 1), (5.1.1) Per где ер — индексы ветвления накрытия /: У —> X в точках Р е У, deg(/) — степень накрытия (максимальное число прообразов точки). Для дока- зательства второго утверждения используется также описание фундамен- тальной группы tci(X\S) римановой поверхности X с выколотыми точ- ками из конечного множества S. Группа tcJX \S) допускает совершенно явное описание в терминах образующих и соотношений, а накрытия дан- ной степени п, неразветвленные вне S, отвечают ее подгруппам индекса /г, которых имеется лишь конечное число. Отметим, что эта аналогия послу- жила исходным пунктом для глубоких гипотез конечности, выдвинутых в докладе И. Р. Шафаревича [105] в Стокгольме (1962 г.). Эти гипотезы определили ход исследований, которые привели в итоге к доказательству знаменитой гипотезы Морделла о конечности числа рациональных точек на алгебраической кривой рода g 2 над числовым полем (теорема Фаль- тингса из [332], см. §5.5).
§5.1] Арифметические многообразия 215 5.1.9. Схемы. Основным объектом современной алгебраической гео- метрии являются схемы. К их числу относятся топологические простран- ства Spec Л, рассматриваемые вместе с кольцом А в качестве «кольца функций» (аффинные схемы). Общее определение схем как топологиче- ских пространств X, снабженных таким пучком колец (9%, что пара (X, Ох) локально изоморфна аффинной схеме, приведено в [14], гл. V, §3, и в [398]. Для любого открытого множества U с X определено кольцо (9% (£7), и для каждой точки х е X найдется такая окрестность (/а Э х, что (/а = 5ресЛа для некоторого кольца Ла = <9/((/а). Любую схему (X, Ох) можно полу- чить из семейства аффинных схем (5ресЛа, Ла) с помощью некоторого процесса склейки по открытым множествам i/a П t/p. Пучок Ох называется структурным пучком схемы X, и для аффинной схемы X = Spec Л структур- ный пучок определяется так, что выполнены условия Ох(Х)=А, Ox(D(f))=A[\/f] (feA). Схемы образуют категорию, в которой морфизмами являются не- прерывные отображения топологических пространств, локально заданные с помощью г