/
Author: Винберг Э.Б.
Tags: математика алгебра высшая математика школьная алгебра учебник для школы
Year: 2001
Text
Э.Б.Винберг КУРС АЛГЕБРЫ 2-е изд., испр. и доп. — М.: Изд-во «Факториал Пресс», 2001. — 544 с. Книга представляет собой расширенный вариант курса алгебры, читаемого в течение трех семестров на математических факультетах университетов. В нее включены такие дополнительные разделы, как элементы коммутативной алгебры (в связи с аффинной алгебраической геометрией), теории Галуа, теории конечномерных ассоциативных алгебр, и теории групп Ли. Это позволяет использовать книгу не только как учебник по общему курсу алгебры, но и как пособие для тех, кто желает углубить свои познания в алгебре. Изложение иллюстрируется большим количеством примеров и сопровождается задачами, часто содержащими дополнительный материал. Для математиков и физиков — студентов, аспирантов, преподавателей и научных работников. ОГЛАВЛЕНИЕ Предисловие 5 Предисловие ко второму изданию 6 Глава 1. Алгебраические структуры 7 § 1. Введение 7 § 2. Абелевы группы 10 § 3. Кольца и поля 14 § 4. Подгруппы, подкольца и подполя 17 § 5. Поле комплексных чисел 19 § 6. Кольца вычетов 25 § 7. Векторные пространства 31 § 8. Алгебры 35 § 9. Алгебра матриц 38 Глава 2. Начала линейной алгебры 43 § 1. Системы линейных уравнений 43 § 2. Базис и размерность векторного пространства 52 § 3. Линейные отображения 62 § 4. Определители 73 § 5. Некоторые приложения определителей 86 Глава 3. Начала алгебры многочленов 90 § 1. Построение и основные свойства алгебры многочленов 90 § 2. Общие свойства корней многочленов 96 § 3. Основная теорема алгебры комплексных чисел 103 § 4. Корни многочленов с вещественными коэффициентами 107 § 5. Теория делимости в евклидовых кольцах 113 § 6. Многочлены с рациональными коэффициентами 119 § 7. Многочлены от нескольких переменных 122 § 8. Симметрические многочлены 127 § 9. Кубические уравнения 136
§10. Поле рациональных дробей 141 Глава 4. Начала теории групп 147 § 1. Определение и примеры 147 § 2. Группы в геометрии и физике 154 § 3. Циклические группы 159 § 4. Системы порождающих 164 § 5. Разбиение на смежные классы 167 § 6. Гомоморфизмы 175 Глава 5. Векторные пространства 183 § 1. Взаимное расположение подпространств 183 § 2. Линейные функции 187 § 3. Билинейные и квадратичные функции 191 § 4. Евклидовы пространства 202 § 5. Эрмитовы пространства 210 Глава 6. Линейные операторы 214 § 1. Матрица линейного оператора 214 § 2. Собственные векторы 220 § 3. Линейные операторы и билинейные функции в евклидовом пространстве 226 § 4. Жорданова форма 237 § 5. Функции от линейного оператора 244 Глава 7. Аффинные и проективные пространства 254 § 1. Аффинные пространства 254 § 2. Выпуклые множества 263 § 3. Аффинные преобразования и движения 273 § 4. Квадрики 283 § 5. Проективные пространства 297 Глава 8. Тензорная алгебра 311 § 1. Тензорное произведение векторных пространств 311 § 2. Тензорная алгебра векторного пространства 319 § 3. Симметрическая алгебра 326 § 4. Алгебра Грассмана 332 Глава 9. Коммутативные кольца 342 § 1. Абелевы группы 342 § 2. Идеалы и факторкольца 355 § 3. Модули над кольцами главных идеалов 364 § 2. Нётеровы кольца 372 § 3. Алгебраические расширения 375 § 4. Конечно порожденные алгебры и аффинные алгебраические многообразия 388 § 5. Разложение на простые множители 400 Глава 10. Группы 409 § 1. Прямые и полупрямые произведения 409 § 2. Коммутант 416
§ 3. Действия 419 § 4. Теоремы Силова 426 § 5. Простые группы 428 § 6. Расширения Галуа 433 § 7. Основная теорема теории Галуа 438 Глава 11. Линейные представления и ассоциативные алгебры 445 § 1. Инвариантные подпространства 445 § 2. Полная приводимость линейных представлений 458 § 3. Конечномерные ассоциативные алгебры 462 § 4. Линейные представления конечных групп 470 § 5. Инварианты 482 § 6. Алгебры с делением 488 Глава 12. Группы Ли 501 § 1 . Определение и простейшие свойства групп Ли 502 § 2. Экспоненциальное отображение 508 § 3. Касательная алгебра Ли и присоединенное представление 512 § 4. Линейные представления групп Ли 618 Ответы к задачам 525 Словарь сокращений 529 Список литературы 530 У казател ь обозначений 531 Предметный указатель 534 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автоморфизм группы 176, 411 — внутренний 412 — алгебраической структуры 23 алгебра 35, 36, 358,491 — альтернативная 499, 500 ----ассоциативная полупростая 464, 470, 491 — простая 467, 468 ----внешняя векторного пространства 334 — градуированная 187 — Грассмана (см. алгебра внешняя) 334 — групповая 470, 471, 473, 474 — инвариантов 483, 484, 486 — кватернионов 37, 42, 56 ----обобщенная 489, 490, 494 — конечно порожденная 388-391,394 — Кэли (см. алгебра октав) 499, 500 — Ли 513 ----простая 519 — линейных операторов 219, 465, 467 — матриц 40, 41, 187, 359, 513 — многочленов 90, 91 — многочленов на алгебраическом многообразии 393 — многочленов от нескольких переменных 122-124, 187, 388, 396 — нильпотентная 462 — октав 499, 500 — полилинейных функций 325 — расщепимся 494 — с делением 488, 490, 492-495 — с единицей 358 -----симметрическая векторного пространства 328, 329 — суперкоммутативная 334 — тензорная 325 — формальных степенных рядов 92 -----функций на множестве, F(X;K)
35, 359, 360, 483 — центральная 489, 492, 494 — Д1]/(й) 464, 466, 468 алгоритм Евклида 116 альтернирование 334 аннулятор модуля 367 — подпространства 190 антиавтоморфизм 490, 499 антикоммутативность 15, 513 аргумент комплексного числа 24 ассоциативность 12, 13, 149 ассоциатор 499 Базис 34, 56, 58-60, 196, 222, 230 Базис абелевой группы 343, 344 — жордановый 243 — модуля 367, 368 — ортонормированный 204, 213 — пространства решений 68 — симплектический 202 — согласованный с подпространством 183, 184 — трансцендентности 388, 389 бивектор 333 Вектор 32, 34 — в аффинном пространстве 254 — геометрический 32 — корневой 237 — собственный 220 /-вектор выпуклого многогранника 270 векторизация аффинного пространства 255 векторы ортогональные 194, 212 — линейно зависимые 52-54, 57, 58, 204, 336 -----независимые 52-54, 57, 58, 73, 336 — ориентированные положительно 74, 75 вершина выпуклого многогранника 271 — квадрики 285, 286 — параболоида 296 вершины выпуклого многогранника смежные 271 высота вектора 240 — корневого вектора 237, 238 — параллепипеда 208 — нильпотентного оператора 240 вычет числа по модулю 27 — квадратичный 200 Геометрия аффинная 156, 157, 276, 277 — конформная 310 — Лобачевского 310 — проективная 304 — псевдоевклидова 283 — гипербола 290, 309 гиперболоид двуполостный 290-292, 309 -----однополостный 290-292, 309 гипергрань выпуклого многогранника 270 гиперплоскость в аффинном пространстве 256, 265 -----в проективном пространстве 299 Гиперплоскость опорная 265, 267 гиперповерхность второго порядка 285 гомоморфизм алгебр 359 — канонический 359 -----групп 175, 176, 178, 181 — канонический 182 Ли511,514 -----колец 357 — канонический 357 -----модулей 366 — канонический 366 -----над полем 380 гомотетия 276 градуировка 187 грань выпуклого многогранника 270, 271 группа 8, 149 — абелева (коммутативная) 12, 13, 149, 176, 342-355, 451,472 -----конечно порожденная 352
-----автоморфизмов 412 -----внутренних 412 — конечного расширения полей 433 — аддитивная 12,149 — аффинных преобразований квадрики 293 — вращений куба 182, 422, 423 — вычетов по модулю п, Zn 28, 29, 162, 163, 174,413,415 — Галилея 157 — Галуа 435 — дважды транзитивная 478 -----движений аффинного евклидового пространства 278, 279, 414 — плоскости 8, 148, 153, 156, 170, 421,422 — диагональных матриц 411 — диэдра, Dn 153, 182, 473 — знакопеременная, Ап 177, 179, 417, 418, 429, 430 — классов идеалов 407, 408 — кольца аддитивная 14 — комплексных чисел по модулю равных 1, Т 176, 460 — конечная 169, 171, 178, 423, 425, 458, 470, 478, 482-484, 486 -----порядка р2 426 -----порядка pq 428 — Ли 501 -----линейная 503-505 -----редуктивная 521 -----связная 507, 510, 519 -------простая 519, 521 группа линейных преобразований конечномерного векторного пространства (см. группа полная линейная) Группа Лоренца 283, 507 — мультипликативная 13, 149 -----корней п-й степени из 1, Си 162, 164 -----поля 17, 150,355, 501 -------С 161, 168, 174, 178, 181 -------Zp 169 -----невырожденных квадратных матриц (см. группа полная линейная) — треугольных матриц, ВИ(Х) 418, 505 -----обратимых элементов кольца 150 ----------Zn,Z* 29, 163, 169, 170, 355,413 — однопараметрическая, порожденная оператором 251 — ортогональная, Ои 152, 170, 232, 233, 460, 488, 504, 507, 510, 513, 517, 520, 521 -----специальная SO„ 232, 432, 507, 520 — параллельных переносов векторного пространства, Tran К148, 150, 155, 421 — подстановок (см. группа симметрическая) — полная аффинная, GA(V) 156, 179, 181,275, 277, 303,412,414 -----проективная, PGL(T) 302, 412 — полная линейная, GL(P), GLW(X) 148, 150, 155, 166, 168, 174, 176, 179, 181, 411, 412, 414, 418, 453, 462, 501, 503, 505, 507, 508 — порожденная подмножеством 165 — преобразований 147, 150, 157, 159, 170,419 — примерная (р-группа) 351, 426 — простая 428, 429 — псевдоортогональная 283 — Пуанкаре 157, 159, 283 — разрешимая 418 — свободная 343,344, 349 — симметрии фигуры 153, 281 — симметрии куба 171, 172, 282, 448, 477 -----правильных многогранников
172, 282 -----тетраэдра 180 -----треугольника 180 — симметрическая 147, 161, 165, 166, 168, 170, 174, 176, 179, 412, 414, 418, 421,449, 472, 482, 483 — топологическая 459, 460 -----компактная 459-462, 486 — транзитивная 155 — унимодулярная, SLn (К) 153, 154, 168, 176, 182, 417, 418, 504, 506, 510,513,517,519-522 Группа унитарная 236, 460, 505, 507, 521 — унитарная специальная 236, 505, 507, 517, 521 — целых чисел, Z 162-164, 174 — циклическая 162-164, 169, 175, 351,354,415, 476 — четверная Клейна, К4 180, 421, 431 — PSL„(X)431,432 — S3 151,180,182,412,413,418,439, 472, 473 — S4 173,180-182,414,448,459,472, 476, 477, — SL2(Z) 154, 166 Движение аффинного евклидового пространства 278, 279 — винтовое 281 — несобственное 279 — собственное 278 действие группы на множестве 419, 420, 482 — смежных классов 423 — левыми сдвигами 420 — правыми сдвигами 420 — сопряжениями 421 — транзитивное 421, 423 — эффективное 420 деление окружности на равные части 443 -----с остатком 94, 114 делимость элементов 113 делитель нуля 16, 17 — в алгебре Ьи(£) 41 диагональ матрицы (главная) 33 -----побочная 35 диаграмма коммутативная 423 дивизор простой 406 дискриминант 135, 136, 138 дистрибутивность 14 дифференциал 179, 261, 274, 284 дифференцирование алгебры многочленов 99, 100 длина вектора 203 — орбиты 171 дополнение алгебраическое 83 — ортогональное 195, 212 дробь (в поле отношений) 141, 142, 143 — несократимая 142 — рациональная 143 — правильная 143, 144, 145 — простейшая 144 Единица группы 13, 149 — кольца 15 — матричная 41 — правая 151 Задача интерполяции 93 -----с кратными узлами 247 — о получении максимальной прибыли 272 — транспортная 273 закон инерции 199, 212 замыкание поля алгебраическое 380 — кольца целое 386 знак перестановки 77, 176, 177 значение собственное 220, 221 Идеал алгебры (двусторонний) 358 -----левый 358 -----правый 358 — главный 361, 401 — кольца (двусторонний) 356 -----левый 356 -----правый 356 — многообразия алгебраического 394
— нормирования 406 — простой 374 идеалы эквивалентные 407 изоморфизм алгебр 38 — аффинных пространств 275 — векторных пространств 33,58 — действий 423 — евклидовых пространств 209 — многообразий алгебраических 395 — модулей 366 — представлений 446 — структур алгебраических 9 инвариант действия группы 482, 483 инволюция стандартная 490 индекс подгруппы 169 инерции положительный 199, 212 инерции отрицательный 199, 212 индукция трансфинитная 61 Канонический вид квадратичной функции 229 ----------эрмитовой 235 карта аффинная 300 квадрика 283, 285-291, 293, 295, 297, 305 — коническая 286, 289, 290, 295 — линейчатая 309, 310 — нецентральная 289, 290, 295 — овальная 309, 310 — проективная 306 — вещественная 308 — комплексная 308 — невырожденная 306-308, 310 -----центральная 285 -----неконическая 289, 290, 293, 295 — цилиндрическая 288 кватернион 489 — сопряженный 490 Класс отношения эквивалентности 26 — смежный 167, 171 — сопряженных элементов 421 клетка жорданова 241, 245, 371 — нильпотентная 241 кольцо 14, 176, 356, 365, 373 — ассоциативное 15 — без делителей нуля 16 — вычетов по модулю 25, 28, 29, 42, 358, 361 — главных идеалов 361, 362, 374 — евклидово 114, 115, 117, 362, 368, 401 -----коммутативное 14 — ассоциативное с единицей 42, 92, 133 -----многочленов 113,114,116,358,402 — от нескольких переменных 124, 373, 403 — нётерово 372-375, 385, 386, 400, 406 — нормальное (целозамкнутое) 386 — факториальное 401, 402, 406 — функций на множестве 15, 17 — целостное (область целостности) 113, 141,400, 408 — целых чисел 15, 16, 19, 113, 114, 116, 141,357,386 -------поля 387, 407, 408 коммутант 416 коммутативность 12, 13 кратный 418 коммутатор 416 — матриц 512 комплексификация 222, 236 композиция отображений 8 — линейных 70 компонента изотипная 454 — неприводимая 398 — однородная многочлена 123 — связная 506 коника 285, 309 константы структурные 491 конус 286, 292, 305 — грассманов 337 — квадратичный 290, 291, 305 координаты барицентрические 256, 262 — вектора 34 — неоднородные 300
— однородные 300 — плюккеровы 338 — тензора 321 — элемента тензорного произведения 314 корень многочлена (алгебраического уравнения) 96, 97, 107, 136 — кратный 97, 101, 136 Корень многочлена простой 97 — первообразный 163 коэффициент линейного уравнения 43 — линейной функции (формы) 188 — многочлена 91, 101 -----старший 91 кривая второго порядка 285 критерий Сильвестра 200 Лемма Гаусса 120, 402 — Даламбера 105 — Пётр о нормализации 390 — о возрастании модуля 105 — о замене 389 — о линейной зависимости 55, 57 — о неподвижной точке 458, 461 — Цорна 61 — Шура 450 — линейная комбинация векторов 34, 52, 60 — барицентрическая 255 — выпуклая 263 — нетривиальная 52, 53 — тривиальная 52 — оболочка множества 55, 57 — часть преобразования 179 Матрица 38, 45 — билинейной функции 192 — верхняя треугольная 47 — Грамма (скалярного умножения) 204 — диагональная 39, 154, 175 — единичная 40 — жорданова 243, 245, 371 — квадратичной функции 194 — квадратная 39, 85, 186 — кососимметричная 186 — косоэрмитова 211 — коэффициентов 43 -----расширенная 43 — линейного оператора 214-216 -----отображения 64, 71 — невырожденная 59, 72-74, 81, 88 -----целочисленная 89, 154 — нижняя треугольная 47 — нильтреугольная 238, 359, 463 -----обратимая 72 — обратная 73, 88 — ортогональная 205 — перехода 59 — полуторалинейной функции 211 — симметричная 186 — скалярная 41 — строго треугольная 47, 49, 154 — ступенчатая 45 Матрица транспонированная 42, 70, 81 — трапецеидальная 46 — унитарная 213 — элементарная 51 — эрмитова 211 матрицы подобные 243 метод аксиоматический 11 — вращений 51 — Гаусса 44, 49-51 — Якоби 199 минор 83, 89 — главный 221 — дополнительный 83 — окаймляющий 89 — угловой 89, 196 многогранник выпуклый 268, 272, 282 — правильный 282 — телесный 268 многогранники правильные двойственные 282 многообразие алгебраическое 283 — аффинное 393, 395, 396, 398, 399, 404, 405
— грассманово 337 — дифференцируемое 502 — линейное 283 многоугольник правильный 282 многочлен 90-94, 106, 107, 109, 110, 112, 119-122 — аннулирующий оператора 244 -----матрицы 244 — деления круга 121 — минимальный матрицы 244 -----оператора 244-246 -----элемента 377 -----на алгебраическом многообразии 393 — неполный 137 — неприводимый 116, 383, 403, 404, 436, 441 -----от нескольких переменных 122- 124, 151 -------однородный 123, 187 -------симметрический 127-129, 151 ----------элементарный 127, 129, 133 — нормированный (приведенный) 99, 119 — от матрицы (оператора) 244, 246 — примитивный 120, 402 — сепарабельный 435 — характеристический 221, 224, 225, 228, 238, 239, 243, 246 множество выпуклое 263, 264, 267, 269 — замкнутое относительно операции 17 множители инвариантные 350, 354, 370 модуль 43, 364 Модуль конечно порожденный 367, 369, 372 — левый 364 — над кольцом Z 365 -------многочленов 365 — периодический 367 — правый 365 — свободный 367, 368 — циклический 367 -----примарный 369 модуль комплексного числа 23, 103 морфизм многообразий алгебраических 395 — представлений 446 -------неприводимых 450 Наибольший общий делитель 115, 401,402 наименьшее общее кратное 118 направление особое параболоида 294 начало отсчета 148, 255 невычет квадратичный 200 неизвестные системы линейных уравнений главные 47 ----------свободные 47 неравенство Коши — Буняковского 203, 204 норма в векторном пространстве 248 — в евклидовом кольце 114 — кватерниона 490 — линейного оператора 248 — октавы 499 нормализатор подгруппы 425 нормальный вид квадратичной функции 198, 199, 212 нормирование 406 Область целостности 113, 141 оболочка аффинная 256 — выпуклая 264 образ гомоморфизма групп 175 — линейного отображения 65 объем параллепипеда 208, 209 — ориентированный 75 оператор альтернирования 334 — дифференцирования 218, 220, 225, 237, 240, 251 — кососимметрический 227, 230 — косоэрмитовый 235 — линейный 214-216, 219-226, 245, 371 -----обратимый (невырожденный)
220, 233 — нильпотентный 240 — ортогональный 227, 231 — представления 435 — присоединенный 514 — Рейнольдса 484 Оператор самосопряженный 227, 235 — симметрирования 328 — симметрический 227-229 -----положительно определенный 230, 233 — сопряженный 227, 235 — тождественный 219 — унитарный 235 — эрмитовый 235 -----положительно определенный 235 операция коммутативная 10 определитель Вандермонда 83, 127, 403 — матрицы 75, 79-82, 176, 192 — оператора 220 орбита 421 — точки 170, 171 основание параллепипеда 208 остаток от деления многочленов 94 ось движения 280 — параболоида 296 отображение аффинное 273, 274 — линейное 62-64, 66-71 — полилинейное (р-линейное) 311, 312,317 -----кососимметрическое 332, 333 -----симметрическое 326, 327 — скользящее 281 — факторизации 26 — эквивариантное 422 — экспоненциальное 508-509 отражение 224, 227, 279 отрезок 263 отношение элементов 13 — на множестве 25 — (простое) точек 278 — двойное 304, 305 — сравнимости по модулю 27 -------подгруппы 167, 173, 174, 356 — эквивалентности 25 -----согласованное с операцией 26 -----определяемое действием 421 Парабола 290, 291, 299 параболоид 296, 307 — гиперболический 290-292, 309 — эллиптический 290-292, 309 параллепипед 208, 268 — фундаментальный 345 перемена знака 109 перенос параллельный 148 пересечение подпространств 184 перестановка элементов 77 — тривиальная 77 — четная (нечетная) 77, 78 перманент квадратной матрицы 331 плоскость бесконечно удаленная 300 — в аффинном пространстве 256, 259, 260, 267 Плоскость в проективном пространстве 299, 301 площадь параллелограмма ориентированная 74 поверхность второго порядка 285 поворот зеркальный 231, 281 поворот на угол 217, 220, 223 подалгебра 38 подгруппа 17, 18, 151 — дискретная 345, 346 — кручения 352 —/7-кручения 353 нормальная 173, 413 -----порожденная множеством элементов 165 /7-подгруппа силовская 426, 427 подгруппы сопряженные 425 подкольцо 18 — порожденное над кольцом 376 подматрица 83 подмодуль 365 — кручения 370 — порожденный множеством 367
подполе 19, 32 — порожденное элементами 379 — G-инвариантных элементов 433 подпредставление 447, 451 подпространства линейно независимые 185 подпространство векторного пространства 33, 58, 190, 191 — инвариантное 215, 447, 518 — корневое 238, 239 — невырожденное 195 — собственное 223, 225 — циклическое 240 подстановка 147 — нечетная 177 — четная 177 подъем индексов тензора 322 поле 16, 29, 30, 35 -----алгебраически замкнутое 103 :— алгебраических чисел 380, 387 — комплексных чисел 20, 21, 34, 36, 37,41,56, 103, 116,358 — конечное 29, 382, 383, 436, 439 поле круговое (деления круга) 378, 384, 387, 437, 439 — отношений (дробей) 142, 388 — разложения многочлена на множители 380, 436, 437, 439 поливектор (р-вектор) 333 полупространство ограниченное гиперплоскостью 265 — опорное 265 поляризация 330 — квадратичной функции 194 Порядок группы 163, 169 порядок элемента 160-163, 169 последовательность векторов сходящаяся по норме 248 — комплексных чисел сходящаяся 103 — финитная 60, 91 представление линейное 445 -----алгебры Ли 515 ----------присоединенное 515, 516 -----ассоциативной алгебры 446 ----------регулярное 450, 464 -----вполне приводимое 451, 453, 457, 458 -----группы 420, 446, 475 -------Ли 514, 518, 519 ----------присоединенное 515 -----изотипное (S-изотипное) 454 -----неприводимое 448,450,451,475 -------тривиальное 469 -----множества 445, 454 -----мономиальное 449 -----одномерное 448 представления линейные изоморфные 446 преобразование аффинное 156,157, 179, 275, 303 — Лоренца 159 — линейное 214 — множества 147, 218 — ортогональное 152 — проективное 302, 303 — сохраняющее ориентацию 181 преобразования элементарные системы линейных уравнений 44, 45 -----столбцов матрицы 70, 347 -----строк матрицы 44, 45, 62, 347 приведение к главным осям 229 принцип тензорной алгебры основной 317 присоединение корня многочлена 377 программирование линейное 272 проективизация 306 проектирование ортогональное 217 проектор 224 — ортогональный 227 проекция вектора 186 — ортогональная 205, 213 произведение внешнее полилинейных функций 336 произведение групп полу прямое 415 -----прямое 351,411 — идеалов 407
— матрицы на матрицу 38, 39 -------элемент 38 — (композиция) отображений 8 -----линейных 70 — подгрупп полупрямое 414 Произведение подгрупп прямое 409, 410 -----симметрическое полилинейных функций 331 -----тензорное векторных пространств 312-314, 316-318 -----матриц 318 -----операторов 318 -----полилинейных функций 325 -----представлений 457, 473 производная 100, 251 пространство аффинное 254, 275 -----евклидово 262 — векторное (линейное) 31, 365 -----бесконечномерное 55, 60, 61, 190, 249 -----евклидово 202, 210 -----конечномерное 34,36,55,56,58, 187, 188, 248, 249 — касательное к группе Ли 504, 509, 512,514 — Минковского 283 — полилинейных функций 311 -----кососимметрических функций 332 -----симметрических функций 326 -----отображений 311, 314, 317 — представления 445 — проективное 299 — псевдоевклидово 283 -----аффинное 283 — сопряженное 188, 189, 226 — счетномерное 60, 61 — тензоров типа (р, q) 319 — топологическое нётерово 398 -----неприводимое 398 -----связное 506 — финитных последовательностей 60, 91, 190 — функций на группе 473 -------множестве со значениями в поле, F(X,K) 32, 33, 35, 56, 57, 188,218, 420 — эрмитово 212, 213 процесс ортогонализации Грамма — Шмидта 197, 206 прямая в аффинном пространстве 256 — в проективном пространстве 299 пфаффиан матрицы 340 Радикал алгебры 463 -----кольца (нильпотентный) 374 разделение орбит 482 разложение многочлена на множители 106, 107, 113, 117 -----полярное 233, 236 -----элемента на простые множители 117, 118,401 Размерность векторного пространства 50, 56, 60 — многообразия алгебраического 399 — представления 445 — пространства решений системы линейных уравнений 67 разность элементов 12 -----симметрическая 16 разрешимость в квадратных радикалах 441, 442 ранг абелевой группы 343 — билинейной функции 193, 202 — квадратичной функции 194 — матрицы 61 — модуля 368 — оператора 220 — произведения матриц 73 — системы векторов 61 расстояние 207, 262 расширение Галуа 435 — кольца 375 -----алгебраическое 376 -----конечно порожденное 376 -----конечное 385 -----целое 385 — поля 136, 246, 315, 379, 467
-----алгебраическое 376 -----квадратичное 377, 387, 436 -----конечное 376, 378, 379, 492 -----простое 377 расщепимое 492 ребро выпуклого многогранника 270 редукция по модулю 120 резольвента кубическая 134 репер аффинного пространства 255 рефлексивность 26 решение общее системы линейных уравнений 47 решетка в пространстве Е1 345 ряд абсолютно сходящийся 249 -----композиционный группы 429 Свертка 320 сигнатура квадратичной функции 199 — билинейной функции 199 символ Кронекера 189 — Лежандра 355 симметричность 26 симметрия центральная 276 симплекс «-мерный 264 симплекс-метод 273 система алгебраических уравнений 392 — векторов 52 -----эквивалентная 61 — порождающая 165 — координат аффинная 255 -----прямоугольная 263 Система линейно независимая 343 — уравнений линейных 43, 44, 50, 67 -----неопределенная 48, 49, 50 -----несовместная 44 -----однородная 49, 50, 67, 68 -----определенная 48, 49, 62 -----совместная 44, 49, 62 -----строго треугольная 47 -----ступенчатая 47 — образующих (порождающих) модуля 367 — точек общего положения 304 системы линейных уравнений эквивалентные 44 след матрицы 188 смежный класс 167, 171 соотношения Плюккера 338 составляющая вектора ортогональная 205 сопряжение комплексное 23 спектр алгебры 396 спуск индексов тензора 322 стабилизатор точки 170, 425 старший член многочлена 126 степень алгебры 493 — внешняя векторного пространства 334 — многочлена 91 -----по переменной 124 -----по совокупности переменных 123 — расширения 376 — симметрическая векторного пространства 328 — трансцендентности 389 — элемента алгебраического 377 строка 13 — единичная 34 — нулевая 13 сумма матриц 38 — подпространств 183, 185, 186 — представлений 453 — прямая алгебр 360 — прямая групп 351 -----колец 360 -----модулей 365 -----подгрупп 350 -----подпространств 185, 323 • -----пространств 324 схема Горнера 95 Тело 488 выпуклое 264-266 тензор 319 ковариантный 325 контравариантный 323 кососимметрический 334 Тензор метрический 322
симметрический 328 теорема Безу 95 Бернсайда 456 Ведцербёрна 496 Вильсона 99 Гамильтона — Кэли 246, 371 Гильберта о базисе идеала 373 — о нулях 393 об инвариантах 484, 486, 522 Декарта 109 Жордана— Гёльдера 429 Кронекера — Капелли 62 Кэли 421 Лагранжа 169 Менелая 258 Минковского — Вейля 269 о гомоморфизме алгебр 359 групп 177, 182 колец 357 модулей 366 примитивном элементе 377, 492 ранге матрицы 89 об определителе матрицы с углом нулей 82 основная алгебры комплексных чисел 103 теории Галуа 438 — отделимости 265 — Ферма малая 30,170 — Фробениуса 495 — Штейница 271 — Чевы259 — Эйлера 170, 232 тождество Якоби 15, 37, 513 топология Зарисского 397 тор, Ти 460 точка аффинного пространства 254 — внутренняя 264 — граничная 264 — крайняя 268, 271 точки аффинно зависимые 257 точки аффинно независимые 257, 277 -----бесконечно удаленные 300 транзитивность 26 транспозиции смежные 166 транспозиция 177, 165 тривектор 333 трисекция угла 443 Удвоение куба 443 угол между векторами 203 умножение в алгебре 36 — левое 219 — линейных отображений 70 — матриц 38-40, 59 — скалярное 202, 205, 212 Упорядочивание лексикографическое 125 уравнение линейное 43 -------однородное 43 -----разрешимое в радикалах 440 Факторалгебра 358 факторгруппа 174, 182 факторкольцо 356 фактормножество 26 фактормодуль 366 факторпредставление 448, 451 факторпространство 366 фигуры эквивалентные (равные) относительно группы 154, 156 флаг многогранника 282 форма алгебраическая комплексного числа 22 — билинейная 192 — вещественная группы Ли 520, 521 — линейная 188 — квадратичная 194 — тригонометрическая комплексного числа 24 формула Бернсайда 425 —для возведения в степень комплексного числа 24 -----деления комплексных чисел 24 — интерполяционная Лагранжа 146, 247 — Кардано 140 — Муавра 24 — преобразования координат 59 — разложения определителя по z-й
строке (/-му столбцу) 84 формулы Виета 98 — Крамера 87, 88 — Тейлора 101 фундаментальная система решений 68 функция аффинно-квадратичная 284, 286, 288 — аффинно-линейная 261, 265, 272 — билинейная 192, 226 -----кососимметрическая 193, 201, 202 -----невырожденная 193, 195 -----отрицательно определенная 198 -----положительно определенная 198 -----симметрическая 193, 196 — дифференцируемая 502 — квадратичная 194, 199, 200 -----положительно определенная 198 -----отрицательно определенная 198 -----невырожденная 194, 195, 200 -----эрмитова 211 -------положительно определенная 212 -----координатная 189 Функция линейная 69, 188 — от линейного оператора 250 — полилинейная (и-линейная) 76,311,325 — кососимметрическая 76, 78, 80, 332 — симметрическая 326 — полуторалинейная 210 -----косоэрмитова 211 -----невырожденная 211 -----эрмитова 211 — центральная 475 — Эйлера 170, 361 — 5-функция 56 Характер представления 475, 476 характеристика поля 29, 30, 161 Целая часть дроби 144 центр алгебры ассоциативной 470 -----Ли 516 — аффинно-квадратичной функции 284 — группы 412 -----Ли связной 516 — квадрики 285, 287 — тела 489 — тяжести 255 — выпуклого множества 460 централизатор элемента 425 цикл в симметрической группе 161 циклы независимые 161 Частное 13 — неполное 94 числа Ферма 444 число комплексное 20 — целое алгебраическое 386 -----гауссово 114 — сочетаний 30 — сочетаний с повторениями 123 Экспонента 354 — от линейного оператора 251 элемент алгебраический 375, 378 -----целый 385 — ведущий 45 — матричный представления 474, 476 — нильпотентный 374, 462, 464 — обратный (в группе) 13 — обратный (в кольце) 16 — обратимый 16, 149 в 29 -----в L„(X) 41,72 — порождающий 162 — правый обратный (в группе) 151 — представимый в радикалах 440 — простой 116 — противоположный (в группе) 12 — разложимый 315, 317, 327, 333 — трансцендентный 375 элементы алгебраически зависимые 376, 388
— ассоциированные 114 — взаимно простые 114, 402 — модуля линейно независимые 367 — сопряженные в группе 421 — сравнимые по модулю подгруппы 167 эллипс 290, 291, 309 эллипсоид 290, 292 эндоморфизм группы 176 ----Фробениуса 383 Ядро билинейной функции 193 — гомоморфизма групп 175 — линейного отображения 65, 67 — неэффективности 420, 424
Предисловие Поводом для написания настоящего учебника послужил двух- годичный курс алгебры, прочитанный мною в Математическом колледже Независимого московского университета (НМУ) в 1992- 94 гг. Энтузиазм слушателей и относительно малое их число позво- лили мне читать курс на более высоком уровне, чем это принято на механико-математическом факультете МГУ (мехмате), и затронуть ряд тем, не входящих в курс алгебры мехмата. Однако при написании учебника я использовал свой опыт преподавания на мехмате, и его окончательный вариант имеет лишь отдаленное сходство с курсом, прочитанным в НМУ. По содержанию гл. 1-4 примерно соответствуют курсу алгебры первого семестра мехмата, а гл. 5-7 и отчасти гл. 9 — курсу линейной алгебры и геометрии второго семестра. Оставшиеся главы значительно перекрывают курс алгебры третьего семестра. Они адресованы в первую очередь тем студентам, которые хотят стать алгебраистами. Глава 7 посвящена геометрии евклидовых, аффинных и проек- тивных пространств. Однако ее ни в коей мере нельзя считать полноценным учебным пособием по геометрии; скорее это алгеб- раический взгляд на геометрию. В первых четырех главах я постарался сделать изложение на- столько подробным, насколько это может быть разумно, если иметь в виду такого читателя, как студент первого семестра мехмата. (Впрочем, язык множеств и отображений используется с самого начала без каких-либо объяснений.) Однако затем я начинаю поз- волять себе опускать некоторые легко восполнимые детали, считая, что читатель постепенно набирается математической культуры. В книге почти нет технически сложных доказательств. В соот- ветствии со своим взглядом на математику я стремился заменять выкладки и сложные рассуждения идеями. Кому-то это может показаться трудным, но усилия, потраченные на усвоение идей, окупятся возможностью самостоятельно решать задачи, не рассмат- риваемые в учебнике. Приведенный в конце книги список литературы на русском языке, которая, на мой взгляд, может быть полезной читателю, безусловно, далеко не полон и даже до некоторой степени случаен. Я искренне благодарен всем бывшим и нынешним сотрудникам кафедры высшей алгебры мехмата, в общении с которыми сложи- лись мои представления о преподавании алгебры.
6 ПРЕДИСЛОВИЕ Я благодарю редактора учебника Г. М. Цукерман, в результате тщательной работы которой было обнаружено большое количество неточностей и опечаток, а также главного редактора издательства «Факториал» Ю. Н. Торхова, чей энтузиазм и самоотверженность немало способствовали улучшению качества учебника. Несколько полезных замечаний сделал А. Д. Свердлов, внимательно прочитав- ший первые две главы. Рисунок на переплете, выполненный на компьютере Ф. Э. Вин- бергом, иллюстрирует гомоморфизм SU2 —> SO3 (см. гл. 13). О нумерации. Теоремы нумеруются в пределах параграфа. При ссылке на теорему другого параграфа той же главы первая цифра означает номер параграфа, при ссылке на теорему другой главы первая цифра означает номер главы, вторая — номер параграфа. Так, теорема 2 — это теорема 2 того же параграфа, теорема 3.2 — это теорема 2 §3 той же главы, а теорема 6.3.2 — это теорема 2 §3 гл. 6. То же относится к параграфам, предложениям, примерам, задачам и замечаниям. Формулы и рисунки нумеруются в пределах главы. Э. Б. Винберг Предисловие ко второму изданию Настоящее издание довольно существенно отличается от преды- дущего. Основные сделанные изменения имели целью упростить из- ложение в техническом и идейном плане. В частности, с этой целью полностью переписана глава «Тензорная алгебра». Дано изложение теории абелевых групп, независимое от общей теории модулей над кольцами главных идеалов и подготавливающее читателя к восприятию этой общей теории, если он захочет это сделать. В то же время сделано несколько небольших добавлений. Так, дано доказательство неприводимости многочлена деления круга на любое число частей; описано приложение теории абелевых групп к исследованию симметрии кристаллов; добавлены некоторые сведения о (тензорных) произведениях и симметрических степенях линейных представлений групп с примером, иллюстрирующим применение этих понятий к физике. Наконец, исправлен ряд опечаток и мелких неточностей, в об- наружении которых мне помогли И. В. Аржанцев, А. П. Мишина и А. Д. Свердлов. Э. Б. Винберг 31 мая 2000 г.
Глава 1 АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ Когда вы знакомитесь с новыми людьми, вы прежде всего запоминаете их имена и внешность. После этого, встречаясь с ними в разных ситуациях, вы постепенно узнаете их лучше и некоторые из них, может быть, становятся вашими друзьями. В первой главе состоится лишь внешнее знакомство читателя с многими из алгебраических структур, рассматриваемых в этой книге. Более глубокое их понимание будет приходить в процессе дальнейшего чтения книги и решения задач. § 1. Введение Если вообще можно четко определить предмет алгебры, то это изучение алгебраических структур — множеств с определенными в них операциями. Под операцией в множестве М понимается любое отображение М х М М, т. е. правило, по которому из любых двух элементов множества М получается некоторый элемент этого же множества. Элементами множества М могут быть как числа, так и объекты другого рода. Хорошо известными и важными примерами алгебраических структур являются следующие числовые множества с операциями сложения и умножения: N — множество натуральных чисел, Z — множество всех целых чисел, Z+ — N U {0} — множество неотрицательных целых чисел, Q — множество рациональных чисел, К — множество всех вещественных (= действительных) чисел, К+ — множество неотрицательных вещественных чисел. Подчеркнем, что операции сложения и умножения определены далеко не на всяком числовом множестве. Например, в множестве отрицательных чисел не определена операция умножения, так как произведение двух отрицательных чисел является положительным числом. В множестве иррациональных чисел не определены ни
8 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ сложение, ни умножение, так как сумма и произведение двух иррациональных чисел могут быть рациональными. Приведем примеры алгебраических структур, состоящих не из чисел. ПРИМЕР 1. Пусть М, N, Р — какие-то множества и f; N -+ М, д: P^N — какие-то отображения. Произведением, или композицией, отоб- ражений fug называется отображение fg- Р^м, определяемое формулой (fg)(a) = f(M) УаеР, т. е. результат последовательного выполнения сначала отображе- ния д, а потом /. В частности, при М = N — Р мы получаем таким образом операцию на множестве всех отображений множества М в себя. Эта операция дает много важных примеров алгебраи- ческих структур, называемых группами. Так, например, согласно аксиоматике евклидовой геометрии, произведение двух движений плоскости есть также движение. Рассматривая в множестве всех движений плоскости операцию умножения, мы получаем алгебра- ическую структуру, называемую группой движений плоскости. ПРИМЕР 2. Множество векторов пространства с операциями сложения и векторного умножения является примером алгебраиче- ской структуры с двумя операциями. Кстати, отметим, что скаляр- ное умножение векторов не является операцией в определенном выше смысле, так как его результат не есть элемент того же мно- жества. Подобные более общие операции также рассматриваются в алгебре, но мы пока не будем об этом думать. Все приведенные выше примеры являются естественными в том смысле, что они были открыты в результате изучения реального мира и внутреннего развития математики. В принципе можно рассматривать любые операции в любых множествах. Например, можно рассматривать операцию в множестве Z+, ставящую в соот- ветствие любым двум числам число совпадающих цифр в их деся- тичной записи. Однако лишь немногие алгебраические структуры представляют реальный интерес. Следует уточнить, что алгебраиста интересуют только те свойст- ва алгебраических структур и составляющих их элементов, которые
§ 1. ВВЕДЕНИЕ 9 могут быть выражены в терминах заданных операций. Этот подход находит свое выражение в понятии изоморфизма. Определение 1. Пусть М — множество с операцией о, a N — множество с операцией *. Алгебраические структуры (М, о) и (N, *) называются изоморфными, если существует такое биективное отображение f: М N, что /(аоЬ) = /(а)*/(Ь) для любых a, b е М. В этом случае пишут (М, о) ~ (N, *). Само отображение f называется изоморфизмом структур (М. о) и (N, *). Аналогичным образом определяется изоморфизм алгебраических структур с двумя или большим числом операций. Пример 3. Отображение а^2“ является изоморфизмом множества всех вещественных чисел с опе- рацией сложения и множества положительных чисел с операцией умножения, поскольку 2a+z> = 2“24. Вместо основания 2 можно было бы взять любое положительное основание, отличное от 1. Это показывает, что между изоморфными алгебраическими структурами может существовать много различ- ных изоморфизмов. Пример 4. Пусть М — множество параллельных переносов плоскости на векторы какой-либо фиксированной прямой. Для лю- бого вещественного числа а обозначим через ta элемент множества М, представляющий собой перенос на вектор длины |а| в одном из двух возможных направлений, определяемом знаком числа а. (Если а = 0, то ta — это тождественное преобразование.) Легко видеть, что где о обозначает умножение (композицию) параллельных перено- сов. Следовательно, отображение ан-> ta является изоморфизмом алгебраических структур (R, +) и (М, о). Ясно, что если две алгебраические структуры изоморфны, то любое утверждение, формулируемое только в терминах заданных операций, будет справедливым в одной из этих структур тогда и только тогда, когда оно справедливо в другой.
10 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ Например, операция о в множестве М называется коммутатив- ной, если а о Ь — b о а для любых a, b G М. Если структура (М, о) изоморфна структуре (N, *) и операция о в множестве М коммутативна, то и операция * в множестве N коммутативна. Таким образом, в принципе все равно, какую из изоморфных друг другу алгебраических структур изучать: все они являются различ- ными моделями одного и того же объекта. Однако выбор модели может оказаться небезразличным для фактического решения какой- либо задачи. Определенная модель может предоставить для этого наибольшее удобство. Например, если какая-то модель имеет гео- метрический характер, то она позволяет применить геометрические методы. § 2. Абелевы группы Сложение вещественных чисел обладает следующими свойства- ми: (Cl) а+ b = b + а (коммутативность); (С2) (а + Ь) + с = а + (Ь + с) (ассоциативность); (СЗ) а + 0 = а; (С4) а + (—а) = 0. Из этих свойств чисто логическим путем могут быть получены и другие свойства, например, наличие операции вычитания, обратной к сложению. Это означает, что для любых а, b уравнение х + а=Ь имеет единственное решение. Докажем, что это так. Если с — решение данного уравнения, т. е. с + а= Ь, то (с + а) + (-а) = b + (—а). Пользуясь свойствами (С2)-(С4), получаем (с + а) + (—а) = с + (а + (—а)) — с + 0 — с. Таким образом, с = Ъ + (-а).
§ 2. АБЕЛЕВЫ ГРУППЫ 11 Это показывает, что если решение существует, то оно единственно и равно Ь + (—а). Сдругой стороны, подстановка х = Ь + (—а) в рас- сматриваемое уравнение показывает, что b 4- (—а) действительно является решением: (Ь 4- (—а)) + а = b 4- ((—а) 4- а) = b 4- (а 4- (—а)) = b 4- 0 — Ь. Умножение вещественных чисел обладает аналогичными свойст- вами: (У1) ab — Ьа (коммутативность); (У2) (ab)c = a(bc) (ассоциативность); (УЗ) al — а; (У4) aa-1 = 1 при а^О. Свойства (У1)-(У4) лишь формой записи отличаются от свойств (С1)-(С4), с единственной оговоркой, что в (У4) мы предполагаем, что а 0, в то время как в (С4) никаких ограничений на а нет. Поэтому приведенный выше вывод из свойств (С1)-(С4) наличия операции вычитания, будучи переведен на язык умножения, даст вывод из свойств (У1)-(У4) наличия операции деления, обратной к умножению. Более точно, таким путем доказывается, что для любого a / 0 и любого b уравнение ха= b имеет единственное решение, равное bar1. Все эти рассуждения приведены здесь не для того, чтобы чита- тель узнал что-либо новое о вещественных числах, а чтобы подве- сти его к важной для алгебры идее. Эта идея есть аксиоматический метод в алгебре. Он состоит в одновременном изучении целых классов алгебраических структур, выделяемых теми или иными аксиомами, представляющими собой какие-то свойства операций в этих структурах. При этом совершенно не важно, как в каждом кон- кретном случае эти операции определяются. Коль скоро выполнены аксиомы, справедлива и любая теорема, полученная логическим путем из этих аксиом. Конечно, лишь немногие системы аксиом действительно инте- ресны. Невозможно придумать «из головы» такую систему аксиом, которая привела бы к содержательной теории. Все системы акси- ом, рассматриваемые в современной алгебре, имеют длительную историю и являются результатом анализа алгебраических структур, возникших естественным путем. Таковы системы аксиом группы, кольца, поля, векторного пространства и другие, с которыми читатель познакомится в этом курсе. Свойства (С1)-(С4), а также (У1)-(У4) являются по сути Дела системой аксиом абелевой группы. Перед тем как привести
12 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ точные формулировки этих аксиом, скажем несколько слов о терминологии. Названия и обозначения операций в алгебраических структурах не имеют принципиального значения, однако чаще всего они называются сложением или умножением и обозначаются соот- ветствующим образом. Это позволяет использовать разработанную терминологию и систему обозначений, относящиеся к операциям над вещественными числами, а также вызывает полезные ассоциа- ции. Приведем вначале определение абелевой группы, использующее язык сложения. Определение 1. (Аддитивной) абелевой группой называется множество А с операцией сложения, обладающей следующими свойствами: 1) а + b = Ь + а для любых а, b е А (коммутативность); 2) (а+Ь)+с = а+(Ь+с) для любых а, Ь,сеА (ассоциативность); 3) в А существует такой элемент 0 (нуль), что а + 0 = а для любого а е А; 4) для любого элемента а£ А существует такой элемент — ае А (противоположный элемент), что а + (—а) = 0. Выведем некоторые простейшие следствия из этих аксиом. 1) Нуль единствен. В самом деле, пусть 0, и 02 — два нуля. Тогда 0[ = 0] + 02 = 02. 2) Противоположный элемент единствен. В самом деле, пусть (—a)j и (—а)2—два элемента, противоположных а. Тогда (—«)1 = (—«)1 + (а + (~а)2) = ((~а)1 + а) + (~а)2 = (~а)2- 3) Для любых а, b уравнение х + а = b имеет единственное решение, равное b + (—а). Доказательство см. выше. Это решение называется разностью элементов b и а и обозначается Ь — а. Из свойства ассоциативности нетрудно вывести (попробуйте сделать это), что сумма произвольного числа (а не только трех) элементов не зависит от расстановки скобок. Пользуясь этим, скобки обычно вообще опускают. Пример 1. Числовые множества Z, Q, R являются абелевыми группами относительно обычной операции сложения. Пример 2. Множество векторов (плоскости или пространства) является абелевой группой относительно обычного сложения век- торов.
§ 2. АБЕЛЕВЫ ГРУППЫ 13 ПРИМЕР 3. Последовательность из п чисел назовем строкой длины п. Множество всех строк длины п, составленных из веще- ственных чисел, обозначим через R”. Определим сложение строк по правилу (аи 02,..., а„) + (Ь,, Ь2,..Ьп) = (а, + + Ь2,..ап + Ьп). Очевидно, что множество R” является абелевой группой относи- тельно этой операции. Ее нулем служит нулевая строка О = (0,0, ...,0). Пример 4. Множество всех функций, определенных на задан- ном подмножестве числовой прямой, является абелевой группой относительно обычного сложения функций. Приведем теперь определение абелевой группы, использующее язык умножения. Определение 1'. (Мультипликативной) абелевой группой называется множество А с операцией умножения, обладающей следующими свойствами: 1) ab = Ьа для любых a, b G А (коммутативность); 2) (ab)c = а(Ьс) для любых а, Ь, с е А (ассоциативность); 3) в А существует такой элемент е (единица), что ае = а для любого а е А; 4) для любого элемента а€ А существует такой элемент а-1 е А (обратный элемент), что аа~1 — е. Единица мультипликативной абелевой группы иногда обознача- ется символом 1. Простейшие следствия аксиом абелевой группы, полученные выше на аддитивном языке, на мультипликативном языке выглядят следующим образом: 1) Единица единственна. 2) Обратный элемент единствен. 3) Для любых а, b уравнение ха=Ь имеет единственное решение, равное Ьа~1. Оно называется частным от деления b на а (или отношением элементов Ь и а) и обозначается | (или Ь/а). ПРИМЕР 5. Числовые множества Q* = Q\{0} и R‘ = R\{0} являются абелевыми группами относительно обычной операции умножения. В дальнейшем мы познакомимся с общим понятием группы (не обязательно абелевой), которое не включает требования коммута- тивности операции.
14 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ § 3. Кольца и поля В отличие от групп кольца и поля — это алгебраические структуры с двумя операциями, называемыми обычно сложением и умножением. Их аксиомы, как и аксиомы абелевой группы, подсказаны свойствами операций над вещественными числами. При этом аксиомы кольца — это разумный минимум требований относительно свойств операций, позволяющий охватить и другие важные примеры алгебраических структур, из которых мы пока можем привести только уже упоминавшееся множество векторов пространства с операциями сложения и векторного умножения. Определение 1. Кольцом называется множество К с операци- ями сложения и умножения, обладающими следующими свойства- ми: 1) относительно сложения К есть абелева группа (называемая аддитивной группой кольца К); 2) а(Ь + с) = ab + ас и (а + Ъ)с — ас + Ьс для любых а, Ъ, с Е К (дистрибутивность умножения относительно сложения). Выведем некоторые следствия аксиом кольца, не входящие в чи- сло следствий аксиом аддитивной абелевой группы, перечисленных в §2. 1) аО — 0а = 0 для любого ае К. В самом деле, пусть а0 = Ъ. Тогда b + Ь — аО + аО = а(0 + 0) = аО — Ь, откуда Ь = Ъ - Ъ = 0. Аналогично доказывается, что 0а — 0. 2) а(—b) = (—a)b = —ab для любых а, Ь е К. В самом деле, аЬ + а(— Ь) — а(Ь + (—Ь)) = аО = 0 и, аналогично, ab + (—а)Ь — 0. 3) a(b — c) = ab — ас и (а — Ъ)с = ас — Ьс для любых a, b, с Е К. В самом деле, а(Ь — с) + ас = а(Ъ — с + с) = аЬ и, аналогично, (а — Ь)с + Ьс = ас. Кольцо К называется коммутативным, если умножение в нем коммутативно, т. е. ab = Ьа \/а, Ъ,
§ 3. КОЛЬЦА И ПОЛЯ 15 и ассоциативным, если умножение в нем ассоциативно, т. е. (ab)c = a(bc) Ча,Ъ,с. Элемент 1 кольца называется единицей, если al = la = а Ча. Так же, как в случае мультипликативной абелевой группы, дока- зывается, что в кольце не может быть двух различных единиц (но может не быть ни одной). Замечание 1. Если 1 =0, то для любого а имеем a = al = a0 — 0, т. е. кольцо состоит из одного нуля. Таким образом, если кольцо содержит более одного элемента, то 1^0. Замечание 2. При наличии коммутативности из двух тож- деств дистрибутивности, входящих в определение кольца, можно оставить лишь одно. Аналогичное замечание относится к определе- нию единицы. Пример 1. Числовые множества Z, Q, R являются коммутатив- ными ассоциативными кольцами с единицей относительно обычных операций сложения и умножения. ПРИМЕР 2. Множество 2Z четных чисел является коммутатив- ным ассоциативным кольцом без единицы. Пример 3. Множество всех функций, определенных на задан- ном подмножестве числовой прямой, является коммутативным ас- социативным кольцом с единицей относительно обычных операций сложения и умножения функций. Пример 4. Множество векторов пространства с операциями сложения и векторного умножения является некоммутативным и неассоциативным кольцом. Однако в нем выполняются следующие тождества, которые в некотором смысле заменяют коммутатив- ность и ассоциативность: а х b + b х а — 0 (антикоммутативность), (а х b) х с + (b х с) х а + (с х а) х b—0 (тождество Якоби). Антикоммутативность очевидна в силу определения векторного умножения. По поводу проверки тождества Якоби см. пример 8.5.
16 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ ЗАДАЧА 1. Пусть X —какое-либо множество и 2х — множес- тво всех его подмножеств. Доказать, что 2х — кольцо относительно операций симметрической разности MAN = (М \ N) U (М \ N) и пересечения, взятых в качестве сложения и умножения соответ- ственно. Доказать, что это кольцо коммутативно и ассоциативно. Элемент а-1 кольца с единицей называется обратным к элемен- ту а, если аа~1 — а~1 а = 1. (В коммутативном кольце достаточно требовать, чтобы аа~' = 1.) Так же, как в случае мультипликативной абелевой группы, доказы- вается, что в ассоциативном кольце с единицей никакой элемент не может иметь двух различных обратных элементов (но может не иметь ни одного). Элемент, имеющий обратный, называется обратимым. Определение 2. Полем называется коммутативное ассоциа- тивное кольцо с единицей, в котором всякий ненулевой элемент обратим. ЗАМЕЧАНИЕ 3. Кольцо, состоящее из одного нуля, не считается полем. Примерами полей служат поле рациональных чисел Q и поле вещественных чисел R. Кольцо Z не является полем: в нем обратимы только ±1. ЗАДАЧА 2. Доказать, что существует поле, состоящее из двух элементов. (Очевидно, что один из этих элементов должен быть нулем поля, а другой — его единицей.) Любое поле обладает следующим важным свойством: а6 = 0 => {а = 0или6=0}. В самом деле, если а / 0, то, умножая обе части равенства ab = О на а-1, получаем 6 = 0. Существуют и другие кольца, обладающие этим свойством, например, кольцо Z. Они называются кольцами без делителей нуля. В кольце без делителей нуля возможно сокращение: { ас = Ьс (или са — сЬ) и с / 0} => а = Ь. В самом деле, равенство ас = Ьс может быть переписано в виде (а — Ь)с = 0, откуда при с / 0 получаем а — Ь = 0, т. е. а = Ъ.
§ 4. ПОДГРУППЫ, ПОДКОЛЬЦА И ПОДПОЛЯ 17 Приведем пример коммутативного ассоциативного кольца с де- лителями нуля. ПРИМЕР 5. В кольце функций на подмножестве X числовой прямой (см. пример 3) есть делители нуля, если только X содержит более одной точки. В самом деле, разобьем X на два непустых подмножества Xi и Х2 и положим при i = 1, 2 ., Л ПРИ х е Xi' ' (0 при х Х{. Тогда Л, /2 /0, но /J2 = 0. Отсутствие делителей нуля в поле означает, что произведение любых двух ненулевых элементов также является ненулевым элементом. Ненулевые элементы поля К образуют абелеву группу относительно умножения. Она называется мультипликативной группой поля К и обозначается через К*. ч § 4. Подгруппы, подкольца и подполя Пусть М — множество с операцией о и N — какое-либо его под- J множество. Говорят, что N замкнуто относительно операции о, хесли a, b € N => а о b G N. В этом случае операция о определена в множестве N и превращает его в некоторую алгебраическую структуру. Если операция о в М обладает некоторым свойством, имеющим характер тожде- ственного соотношения (например, свойством коммутативности или ассоциативности), то она, очевидно, обладает этим свойством и в Однако другие свойства операции о могут не наследоваться подмножеством N. Так, подмножество аддитивной абелевой группы, замкнутое от- носительно сложения, не обязано быть абелевой группой, так как оно может не содержать нуля или элемента, противоположного какому-либо его элементу. Например, подмножество Z+ замкнуто относительно сложения в абелевой группе Z, но не является абелевой группой (и вообще группой), так как не содержит проти- воположного элемента ни к одному своему элементу, кроме нуля. Определение 1. Подмножество^В аддитивной абелевой труп- / пы А называется подгрупп^,, если "" ' 1) В замкнуто относителфцШЬЖЭййя? ;
18 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ 2) а е В 3) 0ев. Замечание 1. Легко видеть, что если В непусто, то из первых двух условий вытекает третье. Поэтому третье условие может быть заменено условием непустоты. Очевидно, что всякая подгруппа аддитивной абелевой группы сама является абелевой группой относительно той же операции. Пример 1. В аддитивной группе R имеется следующая цепочка подгрупп: ZcQcR. ПРИМЕР 2. В аддитивной группе векторов пространства мно- жество векторов, параллельных заданной плоскости или прямой, является подгруппой. В любой аддитивной абелевой группе имеются две «тривиальные» подгруппы: вся группа и подгруппа, состоящая только из нуля. Задача 1. Доказать, что всякая подгруппа группы Z имеет вид nZ, где п е Z+ (решение этой задачи можно найти в § 4.3). Приведем мультипликативный вариант предыдущего определе- ния. Определение 1'. Подмножество В мультипликативной абеле- вой группы А называется подгруппой, если 1) В замкнуто относительно умножения; 2) а& В => а~1 € В; 3) ее В. ПРИМЕР 3. В группе R* имеется следующая цепочка подгрупп: {±1}CQ*CR*. Соображения, с которых начинается этот параграф, могут быть распространены на алгебраические структуры с несколькими опе- рациями. Таким образом мы приходим к понятиям подкольца и подполя. Определение 2. Подмножество L кольца К называется под- кольцом, если 1) L является подгруппой аддитивной группы кольца К; 2) L замкнуто относительно умножения.
§ 5. ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ 19 Очевидно, что всякое подкольцо само является кольцом относи- тельно тех же операций. При этом оно наследует такие свойства, как коммутативность и ассоциативность. ПРИМЕР 4. Цепочка подгрупп аддитивной группы R, приведен- ная в примере 1, является в то же время цепочкой подколец. Пример 5. При любом п eZ+ множество nZ является подколь- цом кольца Z. (Ср. задачу 1.) ЗАДАЧА 2. Доказать, что все конечные подмножества множес- тва X образуют подкольцо кольца 2х из задачи 3.1. Определение 3. Подмножество L поля К называется подпо- лем, если 1) L является подкольцом кольца К; 2) a &L, а^О => a-1 &L; 3) 1 еД. Очевидно, что всякое подполе является полем относительно тех же операций. Пример 6. Поле Q является подполем поля R. ЗАДАЧА 3. Доказать, что подмножество L поля К является подполем тогда и только тогда, когда 1) L замкнуто относительно вычитания и деления; 2) L эО, 1. Задача 4. Доказать, что поле Q не имеет нетривиальных (т. е. отличных от него самого) подполей. § 5. Поле комплексных чисел Подобно тому как невозможность деления в кольце целых чисел приводит к необходимости расширить его до поля рациональных чи- сел, невозможность извлечения квадратных корней из отрицатель- ных чисел в поле вещественных чисел приводит к необходимости расширить его до большего поля, называемого полем комплексных чисел. Для того чтобы лучше понять, что такое поле комплексных чисел, нужно прежде подумать над тем, что такое поле вещественных чисел. Строгое построение поля вещественных чисел обычно при- водится в курсе анализа. Мы не будем входить в его детали. Однако заметим, что имеется несколько определений вещественных чисел:
20 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ как бесконечных десятичных дробей, как сечений Дедекинда мно- жества рациональных чисел и т. д. Формально говоря, при этом получаются различные поля. Какое из них является «настоящим» полем вещественных чисел? Ответ на этот вопрос состоит в том, что все они изоморфны и их следует рассматривать просто как различные модели одного и того же объекта, называемого полем вещественных чисел. Наиболее удовлетворительным в подобной ситуации всегда явля- ется аксиоматический подход, при котором сначала формулируются в виде аксиом свойства, которыми должен обладать искомый объ- ект, а затем доказывается, что этими свойствами он определяется однозначно с точностью до изоморфизма, и с помощью какой- либо конструкции доказывается его существование. В случае поля вещественных чисел такими аксиомами (помимо аксиом поля) могут быть аксиомы порядка, аксиома Архимеда и аксиома непре- рывности. Замечание 1. Нетрудно доказать, что любые две модели поля вещественных чисел не просто изоморфны, но между ними имеется единственный изомор- физм. (Доказательство сводится к доказательству того, что всякий изоморфизм поля R на себя тождествен, и основано на соображении, что неотрицательные числа при любом изоморфизме должны переходить в неотрицательные, так как они и только они являются квадратами в поле R.) Это означает, что каждый элемент поля R имеет свою индивидуальность, т. е. в любой модели могут быть идентифицированы числа 10, \/2, тг и т. д. Дадим теперь аксиоматическое определение поля комплексных чисел. Определение 1. Полем комплексных чисел называется всякое поле С, обладающее следующими свойствами: 1) оно содержит в качестве подполя поле R вещественных чисел; 2) оно содержит такой элемент г, что г2 = —1; 3) оно минимально среди полей с этими свойствами, т. е. если К с С — какое-либо подполе, содержащее R и г, то К = С. ЗАМЕЧАНИЕ 2. Из равенства а:2 + 1 =(х — г)(х + г) следует, что уравнение х2 — — 1 имеет в С ровно 2 решения: г и —г. Если какое- либо подполе содержит одно из этих решений, то оно содержит и другое. Теорема 1. Поле комплексных чисел существует и единст- венно с точностью до изоморфизма, переводящего все веще- ственные числа в себя. Каждое комплексное число однозначно представляется в виде a+bi, где a, b G R, a i —(фиксированный) элемент, квадрат которого равен — 1.
§ 5. ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ 21 Доказательство. 1) Пусть С — какое-то поле комплексных чисел (если оно существует). Рассмотрим его подмножество К — {а + bi: a, b G R}. Из свойств операций в поле и соотношения i2 — — 1 следует, что (aj + b'i) + (о2 + Ь2г) = (dj + а2) + (Ь{ + Ь2)г, (1) (dj + Ь1г)(а2 + b2i) — (d|d2 - Ь[Ь2) + (djb2 + Ь]djz. (2) Решая соответствующие уравнения, находим также, что -(d+ bi) = (-a) + (-b)i, (3) (d+ bi)-1 = -2— + (—^-2) i npHd2 + b2^0. (4) Формулы (l)-(4) показывают, что К — подполе. Так как К, очевидно, содержит R и г, то К =С. Таким образом, каждый элемент поля С представляется в виде а + Ы, где a, b е R. Докажем, что такое представление единствен- но. Пусть d] + b}i — + b2i, alt blt a^, b2 e R. Тогда ai — d2 = (b2 — b))i. Возводя это равенство в квадрат, получаем откуда dj —— Ь2 -~ —— О, что и требовалось доказать. Если теперь С' — другое поле комплексных чисел и i' е С' — такой элемент, что (г')2 = —1, то, поскольку формулы (1) и (2) остаются справедливыми при замене i на г', отображение f: С —> С\ d 4- bi ।—► d + bi1 (d, b G R), является изоморфизмом поля С на поле С. 2) Предыдущее исследование подсказывает, как доказать суще- ствование поля комплексных чисел. Рассмотрим множество С пар (а, Ь), где a, b е R. Определим в нем сложение и умножение по формулам (dp bl) + (a2, ft2) = (d] + 02, b, + b2), (dp b^^a^, b2) = (d[dj — bjb2, 0^2 + bla2),
22 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ подсказанным формулами (1) и (2). Очевидно, что С является абелевой группой относительно сложения (ср. пример 2.3) и что умножение дистрибутивно относительно сложения и коммута- тивно. Непосредственной выкладкой проверяется ассоциативность умножения. Таким образом, С — коммутативное ассоциативное кольцо. Так как (а, Ь)(1, 0) = (а, Ь), то элемент (1,0) — единица кольца С. Формула (4) подсказывает, как должен выглядеть элемент, обратный к (а, Ь) при а2 + Ь2 ^0. И, действительно, непосредственная проверка показывает, что Следовательно, С — поле. Далее, (а,, 0) + (а2, 0) = (а] + 02, 0), (аи 0)(а<,, 0) = (а^, 0), т. е. операции над парами вида (а, 0) сводятся к соответствующим операциям над их первыми компонентами. Условимся отождеств- лять пару (а, 0) с вещественным числом а. Тогда мы можем сказать, что построенное поле С содержит поле R в качестве подполя. Положим г = (О, 1); тогда г2 = (—1,0) = —1, а + bi - (а, Ь) при a, b € R. Таким образом, каждый элемент поля С (однозначно) представля- ется в виде а+ Ы, где a, b е R. Поэтому если какое-либо подполе К С С содержит R и i, то К = С. Следовательно, С — поле комплексных чисел. □ Представление комплексного числа с € С в виде а+ Ы (а, b € R) называется его алгебраической формой; при этом число а на- зывается вещественной частью числа с и обозначается через Re с, а число Ь называется мнимой частью числа с и обозначается через Im с. Комплексные числа, не являющиеся вещественными, называются мнимыми; числа вида Ы, где 6eR, называются чисто мнимыми. Если в первой части доказательства теоремы в качестве С' взять то же поле С, а в качестве i' — элемент —г, то мы получим, что отображение с = а + bi н-> с — а — bi (a,b€ R),
§ 5. ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ 23 является изоморфизмом поля С на себя. Оно называется комплекс- ным сопряжением. Вообще, изоморфизм какой-либо алгебраиче- ской структуры на себя называется ее автоморфизмом. Таким образом, комплексное сопряжение с с есть автоморфизм поля комплексных чисел. Очевидно, что с = с. Вещественные числа характеризуются тем, что они совпадают со своими сопряженными. Отсюда следует, что для любого с е С числа с + с и сс вещественны. В самом деле, с + с = с + с = с + с, сс = сс = сс. Легко видеть, что если с = а + Ы (a, b е R), то с + с = 2а, сс = а2 + Ь2. (5) Рис. 1 Комплексные числа можно изображать точками или векторами на плоскости. А именно, число с = а + Ы изображается точкой или вектором с декартовыми координатами (а, Ь) (рис. 1). Иногда удобнее представление комплексных чисел точками, иногда — векто- рами. При векторном представлении сложе- нию комплексных чисел соответствует обыч- ное сложение векторов по правилу паралле- лограмма (или эквивалентному ему правилу треугольника). Отметим, что разность комплексных чисел и ct представляется векто- ром, соединяющим точки, изображающие с, и сг (рис. 2). Вместо декартовых координат на плоскости иногда бывает удобно использовать полярные. Это приводит к следующим понятиям. Модулем комплексного числа с = а+Ы на- зывается длина вектора, изображающего это число. Модуль числа с обозначается через |с|. Очевидно, что Рис. 2 |с| = у/а2 + Ь2. Аргументом комплексного числа называется угол, образуемый соответствующим вектором с положительным направлением оси абсцисс. Аргумент определен с точностью до прибавления целого кратного 2тг. Аргумент числа 0 не определен. Аргумент числа с обозначается через arg с.
24 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ Пусть г и р — модуль и аргумент числа с (рис. 3). Очевидно, что а = г cos р, b — г sin р, откуда с = r(cos р + i sin р). Такое представление комплексного числа на- зывается его тригонометрической формой. Так как тригонометрическая форма данного комплексного числа определена однозначно с точностью до прибавления к р целого кратно- >0 ^(cos + i sin Pi) — r2(cos <p2 + i sin <p2) <==> •<=> {г] = r2, ip1 = p2 + 2?rA:, k G Z}. Тригонометрическая форма комплексных чисел хорошо приспо- соблена к таким операциям, как умножение, деление, возведение в степень и извлечение корня. А именно, из формул для косинуса и синуса суммы двух углов следует, что г, (cos pt + г sin Pi) • r2(cos p2 + i sin <p2) = = r1r2(cos(^1 + p2) + i sin(^ + p2)), т. e. при умножении комплексных чисел их модули перемножаются, а аргументы складываются. Отсюда вытекают следующие формулы для деления и возведения в степень: Г1 (cos Уд _+ г sin (Pl) _ _ ip j _|_ г- sin(9?j — ip2))> r2(cos tf2 -I- l Sin tp2) r2 ' '“1 [r(cos p + i sin <p)]n = rn(cos np + i sin пр) (формула Муавра) . Извлечение корня п-й степени из комплексного числа с = — г (cos р + i sin р) есть решение уравнения zn = с. Пусть |z| = в, arg z. = ф; тогда з" = г, пф — р + 2тгА: (k Е Z). Следовательно, s = (арифметическое значение корня), ф = у • Окончательно получаем пГ~ ( ip + 2кк \ z = \/r I cos J----Ь г sin ---- . * \ п nJ
§ 6. КОЛЬЦА ВЫЧЕТОВ 25 Одинаковые значения z получаются по этой формуле тогда и только тогда, когда в качестве к берутся числа, сравнимые по модулю п. Отсюда следует, что при с О уравнение zn = c имеет ровно п решений, по- лучаемых, например, при к = 0, 1,..п — 1. В геометрическом изображении эти чис- ла располагаются в вершинах правильного п-угольника с центром в начале координат (см. рис. 4, где изображен случай п = 8). Рис. 4 § 6. Кольца вычетов Расширения кольца целых чисел приводят к цепочке колец Z с Q С R С С, в которую, как мы позже увидим, можно вставить и другие звенья (в том числе и продолжить ее вправо). Кольца вычетов определяются также на основе целых чисел, но идея их опреде- ления совершенно иная. Это часто используемый в математике прием «склейки» — образования фактормножества по отношению эквивалентности. Пусть М — какое-либо множество. Всякое подмножество R с С М х М называется отношением на множестве М. Если (а, Ь) е ER, то говорят, что элементы а и b находятся в отношении R, и пишут aRb. Приведем примеры отношений. ПРИМЕР 1. М — множество людей; aRb, если а знает Ь. ПРИМЕР 2. М то же самое; aRb, если а и b знакомы. ПРИМЕР 3. М то же самое; aRb, если а и b живут в одном доме. Пример 4. М = R; aRb, если а^Ь. Пример 5. М — множество окружностей на плоскости; aRb, если окружности а и b равны, т. е. переводятся одна в другую движением. Отношение R называется отношением эквивалентности, если оно обладает следующими свойствами: 1) aRa (рефлексивность); 2) aRb ==> bRa (симметричность); 3) aRb и bRc => aRc (транзитивность).
26 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ Из приведенных выше примеров отношений только третье и пя- тое являются отношениями эквивалентности: первое и четвертое не симметричны, а второе симметрично, но не транзитивно. Отношение эквивалентности обычно записывается как а ~ b или просто а~ b. R Пусть R — отношение эквивалентности на множестве М. Для каждого а Е М положим й(я) = {ЬбМ: а~ 6}. R Из свойств отношений эквивалентности легко выводится, что а Е Е R(a) и R(a)nR(b)?0 => Я(а) = Я(Ь). Таким образом, подмножества R (а) образуют разбиение множест- ва М, т. е. покрывают его и попарно не пересекаются. Они назы- ваются классами эквивалентности отношения R. Два элемента эквивалентны тогда и только тогда, когда они принадлежат одному классу. Множество, элементами которого являются классы эквивалент- ности отношения R, называется фактормножеством множест- ва М по отношению эквивалентности R и обозначается через M/R. Отображение ММ/R, a^R(a), называется отображением факторизации. Так, в третьем из приведенных выше примеров классы эквива- лентности — это множества жильцов одного дома. Фактормноже- ство можно отождествить с множеством домов; тогда отображение факторизации — это отображение, ставящее в соответствие каждо- му человеку дом, в котором он живет. В пятом примере классы эквивалентности — это множества окружностей одного радиуса, фактормножество отождествляется с множеством положительных чисел, а отображение факторизации — это отображение, ставящее в соответствие каждой окружности ее радиус. Пусть в множестве М задана некоторая операция (х, у)н->х* у. Отношение эквивалентности R в множестве М называется согла- сованным с операцией *, если b ~ 6'1 => а*6~а'*6'. 1 R R R В этом случае на фактормножестве М/R также можно определить операцию * по правилу R(a) * R(b) — R(a* b). (6)
§ 6. КОЛЬЦА ВЫЧЕТОВ 27 В словесном выражении это определение выглядит так: чтобы произвести операцию над какими-либо двумя классами эквива- лентности, надо выбрать в них произвольных представителей, произвести операцию над ними и взять тот класс, в котором будет лежать получившийся элемент. Тот факт, что этот класс не будет зависеть от выбора указанных представителей, как раз и обеспечивается согласованностью отношения эквивалентности с операцией. Очевидно, что все свойства операции в М, имеющие характер тождества, например, коммутативность и ассоциативность, насле- дуются определенной таким образом операцией в М/R. То же самое можно сказать о наличии нуля (единицы) и противоположного (обратного) элемента. Более точно, если, скажем, операция в М называется сложением и в М имеется нулевой элемент 0 относи- тельно этой операции, то 2?(0)— нулевой элемент в M/R-, если -а — элемент, противоположный элементу а в М, то R(—a) — элемент, противоположный элементу R (а) в M/R. Приступим теперь к построению колец вычетов. Пусть п — фиксированное натуральное число. Рассмотрим в множестве Z целых чисел следующее отношение сравнимости по модулю п: а сравнимо с b по модулю п (обозначение: a=b (mod п)), если а — b делится на п или, что равносильно, если а и b дают одинаковые остатки при делении на п. Очевидно, что это отношение эквивалентности, причем классы эквивалентности могут быть занумерованы числами 0, 1,..., п — 1 таким образом, что r-й класс состоит из всех целых чисел, дающих при делении на п остаток г. Класс эквивалентности, содержащий целое число а, называется вычетом числа а по модулю п и обозначается через [а]п или просто через [а], если ясно, какое п имеется в виду. Фактормножество множества Z по отношению сравнимости по модулю п обозначается через Zn. Мы можем написать, что Zn = {[0]n, [1]„,..., [п - 1]„}, но следует понимать, что каждый элемент множества Zn можно обозначать по-разному. Так, элемент [1]п может быть с таким же успехом обозначен через [2п + 1]п, [—(п — 1)]п и т. д. Докажем теперь, что отношение сравнимости по модулю п согласовано с операциями сложения и умножения в Z. Пусть а = d (mod п), b = b' (mod п) Тогда a+b = d + b = d + b' (mod п)
28 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ и, аналогично, ab = db = db' (mod п). Таким образом, мы можем определить в множестве Zn операции сложения и умножения по формулам № + [Ь]„ = [« + И„, Ю]» = нв (справедливым для любых a, b е Z). Тем самым Zn превращается в коммутативное ассоциативное кольцо с единицей. Оно называется кольцом вычетов по модулю п. Пример 6. Ниже приведены таблицы сложения и умножения в кольце Z5. При этом ради простоты квадратные скобки в обозна- чениях элементов этого кольца опущены. + 0 12 3 4 0 1 2 3 4 0 12 3 4 1 2 3 4 0 2 3 4 0 1 3 4 0 1 2 4 0 12 3 X 0 12 3 4 0 1 2 3 4 0 0 0 0 0 0 12 3 4 0 2 4 1 3 0 3 14 2 0 4 3 2 1 Мы видим, в частности, что элементы 2 и 3 взаимно обратны, а элемент 4 обратен сам себе. ПРИМЕР 7. Вычислим [2]100 в кольце Z125: [2]7 = [128] - [3], [2]35 = ([2]7)5 = [З]5 = [243] = [-7], [2]5О = [2]35([2]7)2[2] = [—7][3]2[2] = [-126] = [-1], [2]100 = ([2]50)2 = [1]. Полученный результат означает, что 2100 = 1 (mod 125). Учитывая, что 2100 делится на 8, получаем 2I00 = 376 (mod 1000), т. е. десятичная запись числа 2100 оканчивается на 376. Кольцо Zn обладает всеми свойствами поля, кроме, быть может, обратимости ненулевых элементов. Очевидно, что Z2 — поле из двух элементов, о котором шла речь в задаче 3.2. Рассмотрение
§ 6. КОЛЬЦА ВЫЧЕТОВ 29 приведенной выше таблицы умножения в кольце Z5 показывает, что Z5 — также поле. С другой стороны, Z4 — не поле, так как элемент [2] в этом кольце необратим. Теорема 1. Кольцо Zn является полем тогда и только тогда, когда п — простое число. Доказательство. 1) Пусть п составное, т.е. n = kl, где 1 < к, I < п. Тогда [fc]n, [Z]n ^0, но = [W]n = [n]n = 0. Таким образом, в кольце Zn имеются делители нуля и, значит, оно не является полем. 2) Пусть, напротив, п — простое число и [а]п / 0, т. е. а не делится на п. Будем искать элемент, обратный к [а]п, подбором, т.е. умножая [а]п по очереди на все элементы кольца. Получим элементы [0]„, [а]„, [2а]„, ..., [(п—1)а]п. (7) Докажем, что все они различны. В самом деле, если [&a]n = [Za]n (0 < к < I < п — 1), то [(Z — fc)a]n = 0, т. е. (Z — к)а делится на п, что невозможно, так как ни I — к, ни а на п не делятся. (Здесь мы использовали то, что п простое.) Следовательно, в последователь- ности элементов (7) встречаются все элементы кольца Zn, в том числе [1 ]„, а это и означает, что элемент [a]n обратим. □ ЗАДАЧА 1. Доказать, что при любом п элемент [fc]n обратим в кольце Zn тогда и только тогда, когда п и к взаимно просты. В полях вычетов мы встречаемся с новым явлением, не имевшим места в числовых полях (подполях поля комплексных чисел). А именно, в поле Zn (п простое) выполняется равенство 1 + 1+ +1^ = 0. (8) п (Конечно, это верно и в кольце Zn при любом п.) Это приводит к некоторым особенностям алгебраических преобразований в этом поле, о которых мы скажем ниже. Пусть, вообще, К — произвольное поле. Наименьшее натураль- ное п, для которого в поле К выполняется равенство (8), называ- ется характеристикой этого поля; если такого п не существует, то говорят, что К — поле нулевой характеристики. Таким образом, Zn (п простое) — поле характеристики п, а числовые поля имеют нулевую характеристику. Характеристика поля К обозначается Через char К-.
30 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ Если char К = п, то для любого а е К а + а + ... + а ~ (1 + 1 + ... + 1 )а = Oct= 0. п п Характеристика поля, если она положительна, всегда является простым числом. В самом деле, пусть char Л” — n = kl (1 < к, I <п). Тогда J + 1 + + 1Z = (J + !+••• + У(1 + 1 + • • • + о = О п к I и, значит, либо 1 + 1 + ... + 1у = 0, либо 1 + 1 + ... + 1у = 0, что k i противоречит определению характеристики. Большинство формул элементарной алгебры справедливы в лю- бом поле, так как при их выводе используются только те свойства операций сложения и умножения, которые входят в число аксиом поля или являются их следствием. Особенность полей положитель- ной характеристики проявляется только в тех формулах, которые содержат умножение или деление на натуральные числа. Рассмотрим, например, формулу (а + Ь)2 = а2 + 2аЬ + Ь2. Она справедлива в любом поле, если понимать 2аЬ как ab + ab. Однако в поле характеристики 2 она принимает более простой вид (а + Ь)2 = а2 + Ь2. Более общо, в поле характеристики р справедливо тождество (a+b)p = ap + bp. В самом деле, по формуле бинома Ньютона р (а+Ь)р = £ Скар~кЬк. k=0 Однако при 0 < к < р r<k — р(р~ 0- -• (р~+ О °р ~ *! (число сочетаний из р по к), очевидно, делится на р. Следова- тельно, все слагаемые формулы бинома Ньютона, кроме первого и последнего, в рассматриваемом случае равны нулю. ЗАДАЧА 2. Вывести отсюда, что в поле Zp справедливо тожде- ство ар = а. (Другое доказательство последнего факта, называемого малой теоремой Ферма, будет дано в § 4.5.)
§ 7. ВЕКТОРНЫЕ ПРОСТРАНСТВА 31 Хуже обстоит дело, когда приходится делить на натуральное чис- ло, например, когда мы находим выражение для ab из выписанной выше формулы квадрата суммы. Для того чтобы придать смысл этому делению в любом поле, можно рассматривать умножение на натуральное число к как умножение на элемент 1 + 1 + ... + 1 к данного поля; тогда деление на к можно понимать как деление на этот элемент. Однако если к делится на характеристику поля, то этот элемент равен нулю и деление невозможно. Так, формула для решения квадратного уравнения, содержащая деление на 2, применима в указанном смысле в любом поле характеристики 2, но в поле характеристики 2 она не работает. ПРИМЕР 8. Решим квадратное уравнение х2 + х — 1 = О в поле ZH. По обычной формуле находим: _ [-1]±х/[5] ж1,2- [2] Так как [5] = [16] = [4]2, то можно считать, что \/[5] = [4] (одно из значений квадратного корня). Следовательно, х + [-1]-[4] _ [-5] [6] _[31 1- [2] - [2] ~ [2] “НЬ [2] - [2] [2] § 7. Векторные пространства Векторы, рассматриваемые в элементарной геометрии, можно не только складывать, но и умножать на числа. Анализ свойств этих двух операций приводит к понятию векторного пространства. Прежде чем мы дадим определение, необходимо отметить, что здесь мы выходим за рамки того понимания операции на мно- жестве, которое принималось до сих пор. Умножение вектора на число не есть операция над двумя элементами одного и того же множества. Это операция, которая каждой паре (число, вектор) ставит в соответствие вектор. В общем определении векторного пространства дело обстоит так же, однако вещественные числа заменяются элементами произвольного (но фиксированного) поля. Определение 1. Векторным (или линейным) пространством над полем К называется множество V с операциями сложения
32 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ и умножения на элементы поля К, обладающими следующими свойствами: 1) относительно сложения V есть абелева группа; 2) А(а + Ь) — Аа + АЬ для любых А е К, a, b е V; 3) (А + /г)а = Аа + /га для любых А, /г G К, а С V; 4) (А/г)а = А (/га) для любых А, /г е К, а е V; 5) 1 а = а для любого а е V Элементы векторного пространства называются векторами. Эле- менты поля К, в отличие от векторов, мы будем иногда, допуская вольность речи, называть числами, даже если К не есть числовое поле. Векторы в смысле элементарной геометрии мы будем отныне на- зывать геометрическими векторами. Операции над ними удовлет- воряют всем аксиомам векторного пространства, что, собственно, и послужило основой для данного выше определения. Пространство геометрических векторов евклидовой плоскости (соответственно трехмерного евклидова пространства) мы будем обозначать че- рез Е2 (соответственно через Е3). Подчеркнем, что это векторное пространство над полем R. Приведем другие важные примеры векторных пространств. Пример 1. Множество Кп строк длины п с элементами из поля К является векторным пространством над К относительно операций, определенных формулами (аи аг,..., ап) + (Ь1, Ь2, ..., Ьп) = (а, + Ь1; а2 + Ь2,..., ап + Ьп), А(О], 02,.. ., ап) — (Аар Ай2,..., Аап). ПРИМЕР 2. Множество F(X, К) всех функций на множестве X со значениями в поле К является векторным пространством относительно обычных операций над функциями: (/ + 9)(х) = f(x) + д(х), (A/)(s) = Af(x). ПРИМЕР 3. Пусть К — подполе поля L. Тогда L можно рассма- тривать как векторное пространство над К, определив умножение элементов из L на элементы из К просто как умножение в L. В частности, поле С есть в этом смысле векторное пространство над R. Укажем некоторые следствия аксиом векторного пространства, не являющиеся следствиями только аксиом абелевой группы. Все они доказываются аналогично похожим на них следствиям аксиом кольца (см. §3). Символом 0 обозначается как нуль поля К, так
§ 7. ВЕКТОРНЫЕ ПРОСТРАНСТВА 33 и нулевой вектор, т. е. нуль аддитивной группы V; читатель увидит, что это не приводит к путанице. 1) АО —0 для любого А е К (здесь 0 — нулевой вектор). 2) А (—а) = — Ха для любых А е К, ае V. 3) А (а— Ь) = Ха— ХЬ для любых А е К, a, b е V. 4) 0а = 0 для любого ае V (здесь 0 слева — число, справа — вектор). 5) (—1)а=— а для любого ае V. 6) (А — ц)а= Ха — р,а для любых А,/х е АГ, а е V. Определение 2. Подмножество U векторного пространства V называется подпространством, если 1) U является подгруппой аддитивной группы V; 2) а е U ==> Ха е U для любого А е К. ЗАМЕЧАНИЕ 1. В определении подгруппы требуется, чтобы aeU => -aeU. При наличии условия 2) это свойство выполняется автоматически, так как — а — (—1)а. Подпространство векторного пространства само является вектор- ным пространством относительно тех же операций. Пример 4. В пространстве Е3 множество векторов, параллель- ных заданной плоскости или прямой, является подпространством. ПРИМЕР 5. В пространстве F(X, R) всех функций на заданном промежутке X числовой прямой множество непрерывных функций является подпространством. В каждом векторном пространстве V есть два «тривиальных» подпространства: само пространство V и нулевое подпространство (состоящее из одного нулевого вектора). Последнее мы будем обозначать символом 0. Определение 3. Векторные пространства V и U над полем К называются изоморфными, если существует такое биективное отображение <р: U, что 1) <р(а + Ь) — <р(а) + <р(Ь) для любых a, b е V; 2) <р(Аа) = А<р(а) для любых А е К, aeV. Само отображение <р называется при этом изоморфизмом про- странств V и U.
34 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ Как мы увидим в § 2.2, описание векторных пространств с точностью до изоморфизма весьма просто. В частности, все так называемые конечномерные векторные пространства, с которыми мы в основном и будем иметь дело в этом курсе, изоморфны пространствам Кп. Ключевым понятием этой теории является понятие базиса. Всякое выражение вида Ajсц + А2О2 + . .. + Апап (Ап А2,..., Ап е К) называется линейной комбинацией векторов аи а^,..., ап е V. Говорят, что вектор Ь линейно выражается через векторы а15 Ог,..., ап, если он равен некоторой их линейной комбинации. Определение 4. Система векторов {eu ..., en}c V называ- ется базисом векторного пространства V, если каждый вектор а е V единственным образом линейно а — выражается через , 6^, ..., еп. Коэф- фициенты этого выражения называют- \ / \ ся координатами вектора а в базисе \/ '' {'п®!. Пример 6. Из геометрии извест- 1 1 1 но, что любые два неколлинеарных Рис- 5 вектора еи % составляют базис про- странства Е2 (рис. 5). Аналогично, любые три некомпланарных вектора составляют базис простран- ства Е\ ПРИМЕР 7. Единичные строки е1 = (1,0,...,0), е2 = (0,1,...)0), е„ = (0,0,...,1) составляют базис пространства Кп. Координатами строки а = (аи а2,..., ап) в этом базисе служат числа аи а?,..., ап. Конечно, в пространстве Кп имеются и другие базисы. ПРИМЕР 8. В качестве базиса поля С как векторного про- странства над R (см. пример 3) можно взять {1, »}. Координатами комплексного числа в этом базисе служат его вещественная и мнимая части. Предложение 1. Всякое векторное пространство V над полем К, имеющее базис из п векторов, изоморфно простран- ству Кп.
§ 8. АЛГЕБРЫ 35 Доказательство. Пусть {е,, %,..еп} — базис простран- ства V. Рассмотрим отображение V- V—^Kn, ставящее в соответствие каждому вектору строку из его координат в базисе {eJ; еп}. Очевидно, что это биективное отображе- ние. Далее, если а= а1е1 + а2е2 + ... + апеп, b = biel + + ... + Ьпеп, то а+ b = (aj + + (а2 + + •••-(- (ап + Ьп)еп, Аа=(Аа)е] -|- (Ас^)^ Ч-+ (Аап)еп. Отсюда следует, что — изоморфизм. □ ПРИМЕР 9. Пространство Е2 (соответственно Е3) изоморф- но R2 (соответственно R3). § 8. Алгебры Ввиду крайней простоты своего строения векторные пространст- ва не интересны сами по себе, но они служат необходимым фоном для многих алгебраических (и не только алгебраических) теорий. Так, комбинируя понятия векторного пространства и кольца, мы приходим к важному понятию алгебры. Определение 1. Алгеброй над полем К называется множе- ство А с операциями сложения, умножения и умножения на элементы поля К, обладающими следующими свойствами: 1) относительно сложения и умножения на элементы поля А есть векторное пространство; 2) относительно сложения и умножения А есть кольцо; 3) (Aa)b = a(Ab) = А(аЬ) для любых А е К, а, b е А. ЗАМЕЧАНИЕ 1. Термин «алгебра», употреблявшийся нами до сих пор только как название одного из разделов математики, в этом определении имеет, естественно, другой смысл. Пример 1. Всякое поле L, содержащее К в качестве подполя, можно рассматривать как алгебру над К. В частности, поле С есть алгебра над R. Пример 2. Пространство Е3 есть алгебра относительно опера- ции векторного умножения. ПРИМЕР 3. Множество F(X, К) функций на множестве X со значениями в поле К (см. пример 7.2) является алгеброй над К
36 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ относительно обычных операций сложения и умножения функ- ций и умножения функции на число. Эта алгебра коммутативна, ассоциативна и обладает единицей (каковой является функция, тождественно равная единице). ЗАДАЧА 1. Доказать, что кольцо 2х из задачи 3.1 превращается в алгебру над полем Z2, если определить в нем умножение на элементы этого поля по правилам ОМ-0, 1М-М \/Ме2х. Предположим, что алгебра А обладает базисом {е,, е^,..., еп} как векторное пространство над К, и пусть a — alel -f- 02^2 ап^п ~ У2 ai> i = i b - Ь,е, + Ь2в2 + ... + bnen = Ь.е, i = l — два произвольных элемента этой алгебры. Тогда из дистри- бутивности умножения относительно сложения и свойства 3) в определении алгебры следует, что ab = Е а,(е,Ь) = Е а/Е &у(е. еу)^ = Е а£Ьу(е,еу). Это показывает, что умножение в алгебре А полностью определя- ется произведениями базисных векторов. Если умножение базисных векторов коммутативно, т. е. е£еу = еуе£ Vi,j, то и умножение в алгебре А в целом коммутативно. В самом деле, для любых а, b е А мы тогда в предыдущих обозначениях получаем ab = Е a. bj (е£ ej) = Е а, (еу е£) = Ьа. i,i i,3 Аналогично доказывается, что если умножение базисных векто- ров ассоциативно, т. е. (е£е,)е* = е£(еуе4) Vi, j, к, то и умножение в алгебре А в целом ассоциативно. С другой стороны, если V — какое-то векторное пространство с базисом {еи ej,..., еп} и е£> (г, j = 1, 2,..., п) — произвольные векторы этого пространства, то мы можем определить операцию умножения в V по правилу ab = Eoi^ev i, 3 и тем самым превратить V в алгебру.
§ 8. АЛГЕБРЫ 37 ПРИМЕР 4. Поле С как алгебра над R задается следующей таблицей умножения базисных векторов: X 1 i 1 i 1 i г-1 Проверка коммутативности и ассоциативности умножения в С сво- дится к тривиальной проверке коммутативности и ассоциативности умножения элементов 1 и г. ПРИМЕР 5. В ортонормированием (т.е. состоящем из орто- гональных единичных векторов) базисе {г, j, к} пространства Е3 таблица векторного умножения выглядит следующим образом: X i 3 к i 0 к -з 3 — к 0 i к 3 —i 0 Это умножение антикоммутативно и удовлетворяет тождеству Якоби (см. пример 3.4). Последнее тождество достаточно проверить для базисных векторов, что не составляет труда (проделайте это!). Пример 6. Алгебра кватернионов И задается базисом {1, г, j, к} со следующей таблицей умножения: X 1 i j к 1 i 3 к 1 i j к г -1 к -j j -к -1 i к j —i —1 Эта алгебра ассоциативна (проверьте это!), но не коммутативна. Она содержит в качестве подалгебры (см. определение ниже)
38 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ алгебру комплексных чисел. Позже мы увидим, что в алгебре Н, как и в поле, всякий ненулевой элемент обратим. Таким образом, это «некоммутативное поле». Подмножество алгебры называется подалгеброй, если оно одно- временно является подпространством и подкольцом. Отображение алгебр называется изоморфизмом, если оно одновременно являет- ся изоморфизмом векторных пространств и колец. § 9. Алгебра матриц Матрицей размера т х п над полем К называется прямо- угольная таблица из элементов поля К, имеющая т строк и п столбцов. В буквенной записи элементы матрицы обычно обозначаются одной и той же буквой с двумя индексами, первый из которых есть номер строки, а второй — номер столбца: °21 а12 °22 \ ат1 ат2 Иногда ради краткости мы будем писать просто А = (ai:i). Суммой матриц А — (ai3) и В = (Ьу) одинакового размера назы- вается матрица А + В = (ai3 + by). Произведением матрицы А = (оу) на элемент А е К называется матрица АА = (Аау). Относительно этих двух операций все матрицы размера т х п образуют векторное пространство, которое мы будем обозначать К™ х ". По сути дела оно не отличается от пространства строк Ктп. Специфика матриц проявляется при определении их умножения. Произведением матрицы А = (ау) размера т х п и матрицы В = — (bjk) размера пхр называется матрица AB — (cile) размера тхр, элементы которой находятся по формулам п ctk= 52 aijbjk- У=1 (Смысл этого определения выяснится в §2.3.) Подчеркнем, что произведение двух матриц определено только тогда, когда их размеры согласованы, а именно, когда число столбцов первой матрицы равно числу строк второй.
§ 9. АЛГЕБРА МАТРИЦ 39 Пример 1. 1 0 2 0-13 -1 5 1 1-2 + 00 + 2-1 О • 2 + (—1) • 0 +3 • 1 1-(-1) + 0-5 + 2-1 А О-(-1) + (-1) • 5 + 3 • 1 J 4 3 1 А -2 ) ' Пример 2. cos а sin а — sin а cos а cos /3 sin (3 - sin j3 cos /3 / cos a cos (3 - sin a sin (3 У sin a cos (3 + cos a sin /3 - cos a sin (3 — sin a cos /3 — sin a sin /3 + cos a cos /3 /cos(a+/3) -sin(a+/3) ysin(a+/3) cos(a + /3) Умножение матриц ассоциативно в том смысле, что (АВ)С = А(ВС), (9) если только размеры матриц А, В, С согласованы таким образом, что указанные произведения имеют смысл. В самом деле, пусть (АВ)С = (иа), А(ВС) = (vu). Имеем тогда ии = 52 ( 52 aij bjk ) сы = 52 aij bjk Ckl 1 k x j 7 ik vu = 52 % (52 bjk cw )= 52 an bjk сы, так что ua = va. Матрица размера п х п называется квадратной матрицей порядка п. Квадратная матрица имеет две диагонали. Одна из них, ведущая из левого верхнего угла в правый нижний, называется главной диагональю, или просто диагональю, а другая — побоч- ной диагональю. Квадратная матрица называется диагональной, если все ее элементы, находящееся вне (главной) диагонали, равны нулю. Умножение на диагональные матрицы выглядит особенно просто: /о, 0 ... 0 0 02 ... О \ 0 0 ... ап Ь12 ... Ь1р Ь21 Ь22 • Ь2р \ Ьп1 Ь„2 Ъ, ( а1Ъ11 O[Z>i2 ... aibip 02^21 °2Ь22 • • • °2Ь2р \ ®n^nl ®п^п2 * ‘ * ^пЬпр /
40 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ (каждая строка второй матрицы умножается на соответствующий диагональный элемент первой матрицы) и, аналогично, ац а12 • • • а1п ^1 • • • 0 \ / ап^1 а12^2 • • • О1А \ 021 022 ••• а2п I 0 b2 . . . О __ I °21 Ь] 022^2 ... а2п 1 \ ат1 ат2 • атп /\ 0 / \ От1 ^1 От2 ^2 • • • атп^п / (каждый столбец первой матрицы умножается на соответствующий диагональный элемент второй матрицы). Диагональную матрицу / а, 0 ... О \ О 02 ... О j <0 О ... ап) мы будем обозначать diag(а15 а2,..., ап). Диагональная матрица вида /1 0 ... 0\ Е = 0 1 •° \Ь о ... i / называется единичной матрицей. Из предыдущих формул следует, что для любой матрицы А размера т х п АЕ=А, ЕА — А, (10) где Е в первом случае обозначает единичную матрицу порядка п, а во втором — единичную матрицу порядка т. Следующие очевидные свойства связывают операцию умножения матриц с другими операциями: А(В + С) = АВ + АС, (А + В)С = АС + ВС, (11) (ХА)В = А(ХВ) = Х(АВ) \/ХеК. (12) (Как и в свойстве ассоциативности, здесь предполагается, что размеры матриц согласованы таким образом, что все указанные действия имеют смысл.) Сумма и произведение квадратных матриц одного и того же порядка п определены и также являются квадратными матрицами порядка п. Свойства (9)~(12) показывают, что все квадратные матрицы порядка п образуют ассоциативную алгебру с единицей. Мы будем обозначать ее Ln(K)*). *) Эту алгебру часто обозначают через МП(А"). Буква «L» в нашем обозначении — это первая буква слова «linear» и связана с тем, что матрицы можно интерпретиро- вать как линейные отображения (см. § 2.3).
§ 9. АЛГЕБРА МАТРИЦ 41 Отметим некоторые «отрицательные» свойства алгебры Ln(AT) при п 2. (Алгебра БДАГ) есть поле К.) 1) Алгебра Ln(A") не коммутативна. При п = 2 это можно продемонстрировать на следующем примере: 1 oVo iA_/o 1\ (0 1 V1 о\_(о о\ О оДо OJ~\O О/’ ^0 оДо О J ~ [о О/ Аналогичные примеры можно привести и при п > 2. 2) Алгебра Ln(AT) имеет делители нуля. Это показывает, на- пример, второе из приведенных выше равенств. Более того, суще- ствуют такие ненулевые матрицы, квадрат которых равен нулю, например, о 1\ _ /о 1 уо 1\ (О (Л О 0J ~ ^0 о До о/ о о/ 3) Не всякий ненулевой элемент алгебры Ln(K) обратим. Это следует из наличия делителей нуля и того факта, что делитель нуля не может быть обратим (см. доказательство отсутствия делителей нуля в поле, данное в §3). Так, например, матрицы (1 9 ] и /0 1 \ \ии/ I о q I необратимы в L2(AT). ЗАДАЧА 1. Матрица Е^, у которой на (г,/)-м месте стоит 1, а на остальных местах — нули, называется матричной едини- цей (не путать с единичной матрицей!). Матричные единицы Е^ (г, 3: = 1, • • ч п) образуют базис векторного пространства Ln(AT). Выписать таблицу умножения алгебры Ln(7f) в этом базисе. ЗАДАЧА 2. Матрицы вида ХЕ (А е К) называются скаляр- ными. Очевидно, что всякая скалярная матрица перестановочна со всеми квадратными матрицами того же порядка. Доказать обратное: всякая квадратная матрица, перестановочная со всеми квадратными матрицами того же порядка, скалярна. ЗАДАЧА 3. Доказать, что в алгебре L2(R) матрицы вида (а — Ь \ b a J образуют подалгебру, изоморфную алгебре комплексных чисел. Задача 4. Доказать, что в алгебре L2(C), рассматриваемой как алгебра над R, матрицы вида а —Ь b а
42 Гл. 1. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ образуют подалгебру, изоморфную алгебре кватернионов (см. при- мер 8.6). Для каждой матрицы определим транспонированную матрицу (а11 °21 • • • ат\ а12 а22 • • • ат2 &1п &2п * * ’ ^тп / строками которой служат столбцы матрицы А, а столбцами — стро- ки матрицы А. Если (г, У)-й элемент транспонированной матрицы обозначить через аТ., то аТ. = а . Ч Очевидно, что (АТ)Т = А (А +В)Т = АТ + ВТ, (АА)Т = ААТ \/ХеК. Докажем, что (АВ)Т = ВТА\ В самом деле, пусть АВ = С = (cik); тогда cki = cik=T^ anbjk = Е } i откуда видно, что CT = ВтАт. Замечание 1. Читатель может проследить, что все построения последних трех параграфов проходят без изменений, если в качестве К взять произвольное коммутативное ассоциативное кольцо с единицей, например, кольцо целых чисел или кольцо вычетов. Единственное отличие является терминологическим: вместо термина «векторное пространство» в этой более общей ситуации употребляется термин «модуль». (См. §9.3.)
Глава 2 НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ § 1. Системы линейных уравнений Пусть К — произвольное (но фиксированное) поле. Допуская вольность речи, мы будем обычно называть его элементы числами. Если читателю трудно представить себе произвольное поле, он может считать, что К = Ж, хотя объективно этот случай ничуть не проще общего. Линейным уравнением с неизвестными х1,х2,...,хп над по- лем К называется уравнение вида а\х\ +а2х2 + • • • + апхп = где коэффициенты at, ап и свободный член Ъ суть элемен- ты поля К. Линейное уравнение называется однородным, если Ь=0. Система т линейных уравнений с п неизвестными в общем виде записывается следующим образом: {“и®1+ а12а^ + .. • + — Ьр а21х1^~ а22х2 + . . .+ О2пХп = Ь2, (Р “ml^l+^^Z + • • - + атпхп = Ьт- Матрица . . / ап “12 • • • “in \ Д — I “21 “22 • • • “2n I ' “ml “m2 ' * * “mn ' называется матрицей коэффициентов, а матрица (“11 “12 • • • “in ^1 \ “21 “22 • • • “2n b2 j » Ct_,n • • * / ml mz mn m — расширенной матрицей системы (1).
44 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Система уравнений называется совместной, если она имеет хотя бы одно решение, и несовместной в противном случае. Совместная система может иметь одно или более решений. Решить систему уравнений — это значит найти все ее решения. Подчеркнем, что одно решение системы уравнений с п неиз- вестными — это упорядоченный набор из п чисел, т. е. элемент пространства Кп. Существует простой общий метод решения систем линейных уравнений, называемый методом Гаусса. Его идея состоит в при- ведении любой системы линейных уравнений с помощью некоторых специальных преобразований, называемых элементарными, к экви- валентной системе некоторого простого вида, все решения которой легко найти. Напомним, что две системы уравнений называются эквивалентными, если множества их решений совпадают, т. е. если каждое решение первой из них является решением второй и наоборот. Определение 1. Элементарными преобразованиями системы линейных уравнений называются преобразования следующих трех типов: 1) прибавление к одному уравнению другого, умноженного на число; 2) перестановка двух уравнений; 3) умножение одного уравнения на число, отличное от нуля. Подчеркнем, что при элементарном преобразовании 1-го типа изменяется только одно уравнение — то, к которому прибавляется другое, умноженное на число. Очевидно, что всякое решение исходной системы уравнений является решением новой системы, полученной элементарным преобразованием. С другой стороны, исходная система уравнений может быть получена из новой системы подходящим элементарным преобразованием того же типа. Так, если мы прибавим к первому уравнению второе, умноженное на с, то можно вернуться назад, прибавив к первому уравнению новой системы ее второе уравнение (оно такое же, как у исходной системы), умноженное на —с. Поэтому при любом элементарном преобразовании мы получаем систему уравнений, эквивалентную исходной. Так как нам удобнее работать не с самими системами линейных уравнений, а с их (расширенными) матрицами, дадим соответству- ющее определение для матриц. Определение 1'. Элементарными преобразованиями строк матрицы называются преобразования следующих трех типов:
§ 1. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 45 1) прибавление к одной строке другой, умноженной на число; 2) перестановка двух строк; 3) умножение одной строки на число, отличное от нуля. Очевидно, что всякое элементарное преобразование системы линейных уравнений приводит к соответствующему элементарному преобразованию ее матрицы коэффициентов и расширенной матри- цы. Покажем теперь, что с помощью элементарных преобразований строк любую матрицу можно привести к достаточно простому виду. Назовем ведущим элементом ненулевой строки (ан щ,..., ап)е е Кп ее первый ненулевой элемент. Определение 2. Матрица называется ступенчатой, если 1) номера ведущих элементов ее ненулевых строк образуют строго возрастающую последовательность; 2) нулевые строки, если они есть, стоят в конце. Таким образом, ступенчатая матрица — это матрица вида ( К-.............А %?.......... О \ / (2) в которой элементы а1У1, а2^,..аг> , находящиеся в углах ступен- чатой линии, отличны от нуля, а все элементы, находящиеся слева от этой линии и ниже нее, равны нулю. При этом < j2< ... < jr. Теорема 1. Всякую матрицу путем элементарных преобра- зований строк можно привести к ступенчатому виду. Доказательство. Если данная матрица нулевая, то она уже ступенчатая. Если она ненулевая, то пусть j\ — номер ее первого ненулевого столбца. Переставив, если нужно, строки, добьемся того, чтобы at- т^О. После этого прибавим к каждой строке, начиная со второй, первую строку, умноженную на подходящее число, с таким расчетом, чтобы все элементы у\-го столбца, кроме первого, стали равными нулю. Мы получим матрицу вида /0--0К-....А lolа~1л Поступая таким же образом с матрицей Alt мы в конце концов получим матрицу вида (2). □
46 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ ЗАМЕЧАНИЕ 1. В этом доказательстве мы обошлись без элемен- тарных преобразований 3-го типа. Однако на практике они могут быть полезны. ПРИМЕР 1. Приведем к ступенчатому виду матрицу /1 2 1 0 2\ 1 3 2 -1 4 2 1 -1 3 —2 ' \2 0 —2 3 1 / Вычитая из 2-й, 3-й и 4-й строк 1 -ю строку, умноженную на 1, 2 и 2 соответственно, получаем матрицу /1 2 1 0 2\ О 1 1-1 21 0-3-3 3 -6 ’ \0 —4 —4 3-3/ Далее, прибавляя к 3-й и 4-й строкам 2-ю строку, умноженную на 3 и 4 соответственно, получаем матрицу /121 0 2\ 011-12 ООО 0 0' \0 0 0 -1 5/ Наконец, переставляя 3-ю и 4-ю строки, получаем ступенчатую матрицу /121 0 2\ 011-12 0 0 0 —1 5' \0 О О 0 0/ ЗАМЕЧАНИЕ 2. Предыдущий пример специально подобран та- ким образом, чтобы /и/г, • • •, Л не были просто первыми г чле- нами натурального ряда. Такая ситуация является в определенном смысле исключительной. Например, j\ 1 только при условии, что первый столбец исходной матрицы нулевой. Как правило, /1 = 1, J2 = 2, Зг = г- В этом случае матрица (2) называется трапецеидальной. Применим доказанную теорему к решению систем линейных уравнений.
§ 1. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 47 Определение 3. Система линейных уравнений называется ступенчатой, если ее расширенная матрица ступенчатая. Из теоремы 1 следует, что всякую систему линейных уравне- ний с помощью элементарных преобразований можно привести к ступенчатому виду. Поэтому нам достаточно научиться решать ступенчатые системы. Введем некоторую терминологию. Квадратная матрица А = (aiy) называется (верхней) треугольной, если aiy = 0 при i > j, и строго треугольной, если, кроме того, ай у^О при всех г. Система линейных уравнений называется (строго) треугольной, если ее матрица коэффициентов (строго) треугольна. ЗАМЕЧАНИЕ 3. Квадратная матрица A =(afj) называется ниж- ней треугольной, если а0 =0 при i < j. Рассмотрим теперь произвольную ступенчатую систему линей- ных уравнений. Пусть число ненулевых строк (число ступенек) ее матрицы коэффициентов равно г, а число ненулевых строк расширенной матрицы равно т. Очевидно, что г = г или г + 1. Возможны следующие три принципиально разных случая. 1-й случай. т = г 4-1. В этом случае система содержит уравнение вида OXj 4- Oxj 4-... 4- 0жп = Ъ, где Ъ 0, и, следовательно, несовместна. 2-й случай. г = г — п. В этом случае после отбрасывания нулевых уравнений получается строго треугольная система. Из ее последнего уравнения однозначно определяется хп, затем из предпоследнего уравнения определяется хп_, и т. д. Следовательно, система имеет единственное решение. 3-й случай, г — г < п. Пусть в этом случае j\, j2,..., jr — номера ведущих коэффициентов ненулевых уравнений системы. Неизвестные ж,, х,,..х- назовем главными, а остальные — сво- бодными. После отбрасывания нулевых уравнений и перенесения членов со свободными неизвестными в правую часть получается строго треугольная система относительно главных неизвестных. Решая ее, как в предыдущем случае, находим выражения главных неизвестных через свободные. Эти выражения называют общим решением системы. Все решения системы получаются из общего решения подстановкой каких-то значений свободных неизвестных. Поскольку эти значения могут выбираться произвольно, система имеет, во всяком случае, более одного решения, а если поле К бесконечно, то бесконечно много решений.
48 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Совместная система линейных уравнений называется определен- ной, если она имеет единственное решение, и неопределенной, если она имеет более одного решения. В последнем случае, как следует из проведенного выше анализа, она имеет бесконечно много решений, если только поле К бесконечно. Ее общее решение с точностью до перенумерации неизвестных имеет вид 211 — Сп2:г + 1 + С122!г + 2 + . . . + Ci n_rXn + dj, ^2 — Cj] xr + ! + C22+ 2 4" • • • 4" C2, n-rXn + (3) ^xr = crixr + l + cr2xr + 2 + ... + crn_rxn + dr. ПРИМЕР 2. Решим систему уравнений 2q + 2X2 + Z3 =2, 2q + З22 + 223— 2J4 = 4, 2xl + 2^ — £3 + 32:4 = — 2, k 2xy — 2X3 + 2J4 = 1, расширенной матрицей которой служит матрица из примера 1. Вычисления, проведенные в примере 1, показывают, что данная система эквивалентна ступенчатой системе ' х} + 2x2 + Хз =2, < Х2 + Х3 — 2!4 = 2, - 2!4 = 5. Считая неизвестные 2^, 2^, х4 главными, а неизвестное 2^ — свобод- ным, перепишем систему в виде ' Xj + 2x2 — —Х3 + 2, < Х2 — хА — -Х3 + 2, - 2J4 = 5. Решая ее относительно ij, 2^, ж4, находим общее решение 25] = Х3 4- 8, < 2^2 — Х3 — 3, . х4 = - 5. ЗАМЕЧАНИЕ 4. Для единообразия можно считать, что в случае определенной системы все неизвестные являются главными, а свободные неизвестные отсутствуют. Общее решение есть тогда единственное решение системы.
§ 1. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 49 Строго треугольную матрицу можно путем элементарных преоб- разований строк привести к единичной матрице. Для этого нужно сначала к каждой строке, кроме последней, прибавить последнюю строку с таким коэффициентом, чтобы элемент последнего столбца стал равным нулю, затем аналогичным образом, прибавляя пред- последнюю строку, сделать равными нулю все элементы предпо- следнего столбца, кроме диагонального, и т. д. В результате мы получим диагональную матрицу. Умножая ее строки на подходящие числа, мы получим единичную матрицу. Пользуясь этим, можно при решении системы линейных уравнений не останавливаться на ступенчатом виде, а, продолжив преобразования, привести матрицу коэффициентов при главных неизвестных к единичной матрице. Тогда общее решение просто считывается с полученной матрицы. Эта процедура называется обратным ходом метода Гаусса. ПРИМЕР 3. Продолжим преобразование примера 1, предвари- тельно отбросив нулевую строку. Вычтя из 2-й строки 3-ю, получим матрицу /121 0 2\ 011 0 -3 . \0 0 0 -1 5/ Вычтя из 1-й строки удвоенную 2-ю и умножив 3-ю строку на — 1, получим матрицу 10-10 8\ 01 10—31- 00 0 1—5/ Таким образом, система уравнений из примера 2 эквивалентна системе ' - 2g =8, < 2g + 2g = —3, , ж4 — -5. Перенося члены с 2g в правую часть, получаем уже найденное выше общее решение. Система однородных линейных уравнений всегда совместна, так как она имеет нулевое решение. Если она определенна, то она имеет только нулевое решение, если неопределенна, то имеет хотя бы одно ненулевое решение (и даже бесконечно много таких решений, если поле К бесконечно). В предыдущих обозначениях, последний случай имеет место, если г < п. Пользуясь тем, что всегда г т, мы приходим к следующей теореме, которая является важным теоретическим следствием метода Гаусса.
50 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Теорема 2. Всякая система однородных линейных урав- нений, число уравнений которой меньше числа неизвестных, имеет ненулевое решение. Неопределенные системы линейных уравнений могут иметь раз- ную «степень неопределенности», каковой естественно считать число свободных неизвестных в общем решении системы. Так, прямая в пространстве задается системой (двух) линейных урав- нений с одним свободным неизвестным, а плоскость — системой (из одного уравнения) с двумя свободными неизвестными. Ясно, что это принципиально разные случаи. Однако одна и та же система линейных уравнений может допускать различные общие решения, в которых разные неизвестные играют роль свободных, и закономерен вопрос, будет ли число свободных неизвестных всегда одним и тем же. Положительный ответ на этот вопрос дается с помощью понятия размерности векторного пространства, которое будет введено в следующем параграфе. В оставшейся части этого параграфа мы интерпретируем метод Гаусса на языке умножения матриц. Прежде всего, если обозначить через X столбец неизвестных, а через В — столбец свободных членов, то систему (1) можно переписать в следующей матричной форме: АХ = В. (4) Действительно, матрица АХ, согласно правилу умножения матриц, есть столбец высоты т, i-Й элемент которого равен аИХ1 + ^2^2 + + ainXn- Приравнивая этот элемент г-му элементу столбца В, мы получаем как раз г-е уравнение системы (1). Пусть U — какая-либо квадратная матрица порядка т. Умножая обе части уравнения (4) слева на U, мы получаем уравнение UAX = UB. (5) Очевидно, что всякое решение уравнения (4) удовлетворяет и уравнению (5). Если же матрица U обратима, то умножение слева на U~l осуществляет обратный переход от уравнения (5) к уравнению (4) и, следовательно, эти уравнения эквивалентны. Уравнению (5) соответствует система линейных уравнений с матрицей коэффициентов UA и столбцом свободных членов UB. Легко видеть, что расширенная матрица этой системы равна UA.
§ 1. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 51 Далее, непосредственно проверяется, что элементарные преобра- зования строк какой-либо матрицы А равносильны ее умножению слева на так называемые элементарные матрицы следующих трех типов: где i j, с т^О, а все элементы этих матриц, не выписанные явно, такие же, как у единичной матрицы. Так, например, умножение матрицы А слева на Е + cEV (г j) приводит к тому, что к г-й строке прибавляется у-я строка, умноженная на с (а прочие строки не изменяются). Все элементарные матрицы обратимы, причем обратные к ним матрицы суть элементарные матрицы, соответствующие обратным элементарным преобразованиям: (Е + сЕ^=Е-сЕ^ F^ = Pij, ^(с)-^^(с-1)- Метод Гаусса в матричной интерпретации состоит в последова- тельном умножении уравнения (4) слева на элементарные матрицы, имеющем _целью приведение матрицы А (а также расширенной матрицы А) к ступенчатому виду. Используя вместо элементарных матриц какие-либо другие матрицы, можно получить другие методы решения систем линейных уравнений, которые, быть может, не столь просты в теоретическом отношении, но, скажем, более надежны при приближенных вычислениях (в случае К = R). Таков, например, метод вращений, при котором в качестве U берутся матрицы вида cos а sin а -----sin а........ • ••••' cos а..... = 1/
52 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ § 2. Базис и размерность векторного пространства Представление о размерности пространства есть одна из фунда- ментальных идей математики. В разных разделах математики оно (как и представление о самом пространстве) принимает разные формы. В этом параграфе мы дадим определение размерности векторного пространства и исследуем связанные с этим понятием вопросы. В §1.7 мы ввели понятие базиса векторного пространства и доказали, что векторное пространство над полем К, имеющее базис из п векторов, изоморфно пространству строк Кп. Размерность векторного пространства определяется как число векторов в его базисе. Однако перед тем как дать такое определение, необходимо ответить на два вопроса: какие векторные пространства обладают базисом и не может ли в векторном пространстве быть двух базисов, состоящих из разного числа векторов. Чтобы ответить на эти вопросы, нам понадобится ввести некото- рые понятия и доказать ряд утверждений, которые важны и сами по себе. Пусть V — векторное пространство над полем К. Линейная комбинация AjQj + Л2О2 + ... + Апап (А1; А2,..., Ап е К) векторов аи 02,..., ап е V называется тривиальной, если А( = = А2 = ... = Ап = 0, и нетривиальной в противном случае. Определение!. Векторы 0^02,..., ап называются линейно зависимыми, если существует их нетривиальная линейная комби- нация, равная нулю, и линейно независимыми в противном случае. Подчеркнем, что понятие линейной зависимости (или независи- мости) относится не к отдельным векторам, а к их совокупностям или, как говорят, системам векторов. ЗАМЕЧАНИЕ 1. Понятие системы векторов отличается от по- нятия множества векторов тем, что, во-первых, векторы системы предполагаются занумерованными и, во-вторых, среди них могут быть равные. Таким образом, система из п векторов — это, в сущности, отображение множества {1, 2,..., п} в пространство V. Заметим, однако, что свойство системы векторов быть линейно зависимой или независимой не зависит от нумерации векторов в ней. ЗАМЕЧАНИЕ 2. Термин «линейная комбинация» на самом деле употребляется в двух смыслах: как указание действий, которые
§ 2. БАЗИС И РАЗМЕРНОСТЬ ВЕКТОРНОГО ПРОСТРАНСТВА 53 производятся над данными векторами, что равносильно заданию коэффициентов А,, А2,..Ап, и как результат этих действий. В выражении «нетривиальная линейная комбинация данных векторов равна нулю» нетривиальность понимается в первом смысле, а равенство нулю — во втором. Линейная независимость векторов ан а?,..., ап означает, иными словами, что равенство A^i + А2О2 + ... + Апап =0 выполняется только при А, = А2 = ... = Ап =0. ПРИМЕР 1. Система, состоящая из одного вектора, линейно зависима тогда и только тогда, когда этот вектор нулевой. Пример 2. Система, состоящая из двух векторов, линейно зависима тогда и только тогда, когда эти векторы пропорциональны. ПРИМЕР 3. Три геометрических вектора линейно зависимы тогда и только тогда, когда они компланарны (параллельны одной плоскости). Очевидно, что если система векторов содержит линейно зави- симую подсистему, то она сама линейно зависима. Так, например, всякая система векторов, содержащая пропорциональные векторы, линейно зависима. Лемма 1. Векторы а}, а?,..., ап (n > 1) линейно зависимы тогда и только тогда, когда хотя бы один из них линейно выражается через остальные. Доказательство. 1) Пусть, например, ai=/i2O2 + --- + Mnan- тогда al — М2а2 — — Рпап = что показывает линейную зависимость векторов аи а,,..ап. 2) Обратно, пусть AjtZj + А2О2 + ... + Anan — 0, где не все коэффициенты Аи А2,..., Ап равны нулю. Допустим для определенности, что At ^0. Тогда Ао А “1 ~ — ДУ °2 — — Дуап> т. е. а, линейно выражается через а?,..., ап. □
54 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ ЗАМЕЧАНИЕ 3. Неверно, что любой вектор линейно зависимой системы линейно выражается через остальные. Пусть, например, а — какой-нибудь ненулевой вектор. Система {а, 0} линейно зави- сима, так как Oct 4- 1'0 — 0, но вектор а, очевидно, не выражается через нулевой вектор. Лемма 2. Пусть векторы о,, <%,..., ап линейно независимы. Вектор b линейно выражается через а1,а2,...,ап тогда и только тогда, когда векторы а{, ..., ап, b линейно зависимы. Доказательство. Если вектор Ь линейно выражается через Яр 02, ..., ап, то а1; а^,. .., ап, Ь линейно зависимы согласно предыдущей лемме. Обратно, пусть A]Oj + А2О2 4-... 4- Anan + цЬ =0, причем не все коэффициенты Аи А2,..., Ап, у равны нулю. Можно утверждать, что д 0: в противном случае мы получили бы линейную зависимость векторов аи а^,..., ап, что противоречит условию. Но тогда Ь — — — а, — —02 — ... — —а . □ (2 1 р. 1 р п Лемма 3. Пусть вектор Ь линейно выражается через векто- ры Ор 02, ..., ап. Это выражение единственно тогда и только тогда, когда векторы а1; 02, .... ап линейно независимы. Доказательство. 1) Пусть вектор b допускает два различ- ных выражения через аи а?, .. ., ап: b = AjO] 4- А2О2 4- • • • 4- Апап — Ajа, 4- A^ + ... 4- А'пап. тогда (А; — AJoj + (Aj — А2)а2 + ... + (А'п — Ап)ап = О есть линейная зависимость между а,, а^,..., ап. 2) Обратно, пусть Mi ai 4- М2 О2 + ... + Мп ап ~ ® есть линейная зависимость между ах, а%,..., ап. Тогда если b — A^j + А2О2 + ... + Апап, то также Ь — (Aj + //Jo] + (А2 + М2) ^2 4-... 4- (Ап 4- Рп)ап, что дает другое выражение Ь через аи а^..., ап. □
§ 2. БАЗИС И РАЗМЕРНОСТЬ ВЕКТОРНОГО ПРОСТРАНСТВА 55 Пусть S С V — какое-то подмножество. Совокупность всевоз- можных (конечных) линейных комбинаций векторов из S называ- ется линейной оболочкой множества S и обозначается через (S). Это наименьшее подпространство пространства V, содержащее S (проверьте это!). Говорят, что пространство V порождается множеством S, если (5) = V. Определение 2. Векторное пространство называется конеч- номерным, если оно порождается конечным числом векторов, и бесконечномерным в противном случае. Предложение 1 (основная лемма о линейной зависимости). Если векторное пространство V порождается п векторами, то всякие т> п векторов пространства V линейно зависимы. Доказательство. Пусть V = Д, а,,..., ап) и Ь1г Ь2, ..., Ьт (т > п) — какие-то векторы пространства V. Выразим их через Ог,..., ап: ^1 = Mil а1 + М12а2 + . . . + М1пап! ^2 М21 а| М22а2 + • • • + М2пап> Ьт = + Мт2°2 + • • • + Мт„Оп- Для любых А,, А2,..., Ат е К получаем отсюда АД + А2Ь2 + ... + АтЬт = (А^ц + А2^21 + ... + Am/iml)a! + + 1М12 + ^2^22 + . . . + Am/im2)02 + + (AiMi„ + -Чм2п + • • • + Рассмотрим систему п однородных линейных уравнений с т неизвестными ' Miia:i + M2i^ + --- + Mmia:m=0, ( Мчг1! + + • • • + Мтг^т = Min^i + 1Е>пЪ> + • • • + Р-тпхт =0. Если (Aj, А2,..., Ат) — произвольное решение этой системы, то АД + АД + ... + АтЬт = 0. С другой стороны, по теореме 1.2 эта система имеет ненулевое ре- шение. Следовательно, векторы Ь2,..., Ьт линейно зависимы. □
56 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Ввиду леммы 3 определение 1.7.4 базиса векторного пространст- ва можно переформулировать следующим образом. Определение 3. Базисом векторного пространства V называ- ется всякая линейно независимая система векторов, порождающая пространство V. Теорема 1. Всякое конечномерное векторное пространст- во V обладает базисом. Более точно, из всякого конечного порождающего множества S с V можно выбрать базис про- странства V. Доказательство. Если множество S линейно зависимо, то по лемме 1 в нем найдется вектор, линейно выражающийся через остальные. Выкидывая этот вектор, мы получаем порождающее множество из меньшего числа векторов. Продолжая так дальше, мы в конце концов получим линейно независимое порождающее множество, т.е. базис. □ Теорема 2. Все базисы конечномерного векторного про- странства V содержат одно и тоже число векторов. Это число называется размерностью пространства V и обозна- чается dim V. Доказательство. Если бы в пространстве V существовали два базиса из разного числа векторов, то, согласно предложению 1, тот из них, в котором больше векторов, был бы линейно зависим, что противоречит определению базиса. □ ЗАМЕЧАНИЕ 4. Нулевое векторное пространство (состоящее из одного нулевого вектора) считается обладающим «пустым ба- зисом»; в соответствии с этим его размерность считается равной нулю. ПРИМЕР 4. Пространство Е2 (соответственно Е3) имеет раз- мерность 2 (соответственно 3). ПРИМЕР 5. Ввиду примера 1.7.7 пространство Кп имеет раз- мерность п. ПРИМЕР 6. Поле комплексных чисел как векторное простран- ство над R имеет размерность 2, а алгебра кватернионов (см. при- мер 1.8.6) — размерность 4. ПРИМЕР 7. Если X —конечное множество из п элементов, то векторное пространство F(X,K) всех функций на X со значени- ями в К (см. пример 1.7.2) имеет размерность п. В самом деле, рассмотрим так называемые 6-функции ба (ае X), определяемые формулами {1, если х — а, О, если х^а.
§ 2. БАЗИС И РАЗМЕРНОСТЬ ВЕКТОРНОГО ПРОСТРАНСТВА 57 Очевидно, что любая функция е F(X, К) единственным образом выражается через 8-функции, а именно, <^ = Е <Р(а)8о. аех Следовательно, функции 8а, аеХ, составляют базис пространства F(X, К), причем координатами функции в этом базисе служат ее значения. Если множество X бесконечно, то для любого п в пространстве F(X, К) имеется п линейно независимых векторов, например, 8 8 , ..., 8а , где аи с^,..ап е X различны, и, следо- вательно, пространство F(X, К) бесконечномерно. Пример 8. Поле R как векторное пространство над Q бесконечномерно. В самом деле, если бы оно было конечномерным, то вещественное число определялось бы конечным набором рациональных чисел — своих координат в некотором базисе этого пространства. Но тогда множество всех вещественных чисел было бы счетным, что неверно. ЗАДАЧА 1. Найти число векторов n-мерного векторного про- странства над конечным полем из q элементов. ЗАДАЧА 2. Доказать, что пространство всех непрерывных функ- ций на любом промежутке числовой прямой бесконечномерно. Из основной леммы о линейной зависимости (предложение 1) следует, что в любом (конечном или бесконечном) множестве S векторов конечномерного векторного пространства V имеется максимальное линейно независимое подмножество, т. е. такое ли- нейно независимое подмножество, которое становится линейно зависимым при добавлении к нему любого из оставшихся векторов множества S. Более того, любое линейно независимое подмноже- ство множества S можно дополнить до максимального линейно независимого подмножества. Предложение 2. Всякое максимальное линейно независимое подмножество {е1;..., efc} множества S является базисом ли- нейной оболочки (S) этого множества. Доказательство. Нужно доказать, что каждый вектор из (S) линейно выражается через еи ..., ек. По определению линей- ной оболочки каждый вектор из (5) линейно выражается через векторы из S. Поэтому достаточно доказать, что каждый вектор ае S линейно выражается через еи ..., ек. Для ае {еи ..., ек} это очевидно. Для аф {еи ..., ек} это следует из леммы 2. □ Применяя высказанные соображения к S = V, мы получаем следующую теорему.
58 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Теорема 3. Всякую линейно независимую систему векторов конечномерного векторного пространства V можно дополнить до базиса. В частности, любой ненулевой вектор можно включить в базис, а любые п линейно независимых векторов n-мерного векторного пространства уже составляют базис. ЗАДАЧА 3. Найти число базисов n-мерного векторного про- странства над полем из q элементов. Следующая теорема устанавливает свойство монотонности раз- мерности. Теорема 4. Всякое подпространство U конечномерного векторного пространства V также конечномерно, причем dim U dim V. Более того, если U ^=V, то dim U < dim V. Доказательство. Пусть {et, е2,..., ек}— максимальная линейно независимая система векторов подпространства U. Со- гласно предложению 2, {еи е2,..., ек} — базис этого подпростран- ства. Следовательно, dimZ7 = fc. Линейно независимую систему {еи е2,..., ек} можно дополнить до базиса всего пространства V. Следовательно, если U 7^ V, то dim V > к. □ ЗАДАЧА 4. Найти число А:-мерных подпространств п-мерного векторного пространства над полем из q элементов. Следующая теорема дает исчерпывающее описание всех конеч- номерных векторных пространств. Теорема 5. Конечномерные векторные пространства над одним и тем же полем изоморфны тогда и только тогда, когда они имеют одинаковую размерность. Доказательство. Если /: V —> (7 — изоморфизм век- торных пространств и {еи ..., еп} — базис пространства V, то {f(el),f(e2),...,f(en)} — базис пространства U, так что dim V = dim U. Обратно, согласно предложению 1.7.1, всякое n-мерное векторное пространство над полем К изоморфно Кп; следовательно, все такие пространства изоморфны между собой. □ Таким образом, в любом рассуждении мы вправе заменить произ- вольное n-мерное векторное пространство над полем К простран- ством строк Кп. В пространстве Кп имеется «привилегированный» базис, состоящий из единичных строк (см. пример 1.7.7). С другой стороны, если в каком-либо n-мерном векторном пространстве V задан базис, то сопоставление каждому вектору строки его ко- ординат (как в доказательстве предложения 1.7.1) определяет
§ 2. БАЗИС И РАЗМЕРНОСТЬ ВЕКТОРНОГО ПРОСТРАНСТВА 59 канонический изоморфизм пространства V и пространства Кп, при котором векторам заданного базиса соответствуют единичные строки. В этом смысле можно сказать, что пространство строк — это не что иное, как конечномерное векторное пространство с выделенным базисом. Совокупность всех базисов n-мерного векторного пространст- ва V может быть описана следующим образом. Пусть {еи ..., еп} — какой-либо фиксировнный базис. Любая система п векторов {е[,..., е^} может быть тогда задана квадратной матрицей С = (с^), определяемой равенствами е,=Ее;су (> = 1,..., п) (6) г и называемой матрицей перехода от базиса {еи ..., еп} к системе {cj,..., е'}. Согласно этому определению, j-й столбец матрицы С есть столбец координат вектора в базисе {е15..., еп}. Поэтому векторы е[,...,е’п линейно независимы (и, значит, составляют базис) тогда и только тогда, когда столбцы матрицы С линейно независимы, т.е. когда матрица С невырожденна. Тем самым установлено взаимно однозначное соответствие между множест- вом всех базисов пространства V и множеством невырожденных матриц порядка п. Если распространить правило умножения матриц на случай, когда элементами одной из них являются векторы (что имеет смысл ввиду операций, определенных в векторном пространстве), то равенства (6) могут быть переписаны в следующей матричной форме: (е{,..., е^) = (е,,..., en)G (7) Пусть х е V — какой-либо вектор. Разложим его по базисам {еи..., еп} и {е,', х = + ... + жпеп = х[е{ + ... + х'пе'п. Положим , ч ч / * Х= : , Х'= : . V Хп / V Хп / Тогда х = (е[,...,е№ = (е1,...,еп)СХ', откуда получается следующая формула преобразования координат при переходе от базиса {е1;..., еп} к базису {е[,..., е'}: Х = СХ' (8)
60 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ или, более подробно, а:< = Есо^ (г = 1,..та). (9) з Понятия базиса и размерности могут быть распространены на бесконечномерные векторные пространства. Чтобы это сделать, надо определить, что такое линейная комбинация бесконечной системы векторов. В чисто алгебраической ситуации нет иного выхода, кроме как ограничиться рассмотрением линейных комби- наций, в которых лишь конечное число коэффициентов отлично от нуля. Пусть {а;: i el} — система векторов, занумерованных элемен- тами бесконечного множества I. Линейной комбинацией векто- ров at, i е I, называется выражение вида 52 \ао в котором лишь i е I конечное число коэффициентов А, отлично от нуля, так что сумма фактически является конечной и, таким образом, имеет смысл. На основе этого определения линейной комбинации точно так же, как в случае конечных систем векторов, определяются понятия линейной выражаемости, линейной зависимости и базиса. Мощность базиса называется размерностью пространства. В частности, векторное пространство, обладающее счетным бази- сом, называется счетномерным. ПРИМЕР 9. Очевидно, что множество всех последовательно- стей (строк бесконечной длины) из элементов поля К является векторным пространством относительно операций сложения и умножения на элементы поля К, определяемых так же, как для строк конечной длины. Последовательность называется финитной, если лишь конечное число ее членов отлично от нуля. Финитные последовательности образуют подпространство в пространстве всех последовательностей. Обозначим его через К”. В качестве его базисных векторов можно взять последовательности вида ef=(0, ...,0, 1,0,...) (г = 1,2,...) (единица стоит на г-м месте). Таким образом, пространство К°° счетномерно. Так же, как предложение 1.7.1, доказывается тот факт, что вся- кое счетномерное векторное пространство над К изоморфно К°°. Задача 5. Доказать, что поле R как векторное пространство над Q не является счетномерным. Задача 6. Доказать, что из всякого счетного порождающего множества вектор- ного пространства можно выбрать базис.
§ 2. БАЗИС И РАЗМЕРНОСТЬ ВЕКТОРНОГО ПРОСТРАНСТВА 61 Задача 7. Доказать, что любое несчетное множество векторов в счетномерном векторном пространстве линейно зависимо (и, следовательно, любой базис счетен). Задача 8. Доказать, что всякую (конечную или счетную) линейно независимую систему векторов счетномерного векторного пространства можно дополнить до базиса. Задача 9. Доказать, что всякое подпространство счетномерного векторного пространства не более чем счетномерно (т. е. счетномерно или конечномерно). Привести пример счетномерного подпространства счетномерного векторного про- странства, не совпадающего со всем пространством. Задачи 6-9 представляют собой аналоги теорем 1 -4 для счетномерных векторных пространств. Аналогичные утверждения могут быть доказаны и для несчетномерных пространств, но для этого требуется привлечение аппарата канторовской теории множеств (трансфинитной индукции или леммы Цорна). С другой стороны, такой чисто алгебраический подход имеет ограниченную сферу применения. Обычно несчетномерное векторное пространство снабжается топологией, которая позволяет придавать смысл бесконечным суммам векторов. С понятием размерности тесно связаны понятия ранга системы векторов и ранга матрицы. Определение 4. Рангом системы векторов называется раз- мерность ее линейной оболочки. Рангом матрицы называется ранг системы ее строк. Ранг матрицы А обозначается через rk А. Системы векторов {а1; а^,..., ап} и {Ь}, Ь2,..Ьт} называются эквивалентными, если каждый из векторов линейно выражает- ся через аи 02,..., ап и, наоборот, каждый из векторов а, линейно выражается через Ь2,..Ьт. Это, очевидно, равносильно совпа- дению линейных оболочек: {al,a2,...,an) = (bl,b2,...,bm). Поэтому ранги эквивалентных систем векторов равны. Из определения элементарных преобразований следует, что стро- ки матрицы А', полученной из матрицы А каким-либо элементар- ным преобразованием, линейно выражаются через строки матри- цы А. Но так как матрица А может быть получена из А' обратным элементарным преобразованием, то и, наоборот, ее строки линейно выражаются через строки матрицы А'. Таким образом, системы строк матриц А и А' эквивалентны и, следовательно, ранги этих матриц равны. Этим можно воспользоваться для вычисления ранга матрицы. Предложение 3. Ранг матрицы равен числу ненулевых строк любой ступенчатой матрицы, к которой она приводится эле- ментарными преобразованиями строк.
62 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Доказательство. Так как ранг матрицы не меняется при элементарных преобразованиях, то нам достаточно доказать, что ранг ступенчатой матрицы равен числу ее ненулевых строк. Для этого, в свою очередь, достаточно доказать, что ненулевые строки ступенчатой матрицы линейно независимы. Предположим, что линейная комбинация ненулевых строк сту- пенчатой матрицы (2) с коэффициентами А1,А2,...,АГ равна нулю. Рассматривая У,-ю координату этой линейной комбинации, находим, что А^. =0, откуда Aj =0. Рассматривая, далее, у2-ю координату с учетом того, что А! =0, находим, что Х^^ =0, откуда А2 = 0. Продолжая так дальше, получаем, что все коэффициенты А], А2,..., Аг равны нулю, что и требовалось доказать. □ В частности, какую бы последовательность элементарных пре- образований, приводящих заданную матрицу к ступенчатому виду, мы ни выбрали, число ненулевых строк полученной ступенчатой матрицы будет одним и тем же. С учетом предложения 3 результаты, полученные в § 1 при анали- зе ступенчатых систем линейных уравнений, приводят к следующей теореме. Теорема 6. 1) (Теорема Кронекера — Капелли.) Система ли- нейных уравнений совместна тогда и только тогда, когда ранг матрицы ее коэффициентов равен рангу расширенной матрицы. 2) Совместная система линейных уравнений является опре- деленной тогда и только тогда, когда ранг матрицы ее коэф- фициентов равен числу неизвестных. § 3. Линейные отображения В любой алгебраической теории наряду с изоморфизмами рассма- тривают более общие отображения, называемые в общем случае гомоморфизмами, а в случае векторных пространств—линейными отображениями. В то время как изоморфизмы полностью сохраня- ют внутренние свойства алгебраических структур и их элементов, гомоморфизмы сохраняют их лишь частично. Определение 1. Пусть V и U — векторные пространства над полем К. Отображение V — U называется линейным, если 1) у?(а+ Ь) = <р(а) + <р(Ь) для любых а, b € V; 2) у?(Аа) = Ау?(а) для любых X е К, aeV.
§ 3. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ 63 Это определение отличается от определения изоморфизма век- торных пространств тем, что в нем не требуется биективности. Отметим, что при линейном отображении нулевой вектор перехо- дит в нулевой, а противоположный — в противоположный. В самом деле, <р(а ^(0) = ^(0 0) = 0^(0) = 0, =¥’1 ^(-а) = 1)а) = (—1)^>(а) = -у>(а). Легко также доказать, что <р(Ъ) — b) = <р(а) — ПРИМЕР!. Поворот есть линейное отображение (и даже изоморфизм) пространства Е2 в себя (рис. 1). ПРИМЕР 2. Ортогональное проектирование на плоскость опре- деляет линейное отображение (но не изоморфизм) пространства Е2 в пространство геометрических векторов этой плоскости. ПРИМЕР 3. Дифференцирование является линейным отображе- нием пространства непрерывно дифференцируемых функций на за- данном промежутке числовой прямой в пространство непрерывных функций на этом промежутке. ПРИМЕР 4. Отображение ъ j f(x)dx а является линейным отображением пространства непрерывных функций на отрезке [а, Ь] в поле R, рассматриваемое как векторное пространство над самим собой. Линейное отображение V —> U однозначно определяется образами базисных векторов пространства V. В самом деле, пусть {ег: i е 1} — базис пространства V; тогда для любого вектора х = 52 xiе, имеем 1 ¥>(x) = '£lxi¥>(ei)- i С другой стороны, если ut е U (г G I) — произвольные векторы, то отображение V —> U, определяемое по формуле ^(.х) = ^, xiun г как легко видеть, является линейным и <р(еД = ие
64 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Эти соображения позволяют получить аналитическое описание линейных отображений. Сделаем это для пространств строк. Пусть Кп^Кт — линейное отображение. Применим его к единичным строкам еп пространства Кп (см. пример 1.7.7). Мы получим какие-то строки ^(ej = (аь, Огр .. ., amj) G Кт (> = 1,2,..., п). Числа а0 (г = 1,2, ..., т, > = 1,2, ..., п) образуют матрицу А размера т х п, которая называется матрицей линейного отоб- ражения <р. (Обратите внимание, что координаты строки записываются в >-м столбце матрицы А.) Для любой строки х = (х,, Х2, ..хп) = Е xjej е Кп 3 имеем Н*) = £ х^(е.) = ( Е аИх., Е а^.,..., Е amjxA. з х 3 3 з 7 Таким образом, если положить <р(х) = у = {ух,у2,...,ут), т0 У1 >%>•••> Ут выражаются через а^, х%,..., хп по формулам % = Е (г = 1,2,..., т). (10) >=1 Обратно, если А = (ау) — произвольная матрица размера тхп, то отображение ip: Кп —* Кт, определяемое формулой (10), ли- нейно и его матрица есть А. Тем самым устанавливается взаимно однозначное соответствие между линейными отображениями про- странства К” в Кт и матрицами размера тхп. В соответствии с этим матрица линейного отображения р: V —> U произвольных конечномерных векторных пространств определяет- ся следующим образом: в ее >-м столбце стоят координаты образа >-го базисного вектора пространства V. Эта матрица, естественно, зависит от выбора базисов в пространствах V и U. ПРИМЕР 5. В пространстве Е2 выберем ортонормированный базис {еи 62}. Пусть р— поворот на угол а (рис. 2). Тогда р{ех) — е{ cos а + ej sin а, ^(ej) = —е, sin а + cos а-
§ 3. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ 65 (П) матрица (относительно Это означает, что матрица отображения есть cos а — sin а sin a cos а Заметим, что в данном случае V = U тот же базис {е15 в двух качествах: как базис пространства V и как базис пространства U, хотя, согласно опре- делению, не обязаны были это делать. ПРИМЕР 6. Найдем матрицу про- ектирования из примера 2. В плоско- сти проектирования выберем любой базис {б], е?} и дополним его ортого- нальным вектором е3 до базиса про- странства. Так как при проектирова- нии векторы Cj и ej переходят сами в себя, а вектор % — в нуль, то иском выбранных базисов) имеет вид 1 О О А 0 10/ В отличие от изоморфизма линейное отображение не обязано быть ни сюръективным, ни инъективным. Нарушение этих свойств приводит к возможности связать с каждым линейным отображени- ем два подпространства — его образ и ядро. Определение 2. Образом линейного отображения tp: V —> U называется подмножество Im = {у>(а): а 6 V} С U, а ядром — подмножество Ker р = {a G V: р(а) — 0} С V. Легко видеть, что Im р — подпространство в U, а Кег — под- пространство в V. Докажем, например, второе. Если a, b GKery?, т. е. <р(а) = р(Ь) = 0, то р(а + b) = р(а) + р(Ь) = 0 + 0 = О, т. е. a+b e Ker р. Далее, если aGKer <р, т. е. <р(а) = 0, то для любого А е К р(Ха) — А<р(а) = АО = 0,
66 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ т. е. Ха е Кег <р. Наконец, О G Кег <р, так как по доказанному выше Н0) = 0. ПРИМЕР 7. Ядром отображения проектирования из примера 2 является совокупность векторов, ортогональных плоскости проек- тирования. ПРИМЕР 8. Ядром отображения дифференцирования из приме- ра 3 является совокупность постоянных функций, а образом — пространство всех непрерывных функций. Последнее следует из существования первообразной у каждой непрерывной функции, доказываемого в анализе. Теорема 1. Линейное отображение <р: V —> U инъективно тогда и только тогда, когда Кег = 0. Более точно, для любого b е Im tp множество решений уравнения <р(х) = Ь (12) имеет вид а + Кег ip, где а — какое-то одно решение этого уравнения. (Здесь a + Ker$0 понимается как совокупность сумм вида а + у, где у е Кег <р.) Заметим, что Кег<р, согласно определению, есть множество решений уравнения ip(x) = 0. (13) Доказательство. Инъективность отображения р означает, что для любого b G Im <р уравнение (12) имеет единственное решение. Поэтому нам достаточно доказать второе утверждение теоремы. Пусть <р(а) — Ь. Если у G Кег <р, то р(а + у) = <р(а) + р(у) = b + 0=b. Обратно, если р(х) = Ь, то <р(х — а) — <р(х) — р(а) = b — Ъ — 0, т.е. у = х — аЕ Кег <р; следовательно, х = а+ у Е а + Кег <р. □ Если ip: Кп -+ Кт — линейное отображение с матрицей А и b = (Ьи b2,..Ьт), то уравнение (12) в координатной форме —
§ 3. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ 67 это не что иное, как система линейных уравнений (1), а уравне- ние (13) — это система однородных линейных уравнений с теми же коэффициентами при неизвестных: ' + а12Х2 + ... + а1пхп =0, ®21 Х1 "1" ®22 %2 + • • • + ®2Л = / 1 /1 \ ага]х, + аот2а^ + .. . + атпхп = 0. Таким образом, множество решений системы уравнений (14) есть подпространство пространства Кп, а множество решений систе- мы (1), если оно непусто, есть сумма какого-нибудь одного ее решения и этого подпространства. Какова размерность пространства решений системы (14)? Ответ на этот вопрос дает следующая теорема. Теорема 2. Пусть у?: Кп —> Кт — линейной отображение с матрицей А. Тогда dim Ker = п - rk А. Доказательство. С помощью элементарных преобразова- ний приведем систему (14) к ступенчатому виду. В силу предложе- ния 2 число ненулевых уравнений в этом ступенчатом виде будет равно г = rk Л. Поэтому общее решение будет содержать г главных неизвестных и с точностью до перенумерации неизвестных будет иметь вид (ср. (3)) = С11 Хт + 1 + С12 + 2 + • • • 4” С1, п - г Хп > Xj — Cji хт + j + С22хг + 2 + ... + с, п _ г хп> X. = С, Х„ , . + C9Z , , + . . . + с, „ ,х„. г г 1 г + 1 rz г + z 1 г, п — г п Придавая по очереди одному из свободных неизвестных ^r + i, ^г + 2> • хп значение 1, а остальным — значения 0, мы получим следующие решения системы (14): Щ =( СП, GJ], ..., сг1, 1, 0, ..., 0), ^2 ~ ( с12> ^21 • -1 Ct2i 0; 1; • • •> 0), и„-г = (С1,п-г,^,п-г,---.СГ1П_г,0, 0, ..., 1). Докажем, что они составляют базис пространства Кегу>, откуда и будет следовать утверждение теоремы.
68 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Для любых Аи А2,..Ап_г е К линейная комбинация и = A, u, + A2U2 + ... + Xn_run_r является решением системы (14), в котором свободные неиз- вестные имеют значения А,, А2,..Ап_г. Так как значения глав- ных неизвестных однозначно определяются значениями свободных неизвестных (по формулам (15)), то любое решение системы (14) является линейной комбинацией решений ии ип_ r. С другой стороны, если и — О, то А, = А2 = ... = Ап_г =0; следовательно, и,, и?,..., ип_г линейно независимы. □ Всякий базис пространства решений системы однородных линей- ных уравнений называется фундаментальной системой решений. Предыдущее доказательство дает практический способ построения такой системы решений. Пусть <р: V —> U — линейное отображение конечномерных век- торных пространств и {еи ..., еп} — базис пространства V. Для любого а=а1е1 +a2e2 + ... + anene V имеем На) = а,p(et) + + ... + ап^>(еп). Следовательно, 1ш^ = (у?(е1), ^(ег),у>(еп)). (16) Теорема 3. dim Im + dim Ker tp = dim V. Доказательство. Выберем базис пространства V спе- циальным образом: сначала выберем базис {еи ..., efc} подпро- странства Кег р, а затем дополним его какими-то векторами efc + p...,en Д° базиса пространства V. Так как по построению ^(ej = ... = ip(ek) = 0, то из (16) следует, что Im = (<p(efc + 1),..^(е„)). Докажем, что векторы ip(ek + i),..ip(en) линейно независимы, откуда и будет следовать утверждение теоремы. Пусть \^(efc + i) + • • • + \-ь^(еп) = 0- Рассмотрим вектор а — 1 ek +1 + • • • + А„ - k еп- Предыдущее равенство означает, что р(а) — 0, т.е. ае Кег = (ер ..., ек). Так как еи ..., ек, ek + i,..., еп линейно независимы, то это возмож- но только при A1 = ... = An_Jb=O, что и требовалось доказать. □
§ 3. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ 69 Следствие 1. Если <р: К" —» К™—линейное отображение с матрицей А, то dim Im = гк А. Доказательство. Доказательство получается сравнением теорем 2 и 3. □ Следствие 2. Ранг системы столбцов любой матрицы равен рангу системы ее строк. Доказательство. Пусть <р: Кп —> Кт — линейное отоб- ражение с матрицей А и e^e,,еп— единичные строки про- странства Кп. Из (16) следует, что размерность пространства Im равна рангу системы столбцов матрицы А. Сравнение этого с предыдущим следствием и дает желаемый результат. □ ПРИМЕР 9. Поле К можно рассматривать как (одномерное) векторное пространство над самим собой. Линейное отображение <р: V —> К называется линейной функцией на V. Если — ненулевая линейная функция, то Im у? = К и при dim V = п теорема 3 дает равенство dim Кег = п — 1. ПРИМЕР 10. Пусть X — множество ребер тетраэдра и У — множество его граней. Каждой функции f на X со значениями в поле К поставим в соответствие функцию g на У, определяемую следующим образом: р(у)= Е хСу т. е. значение функции g на какой-либо грани равно сумме значений функции f на сторонах этой грани. Этим определяется линейное отображение р: F(X,K)-+F(Y,K) (см. пример 1.7.2). Докажем, что если char К ^2, то оно сюръектив- но. Для этого достаточно показать, что Im содержит 6-функции всех граней (см. пример 2.7). Функция f, для которой <p(f) есть «5-функция нижней грани, изображена на рис. 3, а) (ее значения на непомеченных ребрах равны нулю). Так как dim F(X, К) = 6, dim F(Y, К) - 4, то по теореме 3 dim Кег = 6 — 4 — 2. Функции, составляющие базис подпространства Кег у>, изображены на рис. 3, б).
70 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Рис. 3, а) Рис. 3, б) ЗАДАЧА 1. Для отображения из предыдущего примера найти dim Кег в случае, когда char К — 2. Так как столбцы матрицы А — это строки транспонированной матрицы Ат (см. § 1.9), то следствие 2 теоремы 3 означает, что rkAT = rkA. Аналогично элементарным преобразованием строк матрицы опреде- ляются элементарные преобразования столбцов. Им соответствуют элементарные преобразования строк транспонированной матрицы. Поэтому ранг матрицы не изменяется не только при элементарных преобразованиях строк, но и при элементарных преобразованиях столбцов. ЗАМЕЧАНИЕ 1. Элементарные преобразования столбцов мат- рицы равносильны ее умножению на элементарные матрицы спра- ва. Обратимся теперь к операциям над линейными отображениями. Линейные отображения V —> U можно складывать и умножать на числа, как обычные функции: (<р + V>)(“) = 4>(а) + V’(a), (А<р)(а) = А<р(а). Относительно этих операций они образуют векторное пространст- во. Далее, если <р: V Ц ф-. W-+V — линейные отображения, то их произведение (композиция) W-+ U есть также линейное отображение. В самом деле, (<р^)(«+ Ь) = <р(^(а+ Ь)) = + ‘ф(Ь)) = = р(^(а)) + ^(#)) = (<р-0)(«) + (<Р^)(Ь), (<р^)(Аа) = ip(ip(Xa)) = <р(А^(а)) = А<^(^(а)) — А(ут0)(а)-
§ 3. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ 71 Умножение линейных отображений связано с линейными опера- циями свойствами р(ф + w) = рф + рш, (р + 1p)w = pW + 1рШ, (Ap)ip = p(Aip) = A(cpV’) VA € К. Докажем, например, первое из свойств дистрибутивности. Пусть р: V—> Ц ф-.W-^V, W.W-+V — линейные отображения. Для любого а G W имеем (р(ф + w))(a) = p((ip + w)(a)) = p(ip(a) + ш(а)) = = <р(^(а)) + <р(^(а)) = (pip)(a) + (рш)(а) = (рФ + <Р^)(а). Умножение линейных отображений ассоциативно, как и вообще умножение любых отображений. В самом деле, пусть М, N, Р, Q — какие-то множества и р\ N —>- М, ip: Р —> N, и>: Q —> Р — какие-то отображения. Тогда для любого aG Q имеем ((<^)w)(a) = (<^)(w(a)) = <p(^(w(a))), (<p(V»w))(a) = p((ipu>)(a)) = p(ip(u>(a))), откуда (рф)ш = p(ipu>). Операции над линейными отображениями пространств строк со- ответствуют таким же операциям над их матрицами. Для линейных операций это очевидно. Докажем это для умножения. Пусть р:Кп^Кт, ip: КрКп — линейные отображения с матрицами А = (at]) и В — (bjk) соответственно. Пусть е() ..., ер — единичные строки простран- ства Кр. Тогда V’C6*) — (^lfc, b2k,..., bnk), (.РФ)(еь) = p(ip(ek)) = ( Y, apjbjk, Y, O2jbjk,..., ^ amjbjk\ 4 3 3 3 ' Следовательно, матрица отображения рф есть C' = (ciJfe), где cik =Y,anbjk- 3 Это означает, что С = АВ, что и требовалось доказать.
72 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Пример И. Матричное равенство, доказанное в примере 1.9.2, на языке линейных отображений означает, что произведение по- воротов плоскости на углы а и (3 есть поворот на угол а + /3 (см. пример 5). Поскольку последнее утверждение геометрически очевидно, это дает доказательство формул для косинуса и синуса суммы двух углов. Свойства операций над матрицами, полученные нами в §1.9 прямыми вычислениями, могут быть теперь выведены из соответ- ствующих свойств операций над линейными отображениями. Очевидно, что тождественное отображение id : V V линейно. Матрица тождественного отображения id : Кп —+ Кп есть единичная матрица Е порядка п. Поэтому свойства единичной ма- трицы (см. формулу (10) гл. 1)) есть просто перевод на матричный язык очевидных равенств • id = ip, id -р = ip, где р\ Кп —»Кт — линейное отображение, задаваемое матрицей А, a id в первом случае обозначает тождественное отображение пространства Кп, а во втором — тождественное отображение пространства Кт. Напомним, что отображение множеств обратимо тогда и только тогда, когда оно биективно. Если <р: V —» U — биективное линейное отображение, то обратное отображение <р-1: U—+ V также линейно. В самом деле, для любых a, b Е U пусть с, d Е V — такие векторы, что <р(с) = a, p{d) — b; тогда р(с + d) = а+ b и, следовательно, р~'(а + b) = c + d = <р“‘(а) + <р-1(Ь). Аналогично проверяется и второе свойство линейности. Применим эти соображения к проблеме обратимости матриц. Определение 3. Квадратная матрица А порядка п называется невырожденной, если rk А = п. Иными словами, матрица А невырожденна, если ее строки (или столбцы) линейно независимы. Теорема 4. Квадратная матрица обратима тогда и только тогда, когда она невырожденна. Доказательство. Пусть р: Кп —> Кп — линейное отобра- жение, задаваемое матрицей А. Согласно предыдущему, матрица А
§ 4. ОПРЕДЕЛИТЕЛИ 73 обратима тогда и только тогда, когда отображение биективно. Последнее в силу теоремы 1 имеет место тогда и только тогда, когда 1т<р = К", Кег<р=0. Ввиду теоремы 2 и следствия 1 теоремы 3 каждое из этих условий эквивалентно тому, что rk А — п. □ Нахождение матрицы, обратной к А, можно рассматривать как решение матричного уравнения АХ = Е (где X — неизвестная квадратная матрица). Такое уравнение можно решать, как и уравнение (4), с помощью умножения слева на элементарные матрицы, что равносильно элементарным преоб- разованиям строк «расширенной» матрицы (А|£?). Приведя левую половину этой матрицы к единичной матрице (что возможно в силу невырожденности матрицы А), в правой половине мы получим обратную матрицу. Пример 12. Найдем матрицу, обратную к матрице Для этого проделаем следующие элементарные преобразования: 1 2 1 0А_/1 2 1 (А /10-5 2 А 3 5 0 1/ ^0 -1 -3 1J [О 1 3 -1/ Таким образом, ЗАДАЧА 2. Используя линейные отображения, доказать, что ранг произведения двух матриц (не обязательно квадратных) не превосходит ранга каждой из них, а если одна из этих матриц невырожденна, то ранг произведения равен рангу другой матрицы. § 4. Определители Вопрос о невырожденности квадратной матрицы или, что рав- носильно, о линейной независимости п векторов n-мерного про- странства в каждом конкретном случае можно решить приведением матрицы к ступенчатому виду элементарными преобразованиями
74 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ строк. Однако представляет интерес нахождение общего условия, которому должны удовлетворять элементы матрицы для того, чтобы она была невырожденной. Поясним идею получения такого условия на примере геометрических векторов. Пара неколлинеарных векторов а1,а2еЕ2 называется ориенти- рованной положительно, если поворот от а. к (на угол, мень- ший тг) происходит в положительном направлении. Для любых век- торов а1; Oj обозначим через агеа^, а?) ориентированную площадь параллелограмма, натянутого на эти векторы, т. е. площадь, взятую со знаком плюс, если пара ориентирована положительно, и со знаком минус в противном случае; если векторы а, и а2 коллинеарны, то положим агеа(аи а?) = 0. Величина | area(<Zj, с^)! может служить мерой линейной независимости векторов и а,. Функция агеа(а1, а^) векторных аргументов а{ и а% обладает следующими свойствами: 1) она линейна по и по (см. пример 3.9); 2) area (с^, 04) = —area (<z,, 02); 3) если {еи Cj} — положительно ориентированный ортонормиро- ванный базис, то area (ен е2) = 1. Последние два свойства очевидны. Для доказательства пер- Рис. 4 вого представим площадь параллелограмма как произведение основания на высоту. Мы получим тогда area (аи а?) = |<z, |/г2, где |aj|—длина вектора ait a — проек- ция вектора на прямую, ортогональную at (рис. 4). Так как проектирование есть линей- ное отображение, то отсюда следует линей- ность area (аи Oj) по с^. Аналогично, взяв за основание с^, можно доказать линейность по аг Свойств 1)_3) достаточно для вычисления агеа(а1, Oj). Выразим векторы аи Oj через положительно ориентированный ортонормиро- ванный базис {е^ еД: j Cj -f- a^2C2, °2 ~ T- ^22^2* Тогда area (g^ , ^2) — area (ctj। -f- a]202, ^21 Cj -I- ^22^2) — = ацС^агеа (еи еД + аиarea (e^ ej) + а^а^агеа (ej, еД + + a12a22area (e^ 62) = a,lla22 — a^a^.
§ 4. ОПРЕДЕЛИТЕЛИ 75 Выражение ЯцО^ — a12O2i называется определителем матрицы А = (а.у) порядка 2. Из предыдущего следует, что векторы а} и 02 линейно независимы тогда и только тогда, когда определитель матрицы, составленной из их координат, отличен от нуля. Аналогичным образом можно доказать, что ориентированный объем vol (аи 02, Оз) параллелепипеда, натянутого на векторы О], Oj, Оз, обладает следующими свойствами: 1) он линеен по каждому из трех аргументов а15 02, а^; 2) он меняет знак при перестановке любых двух аргументов; 3) если {е15 е?, 63} — положительно ориентированный ортонорми- рованный базис, то vol (е,, 6%, е3) = 1. (Тройка {0^02,03} считается ориентированной положительно, если поворот от к а2 со стороны происходит в положительном направлении.) Пользуясь этими свойствами, можно получить следующее вы- ражение для vol (аи 02, а3) через координаты векторов 04,02, аз в положительно ориентированном ортонормированном базисе (про- делайте это!): vol (о,, 02, О3) = ои 022033 + а12а2зО3| + о13О2] Оз2 — — о11а23а32 — 0(302203] — а12а21а33. Выражение, стоящее в правой части этого равенства, называ- ется определителем матрицы А =(а;>) порядка 3. Таким образом, векторы о15 02, Од линейно независимы тогда и только тогда, когда определитель матрицы, составленной из их координат, отличен от нуля. Определитель матрицы А = (atJ) порядка 3 представляет со- бой алгебраическую сумму всевозможных произведений трех эле- ментов матрицы, взятых по одному из каждой строки + ~ и из каждого столбца. На у* рис. 5 схематически изобра- жено, какие из этих произ- «Г/ч. ведений берутся со знаком плюс и какие — со знаком /-''''J минус. Определитель матрицы А Рис 5 обозначается либо через det А, либо путем замены круглых скобок, заключающих в себе матрицу, вертикальными чертами.
76 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Пример 1. cos а — sin а sin a cos а — cos2 а + sin2 а — 1. Пример 2. 1 2 3 4 5 6 = 1 5 • 9 + 2 • 6 • 7 + 3 • 4 • 8 — 3 • 5 • 7 — 2 • 4 • 9 — 1 -6-8 = 7 8 9 =45 + 84 + 96- 105-72-48 = 0. В случае произвольной размерности и произвольного поля, когда мы не располагаем такими понятиями, как площадь или объем, естественно попытаться ввести определитель как функцию, обладающую свойствами, аналогичными свойствам 1)-3). Дадим необходимые для этого определения. Пусть V — векторное пространство над полем К и f(a,, а^,... ..ат) — функция от т векторов пространства V, принимающая значения в К. Определение 1. Функция f(a{, а?,..., ат) называется полили- нейной (или, точнее т-линейной), если она линейна по каждому аргументу. Например, линейность по первому аргументу означает, что f W + aj,..., ат) = /(o'], 02,..., ат) + ..., om), f(Aoj, aj,..., am) = Af (аи aj,..., am). Определение 2. Полилинейная функция /(а{, <%,..., ат) назы- вается кососимметрической, если при перестановке любых двух аргументов она умножается на —1. Важное свойство кососимметрической полилинейной функции состоит в том, что, если только char К 2, она обращается в нуль всякий раз, когда какие-либо два аргумента принимают одинаковые значения. В самом деле, при перестановке этих двух аргументов значение функции не изменится, но, с другой стороны, оно должно умножиться на —1; следовательно, оно равно нулю. Замечание 1. Если char А? = 2, то последнее свойство следует принять за определение кососимметричности. Докажем, что из него, наоборот, вытекает косо- симметричность в определенном выше смысле. Поскольку при проверке кососимме- тричности по каким-либо двум аргументам значения остальных аргументов следует считать фиксированными (хотя и любыми), достаточно рассмотреть случай били- нейной (т. е. 2-линейной) функции. Пусть f — билинейная функция, обращающаяся в нуль при одинаковых значениях аргументов. Тогда для любых а, Ь е V имеем 0 = f(a+ b, а+ 6) = /(а, а) + /(а, Ь) + /(6, а) + f(b, b) = f(a, b) + f(b, а), откуда f(b, а) = —f(a, 6).
§ 4. ОПРЕДЕЛИТЕЛИ 77 Теперь введем понятия, необходимые для описания явного анали- тического выражения определителя матрицы порядка п, подобного тем, которые были получены при п — 2 и 3. Последовательность (fcj5 А^,..., кп) чисел 1,2, ...,п, располо- женных в каком-либо порядке, называется перестановкой из п элементов. Так как может принимать п различных значений, к? при заданном kt может принимать п - 1 значений, fc, при заданных А, и fcj может принимать п — 2 значений и т. д., то имеется всего п(п — 1)(п — 2)... 2 • 1 — п! перестановок из п элементов. Перестановка (1, 2,..., п) называет- ся тривиальной. ЗАМЕЧАНИЕ 2. Слово «перестановка» в математической лите- ратуре (в частности, в этой книге) иногда употребляется в обще- человеческом смысле как изменение порядка каких-либо объектов (например, перестановка слов в предложении). Говорят, что пара чисел образует инверсию в заданной пере- становке, если большее из них стоит левее меньшего. Переста- новка называется четной (соответственно нечетной), если число инверсий в ней четно (соответственного нечетно). Наряду с этим определяется знак перестановки, равный 1, если перестановка четна, и —1, если она нечетна. Знак перестановки (к{, А^,..., кп) обозначается через sgn(fc,, А^,..., кп). Пример 3. При п = 3 четные перестановки — это (1,2,3) (нет инверсий), (2,3,1) (две инверсии) и (3,1,2) (две инверсии), нечетные — (1,3,2) (1 инверсия), (3,2,1) (3 инверсии) и (2,1,3) (1 инверсия). Пример 4. Тривиальная перестановка не имеет инверсий и поэтому четна. Напротив, в перестановке (п, п — 1,..., 2, 1) любая пара чисел образует инверсию. Поэтому число инверсий в этой перестановке равно С2 = = [n] (mod2). Следовательно, sgn(n,n- 1,...,2, 1) = (-!)”<”-о/2 = (—1)[~/21. Перемена местами двух элементов в перестановке называется транспозицией этих элементов. Предложение 1. При любой транспозиции четность пере- становки меняется.
78 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Доказательство. При транспозиции соседних элементов меняется взаимное расположение только этих элементов, так что число инверсий изменяется (увеличивается или уменьшается) на 1; следовательно, четность меняется. Транспозиция элементов г и j, разделенных s другими элементами, может быть осуществлена путем 2s + 1 последовательных транспозиций соседних элементов: сначала переставляем i со всеми промежуточными элементами и с У, затем переставляем j со всеми промежуточными элементами. Каждый раз знак перестановки будет меняться по доказанному выше. Так как это произойдет нечетное число раз, то в результате знак перестановки изменится на противоположный. □ Следствие. При п > 1 число четных перестановок из п элементов равно числу нечетных. Доказательство. Выпишем все четные перестановки и в каждой из них произведем транспозицию первых двух элементов. Тогда мы получим, причем по одному разу, все нечетные переста- новки. □ Теперь мы в состоянии сформулировать и доказать основную теорему. Теорема 1. Для любого с е К в пространстве Кп существу- ет единственная кососимметрическая п-линейная функция f, удовлетворяющая условию f(e,,e2,. ..,е„) = с (17) (где е,, е?,..., еп — единичные строки). Она имеет вид f(ai,a2,...,an) = c sgn(fci, fc>,..., kn)alk ... arik , (18) ..*„> где aik обозначает k-ю компоненту строки а(, а суммирование происходит по всем перестановкам из п элементов. Доказательство. 1) Предположим, что f — кососимметри- ческая n-линейная функция, удовлетворяющая условию (17). Тогда f (а1> °2> • • ч ап) ~ f ( 22 аЩ ец , 22 a2k2ekll • • ч 22 anknekn) ~ К *5 < = 22 • • ank f(ek.i ek,i •> ek„)- В силу кососимметричности функции f, если какие-то два из чисел ftp кп равны, то /(е^, е^,..., ек ) — 0. Если все они различны, то %, • • ч ек) = с sgn(fc,, к^,..., кп).
§ 4. ОПРЕДЕЛИТЕЛИ 79 В самом деле, если это равенство верно для какой-то переста- новки кп), то оно верно и для любой перестановки, получаемой из нее транспозицией, так как при транспозиции обе части равенства умножаются на —1. По условию (17) оно верно для тривиальной перестановки. Но очевидно, что любую перестановку можно получить из тривиальной последовательными транспозициями. Следовательно, доказываемое равенство верно для любой перестановки, и мы получаем для f . ,,ап) вы- ражение (18). Таким образом, если функция f, удовлетворяющая указанным условиям, существует, то она имеет вид (18) и тем самым единственна. 2) Докажем теперь, что функция /, определяемая равенст- вом (18) является полилинейной кососимметрической и удовлет- воряет условию (17). Линейность по каждому из аргументов оче- видна, поскольку для любого i равенство (18) можно представить в виде /(aj, а,,..., ап) = 52а17и., з где и^...,ип не зависят от а;. Условие (17) также выполнено, поскольку в выражении для /(еи Cj,..., еп) слагаемое, отвечающее тривиальной перестановке, равно 1, а все остальные слагаемые равны нулю. Остается проверить кососимметричность. Посмотрим, что происходит при перестановке аргументов а£ и а,. Мы можем разбить множество всех перестановок на пары перестановок, получаемых друг из друга транспозицией к{ и kj. Согласно предложению 1, произведения а^а^.. .апк , соответству- ющие перестановкам из одной такой пары, входят в выражение (18) с противоположными знаками. При перестановке at и а; они меняются ролями и, следовательно, все выражение умножается на -1. □ Замечание 3. Если char К = 2, то кососимметричность следует понимать в смысле замечания 1. Ее доказательство в этом случае состоит в том, что при а, = члены выражения (18), соответствующие перестановкам каждой из описанных выше пар, взаимно уничтожаются. Функцию, удовлетворяющую условиям теоремы 1 при с — 1, обозначим через det. Определение 3. Определителем квадратной матрицы А = (а£>) порядка п называется число det А = det(a], а?,..., ап), где ан аи ..., ап — строки матрицы А.
80 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Таким образом, det А = Y, sgn(кп)аща^ апк . (19) При п = 2 и 3 мы получаем выражения, приведенные в начале этого параграфа. Аналогичным образом, отождествляя каждую матрицу с набором ее строк, можно рассматривать любую функцию от п элементов пространства Кп как функцию от квадратной матрицы порядка п, и наоборот. Утверждение о единственности, содержащееся в теореме 1, можно теперь сформулировать таким образом: Следствие. Если f - какая-mo кососимметрическая полили- нейная функция строк матрицы, то f(A) = f(E) det А. (20) При п 4 вычисление определителя непосредственно по фор- муле (19) в общем случае весьма затруднительно. Существуют значительно более простые способы вычисления определителей. Они основаны на свойствах определителей, доказываемых ниже. Предложение 2. Определитель матрицы не изменяется при элементарном преобразовании строк 1 -го типа. Доказательство. Пусть, скажем, к 1-й строке матрицы А прибавляется 2-я строка, умноженная на с. Полученную матрицу обозначим через А'. Имеем: det А’ — det(a! + са^, а%,. ап) — = det(an cij,..., ап) + с det^, с^,..., ап) = det А. □ При перестановке двух строк определитель, как мы знаем, умножается на —1, а при умножении какой-либо строки на число он умножается на это число. Таким образом мы можем проследить за изменением определителя при любых элементарных преобразова- ниях строк матрицы. Так как любую матрицу с помощью элементар- ных преобразований строк можно привести к ступенчатому виду, а всякая ступенчатая квадратная матрица является треугольной (но, может быть, не строго треугольной), то нам остается научиться вычислять определитель треугольной матрицы. Предложение 3. Определитель треугольной матрицы равен произведению ее диагональных элементов.
§ 4. ОПРЕДЕЛИТЕЛИ 81 Доказательство. Произведение диагональных элементов входит в выражение (19) определителя любой матрицы со знаком плюс, так как соответствует тривиальной перестановке. В случае треугольной матрицы все остальные члены этого выражения равны нулю. В самом деле, если ajka^ ... апк /0, то fcj 1, fcj 2, ..., fcn п; но так как = 1+ 2 + ... + п, то это возможно только при кх — 1, А^ = 2, ..., кп = п. □ Помимо того, что они дают практический способ вычисления определителей, предложения 2 и 3 позволяют нам ответить на вопрос, ради которого мы и ввели понятие определителя. Теорема 2. Квадратная матрица А невырожденна тогда и только тогда, когда det А 0. Доказательство. С помощью элементарных преобразова- ний строк приведем матрицу А к ступенчатому виду. Если при этом использовались элементарные преобразования 2-го или 3-го типов, то определитель может измениться, но, во всяком случае, его равенство нулю или отличие от нуля сохранится. Матрица А невырожденна тогда и только тогда, когда полученная ступенчатая матрица является строго треугольной; но это равносильно тому; что ее определитель отличен от нуля. □ Продолжим изучение свойств определителей. Теорема 3. det Ат = det А. Доказательство. Определитель матрицы Ат, как и опре- делитель матрицы А, есть алгебраическая сумма всевозможных произведений п элементов матрицы А, взятых по одному из каждой строки и из каждого столбца. Единственное, за чем надо проследить, — это то, что одинаковые произведения входят в det А и det АТ с одинаковыми знаками. Для того чтобы выяснить, с каким знаком входит в det Ат произведение а^ ... , нужно расположить его сомножители по порядку номеров столбцов. Этого можно достичь, последо- вательно меняя местами два сомножителя. При каждой такой перемене в перестановках, образуемых номерами строк и столбцов, одновременно происходят транспозиции, так что произведение их
82 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ знаков не меняется. Таким образом, если полученное в результате произведение будет иметь вид а^1а^2 ... а, п, то sgn(fcI; fcj = sgn(Z1; Z„), а это и означает, что рассматриваемое произведение входит в det А и det Ат с одним и тем же знаком. □ Из этой теоремы следует, что всякое свойство определителей остается справедливым, если заменить в нем строки столбцами, а столбцы — строками. В частности, мы таким образом получаем Следствие. Определитель есть кососимметрическая полили- нейная функция столбцов матрицы. Теорема 4 (об определителе матрицы с углом нулей). Пусть матрица А имеет вид где В и С — квадратные матрицы. Тогда det А — det В • det С. Доказательство. При фиксированных В и D определитель матрицы А является кососимметрической полилинейной функцией ее последних строк и, тем самым, кососимметрической полилиней- ной функцией строк матрицы С. Согласно следствию теоремы 1, получаем отсюда det А = det ( •? ) • det С. \ U 25 / Первый множитель, в свою очередь, при фиксированной матрице D является кососимметрической полилинейной функцией столбцов матрицы В, откуда det f л f = det f % р V det В — det В \ U 25 у \ U 25 у (zp Г)\ Р р, I треугольная с единицами на диаго- Ввиду теоремы 3 аналогичная формула верна и для матриц с правым верхним углом нулей.
§ 4. ОПРЕДЕЛИТЕЛИ 83 Пример 5. Вычислим так называемый определитель Вандер- монда 1 х1 X2 . . zf-1 V(z15 х^,. — 1 % zf . /у» Л. 1 • *^2 1 . zn~‘ • п Вычитая из каждого столбца, начиная с последнего, предыдущий столбец, умноженный на xlt и применяя теорему 4, получаем 10 0 ... 0 V(xl,x2,...,xn) = 1 ^(a^-Xi) ... х£ 2(х2-х{) 1 xn-Xi х^-х^ ... х£ 2(z„-z,) = (х2-х1)... (хп - xi)V(x2,..., хп). Продолжая так дальше, в конце концов получаем ...,zn)= (21) г >3 Пусть А — произвольная (не обязательно квадратная) матри- ца. Всякая матрица, составленная из элементов матрицы А, на- ходящихся на пересечении каких-то выбранных строк и каких- то выбранных столбцов, называется подматрицей матрицы А. Подчеркнем, что выбираемые строки и столбцы не обязаны идти подряд. Определитель квадратной подматрицы порядка к называется минором порядка к матрицы А. Иногда, допуская вольность речи, саму квадратную подматрицу также называют минором. В частности, если А — квадратная матрица порядка п, то минор порядка п — 1, получаемый вычеркиванием г-й строки и У-го столбца, называется дополнительным минором элемента ау и обозначается через Mtj. Число Ач = (-\у^М^ называется алгебраическим дополнением элемента atf. Смысл алгебраического дополнения ясен из следующей леммы. Лемма 1. ап • •• • • «1п 0 . •• • . 0 = а-А 13 «п! • •• % • • апп
84 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ (В левой части стоит определитель матрицы, полученной из ма- трицы А = (%.) заменой нулями всех элементов г-й строки, кроме аа-) Доказательство. Поменяем местами г-ю строку со всеми предыдущими строками и у-й столбец со всеми предыдущими столбцами. При этом мы будем г — 1 раз менять местами строки и j — 1 раз столбцы, так что определитель умножится на (—1 у -1 +з -1 = В результате получится определитель вида % 0 ... О а,. a, 1 ... а, 11 • • • In a a, ... a nj nl • • • nn где в правом нижнем углу стоит дополнительный минор элемента atj. По теореме об определителе матрицы с углом нулей этот определитель равен а^М^. С учетом предыдущего знака отсюда и получается доказываемое равенство. □ Теорема 5. Для любой квадратной матрицы А det A =XaijAij = 3 i Первая из этих формул называется формулой разложения определителя по i-й строке, вторая — формулой разложения определителя по j-му столбцу. Доказательство. Так как каждый член выражения (19) для det А содержит ровно один элемент из г-й строки, то предыдущая лемма означает, что сумма тех членов, которые содержат aijt равна а^А^. Отсюда вытекает формула разложения по строке. Аналогично доказывается формула разложения по столбцу. □ ЗАМЕЧАНИЕ 4. Знаки (—l)i + j чередуются в матрице в шахмат- ном порядке, причем на главной диагонали стоят плюсы. Пример 6. Вычисление определителя Д из примера 2 разложе- нием по 2-й строке дает 1 3 9 Д ——4 3 , с 4 8 9 = -4(-6)+5(-12)-6(-6)=0. Пример 7. Вычислим определитель порядка п вида 2 1 О 1 2 1 О 1 2 О о о о о о п ООО ООО 2 1 1 2
§ 4. ОПРЕДЕЛИТЕЛИ 85 Разлагая его по 1-й строке и затем второй из полученных опреде- лителей— по 1-му столбцу, получаем А„=2Д, 1 1 ... О О О 2 ... О О О 0 ... 2 1 О 0 ... 1 2 = 2Д п — п-21 - д откуда Д - Д , = Д ,-Д ,. п п-1 - 1 п-2 Это означает, что последовательность (Ди Д2, Д3,...) есть арифме- тическая прогрессия. Так как Д] =2, Д2 = 3, то ее разность равна 1 и Дп = п + 1. Теорема 6. Для любых квадратных матриц А, В det АВ = det А det В. Доказательство. Легко видеть, что строки ма- трицы АВ получаются из строк ..., ап матрицы А умножением на В : с, = а{В (i — 1,..., п). Отсюда следует, что при фиксированной матрице В определитель det АВ есть кососимметрическая полилинейная функция строк матрицы А. В самом деле, пусть, например, at = с^ + а^, где afj, — какие-то строки; тогда detfo^B, а2В,..., апВ) = det((a'1 + d[)B, а^В,..апВ) = = det(a'1B + а"В, а^В,..., апВ) = = det(a'IB, а^В,..., апВ) + det(a'I'B, а^В,..., апВ). Остальные свойства проверяются аналогично. После этого, приме- няя следствие теоремы 1, получаем: det АВ = det ЕВ det А — det А • det В. □ Пример 8. Выразим неориентированный объем V паралле- лепипеда, натянутого на векторы a1; а^, а3 G Е3, через длины laj, IojI, I Оз I его ребер и плоские углы (см. рис. 6) а1 = ^“3, а2 = ^«1, <*3 ~
86 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ Пусть А = (ai}) — матрица, составленная из координат векторов а( в ортонормированием базисе. Мы знаем (см. начало параграфа), что V = ±detA. Поэтому V2 = (det А)2 = det А • det Ат — det А<4Т. Из правила умножения матриц следует, что (г, У)-й элемент матрицы А4Т есть скалярное произведение (af, Оу) = |aj|aj cos а(аг Рис. 6 Таким образом, V2 = Ы2 l^lhd cos а3 1аз11а11 cos а2 laJlaJcosaj | 11 a31 cos ск2 № laJH cos a( cosaj |a3|2 = |a1|2|a2|2|a3|2 1 cos a3 cos a2 cos a3 1 COS Ctj cos a2 cos ar1 1 и, значит, V = cos cos a2 cos a3— cos2 O'] — COS2 О a2“ cosz a3 § 5. Некоторые приложения определителей Как мы видели в предыдущем параграфе (теорема 2), определи- тели дают ответ на вопрос о невырожденности (и, тем самым, об обратимости) квадратной матрицы, который служил нам поводом для их введения. Вариации на эту тему приводят к многочисленным приложениям определителей в теории линейных уравнений и теории матриц. Первые из таких приложений будут рассмотрены в этом параграфе. Рассмотрим квадратную систему линейных уравнений all‘Cl + a12a:2 + • • + alnXn = < <^21 + . . + = Ь2, (22) ‘ “nl Х1 + ап2Х2 + • • • + аппХп = К'
§ 5. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ОПРЕДЕЛИТЕЛЕЙ 87 Обозначим через А ее матрицу коэффициентов и через Ai (г — = 1,2,..п) матрицу, полученную из А заменой ее г-го столбца столбцом свободных членов. Теорема 1. Если det А 0, то система (22) имеет единст- венное решение, которое может быть найдено по формулам Эти формулы называются формулами Крамера. Доказательство. При любом элементарном преобразова- нии системы (22) в матрицах А и А{ (г = 1,2,..., п) одновременно происходит соответствующее элементарное преобразование строк и, следовательно, отношения, стоящие в правых частях формул Крамера, не изменяются. С помощью элементарных преобразо- ваний строк матрицу А можно привести к единичной матрице. Поэтому достаточно доказать теорему в том случае, когда А = Е. Если А — Е, то система имеет вид ' хх = ЬХ Хп = Ъп Она, очевидно, имеет единственное решение хг = bi (г = 1,2,..., п). С другой стороны, det А = det Е = 1, detAf = 10... Ьх ...00 0 1... Ь2 ...00 = bt, 0 0... Ь( ...00 00... Ьп_х ... 1 0 0 0... Ьп ...01 так что формулы Крамера в этом случае действительно верны. □ Если det А = 0, то ступенчатый вид матрицы А не будет строго треугольным и, следовательно, система (22) либо несовместна, либо неопределенна. Опасно в этом случае пытаться как-то трак- товать формулы Крамера. Они просто не применимы (ведь они доказывались в предположении, что det А ^0), и надо действовать как-то иначе. Задача 1. Доказать, что если det А = 0, но detA£^O для какого-либо г, то система (22) несовместна.
88 Гл. 2. НАЧАЛА ЛИНЕЙНОЙ АЛГЕБРЫ ЗАДАЧА 2. Показать, что если det А = det Aj =... = det Ап = О, то система (22) может быть как несовместной, так и неопреде- ленной. (Привести примеры, показывающие, что обе возможности реализуются.) Отметим, что формулы Крамера — это далеко не лучший спо- соб для практического решения систем линейных уравнений, за исключением, быть может, случая п = 2. Они имеют в основном теоретическое значение. В частности, они позволяют получить следующие явные формулы для элементов обратной матрицы. Теорема 2. Пусть А = (аг]) — невырожденная квадратная матрица. Тогда / -^11 -^-21 • • • -^п! \ Д-1— 1 ‘^•12 -^-22 ••• ^п2 1 71 ~ det А .................. Г \ -^in A2n ... Апп ) (Через А(- обозначается алгебраическое дополнение к элементу а^; см. §4.) Доказательство. Матрица А~‘ является решением матрич- ного уравнения АХ = Е. Это уравнение рассыпается на п уравнений относительно столбцов Х{, Х2, .Хп матрицы X: АХ3. = Е], (23) где Ej — j-й столбец матрицы Е. В координатной записи уравнение (23) представляет собой систе- му п линейных уравнений относительно элементов х^., х^,..., xnj столбца ХГ Матрицей коэффициентов этой системы служит матри- ца А, а столбцом свободных членов — столбец Ej. По формулам Крамера “и а, In _ 1 ХЧ ~ det А _ А’* det А ’ что и требовалось доказать. □
§ 5. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ОПРЕДЕЛИТЕЛЕЙ 89 ПРИМЕР 1. Для невырожденной матрицы порядка 2 получаем ( d ъ\ & ad - be ( —с a / ’ Эту простую формулу имеет смысл запомнить. ЗАДАЧА 3. Пусть А —невырожденная целочисленная (т. е. состоящая из целых чисел) квадратная матрица. Доказать, что матрица А~' является целочисленной тогда и только тогда, когда det А = ±1. Наконец, нахождение ранга любой матрицы также может быть сведено к вычислению определителей. Теорема 3 (о ранге матрицы). Ранг матрицы равен наиболь- шему порядку ее миноров, отличных от нуля. Доказательство. Пусть ранг матрицы А равен г, и пусть з > г. Тогда любые з строк матрицы А линейно зависимы и, тем более, линейно зависимы строки любой квадратной подматрицы порядка з, представляющие собой части соответствующих строк матрицы А. Следовательно, любой минор порядка з равен ну- лю. Далее, рассмотрим подматрицу, образованную какими-либо г линейно независимыми строками матрицы А. Ее ранг, очевидно, также равен г и, значит, среди ее столбцов найдется г линейно независимых. Минор порядка г, образованный этими столбцами, не равен нулю. □ ЗАДАЧА 4. Доказать теорему о ранге матрицы в следующей более сильной форме: если в матрице А имеется минор порядка г, отличный от нуля, а все миноры порядка г + 1, получаемые при- писыванием к нему одной строки и одного столбца (так называемые окаймляющие миноры), равны нулю, то rk А — г. ЗАДАЧА 5. Доказать, что в матрице ранга г любой минор порядка г, образуемый пересечением г линейно независимых строк с г линейно независимыми столбцами, отличен от нуля. Задача 6. Угловым минором порядка к квадратной матрицы А называется определитель подматрицы порядка к, расположенной в левом верхнем углу матрицы А. Доказать, что если все угловые миноры матрицы А отличны от нуля, то ее можно привести к треугольному виду, добавив к каждой строке линейную ком- бинацию предыдущих строк. Вывести отсюда, что матрица А единственным образом представляется в виде А = UB, где U — нижняя треугольная матрица с единицами на диагонали, а В — верхняя треугольная матрица.
Глава 3 НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ § 1. Построение и основные свойства алгебры многочленов Функция вещественной переменной х называется многочленом, если она может быть представлена в виде /(я) = Oq + ajiE + а^х2 + ... + апхп, где Oq, а1; aj,..ап — какие-то вещественные числа (некоторые из них или даже все могут равняться нулю). Можно доказать, и мы это сделаем ниже в более общей ситуации, что такое представление единственно с точностью до приписывания членов с нулевыми коэффициентами, т. е. если Oq + а{х + а^х2 + ... + апхп = Ьо + Ь{х + Ь2х2 + ... + bnxn Ух е R, то ак = Ьк при к =0, 1,2,..., п. Очевидно, что сумма и произведение многочленов, а также про- изведение многочлена на любое число, также являются многочле- нами. Это означает, что многочлены образуют подалгебру в алгебре всех функций вещественной переменной (см. пример 1.8.3). Эта по- далгебра называется алгеброй многочленов над R и обозначается R[x], Из предыдущего следует, что многочлены 1, аг, х2,... образуют базис алгебры R[x]. Таблица умножения для этого базиса выглядит весьма просто: хк х1 = хк + 1. Если попытаться аналогичным образом трактовать многочлены над любым полем К, то возникает трудность, состоящая в том, что формально различные многочлены могут быть тождественно равны при всех значениях переменной. Например, многочлены х и х2 над полем Z2 оба принимают значение 0 при х = 0 и 1 при х = 1. В то же время хотелось бы рассматривать их как разные многочлены. Выход состоит в формальном определении, при котором многочлен
§ 1. ПОСТРОЕНИЕ АЛГЕБРЫ МНОГОЧЛЕНОВ 91 фактически отождествляется с последовательностью его коэффи- циентов. Рассмотрим векторное пространство К°° финитных последо- вательностей элементов поля К (см. пример 2.2.9). Условимся нумеровать члены последовательностей, начиная с нуля, и пусть ек (к — 0, 1,2,...) обозначает последовательность, fc-й член которой равен 1, а все остальные члены равны 0. Последовательности Cq, е15 62,... образуют базис пространства К°°. Превратим пространство К°° в алгебру, определив умножение базисных векторов по правилу ekel ~ ek + г Из коммутативности и ассоциативности сложения целых чисел следует, что умножение базисных векторов, а значит, и любых элементов полученной алгебры, коммутативно и ассоциативно. Элемент е0 является ее единицей. Эта алгебра называется алгеб- рой многочленов над К и обозначается К[х] (вместо х может использоваться любая другая буква). Для того чтобы перейти к привычному представлению многоч- ленов, условимся, во-первых, отождествлять элементы вида ае^ (аеК) алгебры К[х] с соответствующими элементами поля К и, во-вторых, элемент в] обозначим через х (здесь проявляется роль выбранной буквы х). Тогда в соответствии с определением операций в мы получаем, что ек — хк и («Zq, ..., ап, 0,...) = Оц^о + а1е1 + + • • + апеп ~ = Og + а^х + OjX2 + ... + апхп. Числа Од, 0^02,... называются коэффициентами многочлена. Последний из ненулевых коэффициентов называется старшим коэффициентом, а его номер — степенью многочлена. Степень многочлена f обозначается через deg/. Степень нулевого мно- гочлена не определена, однако иногда удобно считать, что она равна — оо. Легко видеть, что deg(/4-<j) max{deg/, deg <7}, (1) deg/<7 = deg/ +deg <7. (2) Докажем, например, последнее равенство. Пусть f = a0 + aix + .. . + апхп (ап/0), g=b0 + blx + ... + bmxm (Ьт/0). Тогда при перемножении / и д получается только один член степени п + т, а именно, апЬтхп + т, а членов большей степени не
92 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ получается вообще. Так как в поле нет делителей нуля, то апЬт / О и, стало быть, deg fg = n + m = deg f + deg g. Предыдущее рассуждение показывает, что в алгебре /С[ж] нет делителей нуля. Из него же следует, что обратимыми элементами в этой алгебре являются только многочлены нулевой степени, т. е. ненулевые элементы поля К. ЗАМЕЧАНИЕ 1. Многочлен можно обозначать /(ж) или просто /, если из контекста ясно, какой буквой обозначается «перемен- ная». ЗАМЕЧАНИЕ 2. Часто бывает удобнее располагать многочлен не по возрастающим, а по убывающим степеням х: f = OqX" + alxn~l + ... + ап_1х + ап. ЗАМЕЧАНИЕ 3. В качестве К можно взять любое коммутатив- ное ассоциативное кольцо с единицей (ср. замечание 1.9.1). В этом случае все предыдущее остается без изменений, за исключением последней части, связанной с формулой (2), где нужно дополни- тельно потребовать, чтобы в кольце К не было делителей нуля. Замечание 4. Произведение финитных последовательностей (oq, а,, а?,...) и (60, fcj, Ь2,...) в кольце К[х] есть последовательность (cq, cj, ...), члены которой находятся по формулам к ck= 52 ai - г 1=0 Эти формулы имеют смысл и для любых (не обязательно финитных) последователь- ностей. Таким образом получается коммутативная ассоциативная алгебра с едини- цей, называемая алгеброй формальных степенных рядов над К и обозначаемая JC[[xc]]. Ее элементы обычно записывают как формальные бесконечные суммы вида 2 а® + х 4- а^х 4-... Алгебра /ГЦх]], как и не имеет делителей нуля, но доказывается это по- другому (попробуйте это сделать!). Каждый многочлен f = Oq + atx + а^х2 + ... + апхп (3) определяет функцию на К со значениями в К, значение которой в точке с е К по определению равно /(с) = Oq + ajC + а^с2 + ... + апсп. Так как сумма и произведение многочленов, а также произ- ведение многочлена на число приводятся к каноническому ви- ду (3) преобразованиями, использующими только свойства опера- ций в -К'[х], справедливые и в поле К, то мы придем к одному
§ 1. ПОСТРОЕНИЕ АЛГЕБРЫ МНОГОЧЛЕНОВ 93 и тому же результату, сделав подстановку х = с до или после этих преобразований. Это означает, что (/ + ff)(c) = /(c) + sr(c), (fg)(c) = f(c)g(c), (Xf)(c) = Xf(c), т. e. операции над многочленами приводят к таким же операциям над соответствующими функциями. Как мы показали на примере в начале параграфа, разные мно- гочлены могут определять одну и ту же функцию. Оказывается, однако, что такое возможно, только если поле К конечно. Теорема 1. Если поле К бесконечно, то разные многочлены над К определяют разные функции. Доказательство. Пусть многочлены f, де определяют одну и ту же функцию. Тогда их разность h = f — д определяет нулевую функцию, т. е. h(c) — 0 для всех с е К. Предположим, что h / 0, и пусть h = OiX + О2Х2 + ... + ап_}хп~1 (anl/0) Возьмем различные х^,..., хп е К (здесь используется бесконеч- ность поля К). Совокупность верных равенств (Zq + а}Х' + а^х2 + ... + ап_ гх?~1 =0, Оо + Я]+ ... + ап_,х£~1 = О, . <^ + aixn + ^n + --- + an-i< 1==°, рассмотрим как (квадратную) систему однородных линейных урав- нений относительно Oq, а^, ..., ап_]. Определитель матрицы коэффициентов этой системы есть определитель Вандермонда V(X], ..., хп) (см. пример 2.4.5) и потому отличен от нуля. Следовательно, система имеет только нулевое решение, что про- тиворечит нашему предположению. □ ЗАМЕЧАНИЕ 5. Даже если поле К конечно, то множество всех многочленов над К бесконечно (но счетно). Однако множество всех функций на К со значениями в Д’ в этом случае конечно, и поэтому обязательно должны существовать разные многочлены, определяющие одну и ту же функцию. Тем не менее теорема 1 и ее доказательство остаются в силе для многочленов, степень которых меньше числа элементов поля К. ЗАДАЧА 1. Так называемая задача интерполяции состоит в нахождении многочлена степени < п, принимающего в за- данных (различных) точках х}, ..., хп е К заданные значения
94 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ у{, у2,..упеК. (В частности, при п = 2 это называется линейной интерполяцией.) Доказать, что задача интерполяции имеет единст- венное решение при любых хп и у{, у2,. .уп. Деление одного многочлена на другой в обычном смысле слова в алгебре как правило, невозможно. Однако возможно так называемое деление с остатком, похожее на деление с остатком в кольце целых чисел. Теорема 2. Пусть f, де А"[а:], причем д^О. Тогда существу- ют такие многочлены q и г, что f = qg + г и либо г — 0, либо deg г < deg д. Многочлены q и г определены этими условиями однозначно. Нахождение таких многочленов q и г и называется делением с остатком многочлена f на д. При этом q называется неполным частным, ar — остатком от деления f на д. Многочлен f делится на д в алгебре тогда и только тогда, когда г =0. Доказательство. 1) Докажем возможность деления с остатком. Если deg / <degg, то можно взять q=0, r = f. Если deg / deg д, то q и г находятся обычной процедурой «деления уголком». А именно, пусть / = а^хп + а}хп~1 + .. . + ап_1х + ап, д = Ьохт + Ь}хт-' + ... + bm_'X + Ьт, где Oq, Ьо / 0. Рассмотрим многочлен fi = f —-^хп~тд. Его степень меньше, чем степень многочлена /. Если deg Д < deg д, то мы можем взять 9 = ^жП“т, г = Д. В противном случае поступаем с многочленом Д так же, как с /. В конце концов мы получим такой многочлен q — с^хп~т + c1xn~m~i + -.. + сп_т, что deg(/ — qg) < deg д. Это и будет неполное частное от деления / на д, а многочлен г = / — qg будет остатком. 2) Докажем, что многочлены q и г определены условиями теоремы однозначно. Пусть f = qig + rl =q2g + r2, где deg г, < deg д и deg r2 < deg д. Тогда Л - Т2 = (<7г - <h)9
§ 1. ПОСТРОЕНИЕ АЛГЕБРЫ МНОГОЧЛЕНОВ 95 и, если qx / q2, то deg(r! - r2) = deg(<?2 - qx) + deg g deg g, что, очевидно, неверно. Следовательно, qx — q2 и rx = r2. □ Особое значение имеет деление с остатком на линейный двучлен х — с. В этом случае остаток имеет степень <1, т. е. является элементом поля К. Таким образом, результат деления с остатком многочлена f на х — с имеет вид f(x) = (х - c)q(x) + г (те К). Отсюда следует, что /(с) = г, т. е. остаток равен значению многочлена f в точке с. Это утверж- дение называется теоремой Безу. Деление с остатком на х — с осуществляется по замечательно простой схеме, называемой схемой Горнера. А именно, пусть OqX" + ах хп -1 + ... + ап _ J х + ап = = (х- с)(Ьохп~} + Ьххп~2 + ... + Ьп_2х + Ьп_х) + г. Приравнивая коэффициенты при соответствующих степенях х, получаем цепочку равенств °о = ^о> — ^2 cbj, -1 = j - cbn_2, an = r-cbn_l, откуда находим следующие рекуррентные формулы для ЬО,ЬХ,... Ь„_, и г: ^0 = ао> bx = ах Ч- c&q, ^2 = ^2 cbj, V 1 — ап- 1 + C^n-2> r = an + cbn_v
96 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Исходные данные и результаты вычислений удобно расположить в виде таблицы: °о а1 • • • ап -1 ап С fy) • V I Г Каждое число во второй строке этой таблицы, начиная с Ь(, находится как сумма числа, стоящего над ним, и числа, стоящего слева, умноженного на с. В частности, это дает очень эффективный способ вычисления значений многочлена. Пример 1. Найдем значение многочлена f = 2х6 - 11 х4 - 19х3 - 7х2 + 8s + 5 в точке х = 3. По схеме Горнера получаем: 2 0 -11 -19 —7 8 5 3 2 6 7 2 -1 5 20 Таким образом, /(3) = 20. § 2. Общие свойства корней многочленов Элемент с поля К называется корнем многочлена f е К[х] (или соответствующего алгебраического уравнения /(х)=0), если /(с)=0. Из теоремы Безу (см. предыдущий параграф) следует Теорема 1. Элемент с поля К является корнем многочлена f е К[х] тогда и только тогда, когда f делится на х — с. Этим можно воспользоваться для доказательства следующей теоремы. Теорема 2. Число корней ненулевого многочлена не превос- ходит его степени. Доказательство. Пусть с, — корень многочлена /. Тогда f^fx-cM (Де/ОД). Пусть — корень многочлена Д. Тогда ДМх-с^Д (ДеВД) и, значит, / = (х-с1)(х-с2)/2. Продолжая так дальше, мы в конце концов представим многочлен f в виде f = (х - Cj)(x - Gj) ... (х - cm)g, (4)
§ 2. ОБЩИЕ СВОЙСТВА КОРНЕЙ МНОГОЧЛЕНОВ 97 где многочлен д 6 К[х] не имеет корней. Числа си с^, ..., ст — это все корни многочлена /. В самом деле, для любого с е К имеем /(с) = (с - С1)(с - Cj)... (с - ст)д(с) и, так как д(с) /0, то /(с) = 0, только если с — сг для некоторого г. Таким образом, число корней многочлена f не превосходит т (оно может быть меньше т, поскольку не исключено, что среди чисел С], С2,..ст есть одинаковые); но т = deg/ - deg# < deg/. □ ЗАМЕЧАНИЕ 1. Эта теорема фактически уже была нами доказа- на другим способом в процессе доказательства теоремы 1.1. С дру- гой стороны, из нее можно получить доказательство теоремы 1.1, не использующее теории линейных уравнений. А именно, если различные многочлены fug над бесконечным полем К определяют одну и ту же функцию, то все элементы поля К являются корнями ненулевого многочлена h = / — д, что противоречит только что доказанной теореме. Доказательство предыдущей теоремы наводит на мысль, что некоторые корни правильнее было бы считать несколько раз. Этому можно придать точный смысл. Корень с многочлена / называется простым, если / не делится на (х — с)2, и кратным в противном случае. Кратностью корня с называется наибольшее из таких к, что / делится на (х — с)к. Таким образом, простой корень — это корень кратности 1. Иногда удобно считать, что число, не являющееся корнем, — это корень кратности 0. Очевидно, что с является корнем кратности к многочлена / тогда и только тогда, когда f = (x-c)kg, (5) где #(с)/0. Теперь мы докажем уточнение теоремы 2. Теорема 3. Число корней ненулевого многочлена с учетом их кратностей (т. е. если каждый корень считается столько раз, какова его кратность) не превосходит степени многочлена, причем равенство имеет место тогда и только тогда, когда этот многочлен разлагается на линейные множители.
98 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Доказательство. Перепишем равенство (4), объединив одинаковые множители: / = (х-с1)*1 * *(х-с2)^...(ж-с,)4'д (6) (си с?,..с, различны). Ясно, что CpCj, ...,с, — это все корни многочлена f. Далее, выделяя в (6) множитель (ж —с4)*‘, мы можем написать / = (х-сД4‘/г;, где /гДсД/О. Следовательно, с, —корень кратности kt. Таким образом, число корней многочлена f с учетом их кратно- стей равно + fe, + ... + kt = deg f - deg g, откуда и вытекают все утверждения теоремы. □ ЗАМЕЧАНИЕ 2. Условно считается, что многочлен нулевой степени разлагается в произведение пустого множества линейных множителей. Если многочлен f = а^х" + а, хп ~1 + ... + ап _ , х + ап разлагается на линейные множители, то это разложение может быть записано в виде f = a^fx — с1)(х — с?)... (х — сп), где си ..., сп — корни многочлена /, причем каждый из них повторен столько раз, какова его кратность. Приравнивая коэффициенты при соответствующих степенях х в этих двух представлениях многочлена /, мы получаем следующие формулы Виета: с1 + с2 + ... + сп = -^, с1с2 + с1с3 + ... + с„_1сп = ^, Е C.Ci!...C,^(-l)4^, h < h < • • < •* С1С2...СП = (-1Г^. В левой части fc-й формулы Виета стоит сумма всевозмож- ных произведений к корней многочлена /. С точностью до множителя (—1)* это коэффициент при хп~к в произведении (х-с1)(2:-с2)...(а:-сп). ПРИМЕР 1. Комплексные корни 5-й степени из 1 ек = cos + i sin (fc — 0, 1, 2, 3,4)
§ 2. ОБЩИЕ СВОЙСТВА КОРНЕЙ МНОГОЧЛЕНОВ 99 (рис. 1) суть корни многочлена х5 — 1. По первой из формул Виета Рис. 1 их сумма равна нулю. Приравнивая нулю сумму их вещественных ча- стей, получаем 2 cos + 2 cos =- + 1=0. о э Пусть cos = х; тогда cos = = 2х2 — 1, так что 4z2 + 2z- 1 =0, откуда cos = а у/5- 1 4 ’ 7Г \/5 + 5 - 4 ЗАДАЧА 1. Пусть п— простое число. Пользуясь задачей 1.6.2 и последней из формул Виета, доказать теорему Вильсона: (п - 1)! = —1 (mod п). Многочлен f называется нормированным (или приведенным), если Oq = 1. Формулы Виета позволяют выразить коэффициенты нормированного многочлена через его корни (при условии, что число корней с учетом кратностей равно степени многочлена). Пример 2. Найдем нормированный многочлен 4-й степени f = х4 + а{ х3 + OjX2 + ОзХ + а4, имеющий двукратный корень 1 и простые корни 2, 3. По формулам Виета —cij = 1 + 14-2 + 3 = 7, 02 = 1-1 + 1- 2 + 1- 3+1- 2+1- 3 + 2-3 = 17, -а3 = 1 • 1 • 2 + 1 • 1 - 3 + 1 • 2 • 3 + 1 • 2 • 3 = 17, а4 = 1 • 1 • 2 3 = 6. Таким образом, / = а:4 — 7х3 + 17х2 — 17х + 6. Кратность корня многочлена может быть истолкована и другим способом, по крайней мере в случае char К = 0. Для этого нужно определить дифференцирование многочленов.
100 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Из правил дифференцирования функций вещественной перемен- ной следует, что производная многочлена есть также многочлен. Обозначим через D отображение алгебры R[x] в себя, ставящее в соответствие каждому многочлену его производную. Отображе- ние D обладает следующими свойствами: 1) оно линейно; 2) D(fg) = (Df)g + f(Dg); 3) Dx = 1. Эти наблюдения позволяют определить дифференцирование мно- гочленов над любым полем К, когда определение производной, даваемое в анализе, не имеет смысла. Предложение 1. Существует единственное отображение D: ^[х] 7С[ж], обладающее свойствами 1)-3). Доказательство. Пусть D — такое отображение. Тогда D1 = D(1 1) = (D1)-1 + 1 (D1) = D1 + DI, откуда D1 = 0. Докажем по индукции, что Dxn — пхп~ *. При п = 1 это верно по предположению, а переход от п — 1 к п делается выкладкой Dxn=D(xn~lx)=(Dxn~l)x + xn~l(Dx)=(n—1)жп~2 х+хп~'=пхп~1. Тем самым отображение D однозначно определено на базисных векторах 1, х, х2,..., а значит, и на всем пространстве К[ж]. Обратно, построим линейное отображение D: К[х] —> Kfx], задав его на базисных векторах формулами Dl=0, Dxn = nxn~x (n = l,2,...), и проверим, что оно обладает свойством 2). В силу линейности достаточно проверить это свойство для базисных векторов. Имеем D(xmxn) = Dxm + n — (m + n)xm+n~l, (Dxm)xn + xm(Dxn) = тхт~1 хп + пхтхп~1 = (т + п)хт+п~1. □ Многочлен Df называется производной многочлена f и обозна- чается, как обычно, через Сделав в многочлене f G К[х] замену х — с + у, где с е К, мы можем представить его в виде многочлена (той же степени) от у — — х — с или, как говорят, разложить по степеням х — с: f = b0 + bt(x - с) + Ь2(х - с)2 + ... + Ьп(х - с)п. (7) Очевидно, что если с — корень многочлена /, то его кратность равна номеру первого отличного от нуля коэффициента этого разложения.
§ 2. ОБЩИЕ СВОЙСТВА КОРНЕЙ МНОГОЧЛЕНОВ 101 Предложение 2. Если char К — 0, то коэффициенты разло- жения многочлена f е А7[ж] по степеням х — с могут быть найдены по формулам (Здесь /<А), как обычно, обозначает fc-ю производную многочле- на /.) Доказательство. Продифференцируем равенство (7) к раз и подставим х = с. □ Таким образом, f=/(с)+-с) + £-2гЧх -с)2 + • • • + ~ СГ- Эта формула называется формулой Тейлора для многочленов. Из формулы Тейлора и сделанного выше замечания следует Теорема 4. При условии, что char К =0, кратность корня с многочлена f е К[х] равна наименьшему порядку производной многочлена f, не обращающейся в нуль в точке с. Следствие. При том же условии всякий к-кратный корень многочлена f является (к — 1)-кратным корнем его производ- ной. Замечание 3. В случае char К >0 кратность корня с может быть меньше указанного в теореме 4 числа. Более того, такого числа может вообще не существовать. Так, например, если п — простое число, то первая, а значит, и все последующие производные многочлена xnEZn[x], имеющего n-кратный корень 0, являются нулевыми многочленами. В случае К — R теорема 4 позволяет истолковать кратность геометрически. А именно, если кратность корня с многочлена f Е К[х] равна к, то вблизи точки с многочлен f ведет себя как Ь(х — с)к (Ь 0). Это означает, что его график в точке с при к = 1 просто пересекает ось х, а при к > 1 имеет с ней касание (к — 1)-го порядка. Кроме того, знак многочлена f(x) при прохождении точки с при нечетном к меняется, а при четном к не меняется (см. рис. 2). Коэффициенты разложения (7), а значит, и значения производ- ных многочлена f в точке с (в случае char К = 0) могут быть найдены последовательными делениями с остатком многочлена / на х — с. А именно, при первом делении получается остаток Ьо и неполное частное /1 = 61 + ьз(х - с) + ... + Ьп(х - с)п“1; при делении Д на х — с получается остаток 1ц и т. д.
102 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Рис. 2 Пример 3. Разложим указанным способом по степеням х — 2 многочлен f = х5 — 5х4 + 7х3 — 2х2 + 4х — 8 е R[x]. Последовательные деления с остатком на х — 2 будем проводить по схеме Горнера, используя строку результатов каждого деления как строку исходных данных для следующего деления: 1 -5 7 -2 4 -8 2 1 1 1 1 1 1 -3104 -1 -1 —2 О 1 1 О 3 7 5 О Таким образом, f = 7{х - 2)3 + 5(х - 2)4 + (х - 2)5. В частности, мы видим, что 2 — трехкратный корень многочлена /. Кроме того, /"'(2) = 3! • 7 = 42, /IV(2) = 4!-5=120, /v(2) = 5! • 1 = 120.
§ 3. ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ КОМПЛЕКСНЫХ ЧИСЕЛ 103 § 3. Основная теорема алгебры комплексных чисел Оценка сверху числа корней многочлена, полученная в преды- дущем параграфе, ничего не говорит о наличии хотя бы одного корня. И действительно, существуют многочлены положительной степени, не имеющие корней, например, многочлен ж2+1 надполем R вещественных чисел. Именно это обстоятельство послужило поводом для построения поля С комплексных чисел. Если бы и над полем С существовали многочлены положительной степени, не имеющие корней, это привело бы к необходимости его дальнейшего расширения. Однако, к счастью, это не так. Это составляет содер- жание теоремы, которую называют основной теоремой алгебры комплексных чисел. Теорема 1. Всякий многочлен положительной степени над полем комплексных чисел имеет корень. Поле, над которым всякий многочлен положительной степени имеет хотя бы один корень, называется алгебраически замкну- тым. Таким образом, теорема 1 означает, что поле С комплексных чисел алгебраически замкнуто. Существует несколько доказательств этой теоремы. Любое из них включает элементы анализа, так как оно должно как-то исполь- зовать определение поля вещественных чисел, которое не является чисто алгебраическим. До- казательство, приводимое ниже, является почти полностью аналитическим. Нам понадобится понятие предела последовательности комплексных чисел. Перед тем как дать соответствую- щее определение, напомним, что модуль |z| комплексного числа z есть длина вектора, изображающего это число. Отсюда следует, что [zj — z%\ есть рас- стояние между точками, изображающими числа Z] и 2,. Известные из геометрии неравенства показывают (см. рис. 3 и 4), что Рис. 3 Рис. 4 h + hl + hl, IkJ - hl| h - ^1- (Равенства могут иметь место, когда соответствующий треугольник вырождается в отрезок.) Определение 1. Последовательность комплексных чисел zk (k eN) называется сходящейся к комплексному числу z (обозначе- ние: zk —> z), если ]zk — z\ —> 0.
104 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Лемма1. Пусть zk = xk + yki, z = x + yi (хк, ук, х, у eR). Тогда zk^z хк^х и ук^ у. Доказательство. Имеем (см. рис. 5) \zk - z\ = “ х12+ 1% - г/12’ так что Рис 5 Обратная импликация вытекает из неравенств хк х и ук у ==> zk^ г. 1*4 “ *1 1*4 ~ 4 \ук - У\ \zk - Z\. □ Лемма 2. zk —> z => |гА| —> |z|. Доказательство следует из того, что |l^|-|z|| □ Лемма 3. zk —> z и wk —> w => zk + wk —> z + w и zkwk^> zw. Доказательство такое же, как для последовательностей вещественных чисел: l(*4+wk)-(z + «>)| = |(zA-z)+(wA-w)| |zA-.z|+|wA-wH0, lZkWk~ZWl = KZk-Z)Wk+Z(Wl:-W)l l*4-*lkJ+|z||wfc-w| ->0. □ Следствие. Пусть zk^> z и f eC[z]—любой многочлен. Тогда f(zk)^f(z). (Здесь мы допускаем вольность в обозначениях, обычную в анализе, когда значение переменной обозначается так же, как сама переменная.) Лемма 4 (о возрастании модуля многочлена). Если —> оо и f G C[z] —многочлен положительной степени, то |/(z4)| —*• оо. Доказательство. Пусть f = avzn + alzn-' + ... + an_lz + an (a^O); тогда Выражение, стоящее в скобках, стремится к |ао|. Следовательно, все произведение и, тем более, |/(z*)| стремятся к бесконечно- сти. □
§ 3. ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ КОМПЛЕКСНЫХ ЧИСЕЛ 105 Следующая лемма является ключевой для доказательства основ- ной теоремы. Лемма 5 (лемма Даламбера). Пусть f е C[z] — многочлен положительной степени и f(z0) / 0. Тогда сколь угодно близко к z0 можно найти такое z, что |/(z)| < l/(2o)l- Доказательство. Разложим f по степеням z — z0 и раз- делим на /(г0). Учитывая, что несколько первых коэффициентов разложения, следующих за свободным членом, могут оказаться равными нулю, запишем результат в виде /М = 1 + с₽(2 “ + с₽+ 1(г - zo)₽ +1 + • • + c„(z - z„)n (ср ± 0). Нам нужно доказать существование такого z, что Идея доказательства состоит в том, что, точно близким к г0, выполнение этого неравенства будет зависеть только от суммы первых двух членов предыдущего разложения. Будем искать z в виде Z = z0 + tz{ (см. рис. 6), где t е (0, 1), a z} — ком- плексное число, удовлетворяющее усло- вию ср zf = — 1. Имеем тогда где <р — некоторый многочлен степени п — р — 1 (с комплексными коэффициентами). Если С — максимум модулей коэффициентов многочлена у>, то MOI А = (п— р)С и, следовательно, |Ж 1 - V + At₽+1 = 1 - t₽(l - At)< 1 I JyZQ) I при t < -J. □
106 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Доказательство теоремы 1. Пусть f е C[z] — мно- гочлен положительной степени. Положим М = inf |/(z)|. z Из определения нижней грани следует, что существует такая последовательность комплексных чисел zk, что ШНМ. (8) Если последовательность |zj неограниченна, то из нее можно выбрать подпоследовательность, сходящуюся к бесконечности; но тогда в силу леммы 4 мы придем в противоречие с (8). Таким образом, существует такое С > 0, что IzJsjC Vfc Представим zk в алгебраической форме: zk = хк + Укг- Тогда По теореме Больцано — Вейерштрасса из последовательности хк можно выбрать сходящуюся подпоследовательность. Перейдя к этой подпоследовательности и изменив обозначения, можно счи- тать, что — Аналогичным образом, перейдя еще раз к подпоследовательности, можно считать, что Ук Уо- Но тогда по лемме 1 zk~^ zo = xo + yoi и, следовательно, 1Ж)Н1Ж)1 = м Если М > 0, то лемма Даламбера приводит нас в противоречие с определением М. Следовательно, М = 0, т. е. f(zo) — O. □ Следствие 1. В алгебре С[х] всякий ненулевой многочлен разлагается на линейные множители. В самом деле, в силу доказанной теоремы многочлен g в разложении (4) должен иметь нулевую степень, т. е. быть просто числом. В силу теоремы 3 получаем отсюда Следствие 2. Всякий многочлен степени п над С имеет п корней (с учетом кратностей).
§ 4. КОРНИ ВЕЩЕСТВЕННЫХ МНОГОЧЛЕНОВ 107 § 4. Корни многочленов с вещественными коэффициентами Многочлен степени п с вещественными коэффициентами может иметь < п (в частности, вообще не иметь) вещественных корней, но, как и всякий многочлен с комплексными коэффициентами, он всегда имеет ровно п комплексных корней (с учетом кратностей). Мнимые корни многочлена с вещественными коэффициентами обладают специальным свойством. Теорема 1. Еслс с —мнимый корень многочлена f е R[x], то с также является корнем этого многочлена, причем той же кратности, что и с. Доказательство. Пусть f = а^х” + alxn~' +... + an_tx + an (oq, а,,..., ап е R). Если /(с) = 0, то, поскольку комплексное сопряжение является автоморфизмом поля С (см. § 1.5), f (с) = UqCп 4- at с" “1 + ... + ап _ , с + а„ = = Оде" + а1сп-1 + ... + ап_ jс + ап = f(c) = б = 0, т. е. с — также корень многочлена f. Аналогично доказывается, что /(*)(с) = 0 <=> /<А)(с) = 0. Следовательно, кратности корней с и с одинаковы. □ Следствие. В алгебре К[ж] всякий ненулевой многочлен раз- лагается на линейные множители и квадратичные множители с отрицательным дискриминантом. Доказательство. Заметим, что если с — мнимое число, то квадратный трехчлен (ж — с)(х — с) = х2 — (с + с)х + сс имеет вещественные коэффициенты; его дискриминант, очевидно, отрицателен. Пусть теперь С1 > • • •; сз > cs + 1 > • • ч с« + t; Сs + 1 1 • • •> + t — это все (различные) комплексные корни многочлена / е R[x], причем сп..., с, eR, C, + 1,...,C, + (^R.
108 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Если кратность корня равна kit то / = а0(х-с,)*:' . • .(х-с,)*'[(я;-с, + 1)(х-с, + 1)]*'+1 ... •• • К* - c, + t)(x - c, + t)]fc'-, (где Oq — старший коэффициент многочлена /). Перемножая линейные множители в квадратных скобках, получаем искомое разложение. □ Пример 1. х5 — 1 = (х — 1)(х — (cos + i sin ч^-))(я — (cos — i sin п^))х х (х — (cos + г sin ^-))(х — (cos — г sin ^Д)) = = (х — 1)(ж2 — 2х cos + 1)(х2 — 2х cos + 1) = = (х - 1)(г2 - 1 х + 1)(ж2 + —£ 1 х + 1) (см. пример 2.1). Пример 2. Для многочлена f из примера 2.3 разложение, о котором идет речь, имеет вид f = (х — 2)3(х2 + х + 1). Из теоремы 1 также следует, что любой многочлен f е R[x] нечетной степени имеет хотя бы один вещественный корень. Впрочем, это легко доказать и по-другому. А именно, если старший коэффициент многочлена f положителен, то lim /(х) = +оо, lim f(x) = — оо х —» 4-оо х —» —оо и, значит, многочлен f принимает как положительные, так и отрицательные значения. По теореме о промежуточном значении непрерывной функции отсюда следует, что в некоторой точке он обращается в нуль. Понятно, что представляет интерес определение точного числа вещественных корней. Вычисляя значение многочлена в отдельных точках, мы можем обнаружить, что в каких-то точках а и Ь он при- нимает значения разных знаков. Отсюда следует, что в интервале (а, Ъ) находится по меньшей мере один корень, а точнее — нечетное число корней (с учетом их кратностей). Таким образом мы можем оценить снизу число вещественных корней. Пример 3. Для многочлена f — х4 + х2 — 4х + 1 находим /(0)=1>0, /(!) = -!< О, /(2)=13>0.
§ 4. КОРНИ ВЕЩЕСТВЕННЫХ МНОГОЧЛЕНОВ 109 Следовательно, f имеет корни в каждом из интервалов (0, 1) и (1,2). Нетрудно показать, что f(x) > 0 при х 0, а также при х 2. Следовательно, все вещественные корни многочлена f лежат в интервале (0, 2). Однако точное их число остается неизвестным, так как в одном из интервалов (0, 1) и (1,2) может быть три корня. Существуют методы, которые в принципе позволяют определить как общее число вещественных корней любого многочлена с вещественными коэффициентами, так и число его корней в любом промежутке числовой прямой. Однако их практическое применение связано с довольно большими вычислениями. Мы приведем здесь одну теорему, которая хотя и не всегда дает точный ответ, но зато не требует никаких вычислений. Она говорит не просто о числе всех вещественных корней, но о числе положительных (или отрицательных) корней и является обобщением следующего тривиального утверждения: если все коэффициенты многочлена неотрицательны, то он не имеет положительных корней. Для формулировки этой теоремы нам понадобится одно вспомо- гательное понятие. Пусть имеется конечная последовательность вещественных чи- сел cZq, а1( tig, •.., ап. Говорят, что на k-м месте в этой последовательности имеется перемена знака, если ак ^0 и знак числа ак противоположен знаку последнего из предшествующих ему ненулевых членов последова- тельности. (Если ак — первый из ненулевых членов последователь- ности, то на fc-м месте перемены знака нет.) Теорема 2 (теорема Декарта). Число положительных корней (с учетом их кратностей) многочлена f е R[a?] не превосходит числа перемен знака в последовательности его коэффициентов и сравнимо с ним по модулю 2; если же все (комплексные) корни многочлена f вещественны, то эти числа равны. Обозначим через N(f) число положительных корней многочлена f и через L(f) число перемен знака в последовательности его коэффициентов. Очевидно, что эти числа не изменяются при умножении f на —1; поэтому всегда можно считать, что старший коэффициент многочлена f положителен. Кроме того, если 0 является fc-кратным корнем многочлена /, то при делении f на xk эти числа также не изменяются; поэтому можно считать, что свободный член многочлена f отличен от нуля. Лемма 1. 7V(/) = L (/) (mod 2).
по Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Доказательство. Пусть f = аохп + агхп-1 +.. , + ап_1а; + ап (а^ > О, ап^0). Тогда /(0) = ап и f(x) > 0 при достаточно больших х. Когда мы двигаемся вправо по числовой прямой, то при прохождении каждого простого корня /(а;) меняет знак, а при прохождении fc-кратного корня знак f(x) умножается на (—l)fc, т.е. как бы меняется к раз. Поэтому N(f) четно, если ап > 0, и нечетно, если ап <0. То же самое можно сказать и об L(f ). □ Лемма 2. N(f) N(f') + 1. Доказательство. По теореме Ролля между любыми двумя корнями многочлена f лежит корень его производной. Кроме того, каждый к -кратный корень многочлена f является (к — 1)-кратным корнем его производной (следствие теоремы 2.4). Отсюда получаем, что W')> W)“ 1- □ Лемма 3. L (/') L (/). Доказательство очевидно. □ Число отрицательных корней многочлена f равно числу положи- тельных корней многочлена 7(х) = (-1)7(-4 Лемма 4. L (/) + L(J) п = deg/. Доказательство. Коэффициенты многочлена / получаются из коэффициентов многочлена / попеременным умножением на ±1. Предположим вначале, что все коэффициенты an многоч- лена / отличны от нуля. Тогда если на fc-м месте в последователь- ности о,,, ап имеется перемена знака, то на том же месте в последовательности коэффициентов многочлена / перемены знака нет, и наоборот. Поэтому в этом случае L(f) + L(f) — п. В общем случае, когда среди коэффициентов (%, а^,..ап могут быть нули, при их замене произвольными числами, отличными от нуля, числа L(f) и L(f) могут только увеличиться. Так как после этого их сумма по доказанному станет равной п, то L(f) + L(f) п. □ Доказательство теоремы 2. Докажем неравенство AT(/)^Z(/) индукцией по deg/. Если deg/=O, то N(f) — L (/)=0. Пусть deg / = п > 0. Тогда deg/' = п — 1. Пользуясь леммами 2 и 3 и предположением индукции, получаем W) N(f') + U L (/') + 1 Z (/) + 1. Однако равенство N(f) = L (/) + 1 невозможно ввиду леммы 1. Следовательно, N(f) L(f).
§ 4. КОРНИ ВЕЩЕСТВЕННЫХ МНОГОЧЛЕНОВ 111 Пусть теперь известно, что все корни многочлена / вещественны. Мы можем считать, что 0 не является корнем. Имеем тогда в силу уже доказанного неравенства и леммы 4 п = N(f) + N(f) $L(f) + L(/) п, откуда N(f) = L(f), N(f) = L(J). □ ПРИМЕР 4. Для многочлена f из примера 3 имеем L (f) = 2, так что N(f) 2. Но мы уже установили, что N(f) 2. Следовательно, W) = 2. ПРИМЕР 5. Многочлен/ = х2~х +1 не имеет положительных (и вообще вещественных) корней, но Z(/) = 2, так что в этом случае W) <£(/). Применяя теорему Декарта к многочлену = f(c + х) = /(с) + ^-х + + ... + ^^хп, мы получаем информацию о числе корней многочлена / в про- межутке (с, +оо). В частности, если все коэффициенты многоч- лена д неотрицательны, то он не имеет положительных корней (тривиальный случай теоремы Декарта), а это означает, что все вещественные корни многочлена f не превосходят с. ПРИМЕР 6. Найдем границы вещественных корней многочлена f = х5 — 5х3 — 10х2 + 2. Пользуясь схемой Горнера, вычислим /(3): 1 0 -5 -10 0 2 3 13 4 2 б 20 Мы видим, что /(3) = 20>0. Более того, все коэффициенты непол- ного частного оказались положительными. Поэтому все производ- ные многочлена f при х = 3 также положительны (см. пример 2.3) и, значит, все его вещественные корни меньше 3. Рассмотрим теперь многочлен /(х) = — /(—х) — х5 — 5х3 + 10х2 — 2. Вычислим значения многочлена f и его производных при х = 1: 1 0 -5 10 0-2 1 1 1 -4 6 6 4 12-2 4 10 13 15
112 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Мы видим, что 7(1) = 4>о, /(1)=10>0, Г(1) = 2-5>0. Значения следующих производных также положительны, поскольку последняя строка таблицы состоит только из положительных чисел. Следовательно, все вещественные корни многочлена f меньше 1, а это означает, что все вещественные корни многочлена f больше — 1. Таким образом, все вещественные корни многочлена f лежат в интервале (-1,3). ЗАДАЧА 1. Исследовав производную многочлена /, доказать, что многочлен f из предыдущего примера имеет только один отрицательный корень. Обратимся теперь к вопросу о приближенном вычислении кор- ней. Если известно, что многочлен f еВД имеет ровно один корень в каком-то интервале, то этот корень может быть в принципе найден с любой степенью точности с помощью вычисления значений многочлена в подходящим образом подобранных точках. Поясним это на следующем примере. Пример 7. Как мы показали (см. пример 4), многочлен f из примера 3 имеет ровно один корень в интервале (1,2). Найдем значение этого корня с точностью до 0,01. Мы видели, что /(1) <0. Вычисляя /(я) при х = 1,1; 1,2; 1,3, мы обнаруживаем, что /(1,2)<0, /(1,3)>0. Следовательно, корень лежит в интервале (1,2; 1,3). Вычисляя f(x) при х = 1,21; 1,22; 1,23; 1,24; 1,25, находим, что /(1,24) < 0, /(1,25) >0. Следовательно, искомый корень лежит в интервале (1,24; 1,25). Конечно, существуют гораздо более совершенные методы при- ближенного вычисления корней. Они применимы к алгебраическим уравнениям любой степени, а некоторые из них — и к трансцен- дентным уравнениям. Однако изложение этих методов выходит за рамки нашего курса: они относятся скорее к вычислительной математике, чем к алгебре. ЗАМЕЧАНИЕ 1. Если многочлен имеет кратный корень, но его коэффициенты даны нам лишь приближенно, хотя бы и с любой
§ 5. ТЕОРИЯ ДЕЛИМОСТИ В ЕВКЛИДОВЫХ КОЛЬЦАХ ИЗ Рис. 7, б) Рис. 7, а) степенью точности, то мы в принципе не можем доказать на- личие этого кратного корня, так как при сколь угодно малом изменении коэффициентов многочлена он может либо рассыпаться на простые корни, либо вообще перестать существовать. Так, в случае двукратного корня мы никогда не сможем сделать выбор между ситуациями, изображенными на рис. 7, а), а в случае трехкратного — между ситуациями, изображенными на рис. 7, б). § 5. Теория делимости в евклидовых кольцах Разложение многочленов над С на линейные множители и многочленов над R на линейные и квадратичные множители ана- логично разложению целых чисел на простые множители. Для многочленов над произвольным полем также имеется подобное разложение, но его множители могут иметь любую степень. Задачу отыскания такого разложения можно рассматривать как обобщение задачи отыскания корней многочлена (которой она равносильна в случае многочленов над С). Она не имеет общего решения, пригодного для любого поля. В этом параграфе мы докажем един- ственность указанного разложения. Одновременно мы докажем единственность разложения целого числа на простые множители — факт широко известный, но не доказываемый в средней школе. Для того чтобы охватить единым рассуждением оба случая, введем некоторые общие понятия. Определение 1. Коммутативное ассоциативное кольцо с еди- ницей и без делителей нуля называется целостным кольцом (или областью целостности). Так, кольцо Z целых чисел и кольцо 7<[гс] многочленов над любым полем К являются целостными кольцами. Более того, кольцо многочленов над любым целостным кольцом также является целостным кольцом (см. замечание 1.3). Пусть А — целостное кольцо. Говорят, что элемент a G А делится на элемент Ь е А (обозначение: а Ь) или, иначе, что
114 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Ь делит а (обозначение: Ь | а), если существует такой элемент q е А, что а= qb. Элементы а и Ъ называются ассоциированными (обозначение: а ~ Ь), если выполняется любое из следующих эквивалентных условий: 1) b | а и а | Ь; 2) a = cb, где с — обратимый элемент. В следующем определении аксиоматизируется то общее, что есть у кольца многочленов над полем и кольца целых чисел, — возможность деления с остатком. Определение 2. Целостное кольцо А, не являющееся полем, называется евклидовым, если существует функция N: А \ {0} Z+ (называемая нормой), удовлетворяющая следующим условиям: 1) У(аЬ) У(а), причем равенство имеет место только тогда, когда элемент Ь обратим; 2) для любых а, b е А, где b 0, существуют такие q, г е А, что a — qb + г и либо г — 0, либо 7V(r) < N(b). ЗАМЕЧАНИЕ 1. Условие 2) означает возможность «деления с остатком». Его единственности (т.е. однозначной определенности пары (q, г)) не требуется. ЗАМЕЧАНИЕ 2. Вторая часть условия 1) на самом деле может быть выведена из остальных условий. В самом деле, пусть элемент b необратим. Тогда а не делится на ab. Разделим а на ab с остатком: a — q(ab) 4- г. Так как г = a(l — qb), то N(a)^N(r)<N(ab). Основными для нас примерами евклидовых колец являются кольцо Z целых чисел и кольцо К[х] многочленов над полем К. В качестве нормы в первом случае можно взять модуль целого числа, а во втором — степень многочлена. Существуют и другие евклидовы кольца. Пример 1. Комплексные числа вида с = а+ Ы, где a, b е Z, на- зываются целыми гауссовыми числами. Они образуют подкольцо в С, обозначаемое через Z[i]. Кольцо Z[i] является евклидовым относительно нормы ЛГ(с) = |с|2 = о? -+- Ь2.
§ 5. ТЕОРИЯ ДЕЛИМОСТИ В ЕВКЛИДОВЫХ КОЛЬЦАХ 115 • i • • 1 1 В самом деле, очевидно, что N(cd) = N(c)N(d) и, поскольку 7V(1) = 1, обратимые элементы кольца Z[«] — это элементы с нормой 1, т.е. ±1 и ±г. Отсюда следует, что выполне- но условие 1) в определении евклидова кольца. Докажем возможность деления с остатком. Пусть с, d eZ[z], d ^0. Рассмо- трим целое гауссово число q, ближайшее к j. Легко видеть, что |j — g|^l/\/2 (см. рис. 8). Положим г = с — qd. Тогда с = qd + г и Рис. 8 N(r) = |с - qd\2 = |£ - g|2 |d|2 ±N(d) < N(d). Определение 3. Наибольшим общим делителем элементов а и b целостного кольца называется их общий делитель, делящийся на все их общие делители. Он обозначается через (а, Ь) или НОД {а, Ь}. Наибольший общий делитель, если он существует, определен однозначно с точностью до ассоциированности. Однако его может не существовать. Например, элементы х5 и х6 в кольце многочленов без линейного члена не имеют наибольшего общего делителя. Теорема 1. В евклидовом кольце для любых элементов а, b существует наибольший общий делитель d, и он может быть представлен в виде d = аи + bv, где u,v — какие-то элементы кольца. Доказательство. Если b = 0, то d=a=a-l + b-0. Если а делится на Ь, то d = b — а-0+ b 1. В противном случае разделим с остатком а на Ъ, затем Ъ на полученный остаток, затем первый остаток на второй остаток и т. д. Так как нормы остатков убывают, то в конце концов деление произойдет без остатка. Получим цепочку равенств: a=q1b + rl, Ь = ?2Г1 + Г2> Г1 = <hr2 + Г3, rn_2 = q„rn~l + rn, rn-i — 9n + irn- Докажем, что последний ненулевой остаток гп и есть наибольший общий делитель элементов а и b.
116 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Двигаясь по выписанной цепочке равенств снизу вверх, получаем последовательно Л.К-1, гп1г„-2, 'гп1’Ъ rn I b, rn I а. Таким образом, гп — общий делитель элементов а и Ь. Двигаясь по той же цепочке равенств сверху вниз, получаем последовательно — аи} + bv}, г2 = ащ + bv2, г3 = <ш3 + bv3, rn = аип + bvn, где иг, vt (г = 1,..п) — какие-то элементы кольца (например, и{ = = 1, Vj — — gj. Таким образом, гп можно представить в виде au + bv. Отсюда, в свою очередь, следует, что гп делится на любой общий делитель элементов а и Ь. □ Процедура нахождения наибольшего общего делителя, использо- ванная в этом доказательстве, называется алгоритмом Евклида. Элементы a, Ь &А называются взаимно простыми, если (a, b)— 1. В этом случае, согласно доказанной теореме, существуют такие и, v 6 А, что аи + bv = 1. Перейдем теперь к вопросу о разложении на простые множители. Определение 4. Необратимый ненулевой элемент р целостно- го кольца называется простым, если он не может быть представлен в виде р — ab, где а и b — необратимые элементы. Иначе говоря, элемент р простой, если всякий его делитель ассоциирован либо с 1, либо с р. Простые элементы кольца Z в этом смысле — это числа вида ±р, где р — простое число. Простые элементы кольца К[х], где К — поле, по тради- ции называются неприводимыми многочленами. Таким образом, неприводимый многочлен — это такой многочлен положительной степени, который не может быть разложен в произведение двух многочленов положительной степени. Очевидно, что всякий многочлен первой степени неприводим. Из основной теоремы алгебры комплексных чисел вытекает, что неприводимые многочлены над С — это только многочлены первой степени, а из следствия теоремы 4.1 —что неприводимые мно- гочлены над R — это многочлены первой степени и. многочлены второй степени с отрицательным дискриминантом. В следующем
§ 5. ТЕОРИЯ ДЕЛИМОСТИ В ЕВКЛИДОВЫХ КОЛЬЦАХ 117 параграфе мы обсудим вопрос о неприводимых многочленах над Q и, в частности, увидим, что они могут иметь любую степень. Пусть теперь А — любое евклидово кольцо. Лемма 1. Если простой элемент р кольца А делит произве- дение а. а? ... ап, то он делит хотя бы один из сомножителей а}, сц, ..ап. Доказательство. Докажем это утверждение индукцией по п. При п = 2 предположим, что р не делит аР Тогда (р, а{) = 1 и, значит, существуют такие и, v G А, что ри + a,v = 1. Умножая это равенство на о^, получаем рисц 4- откуда следует, что р делит а^. При п > 2 представим произведение а^.. ,ап в виде а^а^... ап). По доказанному р | а! или р | а%... ап. Во втором случае по предпо- ложению индукции р | аг, где i — один из индексов 2,..., п. □ Теорема 2. В евклидовом кольце всякий необратимый нену- левой элемент может быть разложен на простые множители, причем это разложение единственно с точностью до переста- новки множителей и умножения их на обратимые элементы. ЗАМЕЧАНИЕ 3. Говоря о разложении на простые множители, мы не исключаем разложения, состоящего только из одного мно- жителя. Доказательство. Назовем необратимый ненулевой эле- мент ае А хорошим, если он может быть разложен на простые мно- жители. Предположим, что существуют плохие элементы. Выберем из них элемент с наименьшей нормой. Пусть это будет элемент а. Он не может быть простым. Следовательно, а = Ьс, где b и с—необратимые элементы. Имеем N(b) < N(d) и N(c)<N(a) и, значит, b и с — хорошие элементы; но тогда, очевидно, и а — хороший элемент, что противоречит нашему предположению. Таким образом, всякий необратимый ненулевой элемент кольца А может быть разложен на простые множители. Докажем теперь индукцией по п, что если a = plp2...pn = qlq2...qm, (9) где Pi,qj — простые элементы, то т — п и, после подходящей перенумерации множителей, р{ ~ при г — 1,2,..., п. При п — 1 это утверждение очевидно. При п > 1 имеем Pi I 9192 • • • Чт и по лемме 1 существует такой номер i, что р{ | q{.
118 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Тогда Можно считать, что г = 1 и р, = д,. Сокращая равенство (9) на р{, получаем Рг • • • Рп = 92 • • • 9т- По предположению индукции отсюда следует, что т = п и, после подходящей перенумерации, ~ при г = 2,п. Тем самым утверждение доказано. □ Следствие. Пусть а — р^... р/ — разложение элемента а е А на простые множители, причем pi </>р^ при i j. Тогда всякий делитель d элемента а имеет вид d = ср!' ... р1,-, где 0 < < (г = 1,..., s), а с — обратимый элемент. Доказательство. Пусть a— qd. Разложим q и d на простые множители. Перемножив эти разложения, мы получим разложение а на простые множители. Сравнив его с данным разложением, получим требуемый результат. □ ЗАДАЧА 1. Доказать, что в евклидовом кольце а) b | а, с | а и (b, с) = 1 => Ьс | а; б) с | ab и (b, с) = 1 ==> с | а. ЗАДАЧА 2. Наименьшим общим кратным элементов а и b целостного кольца называется их общее кратное (т. е. элемент, делящийся на а и на Ь), делящее все их общие кратные. Оно обо- значается через [а, Ь] или НОК{а, Ь}). Доказать, что в евклидовом кольце для любых элементов а, Ь существует наименьшее общее кратное [а, Ь], причем (а, Ь)[а, Ь] ~ ab. ЗАДАЧА 3. В кольце Z[i] (см. пример 1) разложить на простые множители числа 2, 3 и 5 и подумать, в чем принципиальная разница между этими тремя случаями. Известно, что простых чисел бесконечно много. Напомним рас- суждение, которое это доказывает. Предположим, что ... ..., рп — это все простые числа. Тогда число Р\Р2 ... рп + 1 не делится ни на одно из них, что, очевидно, невозможно. Точно такое же рассуждение показывает бесконечность числа нормиро- ванных неприводимых многочленов над любым полем К. Если поле К бесконечно, то этот результат не представляет интереса, так как в этом случае имеется бесконечно много нормированных многочленов первой степени. Однако если поле К конечно, то этот результат означает, что имеются неприводимые многочлены сколь угодно высокой степени. На самом деле в этом случае имеются неприводимые многочлены любой степени.
§ 6. МНОГОЧЛЕНЫ С РАЦИОНАЛЬНЫМИ КОЭФФИЦИЕНТАМИ 119 ЗАДАЧА 4. Перечислить неприводимые многочлены степеней 4 над полем Z2 и доказать, что существует ровно 6 неприводимых многочленов степени 5. § 6. Многочлены с рациональными коэффициентами Из однозначности разложения целого числа на простые множи- тели вытекает Теорема 1. Если многочлен f — a^xn + aIxn~l + ... + an_tx + an е Z[z] имеет рациональный корень где u,v е Z, (и, v) = 1, то и \ап, v I «о- Доказательство. Имеем О = vnf (^) — а^ип + axun^xv + ... + an_xuvn~} + anvn. Все слагаемые в правой части, кроме последнего, делятся на и. Следовательно, и последнее слагаемое должно делиться на и. Но так как и и v взаимно просты, то ап делится на и (см. задачу 5.1 б)). Аналогично доказывается, что Оц делится на v. □ Следствие. Если нормированный многочлен с целыми ко- эффициентами имеет рациональный корень, то этот корень целый. Очевидно, что всякий многочлен с рациональными коэффици- ентами пропорционален многочлену с целыми коэффициентами. Поэтому теорема 1 позволяет путем конечного числа испытаний найти все рациональные корни любого многочлена с рациональ- ными коэффициентами. Конечно, таких корней, как правило, нет. Приводимый ниже специально подобранный пример относится к разряду тех исключений, которые подтверждают правило. ПРИМЕР 1. Рациональными корнями многочлена f = 2х4 — 7а;3 + 4а;2 — 2а; — 3 согласно теореме 1 могут быть только ±^, ±1, ±^, ±3. Испытания дают 2 корня: о 1 Ж1 — •J) ^2 — 2' Следующая теорема может рассматриваться как обобщение тео- ремы 1.
120 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Теорема 2 (лемма Гаусса). Если многочлен с целыми коэф- фициентами разлагается в произведение двух многочленов с рациональными коэффициентами, то он разлагается в про- изведение двух пропорциональных им многочленов с целыми коэффициентами. Иначе говоря, если f е Z[x] и f = gh, где g, h е Q[x], то существует такое А е Q*, что Xg, X'lh е Z[x], Перед тем, как доказывать эту теорему, введем некоторые вспомогательные понятия. Многочлен f е Z[x] называется примитивным, если его коэф- фициенты взаимно просты в совокупности, т.е. не имеют общего простого делителя. Если такой делитель есть, то его можно вынести за скобки. Поэтому всякий многочлен с целыми коэффициентами, а значит, и всякий многочлен с рациональными коэффициентами, пропорционален некоторому примитивному многочлену (опреде- ленному однозначно с точностью до умножения на ±1). Пусть р — какое-нибудь простое число. Определим редукцию по модулю р многочлена f = Oqx” + а}хп^1 + .. . + an_lx + ane Z[x] как многочлен [Д = [Оо]^" + к],1""1 + • • • + [°n- 1]PZ + [аЛ 6 Zp[x], коэффициенты которого суть вычеты по модулю р коэффициентов многочлена f. Из определения операций над вычетами следует, что [/ + д]р — [Л, + [Л]Р = [/]„[£Г]Р для любых многочленов f,gE Z[x]. Доказательство теоремы 2. Пусть / е Z[x] и f = gh, где g, h е Q[ж]. Согласно предыдущему, многочлены g и h пропорциональны каким-то примитивным многочленам дх и hx. Имеем f = pglhl, MGQ. Пусть у — где и, v е Z, (и, v) — 1. Докажем, что v = ±1, откуда будет следовать утверждение теоремы. Если это не так, то пусть р — какой-нибудь простой делитель числа v. В равенстве vf = идх hx сделаем редукцию по модулю р. Мы получим о = [и]„ [ffiMMp- Однако [u]p^0, так как и и и по предположению взаимно просты.
§ 6. МНОГОЧЛЕНЫ С РАЦИОНАЛЬНЫМИ КОЭФФИЦИЕНТАМИ 121 В то же время 0 и [fy],, ± 0, так как дх и hx —примитивные многочлены и, следовательно, все их коэффициенты не могут делиться на р. Это противоречит отсутствию делителей нуля в кольце Zp[x]. □ Следствие. Если многочлен f е Z[x] допускает разложение в произведение двух многочленов положительной степени в кольце Q[x], то он допускает такое разложение и в кольце Z[x], Это существенно облегчает доказательство неприводимости мно- гочленов над Q. ПРИМЕР 2. Пусть р — простое число. Докажем неприводимость над Q «многочлена деления круга на р частей» f = хр~1 + хр~2 +... + х +1 = _-р. (Комплексными корнями этого многочлена являются все нетри- виальные корни р-й степени из 1, которые вместе с 1 делят окружность |z| — 1 на р равных частей.) Как следует из формулы бинома Ньютона (см. § 1.6), в кольце Zp[x] имеет место равенство хр — 1 = (х — 1)р, так что [/], = (*-1Г'- Если f = gh, где g, h е Z[x] — многочлены положительной степени, то [Лр = кЦМр и, значит, Ыр = (х-1)\ [Ч = (*-1)' (М>0, k + l=p-l). Следовательно, [5(1)]р = Мр(1)=о, [Л(1)]„ = [Ч(1)=о> т.е. д(1) и h(l) делятся на р. Но тогда /(1) = g(l)h(l) делится на р2, что не соответствует действительности, ибо f (\) — p. Имеется способ, принадлежащий Кронекеру, который в принципе позволяет для любого многочлена с целыми коэффициентами определить, приводим он или неприводим над Q. Он основывается на следующих соображениях. Пусть f 6 Z[a:] — многочлен степени п, не имеющий целых корней. Предположим, что он разлагается в Z[a:] в произведение двух многочленов положительной степени: f = gh. Тогда степень одного из них, скажем, д, не превосходит т = 5 .
122 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Будем придавать переменной х различные целые значения х$,х\,...,хт. Из равенств /(*<) = следует, что д(а\) | f(xt) при i = 0,1,..., т. Многочлен д однозначно определяется своими значениями в точках Хд, х^,..х . Выбирая всевозможные наборы делите- лей dg, d|,..dm целых чисел /(xq), /(г,),..f (xm) и находя для каждого из них интерполяционный многочлен степени т, принимающий в точках х0,х1,..., хт значения dg, dj,..., dm, можно найти всех кандидатов на роль д (их будет конечное число). Те из них, которые имеют дробные коэффициенты, следует сразу отбросить. Испытав оставшиеся многочлены, можно определить, имеются ли среди них делители многочлена /, в зависимости от чего и будет решен вопрос о приводимости последнего. § 7. Многочлены от нескольких переменных Функция вещественных переменных х1,х2,...,хп называется многочленом, если она может быть представлена в виде /(х1,ж2,...,х„) = Y, х№ .. .х*°, (10) ..*. где суммирование происходит по конечному числу наборов (fc1; ..., fcn) неотрицательных целых чисел. (Формально можно считать, что суммирование происходит по всем таким наборам, но лишь конечное число коэффициентов к отлично от нуля.) Многочлены образуют подалгебру в алгебре всех функций от xt, Х2,..., хп. Она называется алгеброй многочленов от xt, ..., хп над R и обозначается R[x1; хп]. Можно показать (см. теорему 1 ниже), что представление многочлена над R в виде (10) однозначно, т. е. коэффициенты многочлена определяются его значениями. При определении алгебры многочленов от п переменных над любым полем К возникает такая же трудность, как и в случае одной переменной. Это приводит к необходимости формального определения, которое может быть дано, например, следующим образом. Рассмотрим бесконечномерную алгебру над К с базисом ... Jt„ * Z+} и таблицей умножения Очевидно, что эта алгебра коммутативна и ассоциативна и что элемент ...о является ее единицей. Она называется алгеброй многочленов над К и обозначается через жп].
§ 7. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 123 Условимся отождествлять элементы вида ае^ 0 (аб К) с соот- ветствующими элементами поля К и введем обозначения eio...o = q>i. ..о ~ х2> е00 ... 1 — Хп- Тогда fc, Ак к Xn и любой элемент *i, fcj, записывается в обычном виде (10). Многочлен (10) называется однородным степени d, если ПРИ fc1 + ^ + ... + fcn^d. Однородные многочлены заданной степени d образуют конечно- мерное подпространство, так как имеется лишь конечное число наборов (fct, faj, ..кп) целых неотрицательных чисел, удовлетво- ряющих условию fci + . + кп = d. ЗАДАЧА 1. Доказать, что размерность пространства однородных многочленов степени d от п переменных равна _ п(п + 1)... (n + d - 1) ~ d! (число сочетаний с повторениями из п по d). Любой многочлен однозначно представляется в виде суммы однородных многочленов степеней 0, 1, 2,..называемых его од- нородными компонентами. (Лишь конечное число из них отлично от нуля.) Степенью (по совокупности переменных) ненулевого многочле- на называется максимальная из степеней его ненулевых членов или, что то же самое, максимальная из степеней его ненулевых однородных компонент. Степень многочлена f обозначается через deg/. Справедливы следующие соотношения: deg(/ + g) deg/ + degg, (И) degCfo) = deg / + deg fir. (12) Первое из них очевидно, второе мы докажем чуть позже.
124 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ С другой стороны, каждый многочлен f е zn] одно- значно представляется в виде ОС f(xl,x2,...,xn)=^lfk(x2,...,xn)xk, (13) k =0 где /0, /и /2, ... — какие-то многочлены от хп, лишь конечное число которых отлично от нуля. Наибольший из номеров многоч- ленов fk, отличных от нуля, называется степенью многочлена f по Ж] и обозначается через deg^ f. Пользуясь представлением (13), можно рассматривать кольцо К[х,, Х2, ..хп] как кольцо многочленов от хг с коэффициентами из Kfa,..х„]: K[xlf Х2,..., хп] = Ж„][ж,]. (14) Замечание 1. Мы говорим о кольцах, а не об алгебрах, так как ®2>• • • ..., хп] по определению есть алгебра над АГ, в то время как .., £„][£)] есть алгебра над • • •> xnl- Однако если рассматривать Kfa’ • • > ^nlHi 1 как алгебру над К (пользуясь тем, что ..., жп] D АГ), то можно говорить о равенстве алгебр. Предложение 1. Алгебра K[xlt ..., яп] не имеет делителей нуля. Доказательство. В § 1 было фактически доказано (см. за- мечание 1.3), что кольцо многочленов от одной переменной над це- лостным кольцом также является целостным кольцом (в частности, не имеет делителей нуля). Поэтому равенство (14) позволяет дока- зать наше утверждение индуктивным путем, начиная с поля К. □ Теперь мы в состоянии доказать соотношение (12). Разложим многочлены f и д на однородные компоненты: / = /о + Л +• • + /<< (deg Д = fc, fd 7^0), 9 = д0 +9i + +де (^§gk = k, де^о). Ясно, что при их перемножении не появится членов степени > d+е, а сумма всех членов степени d+e будет равна fdge. По доказанному fdge 7^0- Следовательно, deg fg = d + е = deg f + deg g. Как и в случае n = 1, всякий многочлен от п переменных над полем К определяет функцию на Кп со значениями в К. Теорема 1. Если поле К бесконечно, то разные многочлены от п переменных над К определяют разные функции.
§ 7. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 125 Доказательство. Как и в случае многочленов от одной переменной (см. доказательство теоремы 1.1), достаточно доказать, что ненулевой многочлен определяет ненулевую функцию. Дока- жем это индукцией по п. При п = 1 это составляет содержание теоремы 1.1. Предположим теперь, что многочлен f е х^..., xn] (n > 1) определяет нулевую функцию. Представим его в виде (13) и придадим какие-то значения переменным х^ ..хп. Мы получим многочлен от одной переменной xt с коэффициентами из К, обращающийся в нуль при любом значении х{. По теореме 1.1 все его коэффициенты равны нулю. Таким образом, каждый из многочленов fk е . .., zn] обращается в нуль при любых значениях ..., хп, т. е. определяет нулевую функцию. По предположению индукции отсюда следует, что fk—0 при любом к; но тогда и f = 0. □ ЗАМЕЧАНИЕ 2. Если поле К конечно, то теорема и ее доказа- тельство тем не менее остаются в силе для многочленов, степень которых по каждому из переменных меньше числа элементов поля К (см. замечание 1.5). ЗАДАЧА 2. Доказать, что если поле К содержит q элементов, то функции, определяемые одночленами хр ... х^ с fc15..., кп < q, составляют базис в пространстве всех функций на Кп со значени- ями в К. При п > 1 члены многочлена от п переменных нельзя, вообще говоря, однозначно упорядочить по их степеням, поскольку может быть несколько членов одинаковой степени. Между тем какое- то упорядочение иногда бывает полезно. В этих случаях обычно используют лексикографическое (т. е. подобное упорядочению слов в словаре) упорядочение, при котором вначале сравниваются показатели при xit затем, если они равны, показатели при и т. д. Если одночлен и лексикографически старше одночлена v, то мы будем писать и v. Согласно определению, это означает, что первая из переменных, которая входит в и и v с разными показателями, входит вис большим показателем, чем в v. Предложение 2. Отношение лексикографического упорядо- чения одночленов обладает следующими свойствами: 1) если и v и v w, то и>- w (транзитивность); 2) если и v, то uw vw для любого одночлена w; 3) если щ > Vj и v2, то >- vtv2. Первое из этих свойств, собственно, и дает основание называть отношение упорядочением.
126 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Доказательство. 1) Пусть первая переменная, которая не входит во все одночлены u,v,w с одним и тем же показателем, входит в них с показателями к, I, т соответственно. Тогда k I т, причем хотя бы в одном из двух случаев имеет место строгое неравенство. Следовательно, к > т, а это и означает, что и > w. 2) При умножении на w к показателям, с которыми каждая из переменных входит в и и v, добавляется одно и то же число, и знак неравенства (или равенства) между этими показателями не меняется, а только эти неравенства и имеют значение при сравнении одночленов. 3) Пользуясь предыдущим свойством, получаем ЩИ? >- > Vj v2. □ ПРИМЕР 1. Следующий многочлен расположен по лексикогра- фическому убыванию членов: х'^х2 + а^а^а^ + 2a;1rnJ2 + а^а^ — а^а:32 + 3. Обратите внимание на то, что член xix^x3 лексикографически младше а:2а^, хотя его степень больше. Среди ненулевых членов любого ненулевого многочлена f 6 е К[х1;Х2, ...,а:п] имеется единственный, который лексикографи- чески старше всех остальных. Он называется старшим членом многочлена /. Предложение 3. Старший член произведения ненулевых многочленов равен произведению их старших членов. Доказательство. Достаточно доказать это утверждение для двух многочленов. Пусть j\, f2— ненулевые многочлены, и,, щ — их старшие члены и и,, v2 — какие-то их члены. Если / ut или v2 / Uj, то в силу предложения 2 tquj >• v}v2. Следовательно, после приведения подобных членов в произведении J\f2 произведение сохранится в качестве ненулевого члена, который старше всех остальных. □
§ 8. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 127 § 8. Симметрические многочлены Определение 1. Многочлен f е K[xt, хп] называется симметрическим, если он не изменяется ни при каких переста- новках переменных. Так как любая перестановка может быть осуществлена путем последовательных перестановок двух элементов, то многочлен является симметрическим, если он не изменяется при перестановке любых двух переменных. Очевидно, что каждая однородная компонента симметрического многочлена также является симметрическим многочленом. Пример 1. Степенные суммы sk = xf + х* + ... + я* (k = 1, 2,...), очевидно, являются симметрическими многочленами. ПРИМЕР 2. Следующие симметрические многочлены называют- ся элементарными симметрическими многочленами: а1^х1 + х2 + ... + хп, = Я-] 3-2 + Х1Х3 "Ь • • "Ь Хп - 1 > = £ х^хч h < i, <... < it °п = Х1Х2 • • ХП- ПРИМЕРЗ. Определитель Вандермонда V(xi,x2,...,xn)= » > j (см пример 2.4.5), представляющий собой произведение разностей всевозможных пар переменных, при перестановках переменных может только умножиться на ±1 за счет того, что в некоторых слу- чаях уменьшаемое и вычитаемое поменяются ролями. Число таких случаев равно числу инверсий в соответствующей перестановке. Следовательно, V(xK, х^,..xk ) = sgn(fcj, kn)V(Xl, ^2,..., xn). Таким образом, сам определитель Вандермонда не является симме- трическим многочленом, но таковым является его квадрат V(xn Xj,..., zn)2 = П (я\ - ху)2. i > 3
128 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ ПРИМЕР 4. При любых перестановках переменных xt, х,, а;4 многочлены hj — а^2 -f- а>4 , х^ х^ Н- х4 h3 — х^ х4 -f- х2 х^ переставляются между собой. Поэтому любой симметрический мно- гочлен от них будет симметрическим многочленом от х}, а^, х3, х4. В частности, таковым является их произведение ^1 Мз = (xi + хзха)(х1хз + x2x4)(xix4 + х2х3). ЗАДАЧА 1. Доказать, что многочлен (ajj + х2 - z3 - x4)(xj - х2 + х3 - х4)(х, - х2 - х3 + х4) является симметрическим. Симметрические многочлены находят применение в исследова- нии алгебраических уравнений с одним неизвестным благодаря формулам Виета (см. §2), которые выражают элементарные симме- трические многочлены от корней алгебраического уравнения через его коэффициенты (при условии, что число корней уравнения в рассматриваемом поле равно его степени). Ясно, что только сим- метрические многочлены от корней уравнения однозначно опреде- лены: значение любого другого многочлена, вообще говоря, зависит от нумерации корней. С другой стороны, мы покажем, что любой симметрический многочлен от корней алгебраического уравнения может быть выражен через коэффициенты этого уравнения. ПРИМЕР 5. Многочлен s2 = х2 + х£ + ... + х2 является симме- трическим. Легко видеть, что s2 — (Tj — 2<т2. (15) Поэтому сумма квадратов корней алгебраического уравнения хп + at хп '1 + 02 хп ~2 + ... + ап _ t х + ап — О равна а2 — 2о2. Очевидно, что сумма и произведение симметрических многоч- ленов, а также произведение симметрического многочлена на число являются симметрическими многочленами. Иными словами, симметрические многочлены образуют подалгебру в алгебре всех многочленов. Следовательно, если F е X[Xt, Х2,..Хт] — произвольный многочлен от т переменных и Д, /2,..., /т 6 X[xlt х^ ..хп] — какие-то симметрические многочлены, то F(/], /2,..., /т) — также симметрический многочлен от xlt х2,..хп. Естественно поста- вить вопрос, нельзя ли найти такие симметрические многочлены
§ 8. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 129 /1> А, • •, fm< чтобы всякий симметрический многочлен можно было выразить через них указанным способом. Оказывается, что в качестве таких многочленов можно взять элементарные симметри- ческие многочлены <т2,..., ап. Теорема 1. Всякий симметрический многочлен единствен- ным образом представляется в виде многочлена от элементар- ных симметрических многочленов. Доказательству теоремы предпошлем две леммы. Лемма 1. Пусть и = ахр х^ .. .х^ — старший член симметри- ческого многочлена f. Тогда k^k^...>kn. (16) Доказательство. Предположим, что fc, <ki + l для некото- рого i. Наряду с членом и многочлен f должен содержать член и' = ах? ... z£1+ ^i + i ... хп-, получающийся из и перестановкой xt и х< + 1. Легко видеть, что и' >- и. Это противоречит тому, что и — старший член многочле- на /. □ Лемма 2. Для любого одночлена и — х^х^ ... х^, показате- ли которого удовлетворяют неравенствам (16), существуют такие неотрицательные целые числа 12,..., 1п, что старший член многочлена ... ст'" совпадает с и. Числа 12,..., 1п определены этим условием однозначно. Доказательство. Старший член многочлена <тк равен \\ . . хк. В силу предложения 7.3 старший член многочлена .. ак равен • • • хп)‘" = xl1 + ^ + -- +‘"x^ + --- + ‘- ... хк. Приравнивая его одночлену и, получаем систему линейных урав- нений А + k + • • • + А = ^1 > /2 + ... + = fc,, которая, очевидно, имеет единственное решение к^К-к{ + 1 (г = 1,2,..., п — 1), 1п = кп. (17) Из условия леммы следует, что определенные таким образом числа ..., 1п неотрицательны. □
130 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Замечание 1. Уравнение + 4 + ... + ln = fcj показывает, что степень одночлена Х[' Х£ ... Х^ по совокупности переменных равна степени одночлена и по х{. Доказательство теоремы 1. Пусть f G X[xlt 2^,... ..rr„] — симметрический многочлен. Нам нужно найти такой многочлен F е К[Х,, Х2, ..., XJ, что <т2,..., <тп) = /. Если f = 0, то можно взять F = 0. В противном случае пусть U] — axf'xfi ... х*” — старший член многочлена f. По лемме 1 выполняются неравенства (16). По лемме 2 существует такой одночлен F{ е К[Х}, Х2,..Хп], что старший член многочлена _F](crj, а2,..., <тп) равен и,. Рассмотрим симметрический многочлен /1 = /-7?1(<71><Т2, Если Д = 0, то можно взять F = Е]. В противном случае пусть щ — старший член многочлена Д. Ясно, что он младше, чем Суще- ствует такой одночлен F2 е K[Xt, Х2,..Хп], что старший член многочлена F2(a{, а2,..., ап) равен Рассмотрим симметрический многочлен f2 = h~ F2(^,a2,...,an). Если /2 = 0, то можно взять F = Fx + F2. В противном случае, продолжая процесс, получаем последовательность симметрических многочленов f, f2,..старшие члены которых удовлетворяют неравенствам itj >- щ >-... По лемме 1 показатель при любой переменной в любом из одночленов ит не превосходит показателя при хг в этом одночлене, а он, в свою очередь, не превосходит Поэтому для наборов показателей одночленов ит имеется лишь конечное число возмож- ностей, так что описанный выше процесс должен оборваться. Это означает, что fM = 0 для некоторого М. В качестве F можно тогда взять F} + F2 + ... + FM. Докажем теперь, что многочлен F определен однозначно. Пред- положим, что F и G — такие многочлены, что F(at, а2,..., ап) = а2,..., ст„). Рассмотрим их разность Н — F — G. Тогда Н(а],а2,...,ап)=0.
§ 8. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 131 Нам нужно доказать, что Н = 0. Предположим, что это не так, и пусть НИН2,..Н„ — все ненулевые члены многочлена Н. Обозначим через w{ (i = 1, 2,..., s) старший член многочлена Д <т2,..<тп) е К[х{, Жг,..xj. В силу леммы 2 среди одночленов wl,w2,...,w, нет пропор- циональных. Выберем из них старший. Пусть это будет w}. По построению одночлен Wj старше всех остальных членов многоч- лена <т2,..ап) и всех членов многочленов <т2,..., ап) (г = 2, ..., з). Поэтому после приведения подобных членов в сумме Ъ, • •> ап) + <т2,..., <т„) + ... + НДст,, а2,..., ап) = = Н(а{,а2,...,ап) член w, сохранится, так что эта сумма не будет равна нулю, что противоречит нашему предположению. □ ЗАМЕЧАНИЕ 2. Согласно замечанию 1, для любого т deg Fm = degzum deg^ щ = deg^/(= kJ. Следовательно, degF = degz_/. (18) Следуя доказательству этой теоремы, можно в принципе найти выражение любого конкретного симметрического многочлена через <?[, <т2,..., <гп. ПРИМЕР 6. Выразим через ст,, а2, ..., ап многочлен f = 5з = х3 + х* + ... + х*. Представим вычисления в виде таблицы. т <г2,..., ап) fm 1 X,3 CTi3 = 52 xi + 3 52 xixj + • > / > + 6 52 XiXjXk i < j < k -3^,х?х^& 52 xiXjxk i=/tj i<j < к 2 — 3x^X2 -Зо-^^-З 2 xixj~ -9 52 xix,xk i<i<k 3 52 xixjxk i < j <k 3 Зх1х2х3 3<T3 = 3 52 х^хк i<i<k 0
132 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Таким образом, S3 = <7|3 — 3<7] ст2 + 3<т3 (19) На практике для однородных симметрических многочленов удоб- нее применять другой способ, который мы поясним на следующем примере. ПРИМЕР 7. Выразим через о], а2, а3, <т4 многочлен f = (^13=2 + хзх4)(х1хз + + я^з) из примера 4. В обозначениях доказательства теоремы 1 имеем = х^х^х^. Не производя вычислений, можно найти с точностью до коэффициентов возможных кандидатов на роль одночленов . Во-первых, их показатели должны удовлетворять неравен- ствам леммы 1. Во-вторых, поскольку f — однородный многочлен степени 6, сумма их показателей должна равняться 6. В-третьих, они должны быть младше и,. Выпишем в таблицу все наборы пока- зателей одночленов, удовлетворяющих этим условиям, в порядке лексикографического убывания, начиная с набора показателей одночлена щ, а справа выпишем соответствующие произведения элементарных симметрических многочленов, найденные по форму- 3 111 2 2 2 0 2 2 11 ь и?1 b о Итак, мы можем утверждать, что f — а^а4 + а<т2 + Ьа2а4. Для того чтобы найти коэффициенты а и Ь, будем придавать в этом равенстве переменным хх, х2, х4 какие-нибудь выбранные значения. Представим вычисления в виде таблицы, в правом столбце которой будем выписывать получаемые уравнения: хг <т2 °3 <Т4 f 1 1 1 0 3 3 1 0 1 а= 1 1 1 -1 -1 0 —2 0 1 8 -26 = 8 Таким образом, а = 1 и b = —4, так что f = afa + <т32 - 4а2а4. В случае неоднородного симметрического многочлена этот спо- соб можно применить к каждой его однородной компоненте и полученные выражения сложить.
§ 8. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 133 Замечание 3. Изложенная теория без всяких изменений переносится на более общий случай, когда К — произвольное коммутативное ассоциативное кольцо с единицей. Так, в случае К = Z получается следующий результат: всякий симметрический многочлен с целыми коэффициентами представляется в виде мно- гочлена с целыми коэффициентами от элементарных симметриче- ских многочленов. Доказанная теорема в сочетании с формулами Виета позволяет найти любой симметрический многочлен от корней заданного алгебраического уравнения. А именно, пусть f е х^, ..., ггп] — симметрический многочлен и F 6 Х2,..., ХтJ — такой мно- гочлен, что / = А1(о1,ст2,...,оп). Пусть, далее, си с^,..., сп — корни алгебраического уравнения ОоХ" + а^”-1 + ... + а„_ ,а: + ап = О (а^О). Тогда = (20) ЗАМЕЧАНИЕ 4. Пусть deg^f = k. Тогда degF — к (см. заме- чание 2) и, домножив равенство (20) на а§, мы получим в правой части однородный многочлен степени к от ад, alt ап. ПРИМЕР 8. Пусть С], С2, с3, с4— корни уравнения х4 + рх2 + qx + г = 0. (21) Найдем уравнение 3-й степени, корнями которого являются числа (/) = С] С? + С-Jс4, (1^ = С] Сз + С2с4, d3 = C]C4 + C2C3. Запишем его в виде у3 + а{у2 + 0217 + 03 = 0. Согласно формулам Виета О| — (d] “I- “I- d& — d{ <4 -f- d^ d$ 4~ d% d^, 03 — d^ d^ d^. Имеем di = c3, c4), где h}, h2, — многочлены из приме- ра 4. Находим: + /l2 + /^3 “ @21 hxh2 + hlh3 + /13/13= xixjxk = (Ti(T3~^cr4> 3<k hl /I2/I3 = <rf(T4 + (T2 — 4<72<74.
134 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ (Последнее равенство есть результат примера 7.) По формулам Виета ai (ci > Сз> ci)= <Т2(С1> ^5 ^3, с4) = Pi <7з(С11 Cyi *^35 са) ~ ~4i а4(с1,с2,Сз,с4) = г. Следовательно, О] = — р, = —4г, а3 = 4pr — q2, т. е. искомое уравнение имеет вид У3 ~ РУ2 - ^ту + (4рг - д2) = 0. (22) ЗАДАЧА 2. В обозначениях предыдущего примера доказать, что (ci + с2 - с, - с4)2 = 4(d, - р), (С] - О; + Сз - с4)2 = 4(^ - р), (Ci - С2 - Сз + с4)2 = 4(с(з - р) и, кроме того, (ci + Cj - с, - c4)(cj - Сз + с3 - с4)(С| - % - % + с4) = -8g (23) (см. задачу 1). Пользуясь результатами этой задачи, можно свести решение уравнения (21) к решению уравнения (22) (при условии что char К / 2). А именно, складывая с подходящими знаками равенст- ва с, + Сг + Сз + с4 = О, С[ + % - С3 - с4 = 2у/^ -р, С1 - % + Сз - с4 -2-уЦ-р, С1 - С2 - с3 + с4 = 2y/d3-p, получаем с1,2,з,4 = ~Р^= V^-P ± V^-p) 1 где число минусов должно быть четно. Исходные значения квад- ратных корней здесь следует выбирать таким образом, чтобы их произведение равнялось — g (см. формулу (23)). Уравнение (22) называется кубической резольвентой уравне- ния (21).
§ 9. КУБИЧЕСКИЕ УРАВНЕНИЯ 135 § 9. Кубические уравнения При решении квадратных уравнений ключевую роль играет дискриминант. По его обращению в нуль можно судить о наличии кратного корня, а по его знаку (в случае поля вещественных чисел) — о числе вещественных корней. Выясним смысл дискриминанта квадратного трехчлена р = OqX2 + йуХ + а2 Е С[х]. Пусть с,, с? — корни этого трехчлена. Тогда -D(¥’) = ai-4aoa2 = ao[(^) ~^] =^[(ci + c2)2-4cic2] = ao(ci-c2)2- В случае когда Oq, a1,a26R, полученная формула хорошо объ- ясняет ту связь между дискриминантом и свойствами корней, о которой говорилось выше. А именно, имеются следующие три возможности: 1) ct, С2 е R, с( тогда с, — — отличное от нуля вещественное число и D(p) > 0; 2) С] = Cj 6 R; тогда С] — = 0 и D(tp) = 0; 3) Cj = с2 R; тогда - % — отличное от нуля чисто мнимое число и D(tp) < 0. Что еще более важно, эта формула подсказывает, как можно определить дискриминант любого многочлена Ч> = а$хп + а,.хп~' + ... + ап_ tx + ап е К[х] (а^ ^0). Предположим вначале, что многочлен имеет п корней си ... .. .,спе К. Определим тогда его дискриминант D(tp) по формуле D(p) = <^-2 ТШ-S)2- (24) I > j (Показатель при Оц не так важен; почему мы выбрали его именно таким, будет ясно из дальнейшего.) Иными словами, D(<p) есть умноженное на a£n-2 значение симметрического многочлена (см. пример 8.3) f = П (xi ~ Х]У i >3 от корней многочлена р. Описанная в §8 процедура позволяет выразить D(ip) через коэффициенты многочлена <р. Так как = 2п-2,
136 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ то в силу замечания 8.4 это выражение будет представлять собой некоторый однородный многочлен Д степени 2п—2 от ад, а,, ..ап: = (25) Для нахождения многочлена Д нет необходимости знать, что многочлен tp имеет п корней в К. Это позволяет определить дискриминант любого многочлена р по формуле (25). Замечание 1. Так как f имеет целые коэффициенты, то и А имеет целые коэффициенты (см. замечание 8.3). Замечание 2. Можно доказать (см. теорему 9.5.6), что для любого многочлена <р G К[х] степени п существует расширение L поля К, в котором <р имеет п корней. (Например, если Ef = R, то можно взять L =С.) Так как описанная выше процедура вычисления дискриминанта не зависит от того, над каким полем рассматривается многочлен ip (лишь бы его коэффициенты лежали в этом поле), то для D(<p) будет справедлива формула (24), если в качестве Ср с^,..., сп взять корни многочлена р в поле L. Из определения (24) дискриминанта ясно, что многочлен р е С[я] имеет кратные корни тогда и только тогда, когда D(tp) = O. Это показывает, что наличие кратных корней является исключительным обстоятельством: если выбирать коэффициенты многочлена науда- чу, то вероятность того, что он будет иметь кратные корни, равна нулю. Пусть теперь р — кубический многочлен с вещественными ко- эффициентами и сн С2, Сз — его комплексные корни. Тогда £(<p) = <4(ci - “ Сз)2- Имеются следующие три возможности (с точностью до перенуме- рации корней): 1) Cj, С2, Сд — различные вещественные числа; тогда D(p) > 0; 2) Cj, С2, с, е R, С2 = с,; тогда D(tp) = 0; 3) с, е R, Cj = с^ R; тогда Щф) = <4Kci - - ^)]2(с2 ~ ^)2 = = <4lci -c2l4(c2-^)2<°- Таким образом, мы приходим к тому же выводу, что и в случае квадратного трехчлена: все корни многочлена вещественны тогда и только тогда, когда D (<р) 0. Задача 1. Доказать, что если — многочлен любой степени с вещественными коэффициентами, не имеющий кратных комплекс- ных корней, то sgn£>(<p) = (-l)‘, где t — число пар комплексно-сопряженных мнимых корней мно- гочлена <р.
§ 9. КУБИЧЕСКИЕ УРАВНЕНИЯ 137 Мы найдем теперь явное выражение дискриминанта кубического многочлена через его коэффициенты, но перед этим сделаем неко- торые общие замечания, позволяющие упростить вычисления. Любой многочлен можно нормировать, разделив на старший коэффициент, что не изменит его корней. Далее, любой нормиро- ванный многочлен ip — Хп + ajX”-1 + Ог,хп ~2 + ... + ап_ хх + ап над полем нулевой характеристики (или, более общо, над полем, характеристика которого не делит п) с помощью замены “1 х = у---L * п приводится к многочлену = Уп + Ъ2уп~2 + ... + bn_ 1 у + Ьп, в котором коэффициент при уп~х равен нулю. Многочлен такого вида называется неполным. При п = 2 именно таким способом получается формула решения квадратного уравнения. При п > 2 эта замена не решает дела, но, во всяком случае, может упростить задачу. Найдем дискриминант неполного кубического многочлена = х3 + рх + q. (26) Следуя способу, изложенному в примере 8.7, будем искать выражение симметрического многочлена / = (х, - х2)2(х1 - х3)2(х2 - х3)2 через элементарные симметрические многочлены <т{,<т2,<т3. Мно- гочлен f является однородным степени 6, и его старший член равен Х'Х%. Выпишем наборы показателей старших членов сим- метрических многочленов, которые могут встретиться в процессе, описанном в доказательстве теоремы 8.1, и соответствующие им произведения элементарных симметрических многочленов:
138 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Мы видим, что f = + а<7]3ст3 + b(j% + са} а2а3 + dcr2. (27) Для вычисления D(tp) мы должны будем сделать в выраже- нии (27) подстановку o-i=0, ^2 = Р, о3 = -q. Поэтому коэффициенты а и с не будут влиять на окончательный результат, и мы можем их не находить. Для нахождения b и d будем в равенстве (27) придавать переменным х%, х^ значения, указанные в следующей таблице, в правом столбце которой выписаны получаемые при этом уравнения: Х1 °2 °3 f 1 -1 0 2 -1 -1 0-10 0-3 2 4 0 -b=4 -27b+4d =0 Таким образом, b = —4, d = —27 и D(<p) = —4р3 — 27 g2. (28) ПРИМЕР 1. Найдем число вещественных корней многочлена <р = х3 — 0,Зге2 — 4,Зге + 3,9. С помощью замены у = х — 0,1 приводим его к неполному многочлену (коэффициенты которого могут быть найдены по схеме Горнера, как в примере 2.3) ф = у3 - 4,33у + 3,468. Теперь D(<p) = Р('ф) = 4 • 4,333 — 27 • 3,4682 = 0,0013 > 0. Следовательно, многочлен <р имеет 3 различных вещественных корня. ЗАМЕЧАНИЕ 3. Дискриминант кубического многочлена общего вида <р = OqX3 -Т а,х2 + а^х + равен D(<p) = а2а% — 4а^Оз — 4(^0% + 18аоа1а2а3 — 27(%а%. Изложим теперь способ решения кубического уравнения. Предположим, что основное поле К содержит нетривиальный (т. е. отличный от 1) кубический корень из единицы, скажем, ш.
§ 9. КУБИЧЕСКИЕ УРАВНЕНИЯ 139 Тогда 1, а>, о>-1 —это все кубические корни из единицы, и по формуле Виета получаем w + ur-^-1. (29) Рассмотрим линейные многочлены hx = х1 + шх? + ш~[х3, h2 = X] + аг"1 х^ + шх^. При перестановке х^ и х$ они меняются местами, а при перестанов- ке хх и х^ многочлен h{ переходит в wh^, a — в Отсюда следует, что многочлены / = ^|3 + ^2, являются симметрическими. Выражая их через элементарные сим- метрические многочлены, получаем / = 2<т2 — 9а}а2 + 27<т3, д — а? — 3а2. Пусть теперь си с, — корни многочлена (26). Положим d{ = Cj + wCj + w~ 'с,, dj = c, + a?-1C2 + wc,. Из предыдущего следует, что d3 + <43 = —27g, dld2 = —3p и, значит, d*d* = ~27Р3- Таким образом, df и d/ — это корни квадратного уравнения х2 + 27 qx - 27р3 = 0. Решая его, находим (/ 3 2 \ -1 + \Ь + т)^ <3°) (/ 3 2 \ -|-V27 + ^)- (31) Заметим, что выражение, стоящее под знаком радикала, лишь множителем — отличается от дискриминанта многочлена (26). Складывая равенства С]+ С2 + Сз =0, с(-|- 1VC2 +ш~1с3 = dt, С1 + й?~1С2-|- ШСз = <4, с учетом соотношения (29) получаем ci ~ з^1 + dz)'
140 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ Поскольку нумерация корней может быть произвольной, эта фор- мула на самом деле дает все три корня, если в качестве d, и <4 выбирать всевозможные значения кубических корней из выражений (30) и (31), связанные полученным выше соотношением ФФ = -зР. (32) Таким образом, мы приходим к следующей окончательной формуле называемой формулой Кардано. ЗАМЕЧАНИЕ 4. Формула Кардано имеет смысл, если извлека- ются входящие в нее квадратные и кубические корни. В частно- сти, если мы решаем по этой формуле кубическое уравнение с вещественными коэффициентами, то нам, вообще говоря, придется работать с комплексными числами, даже если нас интересуют только вещественные корни. Именно так обстоит дело в случае положительного дискриминанта, когда все три корня вещественны: в этом случае число, стоящее под знаком квадратного радикала, отрицательно. ПРИМЕР 2. Найдем корни многочлена ф из примера 1. Имеем „з „2 , +V = -TO8D(^)W-0’0000120- так что под знаком одного из кубических радикалов в формуле Кардано будет стоять число - 2 + \1^ + 4 ~ -1 ’ 734 + 0,00347г « « 1,73400[cos(tt - 0,00200) + i sin(7r - 0,00200)]. Под знаком другого кубического радикала будет стоять комплексно- сопряженное число. Условие (32) означает в данном случае, что при извлечении кубических корней следует комбинировать их ком- плексно-сопряженные значения. При сложении комплексно-сопря- женных чисел получается их удвоенная вещественная часть. Таким образом, С1« 2^/1,73400 cos ^-у200 « 1,20278, С2 «2^/1,73400 cos 7Г + °/)0200 « 1,20001, Сз « -2^/1,73400 cos « -2,40277.
§ 10. ПОЛЕ РАЦИОНАЛЬНЫХ ДРОБЕЙ 141 § 10. Поле рациональных дробей Таким же образом, как кольцо целых чисел расширяется до поля рациональных чисел, любое целостное кольцо можно расширить до поля. Пусть А —целостное кольцо. Рассмотрим множество пар (а, 6), где а, Ь 6 А, Ь 0, и определим в нем отношение эквивалентности по правилу (й|, d1)~(а^ Ь2) < > alb2 = a2bi. Рефлексивность и симметричность этого отношения очевидны; до- кажем его транзитивность. Если (аи b1)~(a2> b2) и (о^, Ь2)~(оз, Ь3), то ai ^2^3 = c^byb^ = а^Ь^ Ь2, откуда после сокращения на Ъ2 получаем ai Ьз = °з ^1 > т.е. (а,, bj ~ (аз, Ь3). Из данного определения следует, что (а, Ь) ~ (ас, Ьс) (33) для любого с 0. С другой стороны, как показывает следующая ниже цепочка эквивалентностей, любая эквивалентность (а|; bj) ~ ~ (о2, Ь2) является следствием эквивалентностей типа (33): (fli, by) ~ (dj b2, bjb2) = (a2bi, Ь2) ~ (а?, Ь2). (Мы сначала умножили оба члена пары (аи 6,) на Ь2, а затем сократили оба члена получившейся пары на Ьг) Определим теперь сложение и умножение пар по правилам (ai > ^i) 4" (°2> ^2) = (ai ^2 + (ai> ^i)(a2, b2) — (а^а^, bjb2). Докажем, что определенное выше отношение эквивалентности согласовано с этими операциями. В силу предыдущего достаточно показать, что при умножении обоих членов одной из пар (а}, Ь,) и (о^, Ь2) на элемент с^О сумма и произведение этих пар заменятся эквивалентными им парами; но очевидно, что при такой операции оба члена суммы и произведения умножатся на тот же элемент с. Класс эквивалентности, содержащий пару (а, Ь), условимся за- писывать как «дробь» или а/b (пока это просто символ, не
142 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ подразумевающий фактического деления). Ввиду доказанного выше операции сложения и умножения пар определяют операции сложе- ния и умножения дробей, осуществляемые по обычным правилам: f cij “I- ^2 fej ^2 ^2 ^2 ^2 Докажем, что относительно этих операций дроби образуют поле. Любое конечное множество дробей можно привести к общему знаменателю, а сложение дробей с одинаковыми знаменателями сводится к сложению их числителей. Поэтому сложение дробей коммутативно и ассоциативно. Дробь у (= ^ при любом b 0) служит нулем для операции сложения дробей, а дробь -у противо- положна дроби Таким образом, дроби образуют абелеву группу относительно сложения. Коммутативность и ассоциативность умножения очевидны. Сле- дующая цепочка равенств доказывает дистрибутивность умноже- ния дробей относительно сложения: а1 , ^2 'l °3 __ (а1 ~Г а2)а3 __ а1 а3 + Д;аз _ °з , °3 b "I b ) ь3 ьь3 ЬЬ3 Ь Ь3 "I Ь Ь3' Дробь | служит единицей для операции умножения дробей, а при ау^О дробь обратна дроби р Построенное поле называется полем отношений (или полем дробей) кольца А и обозначается через Quot А. Сложение и умножение дробей вида у сводятся к соответ- ствующим операциям над их числителями. Кроме того, у = у только при а — Ь. Следовательно, дроби такого вида образуют подкольцо, изоморфное А. Условившись отождествлять дробь вида у с элементом а кольца А, мы получим вложение кольца А в поле Quot А. Далее, поскольку а b _ а Ъ\ “ I’ дробь равна отношению элементов а и b кольца А в поле Quot А. Таким образом, обозначение можно теперь понимать содержательным образом. В силу (33) дробь не изменится, если ее числитель и знаменатель умножить или разделить (если это возможно) на один и тот же элемент кольца А. Если А — евклидово кольцо, то путем сокращения числителя и знаменателя на их наибольший общий делитель любая дробь приводится к виду у, где (a, b) — 1. Такой вид дроби называется несократимым. (Допуская вольность речи, обычно говорят просто о несократимой дроби.)
§ 10. ПОЛЕ РАЦИОНАЛЬНЫХ ДРОБЕЙ 143 Предложение 1. Любой вид дроби над евклидовым кольцом получается из любого ее несократимого вида умножением числителя и знаменателя на один и тот же элемент. Доказательство. Пусть = у-, причем (00,60) = !. Из равенства ab0 = Оцб следует, что Ьо | а^Ь и, значит, Ьо | Ь. Пусть b — cb0; ясно, что тогда а = са^. □ Следствие. Несократимый вид дроби над евклидовым коль- цом определен однозначно с точностью до умножения числите- ля и знаменателя на один и тот же обратимый элемент. Поле отношений кольца Z целых чисел есть поле Q рацио- нальных чисел. Поле отношений кольца многочленов над полем К называется полем рациональных дробей (или рациональ- ных функций) над полем К и обозначается через К(х). Каждая рациональная дробь определяет функцию на К со значе- ниями в К, определенную там, где ее знаменатель (в несократимой записи) не обращается в нуль. А именно, значением дроби (f д€/б[х]) в точке с е К называется число Легко видеть, что операции сложения и умножения дробей соответствуют таким же операциям над определяемыми ими функциями в их общей области определения. ЗАДАЧА 1. Доказать, что если рациональные дроби и над бесконечным полем К определяют функции, совпадающие в их общей области определения, то у- = у-. Рациональная дробь ~ называется правильной, если deg/ < < deg д. Очевидно, что сумма и произведение правильных дробей являются правильными дробями. Предложение 2. Всякая рациональная дробь единственным образом разлагается в сумму многочлена и правильной дроби. Доказательство. Пусть f,g€ ^[х], g ^0. Разделим / на g с остатком в кольце /<[2:]: f = qff + r (q, г е deg г < deg g). (34) Тогда ~9 причем — правильная дробь Пусть теперь 9 = q + La, (35)
144 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ — какое-нибудь другое разложение дроби £ в сумму многочлена и правильной дроби. Тогда г 9' и мы приходим к противоречию, так как ненулевой многочлен не может равняться правильной дроби. □ Многочлен q из равенства (35) называется целой частью дро- би -. 9 Предложение 3. Всякая правильная рациональная дробь вида 9]92---9s’ где д}, д2,..., да попарно взаимно просты, разлагается в сумму правильных дробей со знаменателями д}, д2,..., да. Доказательство. Докажем это утверждение индукцией по s. При s = 2, согласно теореме 5.1, существуют такие многочлены и, и Uj, что + д2и2 = f. Разделив это равенство на д, получим L = %. + 2ft 9 9i 92 ‘ Так как дробь £ правильная, то сумма целых частей дробей у- и — должна быть равна нулю. Выделив их, мы получим разложение 92 г дроби в сумму правильных дробей со знаменателями д} и д2. При з >2 заметим, что многочлены д{ и д2.. ,да взаимно просты, и по доказанному дробь £ разлагается в сумму правильных дробей со знаменателями д} и д2... да. В свою очередь, вторая из этих дробей по предположению индукции разлагается в сумму правильных дробей со знаменателями д2,..., да □ ЗАДАЧА 2. Доказать, что разложение, о котором идет речь в предложении 3, единственно. Изложим теперь теорию, используемую в математическом ана- лизе при интегрировании рациональных функций. Определение 1. Рациональная дробь над полем К назы- вается простейшей, если д = рк, где р Е АДж] — неприводимый многочлен, и deg / < degp. В частности, всякая дробь вида т (а> с е к)
§ 10. ПОЛЕ РАЦИОНАЛЬНЫХ ДРОБЕЙ 145 является простейшей. В случае К = С дробями такого вида исчер- пываются все простейшие дроби. В случае К = R имеются еще простейшие дроби вида где р2 — 4g < 0. Теорема 1. Всякая правильная рациональная дробь ~ раз- лагается в сумму простейших дробей. Более точно, если g = pk'p!p ... рк> — разложение многочлена g на неприводимые множители, то дробь разлагается в сумму простейших дробей со знаменателями 9 k, 9 9 fc Pl, PiГ, • ; Pl , P2, Рг, •••,№>• • ; P„ P,, P,’- Доказательство. Ввиду предложения 3 дробь разлага- ется в сумму правильных дробей со знаменателями р*1, р?\ • •р*'. Поэтому нам достаточно доказать теорему в случае, когда д = рк, где р — неприводимый многочлен. В этом случае, разделив f на р с остатком, мы получим = + deg г < deg р. р р р Второе из слагаемых является простейшей дробью, а первое являет- ся правильной дробью как разность правильных дробей. Продолжая эту процедуру, мы в конце концов разложим дробь в сумму простейших дробей со знаменателями р, р2,.. .,рк. □ р ЗАМЕЧАНИЕ 1. В силу задачи 2 разложение, о котором идет речь в теореме, единственно. Пример 1. Предположим, что д = (а:-с1)(а:-с2)...(а:-сп), где С], С2,..., сп различны. Тогда £ — а1 I °2 I I ап 9 х-с1~гх-с2~г'--'гх-сп> где aj, Oj,..., ап 6 К. Для нахождения а4 умножим обе части предыдущего равенства на д и положим х = ct. Мы получим тогда Ж^аДс, - с,)... (с, - с, + -сп) = а£д'(с,), °ткУДа _
146 Гл. 3. НАЧАЛА АЛГЕБРЫ МНОГОЧЛЕНОВ <36> (при условии, что deg f < deg д). Интересно отметить, что, умножив обе части этого равенства на д, мы получим интерполяционную формулу Лагранжа f _ Л , (* ~с1) • ••(*- с,^_1)(д-с,. + 1)...(д-сп) J ‘(с. -С1) - (сг -С.-1)(С; -Ci + 1)...(C1 -Сп)’ задающую многочлен f степени < п, принимающий в точках си С2,..сп значения Ь2,..Ьп. ЗАДАЧА 3. Доказать равенство 1 = 1 у'1 _5_ Хп - 1 п 'Tq x~ei’ где е0, еп_[ — комплексные корни n-й степени из единицы. ЗАДАЧА 4. Разложить в сумму простейших дробей над полем (р простое) дробь . Пример 2. Метод неопределенных коэффициентов, использо- ванный в предыдущем примере, разумно применять и в более общей ситуации. Разложим, например, в сумму простейших дробей над R рациональную дробь (х + 1)(х2+ 1)2’ Имеем, согласно теореме 1, __________________х_____ __ а , Ьх + с , dx + е (х + 1)(х2 + 1)2 “ * + 1 х2 + 1 + (г2 4- I)2’ где a, b, c,d,e — какие-то вещественные числа. Для их нахождения умножим предыдущее равенство на (г+ l)(rr2+ I)2: х = а(х2 + I)2 + (Ьх + с)(х + 1)(х2 + 1) + (dx + е)(х + 1). Положив в этом равенстве последовательно x = — inx — i, получим — 1 — 4а, i = (di + e)(i + 1) = (е — d) + (d + е)г, откуда _ 1 , _ 1 а — 4, d е — 2' Далее, сравнив свободные члены и коэффициенты при х4, получим О = а + с + е, 0 = а + Ь, откуда , 1 1 о = -г, с — — -г. 4’ 4 Таким образом, X 1 X ~ 1 X 1 (х+ 1)(х2 + I)2 - ~ 4(*+ !) + 4(ж2 + 1) + 2(х2+ I)2 ‘
Глава 4 НАЧАЛА ТЕОРИИ ГРУПП § 1. Определение и примеры В первой главе читатель познакомился с понятием абелевой группы. Абелевыми группами являются, в частности, аддитивная группа любого кольца, мультипликативная группа любого поля и аддитивная группа любого векторного пространства. Важнейшие примеры неабелевых групп появляются как группы преобразова- ний. Назовем преобразованием множества X всякое его отображе- ние в себя. Определение 1. Группой преобразований множества X на- зывается всякая совокупность G его биективных преобразований, удовлетворяющая следующим условиям: 1) если <£, ф G G, то угф G G; 2) если 6 G, то 92_1 G G; 3) id е G. (Здесь обозначает произведение (композицию) преобразова- ний р и ф, a id —тождественное преобразование.) ПРИМЕР 1. Совокупность S(X) всех биективных преобразова- ний множества X является группой преобразований. Если множе- ство X бесконечно, эта группа слишком велика, чтобы быть инте- ресной. Если X конечно, то можно считать, что X = {1,2,.. ., п}; в этом случае группа S(X) называется группой подстановок или симметрической группой степени п и обозначается через Sn. Подстановка <т е Sn может быть записана в виде таблицы а=( А *2 • \ Ji J2 • • Jn / в первой строке которой выписаны в каком-то порядке числа 1,2,..., п, а во второй строке — их образы, т. е. jk = a(ik). Фик- сируя расположение чисел в первой строке (например, располагая
148 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП их в порядке возрастания), мы видим, что число подстановок равно числу перестановок (см. §2.4), т.е. п!. При этом каждая подстановка может быть записана п! способами. Приведем пример на умножение подстановок: ( 1 2 3 4W1 2 3 4\_ ^3 4 1 2J у 4 3 2 1 )~ _(4 3 2 1W1 2 3 4 \ _ ( 1 2 3 4 А — \2 1 4 3J у4 3 2 1 ,/ \2 1 4 3J' (Здесь мы сначала для удобства переписали первую подстановку таким образом, чтобы первая строка в ее записи совпала со второй строкой в записи второй подстановки.) ПРИМЕР 2. Движения евклидовой плоскости Е2 (соответст- венно евклидова пространства Е3) образуют группу преобразова- ний, обозначаемую через Isom£/2 (соответственно Isom£/3). Это свойство является аксиомой в той версии аксиоматики евклидо- вой геометрии, в которой понятие движения является одним из неопределяемых понятий. В другой версии, берущей за основу понятие расстояния между точками, движение определяется как преобразование, сохраняющее расстояния, а сформулированное выше свойство является очевидной теоремой. Замечание 1. В предыдущих главах мы обозначали через Е2 (соответственно Е3) множество векторов евклидовой плоскости (соответственно пространства). Здесь же символ Е2 (соответст- венно Е3) использован для обозначения самой евклидовой пло- скости (соответственно пространства). Впрочем, если в плоскости (соответственно в пространстве) фиксирована некоторая точка о (которую мы будем в дальнейшем называть началом отсчета), то можно договориться отождествлять точки с их радиусами-вектора- ми относительно точки о. Это соглашение часто будет подразуме- ваться в дальнейшем. Замечание 2. В той версии аксиоматики евклидовой геометрии, которая берет за основу понятие движения, утверждение о том, что всякое биективное преоб- разование, сохраняющее расстояния, является движением, является (несложной) теоремой. ПРИМЕР 3. Ввиду свойств линейных отображений, доказанных в § 2.3, биективные линейные преобразования векторного простран- ства V образуют группу преобразований. Она называется полной линейной группой пространства V и обозначается через GL(V). Пример 4. Назовем параллельным переносом векторного про- странства V на вектор а е V преобразование ta: х (->• х + а.
§ 1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 149 Легко видеть, что — ta+bi 1 ~ t-а, = t0. (1) Эти формулы показывают, что совокупность Tran V всех парал- лельных переносов пространства V является группой преобразова- ний. ЗАДАЧА 1. Доказать, что совокупность всех возрастающих непрерывных функций на отрезке [0, 1], удовлетворяющих услови- ям /(0) = 0, /(1) — 1, является группой преобразований отрезка [0,1]. Анализируя свойства операции умножения в группах преобра- зований, мы приходим к следующему понятию группы, которое отличается от понятия абелевой группы отсутствием требования коммутативности. Определение 2. Группой называется множество G с операци- ей умножения, обладающей следующими свойствами: 1) (ab)c = а(Ьс) для любых a, b, с Е G (ассоциативность); 2) существует такой элемент е Е G (единица), что ае — еа — = а для любого аЕ G; 3) для всякого элемента аЕ G существует такой элемент а-1 Е G (обратный элемент), что аа-1 — аг1а — е. Группа называется абелевой или коммутатиеной, если ab = ba Vа, Ь Е G. Данное определение группы использует мультипликативную тер- минологию. Аддитивная терминология обычно используется только для абелевых групп (хотя в принципе операция в группе может называться и обозначаться как угодно). Аналогично тому, как это было сделано для абелевых групп, доказывается единственность единицы и обратного элемента в любой группе. Что касается деления, то в неабелевой группе следует различать левое и правое деления. А именно, для любых a, b Е G уравнение ах — b имеет единственное решение, равное а~1Ь, а уравнение ха=Ь имеет единственное решение, равное Ьа-1. В любой группе (аЬ)~{ — Ь-'а-1. В самом деле, (ab)(b 1 а 1) = a(bb !)а 1 = аа 1 = е.
150 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Всякая группа преобразований является группой относительно операции умножения преобразований. Действительно, ассоциатив- ность этой операции известна, единицей служит тождественное преобразование, а обратным элементом — обратное преобразова- ние. Пример 5. Невырожденные квадратные матрицы порядка п над полем К образуют группу по умножению, обозначаемую GLn(.K). Поскольку имеется взаимно однозначное соответствие между квад- ратными матрицами порядка п и линейными преобразованиями пространства Кп, причем невырожденным матрицам отвечают обратимые линейные преобразования, а умножению матриц соот- ветствует умножение линейных преобразований, группа GLn(.K) изоморфна группе GL(/fn) (и, тем самым, — группе GL(V), где V — любое n-мерное векторное пространство над полем К). Группа GLn(/f) есть группа обратимых элементов кольца Ln(/f) всех матриц. Если А — любое ассоциативное кольцо с единицей, то множество его обратимых элементов также является группой по умножению. Мы будем обозначать эту группу через А*. Частным случаем является мультипликативная группа К* поля К (состо- ящая из всех ненулевых элементов этого поля). Заметим, что K* — QLl(K). ПРИМЕР 6. Как показывают формулы (1), группа Tran V изо- морфна аддитивной группе пространства V. ПРИМЕР 7. Конечная группа может быть задана своей таблицей умножения. Так, множество G = {е, а, Ь, с} с таблицей умножения е а Ь с е а b с е а b с а е с b b с е а с b а е является абелевой группой. В самом деле, элемент е служит ее единицей и каждый элемент обратен сам себе. Далее, легко видеть, что любая перестановка элементов а, Ь, с является автоморфизмом множества G с указанной операцией. Поэтому, если исключить тривиальные случаи с участием единицы и принять во внимание коммутативность, доказательство ассоциативности сводится к про- верке следующих соотношений: a2b = a(ab) = b, (ab)c — а(Ьс) = е.
§ 1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 151 ЗАДАЧА 2. Доказать, что множество G — {А, Б, В, Г, Д, Е} с операцией, заданной таблицей А Б В Г Д Е А Б В Г Д Е Е Д Г В Б А В Г Д Е А Б Б А Е Д Г В Д Е А Б В Г Г В Б А Е Д А Б В Г Д Е является группой, изоморфной S3. ЗАДАЧА 3. Доказать, что если в множестве G с ассоциативной операцией существует такой элемент е (правая единица), что ае = = а для любого аЕ G, и для любого аЕ G существует такой элемент а~' (правый обратный элемент), что аа~1 = е, то G — группа. Определение 3. Подгруппой группы G называется всякое подмножество Н с G, удовлетворяющее следующим условиям: 1) если a, b Е Н, то ab Е Н; 2) если аЕ Н, то а-1 Е Н; 3) е еН. ЗАМЕЧАНИЕ 3. Так как ааГ1 = е, то условие 3) можно заменить требованием непустоты подмножества Н. Очевидно, что всякая подгруппа сама является группой относи- тельно той же операции. Сравнивая определения 1 и 3, мы видим, что группа преобра- зований множества X — это не что иное, как подгруппа группы 3(Х). ПРИМЕР 8. Пусть f — какой-либо многочлен от п переменных. Тогда Sym f = {ст Е Sn: f(xa(l), ..., ха(п}) = f(x{, ®„)} есть подгруппа группы Sn. В самом деле, пусть ст, тЕ Sym/. Положим — уг; тогда /(Ж<гг(1р Ж<гг(2)) • ч Ж<гг(п)) ~/(Уг(1р Уг(2р • • Ч Уг(п)} = У21 > Уп) = = ^(2)> • • •’ ^(п) ) = /(*!, Х„). Остальные две аксиомы подгруппы выполнены очевидным обра- зом. В частности, многочлен / является симметрическим тогда и
152 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП только тогда, когда Sym/ = 5'n. В качестве примера многочлена с менее богатой, но не тривиальной симметрией рассмотрим многочлен f = xtx2 + x3x4 (от 4 переменных). Легко видеть, что группа Sym/ состоит из 8 подстановок, сохраняющих разбиение множества {1,2,3,4} на два подмножества {1,2} и {3,4}. (Допу- скается перестановка этих подмножеств и перестановка элементов в каждом из них; см. по этому поводу также пример 5.11). преобразования простран- заданный многочлен от группы GLn(/f). Линей- преобразования простран- Rn, сохраняющие многоч- :2 называются Рис. 1 ПРИМЕР 9. Аналогично, линейные ства Кп, сохраняющие какой-либо п переменных, образуют подгруппу ные ства лен х2+х£+.. ,+х; ортогональными преобразова- ниями; они образуют подгруппу группы GLn(R), которая назы- вается ортогональной группой и обозначается через Оп. Так как в декартовых координатах пространства Е2 (соответствен- но Е3) многочлен х2 + у2 (со- ответственно х2 + у2 + z2) выра- жает квадрат длины вектора, то ортогональные преобразования пространства Е2 (соответствен- но Е3) — это не что иное, как линейные преобразования, сохраняющие длину вектора. Дадим геометрическое описание ортогональных преобразований простран- ства Е2. Условие с d)E°2 означает, что (ах + by)2 + (сх + dy)2 = х2 + у2, т. е. а2 + с2 — b2 + d2 = i, ab + cd = 0. Из уравнения а2 + с2 — 1 следует, что существует такой угол а, что а — cos а, с = sin а. Оставшиеся два уравнения показывают, что b = ± sin a, d cos а.
§ 1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 153 Таким образом, / \ „ / cos а — sin а 1 ip = . r I sin а cos a J или _ ( cos a sin а А у sin а — cos a ) ' В первом случае, как мы уже знаем (см. пример 2.3.5) р есть поворот на угол а. Во втором случае р — зеркальное отражение относительно прямой I, образующей угол с осью х (см. рис. 1). Эти два случая отличаются друг от друга тем, что в первом случае сохраняет ориентацию плоскости, а во втором — меняет. В гл. 6 будет доказано, что всякое ортогональное преобразование пространства Е3, сохраняющее ориентацию, есть поворот вокруг некоторой прямой. ПРИМЕР 10. Движения евклидовой плоскости, оставляющие на месте начало отсчета о, образуют подгруппу группы Isom Е2. Обозначим ее через Н. Так как сложение векторов и их умножение на числа определяются в геометрических терминах, то всякое движение, оставляющее на месте точку о, является линейным преобразованием. Более того, так как оно сохраняет длины век- торов, то оно является ортогональным преобразованием. Обратно, поскольку расстояние между точками а и b есть длина вектора а— Ь, то всякое ортогональное преобразование сохраняет расстояние между точками и, значит, является движением. Таким образом, Н = О2. Аналогично, группа движений евклидова пространства, оставляющих на месте начало отсчета, совпадает с О3. ПРИМЕР И. Пусть F — какая-либо фигура на евклидовой плоскости. Тогда Sym F = {р е Isom Е2'. <p(F) = F} есть подгруппа группы Isom!?2; она называется группой симме- трии фигуры F. Так, группа симметрии окружности с центром в начале отсчета о есть группа О2. Группа симметрии правильного n-угольника с центром в точке о есть подгруппа группы О2, 2тг состоящая из поворотов вокруг точки о на углы, кратные —, и отражений относительно прямых, проходящих через о и одну из вершин или середину одной из сторон. Таким образом, эта группа содержит 2п элементов (п поворотов и п отражений); она называется группой диэдра и обозначается через Dn. Пример 12. В силу формулы умножения определителей ма- трицы с определителем 1 образуют подгруппу в группе GLn(AT). Эта подгруппа называется унимодулярной группой и обозначается через SLJJQ.
154 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП ПРИМЕР 13. Целочисленные матрицы с определителем 1 об- разуют подгруппу в группе SLn(R), обозначаемую через SLn(Z) (см. задачу 2.5.3). ПРИМЕР 14. Множество невырожденных диагональных матриц порядка п является абелевой подгруппой группы GLn(/f). ЗАДАЧА 4. Доказать, что множество строго треугольных квад- ратных матриц порядка п является подгруппой группы GLn(F’). § 2. Группы в геометрии и физике Цель этого параграфа — дать общее представление о роли групп в геометрии и физике. В XIX в. математики осознали, что евклидова геометрия не является единственной мыслимой геометрией. Даже если принять, что «пространство, в котором мы живем», подчиняется законам евклидовой геометрии (что на самом деле верно лишь в первом при- ближении), имеет смысл изучать геометрию и других пространств, которые возникают в результате математических построений. В связи с этим возникает вопрос, что же в таком случае следует понимать под геометрией. Обобщая различные понятия, рассматри- ваемые в евклидовой геометрии, можно сформулировать различные ответы на этот вопрос. В частности, обобщая понятие группы движений евклидовой геометрии, немецкий математик Клейн в своей лекции 1872 г., получившей известность под названием «Эрлангенская программа», дал определение геометрии как науки, изучающей свойства фигур, инвариантных относительно заданной группы преобразований. Более подробно, пусть задано некоторое множество X и некото- рая группа G его преобразований. Фигуру Ft С X будем считать эквивалентной (или равной, как говорят в элементарной геоме- трии) фигуре F2 С X относительно группы G и писать Ft ~ F2, если существует такое преобразование <р € G, что F2 = <р(Р\). Проверим, что это действительно отношение эквивалентности: 1) F ~ F, так как F = id (F) и id е G; 2) если F] ~ F2, т.е. F2 = где р€ G, то F2 ~ Ft, так как F[ = <p~1(F2) и <p~l е G; 3) если F] ~F2 и F2~F3, т-е- F2 = lP(F\) и ^з = Ф(^2)’ гДе Ф е то Ft ~ F3, так как F3 = ч/хр^) и ч/чр е G. G
§ 2. ГРУППЫ В ГЕОМЕТРИИ И ФИЗИКЕ 155 Мы видим, таким образом, что три аксиомы отношения эк- вивалентности в точности соответствуют трем аксиомам группы преобразований. Одной из задач геометрии является нахождение необходимых и достаточных условий эквивалентности фигур (вспомните признаки равенства треугольников в евклидовой геометрии). Этой цели служат величины, инвариантные относительно преобразований из группы G (такие, как расстояние между точками или мера угла в евклидовой геометрии). Соотношения между этими инвариантами суть геометрические теоремы (например, теорема Пифагора или теорема о том, что медианы треугольника пересекаются в одной точке). Конечно, далеко не любая группа преобразований приводит к интересной и важной для приложений геометрии. Все такие гео- метрии связаны с достаточно богатыми группами преобразований, которых не так много. Минимальным требованием здесь является транзитивность. Определение 1. Группа G преобразований множества X назы- вается транзитивной, если для любых х, уЕ X существует такое преобразование Е G, что у — <^(х). (Это означает, что в соответствующей геометрии все точки эк- вивалентны в смысле данного выше определения эквивалентности фигур.) Пример 1. Группа Tran V параллельных переносов векторного пространства V (см. пример 1.4) транзитивна. В самом деле, для любых х, у Е V имеем У= ty-*x- Однако группа Tran V все еще слишком мала, чтобы определять интересную геометрию. В качестве примера интересной геометрии, отличной от евклидовой, приведем аффинную геометрию. Пусть V — какое-либо векторное пространство, y?eGL(V) и аЕ Е V. Тогда рК/Р"' = W (2) В самом деле, для любого х Е V имеем: №а<Р~')(х) = <Р(<Р~1(х) + а,) = х + у?(а) = t^x. Предложение 1. Для любой подгруппы G CGL(V) множест- во Tran V- G = {tap; aEV, tp Е G} является транзитивной группой преобразований пространст- ва V.
156 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Доказательство. При a, b е V, у?, i^eQL(V) имеем, со- гласно формулам (1) и (2), (ia¥’)(ii,V’) = eTran V G. Отсюда следует, что (i^)-1 = £ Tran V G. Таким образом, Tran V G — группа преобразований. Она транзи- тивна, поскольку уже ее подгруппа Tran V транзитивна. □ В частности, мы можем взять G = GL(V). Полученная группа GA(V) = Tran V-GL(V) (3) называется полной аффинной группой пространства V, а ее элементы — (биективными) аффинными преобразованиями. Свя- занная с ней геометрия называется аффинной геометрией. В случае V = Е2 мы получаем аффинную геометрию евклидовой плоскости. Предложение 2. Группа движений евклидовой плоскости есть подгруппа группы GA(E'2), равная Tran Е2 О2. Доказательство. Прежде всего, заметим, что все парал- лельные переносы и все ортогональные преобразования являются движениями. Пусть теперь f — какое-либо движение. Положим а = /(о). Тогда движение = t~xf оставляет на месте точку о и, значит, принадлежит группе О2 (см. пример 1.10). Таким образом, / = taу? е Tran Е2 • О2. □ Аналогичным образом описывается группа движений евклидова пространства. Следствие. Если фигуры FltF2cE2 равны в евклидовой геометрии, то они равны и в аффинной геометрии. Группа GA(jf?2) не совпадает с группой движений. Примером аффинного преобразования, не являющегося движением, может служить гомотетия (с коэффициентом /±1) или растяжение вдоль какой-либо оси. Таким образом, группа GA(£?2) богаче группы движений, и фигуры, не равные в евклидовой геометрии, могут ока- заться равными в аффинной геометрии. Так, в аффинной геометрии все окружности равны. ЗАДАЧА 1. Доказать, что в аффинной геометрии все треуголь- ники равны.
§ 2. ГРУППЫ В ГЕОМЕТРИИ И ФИЗИКЕ 157 В аффинной геометрии отсутствует понятие расстояния между точками. Однако, как показывает следующая задача, имеется инва- риант трех точек, лежащих на одной прямой. ЗАДАЧА 2. Доказать, что при аффинных преобразованиях со- храняется отношение, в котором точка делит отрезок. Аналогичным образом определяется аффинная геометрия евкли- дова пространства. В рамках группового подхода могут быть построены также проективная и конформная геометрии, геометрия Лобачевского и другие геометрии, используемые в математике и ее приложениях. Группы преобразований в физике описывают симметрию физиче- ских законов, в частности, симметрию пространства-времени. Точка пространства-времени задается тремя пространственными координатами х, у, z и временной координатой t, так что про- странство-время с фиксированной системой отсчета может быть отождествлено с R4. Переход к другой системе отсчета означает некоторое преобразование пространства R4. Как в классической, так и в релятивистской механике (точнее, в специальной теории от- носительности), существует понятие инерциальных систем отсчета, в которых все законы механики имеют одинаковый вид. Переходы от одной инерциальной системы отсчета к другим составляют некоторую группу преобразований пространства R4. Эта группа однозначно определяет законы механики. Отличие релятивистской механики от классической обусловлено тем, что она берет за основу другую группу преобразований. Группа симметрии пространства-времени в классической механи- ке есть группа Галилея, описываемая следующим образом: G = Tran R4 Н • О3, где О3 — группа ортогональных преобразований пространственных координат, а Н — группа преобразований вида (х, у, z, t) (х + at, у + bt, z + ct, t), соответствующих переходу к новой системе отсчета, равномерно и прямолинейно движущейся относительно старой. Из этого опи- сания группы Галилея видно, что в классической механике время абсолютно в том смысле, что разность временных координат двух событий одинакова во всех инерциальных системах отсчета. Согласно представлению релятивистской механики, группа сим- метрии пространства-времени есть группа Пуанкаре G = Тгап R4 • О3>1,
158 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Рис. 2
§ 3. ЦИКЛИЧЕСКИЕ ГРУППЫ 159 где 03 [ — группа линейных преобразований, сохраняющих многоч- лен х2 + у2 + z2- — t2 (в системе единиц, в которой скорость света равна 1). Группа О3 j содержит группу О3, не затрагивающую временной координаты. Нетривиальным примером преобразований из О33 могут служить преобразования Лоренца (z, у, z, t) (х ch а + t sh а, у, z, х sh а + t ch а), перемешивающие пространственные и временные координаты. Вид этих преобразований показывает, что в релятивистской механике время не абсолютно. Группа Пуанкаре была описана в работах Лоренца и Пуанкаре как группа симметрии законов электродинамики (уравнений Макс- велла). Заслуга Эйнштейна состояла в том, что он имел смелость сделать вывод, что и законы механики должны иметь ту же группу симметрии. Группы преобразований лежат также в основе кристаллогра- фии и теории элементарных частиц. Так, в кристаллографии они описывают симметрию кристаллических структур и, тем самым, физических свойств кристаллов. (См. рис. 2, где изображены кристаллические структуры поваренной соли, алмаза и графита.) § 3. Циклические группы Так же, как в группе R*, в любой группе G могут быть определены степени элемента д е G с целыми показателями: ' дд ...д, если к > 0 k дк = < е, если к — 0 д~1д~1 ... g-1, если к <0 . -k Имеет место свойство дкд‘=дк + ‘- (4) Это очевидно, если к, I > 0. Рассмотрим случай, когда к > 0, I < 0, к + I > 0. Тогда gkgl -- gg-^-gj 'д '^.-д [ = gg• • - g = gk+l- к -l к + l Аналогично рассматриваются остальные случаи.
160 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Из (4) следует, что (5*)“‘ =д~к- Кроме того, е = д° по определению. Таким образом, степени элемен- та д образуют подгруппу в группе G. Она называется циклической подгруппой, порожденной элементом д, и обозначается через (д). Возможны два принципиально разных случая: либо все степени элемента д различны, либо нет. В первом случае подгруппа (д) бесконечна. Рассмотрим более подробно второй случай. Пусть дк ~д‘, к > I; тогда дк~1 = е. Наименьшее из натуральных чисел т, для которых дт = е, называется в этом случае порядком элемента д и обозначается через ord д. Предложение 1. Если ord д = п, то 1) дт = е <=> п | т; 2) дк — д‘ <=> к = / (mod п). Доказательство. 1) Разделим т на п с остатком: т = qn + г, 0 г < п. Тогда в силу определения порядка 5т = (5")’• 5Г =5Г = е <=> г = 0. 2) В силу предыдущего дк = д! <=> дк~‘ = е <=> п | (fc — I) <=> к = I (mod п). □ Следствие. Если ord д = п, то подгруппа (д) содержит п элементов. Доказательство. Действительно, <5) = {е, 9, 92, •••№'}, (5) причем все перечисленные элементы различны. □ В том случае, когда не существует такого натурального т, что дт = е (т. е. имеет место первый из описанных выше случаев), полагают ord д — оо. Отметим, что ord е — 1; порядки же всех остальных элементов группы больше 1. В аддитивной группе говорят не о степенях элемента д, а о его кратных, которые обозначают через кд. В соответствии с этим порядок элемента д аддитивной группы G — это наименьшее из натуральных чисел т (если такие существуют), для которых тд = д + д +--1-5 = 0. m
§ 3. ЦИКЛИЧЕСКИЕ ГРУППЫ 161 ПРИМЕР 1. Характеристика поля (см. §1.6) есть порядок лю- бого ненулевого элемента в его аддитивной группе. ПРИМЕР 2. Очевидно, что в конечной группе порядок любого элемента конечен. Покажем, как вычисляются порядки элементов группы Sn. Подстановка т е Sn называется циклом длины р и обозначается через (г^... гр), если она циклически переставляет г’1, &2,..., гр, т.е. т(г1) = ij, т(^) = %, ...,т(гр) = ij, а все остальные числа оста- вляет на месте. Очевид- но, что порядок цикла дли- ны р равен р. Циклы тх и т2 называются независи- мыми, если среди факти- чески переставляемых ими чисел нет общих; в этом случае TjT2 = т2т{. Всякая подстановка однозначно разлагается в произведение независимых циклов. Например, 1 2 3 5 6 7 а — 4 8 3 2 1) =(2637)(158), что наглядно показано на рис. 3, где действие подстановки а изо- бражено стрелками. Если подстановка а разлагается в произведе- ние независимых циклов длин рх, р^, ..., ps, то ord<r = HOK {px,P2,...,ps}. Например, для подстановки а, изображенной на рис. 2, ord<7 = 12. Задача 1. Доказать, что порядок любого элемента группы Sn не превосходит числа е"/' « 1,44п. ПРИМЕР 3. Порядок комплексного числа с в группе С* конечен тогда и только тогда, когда это число есть корень некоторой степени из единицы, что, в свою очередь, имеет место тогда и только тогда, когда |с| = 1, a arg с соизмерим с тг, т.е. е Q. О Задача 2. Доказать, что arctg несоизмерим с тг. Пример 4. Найдем элементы конечного порядка в группе Isom Е2 движений плоскости. Пусть р е Isom Е2, <рп = id. Для любой точки р G Е2 точки Р, РР, Р2Р, <рп~'р
162 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП циклически переставляются движением <р, так что их центр тяже- сти о неподвижен относительно <р. Следовательно, <р — либо пово- 2 ~к рот на угол вида вокруг точки о, либо отражение относительно некоторой прямой, проходящей через о. ПРИМЕР 5. Найдем порядок матрицы как элемента группы GL2(R). Имеем “j), А3 = -Е, откуда А4 = -А, А5 = ~А2, А6 = -А3 — Е, так что ord А =6. Конечно, этот пример специально подобран: веро- ятность того, что порядок наудачу выбранной матрицы А е GL2(R) будет конечен, равна нулю. Предложение 2. Если ord g = п, то ord дк = , w,,. (6) (п, К) ' ' Доказательство. Пусть (n, k) = d, n — n{d, к — ktd, так что (пи fcj = 1. Имеем (дк)т = е <=> п | кт <=> П] | к{т <=> nt | т. Следовательно, ord дк = гц. □ Определение 1. Группа G называется циклической, если су- ществует такой элемент д € G, что G = (д). Всякий такой элемент называется порождающим элементом группы G. ПРИМЕР 6. Аддитивная группа Z целых чисел является цикли- ческой, так как порождается элементом 1. ПРИМЕР 7. Аддитивная группа Zn вычетов по модулю п явля- ется циклической, так как порождается элементом [1]. ПРИМЕР 8. Мультипликативная группа Сп комплексных корней n-й степени из 1 является циклической. В самом деле, эти корни суть числа 2тгА: , - 2тгА: ,, n i 1 \ ek — cos + г sin (к =0, 1,..., п — 1). Ясно, что ек = ек. Следовательно, группа Сп порождается элемен- том е,.
§ 3. ЦИКЛИЧЕСКИЕ ГРУППЫ 163 ЗАДАЧА 3. Доказать, что группа Z* обратимых элементов кольца Zn (см. задачу 1.6.1) является циклической при п < 7 и не является циклической при п = 8,9. Легко видеть, что в бесконечной циклической группе G = (д) порождающими элементами являются только д и д~'. Так, в группе Z порождающими элементами являются только 1 и — 1. Число элементов конечной группы G называется ее порядком и обозначается через |G|. Порядок конечной циклической группы равен порядку ее порождающего элемента. Поэтому из предложе- ния 2 следует Предложение 3. Элемент gk циклической группы G = {д) порядка п является порождающим тогда и только тогда, когда (п, k) = 1. ПРИМЕР 9. Порождающие элементы группы Сп (см. пример 8) называются первообразными корнями п-й степени из 1. Это корни вида ек, где (п, к)~ 1. Например, первообразные корни 12-й степени из 1 —это е5, е7, ен. Циклические группы — это наиболее простые группы, которые можно себе представить. (В частности, они абелевы.) Следующая теорема дает их полное описание. Теорема 1. Всякая бесконечная циклическая группа изо- морфна группе Z. Всякая конечная циклическая группа порядка п изоморфна группе Zn. Доказательство. Если G = (д) — бесконечная цикличе- ская группа, то в силу формулы (4) отображение f: Z —> G, k ^~> gk, есть изоморфизм. Пусть G = (д) — конечная циклическая группа порядка п. Рас- смотрим отображение /:Zn^G, (fceZ). Так как [fc] = [Z] <=> k = l (mod n) <=> gk = gl, то отображение f корректно определено и биективно. Свойство f(k + l) = f(k)f(l) вытекает из той же формулы (4). Таким образом, f — изомор- физм. □ Для понимания строения какой-либо группы важную роль играет знание ее подгрупп. Все подгруппы циклической группы могут быть легко описаны.
164 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Теорема 2. 1) Всякая подгруппа циклической группы явля- ется циклической. 2) В циклической группе порядка п порядок любой подгруппы делит п и для любого делителя q числа п существует ровно одна подгруппа порядка q. Доказательство. 1) Пусть G — (у) — циклическая группа и Н — ее подгруппа, отличная от {е}. (Единичная подгруппа, очевидно, является циклической.) Заметим, что если g~m 6 Н для какого-либо т е N, то и дт Е Н. Пусть т — наименьшее из натуральных чисел, для которых дт € Н. Докажем, что Н = {дт). Пусть gk Е Н. Разделим к на т с остатком: к = дт + г, О г < т. Имеем дг = дк(дт)-чеН, откуда в силу определения числа т следует, что г = 0 и, значит, дк=(дт)9. 2) Если |G| — п, то предыдущее рассуждение, примененное к к — п (в этом случае дк = е Е Н), показывает, что п = qm. При этом Н = { е, дт, д2т,..., д<-ч~1)т}, (7) и Н является единственной подгруппой порядка q в группе G. Обратно, если q — любой делитель числа п и п — qm, то под- множество Н, определяемое равенством (7), является подгруппой порядка q. □ Следствие. В циклической группе простого порядка любая неединичная подгруппа совпадает со всей группой. ПРИМЕР 10. В группе Z всякая подгруппа имеет вид mZ, где т 0. ПРИМЕР 11. В группе Сп корней n-й степени из 1 любая подгруппа есть группа Cq корней g-й степени из 1, где q | п. §4. Системы порождающих Пусть S — какое-либо подмножество группы G. Обозначим через (S) совокупность всевозможных произведений вида gi'g? • • • gk (ft, ft, • • -Л е S; еь е2,..efc = ±1). (8)
§ 4. СИСТЕМЫ ПОРОЖДАЮЩИХ 165 Это наименьшая подгруппа группы G, содержащая S. В самом деле, если какая-либо подгруппа содержит S, то она содержит и все указанные произведения. С другой стороны, само множество (S) является подгруппой, как показывают следующие равенства: (9\'92 • • Л‘)(5*‘++115к++2 • • • 9к + \) = 9\'92 • 5t‘++i, = 9~О • • • 92 ^д^- Говорят, что (S) — подгруппа, порожденная подмножеством S. В частности, если S состоит из одного элемента д, то (S) — = (д) есть циклическая подгруппа, порожденная элементом д в том смысле, как это было определено в предыдущем параграфе. ЗАМЕЧАНИЕ 1. Удобно считать, что в число произведений (8) входит пустое произведение (к =0), которое по определению равно е. Определение 1. Говорят, что группа G порождается своим подмножеством S или что S — система порождающих (элемен- тов) группы G, если G = (S). Конечно, любая группа G порождается подмножеством S — G, однако представляет интерес найти возможно меньшую систему порождающих. Пример 1. Группа диэдра Dn (см. пример 1.11) порождается поворотом р на угол и (любым) отражением -ф е Dn. В самом деле, р порождает циклическую подгруппу Сп всех поворотов, содержащихся в группе Dn; умножая элементы этой подгруппы на ф, мы получим все отражения, входящие в группу Dn. Два важных примера систем порождающих содержатся в приво- димых ниже теоремах. Подстановка, являющаяся циклом длины 2 (см. пример 3.2), называется транспозицией. Теорема 1. Группа Sn порождается транспозициями. Доказательство. Отметим, что каждая транспозиция об- ратна сама себе. Поэтому утверждение теоремы означает, что любая подстановка разлагается в произведение транспозиций. Умножение подстановки слева на транспозицию (ij) вызывает перестановку i и j в нижней строке. Такая операция также называется транспозицией. Очевид- но, что путем последовательных транспозиций любую перестановку
166 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП (fc,, А^,..., fcn) можно привести к тривиальной: сначала, если fcj /1, меняем местами и 1, ставя тем самым 1 на первое место, затем ставим 2 на второе место и т. д. Таким образом, существуют такие транспозиции ти т2, ..т„ что Т, • • • T2T,67 = id и, значит, ff = TlT2...Ts. □ ЗАДАЧА 1. Доказать, что группа Sn порождается смежными транспозициями (12), (23),..., (п — 1 п), причем минимальное число смежных транспозиций, в произведение которых может быть разложена подстановка а Е Sn, равно числу инверсий в нижней строке ее стандартной записи (9). Теорема 2. Группа QLn(K) порождается элементарными матрицами. (Определение элементарных матриц см. в §2.1) Доказательство. Отметим, что матрица, обратная к эле- ментарной, также элементарна (см. §2.1). Поэтому утверждение теоремы означает, что любая невырожденная матрица разлагается в произведение элементарных матриц. Умножение матрицы А Е GLn(K) слева на элементарную ма- трицу вызывает соответствующее элементарное преобразование ее строк. Мы знаем, что с помощью элементарных преобразований строк любую невырожденную матрицу можно привести к еди- ничной матрице. Таким образом, существуют такие элементарные матрицы CTj, U2, ..., U„ что Us ... U2UXA = Е и, значит, А = CTf'CTf1 ... СТ,"1. □ ЗАДАЧА 2. Доказать, что группа SL^Z) (см. пример 1.13) порождается матрицами р _ fO -1\ о _ (0 -1 \ "“^1 1 J’ о)- ЗАДАЧА 3. Доказать, что группа движений плоскости порож- дается отражениями относительно прямых. (Указание: доказать вначале, что каждый поворот и каждый параллельный перенос являются произведениями двух отражений.)
§ 5. РАЗБИЕНИЕ НА СМЕЖНЫЕ КЛАССЫ 167 § 5. Разбиение на смежные классы Пусть G — группа и Н — ее подгруппа. Будем говорить, что элементы дх, д2е G сравнимы по модулю Н, и писать 5i = д2 (mod Я), если <7Г‘52еЯ, (10) т.е. g2 — gth, где h с Н. Это определение обобщает определение сравнимости целых чисел по модулю п, которое получается в случае G = Z, Н = nZ. Докажем, что определенное таким образом отношение сравнимо- сти по модулю Н является отношением эквивалентности: 1) д = д (mod Н), так как д~'д = е е Н; 2) если дх ~ д2 (mod Я), т. е. g^lg2 Е Н, то д2 = д{ (mod Я), так как =(5Г1&)“1 € 3) если дх = д2 (mod Я) и д2 = д3 (mod Я), т. е. д;1д2, д2'д3 е Я, то д, = д3 (mod Я), так как 5Г‘Зз = (5Г152)(Яг“15з) Н- Классы этой эквивалентности называются (левыми) смежными классами группы G по подгруппе Я. Ясно, что смежный класс, содержащий элемент д, имеет вид gH = {gh; heH}. Одним из смежных классов является сама подгруппа Я. Поскольку умножение в группе не обязано быть коммутативным, мы получим, вообще говоря, другое отношение эквивалентности, взяв вместо условия (10) аналогичное ему условие 525Г!еЯ. (11) Классы этой эквивалентности называются правыми смежными классами группы G по подгруппе Я. Они имеют вид Hg = {hgi heH}. Заметим, что инверсия д*-+ д~1 устанавливает взаимно однознач- ное соответствие между множествами левых и правых смежных классов. А именно, (дН)~1 = Нд~1.
168 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП ПРИМЕР 1. Смежные классы аддитивной группы С по подгруп- пе R изображаются на комплексной плоскости прямыми, парал- лельными вещественной оси (рис. 4, а). Пример 2. Смежные классы мультипликативной группы С* по подгруппе R* положительных чисел — это лучи, исходящие из начала координат (рис. 4, б). Рис. 4, а) Рис. 4, б) Рис. 4, в) Пример 3. Смежные классы группы С* по подгруппе T = {zeC: И = 1} — это окружности с центром в начале координат (рис. 4, в). Пример 4. В случае G = GLn(/f), Н = SLn(K) (см. при- мер 1.12) условие (10), равно как и (11), означает, что det = det д2. Поэтому левые смежные классы в данном случае совпадают с правыми (хотя группа GLn(/f) не абелева); каждый из них пред- ставляет собой совокупность всех матриц с определителем, равным какому-либо фиксированному числу. Пример 5. В группе G = Sn рассмотрим подгруппу Н, состоя- щую из подстановок, оставляющих на месте число п. Подстановки (ТрСТгЕ Sn принадлежат одному левому смежному классу по Н, если <71-1о’2(п) — п, т.е. если <7i(n) = а2(п). Следовательно, имеется п левых смежных классов Р{, Р2, . . Рп, где Рк = {аЕ Sn: <т(п) = к}. В то же время подстановки а2 € Sn принадлежат одному правому смежному классу, если crgcrj-1 (п) = тг, т.е. если
§ 5. РАЗБИЕНИЕ НА СМЕЖНЫЕ КЛАССЫ 169 Следовательно, имеется п правых смежных классов Q,, Q2,..Qn, где = {ст е Sn: a(k) — n}. Мы видим, что правые смежные классы отличны от левых (за исключением Qn = Рп — Н). Множество левых смежных классов группы G по подгруппе Н обозначается через G/Н. Число смежных классов группы G по Н (левых или правых, безразлично), если оно конечно, называется индексом подгруппы Н и обозначается через \G : Н\. Теорема 1 (теорема Лагранжа). Если G —конечная группа и Н — любая ее подгруппа, то \G\ = \G:H\\H\ Доказательство. Все смежные классы дН содержат одно и то же число элементов, равное \Н |. Поскольку они образуют раз- биение группы G (как классы эквивалентности), порядок группы G равен произведению их числа на \Н |. □ Следствие 1. Порядок любой подгруппы конечной группы делит порядок группы. Мы уже видели это в случае циклических групп (теорема 3.2). Следствие 2. Порядок любого элемента конечной группы делит порядок группы. Доказательство. Это вытекает из следствия 1 и того, что порядок элемента равен порядку порождаемой им циклической подгруппы. □ Следствие 3. Всякая конечная группа простого порядка является циклической. Доказательство. В силу следствия 1 такая группа должна совпадать с циклической подгруппой, порожденной любым элемен- том, отличным от единицы. □ Следствие 4. Если |G| — п, то дп = е для любого д Е G. Доказательство. Пусть ordд — т. В силу следствия 2 имеем т | п. Значит, дп = е. □ Пример 6. Если р— простое число, то мультипликативная группа Z* поля Zp есть (абелева) группа порядка р - 1. Следо- вательно, др~1 — 1 для любого элемента д е Z*. Это означает, что ap_1 = 1 (modp)
170 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП для любого целого числа а, не делящегося на р. Последнее утверждение есть так называемая малая теорема Ферма. (Другой способ ее доказательства см. в задаче 1.6.2.) Для любого п порядок группы Z* обратимых элементов кольца Zn, равный количеству чисел в ряде 1,2, ...,п, взаимно простых с п (см. задачу 1.6.1), обозначается через р(п). Функция у>, определенная таким образом на множестве натуральных чисел, называется функцией Эйлера. Применение следствия 4 к группе Z* дает а’’(п) = 1 (mod п) для любого целого числа а, взаимно простого с п. Это обобщение малой теоремы Ферма называется теоремой Эйлера. Например, легко видеть, что 125) = 125 — 25 — 100. Отсюда следует, что 2100 = 1 (mod 125) — результат, полученный нами в примере 1.6.7 прямым вычислением. Разбиение на смежные классы естественно возникает при изуче- нии групп преобразований. Пусть G — группа преобразований множества X. Будем гово- рить, что точки х, у е X эквивалентны относительно G, и писать х ~ у, если существует такой элемент д е G, что у = дх. Это частный случай эквивалентности фигур, определенной в § 2, и, сле- довательно, — отношение эквивалентности. Класс эквивалентности точки х е X называется ее орбитой. Иначе говоря, орбита точки х есть множество Gx = {gx: де G}. В частности, транзитивные группы преобразований (см. опреде- ление 2.1) — это группы преобразований, имеющие единственную орбиту. Подгруппа Gx = {ge G: дх = х} называется стабилизатором точки х. ПРИМЕР 7. Группа движений евклидовой плоскости транзитив- на. Стабилизатором начала отсчета является ортогональная группа О2 (см. пример 1.10). Пример 8. Орбиты группы О2 суть окружности с центром в начале отсчета о и сама точка о. Стабилизатор точки р о состоит из тождественного преобразования и отражения относительно прямой ор, а стабилизатор точки о — это вся группа О2. Пример 9. Группа Sn транзитивна на множестве {1,2,..., п}. Стабилизатор числа п есть подгруппа рассмотренная в примере 5.
§ 5. РАЗБИЕНИЕ НА СМЕЖНЫЕ КЛАССЫ 171 Следующая теорема является обобщением (первой части) приме- ра 5. Теорема 2. Имеется взаимно однозначное соответствие между орбитой Gx и множеством смежных классов G/Gx, при котором точке y = gxe Gx соответствует смежный класс gGx. Доказательство. При дх, д2 е G имеем 51=52(modGI) <=> gf‘g2 е Gx <=> д;1д2х = х дхх = д2х. Таким образом, элементы одного смежного класса группы G по Gx характеризуются тем, что они переводят точку х в одну и ту же точку. Более точно, все элементы смежного класса gGx, и только они, переводят точку х в точку у — дх. Тем самым и установлено искомое соответствие. □ Число элементов орбиты Gx, если оно конечно, называется ее длиной и обозначается через | Gx|. Следствие. Если G—конечная группа, то |G| = |Gx||GJ. (12) Из этой формулы следует, что порядки стабилизаторов всех точек орбиты одинаковы. На самом деле имеется точная связь между стабилизаторами точек одной орбиты, не зависящая от конечности группы G. Мы сформулируем ее в виде задачи. ЗАДАЧА 1. Доказать, что G^gG^-'. Пример 10. Пусть К с Е3— куб. Рассмотрим группу его симметрии G = Sym К = {<р е Isom Е3-. р(К) = К}. Очевидно, что это конечная группа. Более того, симметрия куба полностью определяется тем, как она переставляет его вер- шины. Поэтому мы можем рассматривать группу G как группу преобразований множества V вершин куба К. Ввиду того что куб является правильным многогранником, любую вершину куба можно перевести в любую другую с помощью преобразования из группы G. Иначе говоря, группа G транзитивна на множестве V. Следовательно, |G|=8|GJ, где v — какая-либо вершина. Аналогичным образом, рассматривая
172 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП группу Gv как группу преобразований множества ребер, выходящих из v, можно показать, что |GJ = 3|GJ, где Gv е — стабилизатор в группе Gv какого-либо ребра е, выходящего из V. Группа Gv е состоит из тожде- ственного преобразования и отраже- ния относительно плоскости, прохо- дящей через центр куба и ребро е (см. рис. 5). Таким образом, |Sym JC| = 8-3 -2 = 48. ЗАДАЧА 2. Получить тот же ре- Рис- 5 зультат еще двумя способами, рас- смотрев группу Sym К как группу преобразований множества граней и множества ребер куба соответственно. Аналогичным образом можно найти порядки групп симметрии других правильных многогранников (см. рис. 6). (По поводу опре- деления правильных многогранников см. § 7.3.) Рис. 6
§ 5. РАЗБИЕНИЕ НА СМЕЖНЫЕ КЛАССЫ 173 Пример И. Пусть G — группа преобразований алгебры мно- гочленов K[xt, х^ Хз, х4], состоящая из всевозможных перестано- вок переменных xt,x2,x3,x4. Группа G изоморфна S4 и, следо- вательно, |G| = 4! — 24. Рассмотрим многочлен / = х^ + а^х4. Перестановками переменных из него можно получить 3 многочлена Х1Х2 + Х3Х4, Х1Х3 + Х2Х4, Х}Х4 + ХзХз. Это означает, что \ Gf\ =3. По формуле (12) находим Заметим, что, если отождествить группу G с группой S4, то G, будет не чем иным, как подгруппой, обозначенной в примере 1.8 через Sym/. Отношение сравнимости по модулю п в аддитивной группе целых чисел согласовано с операцией сложения, что позволяет определить операцию сложения в фактормножестве. Аналогичным образом можно определить операцию в множестве смежных клас- сов группы по подгруппе и в других случаях, но не всегда. Определение 1. Подгруппа Н группы G называется нормаль- ной, если gH = Нд VgeG (13) или, что эквивалентно, дНд-'=Н VgeG. (14) В этом случае пишут Н < G (или G > Н). Для того чтобы подгруппа Н была нормальной, достаточно (но не необходимо), чтобы каждый элемент группы G был перестановочен с каждым элементом из Н. В частности, в абелевой группе любая подгруппа нормальна. Теорема 3. Отношение сравнимости по модулю подгруппы Н согласовано с операцией умножения в группе G тогда и только тогда, когда подгруппа Н нормальна. Доказательство. Согласованность отношения сравнимо- сти по модулю Н с операцией умножения означает следующее; 9\ = g'i (mod Я), g2 = g2 (mod H) => gxg2 = g{g!> (mod H) или, что эквивалентно, для любых g^ g2e G и hx, h^e Н (9iM(ftM = 5192 (mod H)-
174 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Последнее условие, согласно определению, переписывается в виде д21\д2еН. Так как д2 может быть любым элементом группы G, a hx — любым элементом подгруппы Н, то это равносильно условию нормальности (14). □ ЗАДАЧА 3. Доказать, что всякое отношение эквивалентности в группе, согласованное с операцией, есть отношение сравнимости по модулю некоторой (нормальной) подгруппы. Таким образом, если Н <1 G, то операция умножения в группе G определяет операцию умножения в множестве G/Н по правилу (д}Н)(д2Н) = дхд2Н. Эта операция наследует ассоциативность операции в группе G. Для нее имеется единица — смежный класс еН. Каждый смежный класс дН имеет обратный, а именно д~'Н. Следовательно, G/H — группа. Эта группа называется факторгруппой группы G по Н. Очевидно, что если группа абелева, то любая ее факторгруппа также абелева. Пример 12. Факторгруппа Z/nZ есть группа вычетов Zn. ПРИМЕР 13. Смежные классы группы Спой (см. пример 1) суть прямые La — {z: Im z = а} (а € R). Операция сложения в С/R задается формулой La + Lb — La+b, так что факторгруппа C/R изоморфна группе R. ПРИМЕР 14. Смежные классы группы С* по Т (см. пример 3) суть окружности СТ = {z е С: |z| — г} (г >0). Операция умножения в С/Т задается формулой CrCs = Сп, так что факторгруппа С/Т изоморфна группе R*. Пример 15. Как мы видели выше (см. пример 4), левые смежные классы группы GLn(A”) по SLn(J0 совпадают с правыми и имеют вид Ма — {А eGLn(K): det А = а} (аеК*). Следовательно, SLn(K) — нормальная подгруппа. Операция умно- жения в факторгруппе задается формулой МаМь = МаЬ, так что факторгруппа GLn(K')/SLn(K') изоморфна К*. Пример 16. Подгруппа Н (изоморфная S’n_1) группы Sn, рас- смотренная в примере 5, не является нормальной при п 3.
§ 6. ГОМОМОРФИЗМЫ 175 ЗАДАЧА 4. Доказать, что всякая факторгруппа циклической группы является циклической. ЗАДАЧА 5. Доказать, что группа диагональных матриц не явля- ется нормальной подгруппой группы GLn(AT) при п^2 и |Л’| 3. § 6. Гомоморфизмы Связи между различными алгебраическими структурами одного типа устанавливаются при помощи гомоморфизмов. Понятие го- моморфизма отличается от понятия изоморфизма тем, что оно не требует биективности. В одном случае мы уже встречались с этим понятием. А именно, гомоморфизмы векторных пространств — это не что иное, как их линейные отображения. Дадим точное определение гомоморфизма групп. Определение 1. Гомоморфизмом группы G в группу Н назы- вается отображение /: G —> Н, удовлетворяющее условию f(ab) = f(a)f(b) Va,beG. Установим некоторые общие свойства гомоморфизмов групп. 1) Де) = е. В самом деле, пусть Де) =heH; тогда /i2 = /(e)2 = /(e2) = /(e) = /1, откуда h = е. 2) Да-1) = /(а)-1, ибо /(а)/(а-‘) = Даа-1) = Де) = е. 3) Im f — {f(a): а е G} есть подгруппа группы Н (называемая образом гомоморфизма /). Это следует из определения гомомор- физма и предыдущих свойств. 4) Кег/ = {ае G: f(d) = e} есть нормальная подгруппа группы G (называемая ядром гомоморфизма /). Действительно, а, Ь е Ker f ==> f(ab) — f(d)f(b) = е2 — е ==> ab е Кег/, ае Кег/ => /(а-1) =/(а)-1 = е-1 = е => а-1 е Кег/, е е Кег /, аеКег/, geG => /(gag-1) = f(g)f(a)f(g)~l = = f(g)e/(g)~’ = Дд)Дд)"‘ = е => 6 Кег /.
176 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП 5) /(91) = /(9г) 9i = ff2(mo<i Кег/); в частности, гомоморфизм / инъективен тогда и только тогда, когда Кег / = {е}. Действитель- но, /(^i) = /(P2) f(9il9z) = e & 5ГЧбКег/ gt = g2(mod Кег/). Таким образом, гомоморфизм /: G —> Н является изоморфизмом (т. е. биективен) тогда и только тогда, когда Im / — Н и Кег / = — {е}. В этом случае иногда пишут /: G—^H. Если группы G и Н изоморфны (т. е. существует изоморфизм f:G^+ Н), то пишут G-H. Гомоморфизм группы в себя называется ее эндоморфизмом. Изоморфизм группы на себя называется ее автоморфизмом. Пример 1. Пусть К — произвольное кольцо. Свойство дистри- бутивности а(Ъ + с) — ab + ас означает, что отображение х нм ах (умножение слева на а) является эндоморфизмом аддитивной группы кольца К. (Аналогичное утверждение справедливо и для умножения справа.) Пример 2. Пусть G — произвольная аддитивная (соответст- венно мультипликативная) абелева группа. Тогда для любого п 6 Z отображение х н-> пх (соответственно х хп) является эндомор- физмом группы G. (Для неабелевой группы это, вообще говоря, неверно.) В случае G — С* ядром этого гомоморфизма является группа Сп корней n-й степени из 1. Пример 3. Согласно основному свойству экспоненты, отоб- ражение гм е1 является гомоморфизмом аддитивной группы К в мультипликативную группу К*. Его образ — это подгруппа R^. положительных чисел, а ядро тривиально. ПРИМЕР 4. Отображение х н-> cos х + г sin х является гомомор- физмом группы R в группу С*. Его образ есть Т, а ядро — 2?rZ. Пример 5. Формула умножения определителей означает, что отображение det: GLn(AT) -м К*, А нм det А, является гомоморфизмом. Его ядро — это унимодулярная группа SLn(tf). Пример 6. Назовем знаком подстановки ст G 5П и обозначим через sgn ст произведение знаков верхней и нижней перестановки в ее записи (см. пример 1.1): sgn( J j • • • у" ) = sgn(z,, 4,..., гп) • sgn(/, j2,..., jn). \ J\ J2 • • • Jn /
§ 6. ГОМОМОРФИЗМЫ 177 Это произведение не зависит от способа записи подстановки а, так как от любого способа записи можно перейти к любому другому последовательными транспозициями столбиков, а при каждой та- кой транспозиции одновременно меняются знаки верхней и нижней перестановок, так что их произведение сохраняется. Основное свойство знака состоит в том, что отображение sgn: Sn —»С2 = {±1}, ст i—> sgn ст, является гомоморфизмом. В самом деле, перемножая подстановки <т и т, мы можем считать, что верхняя перестановка в записи ст совпадает с нижней перестановкой в записи т: т — ( i\ Ч • in \ 3\ Зч • • • Зп Тогда так что sgn стт = sgn(tj, 4,..., in) sgn(fc„ к2,..., кп) = = [sgn(z1, 4,..., г„) sgn(ji, 4,..., J„)]x X [sgn(j\, j2,..., jn) sgn(k}, k2,..., fc„)] = = sgn T Sgn CT = Sgn CT • Sgn T. Ядро гомоморфизма sgn называется знакопеременной группой и обозначается через Ап. Употребляется также следующая тер- минология: подстановки ст, для которых sgn а — 1 (соответственно sgn а = —1), называются четными (соответственно нечетными). Таким образом, Ап — это подгруппа четных подстановок. ЗАДАЧА 1. Вывести следующую формулу для знака цикличе- ской подстановки: sgn(4v - гр) = (-1)р-‘ Пользуясь этим, доказать, что знак любой подстановки равен (—1)т-’, где т—число фактически переставляемых ею (т.е. не оставляемых на месте) символов, as — число независимых циклов, в произведение которых она разлагается. Теорема 1 (о гомоморфизме групп). Пусть f: G —> Н — гомо- морфизм групп. Тогда Im/^G/Кег/.
178 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Более точно, имеется изоморфизм у>: Im/^G/Кег/, ставящий в соответствие каждому элементу h — f(g) G Im/ смежный класс g Кег /. Доказательство. Доказательство этой теоремы аналогично доказательству теоремы 5.2. Из доказанного выше свойства 5) следует, что все элементы смежного класса дКег/, и только они, переходят при гомоморфизме / в элемент h — f(g) G Im /. Тем самым показано, что отображение р, о котором идет речь в теореме, корректно определено и биективно. Остается проверить, что р — гомоморфизм. Пусть ffj, g2 G G, f(gx) = hv f(g2) = h2. Тогда /(fl^) = hih2n ^(/i1M = PifeKer/ = (p, Ker/)(g2 Ker/) = что и требовалось доказать. □ Следствие!. Если группа G конечна, то |G| = | Im/|| Ker/|. (Интересно сравнить эту формулу с формулой (12). Пример 7. Рассмотрим гомоморфизм /: С—» К, zwlmz. Имеем Im / — R, Кег / = R, так что C/R~R — результат, уже полученный нами в примере 5.13. Пример 8. Рассмотрим гомоморфизм /:C*^R;, z^[z[. Имеем Im / = R‘, Кег / =Т = {z G С‘: |z| = 1}, так что C7T-R’ — результат, уже полученный нами в примере 5.14. Пример 9. Отображение /:С*—>Т, z~^,
§ 6. ГОМОМОРФИЗМЫ 179 также является гомоморфизмом, причем Imf = T, Kerf = R^. Следовательно, C*/R*+ Т. (Соответствующее разбиение на смежные классы было описано в примере 5.2.) ПРИМЕР 10. Рассмотрим гомоморфизм /: R —>Т, гм cos2тга + i sin2тгх (ср. пример 4). Так как Кег f — Z, то мы получаем, что R/Z~T. ПРИМЕР 11. Аналогичным образом рассмотрение гомоморфиз- ма det из примера 5 приводит к тому, что GLn(K)/SLn(K)^K* — результат, уже полученный в примере 5.15. Пример 12. Рассмотрение гомоморфизма sgn из примера 6 приводит к тому, что $п/Ап — С2. В частности, отсюда следует, что |А„| = ±п!. Пример 13. Согласно определению (см. §2), всякое аффинное преобразование f есть произведение параллельного переноса и линейного преобразования <р. Последнее называется линейной частью или дифференциалом преобразования f и обозначается через df. Формула полученная при доказательстве предложения 2.1, показывает, что отображение d: GA(V) —> GL(V), f df, является гомоморфизмом. Очевидно, что Imd=GL(V), Кег d = Tran V, так что GA(V)/Tran V ~ GL(V).
180 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП Пример 14. Пусть А = А1А2А3 — правильный треугольник. Сопоставив каждому движению <р е Sym А подстановку <т е S3 по правилу <p(AJ = Аа(<), мы получим гомоморфизм /: Sym А S3. Так как всякое движение плоскости, оставляющее на месте 3 точки, не лежащие на одной прямой, тождественно, то Кег f = {id }. Докажем, что Im f = S3. Так как Im f — подгруппа группы S3 и группа S3 порождается транспозициями, то доста- точно проверить, что любая транспозиция принадлежит Im f, т.е. может быть осуществ- лена некоторым движением р е Sym А. Но это действительно так: например, транспози- ция (12) осуществляется отражением относи- тельно прямой I, показанной на рис. 7. Таким образом, Sym А ~ S3. Аналогично доказывается, что группа симметрии правильного те- траэдра изоморфна S4 (проделайте это!). Пример 15. При перестановках переменных xlt х^ х3, х4 многочлены xix2 + x3x4, ххх3 + х2х4, х1х4 + х2х3 (15) переставляются между собой. Занумеровав их каким-либо образом, мы получим гомоморфизм /: S4^S3. Докажем, что Im f = S3. Для этого достаточно проверить, что любая транспозиция многочленов (15) может быть осуществлена некото- рой перестановкой переменных xlt а^, а^, х4. Но это действительно так: например, транспозиция первых двух многочленов (15) может быть осуществлена транспозицией переменных а^ и х3. Далее, Кег/ — это так называемая четверная группа Клейна V4 = {e,(12)(34),(13)(24),(14)(23)}. По теореме о гомоморфизме V4 <1 S4 и S4/V4 ~ S3. Легко видеть, что группа V4 изоморфна группе из примера 1.7.
§ 6. ГОМОМОРФИЗМЫ 181 ЗАДАЧА 2. Доказать, что для любого п е!Ч имеет место следу- ющий «парадоксальный» изоморфизм: сус^с*. ЗАДАЧА 3. Пусть р — простое число. Найти порядки групп GL2(Zp) и SL2(Zp). Очевидно, что композиция гомоморфизмов F —> G и G —> Н есть гомоморфизм F —> Н. Пример 16. Рассмотрим композицию гомоморфизмов det : GLn(K) К* и sgn : R* —> С2 = {±1}, где sgn обозначает знак вещественного числа. Мы получим таким образом гомоморфизм е: GLB(R)—>С2. При п = 2 он имеет следующий геометрический смысл: если е(А) = 1 (соответственно е(А) = —1), то линейное преобразование пространства Е2, определяемое матрицей А, сохраняет (соответст- венно меняет) ориентацию в том смысле, что любой положительно ориентированный базис оно переводит в положительно (соот- ветственно отрицательно) ориентированный базис. Аналогичная интерпретация возможна и при п = 3. ПРИМЕР 17. Композиция гомоморфизмов d: GA(R")->GL(RB) = GL„(R) и е: GLn(R) —> С2 есть гомоморфизм GA(R")^C2. (16) При п — 2 и 3 это позволяет распространить на аффинные преобра- зования евклидовой плоскости и евклидова пространства понятие сохранения или изменения ориентации. А именно, аффинное пре- образование сохраняет (соответственно меняет) ориентацию, если его дифференциал сохраняет (соответственно меняет) ориентацию. В частности, можно говорить о движениях, сохраняющих или меняющих ориентацию (что мы уже делали раньше, не давая точного определения). Пример 18. Пусть G С Isom 2?" (п = 2 или 3) — какая-либо под- группа, содержащая движения, меняющие ориентацию. Рассматри- вая ограничение на G гомоморфизма (16), мы приходим к выводу,
182 Гл. 4. НАЧАЛА ТЕОРИИ ГРУПП что подмножество движений из G, сохраняющих ориентацию, есть подгруппа индекса 2. Будем обозначать эту подгруппу через G+. Пример 19. В частности, подгруппу Sym+X" с Sym К будем называть группой вращений куба К. Так как |SymA’|=48 (см. пример 5.10), a Sym +К есть подгруппа индекса 2, то |Sym+tf| = 24. Докажем, что Sym+7T ~S4. Для этого занумеруем каким-либо образом 4 диагонали куба К А РИС'- 8 О изображенной на рис. о. и поставим в соответствие каждому движению <p€Sym+A’ подстановку, осуществляемую им на множестве ди- агоналей. Мы получим гомоморфизм /: Sym+7T -> S4. Докажем, что Im / = S4, откуда уже будет следовать, что / — изомор- физм, поскольку |Sym + Л”| = |S4|. Для этого достаточно проверить, что лю- бая транспозиция принадлежит Im f. Но это действительно так: напри- мер, транспозиция (12) осуществляет- ся поворотом на тг вокруг прямой I, ЗАДАЧА 4. Доказать, что группа Z)4 (группа симметрии квадра- та) изоморфна группе Sym (х.а^ + х^х^) (см. примеры 1.8 и 5.11). ЗАДАЧА 5. Доказать, что SL2(Z2) S3. Согласно определению операции в факторгруппе G/N, отобра- жение a: G —» G/N, 9^ gN, является гомоморфизмом. Оно называется каноническим гомомор- физмом группы G на факторгруппу G/N. Его ядром, очевидно, является подгруппа N. Пусть f :G—*H — любой сюръективный гомоморфизм. Положим Кег/ = М. Согласно теореме 1, H~G/N и, если отождествить Н с G/N при помощи указанного там изоморфизма, гомоморфизм / совпадет с каноническим гомоморфизмом группы G на G/N. Поэтому теорему 1 можно понимать таким образом, что никаких сюръективных гомоморфизмов групп, кроме канонических гомомор- физмов на факторгруппы, в сущности, не существует.
Глава 5 ВЕКТОРНЫЕ ПРОСТРАНСТВА Эта и последующие две главы будут посвящены линейной ал- гебре, начала которой были изложены в гл. 2, и связанной с ней геометрии. Линейная алгебра является наиболее прикладным раз- делом алгебры. Ее аппарат так же необходим любому математику, как аппарат математического анализа. Следует, однако, предостеречь читателя от взгляда на линейную алгебру как на манипулирование с матрицами — взгляда, игнори- рующего ее идеологию, в частности, геометрические образы, скры- вающиеся за ее понятиями. Читатель, пошедший по этому легкому пути, много потеряет. Он будет испещрять формулами десятки страниц или перегружать компьютер в ситуациях, очевидных для того, кто действительно владеет линейной алгеброй. За исключением общих определений, некоторых примеров и тех случаев, когда будет оговорено противное, все векторные пространства в главах, относящихся к линейной алгебре, предпола- гаются конечномерными. Основное поле, если это не есть какое-то конкретное поле, обозначается буквой К. § 1. Взаимное расположение подпространств Очевидно, что для любых двух подпространств U и W векторного пространства V их пересечение U C\W также является подпро- странством. Это наибольшее подпространство, содержащееся как в U, так и в TV. Определение 1. Суммой U + W подпространств U и W называется совокупность векторов вида и + w, где и е U, we W. Это наименьшее подпространство, содержащее как U, так и W. Определение 2. Базис пространства V называется согласо- ванным с подпространством U, если U является линейной обо- лочкой какой-то части базисных векторов (т. е. одним из «коорди- натных подпространств» относительно этого базиса).
184 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Так, на рис. 1, а) базис {еи е?} согласован с подпространством U, а на рис. 1, б) — нет. Рис. 1, б) Легко видеть, что для всякого подпространства существует согла- сованный с ним базис. Менее очевиден следующий замечательный факт. Теорема 1. Для всякой пары подпространств U, W С V существует базис пространства V, согласованный с каждым из подпространств U, W. Доказательство. Пусть {еи ..., е} — базис подпростран- ства U A W. Дополним его какими-то векторами ер + 1,... ..ек до базиса подпростран- ства U и, с другой стороны, векторами е4 + 1,..ек + 1_р — до базиса подпространства W. (Здесь р — dim U A W, к = = dim U, I =dim W.) Докажем, что векторы еи ..ек + 1_р ли- нейно независимы. Дополнив их затем до базиса подпро- странства V, мы и получим базис, согласованный как с U, так и с W. Предположим, что Рассмотрим вектор k р Из первого представления вектора х следует, что он лежит в U, а из второго — что он лежит в W. Таким образом, х е U Г) W и, значит, р k+i-p z=£ = ~ £ ^iei-
§ 1. ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПОДПРОСТРАНСТВ 185 Так как векторы ен ..ер, ек + ек + 1_р линейно независимы, то отсюда следует, что х — 0 и = 0 при i = к + 1,..к + I — р. Далее, так как векторы ех,...,ек линейно независимы, то из равенства к =0 i = 1 следует, что А,- =0 при г = 1,..., к. □ Рисунок 2 иллюстрирует это доказательство в случае р — 1, к = = 1=2. Следствие. dim(I7 + TV) = dim U + dim W — dim(17 A TV). Доказательство. В обозначениях доказательства теоре- мы 1 векторы ех,...,ек+1 составляют базис подпространства U + TV, так что dim( U + TV) = к + I — р. □ Для трех подпространств аналогичная теорема неверна. ЗАДАЧА 1. Привести пример, подтверждающий это высказыва- ние. Взаимное расположение произвольного (конечного) числа подпространств описать, вообще говоря, сложно (и в некотором смысле даже невозможно). Однако нас будет в первую очередь интересовать один частный случай, когда это сделать просто. Определение 3. Подпространства Ц,..., Uk называются ли- нейно независимыми, если из равенства их +... + ик =0 (щ е U,) следует, что их = ... = ик = 0. Для двух подпространств U, W линейная независимость рав- носильна тому, что U A W = 0. Напрашивающееся обобщение для любого числа подпространств неверно. ЗАДАЧА 2. Привести пример трех линейно зависимых подпро- странств, все попарные пересечения которых равны нулю. Определение 4. Суммой U\ + ... + Uk подпространств Ux,... • •., Uk С V называется совокупность векторов вида их + ... 4- ик, где и{ е Ц. Это наименьшее подпространство, содержащее все подпростран- ства Ц,..., Uk. Предложение 1. Следующие свойства системы подпро- странств Ux, ...,UtcV равносильны: 1) Ux,..., Uk линейно независимы; 2) объединение базисов подпространств Ux,...,Uk линейно независимо; 3) dim(C/1 + ... + Uk) = dim Ц + ... + dim Uk.
186 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Доказательство. 1)<=>2). Пусть {efl,..., ein } — базис подпространства LT (г = 1,..., к). Предположим, что между векто- рами ei}- (г — 1,..., к, j — 1,..., п£) имеется нетривиальная линейная зависимость: =0- Тогда сумма векторов еЦ (г = 1,..., к) з равна нулю, причем не все они равны нулю. Следовательно, подпространства Ц,..., Uk линейно зависимы. Обратно, если подпространства JTj,..., Uk линейно зависимы, то существуют векторы xiE (г = 1,..не все равные нулю, сумма которых равна нулю. Разложив каждый из них по базису своего подпространства, мы получим нетривиальную линейную зависимость между векторами е£.. 2) <=s> 3). Так как объединение базисов подпространств Ux,..., Uk порождает сумму Ц + ... + Uk, то каждое из свойств 2) и 3) равно- сильно тому, что это объединение является базисом пространства Ux + ... + Uk. Следовательно, эти свойства равносильны между собой. □ Сумма линейно независимых подпространств Ux,...,Uk назы- вается прямой суммой и обозначается Ux®...®Uk. Каждый вектор и прямой суммы однозначно представляется в виде и = их+.. .+ик, где и, е U^, вектор и£ называется проекцией вектора и на подпространство Ц. Подчеркнем, что проекция вектора на подпространство Ui за- висит не только от этого подпространства, но и от остальных слагаемых разложения Ux ®... ® Uk. Пример 1. Квадратная матрица А называется симметричной, если АТ = А, и кососимметричной, если АТ — —А. Симметричные (соответственно кососимметричные) матрицы образуют подпро- странство Ь*(Л") (соответственно L~(K)) в пространстве Ln(K) всех матриц. При условии, что char К ^2, всякая матрица А может быть представлена в виде суммы симметричной и кососимметрич- ной матриц: А = ±(А+Ат)ч4(А-Ат). С другой стороны, при том же условии очевидно, что матрица, симметричная и кососимметричная одновременно, равна нулю. Это означает, что Ln(K) = L+n(K)®L~n(K). Пример 2. Аналогично доказывается, что пространство всех функций на вещественной прямой является прямой суммой подпро-
§ 2. ЛИНЕЙНЫЕ ФУНКЦИИ 187 странств четных и нечетных функций. (В этом примере векторное пространство и оба подпространства бесконечномерны.) ПРИМЕР 3. Пусть {еи ..., еп} — базис векторного пространст- ва V. Тогда У = (ej ф... ф (е„). Проекция вектора х е V на равна х(е(, где ж, есть г-я координата вектора х в базисе {е1,...,еп}, и зависит не только от е,, но и от остальных векторов базиса. Определения 3 и 4 могут быть распространены на бесконечное число подпространств, если рассматривать только такие суммы векторов, в которых лишь конечное число слагаемых отлично от нуля. ПРИМЕР 4. Пусть А = K[xt,..., — алгебра многочленов от п переменных. Обозначим через Ad подпространство однородных многочленов степени d. Так как всякий многочлен однозначно представляется в виде суммы однородных многочленов различных степеней, то А — Ао ф А1 ф А% ф ... = ф Ad' d =о При этом AdAe^Ad+e- (1) Разложение какой-либо алгебры А в прямую сумму подпро- странств Ad (d е Z), удовлетворяющее условию (1), называется ее градуировкой. Алгебра, снабженная градуировкой, называется градуированной алгеброй. (Некоторые из подпространств Ad мо- гут быть нулевыми. Так, в приведенном выше примере Ad =0 при d <0.) ЗАДАЧА 3. Пусть А — Ln(K) — алгебра матриц. Обозначим через Ad линейную оболочку матричных единиц Etj с j — i = d. Доказать, что подпространства Ad задают градуировку алгебры А. (Здесь Ad —0 при |d| п.) § 2. Линейные функции Векторные пространства и их подпространства представляют мир, в котором живут персонажи линейной алгебры. Простейшими из них, помимо векторов, являются линейные функции, которые, как мы увидим, в некотором смысле двойственны векторам.
188 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Определение 1. Линейной функцией (или линейной формой) на векторном пространстве V называется всякая функция а: V —+ —> К, обладающая свойствами 1) а(х + у) = а(х) + а(у); 2) а(Ах) = Ха(х). Иными словами, линейная функция — это линейное отображение пространства V в поле К, рассматриваемое как (одномерное) векторное пространство. Пример 1. Как доказывается в курсе элементарной геометрии, функция а(х) = (а, х) (а е Е3) является линейной функцией на пространстве Е3. ПРИМЕР 2. Функция a(f) — f(xg) (xQeX) является линейной функцией на пространстве F(X, К) функций на множестве X со значениями в К (см. пример 1.7.2). ПРИМЕР 3. Функция a(f) = f'(x0) (а^бК) является линейной функцией на пространстве С1 (К) дифференцируемых функций на вещественной прямой. ь ПРИМЕР 4. Функция а(/) = J f(x) dx является линейной функ- цией на пространстве С[а, непрерывных функций на отрезке [а, Ь]. Пример 5. Следом квадратной матрицы называется сумма ее диагональных элементов. След матрицы X обозначается через tr X. Функция а(Х) = trX является линейной функцией на простран- стве ЬП(Л") квадратных матриц. Если х{,..хп — координаты вектора х в базисе {еи ..., еп}, то a(x) = alxl+... + anxn, (2) где а( = а(е£). Таким образом, линейная функция однозначно опре- деляется своими значениями на базисных векторах, называемыми ее коэффициентами в данном базисе. Коэффициенты могут быть произвольными: для любых аи ..., ап еК функция а, определяемая формулой (2), является линейной. Линейные функции образуют подпространство в пространстве F(V, К) всех функций на V со значениями в К. Определение 2. Пространство линейных функций на V назы- вается сопряженным пространством по отношению к V и обозначается через V*. Пусть {е^ ..., еп} — базис пространства V. Линейные функции ..., е„ 6 V*, определяемые равенствами е£(х) = х(, называются
§ 2. ЛИНЕЙНЫЕ ФУНКЦИИ 189 координатными функциями относительно базиса {б],..., еп}. Они составляют базис пространства V*, который называется со- пряженным базисом по отношению к {е1г..., еп}. Из его опреде- ления следует, что для любого вектора х eV 3: = E£i(2;)ei- (3) i Сопряженный базис может быть также определен условиями , . с . f 1 при i = j, , „ ч е,(еу) = =? | о при i ± j (символ Кронекера). Из предыдущего следует, что dim V* = dim V, так что пространства V и V* изоморфны, хотя между ними и не существует ника- кого естественного (выделенного) изоморфизма. Однако второе сопряженное пространство V** — (V*)* оказывается естественно изоморфным пространству V. Из определения операций в пространстве V* следует, что для любого вектора х е V функция Д на V*, определенная по формуле 4(a)=«(г) является линейной. Теорема 1. Отображение х ь-> fx является изоморфизмом пространства V на пространство V**. Доказательство. Из определения линейных функций сле- дует, что fx + v = fx + fy и fXx = Xfx. Остается проверить, что отобра- жение х >-> fx биективно. Пусть {еи ..., еп} — базис пространства V и {е},еп} — сопряженный базис пространства V*. Тогда А,(£у)=£А) = Sn> так что {fe,..., fe } — базис пространства V**, сопряженный ба- зису {£],..., еп}. Отображение х*-> fx переводит вектор с коорди- натами х},.. .,хп в базисе {еи ..., еп} пространства V в вектор с такими же координатами в базисе {/е,..., /е } пространства V**. Следовательно, оно биективно. □ В дальнейшем мы будем отождествлять пространства V и V** посредством указанного изоморфизма, т.е. рассматривать каждый вектор х eV одновременно и как линейную функцию на V* (и писать х(а) вместо fx(a)). При таком соглашении пространства V и V* будут играть совершенно симметричную роль. Следствие. Всякий базис пространства V* сопряжен неко- торому базису пространства V. ЗАДАЧА 1. Показать, что линейные функции (где п ~ dim V) составляют базис пространства V* тогда и только
190 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА тогда, когда не существует ненулевого вектора х с V, для которого Ei(2:) = ... = en(x) = 0. ЗАДАЧА 2. Пусть V — пространство многочленов степени п над полем К. Показать, что линейные функции е1;..еп, определяемые равенствами где Xq, х{, ..., хп — различные элементы поля К, составляют базис пространства V*, и найти сопряженный базис пространства V. Показать, что формула (3) в этом случае превращается в интер- поляционную формулу Лагранжа. ЗАДАЧА 3. Пусть V то же, что и в задаче 2, причем char К = = 0. Показать, что линейные функции £0, е,,..е„, определяемые равенствами £<(/) =/(<U), где е К, составляют базис пространства V*, и найти сопря- женный базис пространства V. Показать, что формула (3) в этом случае превращается в формулу Тейлора. Замечание 1. Теорема 1 неверна для бесконечномерных пространств. Если пространство V бесконечномерно, то пространство V* и, тем более, V" имеют большую размерность. Например, пусть V = К°° — пространство финитных по- следовательностей (см. пример 2.2.9). Это пространство счетномерно. Линейные функции на нем имеют вид a(x},x2,...) = a1xi +02X2 + ... (ввиду финитности последовательности (а^,^,...) сумма фактически конечна). Здесь ар 02,... могут быть произвольными элементами поля К. Поэтому простран- ство V* изоморфно пространству всех последовательностей, которое, как можно показать (попробуйте это сделать!), несчетномерно. Имеется естественное взаимно однозначное соответствие меж- ду подпространствами пространств V и V*, при котором каж- дому &-мерному подпространству пространства V соответствует (п — &)-мерное подпространство пространства V* (где п = dim V). Определение 3. Аннулятором подпространства U С V назы- вается подпространство U° = {a е V*: a(x) = 0 VxeU}. Теорема 2. dim U° = dim V — dim U. Доказательство. Пусть {en..., e„} — такой базис про- странства V, что U = (е15 ..., ек), и — сопряженный базис пространства V*. Тогда U° = (efc + 1, • • en). □
§ 3. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ 191 В соответствии с нашим отождествлением пространств V** и V мы можем говорить об аннуляторе подпространства W с V* как о подпространстве пространства V. По определению W° = {x& V: а(х) = О VaEWj. Теорема 3. (17°)°= U для любого подпространства UcV. Доказательство. В обозначениях доказательства теоре- мы 2, ясно, что (170)0 — (б],..ек) = U. □ Следствие. Любое подпространство в V является аннуля- тором некоторого подпространства в V*. Пусть имеется система однородных линейных уравнений aijxj =0 (г = 1,...,т). (4) 7 = 1 Будем интерпретировать х1,...,хп как координаты вектора х n-мерного векторного пространства V в некотором базисе {ej,..еп}. Тогда система (4) может быть записана в виде а,(х) = О (z = l,...,m), где а1;..., ат е V* —линейные функции, стоящие в левых частях уравнений (4). Множество решений этой системы представляет собой аннулятор подпространства (аи ..ат) С V*. Заметим, что размерность этого подпространства равна рангу матрицы коэф- фициентов системы (4). Поэтому теорема 2.3.2 о размерности пространства решений системы однородных линейных уравнений является непосредственным следствием теоремы 2. Следствие теоремы 3 в этом контексте может быть сформулиро- вано так: Теорема 4. Всякое подпространство является множеством решений некоторой системы однородных линейных уравнений. § 3. Билинейные и квадратичные функции Аксиоматика векторного пространства не охватывает еще всей элементарной геометрии векторов евклидова пространства, по- скольку в этой аксиоматике отсутствуют такие понятия, как длина вектора и угол между векторами. Длина и угол могут быть выражены через скалярное произведение векторов. Одним из основных свойств скалярного умножения геометрических векторов
192 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА является его линейность по каждому множителю. В этом параграфе мы рассмотрим функции двух векторных аргументов, являющиеся обобщением скалярного умножения. Определение 1. Билинейной функцией (или билинейной фор- мой) на векторном пространстве V называется функция а: V х V —> К, линейная по каждому аргументу. Пример 1. Как доказывается в курсе элементарной геометрии, скалярное умножение геометрических векторов является билиней- ной функцией на пространстве Е3. ПРИМЕР 2. Функция <*(/, Э)= j f(x)g(x)dx а является билинейной функцией на пространстве С[а, Ь]. ПРИМЕР 3. Функция а(Х, Y) — trXY является билинейной функцией на пространстве Ln(JQ. ПРИМЕР 4. Определитель матрицы второго порядка как функ- ция ее строк есть билинейная функция на пространстве К2. Пусть {е1;..., еп} — базис пространства V. Тогда для векторов х = 52 xt е{, у = 52 У^э получаем а(х,у) = ^%х{у., где a^ = a(ei,e>). (5) Матрица A =(ai:j) называется матрицей билинейной функции а в базисе {еи..., еп}. Как видно из предыдущей формулы, билинейная функция однозначно определяется своей матрицей. Формула (5) может быть переписана в матричных обозначениях: a(x,y) = XTAY, (6) где X и Y — столбцы координат векторов хну соответственно. При переходе к другому базису (е;,..., ej = (e1,..., еп)С координаты векторов хну преобразуются по формулам X = СХ', Y = CY'. Подставляя эти выражения в (6), получаем а{х,у) = {Х'УСуАСУ'. .
§ 3. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ 193 откуда следует, что в базисе {е[,..е^} матрица функции а равна А' = СТАС. (7) Основная задача теории билинейных функций — это приведение матрицы билинейной функции к возможно более простому виду за счет выбора подходящего базиса. В связи с этим важно знать свойства матрицы билинейной функции, которые не зависят от выбора базиса. Определение 2. Ядром билинейной функции а называется подпространство Кег а = {у G V: а(х, у) — 0 Vz € V}. Функция а называется невырожденной, если Кег а =0. Все билинейные функции, рассмотренные в примерах 1 — 4, невырожденны. Так, невырожденность скалярного умножения сле- дует из того, что (у, у) > 0 при у ф 0. Аналогично доказывается невырожденность билинейной функции в примере 2. ЗАДАЧА 1. Доказать невырожденность билинейных функций в примерах 3 и 4. Очевидно, что если {е1;..., еп} — базис пространства V, то Кег а — {у € V: а(е(, у) = 0, г = 1,...,п}. Записывая эти условия в координатах, получаем систему одно- родных линейных уравнений, матрицей коэффициентов которой служит матрица А функции а. Следовательно, dim Ker а — n — rk А. (8) В частности, Кега —0 тогда и только тогда, когда rk А = п, т.е. когда матрица А невырожденна. Из формулы (8) следует, что ранг матрицы билинейной функции а не зависит от базиса. Он называется рангом билинейной функции а и обозначается через rk а. Определение 3. Билинейная функция а называется симме- трической (соответственно кососимметрической), если а(х, у) = а(у, х) (соответственно а(х, у) = —а(у, х)) для любых х, у eV. Так, билинейные функции в примерах 1 и 2 симметричны. Билинейная функция в примере 3 также симметрична. В самом деле, если X = (x(j), Y — (у0), то tr XY - £ зд = £ yJ( xtj = £ y.jXji - tr YX. 1,3 *,3 i,3
194 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Билинейная функция в примере 4 кососимметрична. Но, конечно, существуют билинейные функции, которые не являются ни симме- трическими, ни кососимметрическими. Билинейная функция является симметрической (соответственно кососимметрической) тогда и только тогда, когда ее матрица А симметрична (соответственно кососимметрична), т.е. Ат = А (соответственно Ат = — А). Определение 4. Пусть а — симметрическая билинейная функ- ция над полем К характеристики / 2. Функция q: V К, определяемая по формуле q(x) = а(х, х), называется квадратичной функцией (или квадратичной фор- мой), ассоциированной с функцией а. В координатах квадратичная функция записывается в виде ?(®) = 1Х^., (9) i, i т. е. является однородным многочленом второй степени. Симметрическая билинейная функция а может быть восстанов- лена по соответствующей квадратичной функции q по формуле a(z, у) ^[q(x + у) - q(x) - q(y)]. (10) Билинейная функция а называется поляризацией квадратичной функции q. Таким образом, имеется взаимно однозначное соответствие меж- ду симметрическими билинейными и квадратичными функциями. Имея в виду это соответствие, все понятия, относящиеся к сим- метрическим билинейным функциям (матрица, ранг, невырожден- ность и т. д.), переносят на квадратичные функции. В дальнейшем изложении мы будем из соображений удобства иногда говорить о симметрических билинейных, иногда — о квадратичных функциях. Геометрические ассоциации, связанные со скалярным умножени- ем векторов, могут быть полезны при изучении произвольных били- нейных функций. Этим объясняется вводимая ниже терминология. Пусть а — симметрическая или кососимметрическая билинейная функция над полем К характеристики / 2. Векторы х, у е V называются ортогональными (относительно а), если а(х, у)=0; в этом случае пишут z ± у. Ясно, что это отношение симметрично: если z ± у, то и у JL х. Отметим, что в случае кососимметрической функции а каждый вектор ортогонален самому себе.
§ 3. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ 195 Определение 5. Ортогональным, дополнением к подпростран- ству U (относительно а) называется подпространство Ur = {у Е V: а(х, у) = О Vx Е О}. В частности, V-1- = Кег а. Предложение 1. Если функция а невырожденна, то dim U1- = dim V - dim U и (U^ = U. Доказательство. Пусть {еи ..., efc} — базис в U. Тогда Uv = {yE V: а(е{,у) = 0, i = 1,..., к}. (11) Записывая эти условия в координатах, мы получаем систему одно- родных линейных уравнений. Эти уравнения линейно независимы, так как для любых Aj,..., Afc, не равных нулю одновременно, линейная функция к / к \ Е x,a(et, у) = а\У, xtei. У) i = 1 't = 1 ' в силу невырожденности функции а не является нулевой. Следо- вательно, dim U1- = п — к, где п = dim V. По той же формуле dim( f7'-L)-L — п — (п — к) — к = dim U. Однако ясно, что (17х)± D U. Следовательно, (U^y- = U. □ Определение 6. Подпространство U называется невырож- денным относительно функции а, если ее ограничение на U невырожденно. Предложение 2. V = U ® U1- тогда и только тогда, когда подпространство U невырожденно. Доказательство. Из (11) ясно, что в любом случае dim U1- dim V — "dim U. С другой стороны, Un U-L = Кега|а, так что если U П UL — 0, то подпространство U невырожденно. Обратно, если подпространство U невырожденно, то U П UL = 0 и dim(l7 + UL) = dim U + dim > dim V, откуда следует, что U + U-1- = V. □
196 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Пусть а — симметрическая билинейная функция. Базис {е,,..., еп} пространства V называется ортогональным (относительно а), если его векторы попарно ортогональны. В орто- гональном базисе матрица функции а диагональна, а сама функция а и соответствующая ей квадратичная функция q записываются в виде а(х, y) = alxlyl + ...-\-апхпуп, (12) д(х) = а}х^ + ... + апх1 (13) Теорема 1. Для любой симметрической билинейной функции существует ортогональный базис. Доказательство. Докажем это утверждение индукцией по п =dim V. При п — 1 доказывать нечего. Пусть п > 1. Если а =0, то доказывать опять-таки нечего. Если а ^0, то в силу формулы (10) q 0, т. е. существует такой вектор , что a(e,,ei) = g(ei)^0. Согласно предложению 2, V = (e1)e(e1)±. По предположению индукции существует ортогональный базис {е2,...,еп} пространства (е^. Добавляя к нему вектор ех, мы получаем ортогональный базис {еи ej,..., еп} пространства V. □ Следующая теорема дает более явный способ построения ортого- нального базиса (при ограничениях, указанных в ее формулировке). Пусть {е1,...,еп} — некоторый базис пространства V и А — матрица функции а в этом базисе. Обозначим через Ак матрицу ограничения функции а на подпространство Vk — (е1;..., ек) в базисе {еи ..., ек} этого подпространства, т. е. левый верхний угол порядка к матрицы А. Число 6к = det Ак будем называть угловым минором порядка к матрицы А. Положим также VQ = О, <50 = 1. Теорема 2. Если все угловые миноры <5,,..., Sn матрицы А отличны от нуля, то существует единственный ортого- нальный базис {/,, пространства V, удовлетворяющий условиям Ae^ + V*., (fc = l,...,n). (14) При этом = = (к = \,...,п). (15)
§ 3. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ 197 Доказательство. Докажем теорему индукцией по п. При п = 1 имеем /1=е„ д(Л) = «1 (=-^) • При п> 1 применим предположение индукции к базису {еп... ..e„_j} пространства Пусть {/и ..., /„_]} — ортогональный базис пространства K-i> удовлетворяющий условиям теоремы. Будем искать вектор fn в виде А - еп + 52 ^ifi е еп + К-i- 1 = 1 Заметим, что при г = • • ’ п~ 1; и поэтому условия ортогональности 0 = (/„,Л) = (е„,/.)4-A<g(/f) (г-1,...,п-1) удовлетворяются при подходящем выборе чисел А,,..Ап_р при- чем эти числа определяются однозначно. Так как K-i> то {/1,..., fn} — базис пространства V. Остается проверить равенство (15) при к = п. Так как матрица перехода от базиса {е^ ..еп} к базису {/и является (верхней) унитреугольной (т.е. треугольной с единицами на диа- гонали), то ее определитель равен 1 и формула (7) показывает, что определитель матрицы функции а не меняется при переходе к базису {/i, Однако в этом базисе матрица функции а диагональна, причем ее диагональные элементы равны ?(/i), ?(/„-), д(А). Следовательно, *„ = g(A)...g(A-iMA)- Такое же рассуждение, примененное к ограничению функции а на подпространство К-1 (или, если угодно, предположение индукции) показывает, что Vi = Q(/i)---Q(A-i)- Отсюда следует, что ?(/.)= 3^. □ Процесс построения ортогонального базиса, описанный в до- казательстве теоремы, называется процессом ортогонализации Грама — Шмидта. Рисунок 3 иллюстрирует его в случае, когда а —скалярное умножение в Е3.
198 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Пусть {cj,..., еп} — базис пространства V, ортогональный от- носительно функции а. За счет нормировки векторов е, числа Рис. 3 а, = g(ej можно умножать на квадраты любых ненуле- вых элементов поля К. Кро- ме того, переставляя базис- ные векторы, можно пере- ставлять и эти числа. Одна- ко, как видно из доказатель- ства теоремы 1, в выборе ортогонального базиса име- ется гораздо больший про- извол. Как можно изменять числа а,, пользуясь этим произволом? Ответ на этот вопрос существенно зависит от поля К. Пусть К = С. Тогда путем нормировки базисных векторов числа а, могут быть сделаны равными 1 или 0, и после подходящей перестановки базисных векторов, функция q приводится к так называемому нормальному виду: q(x) = х? +...+ х*. Число г является инвариантом, так как г =rkg. Пусть теперь К = К. Тогда путем нормировки базисных векторов числа а,- могут быть сделаны равными ±1 или 0, и после подхо- дящей перестановки базисных векторов функция q приводится к нормальному виду: q(x)^ х^ + ... +х2к-xl+x-..х2к + 1. (16) Сумма к + I = rk q является инвариантом, но являются ли инвари- антами к и I по отдельности? Для ответа на этот вопрос введем одно важное понятие. Определение 7. Вещественная квадратичная функция q на- зывается положительно определенной, если q(x) > 0 при х^О. Вещественная симметрическая билинейная функция называется положительно определенной, если соответствующая ей квадра- тичная функция является положительно определенной. Так, скалярное умножение геометрических векторов является по- ложительно определенной симметрической билинейной функцией. Аналогично определяются отрицательно определенные квадра- тичные и симметрические билинейные функции.
§ 3. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ 199 Очевидно, что нормальный вид положительно определенной квадратичной функции есть xf +... + х%. Теорема 3. Число к в нормальном виде (16) произвольной вещественной квадратичной функции q есть максимальная размерность подпространства, на котором функция q поло- жительно определенна. Доказательство. Очевидно, что функция q положительно определенна на А:-мерном подпространстве (еи ..ек). Пусть те- перь U — произвольное подпространство, на котором функция q положительно определенна, и W = (ек + 1,..., еп). Так как q(x) О при х е W, то U П W = 0. Отсюда следует, что dim U к. □ Аналогично, I есть наибольшая размерность подпространства, на котором функция q отрицательно определенна. Следствие (закон инерции). Числа к и I в нормальном виде (16) вещественной квадратичной функции q не зависят от выбора базиса, в котором эта функция имеет нормальный вид. Эти числа называются соответственно положительным и отри- цательным индексами инерции квадратичной функции q (а также соответствующей симметрической билинейной функции а). Пара (k, I) называется сигнатурой функции q (или функции а). Пример 5. Квадратичная функция q(x) = xlx2 путем (невырож- денного) преобразования координат хг — х[ + xl,, Х2 — х{ — Х^ приводится к виду q(x) = х[2 — х£. Поэтому ее сигнатура равна (U). ЗАДАЧА 2. Найти сигнатуру симметрической билинейной функ- ции из примера 3 (в случае К = R). Теорема 2 позволяет (при указанных в ней ограничениях) опре- делить индексы инерции вещественной квадратичной функции по угловым минорам ее матрицы в каком-либо базисе. Теорема 4 (метод Якоби). Если все угловые миноры 8к ма- трицы вещественной квадратичной функции q отличны от нуля, то отрицательный индекс инерции функции q равен числу перемен знака в последовательности 1, 4, 62, ..., 6п. (17) (Определение числа перемен знаков в последовательности веще- ственных чисел см. в § 3.4.)
200 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Доказательство непосредственно следует из теоремы 2. Заметим, что в условиях теоремы функция q невырожденна, так что сумма ее индексов инерции равна п. Следствие (критерий Сильвестра). Вещественная квадратич- ная функция является положительно определенной тогда и только тогда, когда все угловые миноры ее матрицы положи- тельны. Доказательство. Если все угловые миноры положительны, то, в частности, они отличны от нуля, и применение метода Якоби доказывает, что функция является положительно определенной. Обратно, если функция положительно определенна, то ее ограни- чение на любое подпространство Vk (в обозначениях теоремы 2) также положительно определенно и, следовательно, невырожденно. Это означает, что все угловые миноры отличны от нуля. Применяя метод Якоби, получаем, что они положительны. □ ЗАМЕЧАНИЕ 1. Модифицируя процесс ортогонализации, мож- но показать (попробуйте это сделать), что метод Якоби годится и в том случае, когда некоторые из угловых миноров равны нулю, лишь бы в последовательности 62,..., 8п не было двух нулей подряд (в частности, может быть 8п = 0, но тогда должно быть 8п_} /0). Как мы видели, в случаях К = С или R никакие изменения диагонального вида матрицы квадратичной функции, кроме тех, которые достигаются уже путем перестановки базисных векторов и их умножения на числа, невозможны, но так обстоит дело не всегда. Пусть К = Zp — поле вычетов по простому модулю р / 2. Известно (см. теорему 9.1.7), что Z* — циклическая группа. Следовательно, (Z*)2 = {а2: а 6 Z*} — подгруппа индекса 2. Ее элементы называются квадратичными вычетами, а эле- менты второго смежного класса — квадратичными невычетами. Пусть е 6 Z* — фиксированный квадратичный невычет. Теорема 5. Всякая невырожденная квадратичная функция над полем Zp (р^2) может быть приведена к одному из двух видов xf + ... + xLl + ^п- + ... + х2_ ! + ех2, в зависимости от того, является определитель ее матрицы квадратичным вычетом или невычетом. Лемма 1. Всякая невырожденная квадратичная функция q в векторном пространстве размерности п 2 над полем Zp представляет единицу, т. е. уравнение g(x) = 1 имеет решение. Доказательство. Достаточно рассмотреть случай п = 2. Можно считать, что g(x) = ej х2 + 02
§ 3. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ 201 Когда X] пробегает поле Zp, левая часть последнего различных значений. Аналогично, когда пробегает уравнения принимает — различных значении. Так р + 1 I р +1 О I п Pt где О], 02 0. Уравнение q(x) = 1 может быть представлено в виде 0^2 = 1-02^. уравнения принимает — поле Zp, правая часть этого как то существуют такие х1 и х^, при которых левая и правая части принимают одно и то же значение. □ Доказательство теоремы 5. Следуя доказательству теоремы 1, при п> 1 будем выбирать вектор так, чтобы у(е, )= 1, что возможно в силу предыдущей леммы. Так как при переходе к другому оазису определитель матрицы квадратичной функции умножается на квадрат определителя матрицы перехода, то <?(еп) будет квадратичным вычетом или невычетом одновременно с определителем матрицы функции q в любом базисе. □ Задача 3. Доказать, что произвольная (не обязательно невырожденная) квад- ратичная функция q над Zp может быть приведена ровно к одному из двух видов xf+ ... + xj?_ [ + if, zf + ... + ! + ezf, где r = rk q. Рассмотрим теперь кососимметрические билинейные функции. Здесь нас ожидает сюрприз: строение этих функций оказывается не зависящим от поля К. Пусть а — кососимметрическая билинейная функция в тг-мерном векторном пространстве V. Базис {еи ..еп} пространства V называется симплектическим (относительно а), если а(е2ь-1,е2ь) = -а(е2ь>е2ь-1) = 1 при к = 1,...,т, а(е{, е ) = 0 во всех остальных случаях. Иначе говоря, матрица функции а в этом базисе имеет вид / 0 1 \ -1 О О 1 -1 О О 1 1 о о о/ где число диагональных клеток равно т. Очевидно, что при этом rk а = 2т.
202 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Теорема 6. Для любой кососимметрической билинейной функции существует симплектический базис. Доказательство. Докажем это утверждение индукцией по п. При п = 1 доказывать нечего. Пусть п > 1. Если а = 0, то доказывать опять-таки нечего. Если а 0, то существуют такие векторы и Сг, что а(е,, 62)7^0. Домножив один из этих векторов на подходящее число, можно добиться того, чтобы a(el,e2) = -Q!(e2,el)=1- Матрица ограничения функции а на в базисе {е15 вд} ( 0 1 \ г- имеет вид I _ j q ) и, в частности, невырожденна. Согласно предложению 2, У=(е1,е2)®(е1,е2)±. По предположению индукции в пространстве (е1,е2)± существует симплектический базис {ej, е4,..., еп}. Добавляя к нему векторы в] и вг, мы получаем симплектический базис {е1; Cj, е3, е4,..., еп} пространства V. □ Следствие. Ранг кососимметрической билинейной функции всегда является четным числом. § 4. Евклидово пространство Свойства операций над геометрическими векторами, включая скалярное умножение, находят наиболее полное отражение в понятии евклидова векторного пространства. Определение 1. Евклидовым (векторным) пространством называется вещественное векторное пространство с фиксиро- ванной положительно определенной симметрической билинейной функцией. Обычно эта фиксированная билинейная функция называется скалярным умножением и обозначается (, ). Пример 1. Пространство геометрических векторов с обычным скалярным умножением. ПРИМЕР 2. Пространство R" со скалярным умножением (x,y) = xiy1 + ... + xnyn, где x = (Xi,..., хп), у = (у1,...,уп).
§ 4. ЕВКЛИДОВО ПРОСТРАНСТВО 203 ПРИМЕРЗ. Пространство С2[0, 1] непрерывных функций на отрезке [0, 1] со скалярным умножением (fg)=\f(x)g(x)dx. (18) о В евклидовом пространстве определяются длина вектора и угол между векторами таким образом, что в случае геометрических векторов они совпадают с обычной длиной и обычным углом. А именно, длина |х| вектора х определяется по формуле |х| = \/(х, х). Для определения угла необходимо сначала доказать Предложение 1. Для любых векторов х, у евклидова про- странства |(z, у)\ |ж||у|, (19) причем равенство имеет место тогда и только тогда, когда векторы х и у пропорциональны. Неравенство (19) называется неравенством Коши — Буня- ковского. Доказательство. Если у = Ах, то 1(2, у)| = |А ||(ж, z)| = IA11 ж|2 = I z||y|. Если векторы х и у не пропорциональны, то они составляют базис двумерного подпространства. Матрица скалярного умножения на этом подпространстве в базисе {ж, у} имеет вид / (ж, ж) (х,у)\ \ (z, У) (У, У) J ’ Ввиду положительной определенности скалярного умножения ее определитель должен быть положителен; но это и означает, что |(ж, у)| < |ж||у|. □ Угол ху между ненулевыми векторами х и у евклидова простран- ства определяется по формуле -—*• (х, и) cos ху — ) . У |®Цу| В частности, угол ху равен 0 или л тогда и только тогда, когда векторы хну пропорциональны; ху = тогда и только тогда, когда векторы хну ортогональны.
204 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Неравенство Коши — Буняковского является частным случаем более общего неравенства, относящегося к произвольной конечной системе векторов {а,,..ак} евклидова пространства. Определение 2. Матрица /(“i,ai) (“рог) ••• (“i,aJ\ G(a,, ., ак) — (°2’ ai) (“2, “г) ••• (“г, ak) I M“*,ai) (“it, “г) (ak,ak)J называется матрицей Грама системы векторов {а15..., ак}. Теорема!. Для любых векторов а1,...,ак евклидова про- странства справедливо неравенство det G(ax,..., ак) О, причем равенство имеет место тогда и только тогда, когда векторы а1; ..ак линейно зависимы. Доказательство. Если ^2 Л;а, —0, то ^2 а,) = 0 ПРИ всех j, а это означает, что линейная комбинация строк матрицы G(an ..., ak) с коэффициентами Ли...,Ак равна нулю. Поэтому если векторы а15..ак линейно зависимы, то det G(aH ..ак) = 0. Если же они линейно независимы, то так же, как в случае к — 2, доказывается, что det С(аи ..., ак) > 0. □ ЗАДАЧА 1. Получить соотношение между двугранными углами тетраэдра, рассмотрев матрицу Грама системы единичных векторов, ортогональных его граням. С помощью этого соотношения найти двугранный угол правильного тетраэдра. Определение 3. Базис евклидова пространства, в котором скалярное умножение имеет нормальный вид (см. § 3), называется ортонормированным. Ортонормированность базиса {е,,..., еп} может быть выражена любым из следующих эквивалентных условий: 1) скалярное умножение в этом базисе имеет вид (ж, у) = ххух + ... + хпу„; 2) скалярный квадрат в этом базисе имеет вид (х, х) = хх 4-... + х%; 3) матрица скалярного умножения в этом базисе (т. е. матрица Грама G(ex,..., еп)) является единичной матрицей;
§ 4. ЕВКЛИДОВО ПРОСТРАНСТВО 205 4) (ei,ey) = 5y; 5) базисные векторы попарно ортогональны и имеют длину 1. Согласно общей теории, в любом конечномерном евклидовом пространстве существует ортонормированный базис. Такой базис, конечно, не единствен. Дадим описание всех ортонормированных базисов, исходя из какого-либо одного ортонормированного базиса eJ- Пусть (e;,...,e;) = (ei,...,ejG Тогда матрица скалярного умножения в базисе {е[,..., е^} имеет вид СТЕС = СТС. (см. формулу (7)). Следовательно, базис {е[,...,е^} является ортонормированным тогда и только тогда, когда СТС = Е (20) Очевидно, что следующие свойства матрицы С эквивалентны: 1) СТС = Е; Е ckickj = при всех г, j; 3) Ст —С-1; 4) ССТ = Е; 5) Е cikc.k = при всех г, j. к Определение 4. Матрицы, обладающие этими эквивалентными свойствами, называются ортогональными. Заметим, что из равенства (20) следует соотношение det С — ±1 (но не наоборот!). Ограничение скалярного умножения на любое подпространство U евклидова пространства V также является положительно опре- деленной и потому невырожденной симметрической билинейной функцией, и предложение 3.2 показывает, что V=U®и\ Это означает, что для каждого вектора х е V имеется единственное представление в виде x = y + z, у€.Ц ztU1-. (21) Вектор у называется (ортогональной) проекцией вектора х на подпространство U и обозначается через рга х; вектор z называется ортогональной составляющей вектора х относительно подпро- странства U и обозначается через ort^x.
206 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Если {et,...,ek}— ортонормированный базис подпространства U, то проекция рг^ж может быть найдена по формуле ргих = £(т, eje,. (22) i = 1 Более общо, если {е1;..еА} — ортогональный (но не обязательно ортонормированный) базис подпространства U, то (23) Для построения ортогонального базиса евклидова пространства V может быть применен процесс ортогонализации, описанный в теореме 3.2. В предыдущих обозначениях, если {в],..., еп}— какой-либо базис пространства V, то базис получае- мый в результате ортогонализации, задается формулами A=ortK iefc (fc = l,..., п). (24) Пользуясь тем, что {А,..., fk_,} — ортогональный базис простран- ства K-j, проекцию pr v ек и, тем самым, вектор fk можно найти по формуле (23). ПРИМЕР 4. Пусть V — пространство многочленов степени 3 со скалярным умножением (18). Применим процесс ортогонализа- ции к базису е, = 1, Cj — х, е3 = ж2, е4 = х3. Заметим, что (е,, е.) = —-Д—г. Имеем Л = е1 = 1, (/„/,)=!, А = ~ (д'д)-^1 = х ~ 2’ (^2> А)= (А> = 12’ /з~ ез~ (/^/2)(Л > А)~ 2:2 — 21 + 6’ (А’ А) = (А> ез) = 180> f _ „ _ (е4’ A) f _ (е4> A) f __ ( е4 ’ /1) f _ ™3 _ 3 9 1 3_1_ 4 (/з./з)/з (А>Аг2 (Л’Л)Л " 2 20’ (/4> Д) = (Д, е4) — 2866- Задача 2. Применяя процесс ортогонализации к столбцам матрицы, доказать, что каждая матрица А € GLn(R) может быть единственным образом представлена в виде А = ОВ, где О — орто- гональная матрица, а В — треугольная матрица с положительными элементами на диагонали.
§ 4. ЕВКЛИДОВО ПРОСТРАНСТВО 207 Определим расстояние р между векторами евклидова простран- ства по формуле р(х,у) = \х-у\. Это расстояние удовлетворяет аксиомам метрического пространст- ва, в частности, аксиоме треугольника p(x,z)^p(x,y) + p(y,z). (25) Неравенство (25) следует из неравенства |я + у|^Ы + Ы, (26) которое, в свою очередь, легко выводится из неравенства Коши — Буняковского (проделайте это!) Расстояние между подмножествами X и Y метрического про- странства определяется по формуле p(X,Y) = inf р(х, у). х е х, у eY Теорема 2. Расстояние от вектора х евклидова простран- ства V до подпространства U С V равно |ort ^х), причем единственным ближайшим к х вектором подпространства U является ргцх. Доказательство. См. j рис. 4, где у = pr^rr, z = -----------=ortax. Для любого у' е U, /----------/ У' У’ имеем: / ---- S'/'U' / —-------------/ р(х, у')=и=\/к12 + Ы2> Рис. 4 > |г:| = р(х, у). □ Пример 5. В силу вычислений, примере, квадратным трехчленом, ближайшим к х метрики пространства С2[0, 1], является |ж2 — | расстояние от х3 до этого трехчлена равно проделанных в предыдущем 3 в смысле + 25' пРичем Следующая теорема дает явную формулу для расстояния от вектора х до подпространства U, заданного произвольным базисом <ео---, eJ.
208 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Теорема 3. С')Г ° ХХХ'/.'.'ХГ- Доказательство. Если х е U, то р(х, U) = 0 и det G(ei,... ..ек, х) = 0, так что доказываемая формула верна. Пусть х U и z = ortfjX. Применяя теорему 3.2 к базису {е1;... ..., еп, ж} пространства U ф (х), получаем 1-12 _ _ gfc + l _ detG(el,--, et,x) 11 ~^Z)_ 6k - detG(ei) >ejt) , что и требовалось доказать. □ Полученная формула может быть применена к вычислению объема параллелепипеда в евклидовом пространстве. Параллелепипедом, натянутым на векторы аи ..., ап евклидова пространства, называется множество Р(аи ..., ап) = { £ х,а,: 0^ 1}- '•г ' Основанием этого n-мерного параллелепипеда называется (п — 1)-мерный параллелепипед Р(а},..., ап_ J, а его высотой называется длина вектора ort( а •)ап. При п—2,3 это согла- суется с терминологией элементарной геометрии. Руководствуясь известными формулами для площади параллелограмма и объема трехмерного параллелепипеда, примем следующее индуктивное Определение 5. Объемом n-мерного (п > 1) параллелепипе- да называется произведение объема его основания на высоту. Объемом одномерного параллелепипеда Р(а) называется длина вектора а. Объем параллелепипеда Р обозначается через volP. Теорема 4. vol Р(аи ..., ап)2 =det G(at, ..., ап). Доказательство. Докажем эту формулу индукцией по п. При п = 1 она верна по определению. При п > 1 имеем, согласно определению, уо1Р(ап ..., an)=volP(an ..., ап_1) h, где h—длина вектора ort( e 1)ап, т.е. расстояние от вектора ап до подпространства {at,..., ап_ ]). Используя предположение индукции и теорему 3, получаем (vol P(a„ ..an))2 = det G(a1;..., an_,) • = = det G(a,,..., an). □
§ 4. ЕВКЛИДОВО ПРОСТРАНСТВО 209 В частности, мы видим, что, хотя основание параллелепипеда и зависит от того, какой из заданных векторов мы считаем «послед- ним», объем параллелепипеда в смысле данного выше определения зависит лишь от самого параллелепипеда. Наряду с формулами для площади параллелограмма и объема трехмерного параллелепипеда все это служит неплохим обоснованием приведенного определе- ния, однако по-настоящему убедительное обоснование может быть получено лишь в рамках теории меры, объясняющей, что вообще следует называть объемом множества. Пусть векторы aj,..., ап выражаются через векторы какого- нибудь ортонормированного базиса {е15..., еп) при помощи матри- цы А: (а1,...,ап) = (е1,...,еп)А. Теорема 5. vol Р(а{,..., an) = | det А|. Доказательство следует из того, что G(al,...,an) = ATEA = ATA и, значит, det С(аи ..., an) = (det А)2. □ Доказанное равенство можно понимать как «геометрический смысл» числа | det А|. Что касается знака числа det А, то он может быть истолкован как ориентация системы векторов {а1;..., ап} (по отношению к базису {ер..., еп}). Напомним, что при введении определителей порядка тг в § 2.4 мы как раз руководствовались тем, что определители порядков 2 и 3 задают ориентированную площадь параллелограмма и ориентированный объем параллелепипеда соот- ветственно. В § 2.2 было показано, что строение векторного пространства (над данным полем) зависит лишь от его размерности. Верно ли то же самое для евклидовых векторных пространств? Для того чтобы ответить на этот вопрос, надо, прежде всего, понять, какие евклидовы пространства следует считать «одинаково устроенными» или, точнее, изоморфными. Естественно принять следующее Определение 6. Евклидовы векторные пространства V и U называются изоморфными, если существует биективное отображе- ние /: V —> U, являющееся изоморфизмом векторных пространств и удовлетворяющее условию (f(a),f(b)) = (a,b) Va,beV. Само отображение f называется при этом изоморфизмом про- странств V и U.
210 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Ясно, что изоморфными могут быть только евклидовы простран- ства одинаковой размерности. Оказывается, верно и обратное. Теорема 6. Любые два евклидовых векторных пространства одинаковой (конечной) размерности изоморфны. Доказательство. Пусть V и U — какие-то n-мерные евк- лидовы пространства. Выберем в них ортонормированные базисы {г?н ..., ип) и {uj,.. ., ип} соответственно, и пусть /: V —>U — изо- морфизм векторных пространств, переводящий г>£ в и( (г — 1,..., тг). Тогда (Лч), /(Ч)) = (Ч, Ч) = 6а = (Ч, Ч')’ откуда по линейности вытекает, что (f(a),f(b)) = (a,b) для любых a, b eV. □ В частности, любое двумерное (соответственно трехмерное) евклидово пространство устроено совершенно так же, как Е2 (со- ответственно Е3). Пользуясь этим, в тех случаях, когда рассматри- ваемые векторы лежат в двумерном или трехмерном подпростран- стве, для доказательства каких-либо утверждений о них можно привлекать теоремы элементарной геометрии. Например, таким способом можно доказать неравенство Коши — Буняковского (19), неравенство треугольника (25) и теорему 2. § 5. Эрмитовы пространства При желании ввести метрику в комплексном векторном про- странстве подобно тому, как это делается в вещественном про- странстве, мы наталкиваемся на ту трудность, что в комплексном пространстве не существует положительно определенных квадра- тичных функций. Эту трудность можно обойти, введя в рассмотре- ние так называемые полуторалинейные функции (не очень удачный термин, но лучшего не придумано). Определение 1. Пусть V — комплексное векторное простран- ство. Функция а; V х V —>С называется полуторалинейной, если она линейна по второму аргументу и антилинейна по первому. Последнее означает, что a(xx+x2,y) = a(xi,y) + a(x2,y), а(Хх, у) = Аа(х, у). ЗАМЕЧАНИЕ 1. Иногда требуют, чтобы полуторалинейная функция была, наоборот, линейна по первому аргументу и анти- линейна по второму.
§ 5. ЭРМИТОВЫ ПРОСТРАНСТВА 211 Теория полуторалинейных функций аналогична теории билиней- ных функций. Поэтому мы изложим ее кратко, останавливаясь более подробно лишь в тех местах, где имеется существенное различие. Пусть {е1,...,еп} — базис пространства V. Полуторалинейная функция а определяется числами afJ- = a(ef, е;). А именно, y) = '£laijxiyj. (27) Ъ 3 Матрица А — (а^) называется матрицей функции а в базисе {еи ..., еп}. При переходе к другому базису (e'1,...,e’n) = (ei,...,en)C она преобразуется по правилу А' = С*АС, (28) где С* — с\ (Черта обозначает комплексное сопряжение, приме- ненное ко всем элементам матрицы С.) Функция а называется невырожденной, если Кег а = {у Е V: а(х, у) — 0 VxgV} = 0. Это равносильно невырожденности матрицы А. Полуторалинейная функция а называется эрмитовой (соответ- ственно косоэрмитовой), если а(у, х) = а(х, у) (соответственно а(у, х) = —а(х, у)). При умножении эрмитовой функции на i получается косоэрмитова функция, и наоборот. Функция а является эрмитовой (соответственно косоэрмитовой) тогда и только тогда, когда ее матрица А удовлетворяет условию А* = А (соответственно А* — — А). Такие матрицы называются эрмитовыми (соответственно косоэрмитовыми). Заметим, что диагональные элементы эрмитовой матрицы вещественны, а косо- эрмитовой — чисто мнимы. Каждой эрмитовой полуторалинейной функции а соответствует эрмитова квадратичная функция q(x) = а(х, х). Легко видеть, что все ее значения вещественны. Соотношения + у) = q(x) + q(y) + а(х, у) + а (у, х), q(x + iy) = q(x) + q(y) + ia(x, y) - ia(y, x) позволяют восстановить a no q. В частности, если q =0, то и а =0.
212 Гл. 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Пусть а — эрмитова полуторалинейная функция. Так же, как в случае симметрических билинейных функций, определяется ор- тогональность векторов и ортогональное дополнение к подпро- странству относительно а. Имеет место аналог предложения 3.2. С его помощью доказывается, что всякая эрмитова полуторалиней- ная функция и одновременно соответствующая ей квадратичная функция приводятся к нормальному виду a(x,y) = xiyl + ... + xkyk-xk + iyk + l- ,..-хк+1ук+1, ?(*) = |^|2 + ... + |zj2 - |zt + 1|2 - ... - |^ + z|2- Эрмитова квадратичная функция q (и соответствующая ей эр- митова полуторалинейная функция) называется положительно определенной, если q(x) > 0 при х^О. Это имеет место тогда и только тогда, когда в нормальном виде (29) к — п, 1=0. В общем случае имеет место закон инерции, утверждающий, что числа к и I определены однозначно. Они называются положитель- ным и отрицательным индексами инерции функции q. Так как для всякой комплексной матрицы det А* = det А, то определитель эрмитовой матрицы всегда веществен. Если все угловые миноры матрицы эрмитовой полуторалинейной функции отличны от нуля, то можно так же, как в случае билинейной функции, провести ортогонализацию базисных векторов и получить отсюда метод Якоби для определения индексов инерции по знакам угловых миноров. В частности, имеет место аналог критерия Сильвестра: эрмитова квадратичная функция положительно опре- деленна тогда и только тогда, когда все угловые миноры ее матрицы положительны. Комплексным аналогом евклидовых пространств являются эрми- товы пространства. Эрмитовым пространством называется ком- плексное векторное пространство, в котором фиксирована некото- рая положительно определенная эрмитова полуторалинейная функ- ция, называемая скалярным умножением и обозначаемая (, ). ПРИМЕР 1. Пространство С" со скалярным умножением (х, у) = х1у1 + ... + хпуп. Пример 2. Пространство непрерывных комплекснозначных функций на отрезке [0, 1] со скалярным умножением 1 ___ (/, в) = S f(x)g(x)dx. О
§ 5. ЭРМИТОВЫ ПРОСТРАНСТВА 213 В эрмитовом пространстве определяется длина вектора по фор- муле |х| = у/(х, х). В нем выполняются неравенство Коши — Буняковского |(х, з/)| < |я?||2/| и неравенство треугольника k + y|^|x| + |j/| (докажите их). Базис {ej,..., еп} эрмитова пространства называется ортонор- мированным, если в этом базисе скалярное умножение имеет нормальный вид, т.е. если (е;> еу)= 50- Матрица перехода от одного ортонормированного базиса к другому удовлетворяет условию С* = С~1. Такие комплексные матрицы называются унитарными. ЗАДАЧА 1. Записать условие унитарности матрицы через ма- тричные элементы двумя способами. Заметим, что определитель унитарной матрицы С по модулю равен 1. В самом деле, беря определитель от обеих частей равенства С*С = Е, получаем __________ det С • det С — 1, а это и означает, что | det (7| = 1. Так же, как и в случае евклидова пространства, для любого под- пространства U эрмитова пространства V получаем разложение V = U®UL. Если {еи..., et) — ортогональный базис подпространства U, то ортогональная проекция вектора х е V на U может быть найдена по формуле (е£,х) (Обратите внимание на отличие этой формулы от формулы (23).) В эрмитовом пространстве также справедливы аналоги тео- рем 4.2 и 4.3. С математической точки зрения эрмитовы пространства полезны по той же причине, что и комплексные числа. Это станет ясным в следующей главе. С физической точки зрения эрмитовы простран- ства необходимы для построения адекватной квантово-механиче- ской картины мира.
Глава 6 ЛИНЕЙНЫЕ ОПЕРАТОРЫ Теория линейных операторов — это ядро линейной алгебры и главный источник ее многочисленных приложений. Как и били- нейная функция, линейный оператор в конечномерном векторном пространстве задается квадратной матрицей, так что в каком-то смысле это объекты одинаковой сложности (но, конечно, симметри- ческая или кососимметрическая билинейная функция проще, чем произвольный линейный оператор). Мы сохраняем соглашения, принятые во введении к предыдущей главе. § 1. Матрица линейного оператора Определение 1. Линейным оператором (или линейным пре- образованием) в векторном пространстве V называется линейное отображение пространства V в себя. Более подробно, линейный оператор — это отображение Д: V —» —» V, удовлетворяющее условиям: 1) А(х + у) = Ах + Ау для любых х, у G V; 2) А(Хх) — ХАх для любых х eV, X е К. (Мы обычно будем обозначать линейные операторы рукописными буквами.) Если в пространстве V выбран базис {еи ..., еп}, то линейный оператор может быть задан матрицей. Определение 2. Матрицей линейного оператора А в ба- зисе {ej,...,en} называется матрица A—(ai:j), определяемая из равенств Деу = £а<уег (1) i Иначе говоря, в j-м столбце матрицы А стоят координаты вектора Деу в базисе {е1?..., е„}. (Обратите внимание, что, в отличие от определения матрицы линейного отображения, в этом определении фигурирует только один базис!)
§ 1. МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА 215 Равенства (1) можно переписать в следующей матричной форме: (Де1,...,Де„) = (е1,..., еп)А (2) (Ср. определение матрицы перехода в гл. 2, формула (7).) Очевидно, что для любых векторов eV существует единственный линейный оператор А, переводящий базисные век- торы е,, ..., еп в соответственно. Это оператор, перево- дящий каждый вектор x — '^xiei в вектор ЕЖ.Л- Следовательно, i i линейный оператор однозначно определяется своей матрицей, и лю- бая квадратная матрица порядка п является матрицей некоторого линейного оператора (в данном базисе). Найдем явное выражение координат образа у = Ах вектора х. При x — ^XjCj имеем У = Е ^Ае, = £ а0 et з *, / « где % = Е%Л- (3) 3 Если обозначить через X и Y столбцы координат векторов х и у соответственно, то равенства (3) можно переписать в следующей матричной форме: Y = АХ. (4) (Ср. формулу (8) преобразования координат в гл. 2.) Выясним, как преобразуется матрица линейного оператора при переходе к другому базису В силу линейности оператора А имеем (Де;,..., Ае’п) = (Деи ..., Аеп)С = = (e1,...,en)AC = (e1',...,e;)C-‘AC Таким образом, если обозначить через А' матрицу оператора А в базисе {е{,..., е^}, то А'^С-'АС. (5) Перейдя к другому базису, матрицу линейного оператора часто можно привести к более простому виду. В частности, такая возможность открывается, если известно какое-либо инвариантное подпространство. Определение 3. Подпространство U с V называется инвари- антным относительно оператора А, если AUG U (т. е. Au € U для любого и е U).
216 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Ограничение A\v линейного оператора А на инвариантное под- пространство U является линейным оператором в U. Если базис {е,,..., еп} пространства V выбран таким образом, что U = (еи ..., ек) (а это всегда можно сделать), то матрица оператора А в этом базисе имеет вид л _f В D \ гс\ А ~\0 С) ’ где В —матрица оператора Alv в базисе {е,,..ек}, С — квадратная матрица порядка п — к и D — какая-то матрица раз- мера к х (п — к). Обратно, если матрица оператора А в базисе {б],..еп} имеет вид (6), где В — квадратная матрица порядка к, то U = (е1;..., ек) — инвариантное подпространство. Еще лучше обстоит дело, когда пространство V удается разло- жить в прямую сумму двух инвариантных подпространств U и W: V = U®W. Если {е1;..et} — базис подпространства U, a {et + 1,..., еп} — базис подпространства W, то {е1;..., еп} — базис пространства V и в этом базисе матрица оператора А имеет вид 0 С J ’ В О А = (7) где В —матрица оператора А\и в базисе {в],..., ек}, а С — матрица оператора A\w в базисе {et + 1,..еп}. Более общо, если пространство V разложено в прямую сумму к инвариантных подпространств VJ, V2,..Vk, то в базисе простран- ства V, составленном из базисов этих подпространств, матрица оператора А имеет вид (8) где А,-—матрица оператора A\v. Пример 1. Поворот на угол а является линейным оператором в Е2 (см. пример 2.3.1). В примере 2.3.5 мы доказали, что его матрица в ортонормированном базисе {еи &,} есть матрица I COSO! _sina ' ’ \ sin a cos a (9)
§ 1. МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА 217 В частности, поворот на имеет в таком базисе матрицу Найдем его матрицу А' в базисе ei'=2e2, е^ = е1-е2. (10) Как видно из рис. 1, Ае{ = — е{ — 2е^, Ае^ = е[ + е'2. Это означает, что получаем Матрица А' может быть, конечно, най- дена и по формуле (5). Из формулы (10) Рис. 1 Следовательно, 2 \ 2 I . 0 / ПРИМЕР 2. Аналогично, поворот вокруг какой-либо оси на угол а является линейным оператором в Е3. В ортонормированном базисе {е1; 62,63}, при условии, что вектор е3 направлен по оси поворота, матрица этого оператора имеет вид А = cos а sin а 0 - sin а cos а 0 0\ 0 1 / П(а) 0 0 1 Этот вид согласуется с разложением пространства Е3 в прямую сумму двух инвариантных подпространств: -®3 — (ei> ег) ® (е3) . (Н) Пример 3. В примере 2.3.2 мы рассматривали ортогональное проектирование на плоскость как линейное отображение простран- ства Е3 в пространство векторов этой плоскости. Однако его можно
218 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ рассматривать и как линейный оператор в пространстве Е3. В ортонормированном базисе, первые два вектора которого лежат в плоскости проектирования, его матрица имеет вид 1 О О А = 0 1 О \0 О О Разложение (И) и в этом случае является разложением в прямую сумму инвариантных подпространств. Пример 4. Дифференцирование — линейный оператор в про- странстве многочленов. Это пространство бесконечномерно, но оно является объединением конечномерных инвариантных подпро- странств, состоящих из многочленов не выше заданной степени. В базисе {1, х, х2,..., г") пространства многочленов степени не выше п оператор дифференцирования имеет матрицу В базисе {1, р, .., ру} этот же оператор имеет более простую матрицу О 0\ О О о о /О 1 о О 0 1 ООО (12) ООО \о о о О 1 о о/ ПРИМЕР 5. Пусть — какое-либо биективное преобразование множества X. Тогда отображение </>„, определяемое формулой = '(х)), (13) является линейным оператором в пространстве Е(Х, К) функций на X со значениями в К. (Можно было бы действовать на аргумент функции самим преобразованием <р, а не его обратным, но последнее удобнее по причине, которая будет объяснена в гл. 10.) Например, пусть X = R, К = R, <р(х) = х + a (a G R). Тогда Ш№) = /(х-а).
§ 1. МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА 219 (График функции iptf получается из графика функции f сдвигом вправо на а.) Так как cos(a: — a) — cos а cos х + sin а • sin х, sin(rr — а) — — sin а • cos х + cos а sin х, то подпространство (cos х, sin х) инвариантно относительно ipt, причем матрица ограничения преобразования на это подпро- странство в базисе {cos х, sin х} имеет вид cos а — sin а sin a cos а ПРИМЕР б. В любой алгебре преобразование La: х^ах (а Е А), называемое левым умножением на элемент а, является линейным оператором. Рассмотрим, например, поле С как алгебру над R. Равенства = П(а). a b\ с d (а+ Ы) 1 = а+ Ы, (а+ Ы) • i = —b + at показывают, что матрица оператора La+bi в базисе {1, г} есть а —Ь | Ь а J ' Задача 1. Найти матрицу левого умножения на А = в алгебре L2(K) в базисе, составленном из матричных единиц. Доказать инвариантность подпространств (Еп, Е21) и (£^12, Е22). Линейные операторы в одном векторном пространстве можно складывать, умножать друг на друга и умножать на числа. Эти опе- рации определяются так же, как для общих линейных отображений (см. §2.3). Им соответствуют такие же операции над матрицами, т.е., например, матрица произведения двух линейных операторов в каком-либо базисе равна произведению их матриц в том же базисе. Из свойств операций над линейными отображениями, доказан- ных в §2.3, следует что совокупность всех линейных операторов в векторном пространстве V является ассоциативной алгеброй. Мы будем обозначать эту алгебру через L(V). Отметим, что если dim V = п, то dim L(V) = dim Ln(K) = n2. Алгебра L(V) обладает единицей. Ею является тождественный оператор, который мы будем обозначать буквой £. Матрица оператора £ в любом базисе есть единичная матрица Е.
220 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Линейный оператор Де L(V) обратим тогда и только тогда, когда Кег Д = 0 и Im Д= V. Из теоремы 2.3.3 следует, что в конечномер- ном случае, если Кег Д = 0, то автоматически Im Д= V, и обратно. С другой стороны, ясно, что линейный оператор обратим тогда и только тогда, когда его матрица обратима, т.е. невырожденна. В общем случае размерность подпространства 1тД называется рангом, линейного оператора А и обозначается через rk А. В силу следствия 1 теоремы 2.3.3 она равна рангу матрицы оператора А (в любом базисе). Из формулы (5) следует, что определитель матрицы оператора А не зависит от выбора базиса. Он называется определителем линейного оператора А и обозначается через det А. § 2. Собственные векторы Основная задача теории линейных операторов состоит в приве- дении матрицы линейного оператора к возможно более простому виду за счет выбора подходящего базиса. Как мы уже отмечали, для этого полезно знать инвариантные подпространства. Особую роль играют одномерные инвариантные подпространства. Их рассмотрение приводит к понятию собствен- ного вектора. Определение 1. Ненулевой вектор е G V называется собствен- ным вектором оператора А, если Ае = Хе. Число A G К называ- ется при этом собственным значением оператора А, отвечающим собственному вектору е. Очевидно, что ненулевой вектор е является собственным тогда и только тогда, когда одномерное подпространство (е) инвариантно. В базисе, составленном из собственных векторов (если таковой су- ществует), матрица оператора диагональна, что является пределом мечтаний. ПРИМЕР 1. Для оператора дифференцирования в пространстве многочленов единственным с точностью до пропорциональности собственным вектором является многочлен 1 (причем соответству- ющее собственное значение равно 0). Таким образом, в этом случае из собственных векторов нельзя составить базиса. ПРИМЕР 2. Собственные векторы поворота на угол а / ten в трехмерном пространстве — это векторы, лежащие на оси поворо- та, причем соответствующее им собственное значение равно 1. При а = кя собственными (с собственным значением (—1)*) являются также векторы, ортогональные оси поворота. Таким образом, базис
§ 2. СОБСТВЕННЫЕ ВЕКТОРЫ 221 из собственных векторов в этом примере существует только тогда, когда а = 0 или тг (если считать, что 0 < а < 2тг). Для существования собственного вектора с собственным значе- нием Л необходимо и достаточно, чтобы оператор А — Х£ был вырожден, т.е. чтобы det(.A — А£) = 0. Если А ~(а^)— матрица оператора А в каком-либо базисе, то det(A — t£) = Оц t °21 а12 а22 — uln °2п а 1 п 1 ап2 откуда видно, что det(A - t£) представляет собой многочлен степени тг от t. Определение 2. Многочлен /4(t) = (-l)"det(X- i£) = det(tf-Л) называется характеристическим многочленом оператора А. Легко видеть, что коэффициент при tn многочлена fA(t) равен 1, а коэффициент при равен — tr А, где tr А — след матрицы А (сумма ее диагональных элементов). Свободный член многочлена /ДО равен/ДО) = (-1 Г det А. ЗАДАЧА 1. Доказать, что коэффициент при tn~k многочлена fA(t) равен (—1)* х(сумма главных миноров порядка к матрицы А). (Главным минором квадратной матрицы называется определитель ее подматрицы, расположенной симметрично относительно главной диагонали.) Отметим, что характеристический многочлен линейного операто- ра в силу своего определения не зависит от выбора базиса. Отсюда, в частности, вытекает, что след матрицы линейного оператора не зависит от базиса. Выше была фактически доказана Теорема 1. Собственные значения линейного оператора — это в точности корни его характеристического многочлена. Следствие. Любой линейный оператор в комплексном век- торном пространстве имеет собственный вектор. Линейный оператор в вещественном векторном пространстве может не иметь собственных векторов, как показывает пример поворота плоскости на угол а / 0, тг. Однако использование ком- плексных чисел позволяет получить полезную информацию и о
222 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ линейных операторах над полем вещественных чисел. Это достига- ется с помощью так называемой комплексификации. Пусть V — вещественное векторное пространство. Построим из него комплексное векторное пространство V(C) аналогично тому, как из поля R строится поле С. А именно, элементами пространства У(С) будем считать пары (х, у), где x,yeV. Определим сложение таких пар и умножение на комплексные числа по правилам (®1> У1) + (^, У2) = (;с1 + а=2> У1 + %), (А + гр)(х, у) = (Ах - цу, рх + Ху). Легко проверить, что при этом получится векторное пространство над С. Согласно данному определению, сложение пар вида (х, 0) и их умножение на вещественные числа сводится к соответствующим операциям над их первыми компонентами. Отождествим каждую пару вида (х, 0) с вектором х G V; тогда пространство V окажется вложенным в У(С) в виде вещественного подпространства. При этом окажется, что (х, у) = х + iy. Любой базис пространства V (над R) является в то же время базисом пространства V(С) (над С). Однако в пространстве V(С) существуют и другие базисы. Любой линейный оператор А в пространстве V однозначно продолжается до линейного оператора Ас в пространстве V(C). При этом в базисе, составленном из вещественных векторов, оператор Ас имеет такую же матрицу, как и оператор А. Оператор Ас может иметь мнимые собственные значения и соответствующие им мнимые собственные векторы. Какой смысл они имеют в вещественных терминах? Предложение 1. Вектор х + iy (х, у G V) является соб- ственным вектором оператора Ас с мнимым собственным значением X + ip (А, р G R, р у^О) тогда и только тогда, когда U — (х, у) CV — двумерное инвариантное подпространство для оператора А, причем Ах-Хх-ру, Ау — рх + Ху. Доказательство проводится непосредственным вычислением. Ра- венства (14) означают, что в базисе {х, у} пространства U оператор A\v имеет матрицу л)' <15> \ —fJL Л j
§ 2. СОБСТВЕННЫЕ ВЕКТОРЫ 223 Из них также следует, что вектор х — iy является собственным вектором оператора Ас с собственным значением А — щ. Пример 3. Оператор А поворота евклидовой плоскости на угол а в ортонормированном базисе {еи имеет матрицу П(а) (см. (9)). Следовательно, вектор е1 + ге^ является собственным вектором оператора Ас с собственным значением cos а — г sin а, а вектор в] — ге2 — собственным вектором с собственным значением cosa + isina. Таким образом, матрица поворота может быть приведена к диагональному виду в комплексном пространстве. В качестве следствия предыдущего предложения получается важная Теорема 2. Для любого линейного оператора над полем вещественных чисел существует одномерное или двумерное инвариантное подпространство. При заданном собственном значении А собственные векторы находятся из системы однородных линейных уравнений (А-ХЕ)Х=О, где X обозначает столбец координат неизвестного вектора. Вместе с нулевым вектором они составляют подпространство У\(Л) = Кег(Л—А£), называемое собственным подпространством оператора А, от- вечающим собственному значению А. Его размерность равна п — гк(Д — ХЕ), где п — dim V. Теорема 3. Собственные подпространства, отвечающие различным собственным значениям А1,...,Аа. оператора А, линейно независимы. Доказательство. Докажем утверждение теоремы индукци- ей по к. При к = 1 доказывать нечего. Пусть к > 1 и ... + ек _, + ек — 0 (е, € К,. (-4))- Применяя оператор А, получаем A^j +... + At_1eA:_1 + Хкек =0. Вычитая отсюда исходное равенство, умноженное на Хк, получаем (^i ~ + • • • + Ot-i ~ \)et-i =о, откуда в силу предположения индукции следует, что ег = ... ... = ек _ ] = 0. Но тогда и ек — 0. □
224 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Следствие. Если характеристический многочлен fA(t) име- ет п различных корней, то существует базис из собственных векторов оператора Л. Указанное условие не является необходимым для существования базиса из собственных векторов. Так, для тождественного опера- тора £ все векторы являются собственными, и, стало быть, любой базис состоит из собственных векторов, однако его характеристиче- ский многочлен /£(t) = (t — 1)п имеет единственный (но тг-кратный) корень 1. Рассмотрим два более интересных (и важных) примера. ПРИМЕР 4. Пусть V = U ф W. Линейный оператор Р, опреде- ляемый формулой P(y + z) = y (yEU,z€W), называется проектором на U параллельно W. Очевидно, что tf = v,(P), w = v0(p). В базисе пространства V, составленном из базисов подпро- странств U и W, оператор Р записывается диагональной матрицей с числами 1 и 0 по диагонали. ЗАДАЧА 2. Доказать, что линейный оператор Р является про- ектором (для каких-то U и W) тогда и только тогда, когда Р2 = Р. ПРИМЕР 5. В тех же обозначениях линейный оператор Р, определяемый формулой Р(у + z) — у — z (y€U,z€W), называется отражением относительно U параллельно W. Очевид- но, что U^VJP), W^V_i(P). В базисе пространства V, составленном из базисов U и W, оператор Р записывается диагональной матрицей с числами 1 и — 1 по диагонали. ЗАДАЧА 3. Доказать, что линейный оператор Р является отра- жением (для каких-то U и W) тогда и только тогда, когда Р2 = £. Для получения необходимого и достаточного условия существо- вания базиса из собственных векторов докажем сначала Предложение 2. Характеристический многочлен ограниче- ния линейного оператора на инвариантное подпространство делит характеристический многочлен самого оператора.
§ 2. СОБСТВЕННЫЕ ВЕКТОРЫ 225 Доказательство. Пусть В — ограничение оператора А на инвариантное подпространство U С V. В базисе пространства V, первые векторы которого составляют базис подпространства U, ма- трица А оператора А имеет вид (6), где В —матрица оператора В. Следовательно, fA(t) = fB(t)det(tE-C). □ (16) Следствие. Размерность собственного подпространства ли- нейного оператора не превосходит кратности соответствую- щего корня характеристического многочлена. Доказательство. Пусть dim Vx (Д) = к. Тогда характери- стический многочлен ограничения оператора А на УД Л) равен (t — А)*. Применяя предложение 2 к подпространству U = УД Л), мы и получаем доказываемое утверждение. □ Пример 6. Рассмотрим оператор дифференцирования в про- странстве многочленов степени не выше п. Из вида его матрицы, найденной в примере 1.4, следует, что его характеристический многочлен равен tn + 1. Он имеет корень 0 кратности п + 1, однако размерность соответствующего собственного подпространства рав- на 1 (см. пример 1). Этот пример показывает, что размерность соб- ственного подпространства может быть строго меньше кратности соответствующего корня характеристического многочлена. Теорема 4. Для существования базиса из собственных век- торов линейного оператора А необходимо и достаточно, чтобы выполнялись следующие условия'. 1) характеристический многочлен fA(t) разлагается на ли- нейные множителщ 2) размерность каждого собственного подпространства рав- на кратности соответствующего корня многочлена fA(t). Доказательство. Пусть А1;..., А, — все корни многочлена fA(t) и fcj,..., ks — их кратности. Собственное подпространство, отвечающее At, обозначим через Vt. Согласно следствию предло- жения 1, dim Vt < fcj и, значит, Xdim у;-<х < п- (17) i i ' Однако единственный способ получить базис из собственных векто- ров — это взять объединение базисов собственных подпространств. Для того чтобы при этом действительно получился базис простран- ства V, необходимо и достаточно, чтобы X dim Vt = п.
226 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Ввиду (17) это равносильно тому, что 52 — п и dim Vf = к( для всех г. Первое из этих условий означает, что fA(t) разлагается на линейные множители, а второе — это как раз условие 2) теоремы. □ § 3. Линейные операторы и билинейные функции в евклидовом пространстве Пусть V — евклидово пространство и {еи ..еп} — его ортонор- мированный базис. Каждому вектору а G V соответствует линейная функция <ра(х) = (х, а). (18) При этом коэффициенты <ро(е,) = (е,., а) линейной функции у?о в базисе {е15..., е„} равны координатам вектора а в этом бази- се. Отсюда следует, что отображение а ipa есть изоморфизм пространства V на пространство V*. Отметим, что определение этого изоморфизма не зависит от выбора базиса. Таким образом, в случае конечномерного евклидова пространства как бы исчезает разница между пространством и его сопряженным. Часто говорят «отождествим при помощи канонического изоморфизма евклидово пространство V с его сопряженным пространством», имея в виду указанный выше изоморфизм. Аналогично, каждому линейному оператору А в пространстве V соответствует билинейная функция <Рд(я, У) = (х,Ау). (19) При этом матрица билинейной функции <рА(х, у) в базисе {ер..., еп} совпадает с матрицей оператора А в этом базисе. В самом деле, <рл(е£, еу) = (е£, Ае^) есть не что иное, как г-я координата вектора Де; . Отсюда следует, что отображение А*—>'-рл есть изоморфизм пространства линейных операторов на простран- ство билинейных функций в пространстве V. Определение этого изоморфизма не зависит от выбора базиса. Однако в неортонор- мированном базисе матрица функции <рл не обязана совпадать с матрицей оператора А. Для каждой билинейной функции можно определить «транс- понированную» функцию <^т(х, у) = <р(у, х), матрицей которой в любом базисе является транспонированная матрица функции <р. Линейный оператор А*, соответствующий
§ 3. ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 227 функции <рд, называется сопряженным оператором по отноше- нию к А. Иначе говоря, сопряженный оператор определяется тождеством (А*х, у) = (х, Ау). (20) Матрицей оператора А* в ортонормированном базисе является транспонированная матрица оператора А. Симметрическим (соответственно кососимметрическим) били- нейным функциям соответствуют так называемые симметрические (соответственно кососимметрические) линейные операторы. Они характеризуются тем, что А* — А (соответственно А* — —А), а в матричных терминах — тем, что их матрица в ортонормированном базисе симметрична (соответственно кососимметрична). Симметри- ческие операторы называют также самосопряженными. Пример 1. Ортогональный проектор на подпространство является симметрическим оператором (проверьте это). Линейные операторы, для которых А* =А~1, называются орто- гональными. Иначе говоря, оператор А ортогонален, если (Ах, Ау) = (х, у), (21) т. е. если А сохраняет скалярное произведение векторов. Из тож- дества у) = з(к + у12 - И2 - Ы2) следует, что оператор А ортогонален тогда и только тогда, когда он сохраняет длины векторов. ПРИМЕР 2. Линейный оператор, индуцированный в простран- стве геометрических векторов любым движением, ортогонален. Пример 3. Ортогональное отражение относительно подпро- странства (т.е. отражение параллельно ортогональному подпро- странству) является ортогональным оператором. В матричных терминах ортогональные операторы характеризуют- ся тем, что их матрица в ортонормированном базисе ортогональна (см. определение 5.4.3). Предложение 1. Линейный оператор любого из рассмотрен- ных выше трех типов, т. е. симметрический, кососимметри- ческий или ортогональный, обладает следующим свойством: если подпространство U инвариантно, то и его ортогональное дополнение инвариантно.
228 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Доказательство. Рассмотрим наиболее сложный случай ортогонального оператора А. Заметим, прежде всего, что оператор ЛУ также ортогонален и, следовательно, невырожден. Поэтому для любого вектора х е U найдется такой вектор zeU , что x = Az. Возьмем теперь любой вектор ye U-1-. Тогда, используя предыдущие обозначения, получаем для любого х G U (х, Ay) = (Az, Ay) = (z, у) = О, откуда следует, что Ay е UL. □ С помощью этого предложения и теоремы 2.4 мы можем, рас- суждая индукцией по размерности, получить канонический вид для матриц линейных операторов рассматриваемых трех типов. Теорема. 1. Для любого симметрического оператора А суще- ствует ортонормированный базис из собственных векторов. Доказательство. Достаточно доказать существование хотя бы одного собственного вектора. В силу теоремы 2.2 достаточно сделать это для двумерного пространства. Матрица симметриче- ского оператора в ортонормированном базисе в этом случае имеет вид & с ) ’ и хаРактеРистическ™ многочлен равен fA(t) = t2 - (а + c)t + (ас - b2). Дискриминант этого квадратного трехчлена D = (а + с)2 — 4(ас — Ь2) = (а — с)2 4-4Ь2 всегда неотрицателен, так что fA(t) имеет вещественные корни и, значит, А имеет собственные векторы. □ Следствие!. Характеристический многочлен симметриче- ского оператора разлагается на линейные множители (над R); размерность каждого собственного подпространства рав- на кратности соответствующего корня; собственные под- пространства, отвечающие различным корням, ортогональны друг другу. Для доказательства последнего утверждения надо заметить, что если {gj,..., еп} — базис из собственных векторов оператора А, причем Ле4 = А,е<, то УД Л) есть линейная оболочка тех е,-, для которых А, = А. Впрочем, его легко можно доказать и непосредст- венно. В самом деле, пусть х е у (Л), у е Ур(А), А р. Тогда А (х, у) = (Ах, у) = (х, Ау) = р(х, у),
§ 3. ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 229 откуда (х, у) = 0. □ Используя описанное выше соответствие между симметриче- скими операторами и симметрическими билинейными функциями, получаем Следствие 2. Для любой квадратичной функции q в евкли- довом пространстве существует ортонормированный базис, в котором ее матрица диагональна, т. е. q(x) = Xlxf + ... + Xnx*. (22) Нужно понимать, что в формулировке этого следствия речь идет об ортонормированности в смысле скалярного умножения, а не в смысле симметрической билинейной функции <р, соответствующей q. Однако, поскольку матрица функции <р в указанном базисе диагональна, этот базис является также ортогональным (но, вообще говоря, не ортонормированным) в смысле функции <р. Отметим, что числа А А п — это собственные значения соответствующего симметрического оператора и, следовательно, определены однозначно с точностью до перестановки. Выражение (22) называют каноническим видом квадратичной функции q, а нахождение ортонормированного базиса, в котором функция q имеет такой вид, часто называют приведением к глав- ным осям. Используя соответствие между симметрическими операторами и квадратичными функциями в евклидовом пространстве в обратном направлении, можно получить другое доказательство существова- ния собственного вектора у симметрического оператора. А именно, пусть q — квадратичная функция, соответствующая данному симметрическому оператору А, т. е. q(x) = {Ах, х). Заметим, что функция q, будучи непрерывной, должна иметь максимум на единичной сфере S пространства V, задаваемой уравнением (х, х) = 1. Предложение 2. Всякая точка максимума функции q на сфере S является собственным вектором оператора А, а сам максимум равен соответствующему собственному значению. Доказательство. Касательное пространство сферы S в точке х задается уравнением (х, dx) — 0,
230 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ т.е. представляет собой ортогональное дополнение к подпростран- ству (х). С другой стороны, дифференциал функции q равен dq(x) = (Adx, х) + (Ах, dx) = 2(Ах, dx). Если функция q достигает максимума в какой-то точке е е S, то ее дифференциал обращается в нуль на касательном пространстве сферы S в этой точке. В силу предыдущего это означает, что вектор Ае ортогонален всем векторам, ортогональным е, откуда Ае = Хе. При этом q(e) = (Ае, е) = А(е, е) = А. □ В этом доказательстве мы использовали только необходимое условие максимума, которое выполнено в любой критической точке функции q на S, в частности, в любой точке минимума. Ясно, что собственный вектор е € S действительно является точкой максимума, только если А — максимальное собственное значение оператора А. Симметрический оператор называется положительно опреде- ленным, если соответствующая ему квадратичная функция поло- жительно определенна или, что равносильно, если все его собст- венные значения положительны. Перейдем теперь к линейным операторам других типов. Теорема 2. Для любого кососимметрического линейного опе- ратора А существует ортонормированный базис, в котором его матрица имеет вид 0 Н(ак) 0 0/ где Н(а) = ( 0 . ' ' \ а 0 ) Доказательство очевидно, поскольку Н(а) — это общий вид матрицы кососимметрического оператора в ортонормированном базисе в двумерном евклидовом пространстве. □
§ 3. ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 231 ществует имеет вид /П(а.) А = гйеП(а) - ^os а ' ' I sin а О Теорема 3. Для любого ортогонального оператора А су- чированный базис, в котором его матрица о А П(а*) -1 -1 1 1 — sin а А cos a J' Заметим, что, используя матрицы П(тг) = ( —л Y ) и (1 О А \ -1 / q 1 I, можно при желании оставить не более одного свободного диагонального элемента, равного —1, и не более одного, равного 1. Доказательство. Достаточно рассмотреть ортогональные операторы в одномерном и двумерном пространствах. В одномер- ном пространстве ортогональный оператор — это умножение на ±1. В двумерном пространстве всякий ортогональный оператор А , как мы показали в примере 4.1.9, есть либо поворот на некоторый угол а, либо отражение относительно некоторой прямой. В первом случае матрица оператора А в (любом) ортонормированном базисе имеет вид П(а). Во втором случае существует ортонормированный базис, в котором матрица оператора А имеет вид □ В частности, в трехмерном евклидовом пространстве матрица любого ортогонального оператора А в подходящем ортонормиро- ванном базисе имеет один из следующих двух видов: (П(а) 0\ / П(а) 0\ \ 0 1/’ \ О -1J' В первом случае оператор А представляет собой поворот на угол а вокруг некоторой оси, во втором — зеркальный поворот, т.е. поворот, совмещенный с отражением относительно плоскости, ортогональной оси поворота.
232 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Ясно, что зеркальный поворот не может быть результатом непре- рывного движения, так как он изменяет ориентацию пространства. Следовательно, конечный результат сколь угодно сложного реаль- ного движения твердого тела с закрепленной точкой — такой же, как при простом повороте вокруг подходящей оси на подходящий угол. Эта совершенно не тривиальная теорема называется теоре- мой Эйлера. Ортогональные операторы в евклидовом пространстве V образу- ют подгруппу группы GL(V), называемую ортогональной группой и обозначаемую O(V). Соответственно этому ортогональные ма- трицы образуют подгруппу группы GLn(R), обозначаемую Оп (это согласуется с обозначением, введенным в примере 4.1.9). Как мы уже заметили в § 5.4, определитель ортогональной матрицы равен ±1. Ортогональные матрицы с определителем 1 образуют подгруппу индекса 2 в Оп, обозначаемую SOn. Соот- ветственно этому ортогональные операторы с определителем 1 образуют подгруппу индекса 2 в O(V), называемую специальной ортогональной группой и обозначаемую SO(V). Операторы из SO(V) геометрически истолковываются как ортогональные опера- торы, сохраняющие ориентацию пространства (см. пример 4.6.16). Пример 4. Группа О2 = О(£2) состоит из поворотов, составля- ющих подгруппу SO2 = SO(£2), и отражений относительно прямых. Рис. 2 Рис. 3 Обозначим через за поворот на угол а и через га — отражение относитель- но прямой, образующей угол а с какой- либо фиксированной прямой I. Ясно, что sasi3 — sa + /). Далее, произведение поворота и отражения меняет ориента- цию и, следовательно, является отра- жением. Проследив за какой-нибудь од- ной точкой (см. рис. 2, а), 2, б)), легко
§ 3. ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 233 установить, что Sa Г3 — Г3 + f ’ Г33а = Г3- Наконец, произведение двух отражений сохраняет ориентацию и, следовательно, является поворотом. Проследив за одной точкой (рис. 3), легко установить, что rar3 = s2(a_0), т. е. произведение двух отражений есть поворот на удвоенный угол между их осями. В частности, отсюда следует, что группа О2 порождается отра- жениями. ЗАДАЧА 1. Доказать, что группа О(У) порождается отражени- ями относительно (п - 1)-мерных подпространств (где п = dim V). Всякий линейный оператор в евклидовом пространстве единст- венным образом представляется в виде суммы симметрического и кососимметрического операторов (ср. пример 5.1.1). Имеется мультипликативный аналог этого разложения, в котором косо- симметрический оператор заменяется ортогональным (почему так происходит, станет ясно в гл. 12). Теорема 4. Всякий невырожденный линейный оператор в евклидовом пространстве единственным образом представ- ляется в виде произведения положительно определенного сим- метрического и ортогонального операторов. Такое представление линейного оператора называется его поляр- ным разложением. Перед тем как доказывать эту теорему, докажем следующее Предложение 3. Всякий положительно определенный сим- метрический оператор В единственным образом представля- ется в виде В = С2, где С — также положительно определенный симметрический оператор. Доказательство. Пусть А],...,А,— (различные) собст- венные значения оператора В и Vi,...,Vs — соответствующие собственные подпространства. По условию А,- положительны. По- ложим р{ = у/\ (арифметическое значение корня). Тогда линейный оператор С, действующий в V- как умножение на р{, удовлетворяет условиям предложения. (В частности, он симметричен, поскольку его матрица в ортонормированном базисе, составленном из собст- венных векторов оператора В, диагональна.) Обратно, пусть оператор С удовлетворяет условиям предложе- ния. Пусть Pi,..., р„— его (различные) собственные значения
234 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ и Wt,..Wa — соответствующие собственные подпространства. Тогда оператор С2 = В действует на W{ как умножение на /и.2. Следовательно, при подходящей нумерации ц2 = А,. и Wi — Vt. Это показывает, что оператор С определен однозначно. □ Доказательство теоремы 4. Пусть А — невырожден- ный линейный оператор. Предположим, что А — СО, где С — по- ложительно определенный симметрический, а О — ортогональный операторы. Тогда АА* = СОО*С* = С2. Ввиду предложения 3 этим однозначно определяется оператор С, а тем самым и О. Обратно, из равенства (х, АА*у) = (А*х, А*у) и невырожденности оператора А (и, значит, А*) следует, что АА* — положительно определенный симметрический оператор. Пользуясь предложением 3, найдем такой положительно опреде- ленный симметрический оператор С, что АА* = С2, и положим О = С~'А. Тогда А = СО и АА* = СОО*С = С2, откуда после сокращения на С получаем, что ОО* = 8, т.е. О — ортогональный оператор. □ ПРИМЕР 5. Всякую деформацию твердого тела с закрепленной точкой в первом приближении можно рассматривать как невырож- денный линейный оператор. Пусть А = СО — полярное разложение этого оператора. Тогда О — это поворот вокруг некоторой оси, который не является истинной деформацией в том смысле, что он не приводит к возникновению каких-либо напряжений в теле. С другой стороны, оператор С по теореме 1 есть комбинация растяже- ний (или сжатий) в трех взаимно перпендикулярных направлениях и тем самым представляет собой «чистую деформацию». Именно этот оператор, называемый тензором деформации, участвует в формулировке закона Гука. ЗАДАЧА 2. Доказать, что всякую матрицу А е GLn(R) можно представить в виде А = O^DO^ где О2 — ортогональные матри- цы, a D — диагональная матрица с положительными элементами. Насколько однозначно такое представление? Аналогичная теория имеется для линейных операторов в эрми- товом пространстве, причем она даже проще, так как в эрмито- вом пространстве всякий линейный оператор имеет собственный
§ 3. ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 235 вектор. Изложим ее вкратце, опуская доказательства, аналогичные приведенным выше в евклидовом случае. Для любого линейного оператора А в эрмитовом пространстве определяется сопряженный оператор А* по формуле (20). Если оператор А в некотором ортонормированном базисе имеет матрицу А, то оператор А* в том же базисе имеет матрицу А*. (Напомним, что А* = Ат.) Линейный оператор А называется эрмитовым (соответствен- но косоэрмитовым, унитарным), если А* = А (соответственно А* = —А, А* =Д”'). Это эквивалентно тому, что его матрица в ор- тонормированном базисе эрмитова (соответственно косоэрмитова, унитарна). Эрмитовы операторы называют также самосопряжен- ными. Для любого из этих типов линейных операторов доказывается су- ществование ортонормированного базиса из собственных векторов. При этом собственные значения эрмитова оператора вещественны, косоэрмитова — чисто мнимы, а унитарного — по модулю равны единице. Докажем, например, что собственные значения эрмитова опера- тора А вещественны. Пусть е — собственный вектор оператора А с собственным значением А. Тогда А(е, е) = (Ае, е) — (е, Ае) = А(е, е), откуда А = А. Формула (19) устанавливает биекцию между множествами эр- митовых операторов и эрмитовых полуторалинейных функций. При этом в любом ортонормированном базисе матрицы эрмитова оператора и соответствующей ему эрмитовой функции совпадают. Применяя теорему о существовании ортонормированного базиса из собственных векторов эрмитова оператора, мы получаем, что для любой эрмитовой квадратичной функции q в эрмитовом простран- стве существует ортонормированный базис, в котором ее матрица диагональна, т. е. д(20 = А1Ы2 + ... +Ajzj2. (23) Числа А],..., Ап определены однозначно с точностью до пере- становки, так как это собственные значения соответствующего эрмитова оператора. Выражение (23) называют каноническим видом эрмитовой квадратичной функции q. Эрмитов оператор называется положительно определенным, ес- ли соответствующая ему эрмитова квадратичная функция положи- тельно определенна или, что равносильно, если все его собственные значения положительны.
236 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Унитарные операторы в эрмитовом пространстве V образуют подгруппу группы GL(V), называемую унитарной группой и обозначаемую U(V). Соответственно этому унитарные матрицы образуют подгруппу группы GLn(C), обозначаемую Un. Унитарные операторы (соответственно матрицы) с определите- лем 1 образуют подгруппу в U(V) (соответственно в Un), назы- ваемую специальной унитарной группой и обозначаемую SU(V) (соответственно SUn). Всякий невырожденный линейный оператор в эрмитовом про- странстве единственным образом представляется в виде произве- дения положительно определенного эрмитова и унитарного опера- торов. Такое представление линейного оператора называется его полярным разложением. В одномерном случае линейный оператор есть просто комплексное число, а его полярное разложение — тригонометрическая форма этого числа. Поскольку тригонометри- ческая форма комплексного числа связана с полярными координа- тами на плоскости, это объясняет термин «полярное разложение» в общем случае. Комплексификация V(C) евклидова пространства V канониче- ским образом превращается в эрмитово пространство, если опре- делить скалярное умножение по формуле (х, + iylf ж, + гу2) = [(х1; Жг) + (у,, у2)] + г[(х1; у2) - (у,, ж,)]. При этом комплексное продолжение Ас симметрического (соответ- ственно кососимметрического, ортогонального) оператора А будет эрмитовым (соответственно косоэрмитовым, унитарным) операто- ром. Используя эти соображения, можно дать еще одно доказа- тельство существования собственного вектора у симметрического оператора А в евклидовом пространстве V. А именно, пусть x + iy (х, yEV) — какой-либо собственный вектор оператора Ас. Так как оператор Ас эрмитов, то соответствующее собственное значение А вещественно и, значит, Ах = Ах, Ау — А у. Хотя бы один из векторов х, у отличен от нуля; он и будет собственным вектором оператора А.
§ 4. ЖОРДАНОВА ФОРМА 237 § 4. Жорданова форма Для некоторых специальных типов линейных операторов, как, на- пример, симметрических, эрмитовых и унитарных, рассмотренных в предыдущем параграфе, удается доказать возможность приведения их матрицы к диагональному виду. В общем случае для этого имеются препятствия, указанные в теореме 2.4. Первое из них состоит в том, что характеристический многочлен может не разлагаться на линейные множители, т. е. иметь менее чем п корней. Его не существует для линейных операторов над полем комплексных чисел. В случае линейного оператора над полем вещественных чисел можно работать с его комплексификацией, что в какой-то мере снимает проблему: выбор удачного базиса из комплексных векторов позволяет понять и действие исходного оператора в вещественном пространстве. Так, в §2 мы видели, что всякому мнимому собственному вектору отвечает двумерное инвариантное подпространство в вещественном пространстве. Как будет показано в §9.5, аналогичное расширение основного поля возможно и в общем случае. Второе препятствие состоит в том, что размерность какого-либо собственного подпространства может оказаться меньше кратности соответствующего корня характеристического многочлена. Тогда приходится расстаться с мечтой привести матрицу оператора к диагональной форме, но, если характеристический многочлен разлагается на линейные множители, ее можно привести к так называемой жордановой форме, минимально отличающейся от диагональной. Этому и посвящен настоящий параграф. Коль скоро собственных векторов может оказаться недостаточно, естественно рассмотреть какие-то более общие векторы. Определение 1. Вектор е € V называется корневым вектором линейного оператора А, отвечающим числу А е К, если (Д- Х£)те=0 для некоторого т е Z+. Наименьшее из таких т называется высотой корневого вектора е. В частности, собственные векторы — это корневые векторы высоты 1. Удобно считать нулевой вектор корневым вектором высоты 0 (отвечающим любому А). ПРИМЕР 1. Для оператора дифференцирования в пространстве C'OO(R) бесконечно дифференцируемых функций собственные век- торы, отвечающие числу А —это функции, пропорциональные еЛх,
238 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ а корневые векторы — это функции вида р(х)еХх, где р(х) — многочлен; при этом высота такого корневого вектора равна degp+ 1. В частности, корневые векторы, отвечающие числу 0 — это многочлены. Если е — корневой вектор высоты т > 0, то вектор f = (A-X£)m~le собственный с собственным значением А. Следовательно, А — корень характеристического многочлена. Легко видеть, что корневые векторы, отвечающие корню А, образуют подпространство. Оно называется корневым подпро- странством и обозначается УА(Д). Ясно, что V\A)dVx(A). Если е — корневой вектор высоты т > 0, то (Л — А£)е — корневой вектор высоты т — 1. Отсюда следует, что корневое под- пространство УА(Л) инвариантно относительно А — Х£, а значит, и относительно А. Множество корневых векторов высоты т — это не что иное, как ядро оператора (А—Х£)т. Таким образом, корневое под- пространство УА(Л) — это объединение возрастающей цепочки подпространств Кег(Л - Х£) с Кег(Л - А£)2 с ... В конечномерной ситуации эта цепочка, начиная с некоторого места, стабилизируется, и, значит, УА(Д) = Кег(Л — Х£)т для некоторого т. В базисе пространства УА(Л), согласованном с этой цепочкой подпространств, оператор А — Х£ записывается нильтреугольной матрицей (т.е. треугольной матрицей с нулями на диагонали), а оператор А соответственно этому — треугольной матрицей с числом А на диагонали. Отсюда мы получаем два следствия: 1) характеристический многочлен ограничения оператора А на УА(Л) равен (t — А)*, где k = dim V*(A); 2) при р / А оператор А — р£ невырожден на УА(Д). ЗАДАЧА 1. Доказать, что высота любого корневого вектора, отвечающего корню А, не превосходит dim УА(Д). Докажем теперь ключевое утверждение, оправдывающее понятие корневого вектора. Предложение 1. Размерность корневого подпространства равна кратности соответствующего корня характеристиче- ского многочлена.
§ 4. ЖОРДАНОВА ФОРМА 239 Доказательство. В базисе {ех,...,еп} пространства V, первые к векторов которого составляют базис подпространст- ва РгД(Л), матрица А оператора А имеет вид (6), где В — матрица оператора В = Л|уД(Л). Следовательно, fA(t) = fB(t)-det(tE-C) = (t - A)* det(tE-C). Пусть С — линейный оператор в пространстве W = (efc + 1,..еп), задаваемый матрицей С. Нам нужно доказать, что А не является корнем многочлена det(tE — С), т.е. собственным значением опе- ратора С. Предположим противное. Тогда существует такой ненулевой вектор е 6 W, что Се = Ае. Это означает, что Ле=Ае + и, и Е VX(A), и, следовательно, (Л- Х£)е = и — корневой вектор, но тогда и е — корневой вектор, что противоречит определению VA(.4). □ Предложение 2. Корневые подпространства, отвечающие различным корням Ап ..., Хк, линейно независимы. Доказательство. Доказательство аналогично доказатель- ству теоремы 2.3 о линейной независимости собственных подпро- странств. Пусть е! + • + ek-1 + ek =0 (et е Ул‘(Л)). Применим к этому равенству оператор (А—Хк£)т, где т — высота вектора ек. Мы получим (Л - А^)’"е, + ... + (Л - Хк£)тек _, = 0. Если доказывать предложение индукцией по к, то предположение индукции даст (Л - Хк£)те1 - ... = (А - Хк£)тек _. - 0. Так как оператор А— Хк£ невырожден на каждом из подпространств VA1(.4),..., ТгА‘1(Л), то отсюда следует, что ei = “ еь -1 = 0; но тогда и ек — 0. □ Предложения 1 и 2 в совокупности позволяют сделать следую- щий вывод. Теорема 1. Если характеристический многочлен fA(t) раз- лагается на линейные множители, то УА.(Л), 1 — 1 где А,,..., А, —(различные) корни многочлена fA(t).
240 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Исследуем теперь более подробно действие оператора А на каждом из корневых подпространств. Определение 2. Линейный оператор АГ называется нильпо- тентным, если существует такое т G Z+, что АЛ1 =0. Наименьшее из таких т называется высотой нильпотентного оператора АЛ ПРИМЕР 2. Оператор дифференцирования в пространстве мно- гочленов степени не выше п является нильпотентным оператором высоты п + 1. Так как Vх(Д) = Кег(Д — Х£)т для некоторого т, то оператор АГ= (Д — А£)|уА(Л) нильпотентен. Поэтому наша задача сводится к исследованию нильпотентных операторов. Пусть Af — нильпотентный оператор в векторном пространст- ве V. Высотой вектора е е V относительно АГ называется наименьшее т, для которого АГ'пе — 0, т.е. высота вектора е как корневого вектора оператора АГ (отвечающего корню 0). Очевидно, что высота любого вектора не превосходит высоты самого оператора АГ, причем существуют векторы, высота которых равна высоте оператора Xf. Мы будем обозначать высоту вектора е через ht е. Лемма 1. Если е е V — вектор высоты т, то векторы е, Afe, АРе, ..., Afm-'e линейно независимы. Доказательство. Предположим, что имеется нетривиаль- ная линейная зависимость Адб + А]А/”е + А2АГ2е + ... + Am_ [АГт~ 'е = 0. Пусть Afc —первый из ее отличных от нуля коэффициентов. Тогда, применяя оператор АГ”1-*-1, мы получаем неверное равенство А^т-1е = 0. □ Определение 3. Подпространство (е, АГе, АРе, ..., АГт-1е) (т = ht е) называется циклическим подпространством нильпо- тентного оператора АГ, порожденным вектором е. Очевидно, что циклическое подпространство инвариантно отно- сительно АГ. Ограничение оператора АГ на циклическое подпро- странство (е, АГе, АРе, ..АГт-1е) имеет высоту т и в базисе
§ 4. ЖОРДАНОВА ФОРМА 241 {е, А/е, №е, ..., J\Tm *е 7(0) = } задается м /010. 0 0 1. 0 0 0. атрицей . 0 0\ . 0 0 . 0 0 0 0 0. ^0 0 0. . 0 1 . 0 0/ называемой нильпотентной жордановой клеткой (порядка т) (ср. пример 1.4). Любой вектор циклического подпространства U— (e,Ne,J\Pe,... . не принадлежащий подпространству .hfU = .. .,А/т-1е), имеет высоту т и, следовательно, порождает то же циклическое подпространство. Теорема 2. Пространство V может быть разложено в прямую сумму циклических подпространств оператора ЛГ. Количество слагаемых в таком разложении равно dim Кег А/. Доказательство. Будем доказывать теорему индукцией по п = dim V. При п = 1 утверждение теоремы очевидно. При п > 1 пусть U С V — какое-либо (п — 1)-мерное подпространство, содержащее Im А/. Очевидно, что U инвариантно относительно А/. По предположению индукции и = и1®...®ик, где Ц,..., Uk —циклические подпространства. Возьмем любой вектор е G V \ U. Имеем Ne = Uj +.. . + ик (uteU,). Если для какого-то i (г^еСО, то, заменив вектор е на е — vit мы можем добиться того, чтобы и( = 0. Поэтому можно считать, что для любого i либо гц = 0, либо и. Если = 0 для всех i, т. е. Kfe = 0, то V = (е) ф U{ ф ... © Uk есть разложение пространства V в прямую сумму циклических подпространств.
242 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Пусть теперь Me / 0. Очевидно, что ht А/е = max ht ut. i Будем считать для определенности, что ht Me = ht Uj = m. Тогда ht e = m + 1. Докажем, что V = (e, Me, M2e, ..Mme} Ф U2® ... Ф Uk. Так как ux £MUX, to dim Ux — ht ux = m и, значит, dim V = dim C7 + 1 = (m + 1) + dim U2 + ... + dim Uk. Поэтому достаточно проверить, что (е, Me, М2е, ..., Мте) П (U2 ф ... ф Uk) = 0. Предположим, что Аое + ХхМе + Х2М2е + ... + ХтМте G U2 ф ... ф Um. Так как е U, то Ао = О. Проектируя оставшиеся члены на Ц, мы получаем А । U| + А 2Мих + ... + А тМт 1 их =0, откуда А! =А2 = ... = Хт=0. Докажем второе утверждение теоремы. Пусть V = V, ф ... ф Vk — разложение пространства V в прямую сумму циклических подпространств оператора М. Очевидно, что КегА/= КегЛ/^ ф ... Ф КегЛ/^ . Так как dim Кег VI = 1 при любом i, то dimKerA/=fc. □ Возвращаясь к произвольному линейному оператору А, заметим, что в циклическом подпространстве нильпотентного оператора М= — {А — А£)|ул(Л) оператор А задается матрицей вида J(A) = J(0) + А2? — /А 1 0 ... 0 0\ 0 А 1 ... 0 0 0 0 А ... 0 0 0 0 0 ... А 1 \0 0 0 ... 0 А/ Такая матрица называется жордановой клеткой с собственным значением А.
§ 4. ЖОР ДАНОВА ФОРМА 243 Определение 4. Жордановой матрицей называется клеточно- диагональная матрица м Т о \ J = 2 \ 0 jJ в которой J,, J2,..Jk — какие-то жордановы клетки. Комбинируя теоремы 1 и 2, мы приходим к следующему резуль- тату. Теорема 3. Если характеристический многочлен fA(t) раз- лагается на линейные множители, то существует базис, в котором матрица оператора А жорданова. Следствие. Матрица любого линейного оператора над полем комплексных чисел приводится к жордановой форме. Базис, в котором оператор А имеет жорданову матрицу, называ- ется жордановым. Как видно из доказательства теоремы 2, в его выборе, вообще говоря, имеется большой произвол. Однако сама жорданова форма матрицы линейного оператора определена одно- значно с точностью до перестановки клеток. Это будет доказано в §9.3. Очевидно, что в жордановой форме матрицы оператора А сумма порядков жордановых клеток с собственным значением Л равна б1тИА(Л), т.е. кратности А как корня характеристического мно- гочлена. Из второй части теоремы 2 следует, что число жордановых клеток с собственным значением А равно dim Р^(Л). ЗАДАЧА 2. Доказать, что максимальный порядок жордановых клеток с собственным значением А в жордановой форме ма- трицы оператора А равен высоте нильпотентного оператора V=M-A£)|vW Матрицы А и В называются подобными, если существует такая невырожденная матрица С, что В = С~' АС. Подобные матрицы можно рассматривать как матрицы одного линейного оператора в разных базисах. Следствие теоремы 3 можно сформулировать таким образом, что всякая комплексная матрица подобна жорда- новой. ЗАДАЧА 3. Доказать, что всякая комплексная матрица подобна своей транспонированной матрице.
244 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ § 5. Функции от линейного оператора Пусть А— линейный оператор в п-мерном векторном простран- стве V над полем К. Для любого многочлена f(t) = aotm + alt — l + ... + am_it+ameK[t] можно определить его значение от оператора А по формуле f(A) = OqA™ + alAm^1 + ... + ат_{А+ ат£. Ясно, что (f + g)(A) = f(A) + g(A), (fg)(A) = f(A)g(A). (24) Аналогичным образом можно определить многочлен от матрицы. При этом, если оператор А имеет в некотором базисе матрицу А, то оператор /(Л) будет иметь в том же базисе матрицу /(А). Так как пространство всех линейных операторов конечномерно (при нашем молчаливом предположении, что пространство V конечномерно), то среди степеней оператора А может быть лишь конечное число линейно независимых. Следовательно, существуют такие ненулевые многочлены /, что f(A) — 0. Они называются аннулирующими многочленами оператора А. Аннулирующий мно- гочлен наименьшей степени называется минимальным (аннули- рующим) многочленом оператора А. Мы будем обозначать его через тА. Всякий аннулирующий многочлен f делится на минимальный. В самом деле, если остаток от деления f на тА отличен от нуля, то он является аннулирующим многочленом меньшей степени, чем тА, что противоречит определению минимального многочлена. Отсюда, кстати, следует, что минимальный многочлен определен однозначно с точностью до постоянного множителя. Для того чтобы определить его вполне однозначно, будем считать, что его старший коэффициент равен единице. ЗАДАЧА 1. Найти минимальные многочлены нулевого и тожде- ственного операторов. Аналогично определяются аннулирующие и минимальный мно- гочлены матрицы. Минимальный многочлен линейного оператора равен минимальному многочлену его матрицы в любом базисе. Если пространство V разложено в прямую сумму инвариант- ных подпространств оператора А, то минимальный многочлен
§ 5. ФУНКЦИИ ОТ ЛИНЕЙНОГО ОПЕРАТОРА 245 оператора А равен наименьшему общему кратному минимальных многочленов его ограничений на эти подпространства. Пользуясь этим, легко найти минимальный многочлен линейного оператора по жордановой форме его матрицы (если, конечно, она приводится к жордановой форме). Для этого надо прежде всего найти мини- мальный многочлен жордановой клетки. Лемма 1. Минимальный многочлен жордановой клетки по- рядка т с собственным значением А равен (t — A)m. Доказательство. Пусть А — линейный оператор, задавае- мый такой жордановой клеткой. Тогда N = А — Х£ — нильпотент- ный оператор высоты т, т.е. (Д-А£)т = 0, (Д- А£)т-‘/0. Это означает, что (t —A)m — аннулирующий многочлен, но никакой его собственный делитель не является аннулирующим многочле- ном. Следовательно, (t — A)m — минимальный многочлен. □ Пусть теперь А — произвольный линейный оператор, харак- теристический многочлен fA которого разлагается на линейные множители. Пусть Аи ..., А, — все (различные) корни многочлена fA. Из леммы 1 и предшествующего ей замечания следует Теорема 1. Минимальный многочлен оператора А равен ™а(О=П(*-а(.Г, г = 1 где т1 — максимальный порядок жордановых клеток с собст- венным значением А; в жордановой форме матрицы операто- ра А. Следствие 1. Жорданова форма матрицы оператора А ди- агональна тогда и только тогда, когда его минимальный многочлен не имеет кратных корней. Пример!. Пусть А — линейный оператор в комплексном векторном пространстве, удовлетворяющий условию Ат = £ для некоторого натурального т. Тогда многочлен tm — 1 является аннулирующим для оператора А. Так как он не имеет кратных корней, то минимальный многочлен оператора А тем более не имеет кратных корней. Следовательно, жорданова форма матрицы оператора А диагональна. Ясно, что ее диагональные элементы (собственные значения оператора Д) суть какие-то корни т-й степени из 1.
246 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ ПРИМЕР 2. Найдем все линейные операторы А, удовлетворяю- щие условию Л3 = Л2. Это условие означает, что t3 — t2 является аннулирующим многочленом оператора А или, что равносильно, минимальный многочлен оператора А делит t3 — t2 = t2(t — 1). Ввиду теоремы 1 оно выполняется тогда и только тогда, когда жорданова форма матрицы оператора А состоит только из клеток вида (о о)’ (0)’ <1)- Число клеток каждого вида может быть произвольным (в том числе равным нулю), лишь бы сумма их порядков равнялась п. Следствие 2 (теорема Гамильтона — Кэли). fA(A) = 0. Замечание 1. Теорема Гамильтона — Кэли верна и без предположения о том, что характеристический многочлен fA разлагается на линейные множители. Это можно доказать следующим образом. Как будет показано в §9.5, существует расширение L поля К, в котором f. разлагается на линейные множители. Рассматривая матрицу А оператора А как матрицу с элементами из L, мы можем утверждать в силу предыдущего следствия, что она аннулируется своим характеристическим многочленом; но очевидно, что характеристический многочлен матрицы А не зависит от того, рассматриваем мы ее как матрицу с элементами из К или как матрицу с элементами из L. Этим же способом доказывается, что если минимальный многочлен оператора А разлагается на линейные множители над К, то и его характеристический многочлен разлагается на линейные множители над К. Пользуясь теоремой Гамильтона — Кэли, можно свести вычисле- ние любого многочлена f от линейного оператора А к вычислению многочлена степени < п от этого оператора. А именно, разделим f на fA с остатком: f = qfA + Р, deg Р < п- (25) Тогда /И)=р(Л). Предположим, что К = R или С и многочлен fA разлагается на линейные множители (что всегда имеет место, если К =С). Пусть ААл — все его (различные) корни и к},..к3 — их кратности, так что fcj + ... + ks = п. (26) Тогда из (25) следует, что /Ь)(Д.) = рЬ)(А£) при г = 1,...,з, у = (27) (Мы считаем здесь, что /(0) — f для любой функции /.) Равен- ства (27) однозначно определяют многочлен р, как показывает следующее
§ 5. ФУНКЦИИ ОТ ЛИНЕЙНОГО ОПЕРАТОРА 247 Предложение 1. Пусть А13..А, е К — различные числа и к13..., к3 — натуральные числа, удовлетворяющие условию (26). Обозначим через Рп пространство многочленов степени < п. Тогда отображение <р: Рп —> Кп, ставящее в соответствие каждому многочлену рЕРп набор чисел (р^(Л£): г = 1,..з, j =0,1,..- 1), является изоморфизмом векторных пространств. Доказательство. Очевидно, что — линейное отобра- жение. Так как dim Рп = dim Кп = п, то достаточно доказать, что Кег — 0. Но Кег <р состоит из многочленов, для которых каждое из чисел Л£ является корнем кратности kt, а ненулевой многочлен степени < п не может иметь так много корней (с учетом кратностей). □ Задача нахождения многочлена р степени < п, для которого чис- ла p0)(Af) (г = 1,..., s; j =0, 1,..— 1) равны каким-то заданным числам, называется задачей интерполяции (с кратными узлами). В случае простых узлов, т. е. когда к{ = ... = к3 = 1, ответ может быть дан в виде интерполяционной формулы Лагранжа. Пример 3. Вычислим Ат, где / 1 0 -3\ А = 1 -1 -6 . \-1 2 5/ Имеем Л(О = t -1 -1 1 —2 t -5 = t3 - 5t2 + 8t - 4 = (t - l)(t - 2)2. t + 1 6 Интерполяционный многочлен p(t) = at2 + bt + c определяется условиями p(l) = a+ b + c - 1, p(2) = 4a + 2b + c = 2m, p’(2) = 4a+b = m-2m-\ откуда a= (m — 2) • 2m-1 + 1, b = —(3m — 8) • 2m“1 — 4, c = (2m — 6) • 2m“1 +4.
248 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Следовательно, Ат = 2— '[(m _ 2)А2-(Зт - 8)А+(2т - 6)Е] + А2 - 4А + 4Е= f Зт — 6 —6m+12 —9т + 12\ /4 —6 — 6\ = 2т~1 I Зт — 4 —6т + 8 —9т + 6+12 —3 —3 \ — т 2т Зт + 2 / \0 О О/ Изложенная теория может быть обобщена с многочленов на произвольные аналитические функции, но для этого мы должны исследовать топологические свойства алгебры линейных операто- ров. Пусть V — векторное пространство над полем К = R или С. Определение 1. Нормой в пространстве V называется всякая функция ||. : V —> R, обладающая свойствами 1) ||ж|| > 0 при х / 0; 2) ||Лх|| = |Л|||х||; 3) Цх + уКЦхЦ + ЦуН. Приведем примеры норм в Кп. Пример 4. ||х|| = max |xj. Пример 5. Евклидова (эрмитова) норма ||х|| = /22 |^|2- Пример 6. ||а:|| =22к,|- * i Определение 2. Последовательность векторов хт называется сходящейся по норме к вектору х е. V, если lim ||2:m — х|| = 0. т —»оо Легко видеть, что сходимость по любой из приведенных выше норм означает просто покоординатную сходимость. На самом деле это справедливо вообще для всех норм в конечномерном простран- стве, как показывает следующее Предложение 2. Для любых двух норм ||. Ц, и ||. ||2 в ко- нечномерном векторном пространстве V существуют такие положительные константы а и Ь, что а И2- Ь при всех х е V. х / 0. Mi г Доказательство. Достаточно сравнить произвольную норму с какой-либо фиксированной. Пусть ЦжЦ] = ^3 |х,|, где хп — координаты вектора х в базисе {еи ..еп}. Тогда
§ 5. ФУНКЦИИ ОТ ЛИНЕЙНОГО ОПЕРАТОРА 249 где b = тах||е£||2. Неравенства показывают, что || • ||2 — непрерывная функция в топологии по- координатной сходимости. Пусть а — ее минимум на «единичной сфере» ЦхЦ] = 1 в смысле первой нормы. Тогда ||а;||2 ^а||х||] при всех х е V. □ Замечание 2. В бесконечномерном пространстве различные нормы, вообще говоря, определяют различные топологии. Проверьте это, например, для норм 11/111 = S |/(®)|d®, ||/||2= max |/(х)| О в пространстве непрерывных функций на отрезке [0, 1 ]. Пусть V — конечномерное векторное пространство с фиксиро- ванной нормой || • ||. Определение 3. Ряд 52 хт (хт е Ю называется абсолютно сходящимся, если числовой ряд 52 Ikmll сходится. Точно так же, как для числовых рядов, доказываются следующие утверждения. Предложение 3. Всякий абсолютно сходящийся ряд 52 хт (хте V) сходится, причем m=l II 00 II оо Е k Е Ш1- ' т = 1 " т = 1 Предложение 4. Сумма абсолютно сходящегося ряда не изменяется ни при какой перестановке его членов. Определим теперь норму в пространстве линейных операторов на V. Определение 4. Нормой линейного оператора А называется число ||Д|| - шах ||Дж|| = шах 11 11 м=1 М Предложение 5. Определенная таким образом функция в пространстве линейных операторов действительно является нормой. Кроме того, она обладает свойством ||АВК||Д||||Б||. Доказательство. Имеем M + S|| = max ||(Д+В)а:|| = max ЦЛж+ВхЦ max(||^|| + ||M) М = 1 И = 1 М = 1 < max ||Дг|| + max ||Bz|| = ||Д|| + ||В||. М = 1 11®И = 1
250 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Остальные свойства нормы очевидны. Далее, И лиц - тах ММ _ тах ММ . И < ||ЛеЦ-тах ||х|| -max ||Вг|| |И < тах ||ЛМ . max < max ||Лг/Н • max ИМ - IIЛИ IIBII □ IIM S/o hll llvll ||х|| -||Л||||В|1' □ ЗАДАЧА 2. Найти явный вид нормы линейного оператора для каждой из трех приведенных выше норм в пространстве Кп. Очевидно, что норма линейного оператора не меньше, чем модуль любого его собственного значения. Теорема 2. Пусть ряд f(t)= ^amtm (ameK) сходится при 111 < R. Тогда ряд т=0 ОО /(Л)=^атАт (28) т = 0 абсолютно сходится для любого линейного оператора А, удов- летворяющего условию ||Л|| <R. Доказательство. Как известно, из сходимости степенного ряда /(£) при |£ | < R следует его абсолютная сходимость в том же интервале (круге). Так как 1|а„ЛтКЫ1|ЛГ то ряд /(Л) абсолютно сходится при ||Л|| < R. □ Равенство (28) считается определением функции f от линейного оператора Л. При этом сохраняются свойства (24). Аналогичным образом определяется функция от матрицы. Как и в случае мно- гочленов, если А — матрица оператора Л в каком-либо базисе, то /(А) — матрица оператора /(Л) в том же базисе. Предположим теперь, как и выше, что характеристический мно- гочлен fA имеет корни Ар..., А, кратностей кх, . . ks, причем kx + ... + ks — п. Если ||Л|| < R, то |AJ < R при i = 1,..., s. Теорема 3. В условиях теоремы 2 найдем многочлен р сте- пени < п, удовлетворяющий условиям (27). Тогда f(A) = p(A). Доказательство. Для любого т положим m fM=^aktk k =о и обозначим через рт многочлен степени < п, удовлетворяющий условиям (27) для многочлена fm вместо /. Согласно предыдущему, / (Л) = рт(Л). Из предложения 1 следует, что lim рт = р. Имеем m —»оо теперь /(Л)= lim /т(Л) = lim рт(Л) = р(Л). □ т —+ оо т —* оо
§ 5. ФУНКЦИИ ОТ ЛИНЕЙНОГО ОПЕРАТОРА 251 Согласно сформулированному выше общему принципу, для лю- бого линейного оператора А определяется его экспонента еА (= ехр А) по формуле = + л + + > + •• (29) Как и для чисел, путем перемножения рядов с использованием предложения 4 устанавливается Теорема 4. еА+в — еАев при АВ = В А. (При АВ^ВА это свойство, как правило, не имеет места, и мож- но сказать, что лишь благодаря этому обстоятельству существует теория групп Ли.) При фиксированном А положим G(t) = etA (teK). (30) Очевидно, что Q(0) = £. Из теоремы 4 следует, что g(t + s) = g(t)g(S), g(-t) = g(t)-1. Таким образом, операторы Q(t) образуют группу. Она называется однопараметрической группой, порожденной оператором А. ПРИМЕР 7. Пусть Т> — оператор дифференцирования в про- странстве многочленов степени п. Тогда (е‘1’/)(а:) =f(x) + + ^^t2 + ...=f(x + t). t(0 -П , x Пример 8. e = -sin M (проверьте). \ sin t COS c j Для операторной функции вещественного или комплексного переменного можно обычным образом определить производную. При этом очевидно, что дифференцирование операторной функции сводится к дифференцированию матричных элементов. Теорема 5. g'(t) = g(t)A = AQ(t). Доказательство. Так как g(t + At)=g<t )£(At) = g(At)g(t), TO e,(t)=en±^£in=g(t) ei^. =
252 Гл. 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ и доказательство, как и в случае числовой экспоненты, сводится к выводу «замечательного предела» - tA с lim^-F£ = A (31) (->0 1 Имеем е1Л — £ . /А Л2 —-------— А 8 + t ( 2[ Т t "дт + • • • Ряд, заключенный в круглые скобки, при |t| < 1 мажорируется сходящимся числовым рядом МП . MH2 ИН3 2! 3! 4! и потому абсолютно сходится, причем его сумма по норме не превосходит суммы указанного числового ряда. Отсюда и следу- ет (31). □ Теорема 5 позволяет найти в общем виде решение системы од- нородных линейных дифференциальных уравнений с постоянными коэффициентами (г = 1,...,п). (32) 3 = 1 (Здесь x}(t),..., xn(t)— неизвестные функции переменного t.) Согласно общей теории, система (32) имеет единственное решение, удовлетворяющее начальным условиям вида ^(0) = 2:i0 (г = 1,...,п). (33) Перепишем систему (32) в векторной форме: x'(t) = Ax(t), (34) где x(t) — вектор-столбец с координатами x^t), а А —матрица с элементами atJ. Начальное условие (33) можно записать в форме *(0) = х., (35) где Xq — вектор-столбец с координатами xi0. Тогда решением будет ж(£) = емЯд. (36) Доказательство этого получается непосредственной проверкой с помощью теоремы 5.
§ 5. ФУНКЦИИ ОТ ЛИНЕЙНОГО ОПЕРАТОРА 253 Пример 9. Найдем решение системы дифференциальных урав- нений ' х1/(4) = 2:1(4)-з^(4), < а^(4) = ж1(4)-^(4)-6^(4), •. •Ез(^) ~ ~xi(t) "Ь 2я«>(4) + ), удовлетворяющее начальным условиям ^(0) = !, а^(0) = 1, Хз(О) = О. Матрица А этой системы совпадает с матрицей примера 3. Мы должны вычислить /(А), где f(u) — etu (здесь t выступает как константа). Интерполяционный многочлен р(и) = аи2 + Ьи + с определяется условиями р(1) = а+ Ь + с = е‘, р(2) = 4а + 2Ь + с = е2‘, р'(2) — 4а + b = te2t, откуда a — (t — 1 )е2‘ + е‘, b = —(34 — 4)е2‘ — 4е‘, c = (2t -3)е21+4е‘. Следовательно, etA = e2‘[(t-l)A2 - (3t—4)A + (2t-3)E] + e‘(A2-4A+4E) = /3i—3 —6i+6 —9t+6\ /4 —6 — 6\ = e2t 3t-2 -6Z+4 -9t+3 +e‘ 2 -3 -3 . \ -t 2t 3t + 1 / \0 0 0 / Решение, удовлетворяющее заданным начальным условиям, полу- чается умножением матрицы etA на столбец I 1 ). Таким образом находим \0/ x{(t) = (—34 + 3)е2‘ — 2е‘, а^(4) = (—34 +2)е2‘ — е‘, ^(ty^te21.
Глава 7 АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА § 1. Аффинные пространства В элементарной геометрии мы имеем дело не только с век- торами, но и с точками (и даже главным образом с точками). Подобно тому, как аксиоматика векторного пространства отражает в обобщенном виде свойства векторов элементарной геометрии, аксиоматика аффинного пространства отражает свойства точек и векторов элементарной геометрии в их взаимосвязи. В «обычном» евклидовом пространстве элементарной геометрии можно определить операцию сложения точки и вектора. А именно, суммой точки р и вектора х называется точка, являющаяся концом вектора, равного х, отложенного от точки р. Свойства этой операции и лежат в основе следующего определения. Пусть V — векторное пространство над полем К. Определение 1. Аффинным пространством, ассоциирован- ным с векторным пространством V, называется множество S вме- сте с операцией сложения Sх V —>S, удовлетворяющей следующим условиям: 1) р + (х + у) = (р + х) + у (ре S, x,yeV); 2)р + 0 = р (р е S, 0 — нулевой вектор); 3) для любых p,qeS существует единственный вектор х, такой, что р + х — q. Элементы множества S называются точками. Вектор х из условия 3) называется вектором, соединяющим точки р и q, и обозначается через pq. Из условия 1) следует, что pq + qr =pr Vp, q, r G S. Всякое векторное пространство V можно рассматривать как аффинное, считая, что точки — это те же векторы, и определив операцию сложения точки и вектора как сложение векторов. При этом вектор pq будет разностью векторов q и р.
§ 1. АФФИННЫЕ ПРОСТРАНСТВА 255 С другой стороны, если в аффинном пространстве S фиксировать некоторую точку о — «начало отсчета», то можно отождествить каждую точку р с ее радиус-вектором ор. При этом сложение точки и вектора превратится просто в сложение векторов. Такое отождествление точек с векторами называется векторизацией аффинного пространства. (Конечно, оно зависит от начала отсчета.) Размерностью аффинного пространства по определению считает- ся размерность соответствующего векторного пространства. Точка о (начало отсчета) вместе с базисом {еи ..., еп} простран- ства V называется репером аффинного пространства S. С каждым репером связана аффинная система координат в пространстве S. А именно, каждой точке peS приписываются координаты, равные координатам вектора ор в базисе {еи ..., еп}. Легко видеть, что 1) координаты точки р + х равны суммам соответствующих координат точки р и вектора х; 2) координаты вектора pq равны разностям соответствующих координат точек gap. Линейные комбинации точек аффинного пространства, вообще говоря, не определены. Однако некоторым из них можно придать смысл. А именно, назовем барицентрической линейной комби- нацией точек Pi,..pk е S линейную комбинацию вида 52\й> где 52 А^ = 1, и будем считать ее равной точке р, определяемой равенством о? = 52 А<«К, i где о е S. Благодаря условию J3 А4 — 1 это определение не зависит от выбора точки о. Действительно, пусть о' —любая другая точка. Тогда _______ _____ ______________ _______________ о'р = о'о + ор = 52 АДо'о + ор?) = 52 ^iO'Pi- i i В частности, центр тяжести системы точек {ри ..., pfc} можно определить как cent (р,,..., pj = |(р, +... + рк). ЗАДАЧА 1. Показать, что в обычном евклидовом пространстве а) барицентрическая комбинация Ар 4- pq двух точек р и q есть точка, делящая отрезок pq в отношении р : А (она лежит на самом отрезке, если А, /О 0, и на его продолжении в противном случае); б) центр тяжести множества вершин треугольника есть точка пересечения его медиан.
256 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Пусть Po,Pi,...,pn — такие точки n-мерного аффинного про- странства S, что векторы рорп линейно независимы. Тогда каждая точка р G S единственным образом представляется в виде р — 13 xiPii гДе УЗ х< = 1- i=0 i= 0 В самом деле, это равенство можно переписать в виде РоР= 53 i = 1 откуда следует, что в качестве хг,..хп можно (и должно) взять координаты вектора р^р в базисе РЬР„}; после этого Xq определяется равенством Xq — 1 — J3 xi • i = 1 Числа Xq, xit..., 2in называются барицентрическими координа- тами точки р относительно Pq, ри ..рп. Основными объектами элементарной геометрии являются пря- мые и плоскости. Следующее определение вводит соответствующие понятия в геометрию аффинных пространств. Определение 2. Плоскостью в аффинном пространстве S называется подмножество вида Р=Ро + Ц (1) где Pq — некоторая точка, a U — подпространство пространства V. Подпространство U однозначно определяется как совокупность всех векторов, соединяющих точки плоскости Р, и называется направляющим подпространством плоскости Р. Сумма точки из Р и вектора из U принадлежит Р. Относительно этой операции плоскость Р является аффинным пространством, ассоциированным с векторным пространством U. По определению dim Р = dim U. Нульмерная плоскость есть точка. Одномерная плоскость называется прямой. Плоскость раз- мерности п — 1 называется гиперплоскостью. В качестве точки Pq в равенстве (1), определяющем плоскость Р, может быть взята любая точка этой плоскости. Очевидно, что пересечение плоскостей, если оно не пусто, также является плоскостью. Для любого подмножества М С S и любой точки Pq G М плоскость Ро + {РоР'- Р^М) является наименьшей плоскостью, содержащей М. Эта плоскость называется аффинной оболочкой множества М и обозначается
§ 1. АФФИННЫЕ ПРОСТРАНСТВА 257 через affM. Она может быть также определена как совокупность всех барицентрических линейных комбинаций точек из М. Теорема 1. Через любые к +1 точек аффинного пространст- ва проходит плоскость размерности < к; при этом, если эти точки не содержатся в плоскости размерности < к, через них проходит единственная плоскость размерности к. Доказательство. Пусть р0, р},..рк Е S. Тогда Р = Ро + • • •,Ж) есть плоскость размерности < к, проходящая через р0, р{,.. .,рк. Если dimP = к, то векторы р^,.. -,Р^Р^ линейно независимы и Р является единственной А:-мерной плоскостью, проходящей через Ро, Pi, . . рк. □ Точки pg, ру,..рк Е S называются аффинно зависимыми, если они лежат в плоскости размерности < к, и аффинно независи- мыми в противном случае. Из доказательства теоремы 1 видно, что точки р0, Pi,..., рк аффинно зависимы тогда и только тогда, когда векторы 1%р[,.. -,р^ линейно зависимы. В то же время из определения ясно, что свойство точек быть аффинно зависимыми или независимыми не зависит от их нумерации (в частности, от того, какую из них мы возьмем за pg). Теорема 2. Точки pg, р},..., рк аффинно независимы тогда и только тогда, когда ранг матрицы, составленной из их барицентрических координат, равен k + 1. Доказательство. Пусть xi0, хп,..xin — барицентриче- ские координаты точки рг относительно (аффинно независимых) точек q0, q{,..., qn. Тогда ха,..., a:jn — координаты вектора q^p~ в базисе {ад, ...,адГ}. Ранг матрицы ( хъо аЬ1 • • • \ I ®10 *11 • •• Ж1п I (О\ \ Хк0 Хк1 ' • ' Хкп / не изменится, если прибавить к первому столбцу сумму всех остальных. При этом мы получим матрицу 1 V хк\ ЯЬп X,
258 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Вычтя из каждой строки первую строку, что также не изменит ранга, мы получим матрицу -Чи • • • О 2=11 -2^1 ••• 2-ln ~ 2j)n О хк, - ... хы - / ранг которой на единицу больше ранга матрицы / — а^)] ... X] п — XQn \ (3) \ Хк 1 — ... Х^ Хцп / элементы которой суть координаты векторов р^р,..., в базисе Таким образом, ранг матрицы (2) равен к + 1 тогда и только тогда, когда ранг матрицы (3) равен к; но последнее как раз и означает, что векторы РьРГ,..., рорк линейно независимы, т.е. что точки Pq, рх,..., рк аффинно независимы. □ ПРИМЕР 1. Пусть точки х, у, z, лежащие на сторонах be, са, ab треугольника abc или их продолжениях (см. рис. 1), делят эти стороны в отношениях А : 1, р : 1, v : 1 соответственно. Выясним, при каком условии на А, р, и точки х, у, z лежат на одной прямой, т. е. аффинно зависимы. В силу задачи 1 матрица барицентрических координат точек х, у, z относительно точек а, Ь, с имеет вид + 1 л< + 1 1 V п \ V + 1 V + 1 / По теореме 2 точки х, у, z лежат на одной прямой тогда и только тогда, когда определитель этой матрицы равен нулю, т. е. когда Xpv = —1. Это утверждение носит название теоремы Менелая. Рис. 1 Рис. 2
§ 1. АФФИННЫЕ ПРОСТРАНСТВА 259 ЗАДАЧА 2. Используя барицентрические координаты, доказать теорему Чевы: в обозначениях примера 1, прямые ах, by, cz пересекаются в одной точке (см. рис. 2) тогда и только тогда, когда Л/ziz = 1. Теорема 3. Непустое подмножество Р С S является пло- скостью тогда и только тогда, когда вместе с любыми двумя различными точками оно содержит проходящую через них прямую. Доказательство. Утверждение «только тогда» очевидно. Пусть теперь Р с S — непустое подмножество, обладающее ука- занным свойством. Пусть {р0, рх, ..., pk} — максимальная аффинно независимая система точек в Р. Тогда Р С aff {pq, рх,..., pk}. Докажем, что Р — aff {р0, рх,..., рк}. Пусть р = ^iPi — произвольная барицентрическая линейная комбинация точек р0, рх,.. ,,рк. Докажем, что р е Р, индукцией по числу I коэффициентов Ао, Аи ..., Хк, отличных от нуля. При 1 = 1 точка р совпадает с одной из точек р0, рх,..., рк, так что доказывать нечего. Пусть I > 1. Будем считать для определенности, что Хк ^0. Тогда /Ь-1 . \ Р = С1 - Л J Е T^pi ) + \.=о к J т. е. р лежит на прямой, проходящей через точки и рк. По предположению индукции р' е Р. Следовательно, и р е ЕР. □ Другая точка зрения на плоскости состоит в том, что это множества решений систем линейных уравнений. Пусть дана система линейных уравнений £а^ = Ь( (г = 1,..., пг). (4) 3 = 1 Будем интерпретировать хх,...,хп как координаты точек п-мер- ного аффинного пространства S относительно некоторого репера (о;ец,..., еп). Тогда решения системы (4) можно понимать как точки пространства S. Предположим, что эта система совместна и Pq е S — одно из ее решений. Легко видеть, что точка р Е S является решением системы (4) тогда и только тогда, когда коор-
260 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА динаты вектора рор удовлетворяют системе однородных линейных уравнений Z aijxj = 0 (z = 1,..., пг). (5) 3 = 1 Мы знаем (теорема 2.3.2), что решения системы (5) образуют подпространство U С V размерности п — г, где г — ранг матрицы коэффициентов (общей у систем (4) и (5)). Следовательно, мно- жество решений системы (4) есть плоскость Р = р0 + U той же размерности. Таким образом, доказана Теорема 4. Множество решений совместной системы линей- ных уравнений есть плоскость размерности п — r, где п — число неизвестных, аг — ранг матрицы коэффициентов. Обратно, пусть Р = р0 4- U — некоторая плоскость. Согласно теореме 5.2.4, подпространство U может быть задано системой однородных линейных уравнений. Заменив свободные члены этих уравнений значениями, принимаемыми левыми частями в точке р0, мы получим систему линейных уравнений, задающую плоскость Р. Тем самым доказана Теорема 5. Всякая плоскость есть множество решений некоторой системы линейных уравнений. Обсудим теперь взаимное расположение двух плоскостей = Pi + t/j, Р2 = р2 Р U2. Очевидно, что если они пересекаются и р0 — одна из точек пересечения, то + ^4)- Теорема 6. Плоскости Рх и Р2 пересекаются тогда и только тогда, когда Р№ е Ц + U2. Доказательство. Плоскости TJ и Р2 пересекаются тогда и только тогда, когда существуют такие векторы их Е Ux, щЕ U2, что р1+и1=р2 + и2. Это равенство может быть переписано в виде W=ui - ^2- Поэтому существование таких векторов как раз и означает, что р^ Е Ux + U2. □ Плоскости Рх и Р2 называются параллельными, если Ux С U2 или U2 с Ux, и скрещивающимися, если Рх П Р2 — 0 и U\ П U2 = 0.
§ 1. АФФИННЫЕ ПРОСТРАНСТВА 261 ЗАДАЧА 3. Какова наименьшая размерность пространства, в котором существуют скрещивающиеся двумерные плоскости? ЗАДАЧА 4. Определить dimaff(P1 UP2). Рассмотрим теперь класс функций на аффинном пространстве, соответствующий классу линейных функций на векторном про- странстве. Определение 3. Аффинно-линейной функцией на аффинном пространстве S называется всякая функция f: S —> К, обладающая свойством f(p + х) = f(p) + а(х) (peS,xeV), (6) где а — некоторая линейная функция на векторном пространст- ве V. Функция а называется дифференциалом функции f и обозна- чается через df. Пусть о е S — фиксированное начало отсчета. Полагая в (6) р = о, мы получаем следующее выражение аффинно-линейной функции в векторизованной форме: f(x) = a(x) + b (be К), (7) где b = f(o). Отсюда, в свою очередь, получается запись функции f в координатах: f(x) = Y,aixi + b- (8) Обратно, для любой линейной функции а е V* и любого числа b е К функция /, определяемая формулой (7), является аффин- но-линейной функцией с дифференциалом а. В самом деле, пусть р = о + у, тогда, с учетом векторизации, f(p + х) — f (у 4- х) = а(у + х) + b = а(у) + а(а:) + b = = f(y) + а(х) = f(p) + а(х). Частным случаем аффинно-линейных функций являются посто- янные функции. Они характеризуются тем, что их дифференциал равен нулю. Если f — непостоянная аффинно-линейная функция, то ее многообразия уровня f(p) = с суть параллельные гиперпло- скости с направляющим подпространством, задаваемым уравнени- ем df(x) = 0. Аффинно-линейные функции образуют (п + 1)-мерное подпро- странство (где n = dimS) в пространстве всех функций на S. Это ясно хотя бы из их координатной записи (8).
262 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Докажем два утверждения об аффинно-линейных функциях, которые нам понадобятся в следующем параграфе. Предложение 1. Барицентрические координаты суть аф- финно-линейные функции. Доказательство. Пусть Хц, х{, ..., хп — барицентрические координаты относительно точек р0, ..., рп. Если векторизовать пространство S, приняв точку р0 за начало отсчета, то ..., хп бу- дут обычными координатами относительно базиса р^КГ)- Следовательно, ..., хп — аффинно-линейные функции. Так как х^= 1 — 52 xi< то — также аффинно-линейная функция. (Это i = 1 можно было бы также доказать, приняв за начало отсчета какую- нибудь другую из точек р4.) □ Предложение 2. Пусть f — аффинно-линейная функция. То- еда для любой барицентрической линейной комбинации 52 \Pi т0~ чекр{,...,рк. Доказательство. Векторизуем пространство S. Тогда f запишется в виде (7), и мы получим /(Е =«( ЕЬ =Е Л.(«(₽.) +fe) = E° Объединяя аксиоматику евклидова векторного пространства с аксиоматикой аффинного пространства, мы, наконец, можем ввести понятие, охватывающее всю элементарную геометрию. Определение 4. Аффинное пространство, ассоциированное с евклидовым векторным пространством, называется евклидовым аффинным пространством (или просто евклидовым простран- ством, если ясно, о чем идет речь). Расстояние р между точками евклидова пространства опреде- ляется по формуле p(p,q) = \pq\- Оно удовлетворяет аксиомам метрического пространства. В част- ности, неравенство треугольника следует из неравенства (26) гл. 5 для длины суммы векторов. ЗАДАЧА 5. Доказать, что расстояние между плоскостями = = Р] + {/] и Р2 = д2 + U2 евклидова пространства может быть найдено по формуле Р(-Рц Д) = + У2Р1й1-
§ 2. ВЫПУКЛЫЕ МНОЖЕСТВА 263 Среди всех аффинных систем координат в евклидовом простран- стве выделяются системы координат, связанные с ортонормиро- ванными базисами. Они называются прямоугольными системами координат. § 2. Выпуклые множества Пусть S — аффинное пространство, ассоциированное с вектор- ным пространством V над полем вещественных чисел. Определение 1. Отрезком, соединяющим точки р, q е S, на- зывается множество pq = {Хр + (1 — A)g:O^ А 1}с5. Определение 2. Множество М с S называется выпуклым, если вместе с любыми двумя точками оно содержит соединяющий их отрезок. Очевидно, что пересечение выпуклых множеств выпукло. Любая плоскость является выпуклым множеством. Определение 3. Выпуклой линейной комбинацией точек про- странства S называется их барицентрическая линейная комбина- ция с неотрицательными коэффициентами. Предложение 1. Выпуклое множество М с S вместе с лю- быми точками р0,р},.. .,рк содержит любую их выпуклую ли- нейную комбинацию p — Y^^iPi- i Доказательство проводится индукцией по числу коэффи- циентов Ао, Ли ..., Xk, отличных от нуля, совершенно так же, как доказательство теоремы 1.3, но с заменой прямых отрезками. □ Предложение 2. Для всякого множества М CS множество conv М всевозможных выпуклых линейных комбинаций точек из М является выпуклым множеством. Доказательство. Пусть р = '£ \Pi и Я — Ц.РЛ — выпук- лые линейные комбинации точек из М. Тогда при 0 А 1 Ар + (1 - A)g = £ XXiPi +13(1 - Х)р^ i i есть также выпуклая линейная комбинация точек из М. □
264 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Множество conv М является наименьшим выпуклым множест- вом, содержащим М; оно называется выпуклой оболочкой множе- ства М. Выпуклая оболочка системы аффинно независимых точек р0, Pi,..рп n-мерного пространства называется п-мерным сим- плексом с вершинами в точках р0, рх,..рп. Иными словами, симплекс состоит из точек, барицентрические координаты кото- рых относительно • • •, Рп неотрицательны. Нульмерный сим- плекс — это точка, одномерный симплекс — отрезок, двумерный — треугольник, трехмерный — тетраэдр (треугольная пирамида). Точка множестваMcS называется внутренней, если некоторая ее окрестность целиком содержится в М, и граничной в противном случае. Очевидно, что точки симплекса, барицентрические коор- динаты которых относительно вершин симплекса положительны (и только они) являются внутренними. Предложение 3. Выпуклое множество М содержит вну- тренние точки тогда и только тогда, когда aff Л/ = S. Доказательство. Если affМ = S, то М содержит систему из п + 1 аффинно независимых точек. Но тогда М содержит сим- плекс с вершинами в этих точках и, значит, содержит внутренние точки. Обратное очевидно. □ ЗАДАЧА 1. Доказать, что замыкание выпуклого множества выпукло, причем всякая его внутренняя точка является внутренней точкой самого множества. Выпуклое множество, содержащее внутренние точки, называется выпуклым телом. Предложение 4. Пусть р — внутренняя точка выпуклого тела М и q—любая его точка. Тогда все точки отрезка pq, за исключением, быть может, точки q, являются внутренними точками тела М. Доказательство. Рассмотрим точку r = Ap+(l-A)g (0<А^1). Имеем 1 . А - 1 р= Ar + —^- Если точка г' достаточно близка к г, то точка Рис. 3
§ 2. ВЫПУКЛЫЕ МНОЖЕСТВА 265 близка к точке р и, следовательно, лежит в М (см. рис. 3). Так как г' = Ар' + (1 - А)д, то отсюда следует, что г' е М. □ Следствие!. Внутренние точки выпуклого тела образуют выпуклое множество. Следствие 2. Всякая точка выпуклого тела является пре- делом его внутренних точек. Множество внутренних точек выпуклого тела М обозначим через М°. Это открытое выпуклое тело. Согласно предложению 3, всякое выпуклое множество М с S является выпуклым телом в affAf. Допуская вольность речи, часто говорят о внутренних точках произвольного выпуклого множества М, имея в виду его внутренние точки в пространстве aff М. Для любой непостоянной аффинно-линейной функции f на про- странстве S (см. § 1) положим Hf = {PeS-.f(p) = 0}, Я/ = {peS: f(p) > 0}, Н,- = {р е S : /(р) < 0} (= H+f). Множество Н} является гиперплоскостью. Множества Hf и Hr называются (замкнутыми) полупространствами, ограничивае- мыми гиперплоскостью Н;. Из предложения 1.2 следует, что всякое полупространство является выпуклым множеством. С другой сто- роны, всякий отрезок, соединяющий точку из Н7 с точкой из Яу, пересекает гиперплоскость Н{. Определение 4. Гиперплоскость Н} называется опорной ги- перплоскостью замкнутого выпуклого тела М, если М с Я,+ и Н{ содержит некоторую (граничную) точку тела М. Полупространство Яу+ называется при этом опорным полупространством тела М. Предложение 5. Гиперплоскость Я, проходящая через гра- ничную точку замкнутого выпуклого тела М, является опор- ной тогда и только тогда, когда Я П М° = 0. Доказательство. Если Я П М° 0, то точки множества М° (и, тем самым, точки тела М) имеются по обе стороны от Я. Обратно, если точки тела М имеются по обе стороны от Я, то, поскольку каждая точка тела М является пределом точек множества М°, по обе стороны от Я имеются даже точки этого множества. Отрезок, соединяющий две такие точки, целиком лежит в М° и пересекает Я, так что Я П М° / 0. □ Ключевой теоремой теории выпуклых множеств является следу- ющая теорема отделимости.
266 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Теорема 1. Через любую граничную точку замкнутого вы- пуклого тела проходит опорная гиперплоскость. Доказательство. Пусть р — граничная точка замкнутого выпуклого тела М в n-мерном аффинном пространстве. Докажем индукцией по к, что при к < п — 1 через точку р проходит А:-мерная плоскость, не пересекающая М°. При к = 0 такой плоскостью является сама точка р. Предположим, что уже удалось найти (к — 1)-мерную плоскость Р с нужными свойствами. Выберем любую (к + 1)-мерную плоскость S', содержащую Р и какую- нибудь внутреннюю точку р0 тела М, и попытаемся найти нужную нам /с-мерную плоскость среди плоскостей, содержащих Р и содержащихся в S'. Рассмотрим выпуклое тело М' — М Г) S' в пространстве S'. Ясно, что М° П S' с (М')°. Обратно, всякая точка г е (М')° является вну- тренней точкой отрезка, соединяющего точку Pq @с некоторой точкой q е М' С М (см. рис. 4) и потому принадлежит М°. Таким образом, (А1')° = ГП5'. В частности, отсюда следует, что Р П(М')° = 0, и нам достаточно доказать, что в S' существует Рис. 4 опорная гиперплоскость тела М', содержащая Р. Изменив обозначения, будем считать, что S' = S, М' = Мнк + 1— п. Итак, пусть Р — это (п —2)-мерная плоскость, проходящая через точку р и не пересекающая М°. Докажем, что существует опорная гиперплоскость тела М, содержащая Р. Каждая гиперплоскость Н, содержащая плоскость Р, разбивает- ся ею на две полуплоскости (или полугиперплоскости, если угод- но), скажем, Н+ и Н~ (не путать с предыдущими обозначениями полупространств). Если ни одна из полуплоскостей Н+ и Н~ не пересекает М°, то все доказано. Если они обе пересекают М°, то и Р пересекает М°, так что этот случай невозможен. Пусть теперь Н+ пересекает М°, а Н~ не пересекает. Начнем поворачивать гиперплоскость Н вокруг Р, условно говоря, по часовой стрелке. Ясно, что при небольшом повороте полуплоскость Н+ по-прежнему будет пересекать М°. Однако при повороте на тг она перейдет в полуплоскость Н~, которая М° не пересекает. Поэтому существует некий минимальный поворот, при котором Н+ перестает пересекать М°. Повернутую таким образом гиперпло- скость Н обозначим через Яо.
§ 2. ВЫПУКЛЫЕ МНОЖЕСТВА 267 Согласно построению, полу- плоскость HJ не пересекает множество М°, но при малей- шем повороте против часовой стрелки начинает его пересекать (см. рис. 5). С другой сторо- ны, если бы полуплоскость пересекала М°, то она сохра- нила бы это пересечение при любом небольшом повороте. Но, как мы уже отмечали, обе поло- вины гиперплоскости, содержа- щей Р, не могут пересекать М°. Следовательно, Но не пересекает М° и, значит, Но — опорная гиперплоскость. □ ЗАМЕЧАНИЕ 1. Фактически мы доказали более сильное утвер- ждение, а именно, что любая плоскость, проходящая через точку р и не пересекающая М°, содержится в некоторой опорной гипер- плоскости. ЗАМЕЧАНИЕ 2. Через данную граничную точку р тела М может проходить либо единственная опорная гиперплоскость, как на рис. 5, либо бесконечно много таких гиперплоскостей, как на рис. 6. Опорная гиперплоскость может содержать и другие точки тела М, кроме точки р, как на рис. 7. Рис. 6 Рис. 7 Теорема 2. Всякое замкнутое выпуклое множество М яв- ляется пересечением некоторого (быть может, бесконечного) числа полупространств.
268 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Доказательство. Заметим, что всякая гиперплоскость Hf Рис. 8 некоторой точке г f q. Проведем плоскость Hf (см. рис. 8). Так каь т. е. q £ Hf. □ является пересечением полу- пространств Hf и Hf. Отсюда следует, что и плоскость любой размерности является пересе- чением полупространств. По- этому доказательство теоремы сводится к случаю, когда М — тело. Докажем, что замкнутое вы- пуклое тело М является пе- ресечением своих опорных по- лупространств. Пусть q М и р — какая-либо внутренняя точка тела М. Отрезок pq пе- ресекает границу тела М в через эту точку опорную гипер- f(p) > 0, а /(г) = 0, то f(q) < О, Определение 5. Пересечение конечного числа полупрост- ранств называется выпуклым многогранником. Выпуклый много- гранник, являющийся телом, называется телесным. Иными словами, выпуклый многогранник есть множество реше- ний конечной системы линейных неравенств. Отметим, что выпук- лый многогранник не обязан быть ограниченным. Так, например, все пространство S является выпуклым многогранником (пересече- ние пустого множества полупространств). Выпуклый многогранник не обязан быть телесным (хотя иногда это и требуют). Очевидно, что пересечение конечного числа выпуклых много- гранников является выпуклым многогранником. Любая плоскость является выпуклым многогранником. ПРИМЕР 1. Симплекс с вершинами р0, ..., рп является выпуклым многогранником, так как он может быть задан линей- ными неравенствами xi 0 (г = 0, 1,..., п), где х^, хх,..., хп — барицентрические координаты относительно р0, р1; ..., рп. ПРИМЕР 2. Выпуклый многогранник, задаваемый линейными неравенствами 0 < xi < 1 (г = 1,..., п), где xt,..., хп — аффинные координаты относительно некоторого репера, называется п-мер- ным параллелепипедом. Определение 6. Точка р выпуклого множества М называется крайней, если она не является внутренней точкой никакого отрез- ка, целиком лежащего в М.
§ 2. ВЫПУКЛЫЕ МНОЖЕСТВА 269 Теорема 3. Всякое ограниченное замкнутое выпуклое мно- жество М является выпуклой оболочкой множества Е(М) своих крайних точек. оказательство. Положим М = conv Е (М). Очевидно, что М с М. Докажем индукцией по dim S, что М с М. При dim S = 0 доказывать нечего. Пусть dim S > 0 и р е М. Докажем, что ре М. Будем считать, что М — тело, так как иначе можно применить предположение индукции. Рассмотрим два случая. 1-й случай. Пусть р — граничная точка. Проведем через р опорную гиперплоскость Н. Тогда М П Н — ограниченное замк- нутое выпуклое множество, и всякая его крайняя точка является в то же время крайней точкой множества М. По предположению индукции М П Н является выпуклой оболочкой множества своих крайних точек. Следовательно, ре М. 2-й случай. Пусть р — внутренняя точка. Проведем через р любую прямую. В силу ограниченности множества М она пересекает его по некоторому отрезку qr, содержащему точку р. Точки q и г являются граничными точками тела М и по доказанному принадлежат М. Следовательно, р е М. □ Теорема 4 (Минковского — Вейля). Следующие свойства ограниченного множества М с S равносильны: 1) М — выпуклый многогранник; 2) М — выпуклая оболочка конечного числа точек. Доказательство. 1) Пусть т (9) • = i — выпуклый многогранник. Докажем, что всякая его крайняя точка есть единственная точка пересечения некоторых из гиперпло- скостей Н},..., Н} . Отсюда будет следовать, что М имеет лишь конечное число крайних точек. С другой стороны, по теореме 3 он является их выпуклой оболочкой. Пусть р е М — крайняя точка. Положим J = {3 :Л(р) = 0}с{1,...,т}, Р = {хе S : fjfx) = 0 при j е J}. Так как /Др) > 0 при i J, то р является внутренней точкой выпуклого многогранника МПР в пространстве Р. Но р — крайняя точка множества М и, следовательно, — крайняя точка множества М П Р. Это означает, что dim Р =0, т.е. Р = {р}.
270 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА 2) Пусть М = conv{f>|,..рк}. Будем считать, что aff М = S, и рассмотрим выпуклый многогранник = при 2 — 1,..., к, в пространстве аффинно-линейных функций на S. Так как аф- финно-линейная функция на S однозначно определяется своими значениями в точках Pl,..., Рк, а для функций из М* эти значения принадлежат отрезку [0, 1], то М* — ограниченный многогранник. По доказанному он является выпуклой оболочкой конечного числа точек, скажем, ..., fm. По теореме 2 множество М (очевидно, что оно замкнуто) может быть задано линейными неравенствами. Следовательно, М = {Ре S :f(P)^0 Vf € М*} = {Ре S :fi(P)^0 при i = 1, ..., т}. Таким образом, М — выпуклый многогранник. □ Определение 7. Гранью выпуклого многогранника М назы- вается всякое непустое пересечение этого многогранника с неко- торым числом его опорных гиперплоскостей. (Сам многогранник М также считается своей гранью как пересечение с пустым множеством опорных гиперплоскостей.) Нульмерная грань называется вершиной, одномерная — ребром, (п — 1)-мерная (где п = dim aff М) — гипергранъю. Пусть много- гранник М задан формулой (9). Следующая теорема показывает, что для нахождения его граней можно ограничиться рассмотрением гиперплоскостей . Теорема 5. Всякая грань Г многогранника М имеет вид (10) где J с {1,..., т}. Доказательство. Пусть Г' — грань многогранника М. Положим J = {j :Г'сЯ4}с{1,..,т}. Для каждого i J существует такая точка Pi е Г', что fi(Pi) > 0. Пусть Р — центр тяжести системы этих точек. Тогда /, (р) > 0 при всех г J. Определим теперь грань Г по формуле (10) и докажем, что Г' = Г. Ясно, что Г' с Г и что точка Р является внутренней точкой грани Г. Следовательно, всякая опорная гиперплоскость, проходящая через Р, содержит Г. Значит, Г' = Г. □
§ 2. ВЫПУКЛЫЕ МНОЖЕСТВА 271 Таким образом, если выпуклый многогранник задан системой линейных неравенств, то его грани получаются заменой части этих неравенств равенствами (но так, чтобы при этом получилось непустое множество). Нужно, однако, иметь в виду, что на опреде- ленной таким образом грани некоторые другие неравенства могут автоматически обращаться в равенства. ПРИМЕР 3. Грани п-мерного параллелепипеда, задаваемого неравенствами 0^ 1 (г = 1,..., п), выделяются тем, что некото- рые координаты равны 0 или 1. В частности, вершины — это точки, все координаты которых равны 0 или 1. ЗАДАЧА 2. Найти грани сечения n-мерного параллелепипеда О хг 1 (г = 1,..., п) гиперплоскостью х1 + ... + хп = ЗАДАЧА 3. Найти грани n-мерного симплекса. ЗАДАЧА 4. Доказать, что всякая грань многогранника conv {ди ..., рк} есть выпуклая оболочка некоторых из точек Pi,---,Pk- Изучение комбинаторного строения выпуклых многогранников — это увлекатель- ная и важная область математики. Вот два примера результатов из этой области. 1. Назовем /-вектором n-мерного ограниченного выпуклого многогранника по- следовательность (ад, ар ..., ап_ J, где ак —число А:-мерных граней этого мно- гогранника. Каковы необходимые и достаточные условия для того, чтобы данная последовательность п натуральных чисел была /-вектором некоторого п-мерно- го многогранника? При п = 3 это следующие условия (теорема Штейница): Og — а1+а2 = 2, 4s: ад, -у-. В общем случае ответ неизвестен. 2. Назовем вершины р и q выпуклого многогранника смежными, если отрезок pq является ребром этого многогранника. Легко видеть, что единственным 3-мерным выпуклым многогранником, у которого любые две вершины смежны, является тетраэдр. Совершенно иная ситуация в 4-мерном пространстве. Как показал Д. Гейл, там существуют выпуклые многогранники с любым числом вершин, у которых любые две вершины смежные. Например, пусть М — выпуклая оболочка точек где tp ..., tN —различные вещественные числа. Тогда 1) каждая из точек р, является вершиной многогранника М (и это все его вершины: см. задачу 4); 2) каждый из отрезков р,р^ (г //) является ребром многогранника М. Докажите это самостоятельно. Предложение 6. Крайние точки выпуклого многогранника М — это в точности его вершины. Доказательство. Если точка р является внутренней точ- кой отрезка, целиком лежащего в М, то любая опорная гиперпло- скость, проходящая через р, содержит этот отрезок и, следователь- но, р не может быть вершиной. Обратно, если точка р не является
272 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА вершиной, то она является внутренней точкой некоторой грани положительной размерности и, значит, не может быть крайней точкой. □ Важнейшие применения выпуклых многогранников вне матема- тики связаны с линейным программированием. Основная задача линейного программирования формулируется таким образом: найти максимум (минимум) заданной аффинно-линейной функции на за- данном выпуклом многограннике. Очевидно, что задача о минимуме функции f равносильна задаче о максимуме функции —поэтому можно говорить только об одной из этих задач. В основе линейного программирования лежит следующая Теорема 6. Максимум аффинно-линейной функции f на огра- ниченном выпуклом многограннике М достигается в одной из его вершин. Доказательство. Согласно теореме 3 и предложению 6, каждая точка р многогранника М представляется в виде выпуклой линейной комбинации его вершин р{,..., рк: k k P='EXiPi> ZA. = 1, (i = l,...,k). 1=1 1 = 1 В силу предложения 1.2 k f(p) = E Xif(Pi) ma*f(Pi), i = i • откуда и следует утверждение теоремы. □ Приведем два примера ситуаций, в которых возникает задача линейного программирования. Пример 4 (задача о получении максимальной прибыли). Не- которое предприятие располагает ресурсами Ри ..., Рт в количест- ве bl,...,bm соответственно и планирует произвести продукцию типов П1,...,ПП в количестве х},...,хп соответственно. Пусть aiy — количество ресурса Ро нужное для производства единицы продукции Пу, и су — цена единицы продукции Пу. Очевидно, что должны выполняться неравенства Ё ai-xj < bt (г = 1,..., т), х}^0 (у = 1,..., п). У = 1 Они задают некоторый выпуклый многогранник М в n-мерном про- странстве с координатами х{, . . ., хп. Для получения максимальной прибыли нужно выбрать точку (хг,..., хП)еМ,в которой линейная функция cjxj (цена произведенной продукции) максимальна. 3 = 1
§ 3. АФФИННЫЕ ПРЕОБРАЗОВАНИЯ И ДВИЖЕНИЯ 273 П РИМЕР 5 (транспортная задача). Имеются поставщики Аи .. ..Ат, располагающие неким продуктом в количестве аи ..., ат соответственно, и потребители Д,..., Вп, которые должны полу- чить этот продукт в количестве b-t,..., Ьп соответственно, причем 52 а; = 52 V Пусть xt] — количество продукта, которое предпола- i=i j=i гается доставить от А, к и cf. — стоимость доставки единицы продукта от At к В-. Должны выполняться условия п ТП 12хц = ^ Y,xn = bj, ха^°- j = 1 г' — 1 Они задают некоторый выпуклый многогранник в mn-мерном пространстве с координатами (г = 1, ..т, j — 1,..п). Задача состоит в минимизации линеинои функции 52 cij xi, (общей стоимости перевозки) на этом многограннике. Основной метод решения задачи линейного программирования, на- зываемый симплекс-методом, со- стоит в движении по ребрам мно- гогранника М в направлении воз- растания функции f до тех пор, пока это возможно. Движение за- канчивается в одной из вершин, в которых достигается максимум функции f (см. рис. 9). § 3. Аффинные преобразования и движения Пусть S и S' — аффинные пространства, ассоциированные с век- торными пространствами V и V соответственно (над одним и тем же полем). Определение 1. Аффинным отображением пространства S в пространство S' называется всякое отображение f: S —> S', обладающее свойством № + х) = /(р) + <р(х) (PeS, xev), (11) где — некоторое линейное отображение пространства V в пространство V. В частности, аффинно-линейные функции, определенные в § 1 — это не что иное, как аффинные отображения пространства S в поле К, рассматриваемое как аффинная прямая.
274 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Из (И) вытекает, что <p(pq) = f(p)f(q) (P,qeS). (12) Тем самым линейное отображение однозначно определяется по f. Оно называется дифференциалом отображения f и обозначается через df. Векторизуем пространства S и S', приняв за начала отсчета какие-то точки о и о' соответственно. Полагая в (И) р — о, мы получаем следующее представление аффинного отображения f в векторизованной форме: f(x) = <p(x) + b (beV), (13) где b = o'f(o). Отсюда, в свою очередь, получается запись отобра- жения f в координатах: Уг = Z ацх3 +ь, (г = 1,...,т), (14) 3 = I где Xj,..хп — координаты точки х, a ylt..ут — координаты точки у = f{x). Обратно, как легко проверить, для любого линейного отображе- ния V —> V и любого вектора b е V отображение, определяемое формулой (13), аффинно и его дифференциал равен <р. Пусть S" — еще одно аффинное пространство и g: S’ —> S" — аффинное отображение. Предложение 1. Отображение gf: S —> S" является аффин- ным, причем d(gf) = dg-df. (15) Доказательство. При р е S, х е V имеем (gf)(p + х) = g(f(p + х)) = g(f(p) + df(x)) = = g(f(p)) + dg(df(x)) = (gf)(p) + (dg • df)(x). □ При К = К дифференциал аффинного отображения есть част- ный случай дифференциала произвольного гладкого отображения, рассматриваемого в анализе, а формула (15) есть частный случай формулы для дифференциала произведения гладких отображений (или «сложной функции»). Предложение 2. Аффинное отображение биективно тогда и только тогда, когда его дифференциал биективен. Доказательство. Выберем начала отсчета о и о' в про- странствах S и S' таким образом, чтобы f (о) = о'. Тогда отоб- ражение f в векторизованной форме будет совпадать со своим дифференциалом, откуда и следует доказываемое утверждение. □
§ 3. АФФИННЫЕ ПРЕОБРАЗОВАНИЯ И ДВИЖЕНИЯ 275 Биективное аффинное отображение называется изоморфизмом аффинных пространств. Аффинные пространства называются изо- морфными, если между ними существует изоморфизм. Следствие. Конечномерные аффинные пространства (над одним и тем же полем) изоморфны тогда и только тогда, когда они имеют одинаковую размерность. Очевидно, что при аффинном отображении /: S —> S' всякая плоскость Р = р + U пространства S переходит в плоскость f(P) = f(p) + df(U) пространства S'. Если f биективно, то dim f(P) — dim P. Аналогично предложению 1.2 доказывается, что i i для любой барицентрической линейной комбинации точек Ри ..., pk е S. В частности, центр тяжести системы точек при аффинном отображении переходит в центр тяжести системы их образов. Аффинное отображение аффинного пространства S в себя на- зывается аффинным преобразованием. Биективные аффинные преобразования образуют группу, называемую полной аффинной группой пространства S и обозначаемую через GA(S'). (Это согласуется с тем определением, которое было дано в § 4.2 в векторной форме.) В силу предложения 1 отображение d:GA(S)->GL(V) является гомоморфизмом групп. Его ядро есть группа параллель- ных переносов ta:p^>p + a (a eV). Обозначим ее через Tran S. Предложение 3. Для любых f е GA(S) и a eV имеем (16) Доказательство. Применяя преобразование ftaf~' к точке д — f(p), получаем ftaf-'(q) = fta(p) = f(P + а) = f (Р) + df (а) = q + df(a). □ Конечно, не удивительно, что преобразование ftaf~l оказалось параллельным переносом: ведь подгруппа Tran S с GA(S), будучи ядром гомоморфизма, должна быть нормальной.
276 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Если фиксировано начало отсчета о е S и тем самым аффинное пространство S отождествлено с векторным пространством V, то группа GL(V) становится подгруппой группы GA(S). Это не что иное, как стабилизатор точки о в группе GA(S). Из записи аффинных преобразований в векторизованной форме (13) следует, что всякое аффинное преобразование f е GA(S) единственным образом представляется в виде f = tb? (^eGL(V), be V). (17) Ясно, что tp = df не зависит от выбора начала отсчета, но вектор b = of (о) от этого, вообще говоря, зависит. ЗАДАЧА 1. Доказать, что при переходе к началу отсчета о' = = о + а (а е V) вектор b заменяется на вектор b'= Ь + <р(а) - а. (18) ПРИМЕР 1. Согласно предложению 4.2.2, всякое движение евклидовой плоскости Е2 является (биективным) аффинным пре- образованием. То же верно для евклидова пространства Е3. ПРИМЕР 2. Гомотетия с центром в точке о и коэффициентом А есть аффинное преобразование, задаваемое формулой f(o + х) — о + Ах. Ясно, что df = Х£. Докажем, что всякое аффинное преобразование /, для которого df = Х£ (А 1), есть гомотетия с центром в некоторой точке. Для этого достаточно доказать, что / имеет неподвижную точку. Запишем f в векторизованной форме: f(x) = Xx + b (beV). Уравнение f(x) — х приводится к виду (1 — Х)х — Ь, и, следователь- но, имеет (единственное) решение. Гомотетия с коэффициентом —1 называется центральной сим- метрией. ЗАДАЧА 2. Доказать, что произведение гомотетий с центрами в разных точках с коэффициентами Аид при Ад 1 есть гомотетия, а при Ад = 1 —нетривиальный параллельный перенос. Группа аффинных преобразований определяет аффинную гео- метрию в том смысле, что задачей аффинной геометрии является
§ 3. АФФИННЫЕ ПРЕОБРАЗОВАНИЯ И ДВИЖЕНИЯ 277 изучение свойств фигур, инвариантных при (биективных) аффин- ных преобразованиях. Так как при таких преобразованиях любая плоскость переходит в плоскость той же размерности, а любая барицентрическая линейная комбинация точек — в барицентри- ческую линейную комбинацию их образов с теми же коэффици- ентами, то понятия плоскости и барицентрической комбинации точек, а следовательно, понятия параллельных прямых, паралле- лограмма, отрезка, середины отрезка, центра тяжести системы точек, выпуклого множества, симплекса и т. д. относятся к числу понятий аффинной геометрии. Но, например, понятия квадрата и окружности к числу таковых не относятся, так как при аффинном преобразовании квадрат может перейти в параллелограмм, не являющийся квадратом, а окружность — в эллипс, не являющийся окружностью. Следующая теорема показывает, что в аффинной геометрии все симплексы равны (например, на аффинной плоскости все треугольники равны). Теорема!. Пусть {р0, piy..рп} и {q0, q{, qn} — две си- стемы аффинно независимых точек в п-мерном аффинном пространстве S. Тогда существует единственное аффинное преобразование f, переводящее pt в qt при г =0, 1,..., п. Доказательство. Существует единственное линейное пре- образование щ пространства V, переводящее базис ..., РьР^} в базис ..., Зо9^}. Векторизуем пространство S, приняв за начало отсчета точку Pq. Тогда искомое аффинное преобразование / записывается в виде /(^) = ¥’(^)+Я9о- □ ЗАДАЧА 3. Доказать, что в вещественной аффинной геометрии все параллелепипеды равны. ЗАДАЧА 4. Пусть Р], Р2, Р\, Р2 с S — плоскости с направляю- щими подпространствами Ц, U2, U[, U2 соответственно. Предполо- жим, что dim Р, = dim JJ', dim P2 = dim P2, dim Ц П U2 = dim Ц' Г) U2 и пересечения P{ П P2 и Р/ П P2 пусты или непусты одновременно. Доказать, что тогда существует преобразование f е GA(S), пере- водящее Р, в J}' и Р2 в Р2. В аффинной геометрии не существует понятия расстояния между точками, так как любую пару различных точек с помощью аф- финного преобразования можно перевести в любую другую такую пару. Однако при аффинных преобразованиях сохраняется так называемое отношение тройки точек, лежащих на одной прямой.
278 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Пусть точки ft, ft, ft лежат на одной прямой I. Тогда, если р? 7^ р3, то рД% = срДГ2 (с е К). Число с и называется (прос- тым) отношением тройки точек РпР2,Рз и обозначается через (ft, ft, Рз). Если ft ft = р3, то полагают (р^ Р2, Р%) = оо. Если ft=ft = ft, то (Р1,Р2,Рз) не определено. Если с = —, то говорят также, что точка р3 делит отрезок р^ в отношении А : р (хотя само понятие отрезка определено только в вещественной геометрии). При А + р = 1 это означает, что ft = PPi + Aft. Ясно, что отношение точек ft, ft, ft сохраняется при любом аф- финном преобразовании, не стягивающем прямую I в точку (в частности, при любом биективном аффинном преобразовании). ЗАДАЧА 5. Выяснить, как изменяется отношение тройки точек при перестановках этих точек. Какое наибольшее и какое наимень- шее число различных значений оно может принимать? с ЗАДАЧА 6. Построить треугольник abc по /\ точкам х, у, z на его сторонах be, са, аЬ (или / их продолжениях), делящих их в отношениях / А : 1, р : 1, v: 1 соответственно (рис. 10). (Ука- у \ зание: рассмотреть произведение гомотетий с / ______\ центрами в точках х, у, z, переводящих с в Ъ, а z b а в с, Ъ в а соответственно. Ср. пример 1.1.) Рис 10 Пусть теперь S — евклидово аффинное пространство, ассоциированное с евклидовым векторным пространством V. Определение 2. Движением пространства S называется вся- кое его аффинное преобразование, дифференциал которого являет- ся ортогональным оператором. (В частности, отсюда следует, что всякое движение биективно.) Очевидно, что движение сохраняет расстояние между точками (см. определение в §1) и, обратно, всякое аффинное преобразова- ние, сохраняющее расстояние между точками, является движени- ем. Замечание 1. На самом деле можно показать, что всякое биективное преобра- зование пространства S, сохраняющее расстояние между точками, автоматически является аффинным преобразованием и, следовательно,—движением. Движения евклидова пространства S образуют группу, обознача- емую Isom S. Движение называется собственным (или сохраняю- щим ориентацию), если его дифференциал принадлежит SO(V), и
§ 3. АФФИННЫЕ ПРЕОБРАЗОВАНИЯ И ДВИЖЕНИЯ 279 несобственным (или меняющим ориентацию) в противном случае. Собственные движения образуют подгруппу индекса 2 в Isom S, обозначаемую Isom+S (ср. пример 4.6.17). ПРИМЕР 3. Важным примером несобственного движения явля- ется (ортогональное) отражение гн относительно гиперплоскости Н. Пусть е — единичный вектор, ортогональный Н. Всякую точку р € S можно единственным образом представить в виде p = q + Xe (qeH). По определению rHP = Q~ Ае (см. рис. И). Дифференциал отражения гн есть (ортогональное) отражение относительно направляющего подпространства гипер- плоскости Н в пространстве V. Пусть и Н2 —две гиперплоско- сти. Если они параллельны, то drH = drH~ и, следовательно, d(rHt гнг) = drHi ’ ^гнг — £• В этом случае гн тн —параллельный перенос на удвоенный общий перпендикуляр гиперплоскостей Нх и Н2 (см. рис. 12). Если же 7Z, и Н2 пересекаются по (п — 2)-мерной плоскости Р, то гн,гн2 — поворот вокруг Р на удвоенный угол между Н{ и Н2, т. е. движение, оставляющее на месте все точки плоскости Р и осуществляющее поворот на указанный угол в любой двумерной плоскости, ортогональной Р (ср. пример 6.3.4). ЗАДАЧА 7. Доказать, что группа IsomS порождается отраже- ниями относительно гиперплоскостей.
280 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Если в пространстве S выбрано начало отсчета, то всякое движе- ние однозначно представляется в виде (17), где G O(V). Однако вектор Ь, вообще говоря, зависит от начала отсчета. Следующая теорема даст некое каноническое представление любого движения. Теорема 2. Для всякого движения f существует однозначно определенная плоскость Р =pQ + U со следующими свойствами: 1) f(P) = P, причем /|р—параллельный перенос (быть мо- жет, тривиальный); 2) df не имеет ненулевых неподвижных векторов в UL. Доказательство. Если искомая плоскость существует, то ее направляющее подпространство должно совпадать с подпро- странством неподвижных векторов оператора A—df. Обозначим это подпространство через U. Приняв какую-нибудь точку за начало отсчета, запишем движение f в векторизованной форме: f(x) = Ах + а. Пусть а = 6 + с, beU, се U1-. Так как оператор А — £ невырожден на U1-, то существует единственный вектор х^ е U\ для которого Axq + с = Xq. Пусть pQ — соответствующая точка. Тогда f(Po)=Po + b. Плоскость Р — р0 + U и является той единственной плоскостью, которая удовлетворяет требованиям теоремы. □ Плоскость Р называется осью движения f. Движение f опре- деляется своей осью Р = Pq + U, вектором b е U и ортогональ- ным преобразованием В = A\UL пространства U\ не имеющим неподвижных векторов. Как следует из описания ортогональных преобразований, для собственных движений размерность dim U1 четна, а для несобственных — нечетна. Пользуясь этой теоремой, опишем движения евклидовой прямой, плоскости и трехмерного пространства в терминах элементарной геометрии. Через Р будем обозначать ось движения f. Пусть f — движение евклидовой прямой. Возможны два случая. 1) dim Р — 1. В этом случае f — параллельный перенос. 2) dim Р = 0, т. е. Р — точка. В этом случае В = —£ и f — отражение (симметрия) относительно точки Р. Пусть f — движение евклидовой плоскости. Возможны три случая.
§ 3. АФФИННЫЕ ПРЕОБРАЗОВАНИЯ И ДВИЖЕНИЯ 281 1) dim Р = 2. В этом случае f — параллельный перенос. 2) dim Р = 1, т. е. Р — прямая. В этом случае В = -8 и f — отра- жение относительно прямой Р или скользящее отражение, т.е. композиция отражения относительно Р и параллельного переноса вдоль Р. 3) dim Р = 0, т. е. Р — точка. В этом случае f — (нетривиаль- ный) поворот вокруг точки Р. Пусть, наконец, f — движение трехмерного евклидова простран- ства. Возможны четыре случая. 1) dim Р = 3. В этом случае f — параллельный перенос. 2) dim Р = 2. В этом случае f — отражение относительно пло- скости Р или скользящее отражение, т.е. композиция отражения относительно Р и параллельного переноса на вектор, параллель- ный Р. 3) dim Р = 1. В этом случае f — (нетривиальный) поворот вокруг прямой Р или винтовое движение, т.е. композиция поворота вокруг Р и параллельного переноса вдоль Р. 4) dim Р = 0. В этом случае f — зеркальный поворот, т.е. композиция (нетривиального) поворота вокруг некоторой прямой и отражения относительно плоскости, перпендикулярной этой прямой; при этом указанные прямая и плоскость пересекаются в точке Р. ЗАДАЧА 8. Что представляет собой композиция поворотов f и g евклидовой плоскости вокруг разных точек? (Указание: вычис- лите d(fg).) Для любой фигуры М евклидова пространства S можно опреде- лить ее группу симметрии Sym М = {/ е Isom S : f(M) = М}. Таким образом возникают, например, кристаллографические груп- пы как группы симметрии кристаллических структур. Отметим, что если группа Sym М содержит несобственные движения, то группа Sym+M - {/ е Isom + S : f(M) - М} является ее подгруппой индекса 2 как ядро гомоморфизма SymM—>{±1}, /i->detd/.
282 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Если М — ограниченный выпуклый многогранник, то группа Sym М конечна, так как движение, отображающее многогранник М на себя, однозначно определяется тем, как оно переставляет его вершины, а таких перестановок может быть лишь конечное число. Кроме того, группа Sym М сохраняет центр тяжести множества вершин многогранника М и потому фактически представляет собой подгруппу ортогональной группы. Наиболее симметричны так называемые правильные мно- гогранники. Пусть М — телесный выпуклый многогранник в n-мерном евк- лидовом пространстве. Назовем флагом многогранника М набор его граней {Fo, Fif..., где dim Fk = к и Fo с F} С ... С Fn_x. Определение 3. Выпуклый многогранник М называется пра- вильным, если для любых двух его флагов существует движение f е Sym М, переводящее первый из этих флагов во второй. Так как движение / е Sym М, очевидно, определяется тем, куда оно переводит какой-нибудь один флаг, то порядок группы симметрии правильного многогранника равен числу его флагов. Двумерные правильные многогранники — это обычные правиль- ные многоугольники. Их группы симметрии были описаны в при- мере 4.1.11. Трехмерные правильные многогранники — это платоновы тела, т.е. правильный тетраэдр Т, куб К, октаэдр О, додекаэдр D и икосаэдр I. (См. рис. 6 гл. 4.) Куб и октаэдр, а также додека- эдр и икосаэдр — это так называемые двойственные правильные многогранники, имеющие одинаковые группы симметрии, так как центры граней одного из двойственных многогранников являются вершинами другого. (Тетраэдр двойствен сам себе.) Согласно предыдущему, порядок группы симметрии Sym Р трех- мерного правильного многогранника Р равен числу его флагов, т. е. |Sym Р| = (число вершин) х х (число ребер, выходящих из каждой вершины) х 2. Следовательно, |SymT| = 24, |SymJC| = |Sym O|=48, |Sym D\ = |Sym T| = 120. Группа Sym +Р имеет вдвое меньший порядок. Она состоит из поворотов вокруг прямых, проходящих через центр многогранника Р и через его граничную точку, которая является либо вершиной, либо серединой ребра, либо центром грани. ЗАДАЧА 9. Перечислить все элементы группы симметрии куба.
§ 4. КВАДРИКИ 283 В рамках группового подхода аналогично евклидовой геометрии столь же просто определяется псевдоевклидова геометрия. Вещественное векторное пространство, в котором фиксирова- на симметрическая билинейная функция а сигнатуры (k,l), где k, I > 0, к + I = п = dim V, называется псевдоевклидовым век- торным пространством сигнатуры (k, I). Группа линейных пре- образований пространства V, сохраняющих функцию а, назы- вается псевдоортогональной группой и обозначается O(VJ а). Аффинное пространство S, ассоциированное с псевдоевклидовым векторным пространством V, называется псевдоевклидовым аф- финным пространством соответствующей сигнатуры, а группа Isom S = d-1(O(V^ а)) — группой его движений. Геометрия, опре- деляемая этой группой, и есть псевдоевклидова геометрия. Пространство-время специальной теории относительности — это псевдоевклидово аффинное пространство сигнатуры (3, 1). Оно на- зывается пространством Минковского, а группа его движений — группой Пуанкаре. (Соответствующая группа псевдоортогональ- ных преобразований называется группой Лоренца.) ЗАДАЧА 10. Описать псевдоортогональную группу О(И а), где V — двумерное вещественное векторное пространство, а функция а имеет сигнатуру (1, 1). (Указание: использовать систему коорди- нат, в которой соответствующая квадратичная функция имеет вид g(x) = X1»J.) ЗАДАЧА 11. Сформулировать и доказать «третий признак ра- венства треугольников» на псевдоевклидовой плоскости. § 4. Квадрики Простейшими объектами аффинной и евклидовой геометрий являются плоскости, которые, как мы знаем, задаются система- ми линейных уравнений. Естественным обобщением плоскостей (называемых также линейными многообразиями) являются так называемые алгебраические многообразия — подмножества аф- финного пространства, задаваемые произвольными системами ал- гебраических уравнений. Их изучением занимается алгебраическая геометрия. Это обширный раздел математики, который не может быть представлен в настоящем курсе. Мы лишь слегка коснемся некоторых общих вопросов алгебраической геометрии в гл. 9, а в этом параграфе рассмотрим простейший после плоскостей тип алгебраических многообразий — квадрики, задаваемые одним
284 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА алгебраическим уравнением второй степени. К их числу относятся такие объекты элементарной геометрии, как окружности и сферы. Будем считать, что char К 2. Определение 1. Аффинно-квадратичной функцией на аф- финном пространстве S называется всякая функция Q : S —> К, имеющая в векторизованной форме вид Q(x) = q(x) + l(x) + с, (19) где q — квадратичная функция, I — линейная функция, ас — константа. Пусть q — поляризация квадратичной функции q, т. е. соответст- вующая ей симметрическая билинейная функция. Лемма 1. При переносе начала отсчета о в точку о' — о + а (ае V) слагаемые выражения (19) преобразуются следующим образом: q'(x) — q(x), l'(x) = 2q(a, x) + l(x), с'— q(a) + l(a) + c. (20) Доказательство. Имеем Q(o' + х) = Q(o + а + х) = q(a + х) + 1(а+ х) + с = — q(a) + 2q(a, х) + q(x) + 1(a) + l(x) + с = — Q(x) + (2g(a, я) + l(x)) + (q(a) + 1(a) + c). □ В частности, квадратичная функция q не зависит от выбора начала отсчета. В координатах выражение (19) принимает вид Q(x) = HanxixJ+Z bixi + с (aij = aji). (21) г, j i Коэффициентам bt и с можно придать следующий смысл: c = Q(o), Ь( = ^(о). (22) Линейная функция l(x) = ^bixi i называется дифференциалом функции Q в точке о и обозначается doQ. В случае К — К это согласуется с обычным определением дифференциала. Определение 2. Точка о называется центром аффинно-квад- ратичной функции Q, если Q(o + х) = Q(o — х) Ух eV (23)
§ 4. КВАДРИКИ 285 Ясно, что это имеет место тогда и только тогда, когда doQ =0. Поэтому множество всех центров функции Q задается системой линейных уравнений 9Q _ _ 9Q (24) Оно либо является плоскостью некоторого числа измерений, либо пусто. Легко видеть, что матрица коэффициентов системы (24) — это удвоенная матрица (а1;) квадратичной функции q. Следователь- но, если q невырожденна, то Q имеет единственный центр. Положим X(Q) = {peS-.Q(p) = 0}. Определение 3. Множество вида X(Q), где Q — аффин- но-квадратичная функция, если только оно не пусто и не является плоскостью, называется квадрикой или гиперповерхностью вто- рого порядка. Квадрика на плоскости называется коникой или кривой второго порядка. Квадрика в трехмерном пространстве называется также поверхностью второго порядка. Определение 4. Точка о называется центром квадрики, если эта квадрика симметрична относительно о, т.е. вместе со всякой точкой о + х (х е V) содержит точку о — х. Центр квадрики, лежащий на ней самой, называется ее вершиной. Квадрика называется центральной, если она имеет (хотя бы один) центр. Очевидно, что всякий центр аффинно-квадратичной функции Q является центром квадрики X(Q). Как будет показано ниже, верно и обратное. Докажем некоторые простые геометрические свойства квадрик. Предложение 1. Любая прямая либо целиком лежит на квадрике, либо пересекается с ней не более чем в двух точках. Доказательство. Так как начало отсчета о может быть выбрано в любой точке, то без ограничения общности можно считать, что прямая проходит через о. Пусть функция Q в векторизованной форме имеет вид (19). Тогда пересечение прямой L =o+{x) — {o+tx: t еК} (хе V) с квадрикой X(Q) определяется условием Q(tx) = t2q(x) + tl(x) + с =0, (25) представляющим собой квадратное уравнение относительно t. Если все коэффициенты этого уравнения равны нулю, то L с X(Q); в противном случае оно имеет не более двух корней, а это означает, что пересечение L П X(Q) содержит не более двух точек. □
286 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Предложение 2. Если о —вершина квадрики X, то вместе с любой точкой о квадрика X содержит всю прямую ор. Доказательство. Пусть р = о-\-х (хе V); тогда X содержит три различные точки о, о + х, о — х прямой ор и, следовательно, — всю прямую. □ Всякое подмножество аффинного пространства, содержащее точ- ку о и вместе с любой точкой р о всю прямую ор, называется конусом с вершиной в точке о. Квадрика называется конической, если она имеет (хотя бы одну) вершину. Предложение 3. Всякая квадрика содержит точку, не яв- ляющуюся ее вершиной. Доказательство. Если бы все точки квадрики были ее вершинами, то в силу предложения 2 вместе с любыми двумя точками она содержала бы проходящую через них прямую и, согласно теореме 1.3, была бы плоскостью, а это противоречит определению квадрики. □ Очевидно, что пропорциональные аффинно-квадратичные функ- ции определяют одну и ту же квадрику. Обратное утверждение не столь очевидно; оно составляет содержание следующей теоремы. Теорема 1. Пусть X —квадрика в аффинном пространстве над бесконечным полем К. Если X = X(Ql) — X(Q2) для каких- то аффинно-квадратичных функций Qlt Q2, то эти функции пропорциональны. Доказательство. Возьмем в качестве начала отсчета ка- кую-нибудь точку о квадрики X, не являющуюся ее вершиной. Тогда в векторизованной форме Qi(x) = q{(x) + /Дх), Q2(x) = q2(x) + Z2(x), где Точки пересечения прямой о + (х) с квадрикой X определяются любым из уравнений t2qi(x) + tlY(x) = 0, t2q2(x) + iZ2(x) = 0. Так как эти уравнения должны иметь одинаковые решения (отно- сительно t), то при Z1(x), 12(х)^0 мы получаем <h(x) _ я2(х) М*) Ь(х)’ откуда дДх)^(х) = д2(х)/Дх). (26) Умножая это равенство на 1Дх)^(х), мы получаем равенство q1(x)Z2(x)Z1(x)Z2(x) = g2(x)Z1(x)Z1(x)Z2(x),
§ 4. КВАДРИКИ 287 верное уже при всех х. Однако, поскольку в кольце многочленов нет делителей нуля, мы можем сократить последнее равенство и получить таким образом, что и исходное равенство (26) верно при всех х. Предположим, что линейные функции и 12 не пропорциональ- ны. Тогда в подходящем базисе ll(x) = x1, 12(х) — х2 и равенство (26) записывается в виде q1(x)x2 = q2(x)xl. Рассматривая члены в левой и правой частях этого равенства, мы видим, что должно быть 5](ж) — l(x)xlt q2(x) = l(x)X2, где 1{х) — какая-то линейная функция, и, значит, Qi(x) = (Z(x) + l)xi, Q2(x) = (l(x) + 1)^. Так как X =X(Ql), то X содержит гиперплоскость х{ =0. Так как в то же время X = X(Q2), то функция Q2 должна тождественно обращаться в нуль на этой гиперплоскости. Однако ни один из ее множителей Z(x)+1 и х2 не обращается на ней тождественно в нуль (первый из них не обращается в нуль уже в точке о). Поскольку в кольце многочленов нет делителей нуля, мы тем самым приходим к противоречию. Итак, l2 = A Z, (А е К*). Из (26) получаем тогда, что и q2 = Xq} и, значит, Q2 = AQ,. □ Следствие 1. Всякий центр квадрики X(Q) является также центром функции Q. Доказательство. Если о — центр квадрики X(Q), то X(Q) = X(Q), где Q(o + х) = Q(o - х). Следовательно, Q = XQ (А еК*). Сравнивая члены второй степени в выражениях Q и Q, мы видим, что должно быть А = 1, т. е. Q = Q, а это и означает, что о — центр функции Q. □ Следствие 2. Если квадрика X(Q) инвариантна относи- тельно некоторого параллельного переноса, то и функция Q инвариантна относительно этого переноса. Доказательство. Если квадрика X(Q) переходит в себя при параллельном переносе на вектор а, то X(Q) = X(Q), где Q(p) = Q(p + a). Далее рассуждаем так же, как в доказательстве следствия 1. □
288 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Замечание 1. Анализ приведенного выше доказательства теоремы 1 с учетом замечания 3.7.2 показывает, что она верна и для конечных полей, исключая только поле Z3. (Напомним, что мы считаем, что char К / 2.) Над полем Z3 можно привести следующий контрпример: уравнения xi+xix2 + 1= 0hx^ + xix2 + 1= 0 задают одну и ту же конику в Z3, состоящую из точек (1, 1) и (-1,-1). Однако оба следствия теоремы верны и для поля Z3. Пусть аффинно-квадратичная функция Q представлена в векто- ризованной форме выражением (19). Положим Ker Q = Кег g П Кег ( (27) (где Ker q = Кег q). Предложение 4. Функция Q инвариантна относительно параллельного переноса на вектор а тогда и только тогда, когда а е Кег Q. В частности, отсюда следует, что КегдП Кег/ не зависит от выбора начала отсчета. Доказательство. Инвариантность функции Q относитель- но параллельного переноса на вектор а равносильна тому, что она сохраняет свой вид при переносе начала отсчета из точки о в точку о' = о+а. Ввиду леммы 1 это происходит тогда и только тогда, когда ае Кег Q. □ Таким образом, если Z7 = KerQ^0, то квадрика X = X(Q) вместе с каждой точкой р содержит целую плоскость р + U. Такая квадрика называется цилиндрической с направляющим подпро- странством U. Выберем ба- зис пространства V таким образом, чтобы последние d его векторов составляли ба- зис подпространства U. Тогда выражение Q не будет содер- жать последних d координат. Уравнение Q = 0 можно бу- дет рассматривать как уравне- ние некоторой квадрики Хо в (п — й)-мерном пространстве; сама же квадрика X будет со- стоять из точек, первые n — d координат которых суть коор- динаты точки квадрики Хо, а остальные координаты произ- вольны (см. рис. 13). Ввиду этого описание всех квадрик сводится к описанию нецилиндриче- ских квадрик. Рис. 13
§ 4. КВАДРИКИ 289 Предложение 5. Нецилиндрическая квадрика имеет не более одного центра. Доказательство. Пусть оно' — два центра квадрики X. Обозначим через s и s’ центральные симметрии относительно о и о' соответственно. Тогда sX = s'X = Х и, следовательно, ss'X = Х. Так как d (ss') — ds ds' = (—£)2 = £, то ss’ — (нетривиальный) параллельный перенос и, значит, квадри- ка X цилиндрическая. □ Нецилиндрические квадрики можно разбить на три типа. I. Неконические центральные квадрики. Выбрав начало отсчета в центре квадрики и умножив ее уравнение на подходящее число, мы приведем его к виду ж„) = 1, (28) где q — невырожденная квадратичная функция. II. Конические квадрики. Выбрав начало отсчета в вершине квадрики, мы приведем ее уравнение к виду д(х],...,я:п) = 0, (29) где q — невырожденная квадратичная функция. При этом у нас еще остается возможность умножить уравнение на любое число А 0. III. Нецентральные квадрики. Так как Ker дПКег I =0, но Ker g т^О (иначе квадрика была бы центральной), то dim Ker q = 1 и V = Ker I ф Ker q. (30) Выбрав начало отсчета на квадрике и базис пространства V, согла- сованный с разложением (30), мы приведем уравнение квадрики к виду u(xi,..., жп_|) = а:„, (31) где и = g|Keri — невырожденная квадратичная функция от п — 1 переменных. При этом остается возможность умножить уравнение на любое число А 0, одновременно разделив на А последний базисный вектор. Возможности дальнейшего упрощения уравнения квадрики за счет выбора подходящего базиса в пространстве V зависят от поля К (см. § 5.3). При К = С или R мы можем привести квадратичную функцию q к нормальному виду.
290 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Таблица 1 п Тип k Название 2 I 2 эллипс 1 гипербола II 1 пара пересекающихся прямых III 1 парабола 3 I 3 эллипсоид 2 однополостный гиперболоид 1 двуполостный гиперболоид II 2 квадратичный конус III 2 эллиптический параболоид 1 гиперболический параболоид Рассмотрим более подробно случай К = R. В этом случае уравнение нецилиндрической квадрики может быть приведено к одному и только одному из следующих видов: I. Неконические центральные квадрики: х? + ... + х£ - х£+} - ... - 1 (0<fc^n). (32) II. Конические квадрики: Х? + .. . + х% - xl+y - ... - х% = 0 (j^k<n). (33) (Неравенство к достигается за счет возможного умножения уравнения на —1.) III. Нецентральные квадрики: x^ + ... + x^-x^+y-...-x^_l = xn (^-=J-^fc<n). (34) Полученный результат можно интерпретировать как классифи- кацию вещественных квадрик с точностью до аффинных преобра- зований. В самом деле, если квадрики Хх и Х2 задаются одним и
§ 4. КВАДРИКИ 291 Пара пересекающихся прямых Рис. 14 тем же уравнением в аффинных системах координат, связанных с реперами {о; е1;..., еп} и {o'; е[, ..е'п} соответственно, то Х{ переводится в Х2 аффинным преобразованием, переводящим репер {о; е1;..еп} в репер {o'; е{, ..е{}. Обратно, если квадрика X, переводится в квадрику Х2 аффинным преобразованием /, то Х} и Х2 задаются одним и тем же уравнением в аффинных системах координат, связанных с реперами {о; е15..еп} и {/(о); dffa),... ..df(en)} соответственно. В частности, при п = 2 и 3 получаются хорошо известные классы вещественных кривых и поверхностей второго порядка, перечисленные в табл. 1 и представленные на рис. 14 и 15 соответственно. В произвольной размерности квадрики типа I при к = п назы- ваются эллипсоидами, а при к < п — гиперболоидами; квадрики типа II называются квадратичными конусами; квадрики типа III при k = п — 1 называются эллиптическими параболоидами, а при k < п — 1 — гиперболическими параболоидами. Вещественная квадрика X является гладкой гиперповерхностью в окрестности точки р G X тогда и только тогда, когда dpQ О, т.е. когда р не является вершиной; при этом уравнение dvQ(x) = = 0 задает касательную гиперплоскость квадрики X в точке р. В частности, неконические квадрики гладки всюду.
292 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Рис. 15
§ 4. КВАДРИКИ 293 Замечательным свойством вещественных (и комплексных) квад- рик, которым, вообще говоря, не обладают гиперповерхности больших порядков, является высокая степень их аффинной сим- метрии. Пусть X — вещественная квадрика. Обозначим через G(X) группу всех аффинных преобразований, отображающих X на себя. Теорема 2. Если X — неконическая квадрика, то группа G(X) транзитивно действует на X; если X — коническая квадрика, то группа G(X) транзитивно действует на допол- нении к множеству вершин в X. Доказательство. Если X — цилиндрическая квадрика с направляющим подпространством U, то группа G(X) содержит группу параллельных переносов на векторы из U, которая тран- зитивно действует на любой плоскости вида р + U. Поэтому доказательство теоремы в этом случае сводится к ее доказатель- ству для нецилиндрической квадрики Хй в пространстве меньшей размерности (см. обозначение выше). Пусть X — эллипсоид, задаваемый в векторизованной форме уравнением q(x) — 1, где q — положительно определенная квадра- тичная функция. Превратим пространство V в евклидово, приняв за скалярное умножение поляризацию квадратичной функции q. Тогда X будет единичной сферой в этом пространстве, а группа G(X) будет, во всяком случае, содержать ортогональную группу О(У). (На самом деле она будет с ней совпадать, но нам это не нужно.) Пусть х, х'— любые векторы из X; тогда V = {х) ® (х)1- — (х1) ф (я')-1. Рассмотрим линейное преобразование р eGL(V), переводящее х в х’ и отображающее подпространство (х)-1- на (х')1 таким образом, чтобы это был изоморфизм евклидовых пространств. Очевидно, что р Е O(V), и по построению <р(х) = х'. Случай, когда X — гиперболоид, разбирается аналогично, с той разницей, что, взяв за скалярное умножение поляризацию квадратичной функции q, мы превратим V не в евклидово, а в псевдоевклидово пространство некоторой сигнатуры (k,l) (где k+l — п). Подпространства {х}1- и {х')1- в этом случае будут псевдо- евклидовыми пространствами сигнатуры (k — 1, I) и, следовательно, будут изоморфны. Пусть теперь X — квадратичный конус, задаваемый в векто- ризованной форме уравнением q(x) = 0, где q — квадратичная функция сигнатуры (к, I) (где к +1 = п). Превратим, как и выше,
294 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА пространство V в псевдоевклидово. Для любого ненулевого вектора х с X существует такой вектор у е V, что (х, у) ДО. Нормировав вектор у, можно считать, что (х, у) = 1. Далее, не нарушая этого равенства, можно заменить у на у-^(у, у)х и тем самым добиться, чтобы (у, у) = 0. Тогда в двумерном подпространстве (х, у) ска- лярное умножение будет иметь матрицу о) и’ значит’ будет невырожденным сигнатуры (1, 1). Отсюда следует, что У = (я, у) ® {х, у)х, где (х, у)1- — псевдоевклидово (или евклидово) пространство сиг- натуры (к — 1, I — 1). Проделав такие же построения для другого ненулевого вектора х' е X, мы получим аналогичное разложение V = (х', у') ф {х’, у'У~. Рассмотрим линейное преобразование <pcGL(V), переводящее х в х', у в у' и отображающее подпространство (х, у)1- на (х1, у')1 таким образом, чтобы это был изоморфизм псевдоевклидовых пространств. Тогда С О(V, q) С G(X), и по построению <р(х) = х'. Пусть, наконец, X — параболоид, задаваемый в векторизованной форме уравнением (31). Всякий вектор х € V будем представлять в виде х = у + te, где у е Ker I, t 6 К, а е — базисный вектор подпро- странства Ker q, так что х € X тогда и только тогда, когда u(y) = t. Для любого а е Ker I рассмотрим аффинное преобразование fa: у + te\-+у + a + (t +2й(а, у) + и(а))е. Если и(у) = t, то и(у + d)= t + 2й(а, у) + и(а), и обратно. Это означает, что Де G(X). Очевидно, что преобра- зования Д (абКег!) образуют группу, транзитивно действующую на X. □ ЗАДАЧА 1. Доказать, что если X —параболоид, задаваемый уравнением (31), то группа G(X) транзитивно действует в области u(x1,...,xn_1)<a:n. С каждым параболоидом X = X(Q) каноническим образом свя- зано одномерное подпространство Ker q с V, называемое особым направлением параболоида X. Так как Ker q/Ker Z при любом
§ 4. КВАДРИКИ 295 выборе начала отсчета, то при х е Ker q уравнение (25) имеет ровно одно решение. Следовательно, любая прямая особого направления пересекает па- раболоид ровно в одной точке; более того, это пересечение по той же причине транс- версально (см. рис. 16). ЗАДАЧА 2. Доказать, что для любого нео- собого направления параболоида X суще- ствует прямая этого направления, которая либо пересекает X более чем в одной точке, либо вообще не пересекает X. Посмотрим теперь, к какому виду можно привести уравнение квадрики в евклидовом простран- стве, если ограничиться прямоугольными системами координат. Как и в аффинной геометрии, задача сводится к случаю неци- линдрических квадрик. Рассмотрим, как и выше, три типа таких квадрик. I. Неконические центральные квадрики. Из теоремы о приведении квадратичной функции к главным осям (следствие 2 теоремы 6.3.1) следует, что уравнение такой квадрики в прямоугольной системе координат может быть приведено к виду Х{х2 + ... + Хпх2 = i (Аи ..., Ап ^0). (35) Числа А1; ..., Хп определены однозначно с точностью до переста- новки. II. Конические квадрики. Уравнение такой квадрики в прямоугольной системе координат может быть приведено к виду Aia:f + ... + A,X = O (А,,..., А„^0). (36) Числа А м ..., Хп определены однозначно с точностью до переста- новки и одновременного умножения на число А 0. III. Нецентральные квадрики (параболоиды). Выбрав начало отсчета произвольно и приведя квадратичную функцию q к главным осям, мы получим прямоугольную систему координат, в которой уравнение параболоида будет иметь вид -Mi2 + ... + An_ + ... 4- 6n_1xn_1 + bnxn + с = 0 (А„ ..., Ап_„ Ьп ^0). За счет переноса начала отсчета по координатам oij,..., хп_ j можно убрать линейные члены, содержащие эти координаты. (При этом,
296 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА вообще говоря, изменится свободный член.) После этого за счет переноса начала отсчета по координате хп можно убрать свободный член. Наконец, умножив уравнение на подходящее число, можно привести его к виду Xrf + ... + X^-^Х" (Aj,..., Ап_,/0). (37) Покажем, что начало отсчета, при котором уравнение парабо- лоида приводится к виду (37), определено однозначно. Для этого охарактеризуем его в инвариантных терминах. Пусть {о; ен . .., еп} — репер, в котором уравнение параболоида имеет вид (37). Тогда особое направление этого параболоида есть (еп), а его касательная гиперплоскость в точке о задается уравнением хп =0. Следовательно, если базис {еи ..., е„} ортонор- мированный, то касательная гиперплоскость параболоида в точке о ортогональна особому направлению. Такая точка называется вершиной параболоида (хотя это и не согласуется с определени- ем 4), а проходящая через нее прямая особого направления — осью параболоида. Подчеркнем, что эти определения имеют смысл лишь применительно к параболоидам в евклидовом пространстве. Предложение 6. Всякий параболоид в евклидовом простран- стве имеет единственную вершину. (См. рис. 16, где вершиной изображенной там параболы является точка о.) Доказательство. Пусть р — точка параболоида с коорди- натами хх,...,хп. Дифференцируя уравнение (37), находим, что координаты нормального вектора параболоида в точке р суть 2A j х}, .. ., 2А„ _ j хп_ ], — 1. Для того чтобы точка р была вершиной параболоида, необходимо и достаточно, чтобы этот вектор был пропорционален еп, а это имеет место тогда и только тогда, когда х} = ... = хп_, — 0, т. е. р = о. □ Следствие. Коэффициенты Аи..., А„_, в уравнении (37) определены однозначно с точностью до перестановки и одно- временного умножения на — 1. Доказательство. Как мы показали, начало отсчета, при ко- тором уравнение параболоида приводится к виду (37), определено однозначно. Вектор еп как единичный вектор особого направления определен однозначно с точностью до умножения на —1, приводя- щего к умножению на —1 левой части уравнения (37). Если вектор еп фиксирован, то мы уже не можем умножить уравнение на число
§ 5. ПРОЕКТИВНЫЕ ПРОСТРАНСТВА 297 А 1, не изменив его правой части; но тогда числа Аи ..An-1 определены однозначно с точностью до перестановки как собст- венные значения симметрического оператора, соответствующего квадратичной функции q. □ Аналогично тому, как это было сделано выше применительно к аффинной классификации квадрик, полученные результаты можно интерпретировать как классификацию квадрик в евклидовом про- странстве с точностью до движений. § 5. Проективные пространства На фотографическом снимке или (реалистическом) рисунке пло- ской местности изображения параллельных прямых, вообще гово- ря, пересекаются, а изображения равных отрезков одной прямой, вообще говоря, не равны (см. рис. 17). Это говорит о том, что отображение местности на плоскость снимка или рисунка не является аффинным. То же самое можно сказать и об изображении на сетчатке нашего глаза. Во всех этих случаях мы имеем дело с центральным проектированием. Еще одним житейским примером центрального проектирования может служить световое пятно на полу от лампы с круглым абажуром. Когда абажур направлен вертикально вниз, то граница этого пятна имеет форму окружности, как и край самого абажура. Но когда мы начинаем поворачивать абажур вокруг горизонтальной оси, эта окружность превращается в эллипс, который, вытягиваясь все больше и больше, в какой-то момент, когда его дальний край уходит в бесконечность, превращается в параболу. Когда мы продолжаем поворачивать абажур, парабола «раскрывается», превращаясь в ветвь гиперболы, и если бы мы приставили точно такой же абажур с противоположной стороны лампы, мы увидели бы другую ветвь этой гиперболы. Таким образом, край абажура проектируется на пол то в виде эллипса, то в виде параболы, то в виде гиперболы. Отметим еще одно обстоятельство. На рисунке плоской мест- ности изображения параллельных прямых пересекаются в точке, которая не имеет прообраза на местности (иначе прямые не были бы параллельны). С другой стороны, в тот момент, когда граница светового пятна от лампы с абажуром превращается в параболу, изображение самой высокой точки края абажура исчезает, уходя в бесконечность. Таким образом, мало того, что центральное проек- тирование не является аффинным отображением, оно вдобавок не сюръективно и не всюду определено.
298 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Для изучения центрального проектирования удобно рассмотреть множество, называемое проективной плоскостью, «точками» кото- рого являются прямые, проходящие через центр проектирования, а пересечения этих прямых с плоскостью проектирования считать изображениями соответствующих «точек». При этом «точки», со- ответствующие прямым, параллельным выбранной плоскости про- ектирования, не получают никакого изображения. (Но они будут иметь изображение при другом выборе плоскости проектирования). Они называются «бесконечно удаленными точками» по отношению к данной плоскости проектирования. Далее, множество «точек», соответствующих прямым, лежащим в какой-либо плоскости, проходящей через центр проектирования, естественно называть «прямой» проективной плоскости. На пло- скости проектирования такая «прямая», за вычетом ее «беско- нечно удаленной точки», изображается в виде обычной прямой. Рис. 17. Гравюра Летнего сада А. Зубова. (Воспроизводится по книге: Вергунов А. П., Горохов В. А. Русские сады и парки. — М., Наука, 1988.)
§ 5. ПРОЕКТИВНЫЕ ПРОСТРАНСТВА 299 Единственным исключением является «прямая», соответствующая плоскости, параллельной плоскости проектирования. Она целиком состоит из «бесконечно удаленных точек» и не получает никакого изображения. Эта «прямая» называется «бесконечно удаленной прямой» по отношению к данной плоскости проектирования. Описанную конструкцию можно интерпретировать как добав- ление к аффинной плоскости «бесконечно удаленных точек», со- ставляющих «бесконечно удаленную прямую». При этом к каждой прямой из пучка параллельных прямых аффинной плоскости добав- ляется одна и та же «бесконечно удаленная точка». В построенной таким образом «плоскости» любые две прямые пересекаются. Важно, однако, отметить, что все «точки» и «прямые» проек- тивной плоскости равноправны. Понятие бесконечной удаленности относительно: оно зависит от выбора плоскости проектирования. Обобщая эти идеи на произвольную размерность и произвольное поле, мы приходим к следующим определениям. Определение 1. Множество одномерных подпространств (п + + 1)-мерного векторного пространства V над полем К называется n-мерным проективным пространством над К и обозначается PV. Для всякого (к + 1)-мерного подпространства U С V подмно- жество PU С PV называется А:-мерной плоскостью пространства PV. В частности, нульмерные плоскости — это точки пространства FV; одномерные плоскости называются прямыми, (п — ^-мер- ные — гиперплоскостями. Очевидно, что пересечение плоскостей, если только оно не пусто, также является плоскостью. Пространство РКп + \ построенное указанным образом по про- странству строк Kn+1, обозначается также КРп. Для всякого ненулевого вектора х е V мы будем обозначать через х одномерное подпространство (х), рассматриваемое как точка пространства PV. Пусть S — какая-либо гиперплоскость пространства V, не проходящая через нуль, и Vs — ее направляющее подпространст- во. Определим отображение PV\PVs^S. ставящее в соответствие каждой точке х G PV \ PVS (х е V \ Vs) точку пересечения прямой (х) с S (см. рис. 18). Рис. 18
300 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Определение 2. Гиперплоскость S вместе с отображением <ps называется аффинной, картой пространства PV. Точки гиперпло- скости PVS пространства PV называются бесконечно удаленными по отношению к аффинной карте S. ЗАМЕЧАНИЕ 1. Термин «аффинная карта» вполне согласуется с обычным употреблением слова «карта». Точно так же, как географическая карта представляет собой отображение части зем- ной поверхности на лист бумаги, аффинная карта представляет собой отображение части проективного пространства на аффинное пространство. ЗАМЕЧАНИЕ 2. Отождествляя точки проективного пространст- ва с их изображениями на аффинной карте, мы иногда будем го- ворить об аффинной карте как о части проективного пространства. Имея это в виду, можно сказать, что проективное пространство получается из аффинного пространства добавлением бесконечно удаленных точек. Каждая А:-мерная плоскость пространства PV, не лежащая целиком в PVS, за вычетом ее бесконечно удаленных точек изоб- ражается А:-мерной плоскостью на аффинной карте S. Плоскости, целиком лежащие в PVS, называются бесконечно удаленными по отношению к S. Однородными координатами точки х е PV называются коор- динаты вектора х в каком-либо выбранном базисе пространства V. Однородные координаты точки определены лишь с точностью до одновременного умножения на число А 0. Этим они отличаются от координат в привычном смысле слова. Кроме того, они не могут быть равны нулю одновременно. Точка с однородными координатами xlt..хп обозначается : Xj:...: хп). Неоднородными координатами точки пространства PV назы- ваются аффинные координаты ее изображения на какой-либо аф- финной карте. В отличие от однородных координат, неоднородные координаты точки определены однозначно, но они могут быть вообще не определены, а именно, они не определены для точек, бесконечно удаленных по отношению к выбранной аффинной карте. Установим связь между однородными и неоднородными коорди- натами. Пусть {ед, еи ..., еп} — базис пространства V. Рассмотрим аффинную карту 5'o = eo + (ei,---, е„) (38) (см. рис. 19). Изображением точки х = (х0:х1'...хп) на So служит точка
§ 5. ПРОЕКТИВНЫЕ ПРОСТРАНСТВА 301 Рис. 19 аффинные координаты которой относительно репера ех,..еп} суть Таким образом, при указанном выборе аффинной карты и репера неоднородными коор- динатами точки (x0:xlt...:xn) служат отношения — —. Точки с х, — 0 являются бесконечно удаленными по отношению к So. Аналогично, неоднородными коор- динатами точки х на аффинной карте si = ei + (ео, ei, • • , -1, е. + 1, • • •, еп) (39) служат отношения -1±Л ... Точки с х. = 0 являются бесконечно удаленными по отношению к Д. Отметим, что карты So, S{,..., Sn составляют «атлас» в том смысле, что они покрывают все пространство PV. ЗАДАЧА 1. Доказать, что не существует атласа пространства PV из меньшего числа карт. ЗАДАЧА 2. Пусть ..., уп — неоднородные координаты изоб- ражения точки х е PV на карте So. Найти ее неоднородные координаты на карте S{. Теорема 1. Через любые к +1 точек проективного простран- ства проходит плоскость размерности < к, причем, если эти точки не содержатся в плоскости размерности < к, то через них проходит единственная плоскость размерности к. Доказательство. Перевод утверждения теоремы на язык векторных пространств есть следующее очевидное утверждение: любые к + 1 векторов содержатся в подпространстве размерности < к + 1, и если они не содержатся в подпространстве размерно- сти < к + 1, то они содержатся в единственном подпространстве размерности к + 1. □ Теорема 2. Пусть П, и П2 —плоскости n-мерного проектив- ного пространства. Если dim nt + dim П2 > п, то П] П П2 0, причем dim(n, nn2)>dimn!+dimn2-п. (40) Например, любые две прямые проективной плоскости пересека- ются. Доказательство. Если Щ — PUt, П2 = PU2, то dim Ц + dim U2 = dim П[ + dim П2 + 2>п + 2> dim V.
302 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Следовательно, ЦпС^т^Ои, значит, П1пП2 = Р((71П(72)у<0. Более точно, dim(/7j П U2) dim Ц 4- dim U2 — dim V, откуда следует (40). □ Всякий невырожденный линейный оператор AeGL(V) перево- дит одномерные подпространства в одномерные подпространства и тем самым определяет некоторое биективное преобразование А пространства PV. Определение 3. Преобразования вида А, где А С GL(V), называются проективными преобразованиями пространства PV. Очевидно, что проективное преобразование переводит любую плоскость пространства PV в плоскость той же размерности. Отображение А^А является гомоморфизмом группы GL(V) в группу преобразований пространства PV. Его образ есть группа всех проективных преобразований пространства PV, называемая также полной проективной группой пространства PV и обозна- чаемая через PGL(V). Лемма 1. Ядро гомоморфизма А>-> А есть группа скалярных операторов Х£ (A G К*). Доказательство. Если оператор А переводит каждое одномерное подпространство в себя, то все ненулевые векторы являются его собственными векторами. Но очевидно, что сум- ма собственных векторов с различными собственными значени- ями не может быть собственным вектором. Следовательно, все собственные значения оператора А Рис. 20 одинаковы, а это и означает, что он скалярен. □ Таким образом, PGL(V) ~GL(V)/{X£: А е К*}. Посмотрим, как представляется про- ективное преобразование А на аф- финной карте S. Оператор А осуще- ствляет аффинное отображение ги- перплоскости S на гиперплоскость AS. Изображение точки Ах = Ах (х е S) на карте S есть центральная проекция (с центром в нуле) точки Ах G AS на S (см. рис. 20). Таким образом, можно сказать, что, с точки зрения аффинной
§ 5. ПРОЕКТИВНЫЕ ПРОСТРАНСТВА 303 карты, проективное преобразование есть композиция аффинного отображения и центрального проектирования. В координатах это выглядит следующим образом. Пусть матрица оператора А в базисе {ед, е1;..., еп} имеет вид А = (а0)"у=0. Рассмотрим неоднородные координаты в пространстве PV, опре- деляемые репером {cq, е,, ..., еп} аффинной карты So (см. (38)). Пусть z = e0 + z1e1+... + znen, так что точка х е PV имеет неоднородные координаты ..., хп. Обозначим через эд,..., неоднородные координаты ее образа. Тогда а;о+ Е % У< =---------- (г = 1,..., п). (41) °00 + Е %jxj 3 = 1 Например, проективные преобразования прямой суть дробно- линейные преобразования (ad-Ъс^О). (42) (При с 0 точка — переходит в бесконечно удаленную точку, а бесконечно удаленная точка переходит в точку ^.) Если AS = S, то преобразование А представляется на карте S как аффинное преобразование. Следующая лемма показывает, что всякое аффинное преобразование пространства S получается таким образом. Лемма 2. Всякое аффинное преобразование гиперплоскости S с V, не проходящей через нуль, единственным, образом про- должается до линейного преобразования пространства V. Доказательство. Репер {eg, 6j,..., еп} гиперплоскости S есть в то же время базис пространства V (см. рис. 19). Продол- жением аффинного преобразования f гиперплоскости S является линейное преобразование пространства V, переводящее базис {ед, е,,..., еп} в базис {/(eg), d/(e,),..., df(en)}. □ Рассматривая аффинное пространство S как часть проективного пространства PV, можно сказать, что группа GA(5) есть подгруппа группы PGL(V). ЗАДАЧА 3. Доказать, что для всякого проективного преоб- разования комплексного проективного пространства существует аффинная карта, на которой оно представляется как аффинное преобразование.
304 Глг 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА Геометрия, определяемая группой проективных преобразований, называется проективной геометрией. Следующая теорема при сравнении с теоремой 3.1 показывает, насколько группа проектив- ных преобразований богаче группы аффинных преобразований. Назовем систему п + 2 точек n-мерного проективного простран- ства системой точек общего положения, если никакие п + 1 из них не лежат в одной гиперплоскости. Теорема 3. Пусть {р0, рх,рп+1} и {g0, qt,..., gn+1} — две системы точек общего положения n-мерного проективного про- странства PV. Тогда существует единственное проективное преобразование, переводящее р, в q, при i =0, 1,..., п + 1. Доказательство. Пусть p. = eit qt=/{, где е(, /, (г =0, 1,... ..., п +1) — ненулевые векторы пространства V. Условие теоремы означает, что {cq, еи ..., еп} (соответственно {/0, Л, • •/„})— базис пространства V и все координаты вектора еп+1 (соот- ветственно /п+1) в этом базисе отличны от нуля. Нормиро- вав векторы ед, вр..., еп (соответственно f0, ..., /„) некото- рым вполне определенным образом, можно добиться того, чтобы en + i = ео + ei + • • + еп (соответственно fn +, = /0 + /, + ... + Д). При этих условиях пусть А — линейный оператор, переводящий базис {^>, е1;..., еп} в {/0, Д, ..., fn}. Тогда Aen + l=fn+l и А есть единственное проективное преобразование, удовлетворяющее требованию теоремы. □ В частности, любые 3 различные точки проективной прямой про- ективным преобразованием можно перевести в любые 3 различные точки. Из-за этого в проективной геометрии не существует не толь- ко понятия расстояния между точками, но и понятия отношения тройки точек прямой, имеющегося в аффинной геометрии. Однако существует некий инвариант четверки точек прямой. А именно, пусть р1; Рг, р^ р4 — точки прямой PU с PV. Выберем в пространстве U какой-либо базис {е,, и для любых векторов и, v е U обозначим через det(u, и) определитель матрицы, состав- ленной из их координат в этом базисе. Пусть р,- = и( (г — 1,2, 3, 4). Легко видеть, что выражение (п ПЛ П. О 1 • det(Ul’U4) /4ОЧ \Р1> Рг’ Рь) detlug,^) det(u4, ' не зависит ни от нормировки векторов щ, ни от выбора базиса {еи ej} в U. Оно называется двойным отношением четверки точек Pli Pii Рз, Pi-
§ 5. ПРОЕКТИВНЫЕ ПРОСТРАНСТВА 305 Пусть L — аффинная карта прямой PU. Выберем базис {cj, Cj} так, чтобы £ = 62 + (ej, и пусть и{ — €2 + xie1. Тогда х( — неоднород- ная координата точки р{ на карте L (см. рис. 21) и Рис. 21 1 1 det(uo uy) — = xt - x3- Следовательно, / \ (Р1,Р2;й,Р4) = Ф^--^т7^ (44) Подчеркнем, что в силу наличия инвариантного определения (43) выражение (44) не зависит от выбора аффинной карты и координа- ты на ней. ЗАМЕЧАНИЕ 3. Двойное отношение считается определенным, если среди точек р1; р3, р4 нет трех одинаковых. При этом, если р2 = р3 или pj = р4, его значение считается равным оо. ЗАДАЧА 4. Выяснить что происходит с двойным отношением (Рп Рг>’Pi}, Р4) = <5 ПРИ перестановках точек р{, р%, р3, р4. Доказать, (62 - 6 + I)3 что выражение ' 2—^2 не меняется ни при каких перестанов- ках. ' " ЗАДАЧА 5. Изучив изображение четырех симметрично располо- женных вдоль центральной аллеи квадратных цветников на рис. 17, показать, что гравер существенно исказил перспективу. (Указание: сравнить двойное отношение трех равноотстоящих точек централь- ной аллеи, определяемых этими цветниками, и ее бесконечно удаленной точки с двойным отношением изображений этих точек на гравюре.) Так как двойное отношение определялось в терминах, инвари- антных относительно линейных преобразований пространства V, то оно сохраняется при любых проективных преобразованиях. Перейдем теперь к проективной теории квадрик. Как мы сейчас увидим, она проще аффинной. Это одно из проявлений совер- шенства проективной геометрии, завораживавшего еще математи- ков XIX в., которые считали, что все геометрии следует выводить из проективной. Подмножество векторного пространства V будем называть кону- сом, если оно инвариантно относительно умножений на числа, т. е. вместе со всяким вектором содержит все пропорциональные ему
306 Гл. 7. АФФИННЫЕ И ПРОЕКТИВНЫЕ ПРОСТРАНСТВА векторы. (Это то же самое, что конус с вершиной в нуле в смысле определения, данного в § 4.) В частности, квадрика X С V является конусом в этом смысле тогда и только тогда, когда X =X(Q), где Q —квадратичная функция в пространстве V. Такие квадрики будем называть квадратичными конусами (что слегка расходится с терминологией §4). Для любого конуса X с V назовем его проективизацией и обозначим через РХ подмножество пространства PV, образован- ное всеми одномерными подпространствами, содержащимися в X. Ясно, что изображен