Text
                    Э. Б. Винберг
Курс алгебры

Э.Б.Винберг КУРС АЛГЕБРЫ Москва Издательство МЦНМО 2011
УДК 512 ББК 22.14 В48 Винберг Э. Б. В48 Курс алгебры. — Новое издание, перераб. и доп. — М.: МЦНМО, 2011. — 592 с.: ил. ISBN 978-5-94057-685-3 Книга представляет собой расширенный вариант курса алгебры, читае- мого в течение трех семестров на математических факультетах. В нее вклю- чены такие дополнительные разделы, как элементы коммутативной алгеб- ры (в связи с аффинной алгебраической геометрией), теории Галуа, теории конечномерных ассоциативных алгебр и теории групп Ли. Это позволяет использовать книгу не только как учебник по общему курсу алгебры, но и как пособие для тех, кто желает углубить свои познания в алгебре. Изло- жение иллюстрируется большим количеством примеров и сопровождается задачами, часто содержащими дополнительный материал. Книга предназначена для математиков и физиков — студентов, аспи- рантов, преподавателей и научных работников. Предыдущее издание книги вышло в 2002 году в издательстве «Факто- риал Пресс». ББК 22.14 ISBN 978-5-94057-685-3 © Винберг Э. Б., 2011. © МЦНМО, 2011.
Оглавление Предисловие........................................... 6 Предисловие ко второму изданию........................ 7 Предисловие к третьему изданию........................ 8 Предисловие к четвертому изданию...................... 8 Глава 1. Алгебраические структуры 9 §1. Введение...................................... 9 § 2. Абелевы группы............................... 12 § 3. Кольца и поля................................ 17 § 4. Поле комплексных чисел....................... 22 § 5. Кольца вычетов............................... 28 § 6. Векторные пространства....................... 34 § 7. Алгебры...................................... 38 § 8. Алгебра матриц............................... 41 Глава 2. Начала линейной алгебры 48 § 1. Системы линейных уравнений................... 48 § 2. Базис и размерность векторного пространства . 58 §3. Ранг матрицы................................. 68 § 4. Определители................................. 74 § 5. Некоторые приложения определителей........... 88 Глава 3. Начала алгебры многочленов 92 § 1. Построение и основные свойства алгебры многочленов 92 § 2. Общие свойства корней многочленов ........... 99 § 3. Основная теорема алгебры комплексных чисел...106 § 4. Корни многочленов с вещественными коэффициентами 110 § 5. Теория делимости в евклидовых кольцах........117 § 6. Многочлены с рациональными коэффициентами .... 123 § 7. Многочлены от нескольких переменных..........127 § 8. Симметрические многочлены....................132 §9. Кубические уравнения.........................140 § 10. Поле рациональных дробей....................147 Глава 4. Начала теории групп 154 § 1. Определение и примеры........................154
4 Оглавление § 2. Группы в геометрии и физике...................162 § 3. Циклические группы ...........................166 § 4. Системы порождающих...........................173 §5. Разбиение на смежные классы...................175 § 6. Гомоморфизмы..................................183 Глава 5. Векторные пространства 192 § 1. Подпространства...............................192 § 2. Линейные отображения..........................197 §3. Сопряженное пространство......................205 § 4. Билинейные и квадратичные функции.............209 §5. Евклидово пространство........................221 § 6. Эрмитовы пространства.........................230 Глава 6. Линейные операторы 234 § 1. Матрица линейного оператора..................234 § 2. Собственные векторы..........................240 § 3. Линейные операторы и билинейные функции в евкли- довом пространстве................................246 § 4. Жорданова форма..............................258 § 5. Функции от линейного оператора...............265 Глава 7. Аффинные и проективные пространства 277 § 1. Аффинные пространства.........................277 §2. Аффинные отображения..........................283 § 3. Выпуклые множества............................290 § 4. Евклидовы аффинные пространства ..............302 §5. Квадрики......................................309 § 6. Проективные пространства......................323 Глава 8. Тензорная алгебра 338 § 1. Тензорное произведение векторных пространств .... 338 § 2. Тензорная алгебра векторного пространства.....346 §3. Симметрическая алгебра........................353 § 4. Алгебра Грассмана.............................360 Глава 9. Коммутативная алгебра 372 § 1. Конечно порожденные абелевы группы............372 § 2. Идеалы и факторкольца ........................386 § 3. Модули над кольцами главных идеалов...........395
Оглавление 5 § 4. Нётеровы кольца..............................403 § 5. Алгебраические расширения....................407 § 6. Конечно порожденные алгебры и аффинные алгебраи- ческие многообразия...............................420 § 7. Разложение на простые множители..............431 Глава 10. Группы 441 § 1. Прямые и полупрямые произведения.............441 § 2. Коммутант....................................448 §3. Действия.....................................451 § 4. Теоремы Силова ..............................458 § 5. Простые группы...............................461 § 6. Расширения Галуа.............................465 § 7. Основная теорема теории Галуа................471 Глава 11. Линейные представления и ассоциативные алгебры 478 § 1. Инвариантные подпространства.................478 § 2. Полная приводимость линейных представлений конеч- ных и компактных групп............................491 §3. Конечномерные ассоциативные алгебры..........496 § 4. Линейные представления конечных групп .......504 § 5. Инварианты...................................516 § 6. Алгебры с делением...........................523 Глава 12. Группы Ли 537 § 1. Определение и простейшие свойства групп Ли ..537 §2. Экспоненциальное отображение.................545 §3. Касательная алгебра Ли и присоединенное представ- ление ............................................549 § 4. Линейные представления групп Ли..............555 Ответы к задачам.....................................563 Словарь сокращений английских слов, употребляемых в обозна- чениях ..............................................568 Список литературы....................................570 Указатель обозначений................................572 Предметный указатель.................................575
Предисловие Поводом для написания настоящего учебника1 послужил двухго- дичный курс алгебры, прочитанный мною в Математическом колле- дже Независимого московского университета (НМУ) в 1992—1994 гг. Энтузиазм слушателей и относительно малое их число позволили мне читать курс на более высоком уровне, чем это принято на меха- нико-математическом факультете МГУ (мехмате), и затронуть ряд тем, не входящих в курс алгебры мехмата. Однако при написании учебника я использовал свой опыт преподавания на мехмате, и его окончательный вариант имеет лишь отдаленное сходство с курсом, прочитанным в НМУ. По содержанию гл. 1—4 примерно соответствуют курсу алгеб- ры первого семестра мехмата, а гл. 5—7 и отчасти гл. 92—курсу линейной алгебры и геометрии второго семестра. Оставшиеся гла- вы значительно перекрывают курс алгебры третьего семестра. Они адресованы в первую очередь тем студентам, которые хотят стать алгебраистами. Глава 7 посвящена геометрии евклидовых, аффинных и проек- тивных пространств. Однако ее ни в коей мере нельзя считать пол- ноценным учебным пособием по геометрии; скорее это алгебраиче- ский взгляд на геометрию. В первых четырех главах я постарался сделать изложение на- столько подробным, насколько это может быть разумно, если иметь в виду такого читателя, как студент первого семестра мехмата. (Впрочем, язык множеств и отображений используется с самого начала без каких-либо объяснений.) Однако затем я начинаю поз- волять себе опускать некоторые легко восполнимые детали, считая, что читатель постепенно набирается математической культуры. В книге почти нет технически сложных доказательств. В соот- ветствии со своим взглядом на математику я стремился заменять выкладки и сложные рассуждения идеями. Кому-то это может пока- заться трудным, но усилия, потраченные на усвоение идей, окупят- ся возможностью самостоятельно решать задачи, не рассматривае- мые в учебнике. Первое издание вышло в 1999 году. 2В настоящем издании — глава 8.
Предисловие 7 Приведенный в конце книги список литературы на русском язы- ке, которая, на мой взгляд, может быть полезной читателю, без- условно, далеко не полон и даже до некоторой степени случаен. Я искренне благодарен всем бывшим и нынешним сотрудникам кафедры высшей алгебры мехмата, в общении с которыми сложи- лись мои представления о преподавании алгебры. Я благодарю редактора учебника Г. М. Цукерман, в результате тщательной работы которой было обнаружено большое количество неточностей и опечаток, а также главного редактора издательства «Факториал» Ю.Н.Торхова, чей энтузиазм и самоотверженность немало способствовали улучшению качества учебника. Несколько полезных замечаний сделал А. Д. Свердлов, внимательно прочитав- ший первые две главы. Рисунок на переплете, выполненный на компьютере Ф. Э.Вин- бергом, иллюстрирует гомоморфизм SU2—>SO3 (см. гл. 13г). О нумерации. Теоремы нумеруются в пределах параграфа. При ссылке на теорему другого параграфа той же главы первая цифра означает номер параграфа, при ссылке на теорему другой главы пер- вая цифра означает номер главы, вторая — номер параграфа. Так, теорема 2 — это теорема 2 того же параграфа, теорема 3.2 — это теорема 2 § 3 той же главы, а теорема 6.3.2 — это теорема 2 § 3 гл. 6. То же относится к параграфам, предложениям, примерам, задачам и замечаниям. Формулы и рисунки нумеруются в пределах главы. Э. Б. Винберг Предисловие ко второму изданию Настоящее издание довольно существенно отличается от преды- дущего. Основные сделанные изменения имели целью упростить из- ложение в техническом и идейном плане. В частности, с этой целью полностью переписана глава «Тензорная алгебра». Дано изложение теории абелевых групп, независимое от общей теории модулей над кольцами главных идеалов и подготавливающее читателя к воспри- ятию этой общей теории, если он захочет это сделать. В то же время сделано несколько небольших добавлений. Так, дано доказательство неприводимости многочлена деления круга на !В настоящем издании — глава 12.
8 Предисловие любое число частей; описано приложение теории абелевых групп к исследованию симметрии кристаллов; добавлены некоторые све- дения о (тензорных) произведениях и симметрических степенях ли- нейных представлений групп с примером, иллюстрирующим приме- нение этих понятий к физике. Наконец, исправлен ряд опечаток и мелких неточностей, в об- наружении которых мне помогли И. В. Аржанцев, А. П. Мишина и А. Д. Свердлов. Э. Б. Винберг 31 мая 2000 г. Предисловие к третьему изданию В настоящем издании упрощены или более подробно изложены некоторые доказательства, указаны возможные обобщения некото- рых теорем, добавлены задачи, содержащие существенную допол- нительную информацию о линейных представлениях групп, увели- чено число примеров групп Ли, а также исправлены оставшиеся опечатки и неточности. Э. Б. Винберг 27 марта 2002 г. Предисловие к четвертому изданию В этом издании произведены некоторые дальнейшие упрощения. С целью облегчить жизнь начинающему читателю аксиоматические определения поля комплексных чисел и определителей даны лишь после их конструктивных определений. Понятие линейного отобра- жения и весь относящийся к нему материал перенесены из гл. 2 в гл. 5. Дано более простое доказательство существования жордано- ва базиса для нильпотентного линейного оператора. Кроме того, сделан ряд мелких изменений, в частности, добав- лено несколько интересных задач. Исправлены все замеченные опе- чатки и неточности. Я благодарю всех людей, указавших мне на них, в особенности профессора Скипа Гарибальди из университета Эмори (США). Э. Б. Винберг 25 мая 2010 г.
Глава 1 Алгебраические структуры Когда вы знакомитесь с новыми людьми, вы прежде всего за- поминаете их имена и внешность. После этого, встречаясь с ними в разных ситуациях, вы постепенно узнаете их лучше и некоторые из них, может быть, становятся вашими друзьями. В первой главе состоится лишь внешнее знакомство читателя с многими из алгебраических структур, рассматриваемых в этой книге. Более глубокое их понимание будет приходить в процессе дальнейшего чтения книги и решения задач. § 1. Введение Если вообще можно четко определить предмет алгебры, то это изучение алгебраических структур — множеств с определенными в них операциями. Под операцией в множестве М понимается лю- бое отображение МхМ->М, т. е. правило, по которому из любых двух элементов множества М получается некоторый элемент этого же множества. Элементами множества М могут быть как числа, так и объекты другого рода. Хорошо известными и важными примерами алгебраических структур являются следующие числовые множества с операциями сложения и умножения: N — множество натуральных чисел, Z — множество всех целых чисел, Z+ = Nu{0} — множество неотрицательных целых чисел, Q — множество рациональных чисел, R— множество всех вещественных (= действительных) чисел, R+ — множество неотрицательных вещественных чисел. Подчеркнем, что операции сложения и умножения определены далеко не на всяком числовом множестве. Например, в множестве отрицательных чисел не определена операция умножения, так как
10 Глава 1. Алгебраические структуры произведение двух отрицательных чисел является положительным числом. В множестве иррациональных чисел не определены ни сло- жение, ни умножение, так как сумма и произведение двух иррацио- нальных чисел могут быть рациональными. Приведем примеры алгебраических структур, состоящих не из чисел. Пример 1. Пусть M,N,P — какие-то множества и — какие-то отображения. Произведением, или композицией, отобра- жений f и g называется отображение определяемое формулой (/g)(a)=/(g(a)) VaeP, т. е. результат последовательного выполнения сначала отображе- ния g, а потом /. (Обычно, если это не может привести к недора- зумению, произведение отображений записывают без какого-либо специального знака, т. е. пишут просто fg: ср. обозначение In sin х в анализе.) В частности, при M = N = Р мы получаем таким образом операцию на множестве всех отображений множества М в себя. Эта операция дает много важных примеров алгебраических структур, называемых группами. Так, например, согласно аксиоматике ев- клидовой геометрии, произведение двух движений плоскости есть также движение. Рассматривая в множестве всех движений плоско- сти операцию умножения, мы получаем алгебраическую структуру, называемую группой движений плоскости. Пример 2. Множество векторов пространства с операциями сло- жения и векторного умножения является примером алгебраической структуры с двумя операциями. Кстати, отметим, что скалярное умножение векторов не является операцией в определенном выше смысле, так как его результат не есть элемент того же множества. Подобные более общие операции также рассматриваются в алгебре, но мы пока не будем об этом думать. Все приведенные выше примеры являются естественными в том смысле, что они были открыты в результате изучения реального ми- ра и внутреннего развития математики. В принципе можно рассмат- ривать любые операции в любых множествах. Например, можно
§ 1. Введение 11 рассматривать операцию в множестве ставящую в соответствие любым двум числам число совпадающих цифр в их десятичной запи- си. Однако лишь немногие алгебраические структуры представляют реальный интерес. Следует уточнить, что алгебраиста интересуют только те свой- ства алгебраических структур и составляющих их элементов, кото- рые могут быть выражены в терминах заданных операций. Этот подход находит свое выражение в понятии изоморфизма. Определение 1. Пусть М — множество с операцией о, a N — множество с операцией *. Алгебраические структуры (М, о) и (N, *) называются изоморфными, если существует такое биективное отоб- ражение /: M-+N, что /(aob)=/(a)*/(b) для любых а, bеМ. В этом случае пишут (М, о) (N, *). Само отоб- ражение f называется изоморфизмом структур (М, о) и (N, *). Аналогичным образом определяется изоморфизм алгебраиче- ских структур с двумя или бблыпим числом операций. Пример 3. Отображение а^2а является изоморфизмом множества всех вещественных чисел с опе- рацией сложения и множества положительных чисел с операцией умножения, поскольку 2а+ь = 2а2ь. Вместо основания 2 можно было бы взять любое положительное основание, отличное от 1. Это показывает, что между изоморфными алгебраическими структурами может существовать много различ- ных изоморфизмов. Пример 4. Пусть V — множество векторов плоскости, а Т — мно- жество параллельных переносов. Для любого вектора а обозначим через ta параллельный перенос на вектор а. (Если а = 0, то ta — это тождественное преобразование.) Легко видеть, что ° ^а+Ь» где о обозначает умножение (композицию) параллельных перено- сов, а + обозначает сложение векторов (определяемое по прави-
12 Глава 1. Алгебраические структуры лу параллелограмма). Следовательно, отображение а—> ta является изоморфизмом алгебраических структур (V, +) и (Т, о). Ясно, что если две алгебраические структуры изоморфны, то лю- бое утверждение, формулируемое только в терминах заданных опе- раций, будет справедливым в одной из этих структур тогда и только тогда, когда оно справедливо в другой. Например, операция о в множестве М называется коммутатив- ной, если aob = boa для любых а,ЬеМ. Если структура (М, о) изоморфна структуре (N, *) и операция о в множестве М коммутативна, то и операция * в множестве N коммутативна. Таким образом, в принципе все равно, какую из изоморфных друг другу алгебраических структур изучать: все они являются раз- личными моделями одного и того же объекта. Однако выбор мо- дели может оказаться небезразличным для фактического решения какой-либо задачи. Определенная модель может представить для этого наибольшее удобство. Например, если какая-то модель имеет геометрический характер, то она позволяет применить геометриче- ские методы. § 2. Абелевы группы Сложение вещественных чисел обладает следующими свойст- вами: СС1) а + b = b + а (коммутативность); (С2) (а + Ь) + с = а + (Ь + с) (ассоциативность); (СЗ) а + О = а; (С4) а + (—а) = 0. Из этих свойств чисто логическим путем могут быть получены и другие свойства, например, наличие операции вычитания, обрат- ной к сложению. Это означает, что для любых а, b уравнение х + а = Ь имеет единственное решение. Докажем, что это так. Если с — реше- ние данного уравнения, т. е. с + а = Ь, то (с + а) + (—а) = Ь+ (-а).
§ 2. Абелевы группы 13 Пользуясь свойствами (С2)—(С4), получаем (с + а) + (-а) = с + (а + (-а)) = с + О = с. Таким образом, с = Ь + (-а). Это показывает, что если решение существует, то оно единственно и равно b -I- (-а). С другой стороны, подстановка х = Ь + (-а) в рас- сматриваемое уравнение показывает, что b + (-а) действительно является решением: (Ь + (-а)) + а = Ь + ((-а) + а) = Ь + (а + (-а)) = Ь + О = Ь. Умножение вещественных чисел обладает аналогичными свойст- вами: (У1) ab = ba (коммутативность); (У2) (ab)c = a(bc) (ассоциативность); (УЗ) а1 = а; (У4) аа-1 = 1 при а/0. Свойства (У1)—(У4) лишь формой записи отличаются от свойств (С1)—(С4), с единственной оговоркой, что в (У4) мы предполагаем, что а / 0, в то время как в (С4) никаких ограничений на а нет. Поэтому приведенный выше вывод из свойств (С1)—(С4) наличия операции вычитания, будучи переведен на язык умножения, даст вывод из свойств (У1)—(У4) наличия операции деления, обратной к умножению. Более точно, таким путем доказывается, что для лю- бого а / 0 и любого b уравнение ха = b имеет единственное реше- ние, равное Ьа-1. Все эти рассуждения приведены здесь не для того, чтобы чита- тель узнал что-либо новое о вещественных числах, а чтобы подвести его к важной для алгебры идее. Эта идея есть аксиоматический ме- тод в алгебре. Он состоит в одновременном изучении целых классов алгебраических структур, выделяемых теми или иными аксиомами, представляющими собой какие-то свойства операций в этих струк- турах. При этом совершенно не важно, как в каждом конкретном случае эти операции определяются. Коль скоро выполнены аксио- мы, справедлива и любая теорема, полученная логическим путем из этих аксиом. Конечно, лишь немногие системы аксиом действительно инте- ресны. Невозможно придумать «из головы» такую систему аксиом,
14 Глава 1. Алгебраические структуры которая привела бы к содержательной теории. Все системы акси- ом, рассматриваемые в современной алгебре, имеют длительную историю и являются результатом анализа алгебраических структур, возникших естественным путем. Таковы системы аксиом группы, кольца, поля, векторного пространства и другие, с которыми чита- тель познакомится в этом курсе. Свойства (С1)—(С4), а также (У1)—(У4) являются по сути дела системой аксиом абелевой группы. Перед тем как привести точные формулировки этих аксиом, скажем несколько слов о терминоло- гии. Названия и обозначения операций в алгебраических структу- рах не имеют принципиального значения, однако чаще всего они называются сложением или умножением и обозначаются соответ- ствующим образом. Это позволяет использовать разработанную тер- минологию и систему обозначений, относящиеся к операциям над вещественными числами, а также вызывает полезные ассоциации. Приведем вначале определение абелевой группы, использующее язык сложения. Определение 1. (Аддитивной) абелевой группой называют мно- жество А с операцией сложения, обладающей следующими свойст- вами: 1) а + b = b + а для любых a, b G А (коммутативность); 2) (а + Ь) + с = а + (Ь + с) для любых a, b, с G А (ассоциатив- ность); 3) в А существует такой элемент 0 (нуль), что а + 0 = а для любо- го a G А; 4) для любого элемента ае А существует такой элемент — a G А (противоположный элемент), что а + (-а) = 0. Выведем некоторые простейшие следствия из этих аксиом. 1) Нуль единствен. В самом деле, пусть и 02 —два нуля. Тогда 0} — 01 4- 02 = 02. 2) Противоположный элемент единствен. В самом деле, пусть (—a)i и (-а)2—два элемента, противоположных а. Тогда (-а) 1 = (—а)1 + (а + (~а)2) = ((-а) г + а) + (-а)2 = (-а)2. 3) Для любых а, b уравнение х + а = b имеет единственное реше- ние, равное Ь + (—а). Доказательство см. выше. Это решение назы- вается разностью элементов b и а и обозначается Ь —а.
§ 2. Абелевы группы 15 Из свойства ассоциативности нетрудно вывести (попробуйте сде- лать это), что сумма произвольного числа (а не только трех) эле- ментов не зависит от расстановки скобок. Пользуясь этим, скобки обычно вообще опускают. Пример 1. Числовые множества Z, Q, R являются абелевыми группами относительно обычной операции сложения. Пример 2. Множество векторов (плоскости или пространства) является абелевой группой относительно обычного сложения векто- ров. Пример 3. Последовательность из п чисел назовем строкой дли- ны п. Множество всех строк длины и, составленных из веществен- ных чисел, обозначим через Rn. Определим сложение строк по пра- вилу (а!,а2, ...,an) + (bi,b2, •••> Ьп) = (ai + ЬЬ а2 + Ь2, ...,ап + Ьп). Очевидно, что множество является абелевой группой относитель- но этой операции. Ее нулем служит нулевая строка 0 = (0, 0,..., 0). Пример 4. Множество всех функций, определенных на задан- ном подмножестве числовой прямой, является абелевой группой относительно обычного сложения функций. Приведем теперь определение абелевой группы, использующее язык умножения. Определение Iх. (Мультипликативной) абелевой группой назы- вают множество А с операцией умножения, обладающей следующи- ми свойствами: 1) ab = Ьа для любых а, b G А (коммутативность); 2) (ab)c = a(bc) для любых а, Ь, се А (ассоциативность); 3) в А существует такой элемент е (единица), что ае = а для лю- бого ае А; 4) для любого элемента a G А существует такой элемент а'1 е А (обратный элемент), что аа-1 =е. Единица мультипликативной абелевой группы иногда обознача- ется символом 1. Простейшие следствия аксиом абелевой группы, полученные вы- ше на аддитивном языке, на мультипликативном языке выглядят следующим образом. 1) Единица единственна.
16 Глава 1. Алгебраические структуры 2) Обратный элемент единствен. 3) Для любых а, b уравнение ха = b имеет единственное реше- ние, равное Ьа"1. Оно называется частным от деления b на а (или отношением элементов b и а) и обозначается - (или Ь/а). Пример 5. Числовые множества Q* = Q\ {0} и R* = R\ {0} явля- ются абелевыми группами относительно обычной операции умно- жения. В дальнейшем мы познакомимся с общим понятием группы (не обязательно абелевой), которое не включает требования коммута- тивности операции. Читатель, наверное, заметил, что некоторые из рассмотренных выше абелевых групп содержатся в других, причем операция в «ма- ленькой» группе определяется так же, как в «большой». Это приво- дит нас к понятию подгруппы. Вообще, пусть М — множество с операцией о и N — какое-либо его подмножество. Говорят, что N замкнуто относительно опера- ции о, если a,bGN => aobeN. В этом случае операция о определена в множестве N и превращает его в некоторую алгебраическую структуру. Если операция о в М обладает каким-то свойством, имеющим характер тождественного соотношения (например, свойством коммутативности или ассоциа- тивности), то она, очевидно, обладает этим свойством и в N. Одна- ко другие свойства операции о могут не наследоваться подмноже- ством N. Так, подмножество аддитивной абелевой группы, замкнутое относительно сложения, не обязано быть абелевой группой, так как оно может не содержать нуля или элемента, противополож- ного какому-либо его элементу. Например, подмножество за- мкнуто относительно сложения в абелевой группе Z, но не явля- ется абелевой группой (и вообще группой), так как не содержит противоположного элемента ни к одному своему элементу, кроме нуля. Определение 2. Подмножество В аддитивной абелевой груп- пы А называется подгруппой, если 1) В замкнуто относительно сложения; 2) аеВ => -аеВ; 3) 0GB.
§ 3. Кольца и поля 17 Замечание 1. Легко видеть, что если В непусто, то из первых двух условий вытекает третье. Поэтому третье условие может быть заменено условием непустоты. Очевидно, что всякая подгруппа аддитивной абелевой группы сама является абелевой группой относительно той же операции. Пример 6. В аддитивной группе R имеется следующая цепочка подгрупп: ZcQcR. Пример 7. В аддитивной группе векторов пространства множе- ство векторов, параллельных заданной плоскости или прямой, явля- ется подгруппой. В любой аддитивной абелевой группе имеются две «тривиаль- ные» подгруппы: вся группа и подгруппа, состоящая только из нуля. Задача 1. Доказать, что всякая подгруппа группы Z имеет вид nZ, где neZ+ (решение этой задачи можно найти в §4.3). Приведем мультипликативный вариант предыдущего опреде- ления. Определение 2. Подмножество В мультипликативной абелевой группы А называется подгруппой, если 1) В замкнуто относительно умножения; 2) аеВ => а"1 GB; 3) ееВ. Пример 8. В группе R* имеется следующая цепочка подгрупп: {±1}cQ*cR*. § 3. Кольца и поля В отличие от групп кольца и поля — это алгебраические структу- ры с двумя операциями, называемыми обычно сложением и умно- жением. Их аксиомы, как и аксиомы абелевой группы, подсказаны свойствами операций над вещественными числами. При этом ак- сиомы кольца — это разумный минимум требований относительно свойств операций, позволяющий охватить и другие важные приме- ры алгебраических структур, из которых мы пока можем привести только уже упоминавшееся множество векторов пространства с опе- рациями сложения и векторного умножения.
18 Глава 1. Алгебраические структуры Определение 1. Кольцом называется множество К с операци- ями сложения и умножения, обладающими следующими свойст- вами: 1) относительно сложения К есть абелева группа (называемая аддитивной группой кольца К)', 2) а(Ь + с) = ab + ас и (а + Ь)с = ас + Ьс для любых а, Ь, с е К (дистрибутивностьумножения относительно сложения). Выведем некоторые следствия аксиом кольца, не входящие в чис- ло следствий аксиом аддитивной абелевой группы, перечисленных в §2. 1) аО = Оа = О для любого a G К. В самом деле, пусть аО = Ь. Тогда b + b = аО + аО = а (0 + 0) = аО = Ь, откуда b = b-b = O. Аналогично доказывается, что Оа = 0. 2) a(-b) = (-a)b = -ab для любых a, be К. В самом деле, ab + a(—b) = a(b + (-b)) = а0 = 0 и, аналогично, ab + (-a)b = O. 3) a(b - с) — ab - ас и (а - Ь)с = ас -Ьс для любых a, b, с G К. В самом деле, а(Ь - с) + ас = а(Ь - с + с) = ab и, аналогично, (а — b)c + Ьс = ас. Кольцо К называется коммутативным, если умножение в нем коммутативно, т. е. ab = ba Уа,Ь, и ассоциативным, если умножение в нем ассоциативно, т. е. (ab)c = a(bc) Va, b, с. Элемент 1 кольца называется единицей, если al = la = a Va.
§ 3. Кольца и поля 19 Так же, как в случае мультипликативной абелевой группы, доказыва- ется, что в кольце не может быть двух различных единиц (но может не быть ни одной). Замечание 1. Если 1 = 0, то для любого а имеем а = а1 = а0 = 0, т. е. кольцо состоит из одного нуля. Таким образом, если кольцо содержит более одного элемента, то 1 / 0. Замечание 2. При наличии коммутативности из двух тождеств дистрибутивности, входящих в определение кольца, можно оста- вить лишь одно. Аналогичное замечание относится к определению единицы. Пример 1. Числовые множества Z, Q, R являются коммутатив- ными ассоциативными кольцами с единицей относительно обыч- ных операций сложения и умножения. Пример 2. Множество 2Z четных чисел является коммутатив- ным ассоциативным кольцом без единицы. Пример 3. Множество всех функций, определенных на задан- ном подмножестве числовой прямой, является коммутативным ас- социативным кольцом с единицей относительно обычных операций сложения и умножения функций. Пример 4. Множество векторов пространства с операциями сло- жения и векторного умножения является некоммутативным и неас- социативным кольцом. Однако в нем выполняются следующие тож- дества, которые в некотором смысле заменяют коммутативность и ассоциативность: a xb + b х а = 0 (антикоммутативность), (a xb) хс + (Ьхс) хаЧ-(сха) xb = 0 (тождество Якоби). Антикоммутативность очевидна в силу определения векторного ум- ножения. По поводу проверки тождества Якоби см. пример 7.5. Задача 1. Пусть X — какое-либо множество и 2х — множество всех его подмножеств. Доказать, что 2х — кольцо относительно опе- раций симметрической разности MAN = (M\N)U(N\M) и пересечения, взятых в качестве сложения и умножения соответ- ственно. Доказать, что это кольцо коммутативно, ассоциативно и об- ладает единицей.
20 Глава 1. Алгебраические структуры Элемент а 1 кольца с единицей называется обратным к элемен- ту а, если аа-1 =а“1а = 1. (В коммутативном кольце достаточно требовать, чтобы аа"1 = 1.) Так же, как в случае мультипликативной абелевой группы, доказы- вается, что в ассоциативном кольце с единицей никакой элемент не может иметь двух различных обратных элементов (но может не иметь ни одного). Элемент, имеющий обратный, называется обра- тимым. Определение 2. Полем называется коммутативное ассоциатив- ное кольцо с единицей, в котором всякий ненулевой элемент обра- тим. Замечание 3. Кольцо, состоящее из одного нуля, не считается полем. Примерами полей служат поле рациональных чисел Q и поле ве- щественных чисел R. Кольцо Z не является полем: в нем обратимы только ±1. Задача 2. Доказать, что существует поле, состоящее из двух эле- ментов. (Очевидно, что один из этих элементов должен быть нулем поля, а другой — его единицей.) Любое поле обладает следующим важным свойством: ab = 0 => а = 0илиЬ = 0. В самом деле, если а # 0, то, умножая обе части равенства ab = 0 на а-1, получаем Ь = 0. Существуют и другие кольца, обладающие этим свойством, на- пример, кольцо Z. Они называются кольцами без делителей нуля. В кольце без делителей нуля возможно сокращение: {ас = Ьс (или ca = cb) и с/0} => а = Ь. В самом деле, равенство ас = Ьс может быть переписано в виде (а-Ь)с = О, откуда при с/0 получаем а-Ь = О, т. е. а = Ь. Приведем пример коммутативного ассоциативного кольца с де- лителями нуля. Пример 5. В кольце функций на подмножестве X числовой пря- мой (см. пример 3) есть делители нуля, если только X содержит более одной точки. В самом деле, разобьем X на два непустых под-
§ 3. Кольца и поля 21 множества Х} и Х2 н положим при i = 1, 2 пРихех<> Jl (0 прих^Х,. Тогда /1, f2 / 0, но Л /2 = 0. Отсутствие делителей нуля в поле означает, что произведение любых двух ненулевых элементов также является ненулевым эле- ментом. Ненулевые элементы поля К образуют абелеву группу отно- сительно умножения. Она называется мультипликативной группой поля К и обозначается через К*. Аналогично понятию подгруппы абелевой группы вводится по- нятие подкольца. Определение 3. Подмножество L кольца К называется подколь- цом, если 1) L является подгруппой аддитивной группы кольца К; 2) L замкнуто относительно умножения. Очевидно, что всякое подкольцо само является кольцом относи- тельно тех же операций. При этом оно наследует такие свойства, как коммутативность и ассоциативность. Пример 6. Цепочка подгрупп аддитивной группы R, приведен- ная в примере 1, является в то же время цепочкой подколец. Пример 7. При любом п G множество nZ является подколь- цом кольца Z. (Ср. задачу 2.1.) Задача 3. Доказать, что все конечные подмножества множе- ства X образуют подкольцо кольца 2х из задачи 1. Определение 4. Подмножество L поля К называется подполем, если 1) L является подкольцом кольца К; 2) aGL,a^0 => a-1GL; 3) 1GL. Очевидно, что всякое подполе является полем относительно тех же операций. Пример 8. Поле Q является подполем поля R. Задача 4. Доказать, что подмножество L поля К является подпо- лем тогда и только тогда, когда 1)1 замкнуто относительно вычитания и деления; 2) 1э0,1. Задача 5. Доказать, что поле Q не имеет нетривиальных (т. е. отличных от него самого) подполей.
22 Глава 1. Алгебраические структуры § 4. Поле комплексных чисел Подобно тому как невозможность деления в кольце целых чисел приводит к необходимости расширить его до поля рациональных чи- сел, невозможность извлечения квадратных корней из отрицатель- ных чисел в поле вещественных чисел приводит к необходимости расширить его до большего поля, называемого полем комплексных чисел. Для того чтобы прийти к определению комплексных чисел есте- ственным путем, проведем вначале некоторый анализ. А именно, предположим, что уже имеется некоторое поле С, содержащее по- ле R вещественных чисел и некий элемент z, квадрат которого ра- вен —1, и посмотрим, как оно должно быть устроено. Наряду с элементом z поле С должно содержать элементы а + bz, где а и b — любые вещественные числа. Докажем, что все эти эле- менты различны. Пусть a1+b1i = a2 + b2i) Ьь а2, b2ER. Тогда -a2 = (b2-b1)i. Возводя это равенство в квадрат, получаем (Qi -a2)2 = -(b2-b1)2, откуда а1 “ а2 = ^2 — ^1 = т. е. =а2, Ьг = Ь2, что и требовалось доказать. Далее, из свойств операций в поле и соотношения z2 = -1 следу- ет, что (aJ + bji) + (а2 4- b2z) = (сц 4- а2) 4- (Ьг 4- b2)z, (1) fai 4- bji)(а2 4-b2i) = (а^ - bxb2) 4- (а;Ь2 4-b^aji. (2) Это показывает, что подмножество К = {а 4- bi: a, b е R} с С замкну- то относительно сложения и умножения. Из формулы (1) следует, что - (а 4- Ы) = (-а) 4- (- b) i е К, (3) а из формулы (2) — что (а 4- bi) (а - Ы) = а2 4- b2 G R
§ 4. Поле комплексных чисел 23 и, значит, + + приа2 + Ь2/0. (4) Следовательно, К — подполе поля С. Так как поле К уже содержит поле вещественных чисел и квадратный корень из -1 (а значит, и квадратный корень из любого отрицательного числа), то нам нет необходимости рассматривать какое-то большее поле, т. е. можно считать, что С = К. Предыдущее исследование подсказывает, как можно построить поле комплексных чисел. Рассмотрим множество С пар (а, Ь), где а, beR. Определим в нем сложение и умножение по формулам fai, bi) + (а2, Ь2) = (а 1 + а2, bi + b2>> (а1э bj)(d2, Ь2) = (а1а2 — ^1^2> а1^2 4" М2)> подсказанным формулами (1) и (2). Очевидно, что С является абеле- вой группой относительно сложения (ср. пример 2.3) и что умноже- ние дистрибутивно относительно сложения и коммутативно. Непо- средственной выкладкой проверяется ассоциативность умножения: (fai, bj(a2, b2))(a3, Ь3) = (0^2 - ЬТЬ2, агЬ2 + Ь1а2)(а3, Ь3) = = (а1а2а3—aib2b3—Ь^з^з-Ь1Ь2Пз, b1a2a34-aib2a3+a1a2b3 — Ьг b2b3) = = (cii, Ь])(а2а3 — b2b3, a2b3 + b2a3) = (а1? b1)((a2, Ь2)(а3, b3)). (О том, как можно избежать этих вычислений, см. пример 7.4.) Та- ким образом, С — коммутативное ассоциативное кольцо. Так как (а, Ь)(1,0) = (а, Ь), то элемент (1,0) —единица кольца С. Формула (4) подсказывает, как должен выглядеть элемент, обратный к (а, Ь) при а2 + Ь2 0. И действительно, непосредственная проверка показывает, что ^а’ b) ( а2 + ь2 ’ ~ a2 + b2 ) = С1’ °) • Следовательно, С — поле. Далее, (<21,0) 4- (а2, 0) = (Qi + а2,0), (а1,0)(а2,0) = (а1а2,0),
24 Глава 1. Алгебраические структуры т. е. операции над парами вида (а, 0) сводятся к соответствующим операциям над их первыми компонентами. Условимся отождеств- лять пару (а, 0) с вещественным числом а. Тогда мы можем сказать, что построенное поле С содержит поле R в качестве подполя. Положим i = (0,1); тогда i2 = (-1, 0) = —1, а + Ы = (а, Ь) при a, b е К. Таким образом, каждый элемент поля С однозначно представляется в виде а + bi, где a, b е R. Построенное поле С и называется полем комплексных чисел. Представление комплексного числа с е С в виде а 4- bi (a, b е R) называется его алгебраической формой; при этом число а называ- ется вещественной частью числа с и обозначается Re с, а число b называется мнимой частью числа с и обозначается Im с. Комплекс- ные числа, не являющиеся вещественными, называются мнимыми; числа вида bi, где beR, называются чисто мнимыми. Так как при выводе формул (1) и (2) мы использовали только то свойство элемента i, что i2 = —1, а элемент i' = —i также обладает этим свойством, то эти формулы остаются верными при замене i на i'. Это означает, что отображение с = а + Ы>-*с = а- Ы (а,Ье№), является изоморфизмом поля С на себя. Оно называется комплекс- ным сопряжением. Вообще, изоморфизм какой-либо алгебраиче- ской структуры на себя называется ее автоморфизмом. Таким образом, комплексное сопряжение с —> с есть автоморфизм поля комплексных чисел. Очевидно, что с = с. Вещественные числа характеризуются тем, что они совпадают со своими сопряженными. Отсюда следует, что для любого с е С числа с + с и сс вещественны. Более точно, если с = а + bi (a, bGR), то с + с = 2а, сс = а2 + Ь2. (5) Комплексные числа можно изображать точками или векторами на плоскости. А именно, число с = а + bi изображается точкой или вектором с декартовыми координатами (а, Ь) (рис. 1). Ино- гда удобнее представление комплексных чисел точками, иногда —
§ 4. Поле комплексных чисел 25 векторами. При векторном представлении сложению комплекс- ных чисел соответствует обычное сложение векторов по прави- лу параллелограмма (или эквивалентному ему правилу треуголь- ника). Отметим, что разность комплексных чисел с2 и с2 представляется вектором, соединяющим точки, изображающие и с2 (рис. 2). Вместо декартовых координат на плоскости иногда бывает удоб- но использовать полярные. Это приводит к следующим понятиям. Модулем комплексного числа с = а 4- Ы называется длина векто- ра, изображающего это число. Модуль числа с обозначается через |с|. Очевидно, что |с| = х/а2 + Ь2. Аргументом комплексного числа называется угол, образуемый соответствующим вектором с положительным направлением оси абсцисс. Аргумент определен с точностью до прибавления целого кратного 2л. Аргумент числа 0 не определен. Аргумент числа с обо- значается через arg с. Пусть г и —модуль и аргумент числа с (рис. 3). Очевидно, что a = rcosi/>, b = rsin(/>, откуда c = r(cos ip + i sin </?). Такое представление комплексного числа называется его тригоно- метрической формой. Так как тригонометрическая форма данного комплексного числа определена однозначно с точностью до прибав-
26 Глава 1. Алгебраические структуры ления к целого кратного 2л, то при гь г2 > О И (cos </?1 + isin<p1) = r2(cos ip2 + i sin <p2) *=* <=> {г! = г2, (/?1 = (/?2 + 2лк, keZ}. Тригонометрическая форма комплексных чисел хорошо приспо- соблена к таким операциям, как умножение, деление, возведение в степень и извлечение корня. А именно, из формул для косинуса и синуса суммы двух углов следует, что (cos 4- i sin • r2(cos </>2 4- i sin </>2) = = i\r2(cos(spi + </?2) 4- i sint^i 4- </>2)), т. e. при умножении комплексных чисел их модули перемножаются, а аргументы складываются. Отсюда вытекают следующие формулы для деления и возведения в степень: ^(cos 4-i sin rlr f . , . . , чч rfcos'cp '-i-isin^ •) = 7(cos(v’1" ^2) +1 Sin((/>1 - ¥>2)), 12 \\Uo y/2 ' I bill *2 [r(cos 4- i sin i/?)]n = rn(cos 4- i sin П(/?) (формула Муавра). Извлечение корня n-й степени из комплексного числа c=r (cos <р 4- 4-i sin (/?) есть решение уравнения zn = с. Пусть |z| = s, arg г = ф; тогда sn = г, пф = 4- 2лк (к G Z). Следовательно, $ = у/г (арифметическое значение корня), ф = Окончательно получаем п/-Г ^4-2лк . . у>4-2лк\ г = yr (^cos — --1-1 sin — J. Одинаковые значения z получаются по этой формуле тогда и только тогда, когда в ка- честве к берутся числа, сравнимые по моду- лю и. Отсюда следует, что при с # 0 уравнение zn = с имеет ровно п решений, получаемых, например, при к = 0,1,..., и — 1. В геометри- ческом изображении эти числа располагают- ся в вершинах правильного п-угольника с цен- тром в начале координат (см. рис. 4, где изоб- ражен случай и = 8).
§ 4. Поле комплексных чисел 27 Вместо того чтобы называть комплексным числом пару вещественных чисел, как мы делали выше, можно было бы назвать комплексным числом точку (или вектор) плоскости и соответствующим образом определить опе- рации сложения и умножения. Существуют и другие способы построения поля комплексных чисел: см., в частности, примеры 7.4 и 9.2.14. Как «при- мирить» все эти, казалось бы, различные определения? Для того чтобы лучше понять, что такое поле комплексных чисел, нужно прежде подумать над тем, что такое поле вещественных чисел. Строгое построение поля вещественных чисел обычно приводится в курсе анализа. Мы не будем входить в его детали. Однако заметим, что имеется несколь- ко определений вещественных чисел: как бесконечных десятичных дробей, как сечений Дедекинда множества рациональных чисел и т. д. Формально говоря, при этом получаются различные поля. Какое из них является «на- стоящим» полем вещественных чисел? Ответ на этот вопрос состоит в том, что все они изоморфны и их следует рассматривать просто как различные модели одного и того же объекта, называемого полем вещественных чисел. Наиболее удовлетворительным в подобной ситуации всегда является ак- сиоматический подход, при котором сначала формулируются в виде аксиом свойства, которыми должен обладать искомый объект, а затем доказывает- ся, что этими свойствами он определяется однозначно с точностью до изо- морфизма, и с помощью какой-либо конструкции доказывается его суще- ствование. В случае поля вещественных чисел такими аксиомами (помимо аксиом поля) могут быть аксиомы порядка, аксиома Архимеда и аксиома непрерывности. Замечание 1. Нетрудно доказать, что любые две модели поля вещест- венных чисел не просто изоморфны, но между ними имеется единственный изоморфизм. (Доказательство сводится к доказательству того, что всякий изоморфизм поля R на себя тождествен, и основано на соображении, что неотрицательные числа при любом изоморфизме должны переходить в неотрицательные, так как они и только они являются квадратами в поле R.) Это означает, что каждый элемент поля R имеет свою индивидуальность, т. е. в любой модели могут быть идентифицированы числа 10, л/2, я и т. д. Дадим теперь аксиоматическое определение поля комплексных чисел. Определение 1. Полем комплексных чисел называется всякое поле С, обладающее следующими свойствами: 1) оно содержит в качестве подполя поле R вещественных чисел; 2) оно содержит такой элемент i, что i2 = -1; 3) оно минимально среди полей с этими свойствами, т. е. если К с С — какое-либо подполе, содержащее R и i, то К = С. Замечание 2. Из равенства х2 +1 = (х - 0 (х + i) следует, что уравнение х2 = -1 имеет в С ровно 2 решения: i и -I. Если какое-либо подполе содер- жит одно из этих решений, то оно содержит и другое.
28 Глава 1. Алгебраические структуры Построенное выше поле С обладает этими свойствами. Если теперь С' —другое поле комплексных чисел и i' еС' — такой элемент, что (Г)2 = -1, то, поскольку формулы (1) и (2) остаются справедливыми при замене i на Г, отображение /:С->С', a + bi^a + bi' (a,bGR), является изоморфизмом поля С на поле С'. Таким образом, поле С, удовлетворяющее приведенным выше аксио- мам, существует и единственно с точностью до изоморфизма. § 5. Кольца вычетов Расширения кольца целых чисел приводят к цепочке колец ZcQcRcC, в которую, как мы позже увидим, можно вставить и другие звенья (в том числе и продолжить ее вправо). Кольца вычетов определяют- ся также на основе целых чисел, но идея их определения совершен- но иная. Это часто используемый в математике прием «склейки» — образования фактормножества по отношению эквивалентности. Пусть М — какое-либо множество. Всякое подмножество R с с М х М называется отношением на множестве М. Если (a, b) еR, то говорят, что элементы а и b находятся в отношении R, и пи- шут aRb. Приведем примеры отношений. Пример 1. М — множество людей; aRb, если а знает Ь. Пример 2. М то же самое; aRb, если а и b знакомы. Пример 3. М то же самое; aRb, если а и b живут в одном доме. Пример 4. М = R; aRb, если а Ь. Пример 5. М — множество окружностей на плоскости; aRb, ес- ли окружности а и b равны, т. е. переводятся одна в другую движе- нием. Отношение R называется отношением эквивалентности, если оно обладает следующими свойствами: 1) aRa (рефлексивность); 2) aRb => bRa (симметричность); 3) aRb и bRc => aRc (транзитивность). Из приведенных выше примеров отношений только третье и пя- тое являются отношениями эквивалентности: первое и четвертое не симметричны, а второе симметрично, но не транзитивно.
§ 5. Кольца вычетов 29 Отношение эквивалентности обычно записывается как а ~ b или просто а^Ь. Пусть R — отношение эквивалентности на множестве М. Для каждого а е М положим R(a) = {beM: a^b}. Из свойств отношений эквивалентности легко выводится, что a G GR(a) и R(a)nR(b)/0 => R(a)=R(b). Таким образом, подмножества R(a) образуют разбиение множества М, т. е. покрывают его и попарно не пересекаются. Они называются классами эквивалентности отношения R. Два элемента эквивалент- ны тогда и только тогда, когда они принадлежат одному классу. Множество, элементами которого являются классы эквивалент- ности отношения R, называется фактормножеством множества М по отношению эквивалентности R и обозначается через М/R. Отоб- ражение М—*M/R, a-*R(a), называется отображением факторизации. Так, в третьем из приведенных выше примеров классы эквива- лентности — это множества жильцов одного дома. Фактормноже- ство можно отождествить с множеством домов; тогда отображение факторизации — это отображение, ставящее в соответствие каждо- му человеку дом, в котором он живет. В пятом примере классы эквивалентности — это множества окружностей одного радиуса, фактормножество отождествляется с множеством положительных чисел, а отображение факторизации — это отображение, ставящее в соответствие каждой окружности ее радиус. Пусть в множестве М задана некоторая операция (х, у) —>х*у. Отношение эквивалентности R в множестве М называется согласо- ванным с операцией *, если a~az, b~b' => a*b~a,*b/. В этом случае на фактормножестве М/R также можно определить операцию * по правилу R(a)*R(b)=R(a*b). (6) В словесном выражении это определение выглядит так: чтобы произвести операцию над какими-либо двумя классами эквива-
30 Глава 1. Алгебраические структуры лентности, надо выбрать в них произвольных представителей, про- извести операцию над ними и взять тот класс, в котором будет лежать получившийся элемент. Тот факт, что этот класс не будет зависеть от выбора указанных представителей, как раз и обеспе- чивается согласованностью отношения эквивалентности с опера- цией. Очевидно, что все свойства операции в М, имеющие характер тождества, например коммутативность и ассоциативность, наследу- ются определенной таким образом операцией в М/R. То же самое можно сказать о наличии нуля (единицы) и противоположного (об- ратного) элемента. Более точно, если, скажем, операция в М называ- ется сложением и в М имеется нулевой элемент 0 относительно этой операции, то R(0) — нулевой элемент в М/R; если -а — элемент, противоположный элементу а в М, то Я(-а) — элемент, противопо- ложный элементу R(a) в M/R. Приступим теперь к построению колец вычетов. Пусть п — фик- сированное натуральное число. Рассмотрим в множестве Z целых чисел следующее отношение сравнимости по модулю п: а сравнимо с b по модулю п (обозначение: а = b (mod и)), если а — b делится на п или, что равносильно, если а и Ь дают одинаковые остатки при делении на и. Очевидно, что это отношение эквивалентности, причем классы эквивалентности могут быть занумерованы числами 0,1,..., п — 1 таким образом, что r-й класс состоит из всех целых чисел, дающих при делении на п остаток г. Класс эквивалентности, содержащий целое число а, называется вычетом числа а по модулю п и обозначается через [а]п или просто через [а], если ясно, какое п имеется в виду. Фактормножество множества Z по отношению сравнимости по модулю п обозначается через Zn. Мы можем написать, что Zn = {[0]n, [1]п,..., [п-!]„}, но следует понимать, что каждый элемент множества Zn можно обозначать по-разному. Так, элемент [1]п может быть с таким же успехом обозначен через [2п + 1]п, [-(п - 1)]п ит.д. Докажем теперь, что отношение сравнимости по модулю п согла- совано с операциями сложения и умножения в Z. Пусть а = а' (mod и), b = b' (mod и)
§ 5. Кольца вычетов 31 Тогда а + Ь = а' + Ь = а' + b' (mod и) и,аналогично, ab^a'b^a'b' (mod и). Таким образом, мы можем определить в множестве Zn операции сложения и умножения по формулам [a]n + [b]n = [a + b]n, [a]n[b]n = [ab]n (справедливым для любых a, beZ). Тем самым Zn превращается в коммутативное ассоциативное кольцо с единицей. Оно называет- ся кольцом вычетов по модулю п. Пример 6. Ниже приведены таблицы сложения и умножения в кольце Z5. При этом ради простоты квадратные скобки в обозна- чениях элементов этого кольца опущены. + 0 12 3 4 X 0 12 3 4 0 1 2 3 4 0 12 3 4 1 2 3 4 0 2 3 4 0 1 3 4 0 1 2 4 0 12 3 0 1 2 3 4 0 0 0 0 0 0 12 3 4 0 2 4 1 3 0 3 14 2 0 4 3 2 1 Мы видим, в частности, что элементы 2 и 3 взаимно обратны, а эле- мент 4 обратен сам себе. Пример 7. Вычислим [2]100 в кольце Z125: [2]7 = [128] = [3], [2]35 = ([2]7)5 = [З]5 = [243] = [-7], [2]50 = [2]35 ([2]7)2 [2] = [—7] [3]2 [2] = [-126] = [-1], [2]100 = ([2]50)2 = [1]. Полученный результат означает, что 2100 = 1 (mod 125). Учитывая, что 2100 делится на 8, получаем 2100 = 376 (mod 1000), т. е. десятичная запись числа 2100 оканчивается на 376.
32 Глава 1. Алгебраические структуры Кольцо Zn обладает всеми свойствами поля, кроме, быть может, обратимости ненулевых элементов. Очевидно, что Z2 — поле из двух элементов, о котором шла речь в задаче 3.2. Рассмотрение приведенной выше таблицы умножения в кольце Z5 показывает, что Z5 —также поле. С другой стороны, Z4 — не поле, так как элемент [2] в этом кольце необратим. Теорема 1. Кольцо Zn является полем тогда и только тогда, ко- гда п — простое число. Доказательство. 1) Пусть п составное, т. е. п = kl, где 1 < k, I < п. Тогда [к]п, [1]п/0, но [fc]„[Z]„ = [кПп = [п]п = 0. Таким образом, в кольце Zn имеются делители нуля и, значит, оно не является полем. 2) Пусть, напротив, п — простое число и [а]п 0, т. е. а не делит- ся на п. Будем искать элемент, обратный к [а]„, подбором, т. е. умно- жая [а]п по очереди на все элементы кольца. Получим элементы [0]п, [а]п, [2а],„ [(п-1)а]п. (7) Докажем, что все они различны. В самом деле, если [ka]n = [1а]п (О k < I п — 1), то [(! - к)а]п = 0, т. е. (I — к)а делится на п, что невозможно, так как ни I - к, ни а на п не делятся. (Здесь мы ис- пользовали то, что п простое.) Следовательно, в последовательно- сти элементов (7) встречаются все элементы кольца Zn, в том числе [1]а это и означает, что элемент [а]„ обратим. □ Задача 1. Доказать, что при любом п элемент [к]п обратим в кольце Zn тогда и только тогда, когда пик взаимно просты. В полях вычетов мы встречаемся с новым явлением, не имевшим места в числовых полях (подполях поля комплексных чисел). А имен- но, в поле Zn (п простое) выполняется равенство 1Ч-14-... 4-1 = 0. (8) п (Конечно, это верно и в кольце Zn при любом п.) Это приводит к некоторым особенностям алгебраических преобразований в этом поле, о которых мы скажем ниже. Пусть, вообще, К — произвольное поле. Наименьшее натураль- ное п, для которого в поле К выполняется равенство (8), называет- ся характеристикой этого поля; если такого п не существует, то
§ 5. Кольца вычетов 33 говорят, что К — поле нулевой характеристики. Таким образом, (п простое) — поле характеристики п, а числовые поля имеют нулевую характеристику. Характеристика поля К обозначается че- рез char К. Если char К = п, то для любого а е К а 4-а 4-... 4-а = (14-14-... 4-1)а = Оа = 0. п п Характеристика поля, если она положительна, всегда является простым числом. В самом деле, пусть char К = п = kl (1 < к, I < п). Тогда 1 + 14-... + ! = (! + !+ ... + !)(!+ 1 + ... + 1) = 0 п к I и, значит, либо 1 + 1 + ... + ! = О, либо 1 +14-... + 1 = 0, что противо- к i речит определению характеристики. Большинство формул элементарной алгебры справедливы в лю- бом поле, так как при их выводе используются только те свойства операций сложения и умножения, которые входят в число аксиом поля или являются их следствием. Особенность полей положитель- ной характеристики проявляется только в тех формулах, которые содержат умножение или деление на натуральные числа. Рассмотрим, например, формулу (a + b)2 = a2 + 2ab + b2. Она справедлива в любом поле, если понимать 2аЬ как ab + ab. Од- нако в поле характеристики 2 она принимает более простой вид (a + b)2 = a2 + b2. Более общо, в поле характеристики р справедливо тождество (a + b)p = ap + bp. В самом деле, по формуле бинома Ньютона р (a + b)p=£ckap-kbk. к=0 р Однако при 0 < к < р к _ р(р — 1)...(р - к +1) % к\
34 Глава 1. Алгебраические структуры (число сочетаний из р по к), очевидно, делится на р. Следовательно, все слагаемые формулы бинома Ньютона, кроме первого и послед- него, в рассматриваемом случае равны нулю. Задача 2. Вывести отсюда, что в поле Zp справедливо тождество ар =а. (Другое доказательство последнего факта, называемого ма- лой теоремой Ферма, будет дано в § 4.5.) Хуже обстоит дело, когда приходится делить на натуральное чис- ло, например, когда мы находим выражение для ab из выписанной выше формулы квадрата суммы. Для того чтобы придать смысл этому делению в любом поле, можно рассматривать умножение на натуральное число к как умножение на элемент 14-14-... 4-1 данно- к го поля; тогда деление на к можно понимать как деление на этот элемент. Однако если к делится на характеристику поля, то этот элемент равен нулю и деление невозможно. Так, формула для решения квадратного уравнения, содержащая деление на 2, применима в указанном смысле в любом поле харак- теристики / 2, но в поле характеристики 2 она не работает. Пример 8. Решим квадратное уравнение х2 + х-1 = 0 в поле Zu. По обычной формуле находим: _ [-1]± /[5] Х1-2- [2] Так как [5] = [16] = [4]2, то можно считать, что -/[5] = [4] (одно из значений квадратного корня). Следовательно, Y _ [-U-FE4] _ [3] _ [14] г 1 y _ [-1] - [4] _ [-5] _ [6] г - 1 [2] ” [2] [2] L/J’ 2 [2] [2] [2] LOJ> § 6. Векторные пространства Векторы, рассматриваемые в элементарной геометрии, можно не только складывать, но и умножать на числа. Анализ свойств этих двух операций приводит к понятию векторного пространства. Прежде чем мы дадим определение, необходимо отметить, что здесь мы выходим за рамки того понимания операции на множе- стве, которое принималось до сих пор. Умножение вектора на число
§ 6. Векторные пространства 35 не есть операция над двумя элементами одного и того же множе- ства. Это операция, которая каждой паре (число, вектор) ставит в соответствие вектор. В общем определении векторного простран- ства дело обстоит так же, однако вещественные числа заменяются элементами произвольного (но фиксированного) поля. Определение 1. Векторным (или линейным) пространством над полем К называется множество V с операциями сложения и умножения на элементы поля К, обладающими следующими свой- ствами: 1) относительно сложения V есть абелева группа; 2) Л(а + Ь) = Ла + ЛЬ для любых Ле К, а, beV; 3) (Л4-м)а = Ла4-ма для любых Л,/ieK, а eV; 4) (Л/2)а = Л(/2а) для любых Л,/хеК, aeV; 5) la = а для любого a eV. Элементы векторного пространства называются векторами. Эле- менты поля К, в отличие от векторов, мы будем иногда, допуская вольность речи, называть числами, даже если К не есть числовое поле. Векторы в смысле элементарной геометрии мы будем отныне называть геометрическими векторами. Операции над ними удовле- творяют всем аксиомам векторного пространства, что, собственно, и послужило основой для данного выше определения. Простран- ство геометрических векторов евклидовой плоскости (соответствен- но трехмерного евклидова пространства) мы будем обозначать че- рез Е2 (соответственно через Е3). Подчеркнем, что это векторное пространство над полем R. Приведем другие важные примеры век- торных пространств. Пример 1. Множество Кп строк длины п с элементами из поля К является векторным пространством над К относительно операций, определенных формулами (a!,a2, ...,ап) + (ЬъЬ2,...,Ьп) = (аг+ bna2+ b2, ...,an + bn), Л(аь а2,..., ап)= (Ла^, Ла2,..., Лап). Пример 2. Множество F(X, К) всех функций на множестве X со значениями в поле К является векторным пространством относи- тельно обычных операций над функциями: (f + g) (х) =fW+ g(x), (Л/) (х) = Л/(х).
36 Глава 1. Алгебраические структуры Пример 3. Пусть К — подполе поля L. Тогда L можно рассмат- ривать как векторное пространство над К, определив умножение элементов из L на элементы из К просто как умножение в L. В част- ности, поле С есть в этом смысле векторное пространство над R. Укажем некоторые следствия аксиом векторного пространства, не являющиеся следствиями только аксиом абелевой группы. Все они доказываются аналогично похожим на них следствиям аксиом кольца (см. §3). Символом 0 обозначается как нуль поля К, так и нулевой вектор, т. е. нуль аддитивной группы V; читатель увидит, что это не приводит к путанице. 1) АО = 0 для любого Л G К (здесь 0 — нулевой вектор). 2) Л(-а) = -Ла для любых Ле К, aeV. 3) Л(а - Ь) = Ла - ЛЬ для любых Л е К, а, b е V. 4) Оа = 0 для любого a G V (здесь 0 слева — число, справа — век- тор). 5) (-1)а = — а для любого а G V. 6) (Л - /л)а = Ла — ца для любых Л, р е К, а е V. Определение 2. Подмножество U векторного пространства V называется подпространством, если 1) U является подгруппой аддитивной группы V; 2) aeU => Ла eU для любого Ле К. Замечание 1. В определении подгруппы требуется, чтобы aeU => -ае[/. При наличии условия 2) это свойство выполняется автоматически, так как -а = (-1)а. Подпространство векторного пространства само является век- торным пространством относительно тех же операций. Пример 4. В пространстве Е3 множество векторов, параллель- ных заданной плоскости или прямой, является подпространством. Пример 5. В пространстве F(X, R) всех функций на заданном промежутке X числовой прямой множество непрерывных функций является подпространством. В каждом векторном пространстве V есть два «тривиальных» подпространства: само пространство V и нулевое подпространство (состоящее из одного нулевого вектора). Последнее мы будем обо- значать символом 0. Определение 3. Векторные пространства V и U над полем К называются изоморфными, если существует такое биективное отоб-
§ 6. Векторные пространства 37 ражение V — U, что 1) ip(a + b) = ц>(а) + ¥>(Ь) для любых a, be V; 2) <р (Ла) = Лу> (а) для любых Л е К, а е V. Само отображение <р называется при этом изоморфизмом прост- ранств V и U. Как мы увидим в § 2.2, описание векторных пространств с точ- ностью до изоморфизма весьма просто. В частности, все так назы- ваемые конечномерные векторные пространства, с которыми мы в основном и будем иметь дело в этом курсе, изоморфны простран- ствам Кп. Ключевым понятием этой теории является понятие ба- зиса. Всякое выражение вида Л^! 4- Л2а2 4-... 4- Лпап (Л1э Л2,Лп еК) называется линейной комбинацией векторов аьа2, ...,ап е V. Гово- рят, что вектор b линейно выражается через векторы а1эа2, ...,ап, если он равен некоторой их линейной комбинации. Определение 4. Система векторов {е1? е2,..., en} с V называется бази- сом векторного пространства V, если каждый вектор а € V единственным образом линейно выражается через е1? е2,..., еп. Коэффициенты этого вы- ражения называются координатами вектора а в базисе {е^ е2,..., еп}. Пример 6. Из геометрии известно, что любые два неколлинеар- ных вектора еь е2 составляют базис пространства Е2 (рис. 5). Анало- гично любые три некомпланарных вектора составляют базис прост- ранства Е3. Пример 7. Единичные строки ег = (1, 0, ...,0), е2 = (0,1, ...,0), еп = (0, 0,..., 1)
38 Глава 1. Алгебраические структуры составляют базис пространства Кп. Координатами строки а = (аь а2,..., ап) в этом базисе служат числа аь а2,ап. Конечно, в про- странстве Кп имеются и другие базисы. Пример 8. В качестве базиса поля С как векторного пространст- ва над R (см. пример 3) можно взять {!,£}. Координатами комплекс- ного числа в этом базисе служат его вещественная и мнимая части. Предложение 1. Всякое векторное пространство V над полем К, имеющее базис из п векторов, изоморфно пространству Кп. Доказательство. Пусть {е1? е2,..., еп}— базис пространства V. Рассмотрим отображение ср: V-*Kn, ставящее в соответствие каждому вектору строку из его координат в базисе {eb е2,..., еп}. Очевидно, что это биективное отображение. Далее, если а = а1е14-а2е2 + ...4-апеп, b = b1e1+b2e2 + ... + bnen, то а + b = (a! + bi)еj 4- (а2 4-Ь2)е2 4-... 4- (ап 4- Ьп)еп, Ла = (Ла)ег 4- (Аа2)е2 4-... 4- (Лап)еп. Отсюда следует, что — изоморфизм. □ Пример 9. Пространство Е2 (соответственно Е3) изоморфно R2 (соответственно R3). § 7. Алгебры Ввиду крайней простоты своего строения векторные пространст- ва не интересны сами по себе, но они служат необходимым фоном для многих алгебраических (и не только алгебраических) теорий. Так, комбинируя понятия векторного пространства и кольца, мы приходим к важному понятию алгебры. Определение 1. Алгеброй над полем К называется множество А с операциями сложения, умножения и умножения на элементы по- ля К, обладающими следующими свойствами: 1) относительно сложения и умножения на элементы поля А есть векторное пространство; 2) относительно сложения и умножения А есть кольцо; 3) (Aa)b = a(Ab) = A(ab) для любых А е К, a, be А.
§ 7. Алгебры 39 Замечание 1. Термин «алгебра», употреблявшийся нами до сих пор только как название одного из разделов математики, в этом определении имеет, естественно, другой смысл. Пример 1. Всякое поле L, содержащее К в качестве подполя, можно рассматривать как алгебру над К. В частности, поле С есть алгебра над R. Пример 2. Пространство Е3 есть алгебра относительно опера- ции векторного умножения. Пример 3. Множество F(X, К) функций на множестве X со зна- чениями в поле К (см. пример 6.2) является алгеброй над К относи- тельно обычных операций сложения и умножения функций и умно- жения функции на число. Эта алгебра коммутативна, ассоциативна и обладает единицей (каковой является функция, тождественно рав- ная единице). Задача 1. Доказать, что кольцо 2х из задачи 3.1 превращается в алгебру над полем Z2, если определить в нем умножение на эле- менты этого поля по правилам ОМ = 0, 1М = М VMG2X. Предположим, что алгебра А обладает базисом {e1? е2,...»еп} как векторное пространство над К, и пусть а = а1е1+а2е2 + ... + апеп = ^ сад, 1=1 b = bjCj + Ь2е2 +... + ьпеп = £ /ад (=1 — два произвольных элемента этой алгебры. Тогда из дистрибутив- ности умножения относительно сложения и свойства 3) в определе- нии алгебры следует, что П П z П х П ab = 2 а^е.Ь) = S ai( S Ь/е(еу) ) = £ afb/efep. i=l i=l \j=l ' i,j=l Это показывает, что умножение в алгебре А полностью определяет- ся произведениями базисных векторов. Если умножение базисных векторов коммутативно, т. е. ViJ,
40 Глава 1. Алгебраические структуры то и умножение в алгебре А в целом коммутативно. В самом деле, для любых а, b е А мы тогда в предыдущих обозначениях получаем ab = £ ciibj (е^) = £ (е^) = Ьа. ij i,j Аналогично доказывается, что если умножение базисных векто- ров ассоциативно, т. е. (eiej)ek = ei(ejek>) Vi, j,k, то и умножение в алгебре А в целом ассоциативно. С другой стороны, если V — какое-то векторное пространство с базисом {ej, е2,еп} и (j., j = 1,2, ...,п)— произвольные век- торы этого пространства, то мы можем определить операцию умно- жения в V по правилу ab = Xaibjeij ij и тем самым превратить V в алгебру. Иначе говоря, если мы не тре- буем, чтобы умножение обладало какими-нибудь дополнительными свойствами (например, было коммутативным), таблица умножения базисных векторов алгебры может быть совершенно произвольной. Пример 4. Поле С как алгебра над R задается следующей табли- цей умножения базисных векторов: X 1 i 1 i 1 z i -1 Это можно принять за определение поля С. Проверка коммутатив- ности и ассоциативности умножения сводится тогда к тривиальной проверке коммутативности и ассоциативности умножения элемен- тов 1 и I. Пример 5. В ортонормированном (т. е. состоящем из ортого- нальных единичных векторов) базисе {i,;, к} пространства Е3 таб- лица векторного умножения выглядит следующим образом: X i J к i 0 к -j j -k 0 i к j -i 0
§ 8. Алгебра матриц 41 Это умножение антикоммутативно и удовлетворяет тождеству Яко- би (см. пример 3.4). Последнее тождество достаточно проверить для базисных векторов, что не составляет труда (проделайте это!). Пример 6. Алгебра кватернионов Н задается базисом {1, i, j, k} со следующей таблицей умножения: X 1 i j k 1 1 i j k i i -1 k -J J j ~k -1 i k k j -i -1 Эта алгебра ассоциативна (проверьте это!), но не коммутативна. Она содержит в качестве подалгебры (см. определение ниже) ал- гебру комплексных чисел. Позже мы увидим, что в алгебре Н, как и в поле, всякий ненулевой элемент обратим. Таким образом, это «некоммутативное поле». Задача 2. Доказать, что двумерная алгебра над полем Z2 с бази- сом {1, а} и таблицей умножения X 1 a 1 a 1 a a 1 + a является полем (из 4 элементов). Подмножество алгебры называется подалгеброй, если оно одно- временно является подпространством и подкольцом. Отображение алгебр называется изоморфизмом, если оно одновременно является изоморфизмом векторных пространств и колец. § 8. Алгебра матриц Матрицей размера т х п над полем К называется прямоуголь- ная таблица из элементов поля К, имеющая т строк и п столбцов. В буквенной записи элементы матрицы обычно обозначаются од- ной и той же буквой с двумя индексами, первый из которых есть
42 Глава 1. Алгебраические структуры номер строки, а второй — номер столбца: <ав а12 ... ain^ д= а21 а22 ••• а2п k^nil ^ш2 ••• O-ninJ Иногда ради краткости мы будем писать просто А = (а^). Суммой матриц А = (а^) и В = (Д;) одинакового размера называ- ется матрица A + B = (aIy + bIj). Произведением матрицы А = (а^) на элемент AgK называется мат- рица ЛА = (Ла1}). Относительно этих двух операций все матрицы размера т х п обра- зуют векторное пространство, которое мы будем обозначать Кт*п. По сути дела оно не отличается от пространства строк Ктп. Специ- фика матриц проявляется при определении их умножения. Произведением матрицы А = ) размера т х п и матрицы В = = (Ьд) размера п х р называется матрица АВ — (clfc) размера т х р, элементы которой находятся по формулам cik ~ Zj aijbjk' J=1 Иными словами, если определить скалярное произведение строки длины п на столбец высоты п как сумму произведений их соответ- ственных элементов, то можно сказать, что cik есть скалярное произ- ведение i-й строки матрицы А на k-й столбец матрицы В. Подчерк- нем, что произведение двух матриц определено только тогда, когда их размеры согласованы, а именно, когда число столбцов первой матрицы равно числу строк второй. Это определение мотивируется следующим образом. Будем гово- рить, что переменные ylf ...,ут (принимающие значения в поле К) линейно выражаются через переменные х1?..., хп, если существуют такие а^ G К, что У| = Еа1Л (i = 1,2,т). 7 = 1
§ 8. Алгебра матриц 43 Предположим, что переменные ...,хп, в свою очередь, линейно выражаются через переменные zlf р Xj = Y.bjkzk 0 = 1,2, к=1 Тогда, подставив эти выражения в предыдущие, мы получим линей- ные выражения переменных ..., ут через ..., zp: р У1=’Е^к (i = l,2, п где cik = aijbjk> т-е- матрица С = (clfc) есть произведение матриц А = (ai}) и В = (bjk) в смысле данного выше определения. Пример 1. /2 — П 0 2Л ( f 1-2+0 0+21 1(-D+0-5+2-1 Л Г4 П VO -1 3J I * * l”V0-2+(-l)-0+3-l 0-(-1)-4-(—1)-54-3-1у“ 1^3 -27- Пример 2. fcosa — sin a\ fcos fl -^nfl\__ y^sina cosaj^sinfl cos fl J “ fees a cos fl - sin a sin fl -cos a sin fl - sin a cos /ЗЛ _ — y^sin a cos fl + cos a sin fl -sin a sin fl + cos a cos fl J ~~ _ fcos(a + fl) -sin(a + fl) \ — y^sinta + fl) cos(a 4- fl) J ’ Умножение матриц ассоциативно в том смысле, что (АВ)С = А(ВС), (9) если только размеры матриц А, В, С согласованы таким образом, что указанные произведения имеют смысл. В самом деле, пусть (АВ)С = (иД А(ВС) = (Ц/). Имеем тогда Uil S f S O-ijbjk ) ckl ~ S O-ijbjkckl> к К j 7 ),к Ц7 = S bjkckl^ ” S O-ijbjkckb так ЧТО 11ц = Va.
44 Глава 1. Алгебраические структуры Матрица размера п х п называется квадратной матрицей поряд- ка п. Квадратная матрица имеет две диагонали. Одна из них, веду- щая из левого верхнего угла в правый нижний, называется главной диагональю, или просто диагональю, а другая — побочной диагона- лью. Квадратная матрица называется диагональной, если все ее эле- менты, находящееся вне (главной) диагонали, равны нулю. Умноже- ние на диагональные матрицы выглядит особенно просто: ^01 0 ... О Л ЛЬц Ь12 ••• ь1р^ О а2 ... О b2i Ь22 ••• ь2р к О 0 ... aj V>ni bn2 ... b,ipJ a1^12 ••• a2^21 a2^22 ••• a2^2p \dnbHi anbn2 ••• anbnpj (каждая строка второй матрицы умножается на соответствующий диагональный элемент первой матрицы) и, аналогично, <ап а12 ... а1п а21 а22 ••• а2п \O-inl &ni2 ••• O-mnJ 0 ... 0 k Л а11Ь1 а12^2 ••• а1цЬп Л О Ь2 ... О _ а21Ь2 а22Ь2 ••• ci2nbn к 0 0 ... bnJ а ,n2b2 ••• ainnbnJ (каждый столбец первой матрицы умножается на соответствующий диагональный элемент второй матрицы). Диагональную матрицу (аг 0 ... 0 k О а2 ... О к О 0 ... aj мы будем обозначать diag(a1? а2,ап). Диагональная матрица вида П 0 ... Ок о 0 1 ... О Е = ко 0 ... 1J называется единичной матрицей. Из предыдущих формул следует, что для любой матрицы А размера т х п АЕ = А, ЕА = А, (10) где Е в первом случае обозначает единичную матрицу порядка п, а во втором — единичную матрицу порядка т.
§ 8. Алгебра матриц 45 Следующие очевидные свойства связывают операцию умноже- ния матриц с другими операциями: А(В + С) = АВ + АС, (А + В) С = АС + ВС, (11) (ЛА)В = А(ЛВ) = Л(АВ) VA е К. (12) (Как и в свойстве ассоциативности, здесь предполагается, что разме- ры матриц согласованы таким образом, что все указанные действия имеют смысл.) Сумма и произведение квадратных матриц одного и того же порядка п определены и также являются квадратными матрицами порядка и. Свойства (9)—(12) показывают, что все квадратные мат- рицы порядка п образуют ассоциативную алгебру с единицей. Мы будем обозначать ее Ln(JC)? Отметим некоторые «отрицательные» свойства алгебры Ln(K) при п 2. (Алгебра Ц (К) есть поле К.) 1) Алгебра Ln(K) не коммутативна. При и = 2 это можно проде- монстрировать на следующем примере: р оуо П (0 п р пр owo (Л Vo о J Vo Qj Vo oj’ Vo oJVo о; Vo о/ Аналогичные примеры можно привести и при п > 2. 2) Алгебра Ln(K) имеет делители нуля. Это показывает, напри- мер, второе из приведенных выше равенств. Более того, существуют такие ненулевые матрицы, квадрат которых равен нулю, например, ГО lV_fO 1W0 П_Г0 0> Vo о) ~Vo о J Vo oj-Vo o)- 3) He всякий ненулевой элемент алгебры L„(K) обратим. Это следует из наличия делителей нуля и того факта, что делитель нуля не может быть обратим (см. доказательство отсутствия делителей нуля в поле, данное в § 3). Так, например, матрицы Q и необратимы в Ь2(К). Задача 1. Матрица Е1р у которой на (i, j)-m месте стоит 1, а на остальных местах — нули, называется матричной единицей (не пу- тать с единичной матрицей!). Матричные единицы (i, j = 1,..., п) 1 Буква «L» в нашем обозначении — первая буква слова «linear»; это связано с тем, что матрицы можно интерпретировать как линейные отображения (см. § 5.2). Другое часто встречающееся обозначение для этой алгебры — Мп (X).
46 Глава 1. Алгебраические структуры образуют базис векторного пространства Ln(K). Выписать таблицу умножения алгебры Ln(K) в этом базисе. Задача 2. Матрицы вида ЛЕ (Л G К) называются скалярными. Очевидно, что всякая скалярная матрица перестановочна со всеми квадратными матрицами того же порядка. Доказать обратное: вся- кая квадратная матрица, перестановочная со всеми квадратными матрицами того же порядка, скалярна. Задача 3. Доказать, что в алгебре L2(R) матрицы вида образуют подалгебру, изоморфную алгебре комплексных чисел. Задача 4. Доказать, что в алгебре Ь2(С), рассматриваемой как алгебра над R, матрицы вида образуют подалгебру, изоморфную алгебре кватернионов (см. при- мер 7.6). Для каждой матрицы А = <ап а12 ... ainA а21 а22 ••• а2п k^znl ^m2 ••• 0-mnJ определим транспонированную матрицу <ац а21 ... а12 а22 аш2 kaln ^2п ••• O-mnJ строками которой служат столбцы матрицы А, а столбцами — стро- ки матрицы А. Если (i, ;)-й элемент транспонированной матрицы обозначить через аТ, то Очевидно, что (АТ)Т=А, (А + В)Т = АТ + ВТ, (ЛА)Т = ЛАТ УЛ<=К.
§ 8. Алгебра матриц 47 Докажем, что (АВ)Т = ВТАТ. В самом деле, пусть АВ = С = (clfc); тогда Cki = Cik = S = X ^kjajif j J откуда видно, что СТ = ВТАТ. Замечание 1. Читатель может проследить, что все построения послед- них трех параграфов проходят без изменений, если в качестве К взять произвольное коммутативное ассоциативное кольцо с единицей, например, кольцо целых чисел или кольцо вычетов. Единственное отличие является терминологическим: вместо термина «векторное пространство» в этой бо- лее общей ситуации употребляется термин «модуль». (См. § 9.3.)
Глава 2 Начала линейной алгебры § 1. Системы линейных уравнений Пусть К — произвольное (но фиксированное) поле. Допуская вольность речи, мы будем обычно называть его элементы числами. Если читателю трудно представить себе произвольное поле, он может считать, что К = JR, хотя объективно этот случай ничуть не проще общего. Линейным уравнением с неизвестными хъ х2,хп над полем К называется уравнение вида а1х1+а2х2 + ... + апхп = Ь) где коэффициенты аъа2, ...,ап и свободный член b суть элементы поля К. Линейное уравнение называется однородным, если Ь = 0. Система т линейных уравнений с п неизвестными в общем виде записывается следующим образом: ( anXi+ а12х2 + ...+ а1пхп = Ьъ a21Xi+ а22х2 + ...+ а2пхп = Ь2, V aml*l &т2х2 “Ь • • • + °-тпхп Ът • Матрица <ап а12 ... ащ> д= а21 а22 ••• а2п \Лп11 а/п2 ... атпу называется матрицей коэффициентов, а матрица ^а11 а12 ••• а1п а21 а22 ••• а2п ^2 ^ш2 ••• ^тп ^inJ —расширенной матрицей системы (1).
§ 1. Системы линейных уравнений 49 Система уравнений называется совместной, если она имеет хотя бы одно решение, и несовместной в противном случае. Совместная система может иметь одно или более решений. Решить систему уравнений — это значит найти все ее решения. Подчеркнем, что одно решение системы уравнений с п неизвест- ными — это упорядоченный набор из п чисел, т. е. элемент простран- ства Кп. Существует простой общий метод решения систем линейных уравнений, называемый методом Гаусса. Его идея состоит в при- ведении любой системы линейных уравнений с помощью некото- рых специальных преобразований, называемых элементарными, к эквивалентной системе некоторого простого вида, все решения которой легко найти. Напомним, что две системы уравнений назы- ваются эквивалентными, если множества их решений совпадают, т. е. если каждое решение первой из них является решением второй и наоборот. Определение 1. Элементарными преобразованиями системы ли- нейных уравнений называются преобразования следующих трех ти- пов: 1) прибавление к одному уравнению другого, умноженного на число; 2) перестановка двух уравнений; 3) умножение одного уравнения на число, отличное от нуля. Подчеркнем, что при элементарном преобразовании первого ти- па изменяется только одно уравнение — то, к которому прибавляет- ся другое, умноженное на число. Очевидно, что всякое решение исходной системы уравнений яв- ляется решением новой системы, полученной элементарным пре- образованием. С другой стороны, исходная система уравнений мо- жет быть получена из новой системы подходящим элементарным преобразованием того же типа. Так, если мы прибавим к первому уравнению второе, умноженное на с, то можно вернуться назад, прибавив к первому уравнению новой системы ее второе уравнение (оно такое же, как у исходной системы), умноженное на —с. Поэто- му при любом элементарном преобразовании мы получаем систему уравнений, эквивалентную исходной. Так как нам удобнее работать не с самими системами линейных уравнений, а с их (расширенными) матрицами, дадим соответству- ющее определение для матриц.
50 Глава 2. Начала линейной алгебры Определение V. Элементарными преобразованиями строк мат- рицы называются преобразования следующих трех типов: 1) прибавление к одной строке другой, умноженной на число; 2) перестановка двух строк; 3) умножение одной строки на число, отличное от нуля. Очевидно, что всякое элементарное преобразование системы ли- нейных уравнений приводит к соответствующему элементарному преобразованию ее матрицы коэффициентов и расширенной мат- рицы. Покажем теперь, что с помощью элементарных преобразований строк любую матрицу можно привести к достаточно простому виду. Назовем ведущим элементом ненулевой строки (аь а2)afl) е е Кп ее первый ненулевой элемент. Определение 2. Матрица называется ступенчатой, если 1) номера ведущих элементов ее ненулевых строк образуют стро- го возрастающую последовательность; 2) нулевые строки, если они есть, стоят в конце. Таким образом, ступенчатая матрица — это матрица вида ( |Д1„ ....................... А |%2 ................. 0 V 7 (2) в которой элементы а171, a2j2,аг^, находящиеся в углах ступенча- той линии, отличны от нуля, а все элементы, находящиеся слева от этой линии и ниже нее, равны нулю. При этом <jr- Теорема 1. Всякую матрицу путем элементарных преобразова- ний строк можно привести к ступенчатому виду. Доказательство. Если данная матрица нулевая, то она уже сту- пенчатая. Если она ненулевая, то пусть j\ — номер ее первого нену- левого столбца. Переставив, если нужно, строки, добьемся того, что- бы a1ji / 0. После этого прибавим к каждой строке, начиная со второй, первую строку, умноженную на подходящее число, с таким расчетом, чтобы все элементы ;гго столбца, кроме первого, стали
§ 1. Системы линейных уравнений 51 равными нулю. Мы получим матрицу вида Поступая таким же образом с матрицей мы в конце концов по- лучим матрицу вида (2). □ Замечание 1. В этом доказательстве мы обошлись без элемен- тарных преобразований третьего типа. Однако на практике они мо- гут быть полезны. Пример 1. Приведем к ступенчатому виду матрицу Л 2 1 О 2Л 13 2-1 4 2 1-1 3-2 <2 0 -2 3 1J Вычитая из 2-й, 3-й и 4-й строк 1-ю строку, умноженную на 1, 2 и 2 соответственно, получаем матрицу Л 2 1 0 2\ 011-12 0-3-3 3 -6 ’ <0 —4 —4 3-37 Далее, прибавляя к 3-й и 4-й строкам 2-ю строку, умноженную на 3 и 4 соответственно, получаем матрицу Л 2 1 0 2А 011-12 ООО 00* Ц) 0 0 -1 57 Наконец, переставляя 3-ю и 4-ю строки, получаем ступенчатую мат- рицу Л 2 1 0 2А 0 11-12 0 0 0 —1 5’ <о о о о о7 Замечание 2. Предыдущий пример специально подобран таким образом, чтобы jlf j2, ---tir не были просто первыми г членами на-
52 Глава 2. Начала линейной алгебры турального ряда. Такая ситуация является в определенном смысле исключительной. Например, # 1 только при условии, что первый столбец исходной матрицы нулевой. Как правило, Ь = 1, >2 = 2, }г = Г. В этом случае матрица (2) называется трапецеидальной. Применим доказанную теорему к решению систем линейных уравнений. Определение 3. Система линейных уравнений называется сту- пенчатой, если ее расширенная матрица ступенчатая. Из теоремы 1 следует, что всякую систему линейных уравнений с помощью элементарных преобразований можно привести к сту- пенчатому виду. Поэтому нам достаточно научиться решать ступен- чатые системы. Введем некоторую терминологию. Квадратная матрица А = (а,р называется {верхней) треугольной, если а^ = 0 при i > j, и строго треугольной, если, кроме того, ап # 0 при всех i. Система линейных уравнений называется {строго) треугольной, если ее матрица коэф- фициентов (строго) треугольна. Замечание 3. Квадратная матрица А = (а,;) называется нижней треугольной, если а^ = 0 при i < j. Рассмотрим теперь произвольную ступенчатую систему линей- ных уравнений. Пусть число ненулевых строк (число ступенек) ее матрицы коэффициентов равно г, а число ненулевых строк расши- ренной матрицы равно г. Очевидно, что г = г или г 4-1. Возможны следующие три принципиально разных случая. 1-й случай. г = г 4-1. В этом случае система содержит уравне- ние вида О*! 4- 0х2 4-... 4- 0хп = Ь, где b / 0, и, следовательно, несовместна. 2-й случай. г = г = п. В этом случае после отбрасывания нуле- вых уравнений получается строго треугольная система. Из ее по- следнего уравнения однозначно определяется хп, затем из предпо- следнего уравнения определяется хп_г и т.д. Следовательно, систе- ма имеет единственное решение. 3-й случай. г = г<п. Пусть в этом случае j19 j2,..., jr — номера ведущих коэффициентов ненулевых уравнений системы. Неизвест-
§ 1. Системы линейных уравнений 53 ные х.-, х,•,..., х,- назовем главными. а остальные — свободными. После отбрасывания нулевых уравнений и перенесения членов со свободными неизвестными в правую часть получается строго тре- угольная система относительно главных неизвестных. Решая ее, как в предыдущем случае, находим выражения главных неизвестных че- рез свободные. Эти выражения называют общим решением системы. Все решения системы получаются из общего решения подстановкой каких-то значений свободных неизвестных. Поскольку эти значения могут выбираться произвольно, система имеет, во всяком случае, более одного решения, а если поле К бесконечно, то бесконечно много решений. Совместная система линейных уравнений называется определен- ной, если она имеет единственное решение, и неопределенной, если она имеет более одного решения. В последнем случае, как следует из проведенного выше анализа, она имеет бесконечно много решений, если только поле К бесконечно. Ее общее решение с точностью до перенумерации неизвестных имеет вид ' Х1 = С11*г+1 + С12*г+2 + • • • + Чп-Л + х2~С21Хг+1 + С22Хг+2 + ••• +С2,п-г*п + ^2> (3) I xr = Crl*r+1 + Сг2*г+2 + • • • + Сг.п-Л + Пример 2. Решим систему уравнений Xj + 2х2 + х3 =2, Xi+3x2 + 2x3- х4 = 4, 2х3+ х2— х3 + Зх4 = -2, 2хг - 2х3 + Зх4 = 1, расширенной матрицей которой служит матрица из примера 1. Вы- числения, проведенные в примере 1, показывают, что данная систе- ма эквивалентна ступенчатой системе X! + 2x2 + x3 =2, х2 + х3- х4 = 2, -х4 = 5.
54 Глава 2. Начала линейной алгебры Считая неизвестные х}, х2, х4 главными, а неизвестное х3 — свобод- ным, перепишем систему в виде хг 4- 2х2 = -х3 4- 2, х2-х4 = -х3 + 2, -х4 = 5. Решая ее относительно хь х2, х4, находим общее решение Xj = х3 4- 8, х2 = -х3-3, х4= -5. Замечание 4. Для единообразия можно считать, что в случае определенной системы все неизвестные являются главными, а сво- бодные неизвестные отсутствуют. Общее решение есть тогда един- ственное решение системы. Строго треугольную матрицу можно путем элементарных пре- образований строк привести к единичной матрице. Для этого нуж- но сначала к каждой строке, кроме последней, прибавить послед- нюю строку с таким коэффициентом, чтобы элемент последнего столбца стал равным нулю, затем аналогичным образом, прибав- ляя предпоследнюю строку, сделать равными нулю все элементы предпоследнего столбца, кроме диагонального, и т.д. В результа- те мы получим диагональную матрицу. Умножая ее строки на под- ходящие числа, мы получим единичную матрицу. Пользуясь этим, можно при решении системы линейных уравнений не останавли- ваться на ступенчатом виде, а, продолжив преобразования, приве- сти матрицу коэффициентов при главных неизвестных к единич- ной матрице. Тогда общее решение просто считывается с получен- ной матрицы. Эта процедура называется обратным ходом метода Гаусса. Пример 3. Продолжим преобразование примера 1, предвари- тельно отбросив нулевую строку. Вычтя из 2-й строки 3-ю, получим матрицу /12 1 0 2\ 011 0 -3 . <000-1 5J
§ 1. Системы линейных уравнений 55 Вычтя из 1-й строки удвоенную 2-ю и умножив 3-ю строку на -1, получим матрицу 10-10 8Л 0 1 10-3. 00 01 -5/ Таким образом, система уравнений из примера 2 эквивалентна си- стеме Xj -х3 =8, х24-х3 = -3, х4 = -5. Перенося члены с х3 в правую часть, получаем уже найденное выше общее решение. Система однородных линейных уравнений всегда совместна, так как она имеет нулевое решение. Если она определенна, то она име- ет только нулевое решение, если неопределенна, то имеет хотя бы одно ненулевое решение (и даже бесконечно много таких решений, если поле К бесконечно). В предыдущих обозначениях, последний случай имеет место, если г < п. Пользуясь тем, что всегда г^т, мы приходим к следующей теореме, которая является важным теорети- ческим следствием метода Гаусса. Теорема 2. Всякая система однородных линейных уравнений, число уравнений которой меньше числа неизвестных, имеет нену- левое решение. Совокупность всех решений совместной системы линейных урав- нений с п неизвестными не может быть произвольным подмноже- ством пространства Кп. Читателю, вероятно, известно, что нетриви- альная совместная система линейных уравнений задает в Е2 точку или прямую, а в Е3 — точку, прямую или плоскость. Следующая теорема является алгебраической версией этих утверждений, спра- ведливой в любой размерности и для любого поля. Теорема 3. 1) Совокупность всех решений системы однородных линейных уравнений с п неизвестными является подпространством пространства Кп. 2) Совокупность всех решений произвольной совместной систе- мы линейных уравнений есть сумма какого-либо одного ее решения и подпространства решений системы однородных линейных уравне- ний с той же матрицей коэффициентов.
56 Глава 2. Начала линейной алгебры Доказательство. 1) Рассмотрим произвольную систему одно- родных линейных уравнений (апХ1+ (112*2 +•••+ ain*n = 0> а2гХ1+ а22х2 + ...+ а2пх„ = 0, (4) amixi + ат2х2 + • • • + атпхп = 0. Очевидно, что нулевая строка является ее решением и что произ- ведение любого решения на число также является решением. Дока- жем, что сумма решений (иъ ..., un) и (иъ ..., ип) является решением. Подставляя ее компоненты в i-e уравнение системы, получаем: (u j 4-) 4- ai2(и2 4- и2) 4-... + ain (ип + Цг) = = (atlUj 4- ai2u2 4-... 4- ainun) 4- (а^ 4- ai2v2 4-... 4- ainип) = 0 4- 0 = 0, что и требовалось доказать. 2) Пусть теперь и G Кп — какое-либо фиксированное решение системы (1). Аналогично предыдущему доказывается, что сумма ре- шения и и произвольного решения и системы (4) является решени- ем системы (1). Обратно, если и' — любое решение системы (1), то v = и' - и — решение системы (4); но и' = и 4- р, так что и' получает- ся из и добавлением решения системы (4). □ Неопределенные системы линейных уравнений могут иметь раз- ную «степень неопределенности», каковой естественно считать чис- ло свободных неизвестных в общем решении системы. Однако одна и та же система линейных уравнений может допускать различные общие решения, в которых разные неизвестные играют роль свобод- ных, и закономерен вопрос, будет ли число свободных неизвестных всегда одним и тем же. Положительный ответ на этот вопрос дается с помощью понятия размерности векторного пространства, которое будет введено в следующем параграфе. В оставшейся части этого параграфа мы интерпретируем метод Гаусса на языке умножения матриц. Прежде всего, если обозначить через X столбец неизвестных, а через В — столбец свободных членов, то систему (1) можно пере- писать в следующей матричной форме: АХ = В. (5)
§ 1. Системы линейных уравнений 57 Действительно, матрица АХ, согласно правилу умножения матриц, есть столбец высоты т, i-й элемент которого равен апХ1 +ai2x2 + ...+ainxn. Приравнивая этот элемент i-му элементу столбца В, мы получаем как раз i-e уравнение системы (1). Пусть U — какая-либо квадратная матрица порядка т. Умножая обе части уравнения (5) слева на U, мы получаем уравнение UAX = UB. (6) Очевидно, что всякое решение уравнения (5) удовлетворяет и урав- нению (6). Если же матрица U обратима, то умножение слева на осуществляет обратный переход от уравнения (6) к уравнению (5) и, следовательно, эти уравнения эквивалентны. Уравнению (6) соответствует система линейных уравнений с матрицей коэффициентов UA и столбцом свободных членов UB. Легко видеть, что расширенная матрица этой системы равна UA. Далее, непосредственно проверяется, что элементарные преоб- разования строк какой-либо матрицы А равносильны ее умноже- нию слева на так называемые элементарные матрицы следующих трех типов: = Е + сЕу, = Qi(c), где i 0 с 00, а все элементы этих матриц, не выписанные явно, такие же, как у единичной матрицы.
58 Глава 2. Начала линейной алгебры Так, например, умножение матрицы А слева на Е + сЕ^ (f # J) приводит к тому, что к i-й строке прибавляется j-я строка, умножен- ная на с (а прочие строки не изменяются). Все элементарные матрицы обратимы, причем обратные к ним матрицы суть элементарные матрицы, соответствующие обратным элементарным преобразованиям: (Е + сЕу)-1 =Е— сЕу, Р^=Рц, Qj(c)-1 = Ql(c-1). Метод Гаусса в матричной интерпретации состоит в последова- тельном умножении уравнения (5) слева на элементарные матрицы, имеющем целью приведение матрицы А (а также расширенной мат- рицы А) к ступенчатому виду. Используя вместо элементарных матриц какие-либо другие матрицы, можно получить другие методы решения систем линейных уравнений, кото- рые, быть может, не столь просты в теоретическом отношении, но, скажем, более надежны при приближенных вычислениях (в случае K = R). Таков, например, метод вращений, при котором в качестве U берутся матрицы вида i .........cos а------sin а j .....sin а cos а.... v = i ’’-J § 2. Базис и размерность векторного пространства Представление о размерности пространства есть одна из фунда- ментальных идей математики. В разных разделах математики оно (как и представление о самом пространстве) принимает разные формы. В этом параграфе мы дадим определение размерности век- торного пространства и исследуем связанные с этим понятием во- просы. В § 1.6 мы ввели понятие базиса векторного пространства и до- казали, что векторное пространство над полем К, имеющее базис из п векторов, изоморфно пространству строк К". Размерность век- торного пространства определяется как число векторов в его базисе. Однако перед тем как дать такое определение, необходимо ответить
§ 2. Базис и размерность векторного пространства 59 на два вопроса: какие векторные пространства обладают базисом и не может ли в векторном пространстве быть двух базисов, состоя- щих из разного числа векторов. Чтобы ответить на эти вопросы, нам понадобится ввести некото- рые понятия и доказать ряд утверждений, которые важны и сами по себе. Пусть V — векторное пространство над полем К. Линейная комбинация Aidj 4-А2а2 4-... 4-Anan (Аь А2,..., An GK) векторов а2, ...,aneV называется тривиальной, если Aj = А2 =... ... = Ап = 0, и нетривиальной в противном случае. Определение 1. Векторы а2, называются линейно зави- симыми, если существует их нетривиальная линейная комбинация, равная нулю, и линейно независимыми в противном случае. Подчеркнем, что понятие линейной зависимости (или независи- мости) относится не к отдельным векторам, а к их совокупностям или, как говорят, системам векторов. Замечание 1. Понятие системы векторов отличается от понятия множества векторов тем, что, во-первых, векторы системы пред- полагаются занумерованными и, во-вторых, среди них могут быть равные. Таким образом, система из п векторов — это, в сущности, отображение множества {1, 2,..., п} в пространство V. Заметим, од- нако, что свойство системы векторов быть линейно зависимой или независимой не зависит от нумерации векторов в ней. Замечание 2. Термин «линейная комбинация» на самом деле употребляется в двух смыслах: как указание действий, которые про- изводятся над данными векторами, что равносильно заданию коэф- фициентов Аъ А2,..., Ап, и как результат этих действий. В выраже- нии «нетривиальная линейная комбинация данных векторов равна нулю» нетривиальность понимается в первом смысле, а равенство нулю — во втором. Линейная независимость векторов а2,..., ап означает, иными словами, что равенство А^сц 4~ А2а2 4-... 4- Апап = О выполняется только при Аг = А2 =... = Ап = 0. Пример 1. Система, состоящая из одного вектора, линейно зави- сима тогда и только тогда, когда этот вектор нулевой.
60 Глава 2. Начала линейной алгебры Пример 2. Система, состоящая из двух векторов, линейно зави- сима тогда и только тогда, когда эти векторы пропорциональны. Пример 3. Три геометрических вектора линейно зависимы то- гда и только тогда, когда они компланарны (параллельны одной плоскости). Очевидно, что если система векторов содержит линейно зави- симую подсистему, то она сама линейно зависима. Так, например, всякая система векторов, содержащая пропорциональные векторы, линейно зависима. Лемма 1. Векторы аь а2,..., ап (п > 1) линейно зависимы тогда и только тогда, когда хотя бы один из них линейно выражается через остальные. Доказательство. 1) Пусть, например, =/22а24-... 4-р-пап- тогда ai-M2a2--"-Mnan = 0, что показывает линейную зависимость векторов а2,..., ап. 2) Обратно, пусть AjOj + Л2а2 +... + Anan = 0, где не все коэффициенты Аь А2,..., Ап равны нулю. Допустим для определенности, что Аг / 0. Тогда _ А2 А а'-~Т1а2~-~Т1ап’ т. е. а2 линейно выражается через а2,..., ап. □ Замечание 3. Неверно, что любой вектор линейно зависимой системы линейно выражается через остальные. Пусть, например, а — какой-нибудь ненулевой вектор. Система {а, 0} линейно зави- сима, так как 0а + 1-0 = 0, но вектор а, очевидно, не выражается через нулевой вектор. Лемма 2. Пусть векторы alta2, ...,ап линейно независимы. Век- тор b линейно выражается через а19 а2,..., ап тогда и только тогда, когда векторы а19 а2,..., an, Ь линейно зависимы.
§ 2. Базис и размерность векторного пространства 61 Доказательство. Если вектор b линейно выражается через а2,ап, то аь а2,ап, b линейно зависимы согласно предыдущей лемме. Обратно, пусть Лубц 4- А2а2 4-... 4- ^пап = причем не все коэффициенты Аъ А2,Ап, pt равны нулю. Можно утверждать, что р 00: в противном случае мы получили бы линей- ную зависимость векторов аь а2,..., ап, что противоречит условию. Но тогда Лемма 3. Пусть вектор b линейно выражается через векторы а1э а2,..., ап. Это выражение единственно тогда и только тогда, когда векторы аь а2, линейно независимы. Доказательство. 1) Пусть вектор b допускает два различных вы- ражения через аь а2,..., ап: Ь = А1а1 + А2а2 4-... 4-Апап = Л/1а1 4-А^ 4-... 4-А'а„. тогда (А* — А^сц 4- (А^ — А2)а2 4-... 4- (А^ — Ап)ап = 0 есть линейная зависимость между аь а2,..., ап. 2) Обратно, пусть Miai4-M2a2 + --- + MnOn = 0 есть линейная зависимость между аь а2,..., ап. Тогда если Ь = А1а1 4-А2а2 4-... 4-Anan, то также Ь = (Ах 4-Mi)ai + (^2 + Мг)а2 + ••• + + Мп)ап> что дает другое выражение b через аь а2,..., ап. □ Предложение 1 (основная лемма о линейной зависимости). Ес- ли векторы bi,b2, ...9Ьт линейно выражаются через векторы аъ а2,..., ап, причем т>п, то векторы Ь2,..., Ьт линейно зависимы.
62 Глава 2. Начала линейной алгебры Доказательство. Пусть Ь1= M11G1+ Mi2a2 + ---+Minan, Ь2 = M2iai + М22а2 + ••• + М2пап> Mmlal + Mm2a2 4" ... 4" Mmnan- Для любых Ль А2, ..., АтеК получаем Aibi + А2Ь2 +... + АГПЬП1 = (Aj^n + A2pt21 +... + + + CAi Mi2 + ^2M22 + • • • + ^mMm2)fl2 + -F CAjД£+ A2/22n 4"... 4" Am/2mn)cin. Рассмотрим систему и однородных линейных уравнений с т неиз- вестными Г М11*1 + М21*2 + • • • + Mml^i = О, М12*1 + М22*2 + • • • + = 0» М1пХ1 + М2п*2 + • • • + М;иА = 0- Если (Аь А2,..., А,п) — произвольное решение этой системы, то Ajbj 4- A2b2 4-... 4-Ambni = 0. С другой стороны, по теореме 1.2 эта система имеет ненулевое реше- ние. Следовательно, векторы Ьь Ь2,..., ЬП1 линейно зависимы. □ Пусть S с V — какое-то подмножество. Совокупность всевозмож- ных (конечных) линейных комбинаций векторов из S называется линейной оболочкой множества S и обозначается через (S). Это наи- меньшее подпространство пространства V, содержащее S (проверь- те это!). Говорят, что пространство V порождается множеством S, если (S) = V. Определение 2. Векторное пространство называется конечно- мерным, если оно порождается конечным числом векторов, и бес- конечномерным в противном случае. Ввиду леммы 3 определение 1.6.4 базиса векторного пространст- ва можно переформулировать следующим образом. Определение 3. Базисом векторного пространства V называет- ся всякая линейно независимая система векторов, порождающая пространство V.
§ 2. Базис и размерность векторного пространства 63 Теорема 1. Всякое конечномерное векторное пространство V об- ладает базисом. Более точно, из всякого конечного порождающего множества S с V можно выбрать базис пространства V. Доказательство. Если множество S линейно зависимо, то по лемме 1 в нем найдется вектор, линейно выражающийся через остальные. Выкидывая этот вектор, мы получаем порождающее множество из меньшего числа векторов. Продолжая так дальше, мы в конце концов получим линейно независимое порождающее множество, т. е. базис. □ Теорема 2. Все базисы конечномерного векторного пространст- ва V содержат одно и то же число векторов. Это число называется размерностью пространства V и обознача- ется dim V. Доказательство. Если бы в пространстве V существовали два базиса из разного числа векторов, то, согласно предложению 1, тот из них, в котором больше векторов, был бы линейно зависим, что противоречит определению базиса. □ Замечание 4. Нулевое векторное пространство (состоящее из одного нулевого вектора) считается обладающим «пустым бази- сом»; в соответствии с этим его размерность считается равной нулю. Пример 4. Пространство Е2 (соответственно Е3) имеет размер- ность 2 (соответственно 3). Пример 5. Ввиду примера 1.6.7 пространство Кп имеет размер- ность и. Пример 6. Поле комплексных чисел как векторное простран- ство над R имеет размерность 2, а алгебра кватернионов (см. при- мер 1.7.6) — размерность 4. Пример 7. Если X — конечное множество из п элементов, то век- торное пространство F(X, К) всех функций на X со значениями в К (см. пример 1.6.2) имеет размерность п. В самом деле, рассмотрим так называемые 5-функции 5а (абХ), определяемые формулами „ х (1, еслих = а, (О, если х# а. Очевидно, что любая функция GF(X, К) единственным образом выражается через 5-функции, а именно, <Р= L <₽(а)5а. аеХ
64 Глава 2. Начала линейной алгебры Следовательно, функции 5а, аеХ, составляют базис пространства F(X, X), причем координатами функции в этом базисе служат ее значения. Если множество X бесконечно, то для любого п в прост- ранстве F(X, К) имеется п линейно независимых векторов, напри- мер, 5ар ба2,..., 5ап, где а2) ...,апеХ различны, и, следовательно, пространство F(X, X) бесконечномерно. Пример 8. Поле R как векторное пространство над Q бесконечномерно. В самом деле, если бы оно было конечномерным, то вещественное число определялось бы конечным набором рациональных чисел — своих коорди- нат в некотором базисе этого пространства. Но тогда множество всех веще- ственных чисел было бы счетным, что неверно. Задача 1. Найти число векторов п-мерного векторного прост- ранства над конечным полем из q элементов. Задача 2. Доказать, что пространство всех непрерывных функ- ций на любом промежутке числовой прямой бесконечномерно. Из основной леммы о линейной зависимости (предложение 1) следует, что любые т > п векторов п-мерного векторного простран- ства V линейно зависимы и, значит, в любом (конечном или беско- нечном) множестве S с V имеется максимальное линейно независи- мое подмножество, т. е. такое линейно независимое подмножество, которое становится линейно зависимым при добавлении к нему любого из оставшихся векторов множества S. Более того, любое линейно независимое подмножество множества S можно дополнить до максимального линейно независимого подмножества. Предложение 2. Всякое максимальное линейно независимое под- множество {ет,..., ек} множества S является базисом линейной обо- лочки (S) этого множества. Доказательство. Нужно доказать, что каждый вектор из (S) ли- нейно выражается через е1э ...,efc. По определению линейной обо- лочки каждый вектор из (S) линейно выражается через векторы из S. Поэтому достаточно доказать, что каждый вектор а е S линей- но выражается через elf..., ek. Для a G {eb ..., ek} это очевидно. Для а£{еъ ...,ек} это следует из леммы 2. □ Применяя высказанные соображения к S = V, мы получаем сле- дующую теорему. Теорема 3. Всякую линейно независимую систему векторов ко- нечномерного векторного пространства V можно дополнить до ба- зиса.
§ 2. Базис и размерность векторного пространства 65 В частности, любой ненулевой вектор можно включить в базис, а любые п линейно независимых векторов п-мерного векторного пространства уже составляют базис. Задача 3. Найти число базисов n-мерного векторного простран- ства над полем из q элементов. Следующая теорема устанавливает свойство монотонности раз- мерности. Теорема 4. Всякое подпространство U конечномерного вектор- ного пространства V также конечномерно, причем dim U $ dim V. Более того, если U^V, то dim U < dim V. Доказательство. Пусть {е1э е2,..., ек} — максимальная линейно независимая система векторов подпространства U. Согласно пред- ложению 2, {е^ е2,..., ек} — базис этого подпространства. Следова- тельно, dim U = к. Линейно независимую систему {е1э е2,..., ек} мож- но дополнить до базиса всего пространства V. Следовательно, если L//V, то dim У> к. □ Задача 4. Найти число к-мерных подпространств n-мерного век- торного пространства над полем из q элементов. Следующая теорема дает исчерпывающее описание всех конеч- номерных векторных пространств. Теорема 5. Конечномерные векторные пространства над одним и тем же полем изоморфны тогда и только тогда, когда они имеют одинаковую размерность. Доказательство. Если f: V —♦ U — изоморфизм векторных про- странств и {ej, е2,..., еп} — базис пространства V, то {/(еД /(е2),... • ••> /(еп)} — базис пространства U, так что dim V = dim U. Обратно, согласно предложению 1.6.1, всякое n-мерное векторное простран- ство над полем К изоморфно Кп; следовательно, все такие простран- ства изоморфны между собой. □ Таким образом, в любом рассуждении мы вправе заменить про- извольное n-мерное векторное пространство над полем К простран- ством строк Кп. В пространстве Кп имеется «привилегированный» базис, состоящий из единичных строк (см. пример 1.6.7). С другой стороны, если в каком-либо п-мерном векторном пространстве V задан базис, то сопоставление каждому вектору строки его коор- динат (как в доказательстве предложения 1.6.1) определяет канони- ческий изоморфизм пространства V и пространства Кп, при кото- ром векторам заданного базиса соответствуют единичные строки. В этом смысле можно сказать, что пространство строк — это не что
66 Глава 2. Начала линейной алгебры иное, как конечномерное векторное пространство с выделенным базисом. Выясним, как связаны между собой координаты вектора в раз- ных базисах. Пусть {е2,..., еп} и {е*,..., е'} —два базиса векторного пространства V. Выразим векторы второго базиса через первый базис: e'=Seicij (j = l. (7) I Квадратная матрица С = (с,у) называется матрицей перехода от базиса {еь ..., еп} к базису {e'lfе'}. Согласно этому определению, j-й столбец матрицы С есть столбец координат вектора е< в базисе {еь ..., еп}. Если распространить правило умножения матриц на слу- чай, когда элементами одной из них являются векторы (что имеет смысл ввиду операций, определенных в векторном пространстве), то равенства (7) могут быть переписаны в следующей матричной форме: (е'1,...,<) = (е1,...,еп)С. (8) Пусть х G V — какой-либо вектор. Разложим его по базисам {е1,...,еп}и{е'1,...,е'п}: х = х1е1 + ... + хпел = х{е'1 + ... + х'пе,п. Положим Тогда х= (e'p ..., е')Х' = (eb ..., еп)СХ', откуда получается следующая формула преобразования координат при переходе от базиса {еь ..., еп} к базису {вр ..., е'}: Х = СХ' (9) или, более подробно, = (i = l, ...,п). (10) j Понятия базиса и размерности могут быть распространены на бесконечномерные векторные пространства. Чтобы это сделать, на- до определить, что такое линейная комбинация бесконечной систе-
§ 2. Базис и размерность векторного пространства 67 мы векторов. В чисто алгебраической ситуации нет иного выхо- да, кроме как ограничиться рассмотрением линейных комбинаций, в которых лишь конечное число коэффициентов отлично от нуля. Пусть {а;: iel}— система векторов, занумерованных элемента- ми бесконечного множества I. Линейной комбинацией векторов а,, i е/, называется выражение вида Afaf, в котором лишь конечное iel число коэффициентов А, отлично от нуля, так что сумма фактически является конечной и, таким образом, имеет смысл. На основе этого определения линейной комбинации точно так же, как в случае ко- нечных систем векторов, определяются понятия линейной выража- емости, линейной зависимости и базиса. Векторное пространство, обладающее счетным базисом, называ- ется счетномерным. Пример 9. Очевидно, что множество всех последовательностей (строк бесконечной длины) из элементов поля К является вектор- ным пространством относительно операций сложения и умножения на элементы поля К, определяемых так же, как для строк конеч- ной длины. Последовательность называется финитной, если лишь конечное число ее членов отлично от нуля. Финитные последова- тельности образуют подпространство в пространстве всех последо- вательностей. Обозначим его через К00. В качестве его базисных векторов можно взять последовательности вида е. = (0, ...,0,1,0,...) (i = 1,2,...) (единица стоит на i-м месте). Таким образом, пространство К00 счет- номерно. Так же, как предложение 1.6.1, доказывается тот факт, что всякое счетномерное векторное пространство над К изоморфно /С00. Задача 5. Доказать, что поле R как векторное пространство над Q не является счетномерным. Задача 6. Доказать, что из всякого счетного порождающего множества векторного пространства можно выбрать базис (конечный или счетный). Задача 7. Доказать, что любое несчетное множество векторов в счет- номерном векторном пространстве линейно зависимо (и, следовательно, любой базис счетен). Задача 8. Доказать, что всякую (конечную или счетную) линейно неза- висимую систему векторов счетномерного векторного пространства можно дополнить до базиса.
68 Глава 2. Начала линейной алгебры Задача 9. Доказать, что всякое подпространство счетномерного век- торного пространства не более чем счетномерно (т. е. счетномерно или конечномерно). Привести пример счетномерного подпространства счет- номерного векторного пространства, не совпадающего со всем простран- ством. Задачи 6—9 представляют собой аналоги теорем 1—4 для счетномер- ных векторных пространств. Аналогичные утверждения могут быть доказа- ны и для несчетномерных пространств, но для этого требуется привлечение аппарата канторовской теории множеств (трансфинитной индукции или леммы Цорна). С другой стороны, такой чисто алгебраический подход име- ет ограниченную сферу применения. Обычно несчетномерное векторное пространство снабжается топологией, которая позволяет придавать смысл бесконечным суммам векторов. § 3. Ранг матрицы На основе понятия размерности векторного пространства вво- дятся понятия ранга системы векторов и ранга матрицы. Определение 1. Рангом системы векторов называется размер- ность ее линейной оболочки. Рангом матрицы называется ранг си- стемы ее строк. Ранг матрицы А обозначается через rk А. Системы векторов {аь а2,...»ап} и {Ьь Ь2,..., Ьт} называются эк- вивалентными, если каждый из векторов Ь; линейно выражается через а2, -^,ап и, наоборот, каждый из векторов а, линейно выра- жается через blf b2,..., Ьт. Это, очевидно, равносильно совпадению линейных оболочек: (a1,a2,...,an) = (b1,b2,...,bm). Поэтому ранги эквивалентных систем векторов равны. Из определения элементарных преобразований следует, что стро- ки матрицы А', полученной из матрицы А каким-либо элементар- ным преобразованием, линейно выражаются через строки матри- цы А. Но так как матрица А может быть получена из А' обратным элементарным преобразованием, то и, наоборот, ее строки линей- но выражаются через строки матрицы А'. Таким образом, системы строк матриц А и А' эквивалентны и, следовательно, ранги этих матриц равны. Этим можно воспользоваться для вычисления ранга матрицы.
§ 3. Ранг матрицы 69 Предложение 1. Ранг матрицы равен числу ненулевых строк лю- бой ступенчатой матрицы, к которой она приводится элементар- ными преобразованиями строк. Доказательство. Так как ранг матрицы не меняется при эле- ментарных преобразованиях, то нам достаточно доказать, что ранг ступенчатой матрицы равен числу ее ненулевых строк. Для этого, в свою очередь, достаточно доказать, что ненулевые строки ступен- чатой матрицы линейно независимы. Предположим, что линейная комбинация ненулевых строк сту- пенчатой матрицы (2) с коэффициентами А1э А2,...» Аг равна нулю. Рассматривая )гю координату этой линейной комбинации, нахо- дим, что =0, откуда Aj =0. Рассматривая, далее, )2-ю коор- динату с учетом того, что Aj = 0, находим, что А2а2;-2 = 0, откуда А2 = 0. Продолжая так дальше, получаем, что все коэффициенты Аь А2,..., Аг равны нулю, что и требовалось доказать. □ В частности, какую бы последовательность элементарных пре- образований, приводящих заданную матрицу к ступенчатому виду, мы ни выбрали, число ненулевых строк полученной ступенчатой матрицы будет одним и тем же. С учетом предложения 1 результаты, полученные в § 1 при ана- лизе ступенчатых систем линейных уравнений, приводят к следую- щим теоремам. Теорема 1 (теорема Кронекера—Капелли). Система линейных уравнений совместна тогда и только тогда, когда ранг матрицы ее коэффициентов равен рангу расширенной матрицы. Теорема 2. Совместная система линейных уравнений является определенной тогда и только тогда, когда ранг матрицы ее коэф- фициентов равен числу неизвестных. Следующая теорема является ответом на вопрос о «степени неопределенности» системы линейных уравнений, поставленный в §1. Теорема 3. Размерность пространства решений системы одно- родных линейных уравнений с п неизвестными и матрицей коэффи- циентов А равна п — rk А. Доказательство. Рассмотрим систему уравнений (4). С помо- щью элементарных преобразований приведем ее к ступенчатому виду. В силу предложения 1 число ненулевых уравнений в этом сту- пенчатом виде будет равно r = rkA. Поэтому общее решение будет содержать г главных неизвестных и с точностью до перенумерации
70 Глава 2. Начала линейной алгебры неизвестных будет иметь вид (ср. (3)) Г *1 = СП*г+1 + С12*г+2 + • • • + с1,п-гХп, • »2 = с21хг„ + С2Л+2 + ...+С2.._а, I CriXr+i 4" СГ2-^г+2 4“... 4* cr>n_rxn. Придавая по очереди одному из свободных неизвестных хг+1, хг^_2, значение 1, а остальным — значения 0, мы получим сле- дующие решения системы (4): Uj = (сц, с21,сг1,1, 0,0), и2 = (с12> с22> • • сг2> • • •> 0)> ип-г ~~ (с1,п-г> с2,п-г» •••> сг,л-г> 0, 0, 1). Докажем, что они составляют базис пространства решений, откуда и будет следовать утверждение теоремы. Для любых Аь А2,An_r G/С линейная комбинация u = AjUj 4-А2п2 4-... 4- An_run_r является решением системы (4), в котором свободные неизвестные имеют значения Ль А2,..., Ап_г. Так как значения главных неизвест- ных однозначно определяются значениями свободных неизвестных (по формулам (11)), то любое решение системы (4) является линей- ной комбинацией решений иъ u2iun_r- С другой стороны, если п = 0, то = А2 =... = Ап_г = 0; следовательно, ult u2iun_r линей- но независимы. □ Всякий базис пространства решений системы однородных линей- ных уравнений называется фундаментальной системой решений. Предыдущее доказательство дает практический способ построения такой системы решений. Ранг матрицы был нами определен как ранг системы ее строк. Посмотрим, что можно сказать о ранге системы столбцов. Для этого заметим, что линейная зависимость с коэффициентами Аь..., Ап между столбцами матрицы А означает, что (Аь ..., Ап) — это реше- ние системы однородных линейных уравнений с матрицей А. Эле-
§ 3. Ранг матрицы 71 ментарные преобразования строк матрицы А соответствуют элемен- тарным преобразованиям этой системы, при которых ее решения не меняются. Отсюда получаем Предложение 2. Линейные зависимости между столбцами мат- рицы не меняются при элементарных преобразованиях строк. Следствие. При элементарных преобразованиях строк матри- цы ранг системы ее столбцов не меняется. Доказательство. Линейная зависимость между какими-то столб- цами матрицы может пониматься как линейная зависимость между всеми ее столбцами, в которую остальные столбцы входят с нуле- выми коэффициентами. Следовательно, если какие-то столбцы мат- рицы линейно зависимы, то они останутся линейно зависимыми после любых элементарных преобразований строк. Так как элемен- тарные преобразования обратимы, то и наоборот: если какие-то столбцы матрицы линейно независимы, то они и останутся линейно независимыми. Значит, если какие-то столбцы матрицы составляют максимальную линейно независимую систему ее столбцов, то по- сле любых элементарных преобразований строк столбцы с теми же номерами будут составлять максимальную линейно независимую систему столбцов полученной матрицы, и поэтому ранг матрицы не изменится. □ Так как элементарными преобразованиями строк любую матри- цу можно привести к ступенчатому виду, то для нахождения ранга системы столбцов достаточно научиться это делать для ступенчатых матриц. Предложение 3. Ранг системы столбцов ступенчатой матри- цы равен числу ее ненулевых строк. Доказательство. Пусть А — ступенчатая матрица, число ненуле- вых строк которой равно г. Ясно, что при выкидывании нулевых строк линейные зависимости между столбцами сохраняются и, зна- чит, ранг системы столбцов не меняется. Поэтому можно считать, что у матрицы А нет нулевых строк, т. е. имеется всего г строк. Но тогда ранг системы ее столбцов не превосходит г (размерности пространства всех столбцов высоты г). Покажем, что столбцы, про- ходящие через ведущие элементы строк (углы ступенек), линейно независимы. Для этого рассмотрим систему однородных линейных уравнений с матрицей коэффициентов А. Наличие нетривиальной линейной зависимости между указанными выше столбцами означа- ло бы, что эта система имеет ненулевое решение, в котором все сво-
72 Глава 2. Начала линейной алгебры бодные неизвестные равны нулю, что невозможно. Следовательно, ранг матрицы А равен г. □ Так как ранг системы строк ступенчатой матрицы также равен числу ее ненулевых строк, то из доказанных предложений вытекает Теорема 4. Ранг системы строк любой матрицы равен рангу си- стемы ее столбцов. Иными словами, ранг матрицы не меняется при транспониро- вании. Проведенные рассуждения одновременно дают удобный способ нахождения максимальной линейно независимой системы столб- цов. А именно, если путем элементарных преобразований строк матрица А приведена к ступенчатому виду, в котором ведущие эле- менты ненулевых строк имеют номера jlf..., jr, то столбцы (исход- ной!) матрицы А с номерами составляют максимальную линейно независимую систему ее столбцов. Заметим, что эта про- цедура не дает способа найти максимальную линейно независимую систему строк матрицы А. Дело в том, что, хотя ранг системы строк при элементарных преобразованиях строк не меняется, линейные зависимости между строками (в отличие от столбцов) не сохраня- ются. Замечание 1. Элементарные преобразования столбцов матрицы определяются аналогично элементарным преобразованиям строк. Они равносильны умножению на элементарные матрицы справа. Из доказанного выше следует, что ранг матрицы не меняется и при элементарных преобразованиях столбцов. Теорема 5. Ранг произведения матриц не превосходит ранга каждого из множителей. Доказательство. Пусть А = (а,,), В = (bjfc) и АВ = С = (с^). Соглас- но определению умножения матриц cik = Zj aijbjk- j Рассматривая эти равенства при фиксированном i, мы видим, что i-я строка матрицы С есть линейная комбинация строк матрицы В с коэффициентами из i-й строки матрицы А. Следовательно, линей- ная оболочка строк матрицы С содержится в линейной оболочке строк матрицы В и, значит, rk С rk В. Аналогично, рассматривая те же равенства при фиксирован- ном к, мы видим, что к-й столбец матрицы С есть линейная ком-
§ 3. Ранг матрицы 73 бинация столбцов матрицы А с коэффициентами из к-го столбца матрицы В. Следовательно, линейная оболочка столбцов матрицы С содержится в линейной оболочке столбцов матрицы А и, значит, rkC^rkA. □ Задача 1. Доказать, что ранг суммы матриц не превосходит сум- мы их рангов. Привести пример, когда имеет место равенство. Рассмотрим отдельно случай квадратных матриц. Определение 2. Квадратная матрица А порядка п называется невырожденной, если гкА = п. Иными словами, матрица А невырожденна, если ее строки ли- нейно независимы, или, что эквивалентно, если ее столбцы линей- но независимы. Теорема 6. Квадратная система линейных уравнений определен- на (гл. е. имеет единственное решение) тогда и только тогда, когда ее матрица коэффициентов невырожденна. Доказательство. В самом деле, квадратная система линейных уравнений с матрицей коэффициентов А определенна тогда и толь- ко тогда, когда элементарными преобразованиями строк матрица А приводится к строго треугольному виду, т. е. когда rk А = п. □ Согласно общему определению обратного элемента в кольце с единицей (см. §1.3) матрицей, обратной матрице А, называется такая матрица А"1, что АА-1 = А-1А = Е. Если обратная матрица существует, то она единственна. Теорема 7. Квадратная матрица обратима тогда и только то- гда, когда она невырожденна. Доказательство. Из теоремы 5 следует, что произведение двух квадратных матриц может быть невырожденным, только если оба множителя невырожденны. Очевидно, что единичная матрица Е невырожденна. Поэтому всякая обратимая матрица невырожденна. Обратно, пусть матрица А невырожденна. Будем искать обрат- ную матрицу как решение матричного уравнения АХ = Е. Для эле- ментов к-го столбца матрицы X это дает систему линейных урав- нений с матрицей коэффициентов А и столбцом свободных членов, равным k-му столбцу матрицы Е. В силу невырожденности матри- цы А каждая из этих систем и, тем самым, исходное матричное уравнение имеет единственное решение. Обозначим решение этого матричного уравнения через В. Аналогично, рассмотрим матричное уравнение YA = E. Оно рав- носильно уравнению АТУТ = Е и потому также имеет единственное
74 Глава 2. Начала линейной алгебры решение (так как матрица Ат также невырожденна). Обозначим это решение через С. Пользуясь ассоциативностью умножения матриц, получаем В = (СА)В = С(АВ) = С. Таким образом, В = С — матрица, обратная матрице А. □ Доказательство этой теоремы дает и практический способ нахож- дения обратной матрицы. А именно, матрица, обратная невырож- денной матрице А порядка п, может быть найдена как решение мат- ричного уравнения АХ = Е, которое сводится к решению п систем линейных уравнений с общей матрицей коэффициентов А, столбцы свободных членов которых составляют матрицу Е. Эти системы мо- гут решаться одновременно методом Гаусса. После приведения мат- рицы коэффициентов к единичной матрице (что возможно в силу ее невырожденности) преобразованные столбцы свободных членов составят искомую матрицу А"1. Пример 1. Найдем матрицу, обратную к матрице Для этого проделаем следующие элементарные преобразования: 12 1 .3 5 0 0Л П 0 1J АО 1 -5 3 Таким образом, Замечание 2. На самом деле приведенное доказательство тео- ремы 7 доказывает следующее более сильное утверждение: если матрица А вырожденна, то ни одно из уравнений АХ = Е и YA = E не имеет решения, а если она невырожденна, то каждое из этих уравнений имеет единственное решение и эти решения совпадают. (Априори можно было бы допустить возможность, что одно из этих уравнений имеет решение, а другое не имеет.) § 4. Определители Вопрос о невырожденности квадратной матрицы или, что рав- носильно, о линейной независимости п векторов п-мерного прост- ранства в каждом конкретном случае можно решить приведением
§ 4. Определители 75 матрицы к ступенчатому виду элементарными преобразованиями строк. Однако представляет интерес нахождение общего условия, которому должны удовлетворять элементы матрицы для того, чтобы она была невырожденной. Поясним идею получения такого условия на примере геометрических векторов. Пусть I — ориентированная прямая на плоскости. Для всякого вектора а обозначим через /(а) его проекцию на I (взятую с со- ответствующим знаком). Из определения операций над векторами следует, что f(a + b) =f(a) + /(b) для любых векторов а, Ь, /(Ла) = Л/(а) для любого вектора а и любого числа Л. Всякая функция векторного аргумента, обладающая этими свой- ствами, называется линейной. Пара неколлинеарных векторов аь а2 GE2 называется ориенти- рованной положительно, если поворот от ai к а2 (на угол, мень- ший я) происходит в положительном направлении. Для любых векторов аь а2 обозначим через агеа(аъ а2) ориентированную пло- щадь параллелограмма, натянутого на эти векторы, т. е. площадь, взятую со знаком плюс, если пара {аъа2} ориентирована положи- тельно, и со знаком минус в противном случае; если векторы а} и а2 коллинеарны, то положим агеа(аъ а2) = 0. Величина [area^, а2)| может служить мерой линейной независимости векторов ах и а2. Функция агеа(аъ а2) векторных аргументов а2 и а2 обладает сле- дующими свойствами: 1) она линейна по aj и по а2; 2) агеа(а2, ат) = — агеа(а1эа2); 3) если {ег,е2} — положительно ориентированный ортонорми- рованный базис, то area^, е2) = 1. Последние два свойства очевидны. Для доказательства первого представим площадь параллелограмма как произведение основа- ния на высоту. Мы получим тогда area(a1,a2) = |a1|h2, где |aj—длина вектора ab a h2 — проек- ция вектора а2 на прямую, ортогональную аг (рис. 1). В силу сказанного выше h2 есть ли- нейная функция от а2. Отсюда следует линей- Рис. 1
76 Глава 2. Начала линейной алгебры ность агеа(аъа2) по а2- Аналогично, взяв за основание а2, можно доказать линейность по аР Свойств 1)—3) достаточно для вычисления агеаСа^ а2). Выразим векторы а1э а2 через положительно ориентированный ортонормиро- ванный базис {еь е2}: а1 =а11е1 + а12е2> а2 = а21е1 + а22е2- Тогда агеа(аь а2) = агеаСацв! + а12е2, а21ет + а22е2) = = ana2i агеа(еъ ej + апа22 агеа(ег, е2) + а12а21 area(e2, ej + + ai2a22 агеа(е2, е2) = Пц^22 — а 12а21 • Выражение апа22 - а12а21 называется определителем матрицы А = (ау) порядка 2. Из предыдущего следует, что векторы аг и а2 линейно независимы тогда и только тогда, когда определитель мат- рицы, составленной из их координат, отличен от нуля. Аналогичным образом можно доказать, что ориентированный объем volfaj, а2, а3) параллелепипеда, натянутого на векторы а2, а3, обладает следующими свойствами: 1) он линеен по каждому из трех аргументов а2, а3; 2) он меняет знак при перестановке любых двух аргументов; 3) если {ebe2,e3} — положительно ориентированный ортонор- мированный базис, то vol(eb е2, е3) = 1. (Тройка {а^а^ а3} считается ориентированной положительно, если поворот от к а2 со стороны а3 происходит в положительном направлении.) Пользуясь этими свойствами, можно получить следующее выра- жение для volCaj, a2i а3) через координаты векторов а1э а2> аз в поло- жительно ориентированном ортонормированном базисе (проделай- те это!): VoKflj, а2, а3) = ПцП22аЗЗ + а12а23а31 + а13а21а32 ~ ~ аиа23а32 ~ а13а22а31 — а12а21а33- Выражение, стоящее в правой части этого равенства, называется определителем матрицы А = (а^) порядка 3. Таким образом, векто- ры а2, а3 линейно независимы тогда и только тогда, когда опре- делитель матрицы, составленной из их координат, отличен от нуля.
§4. Определители 77 Определитель матрицы А = (а^) порядка 3 представляет собой алгебраическую сумму всевозможных произведений трех элемен- тов матрицы, взятых по одному из каждой строки и из каждого столбца. На рис. 2 схематически изображено, какие из этих произ- ведений берутся со знаком плюс и какие — со знаком минус. Определитель матрицы А обозначается либо через det А, либо путем замены круглых скобок, заключающих в себе матрицу, вер- тикальными чертами. Пример 1. cos a -sin а sin a cos а = cos2 a + sin2 a = 1. Пример 2. 12 3 4 5 6 7 8 9 = 1 • 5 • 9 + 2 • 6-7 + 3-4-8 — 3 • 5 • 7 —2 • 4-9 — 1 • 6 • 8 = = 45 4-84 + 96-105-72-48 = 0. В случае произвольной размерности и произвольного поля, ко- гда мы не располагаем такими понятиями, как площадь или объем, естественно попытаться ввести определитель как функцию, облада- ющую свойствами, аналогичными свойствам 1)—3). Дадим необхо- димые для этого определения. Пусть V — векторное пространство над произвольным полем К и /(аь а2,..., am) — функция от т векторов пространства V, прини- мающая значения в К, Определение 1. Функция а2,...»am) называется полилиней- ной (или, точнее, т-линейной}, если она линейна по каждому аргу- менту.
78 Глава 2. Начала линейной алгебры Например, линейность по первому аргументу означает, что Ж +<> «2. •••. ат) = ж> а2> •••> а.п) +/(<> а2> •••> ат)> f(Xalt а2,.... am) = Xf(a1, а2,ат). Определение 2. Полилинейная функция а2)..., ат} назы- вается кососимметрической, если при перестановке любых двух аргументов она умножается на — 1. Важное свойство кососимметрической полилинейной функции состоит в том, что, если только char К / 2, она обращается в нуль всякий раз, когда какие-либо два аргумента принимают одинако- вые значения. В самом деле, при перестановке этих двух аргументов значение функции не изменится, но, с другой стороны, оно должно умножиться на -1; следовательно, оно равно нулю. Замечание 1. Если char К = 2, то последнее свойство следует принять за определение кососимметричности. Докажем, что из него, наоборот, вы- текает кососимметричность в определенном выше смысле. Поскольку при проверке кососимметричности по каким-либо двум аргументам значения остальных аргументов следует считать фиксированными (хотя и любыми), достаточно рассмотреть случай билинейной (т. е. 2-линейной) функции. Пусть f — билинейная функция, обращающаяся в нуль при одинаковых значениях аргументов. Тогда для любых a, b е V имеем 0 = /(а + Ь, а4-Ь) =/(а, а) + /(а, b) + f(b, a) + f(b, b)=f(a, b) + f(b, а), откуда /(b, а) = -/(а, b). Теперь введем понятия, необходимые для описания явного ана- литического выражения определителя матрицы порядка п, подобно- го тем, которые были получены при п = 2 и 3. Последовательность (kb к2> •••Ли) чисел 1, 2,..., п, расположен- ных в каком-либо порядке, называется перестановкой из п элемен- тов. Так как кг может принимать п различных значений, к2 при за- данном кх может принимать п - 1 значений, к3 при заданных кг и к2 может принимать п - 2 значений и т. д., то имеется всего п(п — 1)(п — 2) •• 2 • 1 = п! перестановок из п элементов. Перестановка (1, 2,..., п) называется тривиальной. Замечание 2. Слово «перестановка» в математической литера- туре (в частности, в этой книге) иногда употребляется в общечело-
§ 4. Определители 79 веческом смысле как изменение порядка каких-либо объектов (на- пример, перестановка слов в предложении). Говорят, что пара чисел образует инверсию в заданной переста- новке, если большее из них стоит левее меньшего. Перестановка на- зывается четной (соответственно нечетной), если число инверсий в ней четно (соответственного нечетно). Наряду с этим определя- ется знак перестановки, равный 1, если перестановка четна, и — 1, если она нечетна. Знак перестановки (kb к2,кп) обозначается через sgn(kbk2, ...,kn). Пример 3. При п = 3 четные перестановки — это (1, 2, 3) (нет инверсий), (2, 3,1) (две инверсии) и (3,1, 2) (две инверсии), нечет- ные— (1, 3, 2) (1 инверсия), (3,2,1) (3 инверсии) и (2,1, 3) (1 ин- версия). Пример 4. Тривиальная перестановка не имеет инверсий и по- этому четна. Напротив, в перестановке (п, п — 1,..., 2,1) любая пара чисел образует инверсию. Поэтому число инверсий в этой переста- новке равно (mod 2), Следовательно, sgnfri, п -1,2,1) = = (-1)[п/21. Перемена местами двух элементов в перестановке называется транспозицией этих элементов. Предложение 1. При любой транспозиции четность переста- новки меняется. Доказательство. При транспозиции соседних элементов меня- ется взаимное расположение только этих элементов, так что число инверсий изменяется (увеличивается или уменьшается) на 1; сле- довательно, четность меняется. Транспозиция элементов i и ;, раз- деленных s другими элементами, может быть осуществлена путем 2$ + 1 последовательных транспозиций соседних элементов: снача- ла переставляем i со всеми промежуточными элементами и с j, за- тем переставляем j со всеми промежуточными элементами. Каж- дый раз знак перестановки будет меняться по доказанному выше. Так как это произойдет нечетное число раз, то в результате знак перестановки изменится на противоположный. □ Следствие. При п > 1 число четных перестановок из п элемен- тов равно числу нечетных.
80 Глава 2. Начала линейной алгебры Доказательство. Выпишем все четные перестановки и в каждой из них произведем транспозицию первых двух элементов. Тогда мы получим, причем по одному разу, все нечетные перестановки. □ Теперь мы в состоянии дать определение определителя квадрат- ной матрицы любого порядка. Определение 3. Определителем квадратной матрицы А = (а0) порядка п называется число detA= 2 sgn(kbk2, ...,кП)а1ка2к2...апкп. (12) (к„к2.к„) При п = 2 и 3 мы получаем выражения, приведенные в начале этого параграфа. Теорема 1. 1) Определитель является кососимметрической по- лилинейной функцией строк матрицы. 2) Всякая функция f на множестве квадратных матриц по- рядка п, являющаяся кососимметрической полилинейной функцией строк матрицы, имеет вид f(A.') = f(E') det А. В частности, если f(E) = 1, то f = det (гп. е. /(А) = det А для любой матрицы А). Доказательство. Будем обозначать через а1)а2)...,ап строки матрицы А. Если f — какая-либо функция на множестве матриц, то, рассматривая ее как функцию строк матрицы, будем писать /(А) =/(аъ а2>ап). 1) Линейность определителя по каждой из строк матрицы выте- кает из того, что для любого i его можно представить в виде detA = 2ayUj> j где и19 и2, ••>,ип не зависят от элементов i-й строки матрицы. Для проверки кососимметричности посмотрим, что происходит при перестановке i-й и ;-й строк матрицы. Разобьем множество всех перестановок на пары перестановок, получаемых друг из дру- га транспозицией к, и к;. Согласно предложению 1, произведения aik}a2k2---ankn> соответствующие перестановкам из одной такой па- ры, входят в выражение (12) с противоположными знаками. При перестановке i-й и j-й строк они меняются ролями и, следовательно, все выражение умножается на -1.
§ 4. Определители 81 Замечание 3. Если char К = 2, то кососимметричность следует пони- мать в смысле замечания 1. Ее доказательство в этом случае состоит в том, что в случае равенства i-й и j-й строк матрицы А члены выражения (12), соответствующие перестановкам каждой из описанных выше пар, взаимно уничтожаются. 2) Предположим, что f — полилинейная кососимметрическая функция строк матрицы. Пусть е1,е2, ...,еп — единичные строки. Тогда /(А)=/(аъа2, ...,an)=/(Eaik/kI,Ea2k2ek2, •••> Е ank/kn) = Ч к2 к„ 7 = Е а1к}а2к2'"апкц/(ек}> ек2> •••> ki,k2, ...,к„ В силу кососимметричности функции /, если какие-то два из чи- сел къ к2, ...Ли равны, то f(ek}f ек2>..., eki) = 0. Если все они различ- ны, то Ж,’ •••> ekn) = sgn(k1) к2,.... kn)/(eb .... en). В самом деле, если это равенство верно для какой-то перестанов- ки (кь к2,..., kn), то оно верно и для любой перестановки, получа- емой из нее транспозицией, так как при транспозиции обе части равенства умножаются на -1. Очевидно, что оно верно для три- виальной перестановки. Так как любую перестановку можно полу- чить из тривиальной последовательными транспозициями, то дока- зываемое равенство верно для любой перестановки. Учитывая, что /(еь е2,..., en) =f (Е), мы получаем доказываемое утверждение. □ При п 4 вычисление определителя непосредственно по фор- муле (12) в общем случае весьма затруднительно. Существуют зна- чительно более простые способы вычисления определителей. Они основаны на свойствах определителей, доказываемых ниже. Предложение 2. Определитель матрицы не изменяется при эле- ментарном преобразовании строк первого типа. Доказательство. Пусть, скажем, к 1-й строке матрицы А прибав- ляется 2-я строка, умноженная на с. Полученную матрицу обозна- чим через А'. Имеем (в обозначениях доказательства теоремы 1): det А' = det(a} 4- са2> а2,..., ап) = = det(a1,a2,..., ап) +cdet(a2, а2,..., ап) = det А. □
82 Глава 2. Начала линейной алгебры При перестановке двух стррк определитель, как мы знаем, умно- жается на -1, а при умножении какой-либо строки на число он умножается на это число. Таким образом мы можем проследить за изменением определителя при любых элементарных преобразова- ниях строк матрицы. Так как любую матрицу с помощью элемен- тарных преобразований строк можно привести к ступенчатому ви- ду, а всякая ступенчатая квадратная матрица является треугольной (но, может быть, не строго треугольной), то нам остается научиться вычислять определитель треугольной матрицы. Предложение 3. Определитель треугольной матрицы равен произведению ее диагональных элементов. Доказательство. Произведение диагональных элементов вхо- дит в выражение (12) определителя любой матрицы со знаком плюс, так как соответствует тривиальной перестановке. В случае треугольной матрицы все остальные члены этого выражения равны нулю. В самом деле, если /°, то kj^l, k2^2, ..., kn^n; но так как kj + k2 “Ь • • • “Ь = 1 + 2 4-... + п, то это возможно только при k2 = 1, k2 = 2, ..., кп = п. □ Помимо того, что они дают практический способ вычисления определителей, предложения 2 и 3 позволяют нам ответить на во- прос, ради которого мы и ввели понятие определителя. Теорема 2. Квадратная матрица А невырожденна тогда и толь- ко тогда, когда det А 0 0. Доказательство. С помощью элементарных преобразований строк приведем матрицу А к ступенчатому виду. Если при этом ис- пользовались элементарные преобразования второго или третьего типов, то определитель может измениться, но, во всяком случае, его равенство нулю или отличие от нуля сохранится. Матрица А невырожденна тогда и только тогда, когда полученная ступенчатая матрица является строго треугольной; но это равносильно тому, что ее определитель отличен от нуля. □ Продолжим изучение свойств определителей.
§ 4. Определители 83 Лемма 1. Пусть и О’ь•••> Jn) — произвольные пе- рестановки. Произведение ai}j}ai2j2---ainjn входит в выражение (12) определителя матрицы А со знаком sgn(i1? i2,in) sgnCjj, j2, jn\ Доказательство. Для того чтобы выяснить, с каким знаком вхо- дит в det А рассматриваемое произведение, нужно расположить его сомножители по порядку номеров строк. Этого можно достичь, по- следовательно меняя местами два сомножителя. При каждой такой перемене в перестановках, образуемых номерами строк и столбцов, одновременно происходят транспозиции, так что произведение их знаков не меняется. Таким образом, если полученное в результате произведение будет иметь вид &1к а^ ...апк > то sgn(k1; k2,.... kn) = sgn(i1, i2,.... in) sgnOb j2,jn), а это и означает, что рассматриваемое произведение входит в det А с указанным знаком. □ Теорема 3. det Ат = det А. Доказательство. Определитель матрицы Ат, как и определи- тель матрицы А, есть алгебраическая сумма всевозможных произве- дений п элементов матрицы А, взятых по одному из каждой строки и из каждого столбца. Единственное, за чем надо проследить, — это то, что одинаковые произведения входят в det А и det Ат с одинако- выми знаками. При переходе от матрицы А к матрице Ат у каждого элемента номера строки и столбца меняются местами, и, соот- ветственно, у каждого произведения, входящего в определитель, меняются местами перестановки, составленные из номеров строк и столбцов. Предыдущая лемма показывает, что при этом знак, с которым входит данный член в определитель, не меняется. □ Из этой теоремы следует, что всякое свойство определителей остается справедливым, если заменить в нем строки столбцами, а столбцы — строками. В частности, мы таким образом получаем Следствие. Определитель есть кососимметрическая полилиней- ная функция столбцов матрицы. Теорема 4 (об определителе матрицы с углом нулей). Пусть матрица А имеет вид Мо ?) где В и С — квадратные матрицы. Тогда det А = det В-det С.
84 Глава 2. Начала линейной алгебры Доказательство. При фиксированных В и D определитель мат- рицы А является кососимметрической полилинейной функцией ее последних строк и, тем самым, кососимметрической полилинейной функцией строк матрицы С. Согласно теореме 1, получаем отсюда det А = det • det С. Первый множитель, в свою очередь, при фиксированной матрице D является кососимметрической полилинейной функцией столбцов матрицы В, откуда det (о е) det (о е) ‘ det 5 — det В (поскольку матрица I Q Е 1 треугольная с единицами на диагона- ли). Ввиду теоремы 3 аналогичная формула верна и для матриц с пра- вым верхним углом нулей. Пример 5. Вычислим так называемый определитель Вандер- монда 1 Xi *1 ... х" 1 1 Х2 X2 ••• Х2~1 V(xlfx2, ...,хп) = Вычитая из каждого столбца, начиная с последнего, предыдущий столбец, умноженный на хь и применяя теорему 4, получаем У(хъх2> ...,хп) = 10 0 ... 0 1 х2—х1 х2(х2-х!) ... х2"2(х2-х1) 1 Хп-Хг хДХи-Xj) ... х" 2(хп-х}) = (х2 — х1)...(хп — x1)V(x2, ...,хп). Продолжая так дальше, в конце концов получаем VCq, х2,..хп) = П (х, ~Xj). (13) Пусть А — произвольная (не обязательно квадратная) матрица. Всякая матрица, составленная из элементов матрицы А, находящих- ся на пересечении каких-то выбранных строк и каких-то выбранных
§ 4. Определители 85 столбцов, называется подматрицей матрицы А. Подчеркнем, что выбираемые строки и столбцы не обязаны идти подряд. Определитель квадратной подматрицы порядка к называется ми- нором порядка к матрицы А. Иногда, допуская вольность речи, са- му квадратную подматрицу также называют минором. В частности, если А — квадратная матрица порядка п, то минор порядка п - 1, получаемый вычеркиванием i-й строки и j-ro столбца, называется дополнительным минором элемента и обозначается через Число Ay = (-l)i+>M17 называется алгебраическим дополнением элемента а1Г Смысл алгеб- раического дополнения ясен из следующей леммы. Лемма 2. an .. av ... a m 0 .. .. a0 ... 0 ani .. anj ... &nn (В левой части стоит определитель матрицы, полученной из матри- цы А = (atJ) заменой нулями всех элементов i-й строки, кроме а,;.) Доказательство. Поменяем местами i-ю строку со всеми преды- дущими строками и j-й столбец со всеми предыдущими столбцами. При этом мы будем i - 1 раз менять местами строки и j — 1 раз столбцы, так что определитель умножится на В результате получится определитель вида atj 0 . .. 0 au an . •• a in anj • • ^nn где в правом нижнем углу стоит дополнительный минор элемен- та а,;. По теореме об определителе матрицы с углом нулей этот определитель равен а^М^. С учетом предыдущего знака отсюда и по- лучается доказываемое равенство. □ Теорема 5. Для любой квадратной матрицы А det А S вцАц* j i
86 Глава 2. Начала линейной алгебры Первая из этих формул называется формулой разложения опреде- лителя по i-й строке, вторая — формулой разложения определителя по j-му столбцу. Доказательство. Так как каждый член выражения (12) для det А содержит ровно один элемент из i-й строки, то предыдущая лемма означает, что сумма тех членов, которые содержат а[;, равна а^А^. Отсюда вытекает формула разложения по строке. Аналогично дока- зывается формула разложения по столбцу. □ Замечание 4. Знаки (~l)l4j чередуются в матрице в шахматном порядке, причем на главной диагонали стоят плюсы. Пример 6. Вычисление определителя Д из примера 2 разложе- нием по 2-й строке дает 1 3 7 9 2 3 Д = -4 8 * +5 -6 = -4-(-6) + 5-(-12)-6-(-6) = 0. Пример 7. Вычислим определитель порядка п вида 2 1 0 ... 0 0 1 2 1 ... 0 0 Л 0 1 2 ... 0 0 Дп = О 0 0 ... 2 1 О 0 0 ... 1 2 Разлагая его по 1-й строке и затем второй из полученных определи- телей по 1-му столбцу, получаем 1 1 ... 0 0 0 2 ... 0 0 ДП = 2ДП_1 — ~2ДП_1 — Дп_2, 0 0 ... 2 1 0 0 ... 1 2 откуда Дп- " Дп-1 = Ап-1 - " ^п-2- Это означает, что последовательность (Дь Д2, Дз> •••) есть арифме- тическая прогрессия. Так как Дх = 2, Д2 = 3, то ее разность равна 1 и Дп = п + 1. Теорема 6. Для любых квадратных матриц А и В (одного по- рядка) det АВ = det А • det В.
§ 4. Определители 87 Доказательство. Легко видеть, что строки сь ..., сп матрицы АВ получаются из строк аь ..., ап матрицы А умножением на В: (i = l, ...,п). Отсюда следует, что при фиксированной матрице В определитель det АВ есть кососимметрическая полилинейная функция строк мат- рицы А. В самом деле, пусть, например, = а* + а", где а',а" — какие-то строки; тогда detfajB, а2В,..., апВ) =det((a' +а")В, а2В,..., апВ) = = det(a'B4-а"В, а2В,..., апВ) = = det(a'B, а2В,..., апВ) + det(a/1/B, а2В,..., апВ). Остальные свойства проверяются анало- гично. После этого, применяя следствие теоремы 1, получаем: det АВ = det ЕВ • det А = det А • det В. □ Пример 8. Выразим неориентирован- ный объем V параллелепипеда, натянуто- го на векторы аь а2, а3 GB3, через длины laiL la2b 1аз1 его ребер и плоские углы (см. рис. 3) Рис. 3 а1“а2а3> а2~ аЗа1» а3 —а1а2- Пусть А = (а,;) — матрица, составленная из координат векторов а, в ортонормированном базисе. Мы знаем (см. начало параграфа), что V = ± det А. Поэтому V2 = (det А)2 = det А • det Ат = det ААТ. Из правила умножения матриц следует, что (i, ;)-й элемент матри- цы ААТ есть скалярное произведение (аь ар = |aj|a;-| cos
88 Глава 2. Начала линейной алгебры Таким образом, V2 = |oj2 |a2||a]|cos a3 |а3||аа| cosa2 |a1||a2| cos a3 laj^l c°s «2 |a2l2 |a2||a3|cosa1 |a3||a2| cos O] |a3|2 = |a1|2|a2|2|a3|2 1 cos a3 cos a3 1 cos a2 cos a! cos a2 cos a] 1 и, значит, V = | a г I |a211 a 31 y/14- 2 cos cos a2 cos a3 — cos2 сц — cos2 a2 — cos2 a3. Задача 1. Угловым минором порядка к квадратной матрицы А называется определитель подматрицы порядка к, расположенной в левом верхнем углу матрицы А. Доказать, что если все угловые миноры матрицы А отличны от нуля, то ее можно привести к тре- угольному виду, добавив к каждой строке линейную комбинацию предыдущих строк. Вывести отсюда, что матрица А единственным образом представляется в виде А = UB, где U — нижняя треугольная матрица с единицами на диагонали, а В — верхняя треугольная мат- рица. § 5. Некоторые приложения определителей Как мы видели в предыдущем параграфе (теорема 4.2), опреде- лители дают ответ на вопрос о невырожденности (и, тем самым, об обратимости) квадратной матрицы, который служил нам поводом для их введения. Вариации на эту тему приводят к многочислен- ным приложениям определителей в теории линейных уравнений и теории матриц. Первые из таких приложений будут рассмотрены в этом параграфе. Рассмотрим квадратную систему линейных уравнений a 11 *1 + 012*2 + • • • + 01n*n = Ь1, 021*1 +022*2 + + ^2пХп=Ь2, (14) ani*i + an2*2 + • • • + ann*n = bn.
§ 5. Некоторые приложения определителей 89 Обозначим через А ее матрицу коэффициентов и через А( (i = 1, 2,... ..., п) матрицу, полученную из А заменой ее i-го столбца столбцом свободных членов. Теорема 1. Если det А / 0, то система (14) имеет единственное решение, которое может быть найдено по формулам Эти формулы называются формулами Крамера. Доказательство. При любом элементарном преобразовании си- стемы (14) в матрицах А и A, (i = 1, 2,..., п) одновременно происхо- дит соответствующее элементарное преобразование строк и, следо- вательно, отношения, стоящие в правых частях формул Крамера, не изменяются. С помощью элементарных преобразований строк мат- рицу А можно привести к единичной матрице. Поэтому достаточно доказать теорему в том случае, когда А = Е. Если А = Е, то система имеет вид ГХ1 =ЬЪ х2 =Ь2, < I *л ^л • Она, очевидно, имеет единственное решение х, = b, (i = 1, 2,..., и). С другой стороны, det A = detE = l, det А, = 1 0 ... bl ... 0 0 0 1 ... ь2 ... 0 0 0 0 ... Ь, ... 0 0 0 0 ... ь„-> ... 1 0 0 0 ... Ь„ ... 0 1 = b, так что формулы Крамера в этом случае действительно верны. □ Если det А = 0, то ступенчатый вид матрицы А не будет строго треугольным и, следовательно, система (14) либо несовместна, либо неопределенна. Опасно в этом случае пытаться как-то трактовать формулы Крамера. Они просто не применимы (ведь они доказыва- лись в предположении, что detA/O), и надо действовать как-то иначе.
90 Глава 2. Начала линейной алгебры Задача 1. Доказать, что если det А = 0, но det А,- / 0 для како- го-либо I, то система (14) несовместна. Задача 2. Показать, что если det А = det А! =... = det Ап = 0, то система (14) может быть как несовместной, так и неопределен- ной. (Привести примеры, показывающие, что обе возможности реа- лизуются.) Отметим, что формулы Крамера — это далеко не лучший способ для практического решения систем линейных уравнений, за исклю- чением, быть может, случая п = 2. Они имеют в основном теорети- ческое значение. В частности, они позволяют получить следующие явные формулы для элементов обратной матрицы. Теорема 2. Пусть А = (ai;) — невырожденная квадратная мат- рица. Тогда f Ац А21 ••• д-1 = 1 ^12 ^22 ••• Л12 det А .............. \Ain А2п • •• AnnJ (Через Ау обозначается алгебраическое дополнение к элементу см. §4.) Доказательство. Матрица А"1 является решением матричного уравнения АХ = Е. (15) Это уравнение рассыпается на п уравнений относительно столбцов Xlt Х2,Хп матрицы X: AXj=Ej, где Ej — j-й столбец матрицы Е. В координатной записи уравнение (15) представляет собой систе- му п линейных уравнений относительно элементов х1;, x2j, столбца Xj. Матрицей коэффициентов этой системы служит мат- рица А, а столбцом свободных членов — столбец Ej. По формулам Крамера all • .. 0 .. _ 1 X‘i det А a)l • .. 1 .. fl/П • .. 0 .. • ^nn = Aji det А J что и требовалось доказать. □
§ 5. Некоторые приложения определителей 91 Пример 1. Для невырожденной матрицы порядка 2 получаем Л-=-Лг( " Л ad-bc\-c а) Эту простую формулу имеет смысл запомнить. Задача 3. Пусть А — невырожденная целочисленная (т. е. состо- ящая из целых чисел) квадратная матрица. Доказать, что матрица А-1 является целочисленной тогда и только тогда, когда det А = ±1. Наконец, нахождение ранга любой матрицы также может быть сведено к вычислению определителей. Теорема 3 (о ранге матрицы). Ранг матрицы равен наибольше- му порядку ее миноров, отличных от нуля. Доказательство. Пусть ранг матрицы А равен г, и пусть s>r. Тогда любые s строк матрицы А линейно зависимы и, тем более, ли- нейно зависимы строки любой квадратной подматрицы порядка $, представляющие собой части соответствующих строк матрицы А. Следовательно, любой минор порядка s равен нулю. Далее, рассмот- рим подматрицу, образованную какими-либо г линейно независи- мыми строками матрицы А. Ее ранг, очевидно, также равен г и, значит, среди ее столбцов найдется г линейно независимых. Минор порядка г, образованный этими столбцами, не равен нулю. □ Задача 4. Доказать теорему о ранге матрицы в следующей бо- лее сильной форме: если в матрице А имеется минор порядка г, отличный от нуля, а все миноры порядка г +1, получаемые припи- сыванием к нему одной строки и одного столбца (так называемые окаймляющие миноры), равны нулю, то rkA = r. Задача 5. Доказать, что в матрице ранга г любой минор поряд- ка г, образуемый пересечением г линейно независимых строк с г ли- нейно независимыми столбцами, отличен от нуля.
Глава 3 Начала алгебры многочленов § 1. Построение и основные свойства алгебры многочленов Функция вещественной переменной х называется многочленом, если она может быть представлена в виде /(х) = а0 + Qi* + а2х2 4-... 4- апхп, где а0, alfa2,...»ап — какие-то вещественные числа (некоторые из них или даже все могут равняться нулю). Можно доказать, и мы это сделаем ниже в более общей ситуации, что такое представление единственно с точностью до приписывания членов с нулевыми ко- эффициентами, т. е. если aQ + a1x + a2x2 + ... + anxn = bQ + b1x + b2x2 + ...+bnxn VxgR, то ak = bk прик = 0,1,2, ...,п. Очевидно, что сумма и произведение многочленов, а также про- изведение многочлена на любое число, также являются многочле- нами. Это означает, что многочлены образуют подалгебру в алгеб- ре всех функций вещественной переменной (см. пример 1.7.3). Эта подалгебра называется алгеброй многочленов над R и обозначается Щх]. Из предыдущего следует, что многочлены 1, х, х2,... образуют базис алгебры R[x]. Таблица умножения для этого базиса выглядит весьма просто: xkxl = xk+l. Если попытаться аналогичным образом трактовать многочлены над любым полем К, то возникает трудность, состоящая в том, что формально различные многочлены могут быть тождественно равны при всех значениях переменной. Например, многочлены х и х2 над полем Z2 оба принимают значение 0 при х = 0 и 1 при х = 1. В то же время хотелось бы рассматривать их как разные многочлены.
§ 1. Построение и основные свойства алгебры многочленов 93 Выход состоит в формальном определении, при котором многочлен фактически отождествляется с последовательностью его коэффици- ентов. Рассмотрим векторное пространство К00 финитных последова- тельностей элементов поля К (см. пример 2.2.9). Условимся ну- меровать члены последовательностей, начиная с нуля, и пусть ек (к = 0,1, 2,...) обозначает последовательность, к-й член которой равен 1, а все остальные члены равны 0. Последовательности е0, еь е2> ••• образуют базис пространства К00. Превратим пространство №° в алгебру, определив умножение базисных векторов по правилу еке1~ек+1- Из коммутативности и ассоциативности сложения целых чисел сле- дует, что умножение базисных векторов, а значит, и любых элемен- тов полученной алгебры, коммутативно и ассоциативно. Элемент е0 является ее единицей. Эта алгебра называется алгеброй многочле- нов над К и обозначается К[х] (вместо х может использоваться любая другая буква). Для того чтобы перейти к привычному представлению многочле- нов, условимся, во-первых, отождествлять элементы вида ае0 (а е К) алгебры К [х] с соответствующими элементами поля К и, во-вторых, элемент ех обозначим через х (здесь проявляется роль выбранной буквы х). Тогда в соответствии с определением операций в К[х] мы получаем, что ек —хк и (а0, а2,ап, 0,...) = аоео + <№ + <¥2 + ••• + anen = = а0 + ajx + а2х2 +... + а„хп. Числа a0,alfa2,... называются коэффициентами многочлена. Последний из ненулевых коэффициентов называется старшим ко- эффициентом, а его номер — степенью многочлена. Степень много- члена f обозначается через deg/. Степень нулевого многочлена не определена, однако иногда удобно считать, что она равна — оо. Легко видеть, что deg(/ + g) max{deg /, deg g}, deg/g = deg/ + degg. (1) (2)
94 Глава 3. Начала алгебры многочленов Докажем, например, последнее равенство. Пусть / = a0 + aix + ... + anxn (a„#0), g = b0 + b1x +... + bmxm (bm/0). Тогда при перемножении f ng получается только один член степени п + гл, а именно, апЬтхп+т, а членов большей степени не получается вообще. Так как в поле нет делителей нуля, то апЬт 0 0 и, стало быть, deg/g = n + m = deg/ + degg. Предыдущее рассуждение показывает, что в алгебре К[х] нет делителей нуля. Из него же следует, что обратимыми элемента- ми в этой алгебре являются только многочлены нулевой степени, т. е. ненулевые элементы поля К. Замечание 1. Многочлен можно обозначать /(х) или просто /, если из контекста ясно, какой буквой обозначается «переменная». Замечание 2. Часто бывает удобнее располагать многочлен не по возрастающим, а по убывающим степеням х: / = aoxn +a1xn-1 +... +an_1x + a„. Замечание 3. В качестве К можно взять любое коммутативное ассоциативное кольцо с единицей (ср. замечание 1.8.1). В этом слу- чае все предыдущее остается без изменений, за исключением по- следней части, связанной с формулой (2), где нужно дополнительно потребовать, чтобы в кольце К не было делителей нуля. Замечание 4. Произведение финитных последовательностей (a0, ар а2,...) и (b0, blf b2,...) в кольце К[х] есть последовательность (с0, сп с2,...), члены которой находятся по формулам к ск = ^ Qibk-i- 1=0 Эти формулы имеют смысл и для любых (не обязательно финитных) после- довательностей. Таким образом получается коммутативная ассоциативная алгебра с единицей, называемая алгеброй формальных: степенных рядов над К и обозначаемая К [[х]]. Ее элементы обычно записывают как формаль- ные бесконечные суммы вида a0 + a1x + a2*2 + ••• Алгебра К[[х]], как и К[х], не имеет делителей нуля, но доказывается это по-другому (попробуйте это сделать!).
§ 1. Построение и основные свойства алгебры многочленов 95 Каждый многочлен f = aQ + a1x + a2x2 + ... + апхп (3) определяет функцию на К со значениями в К, значение которой в точке с G К по определению равно fM = а0 + а1с + а2с2 + ... + апсп. Так как сумма и произведение многочленов, а также произведение многочлена на число приводятся к каноническому виду (3) преобра- зованиями, использующими только свойства операций вК[х], спра- ведливые и в поле К, то мы придем к одному и тому же результату, сделав подстановку х = с до или после этих преобразований. Это означает, что (/ + ^) Сс) = /(с) 4- ^(с), (/g)(c) =/(c)g(c), (Л/)(с) = Л/(с), т. е. операции над многочленами приводят к таким же операциям над соответствующими функциями. Как мы показали на примере в начале параграфа, разные много- члены могут определять одну и ту же функцию. Оказывается, одна- ко, что такое возможно, только если поле К конечно. Теорема 1. Если поле К бесконечно, то разные многочлены над К определяют разные функции. Доказательство. Пусть многочлены f,g€K[x] определяют од- ну и ту же функцию. Тогда их разность h = f - g определяет нуле- вую функцию, т.е. h(c) = О для всех се К. Предположим, что /1^0, и пусть h = a0 + a1x + a2x2 + ... + an_1xn-1 (an_j/O). Возьмем различные хъ х2,..., хп е К (здесь используется бесконеч- ность поля К). Совокупность верных равенств 1а0 + ajXj + a2x2 +... + a^x"-1 = 0, ao + aiX2 + a2x2 + ... + an_ix£_1 = 0, a0 + aj xn + a2x2 +... + = 0 будем рассматривать как (квадратную) систему однородных линей- ных уравнений относительно a0,ai,a2, Определитель мат-
96 Глава 3. Начала алгебры многочленов рицы коэффициентов этой системы есть определитель Вандермонда V(xlfx2, ...,хп) (см. пример 2.4.5) и потому отличен от нуля. Сле- довательно, система имеет только нулевое решение, что противоре- чит нашему предположению. □ Замечание 5. Даже если поле К конечно, то множество всех мно- гочленов над К бесконечно (но счетно). Однако множество всех функций на К со значениями в К в этом случае конечно, и поэтому обязательно должны существовать разные многочлены, определяю- щие одну и ту же функцию. Тем не менее теорема 1 и ее доказа- тельство остаются в силе для многочленов, степень которых меньше числа элементов поля К. Задача 1. Так называемая задача интерполяции состоит в нахож- дении многочлена степени < п, принимающего в заданных (раз- личных) точках хг, х2,..хп G К заданные значения уг, у2, • • •> Уп € К- (В частности, при п = 2 это называется линейной интерполяцией.) Доказать, что задача интерполяции имеет единственное решение при любых Хр х2,Хп И Ji, у2,.... уп. Деление одного многочлена на другой в обычном смысле слова в алгебре К[х], как правило, невозможно. Однако возможно так называемое деление с остатком, похожее на деление с остатком в кольце целых чисел. Теорема 2. Пусть f,g^ К[х], причем g 0. Тогда существу- ют такие многочлены q и г, что f = qg 4- г и либо г = 0, либо deg г < deg g. Многочлены q и г определены этими условиями одно- значно. Нахождение таких многочленов q и г и называется делением с остатком многочлена f на g. При этом q называется неполным частным, а г — остатком от деления f на g. Многочлен f делится на g в алгебре К[х] тогда и только тогда, когда г = 0. Доказательство. 1) Докажем возможность деления с остатком. Если deg f < deg g, то можно взять q = 0, г = /. Если deg f deg g, то q и г находятся обычной процедурой «деления уголком». А имен- но, пусть f = aQxn + a1xn~1 + ... + ап_1х + ап, g = boxm + b1xm~1 + ... + bm_-lx + bm, где а0, Ьо 0 0. Рассмотрим многочлен /i=/-?x—g. °0
§ 1. Построение и основные свойства алгебры многочленов 97 Его степень меньше, чем степень многочлена /. Если deg/x <degg, то мы можем взять q = ^xn-m, r=/v °0 В противном случае поступаем с многочленом так же, как с /. В конце концов мы получим такой многочлен q = сохп—т + cix"-"'-1 +... + сп_,п, что deg(/ — qg) < deg g. Это и будет неполное частное от деления f на g, а многочлен r = f — qg будет остатком. 2) Докажем, что многочлены q и г определены условиями теоре- мы однозначно. Пусть f = (hg + ri = q2g + r2, где deg < deg g и deg r2 < deg g. Тогда ri-r2 = (q2-qi)g и, если qi /q2, to degCrj - r2) = deg(q2 - q^ + deg g deg g, что, очевидно, неверно. Следовательно, qi = q2 и r2 = r2- □ Особое значение имеет деление с остатком на линейный дву- член х — с. В этом случае остаток имеет степень < 1, т. е. является элементом поля К, Таким образом, результат деления с остатком многочлена f нах —с имеет вид f (х) = (х - c)q (х) 4- г (г е К). Отсюда следует, что /Сс) = г, т. е. остаток равен значению многочлена / в точке с. Это утвержде- ние называется теоремой Безу. Деление с остатком на х — с осуществляется по замечательно простой схеме, называемой схемой Горнера. А именно, пусть аохп 4- ^х"-1 4-... 4- an-ix + ап = = (х - с)(ЬдХ0”1 + bi*"-2 4-... 4- Ьп_2х 4- Ьп_2) 4- г.
98 Глава 3. Начала алгебры многочленов Приравнивая коэффициенты при соответствующих степенях х, по- лучаем цепочку равенств ао = ^о> a1 = b1-cb0, а2 = ^2 “ с^1> an-i = bn_1-cbn_2, fln = r-cbn_1, откуда находим следующие рекуррентные формулы для Ьо, Ь3,... •••Л-i иг: Ьо = ао> bj = CZ1 4“ cbg, b2 = 0-2 cb^, Ьп-1 ~Gn-l + с^п-2> г = ап+Л-1- Исходные данные и результаты вычислений удобно расположить в виде таблицы: а0 <21 а2 ••• ап-1 ап С ьо Ьх Ь2 ~Ьн-х г Каждое число во второй строке этой таблицы, начиная с Ьь нахо- дится как сумма числа, стоящего над ним, и числа, стоящего слева, умноженного на с. В частности, это дает очень эффективный способ вычисления значений многочлена. Пример 1. Найдем значение многочлена / = 2х6 - Их4 - 19х3 - 7х2 + 8х + 5 в точке х = 3. По схеме Горнера получаем: 2 0 -11 -19 —7 8 5 3 2 6 7 2 -1 5 20 Таким образом, /(3) = 20.
§ 2. Общие свойства корней многочленов 99 § 2. Общие свойства корней многочленов Элемент с поля К называется корнелшногочлена f еК[х] (или соответствующего алгебраического уравнения /(х)=0), если /(с)=0. Из теоремы Безу (см. предыдущий параграф) следует Теорема 1. Элемент с поля К является корнем многочлена f G е/С[х] тогда и только тогда, когда f делится нах-с. Этим можно воспользоваться для доказательства следующей тео- ремы. Теорема 2. Число корней ненулевого многочлена не превосходит его степени. Доказательство. Пусть q —корень многочлена /. Тогда / = (х-с1)/1 (ЛеК[х]). Пусть с2 — корень многочлена j\. Тогда Л = (*-с2)/2 (ДсВД) и, значит, / = (х-с1)(х-с2)/2. Продолжая так дальше, мы в конце концов представим многочлен f в виде f = (х - q)(x - с2)...(х - cm)g, (4) где многочлен g G К[х] не имеет корней. Числа q, с2,..., ст — это все корни многочлена f. В самом деле, для любого с G К имеем /(с) = (с - q) (с - с2)... (с - cnl)g(c) и, так как g(c) 0 0, то /(с) = 0, только если с = ct для некоторого i. Таким образом, число корней многочлена f не превосходит т (оно может быть меньше т, поскольку не исключено, что среди чисел q, с2,..., ст есть одинаковые); но m = deg / - deg g $deg f. □ Замечание 1. Эта теорема фактически уже была нами доказана другим способом в процессе доказательства теоремы 1.1. С другой стороны, из нее можно получить доказательство теоремы 1.1, не использующее теории линейных уравнений. А именно, если различ- ные многочлены f и g над бесконечным полем К определяют одну
100 Глава 3. Начала алгебры многочленов и ту же функцию, то все элементы поля К являются корнями ненуле- вого многочлена h = f — g, что противоречит только что доказанной теореме. Доказательство предыдущей теоремы наводит на мысль, что некоторые корни правильнее было бы считать несколько раз. Этому можно придать точный смысл. Корень с многочлена / называется простым, если / не делится на (х — с)2, и кратным в противном случае. Кратностью корня с называется наибольшее из таких к, что / делится на (х - c)fc. Таким образом, простой корень — это корень кратности 1. Иногда удобно считать, что число, не являющееся корнем, — это корень кратно- сти 0. Очевидно, что с является корнем кратности к многочлена f тогда и только тогда, когда / = (x-c)*g, (5) где«(с)/0. Теперь мы докажем уточнение теоремы 2. Теорема 3. Число корней ненулевого многочлена с учетом их кратностей (т. е. если каждый корень считается столько раз, ка- кова его кратность) не превосходит степени многочлена, причем равенство имеет место тогда и только тогда, когда этот много- член разлагается на линейные множители. Доказательство. Перепишем равенство (4), объединив одинако- вые множители: f = (.x-c1)k'(.x-c2)k2...{x-cs)ksg (6) (ci,c2, ...,cs различны). Ясно, что c1,c2f >..tcs — это все корни мно- гочлена /. Далее, выделяя в (6) множитель (х — с,)^*, мы можем написать f = О - Ci'fihj, где /г, (с,) # 0. Следовательно, с, — корень кратности к,. Таким образом, число корней многочлена / с учетом их кратно- стей равно ki + k2 + --- + ks = deg/-deg g, откуда и вытекают все утверждения теоремы. □ Замечание 2. Условно считается, что многочлен нулевой степе- ни разлагается в произведение пустого множества линейных мно- жителей.
§ 2. Общие свойства корней многочленов 101 Если многочлен f = аохп 4- сцх'1-1 4-... 4- an-i* + ап разлагается на линейные множители, то это разложение может быть записано в виде f = а0(х-с1)(х-с2)...(х-сп), где сьс2, ...,сп — корни мно- гочлена f, причем каждый из них повторен столько раз, какова его кратность. Приравнивая коэффициенты при соответствующих степенях х в этих двух представлениях многочлена f, мы получаем следующие формулы Виета: а, с14-с24-...4-сп = --, ао а2 с1с24-с1с34-...4-сп_1сп = —, 0 C1C2...Cn = (-l)nJt. ао В левой части k-й формулы Виета стоит сумма всевозможных произ- ведений к корней многочлена f. С точностью до множителя (—1/ это коэффициент при хп~к в произведении (x-qXx-с2)...(х —сп). Пример 1. Комплексные корни 5-й степени из 1 ек = cos + i sin (к = 0,1,2,3,4) (рис. 1) суть корни многочлена х5 - 1. По первой из формул Виета их сумма равна нулю. Приравнивая нулю сумму их вещественных Рис. 1
102 Глава 3. Начала алгебры многочленов частей, получаем 2cos 5?+2cos ^ + 1 = 0. Пусть cos = х; тогда cos = 2х2 — 1, так что 4х2 + 2х —1 = 0, откуда „ 2л_ч/5-1 „ 4тг У5 + 1 C0ST-^~> COST =-----------“ Задача 1. Пусть п — простое число. Пользуясь задачей 1.5.2 и по- следней из формул Виета, доказать теорему Вильсона: (п-1)! = -1 (mod и). Многочлен f называется нормированным (или приведенным), ес- ли а0 = 1. Формулы Виета позволяют выразить коэффициенты нор- мированного многочлена через его корни (при условии, что число корней с учетом кратностей равно степени многочлена). Пример 2. Найдем нормированный многочлен 4-й степени f = х4 4- Qi x3 4- а2х2 4- а3х 4- а4, имеющий двукратный корень 1 и простые корни 2, 3. По формулам Виета —di = 14-14-24-3 = 7, а2 = 1-1 +1-24-1-34-1-24-1-34-2-3 = 17, -а3 = 1-1-24-1-1-34-1-2-34-1-2-3 = 17, а4 = 1-1-2-3 = 6. Таким образом, / = х4 —7х3 + 17х2 —17х + 6. Кратность корня многочлена может быть истолкована и другим способом, по крайней мере в случае char К = 0. Для этого нужно определить дифференцирование многочленов. Из правил дифференцирования функций вещественной перемен- ной следует, что производная многочлена есть также многочлен. Обозначим через D отображение алгебры Щх] в себя, ставящее в со-
§ 2. Общие свойства корней многочленов 103 ответствие каждому многочлену его производную. Отображение D обладает следующими свойствами: 1) оно линейно; 2) D(/g) = (D/)g4-/(Dg); 3) Dx = l. Эти наблюдения позволяют определить дифференцирование многочленов над любым полем К, когда определение производной, даваемое в анализе, не имеет смысла. Предложение 1. Отображение D: К[х] —>К[х], обладающее свой- ствами 1)—3), существует и единственно. Доказательство. Пусть D — такое отображение. Тогда DI =D(1 • 1) = (D1) • 1 +1 • (DI) = D14- DI, откуда DI = 0. Докажем по индукции, что Dxn = пхп-1. При п = 1 это верно по предположению, а переход от п - 1 к п делается выкладкой Dxn = D(xn~1x) = (Dxn”1)x4-xn-1(Dx) = (п - 1)хп”2-х 4-хп-1 = пхп"1. Тем самым отображение D однозначно определено на базисных век- торах 1, х, х2,..., а значит, и на всем пространстве К[х]. Обратно, построим линейное отображение D: К[х] —♦К[х], за- дав его на базисных векторах формулами Dl = 0, Dxn = nxn-1 (п = 1,2,...), и проверим, что оно обладает свойством 2). В силу линейности до- статочно проверить это свойство для базисных векторов. Имеем D (xmxn) = Dxm+n = (m + n)xzn+n"1, (Dxm)xn 4- xm (Dxn) = mxm~1xn 4- nxmxn-1 = (m 4- n)xm+n-1. □ Многочлен Df называется производной многочлена f и обозна- чается, как обычно, через f Сделав в многочлене f G К[х] замену х = с 4- у, где с G К, мы можем представить его в виде многочлена (той же степени) от у = х — с или, как говорят, разложить по степеням х - с: / = b0 + b1(x-c) + b2(x-c)2 + ... + bn(x-c)n. (7) Очевидно, что если с — корень многочлена /, то его кратность рав- на номеру первого отличного от нуля коэффициента этого разло- жения.
104 Глава 3. Начала алгебры многочленов Предложение 2. Если char К = 0, то коэффициенты разложения многочлена feK[x] по степеням х —смогут быть найдены по фор- мулам bk = ~kT- (Здесь /(к), как обычно, обозначает k-ю производную многочле- на/.) Доказательство. Продифференцируем равенство (7) к раз и под- ставим х = с. □ Таким образом, f=fM+m{x-c)+m{x-^+...+l^(x-cr. Эта формула называется формулой Тейлора для многочленов. Из формулы Тейлора и сделанного выше замечания следует Теорема 4. При условии, что char К = 0, кратность корня с мно- гочлена f^K[x] равна наименьшему порядку производной многочле- на /, не обращающейся в нуль в точке с. Следствие. При том же условии всякий k-кратный корень мно- гочлена f является (к - ^-кратным корнем его производной. Замечание 3. В случае char К > 0 кратность корня с может быть меньше указанного в теореме 4 числа. Более того, такого числа мо- жет вообще не существовать. Так, например, если п — простое чис- ло, то первая, а значит, и все последующие производные многочле- на хп eZn[x], имеющего п-кратный корень 0, являются нулевыми многочленами. В случае К = К теорема 4 позволяет истолковать кратность гео- метрически. А именно, если кратность корня с многочлена / G К[х] равна к, то вблизи точки с многочлен / ведет себя как b(x - с)к (Ь 0 0). Это означает, что его график в точке с при k = 1 просто пересекает ось х, а при k > 1 имеет с ней касание (к - 1)-го порядка. Кроме того, знак многочлена /(х) при прохождении точки с при нечетном к меняется, а при четном к не меняется (см. рис. 2). Коэффициенты разложения (7), а значит, и значения производ- ных многочлена / в точке с (в случае char К = 0) могут быть найде- ны последовательными делениями с остатком многочлена / на х - с. А именно, при первом делении получается остаток Ьо и неполное частное /1=b1+b2(x-c) + ... + bn(x-c)''-1; при делении Д на х — с получается остаток Ьг и т. д.
§ 2. Общие свойства корней многочленов 105 Рис. 2 Пример 3. Разложим указанным способом по степеням х - 2 многочлен f = x5- 5х4 + 7х3- 2х1 2 + 4х- 8ёЖ[х]. Последовательные деления с остатком на х - 2 будем проводить по схеме Горнера, используя строку результатов каждого деления как строку исходных данных для следующего деления: 2 1 -5 7-2 4 -8 1-31040 1 -1 -1 -2 0 1110 1 3 7 1 5 1 Таким образом, / = 7(х - 2)3 + 5(х - 2)4 + (х - 2)5.
106 Глава 3. Начала алгебры многочленов В частности, мы видим, что 2 — трехкратный корень многочлена f. Кроме того, /'"(2) == 3! • 7 = 42, /,v(2) = 4! • 5 = 120, /v(2) = 5! • 1 = 120. § 3. Основная теорема алгебры комплексных чисел Оценка сверху числа корней многочлена, полученная в предыду- щем параграфе, ничего не говорит о наличии хотя бы одного корня. И действительно, существуют многочлены положительной степени, не имеющие корней, например, многочлен х2 +1 над полем К ве- щественных чисел. Именно это обстоятельство послужило поводом для построения поля С комплексных чисел. Если бы и над полем С существовали многочлены положительной степени, не имеющие корней, это привело бы к необходимости его дальнейшего расшире- ния. Однако, к счастью, это не так. Это составляет содержание тео- ремы, которую называют основной теоремой алгебры комплексных чисел. Теорема 1. Всякий многочлен положительной степени над по- лем комплексных чисел имеет корень. Поле, над которым всякий многочлен положительной степени имеет хотя бы один корень, называется алгебраически замкнутым. Таким образом, теорема 1 означает, что поле С комплексных чисел алгебраически замкнуто. Существует несколько доказательств этой теоремы. Любое из них включает элементы анализа, так как оно должно как-то исполь- зовать определение поля вещественных чисел, которое не является чисто алгебраическим. Доказательство, приводимое ниже, является почти полностью аналитическим. Нам понадобится понятие предела последовательности ком- плексных чисел. Перед тем как дать соответствующее определение, напомним, что модуль |z| комплексного числа z есть длина вектора, изображающего это число. Отсюда следует, что |zj — z2| есть рассто- яние между точками, изображающими числа Zj и z2. Известные из геометрии неравенства показывают (см. рис. 3 и 4), что |Z1 +z2| $ |Zj| + |z2|, IlZil - |z2|| |Z1 -z2|. (Равенства могут иметь место, когда соответствующий треугольник вырождается в отрезок.)
§ 3. Основная теорема алгебры комплексных чисел 107 Определение 1. Последовательность комплексных чисел zk (k G GN) называется сходящейся к комплексному числу z (обозначение: zk —► z), если |zfc - z\ —► 0. Лемма 1. Пусть zk = xk + yki, z = x + yi (xk, yk) x, у G R). Тогда *к~*х <=> xk—*x и yk->y. Доказательство. Имеем (см. рис. 5) |zfc - z| = y|xk - x|2 + |yk - у I2, так что *к-** и ук-*у => zk-*z. Обратная импликация вытекает из неравенств lyk-yl^|zk-z|. □ Лемма2. zk-*z => |zfc|—»|z|. Доказательство следует из того, что l|Zk|-|z||^|zfc-z|. □ Лемма 3. zk —► z и tuk —> ш => zk + ivk z + w и zkivk —> zw. Доказательство такое же, как для последовательностей веще- ственных чисел: I(zk + wk) - (z + ip)| = |(zfc - z) + (wk - ip)| $ |zfc -z| + |u/k - ш| -► 0, |zfcwk - zw\ = |(zt - z)wk + z(wk - IP)| $ |zk - z||wfc| + |z||wk - w| -*0. □ Следствие. Пусть zk^> z и f G C[z] —любой многочлен. Тогда (Здесь мы допускаем вольность в обозначениях, обычную в ана- лизе, когда значение переменной обозначается так же, как сама переменная.)
108 Глава 3. Начала алгебры многочленов Определение 2. Последовательность комплексных чисел zk (k G GN) называется сходящейся к бесконечности (обозначение: zk —»сю), если -* 00 • Лемма 4. Из всякой последовательности комплексных чисел zk можно выбрать либо подпоследовательность, сходящуюся к некото- рому комплексному числу z0, либо подпоследовательность, сходящу- юся к бесконечности. Доказательство. Если последовательность модулей чисел zk неограниченна, то из нее можно выбрать подпоследовательность, сходящуюся к бесконечности; но тогда соответствующая подпосле- довательность самих чисел zk согласно определению будет стре- миться к бесконечности. Пусть теперь последовательность модулей ограниченна, т. е. су- ществует такое С > 0, что Vk. Представим zk в алгебраической форме: zk = xk + yki. Тогда \xk\^\zk\^C, \yk\Ш1^С. По теореме Больцано—Вейерштрасса из последовательности хк можно выбрать сходящуюся подпоследовательность. Перейдя к этой подпоследовательности и изменив обозначения, можно считать, что —*о- Аналогичным образом, перейдя еще раз к подпоследовательности, можно считать, что Ук~*Уо- Но тогда по лемме 1 zk^zo = xo + yoi. □ Лемма 5. Если zk <х> и f е C[z] —многочлен положительной степени, то f(zk} —> оо. Доказательство. Пусть / = aozn + ajz'1-1 +... + a„_jZ + ап (a0 / 0);
§ 3. Основная теорема алгебры комплексных чисел 109 тогда |/(Z)t)| = |Z(t|" a0 + ^ + ... + ^ + J. Zk Zk Zk Сумма, стоящая под знаком модуля, стремится к а0, так как все сла- гаемые, кроме а0, стремятся к 0. Так как |zfc|" оо, то и |/(zfc)| -* оо. □ Следующая лемма является ключевой для доказательства основ- ной теоремы. Лемма 6 (лемма Даламбера). Пусть f G C[z] —многочлен поло- жительной степени и f(zo)^O. Тогда сколь угодно близко к z0 мож- но найти такое z, что |f (z)| < |/(z0)|. Доказательство. Разложим f по степеням z - zQ и разделим на /(z0). Учитывая, что несколько первых коэффициентов разложения, следующих за свободным членом, могут оказаться равными нулю, запишем результат в виде = 1 + ср (z - г0)р + ср+1 (г - г0)р+1 +... + сп (г - г0)п (ср / 0). Нам нужно доказать существование такого z, что f(z) /Ы <1. Идея доказательства состоит в том, что, если выбирать z достаточно близким к z0, выполнение этого неравенства будет зависеть только от суммы первых двух членов предыду- щего разложения. Будем искать z в виде z = z0 4- tzx (см. рис. 6), где t G (0,1), a zT — ком- плексное число, удовлетворяющее усло- вию cpz? = — 1. Имеем тогда -^=i-tp+tp+im где <р — некоторый многочлен степени п - р - 1 (с комплексны- ми коэффициентами). Если С — максимум модулей коэффициентов многочлена (/?, то |(p(t)|$A=(n-p)C
no Глава 3. Начала алгебры многочленов и, следовательно, /(z) Ж) 1 - tp + Atp+1 = 1 - tp(l - АО < 1 npHtcl/A. □ Доказательство теоремы 1. Пусть f G С [и] — многочлен поло- жительной степени. Положим M = inf |/(z)|. z Из определения нижней грани следует, что существует такая после- довательность комплексных чисел zk, что 1/(ик)НМ. (8) Перейдя к подходящей подпоследовательности, мы можем со- гласно лемме 4 считать, что либо zk -* со, либо zk —> zQ G С. В первом случае в силу леммы 5 мы придем в противоречие с (8). Во втором случае /(zfc) —(и0) и по лемме 2 Если М > О, то лемма Даламбера приводит нас в противоречие с определением М. Следовательно, М = 0, т. е. /(z0) = 0. □ Следствие 1. В алгебре С[х] всякий ненулевой многочлен разла- гается на линейные множители. В самом деле, в силу доказанной теоремы многочлен g в разло- жении (4) должен иметь нулевую степень, т. е. быть просто числом. В силу теоремы 2.3 получаем отсюда Следствие 2. Всякий многочлен степени п над С имеет п корней (с учетом кратностей). § 4. Корни многочленов с вещественными коэффициентами Многочлен степени п с вещественными коэффициентами может иметь < п (в частности, вообще не иметь) вещественных корней, но, как и всякий многочлен с комплексными коэффициентами, он всегда имеет ровно п комплексных корней (с учетом кратностей). Мнимые корни многочлена с вещественными коэффициентами об- ладают специальным свойством.
§ 4. Корни многочленов с вещественными коэффициентами 111 Теорема 1. Если с — мнимый корень многочлена /е!К[х], то с также является корнем этого многочлена, причем той же кратно- сти, что и с. Доказательство. Пусть / = аохп + а1хп-1 + ... + а,1_1х + а„ (а0,а1; ...,a„eR). Если /(с) =0, то, поскольку комплексное сопряжение является авто- морфизмом поля С (см. § 1.4), f(c) = аосп Ч-а^Н"1 +... + ап_!с + ап = = аосп+а1Сп-1 + ... + ап_1с + ап=/(с) = б = О, т. е. с — также корень многочлена f. Аналогично доказывается, что fk\c) = Q <=> /(к)(с) = 0. Следовательно, кратности корней с и с одинаковы. □ Следствие. В алгебре R[x] всякий ненулевой многочлен разлага- ется на линейные множители и квадратичные множители с отри- цательным дискриминантом. Доказательство. Заметим, что если с — мнимое число, то квад- ратный трехчлен (х - с) (х - с) = х2 - (с + с)х + сс имеет вещественные коэффициенты; его дискриминант, очевидно, отрицателен. Пусть теперь с1> •••> Cs> •••> Cs+P С$+1> •••> — это все (различные) комплексные корни многочлена /ей[х], причем Если кратность корня с, равна kit то / = a0(x-c1)fc’...(x-cs)fc*x х [(х - cs+i) (х - cs+1)]fcjtl... [ (х - cs+t) (х - cJ+t)]fc>+‘, (где a0 — старший коэффициент многочлена /). Перемножая ли- нейные множители в квадратных скобках, получаем искомое разло- жение. □
112 Глава 3. Начала алгебры многочленов Пример 1. х5 - 1 = (х- 1)(х- (cos + i sin (х- (cos - i sin х = (х -1)(х2 — 2х cos +1) (х2 - 2х cos +1) = = (х-1)(х2-^х + 1)(х2 + ^х + 1) (см. пример 2.1). Пример 2. Для многочлена f из примера 2.3 разложение, о кото- ром идет речь, имеет вид / = (х-2)3(х2 + х+1). Из теоремы 1 также следует, что любой многочлен f е R[x] нечет- ной степени имеет хотя бы один вещественный корень. Впрочем, это легко доказать и по-другому. А именно, если старший коэффи- циент многочлена f положителен, то lim /(х) =+°о, lim У(х) = -о> ^-♦4-оо X-+-QO и, значит, многочлен f принимает как положительные, так и отри- цательные значения. По теореме о промежуточном значении непре- рывной функции отсюда следует, что в некоторой точке он обраща- ется в нуль. Понятно, что представляет интерес определение точного числа вещественных корней. Вычисляя значение многочлена в отдельных точках, мы можем обнаружить, что в каких-то точках а и b он при- нимает значения разных знаков. Отсюда следует, что в интервале (а, Ь) находится по меньшей мере один корень, а точнее — нечетное число корней (с учетом их кратностей). Таким образом мы можем оценить снизу число вещественных корней. Пример 3. Для многочлена f = х4 + х2 - 4х +1 находим у (0) = 1 > 0, /(1) = -1 < 0, /(2) = 13 > 0. Следовательно, f имеет корни в каждом из интервалов (0,1) и (1, 2). Нетрудно показать, что f (х) > 0 при х $ 0, а также при х 2. Следо- вательно, все вещественные корни многочлена f лежат в интервале
§ 4. Корни многочленов с вещественными коэффициентами 113 (О, 2). Однако точное их число остается неизвестным, так как в од- ном из интервалов (0,1) и (1, 2) может быть три корня. Существуют методы, которые в принципе позволяют определить как общее число вещественных корней любого многочлена с веще- ственными коэффициентами, так и число его корней в любом про- межутке числовой прямой. Однако их практическое применение связано с довольно большими вычислениями. Мы приведем здесь одну теорему, которая хотя и не всегда дает полный ответ, но зато не требует никаких вычислений. Она говорит не просто о числе всех вещественных корней, но о числе положительных (или отрица- тельных) корней и является обобщением следующего тривиального утверждения: если все коэффициенты многочлена неотрицательны, то он не имеет положительных корней. Для формулировки этой теоремы нам понадобится одно вспомо- гательное понятие. Пусть имеется конечная последовательность вещественных чисел aQ> <*1, <*2, •••, ап- Говорят, что на k-м месте в этой последовательности имеется пере- мена знака, если ак / 0 и знак числа ак противоположен знаку по- следнего из предшествующих ему ненулевых членов последователь- ности. (Если ак — первый из ненулевых членов последовательности, то на k-м месте перемены знака нет.) Теорема 2 (теорема Декарта). Число положительных корней (с учетом их кратностей) многочлена /€й[х] не превосходит числа перемен знака в последовательности его коэффициентов и сравнимо с ним по модулю 2; если же все (комплексные) корни многочлена f вещественны, то эти числа равны. Обозначим через N(f) число положительных корней многочле- на f и через L(f) число перемен знака в последовательности его коэффициентов. Очевидно, что эти числа не изменяются при умно- жении f на -1; поэтому всегда можно считать, что старший коэф- фициент многочлена f положителен. Кроме того, если 0 является k-кратным корнем многочлена /, то при делении f на хк эти числа также не изменяются; поэтому можно считать, что свободный член многочлена f отличен от нуля. Лемма 1. N(f) = L(f) (mod 2). Доказательство. Пусть f = aoxn + ayxn~'1 + ...+ап_-1х + а„ (а0 > 0, а„ /0).
114 Глава 3. Начала алгебры многочленов Тогда /(0) = ап и /(х) > 0 при достаточно больших х. Когда мы дви- гаемся вправо по числовой прямой, то при прохождении каждого простого корня /(х) меняет знак, а при прохождении к-кратного корня знак /(х) умножается на (—l)fc, т. е. как бы меняется к раз. Поэтому N(f) четно, если ап > 0, и нечетно, если ап < 0. То же самое можно сказать и об L(f). □ Лемма 2. N(/) N(/') +1. Доказательство. По теореме Ролля между любыми двумя корня- ми многочлена f лежит корень его производной. Кроме того, каж- дый к-кратный корень многочлена f является (к - 1)-кратным кор- нем его производной (следствие теоремы 2.4). Отсюда получаем, 4ToN(/')^N(/)-l. □ Лемма 3. L(/'KL(/). Доказательство очевидно. □ Число отрицательных корней многочлена f равно числу положи- тельных корней многочлена 7(х) = (-1)п/(-х). Лемма 4. L (/) + L (/) п = cfeg /. Доказательство. Коэффициенты многочлена f получаются из коэффициентов многочлена f попеременным умножением на ±1. Предположим вначале, что все коэффициенты aQ,a19 ...,ап много- члена f отличны от нуля. Тогда если на k-м месте в последовательно- сти а0, аь ..., ап имеется перемена знака, то на том же месте в после- довательности коэффициентов многочлена f перемены знака нет, и наоборот. Поэтому в этом случае £(/)+!(/) = и. В общем случае, когда среди коэффициентов а0>а19 ...,ап могут быть нули, при их замене произвольными числами, отличными от нуля, числа £(/) и L(J) могут только увеличиться. Так как после этого их сумма по доказанному станет равной п, то L(/) + £(/)$ и. □ Доказательство теоремы 2. Докажем неравенство N(/) ^L(/) индукцией по deg f. Если deg f = 0, то N(f) = L(f) = 0. Пусть deg f = = n > 0. Тогда deg f' = n - 1. Пользуясь леммами 2 и 3 и предположе- нием индукции, получаем N(f) N(/') +1 ^L(f) +1 ^К/) +1. Однако равенство N(/) = L(/) +1 невозможно ввиду леммы 1. Сле- довательно, N(f)
§ 4. Корни многочленов с вещественными коэффициентами 115 Пусть теперь известно, что все корни многочлена f веществен- ны. Мы можем считать, что 0 не является корнем. Имеем тогда в силу уже доказанного неравенства и леммы 4 n = N(/)+N(/)^L(/) + L(/)$n, откуда N (/) = £(/), □ Пример 4. Для многочлена f из примера 3 имеем L(/) = 2, так что 2. Но мы уже установили, что N(/) 2. Следовательно, Ш) = 2. Пример 5. Многочлен f = х2 - х + 1 не имеет положительных (и вообще вещественных) корней, но £(/) = 2, так что в этом случае N(/) <£(/). Применяя теорему Декарта к многочлену gM = /(c+rt=/w + ^+^ + ... + £^2< мы получаем информацию о числе корней многочлена f в проме- жутке (с, +оо). В частности, если все коэффициенты многочлена g неотрицательны, то он не имеет положительных корней (тривиаль- ный случай теоремы Декарта), а это означает, что все вещественные корни многочлена f не превосходят с. Пример 6. Найдем границы вещественных корней многочлена f = x5 - 5х3 - 10х2 + 2. Пользуясь схемой Горнера, вычислим /(3): 3 1 0 -5 -10 0 2 1 3 4 2 6 20 Мы видим, что У (3) = 20 > 0. Более того, все коэффициенты неполно- го частного оказались положительными. Поэтому все производные многочлена f при х = 3 также положительны (см. пример 2.3) и, значит, все его вещественные корни меньше 3. Рассмотрим теперь многочлен /(х) = -/(-х) = х5 - 5х3 + 10х2 - 2.
116 Глава 3. Начала алгебры многочленов Вычислим значения многочлена / и его производных при х = 1: 1 0 -5 10 0 —2 1 1 1 -4 6 6 4 1 2 -2 4 10 1 3 1 5 Мы видим, что /(1) = 4 > 0, /'(1) = 10 > О, /"(1) = 2 • 5 > 0. Значения следующих производных также положительны, поскольку последняя строка таблицы состоит только из положительных чисел. Следовательно, все вещественные корни многочлена f меньше 1, а это означает, что все вещественные корни многочлена f больше —1. Таким образом, все вещественные корни многочлена f лежат в интервале (—1, 3). Задача 1. Исследовав производную многочлена /, доказать, что многочлен f из предыдущего примера имеет только один отрица- тельный корень. Обратимся теперь к вопросу о приближенном вычислении кор- ней. Если известно, что многочлен /е К [х] имеет ровно один корень в каком-то интервале, то этот корень может быть в принципе най- ден с любой степенью точности с помощью вычисления значений многочлена в подходящим образом подобранных точках. Поясним это на следующем примере. Пример 7. Как мы показали (см. пример 4), многочлен f из при- мера 3 имеет ровно один корень в интервале (1,2). Найдем зна- чение этого корня с точностью до 0,01. Мы видели, что /(1) < 0. Вычисляя /(х) при х = 1,1; 1,2; 1,3, мы обнаруживаем, что /(1,2) < 0, /(1,3) >0. Следовательно, корень лежит в интервале (1,2; 1,3). Вычисляя /(х) при х = 1,21; 1,22; 1,23; 1,24; 1,25, находим, что /(1,24) < 0, /(1,25) >0. Следовательно, искомый корень лежит в интервале (1,24; 1,25). Конечно, существуют гораздо более совершенные методы при- ближенного вычисления корней. Они применимы к алгебраиче-
§ 5. Теория делимости в евклидовых кольцах 117 ским уравнениям любой степени, а некоторые из них — и к транс- цендентным уравнениям. Однако изложение этих методов выходит за рамки нашего курса: они относятся скорее к вычислительной математике, чем к алгебре. Замечание 1. Если многочлен имеет кратный корень, но его ко- эффициенты даны нам лишь приближенно, хотя бы и с любой сте- пенью точности, то мы в принципе не можем доказать наличие этого кратного корня, так как при сколь угодно малом изменении коэффициентов многочлена он может либо рассыпаться на простые корни, либо вообще перестать существовать. Так, в случае двукрат- ного корня мы никогда не сможем сделать выбор между ситуация- ми, изображенными на рис. 7, а), а в случае трехкратного — между ситуациями, изображенными на рис. 7, б). § 5. Теория делимости в евклидовых кольцах Разложение многочленов над С на линейные множители и мно- гочленов над R на линейные и квадратичные множители аналогич- но разложению целых чисел на простые множители. Для многочле- нов над произвольным полем также имеется подобное разложение, но его множители могут иметь любую степень. Задачу отыскания та- кого разложения можно рассматривать как обобщение задачи отыс- кания корней многочлена (которой она равносильна в случае много- членов над С). Она не имеет общего решения, пригодного для любо- го поля. В этом параграфе мы докажем единственность указанного разложения. Одновременно мы докажем единственность разложе- ния целого числа на простые множители — факт широко известный, но не доказываемый в средней школе. Для того чтобы охватить единым рассуждением оба случая, вве- дем некоторые общие понятия.
118 Глава 3. Начала алгебры многочленов Определение 1. Коммутативное ассоциативное кольцо с едини- цей и без делителей нуля называется целостным кольцом (или обла- стью целостности). Так, кольцо Z целых чисел и кольцо К [х] многочленов над лю- бым полем К являются целостными кольцами. Более того, кольцо многочленов над любым целостным кольцом также является целост- ным кольцом (см. замечание 1.3). Замечание 1. Кольцо, состоящее из одного нуля, не считается целостным. Пусть А — целостное кольцо. Говорят, что элемент a G А делится на элемент b G А (обозначение: а • Ь) или, иначе, что b делит а (обозначение: b | а), если существует такой элемент q G А, что а = qb. Элементы а и Ь называются ассоциированными (обозначение: а ~Ь), если выполняется любое из следующих эквивалентных условий: 1) Ь\а и а\Ь; 2) а = cb, где с — обратимый элемент. В следующем определении аксиоматизируется то общее, что есть у кольца многочленов над полем и кольца целых чисел, — возмож- ность деления с остатком. Определение 2. Целостное кольцо А, не являющееся полем, на- зывается евклидовым, если существует функция N: А\{0}— (называемая нормой), удовлетворяющая следующим условиям: 1) N(ab) N(a), причем равенство имеет место только тогда, когда элемент b обратим; 2) для любых а, b е А, где b 0 0, существуют такие q, г е А, что a = qb + r и либо г = 0, либо N(r) <N(b). Замечание 2. Условие 2) означает возможность «деления с остат- ком». Его единственности (т. е. однозначной определенности пары (q, г)) не требуется. Замечание 3. Вторая часть условия 1) на самом деле может быть выведена из остальных условий. В самом деле, пусть элемент b необ- ратим. Тогда а не делится на ab. Разделим а на ab с остатком: a = q(ab) + r. Так как г = а(1 -qb), то N(a)*SN(r)<N(ab).
§ 5. Теория делимости в евклидовых кольцах 119 Основными для нас примерами евклидовых колец являются коль- цо Z целых чисел и кольцо К[х] многочленов над полем К. В каче- стве нормы в первом случае можно взять модуль целого числа, а во втором — степень многочлена. Существуют и другие евклидовы кольца. Пример 1. Комплексные числа вида с = а + Ы, где a, b е Z, назы- ваются целыми гауссовыми числами. Они образуют подкольцо в С, обозначаемое через Z[i]. Кольцо Z[i] яв- ляется евклидовым относительно нормы W(c) = |c|2 = a2 + b2. В самом деле, очевидно, что N(cd) = = N(c)W(d) и, поскольку N(l) = 1, обра- тимые элементы кольца Z[i] —это эле- менты с нормой 1, т. е. ±1 и ±i. От- сюда следует, что выполнено условие 1) в определении евклидова кольца. Дока- жем возможность деления с остатком. Пусть с, d GZ[i], d 00. Рассмотрим целое гауссово число q, ближай- шее к j. Легко видеть, что | j - q| 1//2 (см. рис. 8). Положим r = c — qd. Тогда c = qd + r и N(r) = |c-qd|2=|^-q|2|d|4|N(d)<N(d). Задача 1. Доказать, что кольцо рациональных чисел вида 2~пт (гл G Z, п е Z+) является евклидовым. Определение 3. Наибольшим общим делителем элементов а и b целостного кольца называется их общий делитель, делящийся на все их общие делители. Он обозначается через (а, Ь) или НОД{а, Ь}. Наибольший общий делитель, если он существует, определен од- нозначно с точностью до ассоциированности. Однако его может не существовать. Например, элементы х5 и х6 в кольце многочленов без линейного члена не имеют наибольшего общего делителя. Теорема 1. В евклидовом кольце для любых элементов а, b суще- ствует наибольший общий делитель d, и он может быть представ- лен в виде d = au + Ъи, где и, и — какие-то элементы кольца. Доказательство. Если b = 0, Tod = a = a- l + b-0. Если а делится на Ь, то d = b = a- O + b- l. В противном случае разделим с остат- ком а на Ь, затем b на полученный остаток, затем первый остаток на
120 Глава 3. Начала алгебры многочленов второй остаток и т. д. Так как нормы остатков убывают, то в конце концов деление произойдет без остатка. Получим цепочку равенств: a = q1b + r1, b = q2ri+r2> Гп-2 = (1ПГп-1 + Гп, Гп-1=Чп+1Гп. Докажем, что последний ненулевой остаток гп и есть наибольший общий делитель элементов а и Ь. Двигаясь по выписанной цепочке равенств снизу вверх, получа- ем последовательно rn|rn-i, Гп|г„_2, .... ГП|Г1, гп|Ь, г„|а. Таким образом, гп —общий делитель элементов а и Ь. Двигаясь по той же цепочке равенств сверху вниз, получаем по- следовательно r1=au1 + bvl, r2 = au2 + bv2, r3 = au3 + bu3, rn = aun + bvn, где ub (i = 1,..., n) — какие-то элементы кольца (например, щ = 1, иг = —Qi). Таким образом, гп можно представить в виде аи + bv. Отсюда, в свою очередь, следует, что гп делится на любой общий делитель элементов а и Ь. □ Процедура нахождения наибольшего общего делителя, исполь- зованная в этом доказательстве, называется алгоритмом Евклида. Элементы a, b G А называются взаимно простыми, если (a, b) = 1. В этом случае, согласно доказанной теореме, существуют такие и, и G А, что аи + Ьи = 1. Перейдем теперь к вопросу о разложении на простые множи- тели.
§ 5. Теория делимости в евклидовых кольцах 121 Определение 4. Необратимый ненулевой элемент р целостного кольца называется простым, если он не может быть представлен в виде р = ab, где а и b — необратимые элементы. Иначе говоря, элемент р простой, если всякий его делитель ас- социирован либо с 1, либо с р. Простые элементы кольца Z в этом смысле — это числа вида ±р, где р — простое число. Простые элементы кольца К[х], где К — поле, по традиции на- зываются неприводимыми многочленами. Таким образом, неприво- димый многочлен — это такой многочлен положительной степени, который не может быть разложен в произведение двух многочленов положительной степени. Очевидно, что всякий многочлен первой степени неприводим. Из основной теоремы алгебры комплексных чисел вытекает, что неприводимые многочлены над С — это только многочлены первой степени, а из следствия теоремы 4.1 — что неприводимые многочле- ны над R — это многочлены первой степени и многочлены второй степени с отрицательным дискриминантом. В следующем парагра- фе мы обсудим вопрос о неприводимых многочленах над Q и, в част- ности, увидим, что они могут иметь любую степень. Пусть теперь А — любое евклидово кольцо. Лемма 1. Если простой элемент р кольца А делит произведение а1а2...ап, то он делит хотя бы один из сомножителей а19 а2,ап. Доказательство. Докажем это утверждение индукцией по п. При п = 2 предположим, что р не делит . Тогда (р, = 1 и, значит, существуют такие и, и G А, что ри = 1. Умножая это равенство на а2, получаем puaz + a^u^a^ откуда следует, что р делит а2. При п > 2 представим произведение а1а2...ап в виде а1(а2...ап). По доказанному р | или р | а2...ап. Во втором случае по предполо- жению индукции р | ait где i — один из индексов 2,..., п. □ Теорема 2. В евклидовом кольце всякий необратимый ненулевой элемент может быть разложен на простые множители, причем это разложение единственно с точностью до перестановки множи- телей и умножения их на обратимые элементы. Замечание 4. Говоря о разложении на простые множители, мы не исключаем разложения, состоящего только из одного множи- теля.
122 Глава 3. Начала алгебры многочленов Доказательство. Назовем необратимый ненулевой элемент а € € А хорошим, если он может быть разложен на простые множители. Предположим, что существуют плохие элементы. Выберем из них элемент с наименьшей нормой. Пусть это будет элемент а. Он не может быть простым. Следовательно, а = Ьс, где Ь и с — необрати- мые элементы. Имеем N(b) <N(a) и N(c) <N(a) и, значит, b и с — хорошие элементы; но тогда, очевидно, и а — хороший элемент, что противоречит нашему предположению. Таким образом, всякий необратимый ненулевой элемент кольца А может быть разложен на простые множители. Докажем теперь индукцией по и, что если а = Р1Р2--Рп = Ч1Ч2---Чт> (9) где Pi, q}- — простые элементы, то т = п и, после подходящей перену- мерации множителей, pt~q, при i = 1,2,..., п. Прип=1 это утверждение очевидно. Прип>1 имеем Pi\qiq2---<lm и по лемме 1 существует такой номер i, что рг | qr Тогда рг ~ qt. Можно считать, что i = 1 и pj =qP Сокращая равенство (9) на рь получаем Р2---Рл =Q2---Qm- По предположению индукции отсюда следует, что т = п и, после подходящей перенумерации, pt- ~ qL при i = 2,..., п. Тем самым утвер- ждение доказано. □ Следствие. Пусть а = р*1 ...pss — разложение элемента аеА на простые множители, причем р( pj при i И j. Тогда всякий дели- тель d элемента а имеет вид d = cp'1‘...p^ где 0 $ lj $ kj (i = 1,..., s), ас — обратимый элемент. Доказательство. Пусть a = qd. Разложим q и d на простые мно- жители. Перемножив эти разложения, мы получим разложение а на простые множители. Сравнив его с данным разложением, получим требуемый результат. □ Задача 2. Доказать, что в евклидовом кольце а) Ь | а, с | а и (Ь, с) = 1 => Ьс | а; б) с | ab и (Ь, с) = 1 => с | а. Задача 3. Наименьшим общим кратным элементов а и b целост- ного кольца называется их общее кратное (т. е. элемент, делящийся на а и на Ь), делящее все их общие кратные. Оно обозначается
§ 6. Многочлены с рациональными коэффициентами 123 через [а, Ь] или НОК{а, Ь}). Доказать, что в евклидовом кольце для любых элементов а, b существует наименьшее общее кратное [а, Ь], причем (а, Ь)[а, Ь] ~аЬ. Задача 4. В кольце Z[i] (см. пример 1) разложить на простые множители числа 2, 3 и 5 и подумать, в чем принципиальная раз- ница между этими тремя случаями. Известно, что простых чисел бесконечно много. Напомним рас- суждение, которое это доказывает. Предположим, что рь р2, •••, рп — это все простые числа. Тогда число PiP2---pn + 1 не делится ни на од- но из них, что, очевидно, невозможно. Точно такое же рассуждение показывает бесконечность числа нормированных неприводимых многочленов над любым полем К. Если поле К бесконечно, то этот результат не представляет интереса, так как в этом случае имеется бесконечно много нормированных многочленов первой степени. Однако если поле К конечно, то этот результат означает, что име- ются неприводимые многочлены сколь угодно высокой степени. На самом деле в этом случае имеются неприводимые многочлены любой степени. Задача 5. Перечислить неприводимые многочлены степеней 4 над полем Z2 и доказать, что существует ровно 6 неприводимых многочленов степени 5. § 6. Многочлены с рациональными коэффициентами Из однозначности разложения целого числа на простые множи- тели вытекает Теорема 1. Если многочлен f = aQxn 4- ajx”"1 4-... 4-ап_гх 4- ап € Z[x] имеет рациональный корень где u,veZ, (и, и) = 1, то и | ап, и | а0. Доказательство. Имеем 0 = уП/(“) =аоип +а1ип~'и 4-... 4-an_1uvn"1 + апип. Все слагаемые в правой части, кроме последнего, делятся на и. Сле- довательно, и последнее слагаемое должно делиться на и. Но так как и и и взаимно просты, то ап делится на и (см. задачу 5.2, б)). Аналогично доказывается, что а0 делится на и. □
124 Глава 3. Начала алгебры многочленов Следствие. Если нормированный многочлен с целыми коэффици- ентами имеет рациональный корень, то этот корень целый. Очевидно, что всякий многочлен с рациональными коэффициен- тами пропорционален многочлену с целыми коэффициентами. По- этому теорема 1 позволяет путем конечного числа испытаний най- ти все рациональные корни любого многочлена с рациональными коэффициентами. Конечно, таких корней, как правило, нет. Приво- димый ниже специально подобранный пример относится к разряду тех исключений, которые подтверждают правило. Пример 1. Рациональными корнями многочлена f = 2x4 - 7х3 + 4х2 - 2х - 3 согласно теореме 1 могут быть только ±|, ±1, ±|, ±3. Испытания дают 2 корня: Xi = 3, х2 ~ ~~ 2 * Следующая теорема может рассматриваться как обобщение тео- ремы 1. Теорема 2 (лемма Гаусса). Если многочлен с целыми коэффици- ентами разлагается в произведение двух многочленов с рациональ- ными коэффициентами, то он разлагается в произведение двух про- порциональных им многочленов с целыми коэффициентами. Иначе говоря, если f G Z[x] и f = gh, где g, h G Q[x], то существу- ет такое AgQ*, что Ag, A“1hGZ[x]. Перед тем, как доказывать эту теорему, введем некоторые вспо- могательные понятия. Многочлен f G Z[x] называется примитивным, если его коэф- фициенты взаимно просты в совокупности, т. е. не имеют общего простого делителя. Если такой делитель есть, то его можно вынести за скобки. Поэтому всякий ненулевой многочлен с целыми коэффи- циентами, а значит, и всякий ненулевой многочлен с рациональны- ми коэффициентами, пропорционален некоторому примитивному многочлену (определенному однозначно с точностью до умножения на ±1). Пусть р — какое-нибудь простое число. Определим редукцию по модулю р многочлена f = aQxn 4- с^х”"14-... 4-ап_^х + ап G Z[x]
§ 6. Многочлены с рациональными коэффициентами 125 как многочлен [/]₽ = [а0]рл:п + [ajpx'’-1 +... + [a,i-i]px+ [an]peZp [х], коэффициенты которого суть вычеты по модулю р коэффициентов многочлена /. Из определения операций над вычетами следует, что [/+g]p = [/]p + [g]p, [/.?]₽ = [/]₽[£]₽ для любых многочленов /, g G Z[x]. Доказательство теоремы 2. Пусть f G Z[x] и f = gh, где g, h € €Q[x]. Согласно предыдущему, многочлены g и h пропорциональ- ны каким-то примитивным многочленам gj и Имеем / = Mgihi, geQ. Пусть где и, v е Z, (u, v) = 1. Докажем, что и = ±1, откуда будет следовать утверждение теоремы. Если это не так, то пусть р — какой-нибудь простой делитель числа v. В равенстве p/ = ugihi сделаем редукцию по модулю р. Мы получим 0=[u]p[g1]p[h1]p. Однако [ы]р /0, так как ин и по предположению взаимно просты. В то же время [gj]p 0 0 и [hT]р / 0, так как gj и /ц — примитивные многочлены и, следовательно, все их коэффициенты не могут де- литься на р. Это противоречит отсутствию делителей нуля в кольце Zp[x]. □ Следствие. Если многочлен feZfx] допускает разложение в про- изведение двух многочленов положительной степени в кольце Q[x], то он допускает такое разложение и в кольце Z[x]. Это существенно облегчает доказательство неприводимости многочленов над Q. Пример 2. Пусть р — простое число. Докажем неприводимость над Q «многочлена деления круга на р частей» / = хр-1+хр_2 + ...4-х + 1 = ^^. J х-1 (Комплексными корнями этого многочлена являются все нетриви- альные корни р-й степени из 1, которые вместе с 1 делят окруж-
126 Глава 3. Начала алгебры многочленов ность |z| = 1 на р равных частей.) Как следует из формулы бинома Ньютона (см. §1.5), в кольце Zp[x] имеет место равенство хр-1 = (х-1)р, так что [/]р = (х-1)р-1. Если / = gh, где g,heZ[x] — многочлены положительной степени, то [/]р = [g]p[h]p и, значит, [g]p = (x-l)fc, [h]p = (x-l)' (kJ>O,k + /=p-l). Следовательно, [g(l)]p = [g]p(D = 0, [hCl)]p = [h]p CD = 0, t. e. g(l) и h(l) делятся на p. Но тогда /(1) = g(l)h(l) делится на p2, что не соответствует действительности, ибо J(l) = р. Имеется способ, принадлежащий Кронекеру, который в принципе поз- воляет для любого многочлена с целыми коэффициентами определить, при- водим он или неприводим над Q. Он основывается на следующих соображе- ниях. Пусть f е Z[x] — многочлен степени и, не имеющий целых корней. Предположим, что он разлагается bZ[x] в произведение двух многочленов положительной степени: f=gh. Тогда степень одного из них, скажем, g, не превосходит т = [^] • Будем придавать переменной х различные целые значения х0, хь ..., хП1. Из равенств /(x,)=g(xl)h(xl) следует, что g(x,) |/(х,) при 1 = 0,1,..., т. Многочлен g однозначно опреде- ляется своими значениями в точках х0, хь ...,хпг Выбирая всевозможные наборы делителей d0, dlt..., dm целых чисел /(х0), /(хД ..., /(хш) и находя для каждого из них интерполяционный многочлен степени гп, принима- ющий в точках х0, хь ..., хП| значения dQidlf ...,dm, можно найти всех кан- дидатов на роль g (их будет конечное число). Те из них, которые имеют дробные коэффициенты, следует сразу отбросить. Испытав оставшиеся мно- гочлены, можно определить, имеются ли среди них делители многочлена /, в зависимости от чего и будет решен вопрос о приводимости последнего.
§ 7. Многочлены от нескольких переменных 127 § 7. Многочлены от нескольких переменных Функция вещественных переменных х1}х2, ...,хп называется многочленом, если она может быть представлена в виде /(Х1,Х2, ...,Xn) = S С10) к},к2,...,кц где суммирование в правой части происходит по конечному числу наборов (kb k2,kn) неотрицательных целых чисел. (Формально можно считать, что суммирование происходит по всем таким набо- рам, но лишь конечное число коэффициентов ак к2...кп отлично от нуля.) Многочлены образуют подалгебру в алгебре всех функций от х2,..., хп, Она называется алгеброй многочленов от х2,..., хп над R и обозначается R[xb х2,..., хп]. Можно показать (см. теорему 1 ниже), что представление много- члена над R в виде (10) однозначно, т. е. коэффициенты многочлена определяются его значениями. При определении алгебры многочленов от п переменных над любым полем К возникает такая же трудность, как и в случае одной переменной. Это приводит к необходимости формального определе- ния, которое может быть дано, например, следующим образом. Рассмотрим бесконечномерную алгебру над К с базисом {ek]k2...kn • ^1» ^2» •••» kn G. Z+} и таблицей умножения Очевидно, что эта алгебра коммутативна и ассоциативна и что эле- мент е00 0 является ее единицей. Она называется алгеброй много- членов над К и обозначается через х2,..., хп]. Условимся отождествлять элементы вида ае00 0 (а е К) с соответ- ствующими элементами поля К и введем обозначения е10...0 = х1> е01...0 = х2» е00...1 — хп‘ Тогда _________________________________________ к] к2 к ек1к2...к„=х1 ‘х2 2...х*"
128 Глава 3. Начала алгебры многочленов и любой элемент S akik2...knek}k2...k„ к},к2,...,кп записывается в обычном виде (10). Многочлен (10) называется однородным степени d, если %к2...1с„=0 при kj 4-k2 + ... + kn/d. Однородные многочлены заданной степени d образуют конечномер- ное подпространство, так как имеется лишь конечное число набо- ров (кь к2,кп) целых неотрицательных чисел, удовлетворяющих условию ki + к2 +... + кп = d. Задача 1. Доказать, что размерность пространства однородных многочленов степени d от п переменных равна rrd_ n(n + l)...(n + d-l) (число сочетаний с повторениями из п по d). Любой многочлен однозначно представляется в виде суммы од- нородных многочленов степеней 0,1,2,..., называемых его одно- родными компонентами. (Лишь конечное число из них отлично от нуля.) Степенью (по совокупности переменных) ненулевого многочле- на называется максимальная из степеней его ненулевых членов или, что то же самое, максимальная из степеней его ненулевых одно- родных компонент. Степень многочлена f обозначается через deg f. Справедливы следующие соотношения: deg(/ + g)^max{deg/,degg}, (11) deg(/g) = deg/ + degg. (12) Первое из них очевидно, второе мы докажем чуть позже. С другой стороны, каждый многочлен f е К[х1} х2,..., хп] одно- значно представляется в виде /(X1,X2) ...,Xn)= S Л(*2> •••.Xn)xf. (13) k=0
§ 7. Многочлены от нескольких переменных 129 где /0, /i, f2,... —какие-то многочлены от х2,...»хп, лишь конечное число которых отлично от нуля. Наибольший из номеров многочле- нов Д, отличных от нуля, называется степенью многочлена f по х} и обозначается через degX] /. Пользуясь представлением (13), можно рассматривать кольцо К[х1? х2, ...,хп] как кольцо многочленов от х2 с коэффициентами изК[х2, ...,хп]: К[хъх2, ...,хп]=К[х2,...,xn][xj. (14) Замечание 1. Мы говорим о кольцах, а не об алгебрах, так как по опре- делению К [хь х2, ...,х„] есть алгебра надК, вто время какК[х2,..., х„] [xj есть алгебра над К[х2, ...,хп]. Однако если рассматривать К[х2,..., xn][Xj] как алгебру над К (пользуясь тем, что К[х2,хп] ЭК), то можно говорить о равенстве алгебр. Предложение 1. Алгебра К[хъ х2,..., хп] не имеет делителей нуля. Доказательство. В §1 было фактически доказано (см. замеча- ние 1.3), что кольцо многочленов от одной переменной над целост- ным кольцом также является целостным кольцом (в частности, не имеет делителей нуля). Поэтому равенство (14) позволяет доказать наше утверждение индуктивным путем, начиная с поля К. □ Теперь мы в состоянии доказать соотношение (12). Разложим многочлены f и g на однородные компоненты: / = /o + /i + -+/d (deg fk = k, fd/0), £=£o+gi + •••+& (deggfc = k,ge#O). Ясно, что при их перемножении не появится членов степени > d + е, а сумма всех членов степени d + e будет равна fdge. По доказанному fdge / 0. Следовательно, deg/g = d + e = deg/ + degg. Как и в случае п = 1, всякий многочлен от п переменных над полем К определяет функцию на Кп со значениями в К. Теорема 1. Если поле К бесконечно, то разные многочлены от п переменных над К определяют разные функции. Доказательство. Как и в случае многочленов от одной перемен- ной (см. доказательство теоремы 1.1), достаточно доказать, что нену- левой многочлен определяет ненулевую функцию. Докажем это ин- дукцией по п.
130 Глава 3. Начала алгебры многочленов При п = 1 это составляет содержание теоремы 1.1. Предположим теперь, что многочлен f GK[xb х2,..., хп] (и > 1) определяет нуле- вую функцию. Представим его в виде (13) и придадим какие-то значения переменным х2, • Мы получим многочлен от одной переменной Xj с коэффициентами из К, обращающийся в нуль при любом значении хР По теореме 1.1 все его коэффициенты равны нулю. Таким образом, каждый из многочленов fk еК[х2) ..., х„] об- ращается в нуль при любых значениях х2,..., хп, т. е. определяет ну- левую функцию. По предположению индукции отсюда следует, что Д = 0 при любом к; но тогда и f = 0. □ Иногда бывает полезно следующее более сильное утверждение, которое легко выводится из доказанной теоремы. Следствие. Пусть поле К бесконечно и heK[xlf х2, ...,xj — ка- кой-либо ненулевой многочлен. Еслимногочлены/, g<EK[x}, х2,..., хп] принимают одинаковые значения при всех значениях переменных хг, х2,..., хп, при которых многочлен h не обращается в нуль, то они равны. Доказательство. При указанных условиях многочлены fh и gh принимают одинаковые значения вообще при всех значениях пе- ременных и, значит, fh = gh. Так как в алгебре многочленов нет делителей нуля (предложение 1), то отсюда следует, что f — g^ □ Замечание 2. Если поле К конечно, то теорема и ее доказатель- ство тем не менее остаются в силе для многочленов, степень кото- рых по каждому из переменных меньше числа элементов поля К (см. замечание 1.5). Задача 2. Доказать, что если поле К содержит q элементов, то функции, определяемые одночленами х*1...х*п с kb ...,kn<q, состав- ляют базис в пространстве всех функций на Кп со значениями в К. При и > 1 члены многочлена от п переменных нельзя, вообще говоря, однозначно упорядочить по их степеням, поскольку может быть несколько членов одинаковой степени. Между тем какое-то упорядочение иногда бывает полезно. В этих случаях обычно ис- пользуют лексикографическое (т. е. подобное упорядочению слов в словаре) упорядочение, при котором вначале сравниваются по- казатели при х15 затем, если они равны, показатели при х2 и т.д. Если одночлен и лексикографически старше одночлена и, то мы будем писать и >- и. Согласно определению, это означает, что первая из переменных, которая входит в и и и с разными показателями, входит вис большим показателем, чем в и.
§ 7. Многочлены от нескольких переменных 131 Предложение 2. Отношение лексикографического упорядочения одночленов обладает следующими свойствами: 1) если u^vuv^w, то и (транзитивность)} 2) если u^v, то иш>- vw для любого одночлена ш\ 3) если u1'^v1 ии2>- иъ то и1и2 >- и^. Первое из этих свойств, собственно, и дает основание называть отношение «^» упорядочением. Доказательство. 1) Пусть первая переменная, которая не вхо- дит во все одночлены и, и, ш с одним и тем же показателем, входит в них с показателями k, Z, т соответственно. Тогда k I гл, причем хотя бы в одном из двух случаев имеет место строгое нера- венство. Следовательно, к > т, а это и означает, что и >- ш. 2) При умножении на ш к показателям, с которыми каждая из переменных входит в и и и, добавляется одно и то же число, и знак неравенства (или равенства) между этими показателями не меня- ется, а только эти неравенства и имеют значение при сравнении одночленов. 3) Пользуясь предыдущим свойством, получаем иги2 '^v1u2'^v1 и2. □ Пример 1. Следующий многочлен расположен по лексикографи- ческому убыванию членов: х^х2 + х^Хз + 2x^2 + х2х% - х2х% + 3. Обратите внимание на то, что член хгх1х3 лексикографически млад- ше х^х2, хотя его степень больше. Среди ненулевых членов любого ненулевого многочлена f G G/С[хъх2, ...,хп] имеется единственный, который лексикографи- чески старше всех остальных. Он называется старшим членом многочлена /. Предложение 3. Старший член произведения ненулевых много- членов равен произведению их старших членов. Доказательство. Достаточно доказать это утверждение для двух многочленов. Пусть /ь/2— ненулевые многочлены, и2 — их старшие члены и Pj, v2 — какие-то их члены. Если / Uj или и2 / и2, то в силу предложения 2
132 Глава 3. Начала алгебры многочленов Следовательно, после приведения подобных членов в произведении /1/2 произведение щи2 сохранится в качестве ненулевого члена, ко- торый старше всех остальных. □ § 8. Симметрические многочлены Определение 1. Многочлен f eK[xlt х2,х„] называется сим- метрическим, если он не изменяется ни при каких перестановках переменных. Так как любая перестановка может быть осуществлена путем последовательных перестановок двух элементов, то многочлен яв- ляется симметрическим, если он не изменяется при перестановке любых двух переменных. Очевидно, что каждая однородная компонента симметрического многочлена также является симметрическим многочленом. Пример 1. Степенные суммы = + *2+ (k = l, 2,...), очевидно, являются симметрическими многочленами. Пример 2. Следующие симметрические многочлены называют- ся элементарными симметрическими многочленами: сг1=х1+х2 + --- + ^л, (Т2 = XjX2 + XjX3 + ... + Xn_iXn, °k= L оп=х1х2...хп. Пример 3. Определитель Вандермонда V(x1,x2) ...,х„) = П(х| -хР i>j (см. пример 2.4.5), представляющий собой произведение разностей всевозможных пар переменных, при перестановках переменных мо- жет только умножиться на ±1 за счет того, что в некоторых случаях уменьшаемое и вычитаемое поменяются ролями. Число таких слу-
§ 8. Симметрические многочлены 133 чаев равно числу инверсий в соответствующей перестановке. Сле- довательно, V(xki, хк2, = sgn(k1; k2,kJVCxj, x2).... xn). Таким образом, сам определитель Вандермонда не является симмет- рическим многочленом, но таковым является его квадрат У(хъх2>..хп)2 = П(х, - х})2. i>J Пример 4. При любых перестановках переменных хь х2, х3, х4 многочлены hi = XiX2 4- х3х4, h2 = XjX3 4- х2х4, h3 = хгх4 4- х2х3 переставляются между собой. Поэтому любой симметрический мно- гочлен от них будет симметрическим многочленом от хъ х2, х3, х4. В частности, таковым является их произведение hih2h3 = (XjX2 4- х3х4) (Х!Х3 + х2х4) (хтх4 4- х2х3). Задача 1. Доказать, что многочлен (Xi 4- х2 — х3 — х4) (Xj - х2 4- х3 - х4) (хг - х2 - х3 4- х4) является симметрическим. Симметрические многочлены находят применение в исследова- нии алгебраических уравнений с одним неизвестным благодаря формулам Виета (см. § 2), которые выражают элементарные симмет- рические многочлены от корней алгебраического уравнения через его коэффициенты (при условии, что число корней уравнения в рас- сматриваемом поле равно его степени). Ясно, что только симметри- ческие многочлены от корней уравнения однозначно определены: значение любого другого многочлена, вообще говоря, зависит от нумерации корней. С другой стороны, мы покажем, что любой симметрический многочлен от корней алгебраического уравнения может быть выражен через коэффициенты этого уравнения. Пример 5. Многочлен $2 = х* 4-х^ 4-... 4-х^ является симметри- ческим. Легко видеть, что s2 = cr2 -2сг2. (15) Поэтому сумма квадратов корней алгебраического уравнения хп 4- сцх'1”14- а2хп~2 4-... 4- ап_гх 4- ап = О равна а2-2а2.
134 Глава 3. Начала алгебры многочленов Очевидно, что сумма и произведение симметрических многочле- нов, а также произведение симметрического многочлена на число являются симметрическими многочленами. Иными словами, сим- метрические многочлены образуют подалгебру в алгебре всех мно- гочленов. Следовательно, если F € К[ХЬ Х2,Хт] — произвольный мно- гочлен от т переменных и Д, f2,..., fm € К [хь х2,..., х„] — какие-то симметрические многочлены, то F(flt /2,..., fm) —также симметри- ческий многочлен от хъ х2,..., хп. Естественно поставить вопрос, нельзя ли найти такие симметрические многочлены f2,..., fm> чтобы всякий симметрический многочлен можно было выразить через них указанным способом. Оказывается, что в качестве таких многочленов можно взять элементарные симметрические многочле- ны сгъ а2,..., сгп. Теорема 1. Всякий симметрический многочлен единственным об- разом представляется в виде многочлена от элементарных симмет- рических многочленов. Доказательству теоремы предпошлем две леммы. Лемма 1. Пусть и = ах^х^-.-Хп1 — старший член симметриче- ского многочлена f. Тогда k^k2^ ...^кп. (16) Доказательство. Предположим, что < ki+1 для некоторого i. Наряду с членом и многочлен f должен содержать член / к\ к'+1 к; к и =ax11...xi'+1xi;1...x^’, получающийся из и перестановкой х, и х1+1. Легко видеть, что и' >- и. Это противоречит тому, что и — старший член многочлена /. □ Лемма 2. Для любого одночлена и = х^х!^..^", показатели которого удовлетворяют неравенствам (16), существуют такие неотрицательные целые числа llf 12,..., lni что старший член много- члена совпадает с и. Числа 12,..., 1П определены этим условием однозначно. Доказательство. Старший член многочлена ак равен ххх2...хк. В силу предложения 7.3 старший член многочлена aj1 сг^2.. равен х'1 (XjXz)'2 • • • (*1Х2.. .хп)'" = х'1 +'2+-+1пх%+• • +'".. .x'j.
§ 8. Симметрические многочлены 135 Приравнивая его одночлену и, получаем систему линейных урав- нений Z14-Z24-...4-Zn = k1, Z2 + ... + /n = k2, In kn, которая, очевидно, имеет единственное решение i^k-k^i (i = 1,2,..., п — 1), Zn = kn. (17) Из условия леммы следует, что определенные таким образом числа 11, /2, • • •> 1п неотрицательны. □ Замечание 1. Уравнение l1+Z2 + ... + Zn = k1 показывает, что сте- пень одночлена X* Х^.-.Хп по совокупности переменных равна сте- пени одночлена и по хР Доказательство теоремы 1. Пусть f е К[х1,х2, ...,хп] — сим- метрический многочлен. Нам нужно найти такой многочлен F е eK[XlfX2i ...,Хп],что F(cr1Jcr2,...>CTn)=/. Если f = 0, то можно взять F = 0. В противном случае пусть = = ах^*22 ••••*£" —старший член многочлена /. По лемме 1 выполня- ются неравенства (16). По лемме 2 существует такой одночлен Ft е G Х[ХЪ Х2,..., Хп], что старший член многочлена F^dp сг2,..., сгп) равен Пр Рассмотрим симметрический многочлен f1=f-F1(ava2,...,(Tn). Если j\ = 0, то можно взять F = Fp В противном случае пусть и2 — старший член многочлена /р Ясно, что он младше, чем Up Существу- ет такой одночлен F2 еХ[Хр Х2,..., Хп], что старший член многочле- на F2(cTp сг2,..., сгп) равен и2. Рассмотрим симметрический много- член Л = /1-^2(Сг1.Ог2> Если f2 = 0, то можно взять F = F1+F2.B противном случае, продол- жая процесс, получаем последовательность симметрических много- членов /, /р /2,..., старшие члены которых удовлетворяют неравен- ствам
136 Глава 3. Начала алгебры многочленов По лемме 1 показатель при любой переменной в любом из одно- членов ит не превосходит показателя при jq в этом одночлене, а он, в свою очередь, не превосходит кР Поэтому для наборов показа- телей одночленов ит имеется лишь конечное число возможностей, так что описанный выше процесс должен оборваться. Это означа- ет, что fM = 0 для некоторого М. В качестве F можно тогда взять + F2 + ...+FM. Докажем теперь, что многочлен F определен однозначно. Пред- положим, что F и G — такие многочлены, что К(СГ1Э сг2,сгп) = G(cr1, сг2, Рассмотрим их разность Н = F - G. Тогда Жстьсгг, ...,сгп) = О. Нам нужно доказать, что Н = 0. Предположим, что это не так, и пусть НЪН2, — все ненулевые члены многочлена Н. Обо- значим через wt (i = 1, 2,..., $) старший член многочлена Н^сгъа2>„.,(jn)eK[xbx2, ...,хп]. В силу леммы 2 среди одночленов w2,ws нет пропорцио- нальных. Выберем из них старший. Пусть это будет и\. По по- строению одночлен и?! старше всех остальных членов многочле- на сг2,..., ап) и всех членов многочленов Hi(alJo‘2, (i = 2,Поэтому после приведения подобных членов в сумме сг2,<тп) + ЛгСо"!, ог2> •••> &п) + ••• + сг2,..., сгп) = = Н(сг1,сг2, ...,стп) член и\ сохранится, так что эта сумма не будет равна нулю, что противоречит нашему предположению. □ Замечание 2. Согласно замечанию 1, для любого т deg= degX)um $ degX) Uj = degXj /(= kJ. Следовательно, degF = degX)/. (18) Следуя доказательству этой теоремы, можно в принципе найти выражение любого конкретного симметрического многочлена че- рез (J11 сг2,..., (Jn.
§ 8. Симметрические многочлены 137 Пример 6. Выразим через <72,..., сгп многочлен / = $з = хЗ + хз+ . +х3 Представим вычисления в виде таблицы. т СГ2, ...» СГ„) f,n 1 О'3 = 52 *,3 + 3 52 xfxj + +6 S xixixk i<j<k -з52х2х,-б 52 x,xixk i<j<k 2 -3X1*2 -3<T1<72 = -3 52x,2Xj- -9 Xkxixixk з 52 x<xixk i<j<k 3 3X]X2x3 3<т3 = 3 S xixjxk i<j<k 0 Таким образом, $3 = CTj - + Зсг3 (19) На практике для однородных симметрических многочленов удоб- нее применять другой способ, который мы поясним на следующем примере. Пример 7. Выразим через cr1)a2ia3> сг4 многочлен / = 01*2 + *3*4) <*1*3 + *2*4) <*1*4 + *2*з) из примера 4. В обозначениях доказательства теоремы 1 имеем щ = = *2хз*4• Не производя вычислений, можно найти с точностью до коэффициентов возможных кандидатов на роль одночленов и2, и3,... Во-первых, их показатели должны удовлетворять неравен- ствам леммы 1. Во-вторых, поскольку f — однородный многочлен степени 6, сумма их показателей должна равняться 6. В-третьих, они должны быть младше uv Выпишем в таблицу все наборы по- казателей одночленов, удовлетворяющих этим условиям, в поряд- ке лексикографического убывания, начиная с набора показателей одночлена и1} а справа выпишем соответствующие произведения элементарных симметрических многочленов, найденные по форму- лам (17): _____________________ 3 111 2 2 2 0 2 2 11 b n b b к о о
138 Глава 3. Начала алгебры многочленов Итак, мы можем утверждать, что f = af а4 + асг^ + Ьсг2сг4. Для того чтобы найти коэффициенты а и Ь, будем придавать в этом равенстве переменным х1,х2,х3,х4 какие-нибудь выбранные зна- чения. Представим вычисления в виде таблицы, в правом столбце которой будем выписывать получаемые уравнения: *1 *2 *3 х4 СГ1 сг2 ст3 °4 f 1 1 1 0 3 3 1 0 1 а — 1 1 1 -1 -1 0 -2 0 1 8 —2Ь = 8 Таким образом, а = 1 и b = -4, так что / = afa4 + <72 -4а2а4. В случае неоднородного симметрического многочлена этот спо- соб можно применить к каждой его однородной компоненте и полу- ченные выражения сложить. Замечание 3. Изложенная теория без всяких изменений перено- сится на более общий случай, когда К — произвольное коммутатив- ное ассоциативное кольцо с единицей. Так, в случае К = Z получа- ется следующий результат: всякий симметрический многочлен с це- лыми коэффициентами представляется в виде многочлена с целыми коэффициентами от элементарных симметрических многочленов. Доказанная теорема в сочетании с формулами Виета позволя- ет найти любой симметрический многочлен от корней заданного алгебраического уравнения. А именно, пусть f G К[хъ х2,..., хп] — симметрический многочлен и F еК[Х1,Х2, ...,ХП] —такой много- член, что / = F(cr1> сг2>сгп). Пусть, далее, с2,..., сп — корни алгебраического уравнения аохп + а1хп~1 + ...+ап_1х + ап = 0 (а0 / 0). Тогда (20) ч uq a.Q а0 у Замечание 4. Пусть degXj f = к. Тогда degF = к (см. замеча- ние 2) и, домножив равенство (20) на aj, мы получим в правой части однородный многочлен степени к от а0, а1? а2,..., ап.
§ 8. Симметрические многочлены 139 Пример 8. Пусть сь с2, с3, с4 — корни уравнения х4 4- рх2 4- qx + г = 0. (21) Найдем уравнение 3-й степени, корнями которого являются числа ^1 =С1С2 ”^С3С4> ^2 = С1С3 + С2С4> ^3 = С1С4 + С2С3* Запишем его в виде у3 + а1у2 + а2у + а3 = 0. Согласно формулам Виета = ""(di 4-d2 4-d3), а2 = djd2 + ^1^3 + й2^з, g3 = — did2d3. Имеем di = h, (с1? с2, с3, с4), где hlt h2, h3 — многочлены из примера 4. Находим: hi + h2 + h3 = a2, h}h2 + h1h3 + h2h3 = £ xfxjxk=a1a3 -4cr4, j<k hih2h3 = a2a4 4- a2 - 4a2a4. (Последнее равенство есть результат примера 7.) По формулам Виета О’ 1 (сь с2» сз> сл)= ^2^1» с2> С3> С4^ =Р> Оз(сЪ С2, с3> с4) = “Ч» ОГ4(С1,С2>С3>С4) = Г- Следовательно, а3 = -р, a2 = -4r, a3 = 4pr-q2, т. е. искомое уравнение имеет вид y3-py2-4ry + (4pr-q2) = 0. (22) Задача 2. В обозначениях предыдущего примера доказать, что (с1 + с2-с3-с4)2 = 4(<11-р), (с1-с2 + с3-с4)2 = 4(d2 - Р), (сг - с2 - с3 + с4)2 = 4(d3 - р)
140 Глава 3. Начала алгебры многочленов и, кроме того, (Cj + с2 - с3 - с4)(q - с2 + с3 - с4) (q - с2 - с3 + с4) = —8q (23) (см. задачу 1). Пользуясь результатами этой задачи, можно свести решение уравнения (21) к решению уравнения (22) (при условии что char К 5^2). А именно, складывая с подходящими знаками равенства С1 + с2 + с3 + с4 - °, С1 + с2 - с3 - с4 = 2 x/dj-p, Ci - С2 + «3 - с4 = 2 yJd2~P> Cj — с2 — с3 + с4 = 2у53 — р, получаем 4,2,3,4 = | (±\Л*1-Р ± У<*2-Р ± ТЧз-р) . где число минусов должно быть четно. Исходные значения квадрат- ных корней здесь следует выбирать таким образом, чтобы их произ- ведение равнялось -q (см. формулу (23)). Уравнение (22) называется кубической резольвентой уравнения (21). § 9. Кубические уравнения При решении квадратных уравнений ключевую роль играет дис- криминант. По его обращению в нуль можно судить о наличии крат- ного корня, а по его знаку (в случае поля вещественных чисел) — о числе вещественных корней. Выясним смысл дискриминанта D((/?) квадратного трехчлена = aQx2 + аТх 4- а2 е С [х]. Пусть съ с2 — корни этого трехчлена. Тогда D(</)=a*-4aoa2 = a*[(^)2-^] = = a^[(ci+c2)2-4c1c2]=a2(ci -с2)2. В случае когда а0, аъ a2GR, полученная формула хорошо объяс- няет ту связь между дискриминантом и свойствами корней, о кото-
§ 9. Кубические уравнения 141 рой говорилось выше. А именно, имеются следующие три возмож- ности: 1) сь с2 G R, Cj / с2; тогда Cj — с2 — отличное от нуля веществен- ное число и > 0; 2) q = с2 G R; тогда q - с2 = 0 и = 0; 3) Cj = с2 R; тогда сх — с2 — отличное от нуля чисто мнимое число и <0. Что еще более важно, эта формула подсказывает, как можно определить дискриминант любого многочлена Ч> = аохп + ajx"-1 +... + an_jx + ап еВД (а0 / 0). Предположим вначале, что многочлен имеет п корней сь с2,... ..., спеК. Определим тогда его дискриминант по формуле 0(¥>)=а§"-2П(с<-с,)2. (24) i>j (Показатель при а0 не так важен; почему мы выбрали его именно таким, будет ясно из дальнейшего.) Иными словами, есть умноженное на а^п~2 значение сим- метрического многочлена (см. пример 8.3) /=П(^-^)2 i>j от корней многочлена (/?. Описанная в §8 процедура позволяет вы- разить D((/>) через коэффициенты многочлена (/?. Так как degX1/ = 2n-2, то в силу замечания 8.4 это выражение будет представлять собой некоторый однородный многочлен А степени 2п - 2 от а0, аг,ап: D(^) = A(a0,a1, ...,an). (25) Для нахождения многочлена А нет необходимости знать, что многочлен имеет п корней в К, Это позволяет определить дискри- минант любого многочлена по формуле (25). Замечание 1. Так как f имеет целые коэффициенты, то и А имеет це- лые коэффициенты (см. замечание 8.3). Замечание 2. Можно доказать (см. теорему 9.5.6), что для любого мно- гочлена (/? еВД степени п существует расширение L поля К, в котором имеет п корней. (Например, если K = R, то можно взять L = C.) Так как
142 Глава 3. Начала алгебры многочленов описанная выше процедура вычисления дискриминанта не зависит от того, над каким полем рассматривается многочлен <р (лишь бы его коэффициен- ты лежали в этом поле), то для £>((/?) будет справедлива формула (24), если в качестве сь с2,..., сп взять корни многочлена в поле L. Из определения (24) дискриминанта ясно, что многочлен G GC[x] имеет кратные корни тогда и только тогда, когда D(^) = 0. Это показывает, что наличие кратных корней является исключи- тельным обстоятельством: если выбирать коэффициенты многочле- на наудачу, то вероятность того, что он будет иметь кратные корни, равна нулю. Пусть теперь ip —кубический многочлен с вещественными коэф- фициентами и сь с2, с3 — его комплексные корни. Тогда О((/>) = а£(С1 - с2)2(cj - с3)2(с2 - с3)2. Имеются следующие три возможности (с точностью до перенумера- ции корней): 1) сь с2, с3 —различные вещественные числа; тогда D(c/?) > 0; 2) q,c2,c3€R, с2 = с3; тогда D((/?) = 0; 3) Cj G R, c2 = c3 R; тогда =Qq[(c! - c2)(Ci -c2)]2(c2 - c2)2 = OqIcj - c2|4(c2 - c2)2 < 0. Таким образом, мы приходим к тому же выводу, что и в случае квадратного трехчлена: все корни многочлена вещественны тогда и только тогда, когда D((/0 0. Задача 1. Доказать, что если — многочлен любой степени с ве- щественными коэффициентами, не имеющий кратных комплекс- ных корней, то sgnD(^) = (-l)f, где с — число пар комплексно-сопряженных мнимых корней много- члена (/?. Мы найдем теперь явное выражение дискриминанта кубическо- го многочлена через его коэффициенты, но перед этим сделаем некоторые общие замечания, позволяющие упростить вычисления. Любой многочлен можно нормировать, разделив на старший ко- эффициент, что не изменит его корней. Далее, любой нормирован- ный многочлен = хп 4- ajx”"14-а2хп~2 +... + an_Tx + ап
§ 9. Кубические уравнения 143 над полем нулевой характеристики (или, более общо, над полем, характеристика которого не делит п) с помощью замены приводится к многочлену Ф = у" + b2yn~2 + ... + bn_1y + bn, в котором коэффициент при уп-1 равен нулю. Многочлен такого ви- да называется неполным. При п = 2 именно таким способом получа- ется формула решения квадратного уравнения. При п > 2 эта замена не решает дела, но, во всяком случае, может упростить задачу. Найдем дискриминант неполного кубического многочлена 4>=x3 + px + q. (26) Следуя способу, изложенному в примере 8.7, будем искать выра- жение симметрического многочлена / = (*!- Х2)2(*1 ~ Х3)2(Х2 - Х3)2 через элементарные симметрические многочлены сг2, сг3. Много- член f является однородным степени 6, и его старший член равен х^х^. Выпишем наборы показателей старших членов симметриче- ских многочленов, которые могут встретиться в процессе, описан- ном в доказательстве теоремы 8.1, и соответствующие им произве- дения элементарных симметрических многочленов: 4 2 0 4 1 1 3 3 0 3 2 1 2 2 2 ^2 О'? о-з Мы видим, что f = ст* 0*2 + acr3 сг3 + bcr3 + со^о^Оз + da3. (27) Для вычисления D(</>) мы должны будем сделать в выраже- нии (27) подстановку о*1 = 0, <т2 = р, о-3 = -q. Поэтому коэффициенты а и с не будут влиять на окончательный результат, и мы можем их не находить.
144 Глава 3. Начала алгебры многочленов Для нахождения b и d будем в равенстве (27) придавать перемен- ным хь х2) х3 значения, указанные в следующей таблице, в правом столбце которой выписаны получаемые при этом уравнения: *1 *2 *3 О'] о2 ^3 / 1 -1 0 0 -1 0 4 —Ь = 4 2 -1 -1 0 -3 2 0 -27b + 4d = 0 Таким образом, b = —4, d = —27 и D(y>) = —4р3 —27q2. (28) Пример 1. Найдем число вещественных корней многочлена 4> = х3- О,3х2 - 4,3х + 3,9. С помощью замены у = х-0,1 приводим его к неполному многочлену (коэффициенты которого могут быть найдены по схеме Горнера, как в примере 2.3) i/>=y3 — 4,33у+ 3,468. Теперь D(<p) = = 4 • 4,333 - 27 • 3.4682 = 0,0013 > 0. Следовательно, многочлен у имеет 3 различных вещественных кор- ня. Замечание 3. Дискриминант кубического многочлена общего вида = aQx3 + агх2 + а2х + а3 равен D(y?) = a2a^ - 4а3а3 - 4а0а3 + 18а0а1а2аз ~ 27аоаз* Изложим теперь способ решения кубического уравнения. Предположим, что основное поле К содержит нетривиальный (т. е. отличный от 1) кубический корень из единицы, скажем, со. То- гда 1, со, со"1 —это все кубические корни из единицы, и по формуле Виета получаем со + со’^-1. (29)
§ 9. Кубические уравнения 145 Рассмотрим линейные многочлены hi + а>х2 + ^>-'1*з> ^2 = xi + о>“1х2 + ^>*з- При перестановке х2 и х3 они меняются местами, а при перестанов- ке и х2 многочлен переходит в a>h2, a h2 — в Отсюда следует, что многочлены / = h2 + h2, g = hih2 являются симметрическими. Выражая их через элементарные сим- метрические многочлены, получаем f = 2<Т1 — 9<т1сг2 + 27стз, £ = ст2-Зсг2. Пусть теперь сь с2, с3 — корни многочлена (26). Положим dj =Cj +сос2 + ы~1с3, d2 = Cj 4-co“1c2-i-a)c3. Из предыдущего следует, что d3 + dz = -27q, djd2 = -Зр и, значит, d3d3 = —27р3. Таким образом, d3 и d3 — это корни квадратного уравнения x2 + 27qx —27р3 = 0. Решая его, находим d?=27H + /i+?)- (30> d3=27(-|-/S+?)' (31) Заметим, что выражение, стоящее под знаком радикала, лишь мно- жителем — отличается от дискриминанта многочлена (26). Складывая равенства Ci + с2 + с3 = О, CiH- а>с2 + а>“1с3 = d1, c1d-a>“1c2d- coc3 = d2,
146 Глава 3. Начала алгебры многочленов с учетом соотношения (29) получаем С1 ~ з Wi Поскольку нумерация корней может быть произвольной, эта форму- ла на самом деле дает все три корня, если в качестве d} и d2 выби- рать всевозможные значения кубических корней из выражений (30) и (31), связанные полученным выше соотношением d1d2 = --3p. (32) Таким образом, мы приходим к следующей окончательной формуле с1,2,з у 2^7 27' 4' у 2 V 27 ' 4 ’ называемой формулой Кардано. Замечание 4. Формула Кардано имеет смысл, если извлекаются входящие в нее квадратные и кубические корни. В частности, если мы решаем по этой формуле кубическое уравнение с веществен- ными коэффициентами, то нам, вообще говоря, придется работать с комплексными числами, даже если нас интересуют только веще- ственные корни. Именно так обстоит дело в случае положительного дискриминанта, когда все три корня вещественны: в этом случае число, стоящее под знаком квадратного радикала, отрицательно. Пример 2. Найдем корни многочлена ф из примера 1. Имеем ё + Т="ife W) * -0,0000120, так что под знаком одного из кубических радикалов в формуле Кар- дано будет стоять число ~2+УХ7 + ^* ~1,734 + °>00347i * s* 1,73400[соз(л - 0,00200) + i sin(rc - 0,00200)]. Под знаком другого кубического радикала будет стоять комплекс- но-сопряженное число. Условие (32) означает в данном случае, что при извлечении кубических корней следует комбинировать их комплексно-сопряженные значения. При сложении комплексно-со- пряженных чисел получается их удвоенная вещественная часть.
§ 10. Поле рациональных дробей 147 Таким образом, q * 2 V1,73400 cos 7Г~0’°0200 * 1,20278, с2 % 2 ^/1,73400 cos -я—^0-2-°° 1,20001, с3 % -2 ^1,73400 cos 0,0°200 % -2,40277. § 10. Поле рациональных дробей Таким же образом, как кольцо целых чисел расширяется до поля рациональных чисел, любое целостное кольцо можно расширить до поля. Пусть А — целостное кольцо. Рассмотрим множество пар (а, Ь), где a, b G А, b # 0, и определим в нем отношение эквивалентности по правилу Ь1) ~ (а2, ^2) а1^2 = а2^1 • Рефлексивность и симметричность этого отношения очевидны; до- кажем его транзитивность. Если (аь bj ~ (а2, Ь2) и (а2, Ь2) ~ (а3, Ь3), то ^1Ь2Ь3 =а2^1^3 =^3^1^2> откуда после сокращения на Ь2 получаем <21Ь3 = а3Ь1? т.е. (a1,b1)~(a3,b3). Из данного определения следует, что (а, Ь) - (ас, Ьс) (33) для любого с 0 0. С другой стороны, как показывает следующая ниже цепочка эквивалентностей, любая эквивалентность (аъ Ь}) ~ ~ (^2, Ь2) является следствием эквивалентностей типа (33): (Qi> bj) ~ (ajb2, bjb2)= (q2^i> bjb2) ~ (а2, Ь2). (Мы сначала умножили оба члена пары (а1? Ьт) на Ь2, а затем сокра- тили оба члена получившейся пары на ЬР) Определим теперь сложение и умножение пар по правилам (аъ bj) + (а2, Ь2) = (атЬ2 + а2Ьь ЬХЬ2), (а1> Ьт)(а2, Ь2) = (ата2, ЬуЬ2).
148 Глава 3. Начала алгебры многочленов Докажем, что определенное выше отношение эквивалентности со- гласовано с этими операциями. В силу предыдущего достаточно показать, что при умножении обоих членов одной из пар (а1}Ьу) и (а2, Ь2) на элемент с / 0 сумма и произведение этих пар заменятся эквивалентными им парами; но очевидно, что при такой операции оба члена суммы и произведения умножатся на тот же элемент с. Класс эквивалентности, содержащий пару (а, Ь), условимся запи- сывать как «дробь» | или а/b (пока это просто символ, не подразуме- вающий фактического деления). Ввиду доказанного выше операции сложения и умножения пар определяют операции сложения и умно- жения дробей, осуществляемые по обычным правилам: ^1^2 ^2^1 bjb2 Qi . Q2 _ ь,ъ2 CZj CL2 bj Ь2 ^1^2 Докажем, что относительно этих операций дроби образуют поле. Любое конечное множество дробей можно привести к общему знаменателю, а сложение дробей с одинаковыми знаменателями сводится к сложению их числителей. Поэтому сложение дробей ком- мутативно и ассоциативно. Дробь у (= | при любом b / 0) служит нулем для операции сложения дробей, а дробь — - противоположна дроби Таким образом, дроби образуют абелеву группу относи- тельно сложения. Коммутативность и ассоциативность умножения очевидны. Сле- дующая цепочка равенств доказывает дистрибутивность умноже- ния дробей относительно сложения: f а1 1 °2 аз — (Q1 + а2)а3 _ а1а3 +а2а3 _ а3 а2 а3 V ъ ъ J Ъ3~ bb3 ” bb3 ~ b b3 b Ь3' Дробь | служит единицей для операции умножения дробей, а при а / 0 дробь | обратна дроби Построенное поле называется полем отношений (или полем дро- бей) кольца А и обозначается через Quot А. Сложение и умножение дробей вида у сводятся к соответству- J а b ющим операциям над их числителями. Кроме того, у = у только при а = Ь. Следовательно, дроби такого вида образуют подкольцо, изоморфное А. Условившись отождествлять дробь вида у с элемен- том а кольца А, мы получим вложение кольца А в поле Quot А. Далее,
§ 10. Поле рациональных дробей 149 поскольку ab _ а b 1 ~ Г дробь | равна отношению элементов а и b кольца А в поле Quot А. Таким образом, обозначение | можно теперь понимать содержа- тельным образом. В силу (33) дробь не изменится, если ее числитель и знаменатель умножить или разделить (если это возможно) на один и тот же эле- мент кольца А. Если А — евклидово кольцо, то путем сокращения числителя и знаменателя на их наибольший общий делитель любая дробь приводится к виду где (a, b) = 1. Такой вид дроби назы- вается несократимым. (Допуская вольность речи, обычно говорят просто о несократимой дроби.) Предложение 1. Любой вид дроби над евклидовым кольцом по- лучается из любого ее несократимого вида умножением числителя и знаменателя на один и тот же элемент. Доказательство. Пусть г = причем (а0, b0) = 1- Из равенства О Uq ab0 = а0Ь следует, что Ьо | а0Ь и, значит, Ьо | Ь. Пусть b = cb0; ясно, что тогдаа = са0. □ Следствие. Несократимый вид дроби над евклидовым кольцом определен однозначно с точностью до умножения числителя и зна- менателя на один и тот же обратимый элемент. Поле отношений кольца Z целых чисел есть поле Q рациональ- ных чисел. Поле отношений кольца К[х] многочленов над полем К называется полем рациональных дробей (или рациональных функ- ций) над полем К и обозначается через К(х). Каждая рациональная дробь определяет функцию на К со зна- чениями в К, определенную там, где ее знаменатель (в несократи- мой записи) не обращается в нуль. А именно, значением дроби - /(С) & (/, gGK[x]) в точке сеК называется число Легко видеть, что операции сложения и умножения дробей соответствуют таким же операциям над определяемыми ими функциями в их общей области определения. f f Задача 1. Доказать, что если рациональные дроби — и — над бесконечным полем К определяют функции, совпадающие в их об- щей области определения, то — = —.
150 Глава 3. Начала алгебры многочленов Рациональная дробь ~ называется правильной, если deg f <deg g. Очевидно, что сумма и произведение правильных дробей являются правильными дробями. Предложение 2. Всякая рациональная дробь единственным об- разом разлагается в сумму многочлена и правильной дроби. Доказательство. Пусть f, g е К[х], g / 0. Разделим f на g с остат- ком в кольце К[х]: f = qg + r (q,reK[x], degr<degg). (34) Тогда 7=q + ;> (35) g g причем — правильная дробь. Пусть теперь f _п , П g 1 gi — какое-нибудь другое разложение дроби - в сумму многочлена и правильной дроби. Тогда S и мы приходим к противоречию, так как ненулевой многочлен не может равняться правильной дроби. □ Многочлен q из равенства (35) называется целой частью дро- би -. g Предложение 3. Всякая правильная рациональная дробь вида f glg2--*gs ’ где gi> g2> • ••> g$ попарно взаимно просты, разлагается в сумму пра- вильных дробей со знаменателями g1} g2,..., gs. Доказательство. Докажем это утверждение индукцией по s. При s = 2, согласно теореме 5.1, существуют такие многочлены Hi и и2, что g1u1 +g2u2 = f- Разделив это равенство на g, получим L = 0* + g gi g2 *
§ 10. Поле рациональных дробей 151 гт. f „ „ и2 щ Так как дробь - правильная, то сумма целых частей дробей - и ~ & £1 #2 должна быть равна нулю. Выделив их, мы получим разложение дро- би в сумму правильных дробей со знаменателями и g2. При s > 2 заметим, что многочлены и g2...gs взаимно просты, и по доказанному дробь - разлагается в сумму правильных дробей со знаменателями gj и g2...gs. В свою очередь, вторая из этих дро- бей по предположению индукции разлагается в сумму правильных дробей со знаменателями g2,..., gs. □ Задача 2. Доказать, что разложение, о котором идет речь в пред- ложении 3, единственно. Изложим теперь теорию, используемую в математическом ана- лизе при интегрировании рациональных функций. Определение 1. Рациональная дробь ~ над полем К называется простейшей, если g = рк, где р еК[х] — неприводимый многочлен, и deg/<degp. В частности, всякая дробь вида а (х - с)к (а, СЕК) является простейшей. В случае К = С дробями такого вида исчерпы- ваются все простейшие дроби. В случае К = R имеются еще простей- шие дроби вида , 2lx+b^ ,к (a,b,p,qen, (x2 + px + q)fc где р2 - 4q < 0. Теорема 1. Всякая правильная рациональная дробь - разлагает- 8 ся в сумму простейших дробей. Более точно, если g = р^р^.-.р** — разложение многочлена g на неприводимые множители, то дробь разлагается в сумму простейших дробей со знаменателями Ръ РЬ -,p\',P2>Pv ->Р2> ->Ps>P2s> • • •> Pss• Доказательство. Ввиду предложения 3 дробь J- разлагается в сумму правильных дробей со знаменателями р*1, р£,..., р*\ Поэто- му нам достаточно доказать теорему в случае, когда g = рк, где р —
152 Глава 3. Начала алгебры многочленов неприводимый многочлен. В этом случае, разделив f на р с остат- ком, мы получим = + degr<degp. рк рК 1 р\ Второе из слагаемых является простейшей дробью, а первое являет- ся правильной дробью как разность правильных дробей. Продолжая эту процедуру, мы в конце концов разложим дробь в сумму про- стейших дробей со знаменателями р, р2,..., р*. р □ Замечание 1. В силу задачи 2 разложение, о котором идет речь в теореме, единственно. Пример 1. Предположим, что g=(x-c1)(x-c2)...(x-cn), где с1} с2,..., сп различны. Тогда / _ Q1 । а2 । । ап g x-Ci х-с2 х-сп’ где аь а2,..., ап е К. Для нахождения а, умножим обе части преды- дущего равенства на g и положим х = с,. Мы получим тогда /(с.) = af (с, - Cj)... (с( - c.-i) (с( - ci+1)... (с, - cn) = a,g'(с,), откуда Итак, / ^ у /(с.) g g'(C()(x-Cf) (36) (при условии, что deg / < degg). Интересно отметить, что, умножив обе части этого равенства на g, мы получим интерполяционную формулу Лагранжа у ь (х-С1)...(х-с,_1)(х-с,+1)...(х-сп) ,=1 ' (с< -q)-(q — с,-!)(с( -с,?+1)-..(сх -c„)’ которая задает многочлен / степени < и, принимающий в точках q, с2> ••> сп значения blt b2,..., Ьп.
§ 10. Поле рациональных дробей 153 Задача 3. Доказать равенство I _ 1 "у 6, Хп — 1 П X - Ei ' где £0, £n_j —комплексные корни п-й степени из единицы. Задача 4. Разложить в сумму простейших дробей над полем Zp (р простое) дробь — . Пример 2. Метод неопределенных коэффициентов, использо- ванный в предыдущем примере, разумно применять и в более об- щей ситуации. Разложим, например, в сумму простейших дробей над К рациональную дробь ___________________________х______ (х + 1)(х2 + 1)2’ Имеем, согласно теореме 1, _____х______ а . bx + c . dx + e (х + 1)(х2 + 1)2 “х + 1 х2 + 1 (х2 + 1)2’ где а, Ь, с, d, е — какие-то вещественные числа. Для их нахождения умножим предыдущее равенство на (х +1) (х2 +1)2: x = a(x2 + l)2 + (bx + c)(x + l)(x2 + l) + (dx + e)(x + l). Положив в этом равенстве последовательно х = -1 и x = i, получим -1 = 4а, i = (di + е) (i +1) = (е - d) + (d + e)i, откуда —i Далее, сравнив свободные члены и коэффициенты при х4, получим 0 = а + с + е, 0 = а + Ь, откуда Таким образом, ______х________ _ 1 . х-1 . х +1 (х +1)(х2 +1)2 ” 4(х + 1) 4(х2 + 1) 2(х2 + 1)2‘
Глава 4 Начала теории групп § 1. Определение и примеры В первой главе читатель познакомился с понятием абелевой группы. Абелевыми группами являются, в частности, аддитивная группа любого кольца, мультипликативная группа любого поля и ад- дитивная группа любого векторного пространства. Важнейшие при- меры неабелевых групп появляются как группы преобразований. Назовем преобразованием множества X всякое его отображение в себя. Определение 1. Группой преобразований множества X называет- ся всякая совокупность G его биективных преобразований, удовле- творяющая следующим условиям: 1) если (/?, гр € G, то ргр € G; 2) если р € G, то р~г е G; 3) id€G. (Здесь ргр обозначает произведение (композицию) преобразова- ний р и гр, a id — тождественное преобразование.) Пример 1. Совокупность S(X) всех биективных преобразова- ний множества X является группой преобразований. Если множе- ство X бесконечно, эта группа слишком велика, чтобы быть интерес- ной. Если X конечно, то можно считать, что X = {1, 2,..., и}; в этом случае группа S(X) называется группой подстановок или симмет- рической группой степени п и обозначается через Sn. Подстановка creSn может быть записана в виде таблицы в первой строке которой выписаны в каком-то порядке числа 1,2,... ..., п, а во второй строке — их образы, т. е. jk = cr(ifc). Фиксируя рас- положение чисел в первой строке (например, располагая их в по- рядке возрастания), мы видим, что число подстановок равно числу перестановок (см. §2.4), т. е. п!. При этом каждая подстановка мо- жет быть записана п! способами. Приведем пример на умножение
§ 1. Определение и примеры 155 подстановок: р 2 3 4W1 2 3 4А (4 3 2 ПЛ 2 3 4) (1 2 3 4А <3 4 1 2Д4 3 2 1J “ <2 1 4 зД4 3 2 1) ~ <2 1 4 3/ (Здесь мы сначала для удобства переписали первую подстановку таким образом, чтобы первая строка в ее записи совпала со второй строкой в записи второй подстановки.) Пример 2. Движения евклидовой плоскости Е2 (соответственно евклидова пространства Е3) образуют группу преобразований, обо- значаемую через IsomE2 (соответственно IsomE3). Замечание 1. В предыдущих главах мы обозначали через Е2 (соответственно Е3) множество векторов евклидовой плоскости (соответственно пространства). Здесь же символ Е2 (соответствен- но Е3) использован для обозначения самой евклидовой плоскости (соответственно пространства). Впрочем, если в плоскости (соответ- ственно в пространстве) фиксирована некоторая точка о (которую мы будем в дальнейшем называть началом отсчета), то можно договориться отождествлять точки с их радиусами-векторами от- носительно точки о. Это соглашение часто будет подразумеваться в дальнейшем. Замечание 2. В той версии аксиоматики евклидовой геометрии, кото- рая берет за основу понятие расстояния между точками, движение опре- деляется как преобразование, сохраняющее расстояния, и сформулирован- ное в примере 2 свойство является очевидной теоремой. В другой версии, в которой понятие движения является одним из неопределяемых понятий, это свойство является аксиомой, а утверждение о том, что всякое преоб- разование, сохраняющее расстояния, есть движение, является (несложной) теоремой. Пример 3. Пусть А = (</) — квадратная матрица порядка п с эле- ментами из поля К. Отображение Ч>а- Кп-^Кп, x=(xi,...,xn)--»y=(y1,...,yn), У. = Ёаих; = и), j=i называется линейным преобразованием пространства Кп. В матрич- ной форме, если представлять х и у как столбцы, можно запи- сать это определение как у = Ах. Если А и В—две матрицы, то (АВ)х = А(Вх), то есть ^дв — Т^д^в-
156 Глава 4. Начала теории групп Очевидно, что ipE — это тождественное преобразование. Поэтому, если матрица А невырожденна, преобразование </>a-j обратно преоб- разованию у>А (откуда, в частности, следует, что <рА биективно). Ли- нейное преобразование, определяемое невырожденной матрицей, называется невырожденным. Из вышесказанного следует, что невы- рожденные линейные преобразования образуют группу преобразо- ваний пространства Кп. Отметим, что всякое линейное преобразо- вание = <рА обладает следующими очевидными свойствами: Ч> (х' + х") = (х') 4- у) (х"), у (Ах) = Аср (х) (ср. определение линейной функции векторного аргумента в § 2.4). Замечание 3. Легко показать (см. §5.2), что эти свойства можно при- нять за определение линейного преобразования, т. е. всякое преобразова- ние пространства К", обладающее этими свойствами, имеет вид ipA для некоторой матрицы А. Пример 4. Назовем параллельным переносом векторного прост- ранства V на вектор а е V преобразование ta: х—>х + а. Легко видеть, что tatb = ta+b> id = t0- С1) Эти формулы показывают, что совокупность Trans (V) всех парал- лельных переносов пространства V является группой преобразо- ваний. Задача 1. Доказать, что совокупность всех возрастающих не- прерывных функций на отрезке [0,1], удовлетворяющих условиям /(0) = 0, /(1) = 1, является группой преобразований отрезка [0,1]. Анализируя свойства операции умножения в группах преобразо- ваний, мы приходим к следующему понятию группы, которое отли- чается от понятия абелевой группы отсутствием требования комму- тативности. Определение 2. Группой называется множество G с операцией умножения, обладающей следующими свойствами: 1) (ab)c = a(bc) для любых a, b, ceG (ассоциативность)-, 2) существует такой элемент е е G (единица), что ае = еа = а для любого a eG; 3) для всякого элемента а е G существует такой элемент а"1 G G (обратный элемент), что аа”1 =а-1а = е.
§ 1. Определение и примеры 157 Группа называется абелевой или коммутативной, если ab = ba Va,beG. Данное определение группы использует мультипликативную тер- минологию. Аддитивная терминология обычно используется только для абелевых групп (хотя в принципе операция в группе может на- зываться и обозначаться как угодно). Аналогично тому, как это было сделано для абелевых групп, до- казывается единственность единицы и обратного элемента в любой группе. Что касается деления, то в неабелевой группе следует разли- чать левое и правое деления. А именно, для любых a, b е G уравне- ние ах = Ь имеет единственное решение, равное а-1Ь, а уравнение ха = Ь имеет единственное решение, равное Ьа-1. В любой группе (ab)”1 = Ь“1а"1. В самом деле, (ab)(b-1a-1) = а(ЬЬ"1)а"’1 =аа"1 = е. Всякая группа преобразований является группой относительно операции умножения преобразований. Действительно, ассоциатив- ность этой операции известна, единицей служит тождественное преобразование, а обратным элементом — обратное преобразо- вание. Пример 5. Невырожденные квадратные матрицы порядка п над полем К образуют группу по умножению, обозначаемую GLn(K). Поскольку имеется взаимно однозначное соответствие между невы- рожденными квадратными матрицами порядка п и невырожденны- ми линейными преобразованиями пространства Кп, причем умно- жению матриц соответствует умножение линейных преобразова- ний, группа GLn(K) изоморфна группе невырожденных линейных преобразований пространства Кп. В дальнейшем мы будем иногда, говоря о группе GLn(K), рассматривать ее именно как группу линей- ных преобразований. Группа GLn(K) есть группа обратимых элементов кольца Ln(K) всех матриц. Если А — любое ассоциативное кольцо с единицей, то множество его обратимых элементов также является группой по умножению. Мы будем обозначать эту группу через А*. Част- ным случаем является мультипликативная группа К* поля К (состо-
158 Глава 4. Начала теории групп ящая из всех ненулевых элементов этого поля). Заметим, что К* = = GLi(K). Пример 6. Как показывают формулы (1), группа Trans (V) изо- морфна аддитивной группе пространства V. Пример 7. Конечная группа может быть задана своей таблицей умножения. Так, множество G = {е, а, Ь, с} с таблицей умножения е а Ь с е а Ь с е а Ь с а е с b Ь с е а с b а е является абелевой группой. В самом деле, элемент е служит ее еди- ницей и каждый элемент обратен сам себе. Далее, легко видеть, что любая перестановка элементов а, Ь, с является автоморфизмом мно- жества G с указанной операцией. Поэтому, если исключить триви- альные случаи с участием единицы и принять во внимание комму- тативность, доказательство ассоциативности сводится к проверке следующих соотношений: a2b = a (ab) = b, (ab)c = а (Ьс) = е. Задача 2. Доказать, что множество G = {А, Б, В, Г, Д, Е} с опера- цией, заданной таблицей А Б В Г Д Е А Б В Г д Е Е Д Г В Б А В Г Д Е А Б Б А Е Д Г В Д Е А Б В Г Г В Б А Е Д А Б В Г Д Е является группой, изоморфной S3. Задача 3. Доказать, что если в множестве G с ассоциативной операцией существует такой элемент е (правая единица), что ае = а для любого a G G, и для любого a G G существует такой элемент а”1 (правый обратный элемент), что аа-1 = е, то G — группа.
§ 1. Определение и примеры 159 Определение 3. Подгруппой группы G называется всякое под- множество Н с G, удовлетворяющее следующим условиям: 1) если a, b € Н, то ab G Я; 2) если а € Я, то а"1 е Я; 3) ееН. Замечание 4. Так как аа”1 = е, условие 3) можно заменить тре- бованием непустоты подмножества Н. Очевидно, что всякая подгруппа сама является группой относи- тельно той же операции. Сравнивая определения 1 и 3, мы видим, что группа преобразо- ваний множества X — это не что иное, как подгруппа группы S(X). Пример 8. Пусть f — какой-либо многочлен от п переменных. Тогда Symf = {creS„:f(xam,xam,...,xaM') = f(xbx2, ...,х„)} есть подгруппа группы Sn. В самом деле, пусть ст, т е Symf. Поло- жим ха(1) = у,-; тогда /(*<7т(1).*<7т(2). •••> *<тт(п))=/(Ут(1)> Ут(2)> •••.Уг(П))=/(У1,У2, •••>Уп) = = /(*<7(1). *а(2)> •••> *<7(П)) = /(*1> *2, Остальные две аксиомы подгруппы выполнены очевидным образом. В частности, многочлен f является симметрическим тогда и толь- ко тогда, когда Sym f = Sn. В качестве примера многочлена с ме- нее богатой, но не тривиальной симметрией рассмотрим много- член f = хтх2 + х3х4 (от 4 переменных). Легко видеть, что группа Sym/ состоит из 8 подстановок, сохраняющих разбиение множе- ства {1, 2, 3,4} на два подмножества {1, 2} и {3, 4}. (Допускается пе- рестановка этих подмножеств и перестановка элементов в каждом из них; см. по этому поводу также пример 5.11). Пример 9. Аналогично, невырожденные линейные преобразо- вания пространства Кп, сохраняющие какой-либо заданный много- член от п переменных, образуют подгруппу группы GLn(X). Невы- рожденные линейные преобразования пространства Rn, сохраня- ющие многочлен *1 + *2 + ••• + хп, называются ортогональными преобразованиями; они образуют подгруппу группы GLn(R), кото- рая называется ортогональной группой и обозначается через Оп. Так как в декартовых координатах пространства Е2 (соответственно Е3) многочлен х2 + у2 (соответственно х2 + у2 + z2) выражает квадрат
160 Глава 4. Начала теории групп длины вектора, то преобразования из группы О2 (соответствен- но О3) могут пониматься как линейные преобразования, сохраня- ющие длину вектора. Дадим явное описание группы О2. Условие ^=(с d)e°2 означает, что (ах + by)2 4- (сх + dy )2 = х2 + у2, т. е. a2 + c2 = b2 + d2 = l, ab + cd = O. (2) Из уравнения а2 + с2 = 1 следует, что существует такой угол а, что а = cos а, с = sin а. Оставшиеся два уравнения показывают, что b = ±sina, d = =Fcosa. Таким образом, (cos a -sin а Л sin a cos a J или (cos a sinaA V’=(sina -cosa)' (4) Геометрический смысл этих преобразований становится ясным, ес- ли ввести комплексную координату z = x + yi. Тогда в случае (3) пре- образование ip есть просто умножение z на cos а 4- i sin а, т. е. при- бавление к аргументу z числа а, что геометрически описывается как поворот на угол а. В случае (4) преобразование есть компози- ция поворота на угол а и зеркального отражения относительно ве- щественной оси (комплексного сопряжения), что, как легко видеть, есть отражение относительно прямой, составляющей с веществен- ной осью угол а/2. Отметим, что в первом случае преобразование ip сохраняет ориентацию плоскости, а во втором — меняет ее. Пример 10. Движения евклидовой плоскости, оставляющие на месте начало отсчета о, образуют подгруппу группы Isom Е2. Обозна- чим ее через Н. Пусть ej и е2— координатные векторы. Из аксиом евклидовой геометрии следует, что для любых перпендикулярных единичных векторов и f2 существует единственное движение
§ 1. Определение и примеры 161 оставляющее точку о на месте и переводящее векторы elf е2 в векто- ры /ьЛ соответственно. Если пара {fi,f2} ориентирована положи- тельно (т. е. /2 получается из поворотом на л/2 против часовой стрелки), то есть поворот вокруг точки о на некоторый угол а; в противном случае есть отражение относительно некоторой пря- мой I, проходящей через точку о (см. рис. 1). Но, как мы показали в предыдущем примере, это есть в точности ортогональные преобра- зования. Таким образом, Н = О2. Пример 11. Пусть F — какая-либо фигура на евклидовой плоско- сти. Тогда Sym F = {(/?€ Isom Е2: ip(F) = F} есть подгруппа группы Isom Е2; она называется группой симметрии фигуры F. Так, группа симметрии окружности с центром в начале отсчета о есть группа О2. Группа симметрии правильного п-уголь- ника с центром в точке о есть подгруппа группы О2, состоящая из поворотов вокруг точки о на углы, кратные 2л/п, и отражений относительно прямых, проходящих через о и одну из вершин или середину одной из сторон. Таким образом, эта группа содержит 2п элементов (п поворотов и п отражений); она называется группой диэдра и обозначается через Dn. Пример 12. В силу формулы умножения определителей матри- цы с определителем 1 образуют подгруппу в группе GLn(K). Эта подгруппа называется унимодулярной группой и обозначается через SLn(K).
162 Глава 4. Начала теории групп Пример 13. Целочисленные матрицы с определителем 1 образу- ют подгруппу в группе SLn (R), обозначаемую через SLn (Z) (см. зада- чу 2.5.3). Пример 14. Множество невырожденных диагональных матриц порядка п является абелевой подгруппой группы GLn(K). Задача 4. Доказать, что множество строго треугольных квадрат- ных матриц порядка п является подгруппой группы GLn(K). § 2. Группы в геометрии и физике Цель этого параграфа—дать общее представление о роли групп в геометрии и физике. В XIX в. математики осознали, что евклидова геометрия не явля- ется единственной мыслимой геометрией. Даже если принять, что «пространство, в котором мы живем», подчиняется законам евкли- довой геометрии (что на самом деле верно лишь в первом прибли- жении), имеет смысл изучать геометрию и других пространств, ко- торые возникают в результате математических построений. В свя- зи с этим возникает вопрос, что же в таком случае следует пони- мать под геометрией. Обобщая различные понятия, рассматривае- мые в евклидовой геометрии, можно сформулировать различные ответы на этот вопрос. В частности, обобщая понятие группы движений евклидовой гео- метрии, немецкий математик Клейн в своей лекции 1872 г., полу- чившей известность под названием «Эрлангенская программа», дал определение геометрии как науки, изучающей свойства фигур, ин- вариантные относительно заданной группы преобразований. Более подробно, пусть задано некоторое множество X и некото- рая группа G его преобразований. Фигуру F1 с X будем считать эк- вивалентной (или равной, как говорят в элементарной геометрии) фигуре F2 с X относительно группы G и писать Fx ~ F2, если суще- ствует такое преобразование G G, что F2 = (F2). Проверим, что это действительно отношение эквивалентности: 1) F~F, так как F = id(F) и idGG; 2) если F1~F2, т. е. F2 = (/?(F1), где (/?GG, то F2~Fj, так как F1 = (/?"1(F2) и с/?-1 gG; 3) если Fj ~F2 и F2~F3, т.е. F2 = c/?(F1) hF3 = ^(F2), где (/?, 'ipeG, то Fj ~F3, так как F3 = '0</?(F1) и 'ipipeG.
§ 2. Группы в геометрии и физике 163 Мы видим, таким образом, что три аксиомы отношения эквива- лентности в точности соответствуют трем аксиомам группы преоб- разований. Одной из задач геометрии является нахождение необходимых и достаточных условий эквивалентности фигур (вспомните призна- ки равенства треугольников в евклидовой геометрии). Этой цели служат величины, инвариантные относительно преобразований из группы G (такие, как расстояние между точками или мера угла в ев- клидовой геометрии). Соотношения между этими инвариантами суть геометрические теоремы (например, теорема Пифагора или теорема о том, что медианы треугольника пересекаются в одной точке). Конечно, далеко не любая группа преобразований приводит к интересной и важной для приложений геометрии. Все такие гео- метрии связаны с достаточно богатыми группами преобразований, которых не так много. Минимальным требованием здесь является транзитивность. Определение 1. Группа G преобразований множества X назы- вается транзитивной, если для любых х, у G. X существует такое преобразование G G, что у = </?(х). (Это означает, что в соответствующей геометрии все точки эк- вивалентны в смысле данного выше определения эквивалентности фигур.) Пример 1. Группа Trans(Кп) параллельных переносов простран- ства Кп (см. пример 1.4) транзитивна. В самом деле, для любых х, у G Кп имеем Однако группа Trans(Кп) все еще слишком мала, чтобы опреде- лять интересную геометрию. В качестве примера интересной гео- метрии, отличной от евклидовой, приведем аффинную геометрию. Пусть G GLn(K) и a G Кп. Тогда ¥>taV_1 = tV(a). (5) В самом деле, для любого хеКп имеем: ((/>ta^-1)(x) = + а) = х + у>(а) = t^x. Предложение 1. Для любой подгруппы G с GLn(K) множество Trans(Kn)*G = {taip: аеКП, </>gG} является транзитивной группой преобразований пространства Кп.
164 Глава 4. Начала теории групп Доказательство. При a, be Кп, е GLn(K) имеем, согласно формулам (1) и (5), = ta+9>(W е Trans (Kn) • G. Отсюда следует, что (с.,?)"1 = t-v-'toV’-1 е Trans (К") • G. Таким образом, Trans(Kn) • G — группа преобразований. Она транзи- тивна, поскольку уже ее подгруппа Trans(Кп) транзитивна. □ В частности, мы можем взять G = GLn(K). Полученная группа GAn (К) = Trans(Kn) • GLn(К) (6) называется полной аффинной группой пространства Кп, а ее эле- менты— (биективными) аффинными преобразованиями. Связанная с ней геометрия называется аффинной геометрией. В случае К = R, п = 2 мы получаем аффинную геометрию евкли- довой плоскости. Предложение 2. Группа движений евклидовой плоскости есть подгруппа группы GA2®), равная Trans (К2) -О2. Доказательство. Прежде всего, заметим, что все параллельные переносы и все ортогональные преобразования являются движени- ями (см. пример 1.10). Пусть теперь /—какое-либо движение. Поло- жим а = /(о). Тогда движение = С”1/ оставляет на месте точку о и, значит, принадлежит группе О2 . Таким образом, / = taip eTransQR2) О2. □ Аналогичным образом описывается группа движений евклидова пространства. Следствие. Если фигуры F1? F2 с Е2 равны в евклидовой геомет- рии, то они равны и в аффинной геометрии. Группа GA2(R) не совпадает с группой движений. Примером аф- финного преобразования, не являющегося движением, может слу- жить гомотетия (с коэффициентом 0±1) или растяжение вдоль ка- кой-либо оси. Таким образом, группа GA2(R) богаче группы движе- ний, и фигуры, не равные в евклидовой геометрии, могут оказаться равными в аффинной геометрии. Так, в аффинной геометрии все окружности равны. Задача 1. Доказать, что в аффинной геометрии все треугольни- ки равны.
§ 2. Группы в геометрии и физике 165 В аффинной геометрии отсутствует понятие расстояния между точками. Однако, как показывает следующая задача, имеется инва- риант трех точек, лежащих на одной прямой. Задача 2. Доказать, что при аффинных преобразованиях сохра- няется отношение, в котором точка делит отрезок. В рамках группового подхода могут быть построены также проек- тивная и конформная геометрии, геометрия Лобачевского и другие геометрии, используемые в математике и ее приложениях. Группы преобразований в физике описывают симметрию физи- ческих законов, в частности симметрию пространства-времени. Точка пространства-времени задается тремя пространственны- ми координатами х, у, z и временной координатой г, так что про- странство-время с фиксированной системой отсчета может быть отождествлено с R4. Переход к другой системе отсчета означает некоторое преобразование пространства R4. Как в классической, так и в релятивистской механике (точнее, в специальной теории относительности) существует понятие инерциальных систем отсче- та, в которых все законы механики имеют одинаковый вид. Пере- ходы от одной инерциальной системы отсчета к другим составля- ют некоторую группу преобразований пространства R4. Эта группа однозначно определяет законы механики. Отличие релятивистской механики от классической обусловлено тем, что она берет за основу другую группу преобразований. Группа симметрии пространства-времени в классической меха- нике есть группа Галилея, описываемая следующим образом: G=Trans (R4) -Н-Оз, где О3 — группа ортогональных преобразований пространственных координат, а Н — группа преобразований вида (х, у, z, t) —> (х + at, y + bt,z + ct, t), соответствующих переходу к новой системе отсчета, равномерно и прямолинейно движущейся относительно старой. Из этого опи- сания группы Галилея видно, что в классической механике время абсолютно в том смысле, что разность временных координат двух событий одинакова во всех инерциальных системах отсчета. Согласно представлению релятивистской механики, группа сим- метрии пространства-времени есть группа Пуанкаре G = Trans (R4) -О3д,
166 Глава 4. Начала теории групп где О3> j — группа линейных преобразований, сохраняющих много- член x2 + y2 + z2-Г2 (в системе единиц, в которой скорость света равна 1). Группа О3л содержит группу О3, не затрагивающую временной координаты. Нетривиальным примером преобразований из О3>1 могут служить преобразования Лоренца (х, у, z, с) *-► (х, у, z ch а +1 sh a, z sh а +1 ch a), перемешивающие пространственные и временные координаты. Вид этих преобразований показывает, что в релятивистской меха- нике время не абсолютно. Группа Пуанкаре была описана в работах Лоренца и Пуанкаре как группа симметрии законов электродинамики (уравнений Макс- велла). Заслуга Эйнштейна состояла в том, что он имел смелость сделать вывод, что и законы механики должны иметь ту же группу симметрии. Группы преобразований лежат также в основе кристаллографии и теории элементарных частиц. Так, в кристаллографии они описы- вают симметрию кристаллических структур и, тем самым, физиче- ских свойств кристаллов. (См. рис. 2, где изображены кристалличе- ские структуры поваренной соли, алмаза и графита.) § 3. Циклические группы Так же как в группе R*, в любой группе G могут быть определены степени элемента g€G с целыми показателями: если к > О, к е, если к = О, g”1g~1...g~1, если к <0. i -к Имеет место свойство gkgl=gk+l (7)
§ 3. Циклические группы 167 Рис. 2
168 Глава 4. Начала теории групп Это очевидно, если к, I > 0. Рассмотрим случай, когда к > 0, I < 0, к +1 > 0. Тогда gkgl =gg- •£ • • g~\=gg- -g =gk+l- к -I k+l Аналогично рассматриваются остальные случаи. Из (7) следует, что (gky~1=g~k- Кроме того, е = g° по определению. Таким образом, степени элемен- та g образуют подгруппу в группе G. Она называется циклической, подгруппой, порожденной элементом g, и обозначается через (g). Возможны два принципиально разных случая: либо все степени элемента g различны, либо нет. В первом случае подгруппа (g) бес- конечна. Рассмотрим более подробно второй случай. Пусть gfc = g*, k > I; тогда gk~l = e. Наименьшее из натуральных чисел т, для которых gm = е, называется в этом случае порядком элемента g и обозначается через ord g. Предложение 1. Если ord g = п, то 1) gm = e <=> п | гл; 2) gk=gl <=> k = l (mod n). Доказательство. 1) Разделим т на п с остатком: m = qn + r, О^гсп. Тогда в силу определения порядка gm = (.gn)q-gr = gr = e <=> г = 0. 2) В силу предыдущего g/c = g/ <=> gk”/ = e <=> п | (к -/) <=> k = l (mod n). □ Следствие. Если ord g = и, то подгруппа (g) содержит п элемен- тов. Доказательство. Действительно, {g} = {e,g,g2, ;gn~1}, (8) причем все перечисленные элементы различны. □ В том случае, когда не существует такого натурального т, что gm—e (т.е. имеет место первый из описанных выше случаев), пола- гают ord g = оо. Отметим, что ord е = 1; порядки же всех остальных элементов группы больше 1.
§ 3. Циклические группы 169 В аддитивной группе говорят не о степенях элемента g, а о его кратных, которые обозначают через kg. В соответствии с этим по- рядок элемента g аддитивной группы G — это наименьшее из нату- ральных чисел т (если такие существуют), для которых mg g + g + ... + g = 0. т Пример 1. Характеристика поля (см. § 1.5) есть порядок любого ненулевого элемента в его аддитивной группе. Пример 2. Очевидно, что в конечной группе порядок любого элемента конечен. Покажем, как вычисляются порядки элемен- тов группы Sn. Подстановка т е$п называется циклом длины р и обозначается через (ц12..лр), если она циклически переставляет h, ^2» •••> ip, т.е. т(ц) = i2, r(i2) = 13, •••> TGP) = a все остальные числа оставляет на месте. Очевидно, что порядок цикла длины р равен р. Циклы и т2 называются независимыми, если среди фактически переставляемых ими чисел нет общих; в этом случае т1т2 = т2тр Всякая подстановка однозначно разлагается в произве- дение независимых циклов. Например, 'Ms 6 7 4 I 3 2 !} = (2637)(1S8), что наглядно показано на рис. 3, где действие подстановки сг изоб- ражено стрелками. Если подстановка а разлагается в произведение независимых циклов длин р15 р2,..., pS) то ordcr = HOK{p1,p2, ...,ps}. Например, для подстановки сг, изображенной на рис. 3, ord сг = 12. Рис. з Задача 1. Доказать, что порядок любого элемента группы Sn не превос- ходит числа е"/с*1,44п.
170 Глава 4. Начала теории групп Пример 3. Порядок комплексного числа с в группе С* конечен тогда и только тогда, когда это число есть корень некоторой степени из единицы, что, в свою очередь, имеет место тогда и только тогда, когда |с| = 1, a arg с соизмерим с л, т. е. е Q. з Задача 2. Доказать, что arctg несоизмерим с л. Пример 4. Найдем элементы конечного порядка в группе Isom Е2 движений плоскости. Пусть G IsomE2, = id. Для любой точки р G Е2 точки <Р2Р,ч>п-'р циклически переставляются движением (/?, так что их центр тяже- сти о неподвижен относительно (/?. Следовательно, —либо пово- рот на угол вида -jj- вокруг точки о, либо отражение относительно некоторой прямой, проходящей через о. Пример 5. Найдем порядок матрицы Ч? '!) как элемента группы GL2(R). Имеем откуда а4=-а, а5=-а2, а6=-а3=е, так что ord А = 6. Конечно, этот пример специально подобран: веро- ятность того, что порядок наудачу выбранной матрицы A G GL2(R) будет конечен, равна нулю. Предложение 2. Если ord g = n, то ord^=(A)- (9) Доказательство. Пусть (n,k) = d, n = n1d, k = k1d, так что (Hi, kj) = 1. Имеем (gk)m_e фф riilkjm <=> ni|m. Следовательно, ord gk = пг. □
§ 3. Циклические группы 171 Определение 1. Группа G называется циклической, если суще- ствует такой элемент g G G, что G = (g). Всякий такой элемент на- зывается порождающим элементом группы G. Пример 6. Аддитивная группа Z целых чисел является цикличе- ской, так как порождается элементом 1. Пример 7. Аддитивная группа Zn вычетов по модулю п является циклической, так как порождается элементом [1]. Пример 8. Мультипликативная группа Сп комплексных корней п-й степени из 1 является циклической. В самом деле, эти корни суть числа Ek = cos +i sin (k = 0,1,..., п - 1). к п п ’ ’ Ясно, что Ek = ef. Следовательно, группа Сп порождается элемен- том ер Задача 3. Доказать, что группа Z* обратимых элементов коль- ца Zn (см. задачу 1.5.1) является циклической при п $ 7 и п = 9 и не является циклической при п = 8. Легко видеть, что в бесконечной циклической группе G = (g) по- рождающими элементами являются только g и g-1. Так, в группе Z порождающими элементами являются только 1 и -1. Число элементов конечной группы G называется ее порядком и обозначается через |G|. Порядок конечной циклической группы ра- вен порядку ее порождающего элемента. Поэтому из предложения 2 следует Предложение 3. Элемент gk циклической группы G = (g) поряд- ка п является порождающим тогда и только тогда, когда (и, k) = 1. Пример 9. Порождающие элементы группы Сп (см. пример 8) называются первообразными корнями п-й степени из 1. Это корни вида ек, где (п, k) = 1. Например, первообразные корни 12-й степе- ни из 1 — это е5, е7, en. Циклические группы — это наиболее простые группы, которые можно себе представить. (В частности, они абелевы.) Следующая теорема дает их полное описание. Теорема 1. Всякая бесконечная циклическая группа изоморфна группе Z. Всякая конечная циклическая группа порядка п изоморфна группе Zn. Доказательство. Если G = (g) — бесконечная циклическая груп- па, то в силу формулы (7) отображение f: Z -* G, к —> gk, есть изо- морфизм.
172 Глава 4. Начала теории групп Пусть G = (g) —конечная циклическая группа порядка п. Рас- смотрим отображение /:Zn-»G, [k]-gk (keZ). Так как [k] = [Z] <=> k = l (mod п) <=» gk = g‘, отображение f корректно определено и биективно. Свойство /(k + !)=/(k)/(O вытекает из той же формулы (7). Таким образом, f — изомор- физм. □ Для понимания строения какой-либо группы важную роль игра- ет знание ее подгрупп. Все подгруппы циклической группы могут быть легко описаны. Теорема 2. 1) Всякая подгруппа циклической группы является циклической. 2) В циклической группе порядка п порядок любой подгруппы де- лит п и для любого делителя q числа п существует ровно одна подгруппа порядка q. Доказательство. 1) Пусть G = (g) — циклическая группа и Н — ее подгруппа, отличная от {е}. (Единичная подгруппа, очевидно, яв- ляется циклической.) Заметим, что если g“m G Н для какого-либо гп G N, то и gm G Н. Пусть гп — наименьшее из натуральных чисел, для которыхgmeH. Докажем, что Н = (gm}. Пусть gkeH. Разделим к на гп с остатком: k = qm + r, О$г<гп. Имеем gr=gk(gnTqeH, откуда в силу определения числа гп следует, что г = 0 и, значит, gk = = (gm)q. 2) Если | G | = п, то предыдущее рассуждение, примененное к к = п (в этом случае gk = е G Н), показывает, что п = qm. При этом H = {e,gm,g2m,...,g(^1)m}, (10) и Н является единственной подгруппой порядка q в группе G. Обрат- но, если q —любой делитель числа п и n = qrn, то подмножество Н, определяемое равенством (10), является подгруппой порядка q. □
§ 4. Системы порождающих 173 Следствие. В циклической группе простого порядка любая нееди- ничная подгруппа совпадает со всей группой. Пример 10. В группе Z всякая подгруппа имеет вид mZ, где т^О. Пример 11. В группе Сп корней п-й степени из 1 любая подгруп- па есть группа Cq корней q-й степени из 1, где q | п. § 4. Системы порождающих Пусть S — какое-либо подмножество группы G. Обозначим через (S) совокупность всевозможных произведений вида Si'g2--Sk (gi,g2,-;gk^S;elte2,...,ek = ±l). (11) Это наименьшая подгруппа группы G, содержащая S. В самом де- ле, если какая-либо подгруппа содержит S, то она содержит и все указанные произведения. С другой стороны, само множество (S) является подгруппой, как показывают следующие равенства: (г/1 Ч ( ~£к+1 **+2 ?k+l Ч Ъ Ск+1 <51 52 '^&к+1&к+2'"&к+1' *1 *2 Говорят, что (S) — подгруппа, порожденная подмножеством S. В частности, если S состоит из одного элемента g, то (S) = (g) есть циклическая подгруппа, порожденная элементом g в том смысле, как это было определено в предыдущем параграфе. Замечание 1. Удобно считать, что в число произведений (11) вхо- дит пустое произведение (к = 0), которое по определению равно е. Определение 1. Говорят, что группа G порождается своим под- множеством S или что S — система порождающих (элементов) груп- пы G, если G = (S). Конечно, любая группа G порождается подмножеством S = G, од- нако представляет интерес найти возможно меньшую систему по- рождающих. Пример 1. Группа диэдра Dn (см. пример 1.11) порождается по- 2л воротом на угол — и (любым) отражением ip GDn. В самом деле, порождает циклическую подгруппу Сп всех поворотов, содержа- щихся в группе Dn; умножая элементы этой подгруппы на ф, мы получим все отражения, входящие в группу Dn.
174 Глава 4. Начала теории групп Два важных примера систем порождающих содержатся в приво- димых ниже теоремах. Подстановка, являющаяся циклом длины 2 (см. пример 3.2), на- зывается транспозицией. Теорема 1. Группа Sn порождается транспозициями. Доказательство. Отметим, что каждая транспозиция обратна сама себе. Поэтому утверждение теоремы означает, что любая под- становка разлагается в произведение транспозиций. Умножение подстановки слева на транспозицию (у) вызывает перестановку i и j в нижней строке. Такая операция также называется транспозицией. Очевид- но, что путем последовательных транспозиций любую перестановку (кь к2)кп) можно привести к тривиальной: сначала, если кг #1, меняем местами кТ и 1, ставя тем самым 1 на первое место, затем ставим 2 на второе место и т. д. Таким образом, существуют такие транспозиции т2,..., т5, что Ts...T2T1cr = id и, значит, cr = T1T2...Ts. □ Задача 1. Доказать, что группа Sn порождается смежными транс- позициями (12), (23),..., (и—1 и), причем минимальное число смеж- ных транспозиций, в произведение которых может быть разложена подстановка сг eSn, равно числу инверсий в нижней строке ее стан- дартной записи (12). Теорема 2. Группа GLn(K) порождается элементарными матри- цами. (Определение элементарных матриц см. в § 2.1.) Доказательство. Отметим, что матрица, обратная к элементар- ной, также элементарна (см. §2.1). Поэтому утверждение теоремы означает, что любая невырожденная матрица разлагается в произ- ведение элементарных матриц. Умножение матрицы А е GLn (К) слева на элементарную матрицу вызывает соответствующее элементарное преобразование ее строк. Мы знаем, что с помощью элементарных преобразований строк любую невырожденную матрицу можно привести к единичной
§ 5. Разбиение на смежные классы 175 матрице. Таким образом, существуют такие элементарные матрицы UlfU2,..„US) что Us...U2l/1A = E и, значит, Задача 2. Доказать, что группа SL2(Z) (см. пример 1.13) порож- дается матрицами Задача 3. Доказать, что группа движений плоскости порождает- ся отражениями относительно прямых. (Указание: доказать внача- ле, что каждый поворот и каждый параллельный перенос являются произведениями двух отражений.) § 5. Разбиение на смежные классы Пусть G — группа и Н — ее подгруппа. Будем говорить, что эле- менты gi, g2 е G сравнимы по модулю Н, и писать £1 =£2 (mod Н), если g?g2eH, (13) т.е. где heH. Это определение обобщает определение сравнимости целых чисел по модулю п, которое получается в случае G = Z, Н = п%. Докажем, что определенное таким образом отношение сравни- мости по модулю Н является отношением эквивалентности: 1) £ = £(mod Н), так как £-1£ = eGH; 2) если £! =£2 (mod И), т.е. g~'g2 еН, то £2 = £i (mod Н), так как g218i = (8i1S2)~leH; 3) если gj = g2 (mod Н) и g2 = g3 (mod Н), т.е. g^g2, g^g3eH, то £j =£3 (mod Н), так как = (§Г^2)(§2 ^з) еН.
176 Глава 4. Начала теории групп Классы этой эквивалентности называются (левыми) смежными классами группы G по подгруппе Н. Ясно, что смежный класс, со- держащий элемент g, имеет вид gtf = {gh:heH}. Одним из смежных классов является сама подгруппа Н. Поскольку умножение в группе не обязано быть коммутативным, мы получим, вообще говоря, другое отношение эквивалентности, взяв вместо условия (13) аналогичное ему условие gzgf’eH. (14) Классы этой эквивалентности называются правыми смежными клас- сами группы G по подгруппе Н, Они имеют вид Hg = {hg:hGH}. Заметим, что инверсия g—>g-1 устанавливает взаимно однознач- ное соответствие между множествами левых и правых смежных классов. А именно, Пример 1. Смежные классы аддитивной группы С по подгруп- пе К изображаются на комплексной плоскости прямыми, параллель- ными вещественной оси (рис. 4, а). Пример 2. Смежные классы мультипликативной группы С* по подгруппе R$. положительных чисел — это лучи, исходящие из нача- ла координат (рис. 4, б). Пример 3. Смежные классы группы С* по подгруппе T = {zGC*: |и| = 1} — это окружности с центром в начале координат (рис. 4, в).
§ 5. Разбиение на смежные классы 177 Пример 4. В случае G = GLn(K), H = SLn(K) (см. пример 1.12) условие (13), равно как и (14), означает, что detgj = detg2. Поэтому левые смежные классы в данном случае совпадают с правыми (хо- тя группа GLn(K) не абелева); каждый из них представляет собой совокупность всех матриц с определителем, равным какому-либо фиксированному числу. Пример 5. В группе G = Sn рассмотрим подгруппу Н, состоя- щую из подстановок, оставляющих на месте число п. Подстановки о-!, сг2 е Sn принадлежат одному левому смежному классу по Н, если <г1-1сг2(п) = и, т.е- если сг1(п)=сг2(п). Следовательно, имеется п левых смежных классов Рь Р2,..., Рп, где Pk = {aeSni сг(п) = к}. В то же время подстановки crltcr2^Sn принадлежат одному правому смежному классу, если a2af г(п) = п, т. е. если а1"1(п) = сг21(п). Следовательно, имеется п правых смежных классов QbQ2,..., Qn, где Qk = {creSn: cr(k) = n}. Мы видим, что при п > 2 правые смежные классы отличны от левых, за исключением класса Qn =РП =Н. Множество левых смежных классов группы G по подгруппе Н обозначается через G/Н. Число смежных классов группы G по Н (левых или правых, безразлично), если оно конечно, называется индексом подгруппы Н и обозначается через |G: Н|. Теорема 1 (теорема Лагранжа). Если G — конечная группа и Н — любая ее подгруппа, то |G| = |G:H||H|. Доказательство. Все смежные классы gH содержат одно и то же число элементов, равное |Н|. Поскольку они образуют разбиение группы G (как классы эквивалентности), порядок группы G равен произведению их числа на \Н\. □ Следствие 1. Порядок любой подгруппы конечной группы делит порядок группы. Мы уже видели это в случае циклических групп (теорема 3.2).
178 Глава 4. Начала теории групп Следствие 2. Порядок любого элемента конечной группы делит порядок группы. Доказательство. Это вытекает из следствия 1 и того, что поря- док элемента равен порядку порождаемой им циклической подгруп- пы. □ Следствие 3. Всякая конечная группа простого порядка являет- ся циклической. Доказательство. В силу следствия 1 такая группа должна совпа- дать с циклической подгруппой, порожденной любым элементом, отличным от единицы. □ Следствие 4. Если |G| = п, то gn = е для любого g е G. Доказательство. Пусть ord g = т. В силу следствия 2 имеем т | п. Значит, gn = e. □ Пример 6. Если р — простое число, то мультипликативная груп- па Z* поля Zp есть (абелева) группа порядка р - 1. Следовательно, gp-1 = 1 для любого элемента geZ*. Это означает, что ар“1 = 1 (mod р) для любого целого числа а, не делящегося на р. Последнее утвержде- ние есть так называемая малая теорема Ферма. (Другой способ ее доказательства см. в задаче 1.5.2.) Для любого п порядок группы Z* обратимых элементов коль- ца Zn, равный количеству чисел в ряде 1, 2,..., п, взаимно простых с п (см. задачу 1.5.1), обозначается через <р(п). Функция ср, опреде- ленная таким образом на множестве натуральных чисел, называет- ся функцией Эйлера. Применение следствия 4 к группе Z* дает а^(п) = 1 (mod и) для любого целого числа а, взаимно простого с и. Это обобщение малой теоремы Ферма называется теоремой Эйлера. Например, легко видеть, что (р(125) = 125 - 25 = 100. Отсюда следует, что 2100 = 1 (mod 125) — результат, полученный нами в при- мере 1.5.7 прямым вычислением. Разбиение на смежные классы естественно возникает при изуче- нии групп преобразований. Пусть G — группа преобразований множества X. Будем говорить, что точки х, у G X эквивалентны относительно G, и писать х ~ у, если существует такой элемент g G G, что у = gx. Это частный случай
§ 5. Разбиение на смежные классы 179 эквивалентности фигур, определенной в § 2, и, следовательно, — отношение эквивалентности. Класс эквивалентности точки х G X на- зывается ее орбитой. Иначе говоря, орбита точки х есть множество Gx = {gx: gGG}. В частности, транзитивные группы преобразований (см. определе- ние 2.1) —это группы преобразований, имеющие единственную ор- биту. Подгруппа Gx = {gGG: gx = x} называется стабилизатором точки х. Пример 7. Группа движений евклидовой плоскости транзитив- на. Стабилизатором начала отсчета является ортогональная груп- па О2 (см. пример 1.10). Пример 8. Орбиты группы О2 суть окружности с центром в нача- ле отсчета о и сама точка о. Стабилизатор точки р / о состоит из тож- дественного преобразования и отражения относительно прямой ор, а стабилизатор точки о — это вся группа О2. Пример 9. Группа Sn транзитивна на множестве {1, 2,..., п}. Стабилизатор числа п есть подгруппа Н 5П_Ъ рассмотренная в при- мере 5. Следующая теорема является обобщением (первой части) при- мера 5. Теорема 2. Имеется взаимно однозначное соответствие между орбитой Gx и множеством смежных классов G/Gx, при котором точке y = gxeGx соответствует смежный класс gGx. Доказательство. При gb g2 е G имеем gl=g2 (mod Gx) <=> Si'&GGx <=> «Г1?2Х = Х <=> Sl* = g2x- Таким образом, элементы одного смежного класса группы G по Gx характеризуются тем, что они переводят точку х в одну и ту же точку. Более точно, все элементы смежного класса gGx, и только они, переводят точку х в точку у = gx. Тем самым и установлено искомое соответствие. □ Число элементов орбиты Gx, если оно конечно, называется ее длиной и обозначается через |Gx|. Следствие. Если G — конечная группа, то |G| = |Gx||Gx|. (15)
180 Глава 4. Начала теории групп Из этой формулы следует, что порядки стабилизаторов всех то- чек орбиты одинаковы. На самом деле имеется точная связь между стабилизаторами точек одной орбиты, не зависящая от конечности группы G. Мы сформулируем ее в виде задачи. Задача 1. Доказать, что Ggx = SGxg~1. Пример 10. Пусть К с Е3 — куб. Рассмотрим группу его симмет- рии G = SymK = {</?€lsomE3: ^(К) = К}. Очевидно, что это конечная группа. Более того, симметрия куба полностью определяется тем, как она переставляет его вершины. Поэтому мы можем рассматривать группу G как группу преобразо- ваний множества V вершин куба К. Ввиду того что куб является пра- вильным многогранником, любую вершину куба можно перевести в любую другую с помощью преобразования из группы G. Иначе Рис. 5 говоря, группа G транзитивна на множе- стве V. Следовательно, |G| = 8|GJ, где и — какая-либо вершина. Аналогичным образом, рассматривая группу Gv как груп- пу преобразований множества ребер, выхо- дящих из у, можно показать, что |Gu| = 3|Gu>e|, где Gv е — стабилизатор в группе Gv како- го-либо ребра е, выходящего из v. Группа Gv е состоит из тождествен- ного преобразования и отражения относительно плоскости, прохо- дящей через центр куба и ребро е (см. рис. 5). Таким образом, |SymK| = 8-3-2 = 48. Задача 2. Получить тот же результат еще двумя способами, рас- смотрев группу Sym К как группу преобразований множества гра- ней и множества ребер куба соответственно. Аналогичным образом можно найти порядки групп симметрии других правильных многогранников (см. рис. 6). (По поводу опре- деления правильных многогранников см. § 7.4.)
§ 5. Разбиение на смежные классы 181 Рис. 6 Пример 11. Пусть G — группа преобразований алгебры много- членов K[*i,x2, х3, х4], состоящая из всевозможных перестановок переменных х2, х3, х4. Группа G изоморфна S4 и, следовательно, IG| = 4! = 24. Рассмотрим многочлен f = хгх2 4- х3х4. Перестановка- ми переменных из него можно получить 3 многочлена *1*2 4- х3х4, х2х3 4- х2х4, *i*4 4- х2х3. Это означает, что \Gf\ = 3. По формуле (15) находим Заметим, что, если отождествить группу G с группой S4, то Gf будет не чем иным, как подгруппой, обозначенной в примере 1.8 через Sym/. Отношение сравнимости по модулю п в аддитивной группе це- лых чисел согласовано с операцией сложения, что позволяет опре- делить операцию сложения в фактормножестве. Аналогичным об- разом можно определить операцию в множестве смежных классов группы по подгруппе и в других случаях, но не всегда. Определение 1. Подгруппа Н группы G называется нормальной, если gH = Hg VgeG (16) или, что эквивалентно, gHg~1=H VgeG. (17) В этом случае пишут Н < G (или G > Н).
182 Глава 4. Начала теории групп Для того чтобы подгруппа Н была нормальной, достаточно (но не необходимо), чтобы каждый элемент группы G был перестано- вочен с каждым элементом из Н. В частности, в абелевой группе любая подгруппа нормальна. Теорема 3. Отношение сравнимости по модулю подгруппы Н со- гласовано с операцией умножения в группе G тогда и только тогда, когда подгруппа Н нормальна. Доказательство. Согласованность отношения сравнимости по модулю Н с операцией умножения означает следующее: g!=g' (mod Н), g2=g'(mod Н) => (mod Н) или, что эквивалентно, для любых gl, g2 е G и h2 6 Н (gl^l)(g2^2)=«lg2 (mod Н). Последнее условие, согласно определению, переписывается в виде Так как g2 может быть любым элементом группы G, a hx —любым элементом подгруппы Н, то это равносильно условию нормально- сти (17). □ Задача 3. Доказать, что всякое отношение эквивалентности в группе, согласованное с операцией, есть отношение сравнимости по модулю некоторой (нормальной) подгруппы. Таким образом, если Н< G, то операция умножения в группе G определяет операцию умножения в множестве G/Н по правилу (giH)(g2H)=glg2H. Эта операция наследует ассоциативность операции в группе G. Для нее имеется единица — смежный класс еН. Каждый смежный класс gH имеет обратный, а именно g~xH. Следовательно, G/H — группа. Эта группа называется факторгруппой группы Guo Н. Очевидно, что если группа абелева, то любая ее факторгруппа также абелева. Пример 12. Факторгруппа Z/nZ есть группа вычетов Zn. Пример 13. Смежные классы группы С по R (см. пример 1) суть прямые La = {z: Im z = a} (a e R). Операция сложения в C/R задает- ся формулой La + Lb = La+b, так что факторгруппа С/R изоморфна группе R.
§ 6. Гомоморфизмы 183 Пример 14. Смежные классы группы С* по Т (см. пример 3) суть окружности Cr = {z G С*: |z| = г} (г > 0). Операция умножения в С*/Т задается формулой CrCs = Crs, так что факторгруппа С*/Т изоморфна группе 1&+. Пример 15. Как мы видели выше (см. пример 4), левые смежные классы группы GLn(K) по SLn(K) совпадают с правыми и имеют вид Ма = {A G GLn(К): det А = а} (а 6 Г). Следовательно, SLn(K) — нормальная подгруппа. Операция умноже- ния в факторгруппе задается формулой МаМь = МаЬ, так что фактор- группа GLn(K)/SLn(K) изоморфна К*. Пример 16. Подгруппа Н (изоморфная Sn_i) группы Sn, рассмот- ренная в примере 5, не является нормальной при п 3. Задача 4. Доказать, что всякая факторгруппа циклической груп- пы является циклической. Задача 5. Доказать, что группа диагональных матриц не являет- ся нормальной подгруппой группы GLn(K) при п 2 и |К| 3. § 6. Гомоморфизмы В любой алгебраической теории наряду с изоморфизмами рас- сматривают более общие отображения, называемые гомоморфизма- ми. Они отличаются от изоморфизмов тем, что не обязаны быть биективными. Тем не менее они позволяют установить полезные связи между алгебраическими структурами одного типа. Дадим точное определение гомоморфизма групп. Определение 1. Гомоморфизмом группы G в группу Н называет- ся отображение f: G —► Н, удовлетворяющее условию /(ab)=/(a)/(b) Va,bGG. Установим некоторые общие свойства гомоморфизмов групп. 1) /(е) = е. В самом деле, пусть /(е) = h GН; тогда h2 = /(e)2 = /(e2) = /(e) = h, откуда h = e. 2) /(а-1) =/(а)-1, ибо /(а)/(а-1) =/(аа-1) =/(е) = е.
184 Глава 4. Начала теории групп 3) Im/ = {/(а): а е G} есть подгруппа группы Н (называемая об- разом гомоморфизма /). Это следует из определения гомоморфизма и предыдущих свойств. 4) Ker / = {a G G: /(а) = е} есть нормальная подгруппа группы G (называемая ядром гомоморфизма /). Действительно, a, b EKerf => /(ab) = /(a)/(b) = е2 = е => ab EKerf, aEKerf => /(а"1) = /(а)“1 =е-1 =е => а“1€Кег/, е Е Кег /, aEKerf,gEG => => /(gag"1)=/(g)/(a)/(g)"1 = /(g)e/(g)“1=/(g)/(g)"1 = e => => gag-1 е Ker/. 5) /(&i) = <=* £1 = 82 (mod Ker/); в частности, гомомор- физм f инъективен тогда и только тогда, когда Ker f = {е}. Действи- тельно, /(gi) = /(g2) <=> /(gr1«2) = e <=> <=> g1“1g2GKer/ <=> gj=g2 (mod Ker/). Таким образом, гомоморфизм f:G-+H является изоморфизмом (т. е. биективен) тогда и только тогда, когда Im f = Н и Ker f = {е}. В этом случае иногда пишут /: G^H. Если группы G и Н изоморф- ны (т.е. существует изоморфизм f: GН), то пишут G^H. Гомоморфизм группы в себя называется ее эндоморфизмом. Изо- морфизм группы на себя называется ее автоморфизмом. Пример 1. Пусть К — произвольное кольцо. Свойство дистрибу- тивности а(Ь 4-с) = ab 4- ас означает, что отображение х>->ах (умно- жение слева на а) является эндоморфизмом аддитивной группы кольца К. (Аналогичное утверждение справедливо и для умножения справа.) Пример 2. Пусть G — произвольная аддитивная (соответствен- но мультипликативная) абелева группа. Тогда для любого п Е Z отоб- ражение х—>пх (соответственно х—>хп) является эндоморфизмом группы G. (Для неабелевой группы это, вообще говоря, неверно.) В случае G = С* ядром этого гомоморфизма является группа Сп кор- ней п-й степени из 1. Пример 3. Согласно основному свойству экспоненты, отображе- ние х ех является гомоморфизмом аддитивной группы R в мульти-
§ 6. Гомоморфизмы 185 пликативную группу R*. Его образ — это подгруппа R?J. положитель- ных чисел, а ядро тривиально. Пример 4. Отображение х cos х -I- i sin х является гомоморфиз- мом группы R в группу С*. Его образ есть Т, а ядро — Пример 5. Формула умножения определителей означает, что отображение det: GL„ (К) -> К*, А —> det А, является гомоморфизмом. Его ядро — это унимодулярная группа SLn(K). Пример 6. Назовем знаком подстановки a G Sn и обозначим че- рез sgn а произведение знаков верхней и нижней перестановки в ее записи (см. пример 1.1): sgn (7 '2 " i" )=sgn(i1,i2>...)in)-sgn(j1J2,.... j„). Это произведение не зависит от способа записи подстановки ст, так как от любого способа записи можно перейти к любому другому последовательными транспозициями столбиков, а при каждой та- кой транспозиции одновременно меняются знаки верхней и ниж- ней перестановок, так что их произведение сохраняется. Основное свойство знака состоит в том, что отображение sgn: Sn-»С2 = {±1}, ст->Sgn ст, является гомоморфизмом. В самом деле, перемножая подстановки (тит, мы можем считать, что верхняя перестановка в записи а совпадает с нижней перестановкой в записи т: Ч t::: & Ч 1И- Тогда Ч Й ::: Й- так что sgn <7Т = sgn(t1, i2,in) • sgn(kb k2>kn) = = [sgn(ib i2,i„) sgnQb j2,jn)] x x [sgn (я, j2,j„) sgn(kv k2,k,,)] = = sgn т • sgn a = sgn a sgn t.
186 Глава 4. Начала теории групп Ядро гомоморфизма sgn называется знакопеременной группой и обозначается через Ап. Употребляется также следующая терми- нология: подстановки сг, для которых sgn ст = 1 (соответственно sgncr = -l), называются четными (соответственно нечетными). Таким образом, Ап — это подгруппа четных подстановок. Задача 1. Вывести следующую формулу для знака циклической подстановки: sgn(i1i2...ip) = (-l)₽-1. Используя это, доказать, что знак любой подстановки равен (-l)m-s, где т — число фактически переставляемых ею (т. е. не оставляемых на месте) символов, as — число независимых циклов, в произведе- ние которых она разлагается. Теорема 1 (о гомоморфизме групп). Пусть f: G-^H — гомомор- физм групп. Тогда Im/^G/Ker/. Более точно, имеется изоморфизм ip: Im/^G/Ker/, ставящий в соответствие каждому элементу h = f(g) G Im f смеж- ный класс g Ker/. Доказательство. Доказательство этой теоремы аналогично до- казательству теоремы 5.2. Из доказанного выше свойства 5) следует, что все элементы смежного класса g Ker f, и только они, переходят при гомоморфизме f в элемент h = /(g) G Im/. Тем самым показано, что отображение ip, о котором идет речь в теореме, корректно опре- делено и биективно. Остается проверить, что ip — гомоморфизм. Пусть gi,g2GG, /(gi) = hi, /(g2) = h2. Тогда/(g}g2) = h1h2 и V (W = S1S2 Ker f = (£1 Ker /) (g2 Ker f) = ip (hjiptj^), что и требовалось доказать. □ Следствие. Если группа G конечна, то |G| = |Im/||Ker/|. (Интересно сравнить эту формулу с формулой (15).) Пример 7. Рассмотрим гомоморфизм /: С->R, 2b->Imz.
§ 6. Гомоморфизмы 187 Имеем Im f = R, Ker f = R, так что C/R^R — результат, уже полученный нами в примере 5.13. Пример 8. Рассмотрим гомоморфизм /:C*-»R;, z —|z|. Имеем Im f=R^, Ker f = T = {z e C*: |z| — 1}, так что c‘/t^r; — результат, уже полученный нами в примере 5.14. Пример 9. Отображение /:С^Т, z~A также является гомоморфизмом, причем Imf = Т, Ker f = R^. Следо- вательно, C*/R^T. (Соответствующее разбиение на смежные классы было описано в примере 5.2.) Пример 10. Рассмотрим гомоморфизм f: R -* Т, х —> cos 2пх 4- i sin 2 лх (ср. пример 4). Так как Ker/ = Z, то мы получаем, что R/Z^T. Пример 11. Аналогичным образом рассмотрение гомоморфиз- ма det из примера 5 приводит к тому, что GLn(K)/SLn(K)^K* — результат, уже полученный в примере 5.15. Пример 12. Рассмотрение гомоморфизма sgn из примера 6 при- водит к тому, что при и > 1 SnMn — ^2’ В частности, отсюда следует, что Ип| = |п!.
188 Глава 4. Начала теории групп Пример 13. Согласно определению (см. §2), всякое аффинное преобразование f есть произведение параллельного переноса и ли- нейного преобразования <р. Последнее называется линейной ча- стью или дифференциалом преобразования f и обозначается че- рез df. Формула ^<p)(tbV0 = ta+9,(b)W’> полученная при доказательстве предложения 2.1, показывает, что отображение d: GAn(K)—»GLn(K), f^df, является гомоморфизмом. Очевидно, что Im d = GLn (К), Ker d = Trans (К”), так что GAn(K)/Trans(Kn) ^GLn(K). Пример 14. Пусть А = А1А2А3— правильный треугольник. Со- поставив каждому движению е Sym Д подстановку cr е S3 по пра- вилу ^(А/) Аащ, мы получим гомоморфизм /: Sym A-»S3. Так как всякое движение плоскости, оставляющее на месте 3 точки, не лежащие на одной прямой, тождественно, то Кег/ = {id}. До- кажем, что Im/ = S3. Так как 1т/ — подгруппа группы S3 и груп- па S3 порождается транспозициями, то достаточно проверить, что любая транспозиция принадлежит 1т/, т. е. может быть осуществ- лена некоторым движением <р G Sym Д. Но д3 это действительно так: например, транспози- А ция (12) осуществляется отражением относи- / [ \ тельно прямой I, показанной на рис. 7. Таким / ] \ образом, / ] \ SymA^S3. £-----------н--Аналогично доказывается, что группа симмет- 1 • 2 рии правильного тетраэдра изоморфна S4 (про- Рис. 7 делайте это!).
§ 6. Гомоморфизмы 189 Пример 15. При перестановках переменных х2, х3, х4 много- члены Х]Х2 + *3*4> *1*з + х2х4> *1*4 +*2*3 (18) переставляются между собой. Занумеровав их каким-либо образом, мы получим гомоморфизм /:S4-S3. Докажем, что Im f = S3. Для этого достаточно проверить, что любая транспозиция многочленов (18) может быть осуществлена некото- рой перестановкой переменных х2, х3, х4. Но это действитель- но так: например, транспозиция первых двух многочленов (18) мо- жет быть осуществлена транспозицией переменных х2 и х3. Далее, Ker f — это так называемая четверная группа Клейна У4 = {е, (12)(34), (13)(24), (14)(23)}. По теореме о гомоморфизме V4 <S4 и S4/V4 ~S3. Легко видеть, что группа V4 изоморфна группе из примера 1.7. Задача 2. Доказать, что для любого п G N имеет место следую- щий «парадоксальный» изоморфизм: с*/сл-с*. Задача 3. Пусть р — простое число. Найти порядки групп GL2(Zp) и SL2(Zp). Очевидно, что композиция гомоморфизмов F -+ G и G —♦ Н есть гомоморфизм F-+H. Пример 16. Рассмотрим композицию гомоморфизмов det: GLn(R)R* и sgn: R*—>C2 = {±1}, где sgn обозначает знак вещественного числа. Мы получим таким образом гомоморфизм £ • GLn(R) —> С2. При п = 2 он имеет следующий геометрический смысл: если е(А) = 1 (соответственно е(А) = -1), то линейное преобразование простран- ства Е2, определяемое матрицей А, сохраняет (соответственно ме- няет) ориентацию в том смысле, что любой положительно ориенти- рованный базис оно переводит в положительно (соответственно от- рицательно) ориентированный базис. Аналогичная интерпретация возможна и при п = 3.
190 Глава 4. Начала теории групп Пример 17. Композиция гомоморфизмов d: GAn (R) -> GLn (R) и е : GLn (R) С2 есть гомоморфизм GAn(R)—>С2. (19) При п = 2 и 3 это позволяет распространить на аффинные преобра- зования евклидовой плоскости и евклидова пространства понятие сохранения или изменения ориентации. А именно, аффинное пре- образование сохраняет (соответственно меняет) ориентацию, если его дифференциал сохраняет (соответственно меняет) ориентацию. В частности, можно говорить о движениях, сохраняющих или меня- ющих ориентацию (что мы уже делали раньше, не давая точного определения). Пример 18. Пусть G С Isom Еп (п = 2 или 3) — какая-либо под- группа, содержащая движения, меняющие ориентацию. Рассматри- вая ограничение на G гомоморфизма (19), мы приходим к выводу, что подмножество движений из G, сохраняющих ориентацию, есть подгруппа индекса 2. Будем обозначать эту подгруппу через G+. Пример 19. В частности, подгруппу Sym+ К с Sym К будем на- зывать группой вращений куба К. Так как |SymK| = 48 (см. при- мер 5.10), a Sym+ К есть подгруппа индекса 2, то |Sym+K| = 24. Докажем, что Sym+K~S4. Для этого занумеруем каким-либо образом 4 диагонали куба К и по- ставим в соответствие каждому движению G Sym+ К подстановку, осуществляемую им на множестве диагоналей. Мы получим гомо- морфизм /: Sym.,. К—>S4. Докажем, что Im f = S4, откуда уже будет следовать, что f — изомор- физм, поскольку iSym^Kl = |S4|. Для этого достаточно проверить, что любая транспозиция принадлежит 1т/. Но это действительно так: например, транспозиция (12) осуществляется поворотом на п вокруг прямой I, изображенной на рис. 8. Задача 4. Доказать, что группа D4 (группа симметрии квадрата) изоморфна группе SymCqA^ + ^A^) (см. примеры 1.8 и 5.11).
§6. Гомоморфизмы 191 Задача 5. Доказать, что SL2(Z2) ^S3. Согласно определению операции в факторгруппе G/N, отобра- жение a:G->G/N, g-*gN, является гомоморфизмом. Оно называется каноническим гомомор- физмом группы G на факторгруппу G/N. Его ядром, очевидно, явля- ется подгруппа N. Пусть f: G Н — любой сюръективный гомоморфизм. Поло- жим Ker f = N. Согласно теореме 1, Н G/N и, если отождествить Н с G/N при помощи указанного там изоморфизма, гомоморфизм f совпадет с каноническим гомоморфизмом группы G на G/ЛЛ По- этому теорему 1 можно понимать таким образом, что никаких сюръективных гомоморфизмов групп, кроме канонических гомо- морфизмов на факторгруппы, в сущности, не существует.
Глава 5 Векторные пространства Эта и последующие две главы будут посвящены линейной ал- гебре, начала которой были изложены в гл. 2, и связанной с ней геометрии. Линейная алгебра является наиболее прикладным раз- делом алгебры. Ее аппарат так же необходим любому математику, как аппарат математического анализа. Следует, однако, предостеречь читателя от взгляда на линейную алгебру как на манипулирование с матрицами — взгляда, игнориру- ющего ее идеологию, в частности геометрические образы, скрываю- щиеся за ее понятиями. Читатель, пошедший по этому легкому пути, много потеряет. Он будет испещрять формулами десятки страниц или перегружать компьютер в ситуациях, очевидных для того, кто действительно владеет линейной алгеброй. За исключением общих определений, некоторых примеров и тех случаев, когда будет оговорено противное, все векторные простран- ства в главах, относящихся к линейной алгебре, предполагаются конечномерными. Основное поле, если это не есть какое-то конкрет- ное поле, обозначается буквой К, § 1. Подпространства Всякий базис подпространства U векторного пространства V можно дополнить до базиса всего пространства. Таким образом мы получим базис, в котором данное подпространство U выглядит весьма просто, а именно, натянуто на несколько первых базисных векторов. Определение 1. Базис пространства V называется согласован- ным с подпространством U, если U является линейной оболочкой какой-то части базисных векторов (т. е. одним из «координатных подпространств» относительно этого базиса). Так, на рис. 1, а) базис {еь е2} согласован с подпространством I/, а на рис. 1, б) — нет.
§ 1. Подпространства 193 Согласно сказанному выше для всякого подпространства суще- ствует согласованный с ним базис. Пусть теперь имеются два подпространства U, W с V. Очевидно, что их пересечение U П IV также является подпространством. Это наибольшее подпространство, содержащееся как в U, так и в IV. Определение 2. Суммой U + W подпространств U и IV называет- ся совокупность векторов вида и + w, где и е U, tv е IV. Это наименьшее подпространство, содержащее как U, так и IV. Иными словами, это линейная оболочка объединения U и IV. Теорема 1. Для всякой пары подпространств Uf IV С V существу- ет базис пространства V, согласованный с каждым из подпрост- ранств U, IV. Доказательство. Пусть {еь ..., ер} — базис подпространства U п АIV. Дополним его какими-то векторами ер+1,..., ек до базиса под- пространства U и, с другой стороны, векторами ek+1, ...,ек+[_р — до базиса подпространства IV. (Здесь р = dim U АIV, k = dim U, I = = dim IV.) Докажем, что векторы elt..., ек+1_р линейно независимы. Дополнив их затем до базиса подпространства V, мы и получим базис, согласованный как с U, так и с IV. Предположим, что к+/-р S А,е,. = О. 1=1 Рассмотрим вектор к к+1—р х = S ^iei = ~ S ^iei- i=l i=k+l Из первого представления вектора х следует, что он лежит в U, а из второго — что он лежит в IV. Таким образом, х е U АIV и, значит, р к+1-р х=Т.^е1 = - S А<ег i=l i=k+l
194 Глава 5. Векторные пространства Так как векторы еьер, efc+1,..., ek+i_p линейно независимы, то отсюда следует, что х = 0 и Л, = О при i = k + 1, ...,к + 1- р. Далее, так как векторы elfек линейно независимы, то из равенства к £Л(е,=О 1=1 следует, что Л( = 0 при i = 1,..., к. □ Рисунок 2 иллюстрирует это доказательство в случае р = 1, к = =J = 2. Следствие. dim([/ + IV) = dim U + dim IV - dim([/ ПIV). Доказательство. В обозначениях доказательства теоремы 1 век- торы еь ek+i-p составляют базис подпространства U + IV, так что dim«J + IV) = k + Z-p. □ Для трех подпространств теорема, аналогичная теореме 1, невер- на. Задача 1. Привести пример, подтверждающий это высказыва- ние. Теорема 1 описывает взаимное расположение пары подпрост- ранств. Взаимное расположение произвольного (конечного) числа подпространств описать, вообще говоря, сложно (и в некотором смысле даже невозможно). Однако нас будет в первую очередь
§ 1. Подпространства 195 интересовать один важный частный случай, когда это сделать просто. Определение 3. Подпространства 1^,..., U* называются линей- но независимыми, если из равенства 4-... 4- = 0 (u, G Ц) следует, что u1 = ... = uk = 0. Для двух подпространств U, W линейная независимость равно- сильна тому, что U п IV = 0. Напрашивающееся обобщение для лю- бого числа подпространств неверно. Задача 2. Привести пример трех линейно зависимых подпрост- ранств, все попарные пересечения которых равны нулю. Определение 4. Суммой 14 + ...4-14 подпространств U19..., Ukc с V называется совокупность векторов вида u j 4-... 4- ик, где u, G . Это наименьшее подпространство, содержащее все подпростран- ства U19..., ик. Предложение 1. Следующие свойства системы подпространств ..., Uk с V равносильны: 1) U19..., Uk линейно независимы; 2) объединение базисов подпространств Ult ...,Uk линейно неза- висимо; 3) dimCt/i 4-... 4- (4) = dim Щ 4-... 4- dim Uk. Доказательство. 1) <=» 2). Пусть {еп,..., е1П.} — базис подпрост- ранства Ui (i = 1, ...,k). Предположим, что между векторами ei} (i = 1,..., к, j = 1,..., nJ имеется нетривиальная линейная зависи- мость: =0. Тогда сумма векторов Xi = SVvel/i (i = l,...,k) J равна нулю, причем не все они равны нулю. Следовательно, подпро- странства Ulf..., Uk линейно зависимы. Обратно, если подпространства Ulf ...,Uk линейно зависимы, то существуют векторы х( GLT, (i = 1,..., к), не все равные нулю, сумма которых равна нулю. Разложив каждый из них по базису своего под- пространства, мы получим нетривиальную линейную зависимость между векторами е^. 2) <=> 3). Так как объединение базисов подпространств UlfUk порождает сумму иг 4-... 4- Uk, то каждое из свойств 2) и 3) рав- носильно тому, что это объединение является базисом пространст- ва L4 4-... 4- Uk. Следовательно, эти свойства равносильны между собой. □
196 Глава 5. Векторные пространства Определение 5. Говорят, что векторное пространство V разлага- ется в прямую сумму подпространств Ulf..., Uk, если 1) подпространства Ult ...,Uk линейно независимы; 2) иг + ... + U^V. В этом случае пишут V = LJ1®...©[Jk. Каждый вектор и G V однозначно представляется в виде и = tq +... ... + ик, где щ G Up, вектор и, называется проекцией вектора и на подпространство Подчеркнем, что проекция вектора на подпро- странство U( зависит не только от этого подпространства, но и от остальных слагаемых разложения. Пример 1. Квадратная матрица А называется симметричной, если Ат = А, и кососимметричной, если Ат = —А. Симметричные (соответственно кососимметричные) матрицы образуют подпро- странство L+(K) (соответственно L~(K)) в пространстве Ln(K) всех матриц. При условии, что char К 0 2, всякая матрица А может быть представлена в виде суммы симметричной и кососимметричной матриц: А=|(А + АТ) + |(А-АТ). С другой стороны, при том же условии очевидно, что матрица, симметричная и кососимметричная одновременно, равна нулю. Это означает, что ljk) = l+(K)©l;(K). Пример 2. Аналогично доказывается, что пространство всех функций на вещественной прямой является прямой суммой подпро- странств четных и нечетных функций. (В этом примере векторное пространство и оба подпространства бесконечномерны.) Пример 3. Пусть {е}, ...,еп} — базис векторного пространства V. Тогда У = (е1)ф...ф(еп). Проекция вектора хе V на (е^ равна х&, где х, есть i-я координата вектора х в базисе {еь ...,еп}, и зависит не только от ef, но и от остальных векторов базиса. Определения 3, 4 и 5 могут быть распространены на бесконеч- ное число подпространств, если рассматривать только такие суммы
§ 2. Линейные отображения 197 векторов, в которых лишь конечное число слагаемых отлично от нуля. Пример 4. Пусть А = К[хь ..., хп] — алгебра многочленов от п переменных. Обозначим через Ad подпространство однородных многочленов степени d. Так как всякий многочлен однозначно представляется в виде суммы однородных многочленов различных степеней, то м А = А0ФА1ФА2Ф...= ФАр При этом d=0 ^d+e* (1) Разложение какой-либо алгебры А в прямую сумму подпрост- ранств Ad (d GZ), удовлетворяющее условию (1), называется ее гра- дуировкой. Алгебра, снабженная градуировкой, называется градуи- рованной алгеброй. (Некоторые из подпространств Ad могут быть нулевыми. Так, в приведенном выше примере Ad = 0 при d < 0.) Задача 3. Пусть А = Ln (К) — алгебра матриц. Обозначим че- рез Ad линейную оболочку матричных единиц Еу с j -i = d. Дока- зать, что подпространства Ad задают градуировку алгебры А. (Здесь Ad= 0 при |d| п.) § 2. Линейные отображения Подобно гомоморфизмам групп естественно рассматривать го- моморфизмы векторных пространств. Их принято называть линей- ными отображениями. Определение 1. Пусть V и U — векторные пространства над по- лем К. Отображение (/?: V-+U называется линейным, если 1) (p(a + b) = (p(a) + (/?(b) для любых a, be V; 2) (Aa) = А<р (а) для любых A G К, а G V. Это определение отличается от определения изоморфизма век- торных пространств тем, что в нем не требуется биективности. Усло- вие 1) означает, что отображение ср должно быть гомоморфизмом аддитивных групп. Из общих свойств гомоморфизмов групп следует, что ср(О) = О, </?(-a) = -^(a), (/?(a-b) = (p(a)-(/?(b).
198 Глава 5. Векторные пространства Пример 1. Поворот есть линейное отображение (и даже изомор- физм) пространства Е2 в себя (рис. 3). у?(а+Ь)= а Ла Рис. 3 Пример 2. Ортогональное проектирование на плоскость опреде- ляет линейное отображение (но не изоморфизм) пространства Е3 в пространство геометрических векторов этой плоскости. Пример 3. Дифференцирование является линейным отображе- нием пространства непрерывно дифференцируемых функций на за- данном промежутке числовой прямой в пространство непрерывных функций на этом промежутке. Линейное отображение ср: V —► U однозначно определяется об- разами базисных векторов пространства V. В самом деле, пусть {ef: iel} — базис пространства V; тогда для любого вектора х = = ^х1е1 имеем i С другой стороны, если G U (ieV) — произвольные векторы, то отображение (p:V—*U, определяемое по формуле i как легко видеть, является линейным и = щ. Эти соображения позволяют получить аналитическое описание линейных отображений. Пусть ср: V —» U —линейное отображение конечномерных векторных пространств. Выберем в пространствах V и U какие-нибудь базисы {ег,..., еп} и {Д,..., fm}. Применим отоб- ражение к векторам elf...,en и разложим полученные векторы
§ 2. Линейные отображения 199 пространства U по базису {/ь ..., fm}: + a2jf2 +... + amjfm = £ a.jfi- i Числа ay (i = 1, 2,..., m, j = 1,2,п) образуют матрицу А размера гп x п, которая называется матрицей линейного отображения ср в выбранных базисах пространств V и U. Согласно этому определе- нию в j-м столбце матрицы А стоят координаты образа j-го базис- ного вектора пространства V в выбранном базисе пространства U. В матричных обозначениях это можно записать следующим обра- зом: ((p(e1),...)^(en)) = (/1,...>/m)A (ср. формулу (8) перехода к другому базису в § 2.2). Найдем теперь выражение координат у19..., ут образа у = </?(х) вектора хе V через координаты х1}..., хп вектора х. В силу линейно- сти отображения ip имеем У = Ч> (s V;) = S XjipCej) = S aijXjfi, j j i,j * = £ aijxj = ...,m). j=i откуда (2) Если обозначить через X и Y столбцы координат векторов х и у соответственно, то равенства (2) можно переписать в следующей матричной форме: У = АХ. (Ср. формулу (9) преобразования координат в § 2.2.) Пример 4. В пространстве Е2 * * выберем ортонормированный ба- зис {elfe2}. Пусть ip— поворот на угол а. Тогда (см. рис. 4) ^р(е1) = Cj cos а + е2 sin а, ip (е2) = — Cj sin а + е2 cos а. Это означает, что матрица отображения ср есть cos a -sin а sin a cos а (4)
200 Глава 5. Векторные пространства Заметим, что в данном случае V = U и мы использовали один и тот же базис {еь е2} в двух качествах: как базис пространства V и как ба- зис пространства U, хотя, согласно определению, не обязаны были это делать. Пример 5. Найдем матрицу проектирования из примера 2. В плоскости проектирования выберем любой базис {е},е2} и допол- ним его ортогональным вектором е3 до базиса пространства. Так как при проектировании векторы Ci и е2 переходят сами в себя, а вектор е3 — в нуль, то искомая матрица (относительно выбранных базисов) имеет вид 1 0 ОА 0 1 0/ Как и для любого гомоморфизма групп, для линейного отображе- ния ср: V —► U определяются его образ Im ср = {(/?(а): a е V} с U, и ядро Кегср = {аеУ: <p(a) = 0}cV. Они являются не только подгруппами, но и подпространствами со- ответствующих векторных пространств, т. е. замкнуты относитель- но умножений на любые числа. Покажем, например, что Ker р — подпространство в V. Если a е Кег р, т. е. ср (а) = 0, то для любого ЛеК р (Ла) = Хр (а) = Л0 = 0, т.е. ЛаеКегр. Пример 6. Ядром отображения проектирования из примера 2 является совокупность векторов, ортогональных плоскости проек- тирования. Пример 7. Ядром отображения дифференцирования из приме- ра 3 является совокупность постоянных функций, а образом — про- странство всех непрерывных функций. Последнее следует из суще- ствования первообразной у каждой непрерывной функции, доказы- ваемого в анализе. Согласно общим свойствам гомоморфизмов групп, установлен- ным в § 4.6, линейное отображение р: V U инъективно тогда и только тогда, когда Кег р = 0, а в общем случае полный прооб- раз любого вектора b = р(а) е Im р есть смежный класс а + Кег р.
§ 2. Линейные отображения 201 Последнее утверждение есть «бескоординатная» форма утвержде- ния 2) теоремы 2.1.3 (а утверждение о том, что Кег — подпростран- ство, есть бескоординатная форма утверждения 1) этой теоремы). Что можно сказать о размерностях образа и ядра линейного отоб- ражения конечномерных векторных пространств? Теорема 1. Если в каких-то базисах пространств V uU линейное отображение V -+U имеет матрицу А, то dim Im ср = rk А. Доказательство. Очевидно, что Im ср есть линейная оболочка образов базисных векторов е1,...,еп пространства V и, значит, dim Im ip есть ранг системы векторов (рСеД ..., <р(еп). Но в столб- цах матрицы А как раз и записаны координаты этих векторов в каком-то базисе пространства U. Следовательно, ранг этой системы векторов равен рангу матрицы А. □ Теорема 2. dim Im (р + dim Ker = dim V. Доказательство. Выберем базис пространства V специальным образом: сначала возьмем базис {е1? ...,ек} подпространства Кег ср, а затем дополним его какими-то векторами ед.+1, ...,еп до базиса пространства V. Так как по построению =... = = 0, то Докажем, что векторы (р(ек+1),..., ср (еп) линейно независимы, отку- да и будет следовать утверждение теоремы. Пусть *1 (efc+i) + •. + А„-к¥> (е,,) = 0. Рассмотрим вектор a = A]efc+i + ... + An_fcen. Предыдущее равенство означает, что ср (а) = 0, т. е. аеКег(р = (е1, ...,ек). Так как е1?..., ек, ек+1, ...,еп линейно независимы, то это возможно только при А} =... = An_k = 0, что и требовалось доказать. □ Записывая отображение ср в координатах, мы можем из теорем 1 и 2 вывести теорему 2.3.3 о размерности пространства решений системы однородных линейных уравнений. Таким образом, понятие линейного отображения позволяет получить более простое доказа- тельство теоремы 2.3.3.
202 Глава 5. Векторные пространства Пример 8. Пусть X — множество ребер тетраэдра и У — множе- ство его граней. Каждой функции f на X со значениями в поле К по- ставим в соответствие функцию g на У, определяемую следующим образом: g(y)= L fM, хс.у т. е. значение функции g на какой-либо грани равно сумме значений функции f на сторонах этой грани. Этим определяется линейное отображение <p:F(X, К) — F(y, К) (см. пример 1.6.2). Докажем, что если char К 02, то оно сюръектив- но. Для этого достаточно показать, что Im ср содержит 5-функции всех граней (см. пример 2.2.7). Функция /, для которой (р(/) есть 5-функция нижней грани, изображена на рис. 5, а) (ее значения на непомеченных ребрах равны нулю). Так как dim F (X, X) = 6, dim F (У, X) = 4, то по теореме 2 dim Кег (р = 6-4 = 2. Функции, составляющие базис подпространства Кег <р, изображены на рис. 5, б). Задача 1. Для отображения <р из предыдущего примера найти dim Кег <р в случае, когда char К = 2. Обратимся теперь к операциям над линейными отображениями. Линейные отображения V -♦ U можно складывать и умножать на числа, как обычные функции: ((р + 'ф)(а) = (р(а) + 'ф(а), (Лср)(а) = Л(р(а).
§ 2. Линейные отображения 203 Относительно этих операций они образуют векторное простран- ство. Далее, если 4>:V-*U, Tp:W-*V —линейные отображения, то их произведение (композиция) W->U есть также линейное отображение. В самом деле, (<^)(а + Ь) = </>(!/; (а + Ь)) = </>(i/)(a) +ч/>(Ь)) = = <p(i/>(a)) + = (</>^)(а) + (</”/’)№), (</’’/’) (Ла) = </> (i/> (Ла)) = у (Лт/Ча)) = Л(/?(ч/) (а)) = Л (<р-ф) (а). Умножение линейных отображений связано с линейными опера- циями свойствами </?(1/> + о)) = </я^ + <ро), (<р +1/>) <«> = </? со+ (Л<^)1/> = <^(Л1/>) = Л(^) УЛбК. Докажем, например, первое из свойств дистрибутивности. Пусть xp:W—*V, a>:W-+V —линейные отображения. Для любого а е IV имеем (</> (i/> + со)) (a) = ((i/> + со) (а)) = </> (i/> (а) + со (а)) = = (со(а)) = (</?i/>)(a) + (</?со)(а) = (<pi/> + </>со)(а). Умножение линейных отображений ассоциативно, как и вообще умножение любых отображений. В самом деле, пусть M,N,P,Q. — какие-то множества и 4>:N-*M, ip:P-+N, oj:Q->P — какие-то отображения. Тогда для любого a G Q имеем ((</>V>)co)(a) = (</>i/>)(co(a)) = </>(i/>(co(a))), (</>(’/’ co))(a) = </?((i^to)(a)) = <^(i/>(a)(a))), откуда (</?V’)co = </>('t/’to).
204 Глава 5. Векторные пространства Операции над линейными отображениями соответствуют таким же операциям над их матрицами. Для линейных операций это оче- видно. Докажем это для умножения. Пусть — линейные отображения с матрицами А = (а^) и В = (bjk) в бази- сах {е1? ...,en}, {flf {gi, ...,gp} пространств V, U, W соответ- ственно. Тогда = </>(№)) = ¥» (S bjkej) = E bjk</>(ej) = £ а0Ь}к//, j j ij Следовательно, матрица отображения угр есть С = (cik), где cik == S j Это означает, что С = АВ, что и требовалось доказать. Пример 9. Матричное равенство, доказанное в примере 1.8.2, на языке линейных отображений означает, что произведение пово- ротов плоскости на углы а и Р есть поворот на угол а + р (см. при- мер 4). Поскольку последнее утверждение геометрически очевидно, это дает доказательство формул для косинуса и синуса суммы двух углов. Свойства операций над матрицами, полученные нами в § 1.8 пря- мыми вычислениями, могут быть теперь выведены из соответствую- щих свойств операций над линейными отображениями. Очевидно, что тождественное отображение id: V — V линейно. Матрица тождественного отображения id: V -* V в двух одинаковых базисах пространства V есть единичная матрица Е. По- этому свойства единичной матрицы (см. формулу (10) §1.8) есть просто перевод на матричный язык очевидных равенств <p-id = (p, id •(/? = (/?, где ср: V -♦ V — линейное отображение, задаваемое матрицей A, a id в первом случае обозначает тождественное отображение простран- ства V, а во втором — тождественное отображение пространства U- Напомним, что отображение множеств обратимо тогда и только тогда, когда оно биективно. Если : V —* U — биективное линейное
§ 3. Сопряженное пространство 205 отображение, то обратное отображение с/?"1: U —► V также линейно. В самом деле, для любых a, b G U пусть с, d G V — такие векторы, что ip(с) = а, <р(d) = b; тогда <р(с + d) = а + b и, следовательно, (£-1(a + b) = c + d = (^“1(a) Аналогично проверяется и второе свойство линейности. Очевидно, что линейное отображение ip: V —► U биективно тогда и только тогда, когда Im ip = U и Ker ip = 0. В этом случае оно явля- ется изоморфизмом, а матрицей обратного отображения (в тех же базисах) служит матрица, обратная матрице <р. Задача 2. Используя линейные отображения, доказать, что ранг произведения двух матриц (не обязательно квадратных) не превос- ходит ранга каждой из них (теорема 2.3.5), а если одна из этих матриц невырожденна, то ранг произведения равен рангу другой матрицы. § 3. Сопряженное пространство Векторные пространства представляют мир, в котором живут персонажи линейной алгебры. Простейшими из них, помимо векто- ров, являются линейные функции, которые, как мы увидим, в неко- тором смысле двойственны векторам. Напомним определение линейной функции, введенное нами в §2.4. Определение 1. Линейной функцией (или линейной формой) на векторном пространстве V называется всякая функция а: V К, обладающая свойствами 1) а(х + у) = а(х) + а(у); 2) а(Лх) = Ла(х). Иными словами, линейная функция — это линейное отображе- ние пространства V в поле К, рассматриваемое как (одномерное) векторное пространство. Пример 1. Как доказывается в курсе элементарной геометрии, функция а(х) = (а, х) (а GE3) является линейной функцией на про- странстве Е3. Пример 2. Функция a(f) = /(х0) (х0 £ X) является линейной функцией на пространстве F(X, К) функций на множестве X со значениями в К (см. пример 1.6.2).
206 Глава 5. Векторные пространства Пример 3. Функция а(/) = /'(*о) (*о е является линейной функцией на пространстве С1®) дифференцируемых функций на вещественной прямой. ь Пример 4. Функция а(/) = j f(x) dx является линейной функ- цией на пространстве С [а, Ъ] непрерывных функций на отрезке [а, Ы. Пример 5. Следом квадратной матрицы называется сумма ее диагональных элементов. След матрицы X обозначается через trX. Функция а(Х) = trX является линейной функцией на пространстве Ln(K) квадратных матриц. Если хь ..., хп —координаты вектора х в базисе {е1?..., еп}, то а(х) = +... + апхп, (5) где а, = аСе,). Таким образом, линейная функция однозначно опре- деляется своими значениями на базисных векторах, называемыми ее коэффициентами в данном базисе. Коэффициенты могут быть произвольными: для любых аь ..., ап еК функция а, определяемая формулой (5), является линейной. Линейные функции образуют подпространство в пространстве F(V, К) всех функций на V со значениями в К. Определение 2. Пространство линейных функций на V называ- ется сопряженным пространством по отношению к V и обозначает- ся через V*. Пусть {еь ..., еп}— базис пространства V. Линейные функции ..., еп G V*, определяемые равенствами e,(x) = х1? называются ко- ординатными функциями относительно базиса {е1? ...,еп}. Они со- ставляют базис пространства V*, который называется сопряженным базисом по отношению к {е1?..., еп}. Из его определения следует, что для любого вектора х G V x = Ylei(x')ei. (6) Сопряженный базис может быть также определен условиями &i (Cj) бу 1 при/= 7, 0 при/0; (символ Кронекера). Из предыдущего следует, что dim V* = dim V, так что пространства V и V* изоморфны, хотя между ними и не существует никакого есте- ственного (выделенного) изоморфизма. Однако второе сопряжен-
§ 3. Сопряженное пространство 207 ное пространство V** = (V*)* оказывается естественно изоморфным пространству V. Из определения операций в пространстве V* следует, что для любого вектора хе V функция fx на V*, определенная по формуле /Х(а) = а(х), является линейной. Теорема 1. Отображение x*-+fx является изоморфизмом прост- ранства V на пространство V**. Доказательство. Из определения линейных функций следует, что fx+y = fx + fy и /л* = Л/х. Остается проверить, что отображе- ние х —>/х биективно. Пусть {elf...,en}— базис пространства V и {q,..., еп} — сопряженный базис пространства V*. Тогда /е, &ij> так что {fe},fen} — базис пространства V**, сопряженный базису {^1,..., еп}. Отображение х —► Д переводит вектор с координатами хь ..., хп в базисе {е1э..., еп} пространства V в вектор с такими же координатами в базисе {Д ,Д} пространства V**. Следователь- но, оно биективно. □ В дальнейшем мы будем отождествлять пространства V и V** посредством указанного изоморфизма, т. е. рассматривать каждый вектор х G V одновременно и как линейную функцию на V* (и пи- сать х(а) вместо fx(а)). При таком соглашении пространства V и V* будут играть совершенно симметричную роль. Следствие. Всякий базис пространства V* сопряжен некоторо- му базису пространства V. Задача!. Показать, что линейные функции elf...,en (где п = = dim V) составляют базис пространства V* тогда и только тогда, ко- гда не существует ненулевого вектора х G V, для которого (х) =... ... = еп(х) = 0. Задача 2. Пусть V — пространство многочленов степени $ п над полем К. Показать, что линейные функции е0, elfеп> определяе- мые равенствами М/)=ЛХ(), где х0,хь ...,хп —различные элементы поля К, составляют базис пространства V*, и найти сопряженный базис пространства V. По- казать, что формула (6) в этом случае превращается в интерполяци- онную формулу Лагранжа.
208 Глава 5. Векторные пространства Задача 3. Пусть V то же, что и в задаче 2, причем char К = 0. Показать, что линейные функции е0, ..., еп> определяемые равен- ствами где х0 G К, составляют базис пространства V*, и найти сопряженный базис пространства V. Показать, что формула (6) в этом случае пре- вращается в формулу Тейлора. Замечание 1. Теорема 1 неверна для бесконечномерных пространств. Если пространство V бесконечномерно, то пространство V* и, тем более, V** имеют большую размерность. Например, пусть V = K°° — пространство финитных последовательностей (см. пример 2.2.9). Это пространство счет- номерно. Линейные функции на нем имеют вид a(xj,x2, ...) = а1х1+а2х2 + ... (ввиду финитности последовательности (хьх2,...) сумма фактически ко- нечна). Здесь аь а2,... могут быть произвольными элементами поля К. По- этому пространство V* изоморфно пространству всех последовательно- стей, которое, как можно показать (попробуйте это сделать!), несчетно- мерно. Имеется естественное взаимно однозначное соответствие меж- ду подпространствами пространств V и V*, при котором каждому k-мерному подпространству пространства V соответствует (и - к)- мерное подпространство пространства V* (где n = dim V). Определение 3. Аннулятором подпространства U с V называет- ся подпространство U° = {aGV*: a(x) = 0 VxGl7}. Теорема 2. dim UQ = dim V - dim U. Доказательство. Пусть — такой базис пространства V, что U = (еь ..., ек), и {еъ ..., еп} — сопряженный базис простран- ства V*. Тогда U° = (ек+1, □ В соответствии с нашим отождествлением пространств V** и V мы можем говорить об аннуляторе подпространства W с V* как о подпространстве пространства V. По определению W° = {xGV: a(x) = 0 VaGW}. Теорема 3. (17°)° = U для любого подпространства U с V.
§ 4. Билинейные и квадратичные функции 209 Доказательство. В обозначениях доказательства теоремы 2, яс- но, что ((J0)° = (e1, ...,ek) = U. □ Следствие. Любое подпространство в V является аннулятором некоторого подпространства в V*. Пусть имеется система однородных линейных уравнений S 0,^ = 0 (i = l, (7) j=i Будем интерпретировать ..., хп как координаты вектора х п-мер- ного векторного пространства V в некотором базисе {еь ...»еп}. То- гда система (7) может быть записана в виде «i(x) = 0 (i = l, ...,m), где аъ ат G V* —линейные функции, стоящие в левых частях уравнений (7). Множество решений этой системы представляет со- бой аннулятор подпространства (аь ..., ат) С V*. Заметим, что раз- мерность этого подпространства равна рангу матрицы коэффициен- тов системы (7). Поэтому теорема 2.3.3 о размерности пространства решений системы однородных линейных уравнений является непо- средственным следствием теоремы 2. Следствие теоремы 3 в этом контексте может быть сформулиро- вано так: Теорема 4. Всякое подпространство является множеством ре- шений некоторой системы однородных линейных уравнений. § 4. Билинейные и квадратичные функции Аксиоматика векторного пространства не охватывает еще всей элементарной геометрии векторов евклидова пространства, по- скольку в этой аксиоматике отсутствуют такие понятия, как дли- на вектора и угол между векторами. Длина и угол могут быть выражены через скалярное произведение векторов. Одним из ос- новных свойств скалярного умножения геометрических векторов является его линейность по каждому множителю. В этом параграфе мы рассмотрим функции двух векторных аргументов, являющиеся обобщением скалярного умножения. Определение 1. Билинейной функцией (или билинейной фор- мой) на векторном пространстве V называется функция а: V х V —> -*К, линейная по каждому аргументу.
210 Глава 5. Векторные пространства Пример 1. Как доказывается в курсе элементарной геометрии, скалярное умножение геометрических векторов является билиней- ной функцией на пространстве Е3. Пример 2. Функция Гь “(/>?) = /(x)g(x)dx Ja является билинейной функцией на пространстве С [а, Ъ]. Пример 3. Функция а(Х, У) = 1гХУ является билинейной функцией на пространстве Ln(X). Пример 4. Определитель матрицы второго порядка как функ- ция ее строк есть билинейная функция на пространстве К2. Пусть {еь ..., еп} — базис пространства V. Тогда для векторов х = = S xieb У = S yjej получаем < j а(х, У) = L где aij = (8) i>j Матрица А = (а^) называется матрицей билинейной функции а в ба- зисе {elf...,en}. Как видно из предыдущей формулы, билинейная функция однозначно определяется своей матрицей. Формула (8) может быть переписана в матричных обозначениях: а(х,у) = ХтАУ, (9) где X и У — столбцы координат векторов х и у соответственно. При переходе к другому базису (е/1,...,е/п) = (е1,...,еп)С координаты векторов х и у преобразуются по формулам Х = СХ', Y = CY'. Подставляя эти выражения в (9), получаем а(х, у) = (Х')ТСТАСУ', откуда следует, что в базисе {e'v ...,е'п} матрица функции а равна А' = СТАС. (10)
§ 4. Билинейные и квадратичные функции 211 Основная задача теории билинейных функций — это приведе- ние матрицы билинейной функции к возможно более простому ви- ду за счет выбора подходящего базиса. В связи с этим важно знать свойства матрицы билинейной функции, которые не зависят от вы- бора базиса. Определение 2. Ядром билинейной функции а называется под- пространство Кег а = {у G V: а(х, у) = 0 Vx G V}. Функция а называется невырожденной, если Кег а = 0. Все билинейные функции, рассмотренные в примерах 1—4, невырожденны. Так, невырожденность скалярного умножения сле- дует из того, что (у, у) > 0 при у 0 0. Аналогично доказывается невырожденность билинейной функции в примере 2. Задача 1. Доказать невырожденность билинейных функций в примерах 3 и 4. Очевидно, что если {еь ..., еп} — базис пространства V, то Кег а = {у GV: a(eh у) = 0, i = l,..., и}. Записывая эти условия в координатах, получаем систему однород- ных линейных уравнений, матрицей коэффициентов которой слу- жит матрица А функции а. Следовательно, dim Ker а = п - rk А. (11) В частности, Кег а = 0 тогда и только тогда, когда rk А = п, т. е. когда матрица А невырожденна. Из формулы (11) следует, что ранг матрицы билинейной функ- ции а не зависит от базиса. Он называется рангом билинейной функ- ции а и обозначается через rk а. Определение 3. Билинейная функция а называется симметри- ческой (соответственно кососимметрической), если а(х, у) = а (у, х) (соответственно а(х, у) = — а(у, х)) для любых х, у G V. Так, билинейные функции в примерах 1 и 2 симметричны. Билинейная функция в примере 3 также симметрична. В самом деле, если X = (Ху), Y = (уу), то tr XY = £ ХцУц = S УцХц = £ УцХц = tr YX. i,j iJ i,j
212 Глава 5. Векторные пространства Билинейная функция в примере 4 кососимметрична. Но, конечно, существуют билинейные функции, которые не являются ни симмет- рическими, ни кососимметрическими. Билинейная функция является симметрической (соответственно кососимметрической) тогда и только тогда, когда ее матрица А сим- метрична (соответственно кососимметрична), т. е. АТ = А (соответ- ственно Ат = — А). Определение 4. Пусть а — симметрическая билинейная функ- ция над полем К характеристики /2. Функция q: V ->К, определяе- мая по формуле q(x) = a(x,x), называется квадратичной функцией (или квадратичной формой), ассоциированной с функцией а. В координатах квадратичная функция записывается в виде qM = Yiaijxixj) (12) i,j т. е. является однородным многочленом второй степени. Симметрическая билинейная функция а может быть восстанов- лена по соответствующей квадратичной функции q по формуле a(x,y) = i[q(x + y)-q(x)-q(y)]. (13) Билинейная функция а называется поляризацией квадратичной функции q. Таким образом, имеется взаимно однозначное соответствие меж- ду симметрическими билинейными и квадратичными функциями. Имея в виду это соответствие, все понятия, относящиеся к сим- метрическим билинейным функциям (матрица, ранг, невырожден- ность и т.д.), переносят на квадратичные функции. В дальнейшем изложении мы будем из соображений удобства иногда говорить о симметрических билинейных, иногда — о квадратичных функциях. Геометрические ассоциации, связанные со скалярным умноже- нием векторов, могут быть полезны при изучении произвольных билинейных функций. Этим объясняется вводимая ниже термино- логия. Пусть а — симметрическая или кососимметрическая билиней- ная функция над полем К характеристики /2. Векторы х,у eV называются ортогональными (относительно а), если а(х, у) = 0;
§ 4. Билинейные и квадратичные функции 213 в этом случае пишут х ±у. Ясно, что это отношение симметрично: если х ±у, то и у ±х. Отметим, что в случае кососимметрической функции а каждый вектор ортогонален самому себе. Определение 5. Ортогональным дополнением к подпростран- ству U (относительно а) называется подпространство U1 = {yeV: а(х,у) = 0 Vxel/}. В частности, У1 = Кег а. Предложение 1. Если функция а невырожденна, то dim U1 = dim V - dim U и (U^y^U. Доказательство. Пусть {е1?..., ек} — базис в U. Тогда U1 = {у е V: а(е(., у) = 0, i = 1,..., к}. (14) Записывая эти условия в координатах, мы получаем систему одно- родных линейных уравнений. Эти уравнения линейно независимы, так как для любых ..., Лк, не равных нулю одновременно, линей- ная функция k z к х £Л,а(е(,у) = а( i=l М=1 J в силу невырожденности функции а не является нулевой. Следова- тельно, dim U1 = n-k, где n = dim V. По той же формуле dimtU1)1 = п-(п-к) = к = dim U. Однако ясно, что ((У1)1 О, Следовательно, ((У1)1 = U. □ Определение 6. Подпространство U называется невырожден- ным относительно билинейной функции а, если ее ограничение на U невырожденно. Предложение 2. V = U Ф (У1 тогда и только тогда, когда под- пространство U невырожденно. Доказательство. Из (14) ясно, что в любом случае dim U1 dim V — dim U. С другой стороны, U П СУ1 = Кег а|а,
214 Глава 5. Векторные пространства так что если U П U1 = 0, то подпространство U невырожденно. Об- ратно, если подпространство U невырожденно, то U П U1 = 0 и dim(C7 + U1) = dim U + dim U1 dim V, откуда следует, что U + U1 = V. □ Пусть а — симметрическая билинейная функция. Базис {е1?..., еп} пространства V называется ортогональным (от- носительно а), если его векторы попарно ортогональны. В орто- гональном базисе матрица функции а диагональна, а сама функ- ция а и соответствующая ей квадратичная функция q записываются в виде a(x,y) = aiX1y1 + ...+anxnyn, (15) q(x) = aix2 + ... + anx2. (16) Теорема 1. Для любой симметрической билинейной функции су- ществует ортогональный базис. Доказательство. Докажем это утверждение индукцией по п = = dim V. При п = 1 доказывать нечего. Пусть п > 1. Если а = 0, то доказывать опять-таки нечего. Если а 0, то в силу формулы (13) q £ 0, т. е. существует такой вектор еь что a(e1,e1) = q(e1)0O. Согласно предложению 2, У = (е1)ф(е1)±. По предположению индукции существует ортогональный базис {е2, ...,еп} пространства (ej)1. Добавляя к нему вектор еь мы по- лучаем ортогональный базис {е1? е2,..., еп} пространства V. □ Следующая теорема дает более явный способ построения орто- гонального базиса (при ограничениях, указанных в ее формулиров- ке). Пусть {еь ...,еп}— некоторый базис пространства V и А — мат- рица функции а в этом базисе. Обозначим через Ак матрицу огра- ничения функции а на подпространство Vk = (еь ...,ек) в базисе {е1? ...,efc} этого подпространства, т.е. левый верхний угол поряд- ка к матрицы А. Число 5к = det Ак будем называть угловым минором порядка к матрицы А. Положим также Уо = 0, 50 = 1. Теорема 2. Если все угловые миноры 5lf..., 5п матрицы А от- личны от нуля, то существует единственный ортогональный базис
§ 4. Билинейные и квадратичные функции 215 {/i,..., fn} пространства V, удовлетворяющий условиям fkZek + Vk-г (к = 1,и). (17) При этом q(fk^^fk,fk) = ^- (k = l,...,n). (18) °k-l Доказательство. Докажем теорему индукцией по п. При и = 1 имеем Л=е„ ?(Л> = 5,(=^)- При и > 1 применим предположение индукции к базису {е1?..en_i} пространства УП_Р Пусть {Д, — ортогональный базис про- странства Уп_ь удовлетворяющий условиям теоремы. Будем искать вектор fn в виде п-1 fn ^ifi + Vn_i. i=l Заметим, что q(Z) = ^y#o при1=1,...,п-1, и поэтому условия ортогональности о = a(/n, fi) = а(еп, Л) + (/f) (i = 1,.... и - 1) удовлетворяются при подходящем выборе чисел при- чем эти числа определяются однозначно. Так как fn ф Уп_1? то {/1, •••> /п) — базис пространства V. Остается проверить равенство (18) при к = п. Так как матрица пе- рехода от базиса {еь..., еп} к базису {f19..., fn} является (верхней) унитреугольной (т. е. треугольной с единицами на диагонали), то ее определитель равен 1 и формула (10) показывает, что определитель матрицы функции а не меняется при переходе к базису {j\,..., fn}. Однако в этом базисе матрица функции а диагональна, причем ее диагональные элементы равны q(/i),...,q(/n-i),q(/n). Следовательно, 5n = q(/i)-q(/n-i)q(/n)-
216 Глава 5. Векторные пространства Такое же рассуждение, примененное к ограничению функции а на подпространство (или, если угодно, предположение индукции), показывает, что Отсюда следует, что Процесс построения ортогонального базиса, описанный в дока- зательстве теоремы, называется процессом ортогонализации Гра- ма—Шмидта. Рисунок 6 иллюстрирует его в случае, когда а — скалярное умножение в Е3. Пусть {еь — базис пространства V, ортогональный отно- сительно функции а. За счет нормировки векторов et числа а, = q (ef) можно умножать на квадраты любых ненулевых элементов поля К. Кроме того, переставляя базисные векторы, можно переставлять и эти числа. Однако, как видно из доказательства теоремы 1, в выбо- ре ортогонального базиса имеется гораздо больший произвол. Как можно изменять числа а,, пользуясь этим произволом? Ответ на этот вопрос существенно зависит от поля К. Пусть К = С. Тогда путем нормировки базисных векторов чис- ла at могут быть сделаны равными 1 или 0, и после подходящей перестановки базисных векторов функция q приводится к так назы- ваемому нормальному виду: qM=xl + ... + x^. Число г является инвариантом, так как r = rkq.
§4. Билинейные и квадратичные функции 217 Пусть теперь К = К. Тогда путем нормировки базисных векторов числа а, могут быть сделаны равными ±1 или 0, и после подходящей перестановки базисных векторов функция q приводится к нормаль- ному виду: q(x) = xf +... + х2 - х2+1 - ... - х2+(. (19) Сумма к +1 = rk q является инвариантом, но являются ли инвариан- тами к и I по отдельности? Для ответа на этот вопрос введем одно важное понятие. Определение 7. Вещественная квадратичная функция q называ- ется положительно определенной, если q(x) > О при х / 0. Веще- ственная симметрическая билинейная функция называется положи- тельно определенной, если соответствующая ей квадратичная функ- ция положительно определенна. Так, скалярное умножение геометрических векторов является положительно определенной симметрической билинейной функ- цией. Очевидно, что нормальный вид положительно определенной ква- дратичной функции есть х* + ... + х?, т.е. в некотором базисе ее матрица единичная и, в частности, имеет определитель 1. Из форму- лы (10) следует, что при переходе к другому базису определитель ее матрицы умножается на квадрат определителя матрицы перехода и, значит, остается положительным. Таким образом, определитель мат- рицы положительно определенной квадратичной функции в любом базисе положителен. Теорема 3. Число к в нормальном виде (19) произвольной веще- ственной квадратичной функции q есть максимальная размерность подпространства, на котором функция q положительно опреде- ленна. Доказательство. Очевидно, что функция q положительно опре- деленна на k-мерном подпространстве (еь ..., ек). Пусть теперь U — произвольное подпространство, на котором функция q положитель- но определенна, и W = (ek+1, ...,еп). Так как q(x) 0 при хе W, то U П W = 0. Отсюда следует, что dim U к. □ Аналогично определяются отрицательно определенные квадра- тичные и симметрические билинейные функции. Так же, как и вы- ше, доказывается, что число I в нормальном виде квадратичной функции q есть максимальная размерность подпространства, на ко- тором функция q отрицательно определенна. Впрочем, это и пря-
218 Глава 5. Векторные пространства мо следует из теоремы 3, если ее применить к квадратичной функ- ции -q. Следствие (закон инерции). Числа к и I в нормальном виде (19) вещественной квадратичной функции q не зависят от выбора бази- са, в котором эта функция имеет нормальный вид. Эти числа называются соответственно положительным и отри- цательным индексами инерции квадратичной функции q (а также соответствующей симметрической билинейной функции а). Пара (к, /) называется сигнатурой функции q (или функции а). Пример 5. Квадратичная функция q(x) = XjX2 путем (невырож- денного) преобразования координат x^xj+x', x2=xj-x' приводится к виду q(x) = х'2 - х'22. Поэтому ее сигнатура равна (1,1). Задача 2. Найти сигнатуру симметрической билинейной функ- ции из примера 3 (в случае К = Ю. Теорема 2 позволяет (при указанных в ней ограничениях) опре- делить индексы инерции вещественной квадратичной функции по угловым минорам 5Ь 5П ее матрицы в каком-либо базисе. Теорема 4 (метод Якоби). Если все угловые миноры 5к матрицы вещественной квадратичной функции q отличны от нуля, то от- рицательный индекс инерции функции q равен числу перемен знака в последовательности l^S,,...^. (20) (Определение числа перемен знаков в последовательности веще- ственных чисел см. в § 3.4.) Доказательство непосредственно следует из теоремы 2. □ Заметим, что в условиях теоремы функция q невырожденна, так что сумма ее индексов инерции равна п. Следствие (критерий Сильвестра). Вещественная квадратич- ная функция является положительно определенной тогда и только тогда, когда все угловые миноры ее матрицы положительны. Доказательство. Если все угловые миноры положительны, то, в частности, они отличны от нуля, и применение метода Якоби до- казывает, что функция является положительно определенной. Об- ратно, если функция положительно определенна, то ее ограничение
§ 4. Билинейные и квадратичные функции 219 на любое подпространство Vk (в обозначениях теоремы 2) также по- ложительно определенно и, согласно замечанию перед теоремой 3, определитель 5к его матрицы положителен. □ Замечание 1. Модифицируя процесс ортогонализации, можно показать (попробуйте это сделать), что метод Якоби годится и в том случае, когда некоторые из угловых миноров равны нулю, лишь бы в последовательности 6^62,...,5п не было двух нулей подряд (в частности, может быть 5П = 0, но тогда должно быть 5n-i / 0). При этом если 5к = 0 при каком-то к < п, то автоматически <0. Как мы видели, в случаях К = С или R никакие изменения диаго- нального вида матрицы квадратичной функции, кроме тех, которые достигаются уже путем перестановки базисных векторов и их умно- жения на числа, невозможны, но так обстоит дело не всегда. Пусть К = — поле вычетов по простому модулю р / 2. Известно (см. теорему 9.1.7), что %* — циклическая группа. Следовательно, (Z*)2 = = {а2: aeZ*} — подгруппа индекса 2. Ее элементы называются квадратич- ными вычетами, а элементы второго смежного класса — квадратичными невычетами. Пусть е G Z* — фиксированный квадратичный невычет. Теорема 5. Всякая невырожденная квадратичная функция над полем Zp (р # 2) может быть приведена к одному из двух видов x^...+х^+х2, Х12 + ...+Хп2_1+£Хп2 в зависимости от того, является определитель ее матрицы квадратич- ным вычетом или невычетом. Лемма 1. Всякая невырожденная квадратичная функция q в векторном пространстве размерности п 2 над полем Zp представляет единицу, т. е. уравнение q(x) = 1 имеет решение. Доказательство. Достаточно рассмотреть случай п = 2. Можно считать, что qM=a1xf + а2х2, где аь а2 /0. Уравнение q(x) = 1 может быть представлено в виде 01^=1-02^2- Когда Xi пробегает поле Zp, левая часть последнего уравнения принимает различных значений. Аналогично, когда х2 пробегает поле Zp, правая
220 Глава 5. Векторные пространства Р 4" 1 w гр часть этого уравнения принимает различных значении. Так как то существуют такие и х2, при которых левая и правая части принимают одно и то же значение. □ Доказательство теоремы 5. Следуя доказательству теоремы 1, при п > 1 будем выбирать вектор е1 так, чтобы qCeJ = 1, что возможно в силу предыдущей леммы. Так как при переходе к другому базису определитель матрицы квадратичной функции умножается на квадрат определителя матрицы перехода, то q(en) будет квадратичным вычетом или невычетом одновременно с определителем матрицы функции q в любом базисе. □ Задача 3. Доказать, что произвольная (не обязательно невырожден- ная) квадратичная функция q над Zp может быть приведена ровно к одному из двух видов Xl + ...+Xr-j+Х*, Xj + .^+x^j+ex^, где r = rkq. Рассмотрим теперь кососимметрические билинейные функции. Здесь нас ожидает приятный сюрприз: строение этих функций ока- зывается не зависящим от поля К. Пусть а — кососимметрическая билинейная функция в п-мер- ном векторном пространстве V. Базис {еь ...,еп} пространства V называется симплектическим (относительно а), если a(e2k-l> e2k) = —а(е2к> e2k-l) = 1 При k = 1, a(eh €j) = 0 во всех остальных случаях. Иначе говоря, матрица функции а в этом базисе имеет вид
§ 5. Евклидово пространство 221 где число диагональных клеток равно т. Очевидно, что при этом rka = 2m. Теорема 6. Для любой кососимметрической билинейной функ- ции существует симплектический базис. Доказательство. Докажем это утверждение индукцией по п. При п = 1 доказывать нечего. Пусть п > 1. Если а = 0, то доказывать опять-таки нечего. Если а^О, то существуют такие векторы е2 и е2, что а(е1э е2) # 0. Домножив один из этих векторов на подходящее число, можно добиться того, чтобы а(е1,е2) = -а(е2,е1) = 1. Матрица ограничения функции а на (еъе2) в базисе {еъе2} име- ( 0 П ет вид I- j 0 1 и, в частности, невырожденна. Согласно предложе- нию 2, V = (e1)e2)®(ei,e2)±. По предположению индукции в пространстве (е1,е2)1 существует симплектический базис {е3, е4,..., еп}. Добавляя к нему векторы е} и е2, мы получаем симплектический базис {еь е2, е3, е4,..., еп} пространства V. □ Следствие. Ранг кососимметрической билинейной функции все- гда является четным числом. § 5. Евклидово пространство Свойства операций над геометрическими векторами, включая скалярное умножение, находят наиболее полное отражение в поня- тии евклидова векторного пространства. Определение 1. Евклидовым (векторным) пространством на- зывается вещественное векторное пространство с фиксированной положительно определенной симметрической билинейной функ- цией. Обычно эта фиксированная билинейная функция называется скалярным умножением и обозначается (,). Пример 1. Пространство геометрических векторов с обычным скалярным умножением. Пример 2. Пространство со скалярным умножением (х,у) = х1у1 + ... + х„уп, гдех = (х1; ...,хп),у = (уъ...,у„).
222 Глава 5. Векторные пространства Пример 3. Пространство С2 [0,1] непрерывных функций на от- резке [0,1] со скалярным умножением Г1 (f,g) = fMgWdx. (21) Jo В евклидовом пространстве определяются длина вектора и угол между векторами таким образом, что в случае геометрических век- торов они совпадают с обычной длиной и обычным углом. А имен- но, длина |х | вектора х определяется по формуле |х| = У(х,х). Для определения угла необходимо сначала доказать Предложение 1. Для любых векторов х, у евклидова простран- ства |(х,у)|$|х||у|, (22) причем равенство имеет место тогда и только тогда, когда векто- ры х и у пропорциональны. Неравенство (22) называется неравенством Коши—Буняковс- кого. Доказательство. Если у = Лх, то |(х,у)| = |Л||(х,х)| = |Л||х|2 = |х||у|. Если векторы х и у не пропорциональны, то они составляют базис двумерного подпространства. Матрица скалярного умножения на этом подпространстве в базисе {х, у} имеет вид f(x,x) (х,уП 1(х,у) (y,y)J‘ Ввиду положительной определенности скалярного умножения ее определитель должен быть положителен; но это и означает, что |(х,у)|<|х||у|. □ Пример 4. Для евклидова пространства С2[0,1] из примера 3 неравенство Коши—Буняковского означает, что /(x)g(x)dx^ < (J (/(x))2dx^ (J (g(x))2dx^ (23)
§ 5. Евклидово пространство 223 для любых непропорциональных непрерывных функций f и g на отрезке [0,1]. В частности, при g = 1 мы получаем, что G1 \2 Г1 /(x)dx < (f(x))2dx (24) о J Jo для любой непостоянной непрерывной функции f. Угол лу между ненулевыми векторами х и у евклидова простран- ства определяется по формуле — (х, у) COS ху= . J И1у| В частности, угол ху равен 0 или л тогда и только тогда, когда век- торы х и у пропорциональны; ху = л/2 тогда и только тогда, когда векторы х и у ортогональны. Неравенство Коши—Буняковского является частным случаем бо- лее общего неравенства, относящегося к произвольной конечной системе векторов {аь ..., ак} евклидова пространства. Определение 2. Матрица называется матрицей Грама системы векторов {а1?..., ак}. Теорема 1. Для любых векторов а}, ..., ак евклидова пространст- ва справедливо неравенство detG(ab ..., ak) ^0, причем равенство имеет место тогда и только тогда, когда векто- ры а1}ак линейно зависимы. Доказательство. Если 2 = 0, то Л, (а,, а;)=0 при всех j, а i i это означает, что линейная комбинация строк матрицы G(a1?..., ак) с коэффициентами Лг,...,Хк равна нулю. Поэтому если векторы аь ...,ак линейно зависимы, то det G(alt..., ак) = 0. Если же они линейно независимы, то так же, как в случае к = 2, доказывается, что detG(a1? ...,afc) >0. □ Задача 1. Получить соотношение между двугранными углами тетраэдра, рассмотрев матрицу Грама системы единичных векторов,
224 Глава 5. Векторные пространства ортогональных его граням. С помощью этого соотношения найти двугранный угол правильного тетраэдра. Определение 3. Базис евклидова пространства, в котором ска- лярное умножение имеет нормальный вид (см. §4), называется ор- тонормированным. Ортонормированность базиса {е1? ...,еп} означает, что матрица скалярного умножения в этом базисе (т. е. матрица G(eb еп)) является единичной матрицей или, иными словами, что базисные векторы попарно ортогональны и имеют длину 1. Согласно общей теории, в любом конечномерном евклидовом пространстве существует ортонормированный базис. Такой базис, конечно, не единствен. Дадим описание всех ортонормированных базисов, исходя из какого-либо одного ортонормированного базиса {в},..., еп}. Пусть (вр ..., еп) (вр ..., еп)С. Тогда матрица скалярного умножения в базисе {е',..., е'п} имеет вид СТЕС = СТС. (см. формулу (10)). Следовательно, базис {е'р ...,е'} является орто- нормированным тогда и только тогда, когда СТС = Е, (25) т. е. когда матрица Ст обратна матрице С. Определение 4. Матрица С, для которой С-1 = Ст, называется ортогональной. Равенство (25) означает следующие соотношения между элемен- тами матрицы С: Sch% = 50 при всех i.j. к Условие ортогональности также может быть записано в виде ССТ = Е, (26) что означает следующие соотношения между матричными элемен- тами: Цс1ксА = 5у при всех i,j. к Заметим, что из равенства (25) следует соотношение det С = ±1 (но не наоборот!).
§ 5. Евклидово пространство 225 Ограничение скалярного умножения на любое подпростран- ство U евклидова пространства V также является положительно определенной и потому невырожденной симметрической билиней- ной функцией, и предложение 4.2 показывает, что у=и®и1. Это означает, что для каждого вектора х G V имеется единственное представление в виде x = y + z, уе[/, zgLT1. (27) Вектор у называется (ортогональной) проекцией вектора х на подпространство U и обозначается через рг^ х; вектор z называется ортогональной составляющей вектора х относительно подпростран- ства U и обозначается через ortu х. Если {вх,...,е^}— ортонормированный базис подпространст- ва U, то проекция рга х может быть найдена по формуле k Pryx=S(x)ei)ei. (28) 1=1 Более общо, если {e1? ...,efc}— ортогональный (но не обязательно ортонормированный) базис подпространства U, то (29) Для построения ортогонального базиса евклидова пространст- ва V может быть применен процесс ортогонализации, описанный в доказательстве теоремы 4.2. В предыдущих обозначениях, если {е1? ...,еп}— какой-либо базис пространства V, то базис {j\, ...,/п}, получаемый в результате ортогонализации, задается формулами fk = ortyki ek (k = 1,...»п). (30) Пользуясь тем, что {f19..., fk-i} — ортогональный базис пространст- ва Vk_lt проекцию prVfc ек и, тем самым, вектор fk можно найти по формуле (29). Пример 5. Пусть V — пространство многочленов степени 3 со скалярным умножением (21). Применим процесс ортогонализации к базису вх = 1, е2 = х, е3 = х2, е4 = х3.
Глава 5. Векторные пространства 226 Заметим, что (е.«, е.) = т—4—Имеем A=ei = i, = /2 = е2-ЦиНЛ=Х4’ (/2,/2) = (/2,е2) = ^. =вз ~ (Х/г)^2 ~ =*2 _Х+ 6’ ™ = ^3’ «з) = 180> f-Р (е4>/з), (е4,/2) (e4,/i)f_ 3 3 2,3 1 Л 4 (/з>/зГ3 (Л./гГ2 (/1./1)71 2* + 5* 20’ (/4» /4) = (А> е4) = 2800’ Задача 2. Применяя процесс ортогонализации к столбцам мат- рицы, доказать, что каждая матрица AeGLn(lR) может быть един- ственным образом представлена в виде А = ОВ, где О — ортогональ- ная матрица, а В — треугольная матрица с положительными элемен- тами на диагонали. Определим расстояние р между векторами евклидова простран- ства по формуле р(х,у) = |х-у|. Это расстояние удовлетворяет аксиомам метрического пространст- ва, в частности аксиоме треугольника p(x,z)^p(x,y) + p(y,z). (31) Неравенство (31) следует из неравенства |х + у| |х| + lyl, (32) которое, в свою очередь, легко выводится из неравенства Коши— Буняковского (проделайте это!) Расстояние между подмножествами X и Y метрического прост- ранства определяется по формуле р(Х,У)= inf р(х,у). Теорема 2. Расстояние от вектора х евклидова пространства V до подпространства U с V равно |orta х|, причем единственным бли- жайшим к х вектором подпространства U является рга х.
§ 5. Евклидово пространство 227 Доказательство. См. рис. 7, где у = pry х, z = ortu х. любого у' е U, у' / у, имеем: р(х, у'} = |z'| = ^/|z|2 + |u|2 > \z\=p(x, у). □ Пример 6. В силу вычислений, проделанных в предыдущем при- мере, квадратным трехчленом, ближайшим к х3 в смысле метрики пространства С2[0,1], является |х2 - |х + причем расстояние от х3 до этого трехчлена равно ^~=. Следующая теорема дает явную формулу для расстояния от век- тора х до подпространства U, заданного произвольным базисом Теорема 3. (рСх, И)! = detg(e[.. Доказательство. Если х е U, то р (х, 17) = 0 и det G (е,,..., ек, х) = = 0, так что доказываемая формула верна. Пусть х$ U и z = orty х- Применяя теорему 4.2 к базису {е^,... .... ек, х} пространства UФ (х), получаем Izl2 = fz z) - ^±1 = detG(ei>-»ebX) 11 1 ’ } 5k 4е1С(е1,...,е0 ’ что и требовалось доказать. □ Полученная формула может быть применена к вычислению объ- ема параллелепипеда в евклидовом пространстве. Параллелепипедом, натянутым на векторы аь евклидова пространства, называется множество P(ai. ...,a„) = {Sxiai: O^Xi^l}. Основанием этого п-мерного параллелепипеда называют (и — 1)- мерный параллелепипед Р(аъ ..., an-i), а его высотой — длину век- тора ort(fl]>_>a j an. При п = 2, 3 это согласуется с терминологией
228 Глава 5. Векторные пространства элементарной геометрии. Руководствуясь известными формулами для площади параллелограмма и объема трехмерного параллелепи- педа, примем следующее индуктивное Определение 5. Объемом п-мерного (п>1) параллелепипеда на- зывается произведение объема его основания на высоту. Объемом одномерного параллелепипеда Р(а) называется длина вектора а. Объем параллелепипеда Р обозначается через volP. Теорема 4. (volP(aj, ...,an))2 = detG(a1, ...,an). Доказательство. Докажем эту формулу индукцией по п. При п = 1 она верна по определению. При п > 1 имеем, согласно опре- делению, volPCax, ...,an)=volP(a1, -h, где h — длина вектора ort(aj>_>a j an, т. е. расстояние от вектора ап до подпространства {alf ...,0,^). Используя предположение индук- ции и теорему 3, получаем = det G(alf..., an). □ В частности, мы видим, что, хотя основание параллелепипеда и зависит от того, какой из заданных векторов мы считаем «послед- ним», объем параллелепипеда в смысле данного выше определения зависит лишь от самого параллелепипеда. Наряду с формулами для площади параллелограмма и объема трехмерного параллелепипеда все это служит неплохим обоснованием приведенного определения, однако по-настоящему убедительное обоснование может быть полу- чено лишь в рамках теории меры, объясняющей, что вообще следу- ет называть объемом множества. Пусть векторы а19 ...,ап выражаются через векторы какого-ни- будь ортонормированного базиса {еь при помощи матри- цы А: (аь ...,ап) = (е1, ...,еп)А. Теорема 5. уо1Р(а1; ...,an) = |detA|. Доказательство следует из того, что G(a1,...,an) = ATEA = ATA и, значит, detGfai, ...,an) = (det А)2. □
§ 5. Евклидово пространство 229 Доказанное равенство можно понимать как «геометрический смысл» числа |det А|. Что касается знака числа det А, то он может быть истолкован как ориентация системы векторов {аь ап} (по отношению к базису {е1эеп}). Напомним, что при введении определителей порядка п в § 2.4 мы как раз руководствовались тем, что определители порядков 2 и 3 задают ориентированную площадь параллелограмма и ориентированный объем параллелепипеда соот- ветственно. В §2.2 было показано, что строение векторного пространства (над данным полем) зависит лишь от его размерности. Верно ли то же самое для евклидовых векторных пространств? Для того чтобы ответить на этот вопрос, надо прежде всего понять, какие евкли- довы пространства следует считать «одинаково устроенными» или, точнее, изоморфными. Естественно принять следующее Определение 6. Евклидовы векторные пространства V и U на- зываются изоморфными, если существует биективное отображение f: V —> U, являющееся изоморфизмом векторных пространств и удо- влетворяющее условию (/(a),/(b)) = (a,b) Va,bGV. Само отображение f называется при этом изоморфизмом прост- ранств V и U. Ясно, что изоморфными могут быть только евклидовы простран- ства одинаковой размерности. Оказывается, верно и обратное. Теорема 6. Любые два евклидовых векторных пространства оди- наковой (конечной) размерности изоморфны. Доказательство. Пусть V и U — какие-то n-мерные евклидовы пространства. Выберем в них ортонормированные базисы {^,..., уп} и {иь ..., ип} соответственно, и пусть f: V —► U — изоморфизм век- торных пространств, переводящий ц в u, (i = 1,..., п). Тогда (/(ц), /(^)) = (и,-, uj) = = (ц, у;), откуда по линейности вытекает, что (/(а),/(Ь)) = (а,Ь) для любых a, b GV. □ В частности, любое двумерное (соответственно трехмерное) ев- клидово пространство устроено совершенно так же, как Е2 (соот- ветственно Е3). Пользуясь этим, в тех случаях, когда рассматрива-
230 Глава 5. Векторные пространства емые векторы лежат в двумерном или трехмерном подпростран- стве, для доказательства каких-либо утверждений о них можно при- влекать теоремы элементарной геометрии. Например, таким спосо- бом можно доказать неравенство Коши—Буняковского (22), нера- венство треугольника (31) и теорему 2. § 6. Эрмитовы пространства При желании ввести метрику в комплексном векторном прост- ранстве подобно тому, как это делается в вещественном простран- стве, мы наталкиваемся на ту трудность, что в комплексном прост- ранстве не существует положительно определенных квадратичных функций. Эту трудность можно обойти, введя в рассмотрение так на- зываемые полуторалинейные функции (не очень удачный термин, но лучшего не придумано). Определение 1. Пусть V — комплексное векторное простран- ство. Функция а: V х V —>С называется полуторалинейной, если она линейна по второму аргументу и антилинейна по первому. Последнее означает, что а(х! + х2, у) = а(хь у) + а(х2, у), а(Ах,у) = Аа(х,у). Замечание 1. Иногда требуют, чтобы полуторалинейная функ- ция была, наоборот, линейна по первому аргументу и антилинейна по второму. Теория полуторалинейных функций аналогична теории били- нейных функций. Поэтому мы изложим ее кратко, останавливаясь более подробно лишь в тех местах, где имеется существенное раз- личие. Пусть {en ...,еп}— базис пространства V. Полуторалинейная функция а определяется числами = a(ef, е;). А именно, а(х, У)=S aijXtyj (33) ij Матрица А = (ац) называется матрицей функции а в базисе {еь ... ..., еп}. При переходе к другому базису (ер ..., еп) = (е^,..., еп)С
§ 6. Эрмитовы пространства 231 она преобразуется по правилу А' = С*АС, (34) где С* = Ст. (Черта обозначает комплексное сопряжение, применен- ное ко всем элементам матрицы С.) Функция а называется невырож- денной, если Кег а = {у G V: а(х, у) = 0 Vx G V} = 0. Это равносильно невырожденности матрицы А. Полуторалинейная функция а называется эрмитовой (соответ- ственно косоэрмитовой), если а(у,х) = а(х,у) (соответственно «(У, *) = -а(х, у)). При умножении эрмитовой функции на i полу- чается косоэрмитова функция, и наоборот. Функция а является эрмитовой (соответственно косоэрмито- вой) тогда и только тогда, когда ее матрица А удовлетворяет усло- вию А* = А (соответственно А* = - А). Такие матрицы называются эрмитовыми (соответственно косоэрмитовыми). Заметим, что диа- гональные элементы эрмитовой матрицы вещественны, а косоэрми- товой — чисто мнимы. Каждой эрмитовой полуторалинейной функции а соответствует эрмитова квадратичная функция q(x) = a(x, х). Легко видеть, что все ее значения вещественны. Соотношения q (х + у) = q (х) + q (у) + а (х, у) + а (у, х), q(x + iy) = q (х) + q (у) + ia(x, у) - i а (у, х) позволяют восстановить а по q. В частности, если q = 0, то и а = 0. Пусть а — эрмитова полуторалинейная функция. Так же, как в случае симметрических билинейных функций, определяется орто- гональность векторов и ортогональное дополнение к подпростран- ству относительно а. Имеет место аналог предложения 4.2. С его помощью доказывается, что всякая эрмитова полуторалинейная функция и одновременно соответствующая ей квадратичная функ- ция приводятся к нормальному виду а(х, у) = х^ +... + xkyk - xMyk+1 -... - xk+lyk+l, q(x) = |xj2 +... + |xk|2 - |xk+112 - ... - |xfc+z|2.
232 Глава 5. Векторные пространства Эрмитова квадратичная функция q (и соответствующая ей эрми- това полуторалинейная функция) называется положительно опреде- ленной, если q М > 0 при х # 0. Это имеет место тогда и только тогда, когда в нормальном виде (35) к = и, I = 0. В общем случае имеет место закон инерции, утверждающий, что числа к и I определены однозначно. Они называются положитель- ным и отрицательным индексами инерции функции q. Так как для всякой комплексной матрицы det А* = det А, то определитель эрмитовой матрицы всегда веществен. Если все угловые миноры матрицы эрмитовой полуторалинейной функции отличны от нуля, то можно так же, как в случае билинейной функ- ции, провести ортогонализацию базисных векторов и получить от- сюда метод Якоби для определения индексов инерции по знакам уг- ловых миноров. В частности, имеет место аналог критерия Сильве- стра: эрмитова квадратичная функция положительно определенна тогда и только тогда, когда все угловые миноры ее матрицы поло- жительны. Комплексным аналогом евклидовых пространств являются эр- митовы пространства. Эрмитовым пространством называется ком- плексное векторное пространство, в котором фиксирована некото- рая положительно определенная эрмитова полуторалинейная функ- ция, называемая скалярным умножением и обозначаемая (,). Пример 1. Пространство Сп со скалярным умножением (Х,у)=Х1У1 + ...+Хпуп. Пример 2. Пространство непрерывных комплекснозначных фун- кций на отрезке [0,1] со скалярным умножением Г1 (/,g) = fWgWdx. Jo В эрмитовом пространстве определяется длина вектора по фор- муле И = у/(х, х). В нем выполняются неравенство Коши—Буняковского |(х, у)| $ |х||у|
§ 6. Эрмитовы пространства 233 и неравенство треугольника |х + у|^|х| + |у| (докажите их). Базис {еь ..., еп} эрмитова пространства называется ортонорми- рованным, если в этом базисе скалярное умножение имеет нормаль- ный вид, т. е. если (ei> £j) — 5ij. Матрица перехода от одного ортонормированного базиса к другому удовлетворяет условию С* = С-1. Такие комплексные матрицы назы- ваются унитарными. Задача 1. Записать условие унитарности матрицы через матрич- ные элементы двумя способами. Заметим, что определитель унитарной матрицы С по модулю равен 1. В самом деле, беря определитель от обеих частей равенства С*С = Е, получаем det С • det С = 1, а это и означает, что | det С| = 1. Так же, как и в случае евклидова пространства, для любого под- пространства U эрмитова пространства V получаем разложение v=u®u1. Если {е1? ...,ек}— ортогональный базис подпространства U, то ор- тогональная проекция вектора х G V на U может быть найдена по формуле к 1=1 (е,-> х) (Обратите внимание на отличие этой формулы от формулы (29).) В эрмитовом пространстве также справедливы аналоги тео- рем 5.2 и 5.3. С математической точки зрения эрмитовы пространства полез- ны по той же причине, что и комплексные числа. Это станет ясным в следующей главе. С физической точки зрения эрмитовы прост- ранства необходимы для построения адекватной квантово-механи- ческой картины мира.
Глава 6 Линейные операторы Теория линейных операторов — это ядро линейной алгебры и главный источник ее многочисленных приложений. Как и били- нейная функция, линейный оператор в конечномерном векторном пространстве задается квадратной матрицей, так что в каком-то смысле это объекты одинаковой сложности (но, конечно, симмет- рическая или кососимметрическая билинейная функция проще, чем произвольный линейный оператор). Мы сохраняем соглашения, принятые во введении к предыдущей главе. § 1. Матрица линейного оператора Определение 1. Линейным оператором (или линейным преобра- зованием) в векторном пространстве V называется линейное отоб- ражение пространства V в себя. Более подробно, линейный оператор — это отображение зУ: V —► -♦ V, удовлетворяющее условиям: 1) зУ(х + у) = зУх + а/у для любых х, yGV; 2) а/(Ах) = АзУх для любых х G V, A G К. (Мы обычно будем обозначать линейные операторы рукописны- ми буквами.) Если в пространстве V выбран базис {е1? ...,еп}, то линейный оператор может быть задан матрицей. Определение 2. Матрицей линейного оператора л/ в базисе {е1?..., еп} называется матрица А = (а^), определяемая из равенств ^ej=Sayei- U) i Иначе говоря, в j-м столбце матрицы А стоят координаты векто- ра в базисе {е1?..., еп}. (Обратите внимание, что, в отличие от определения матрицы линейного отображения, в этом определении фигурирует только один базис!)
§ 1. Матрица линейного оператора 235 Равенства (1) можно переписать в следующей матричной форме: (а/еъ j/en) = (ei, ...,en)A (2) (Ср. определение матрицы перехода в § 2.2, формула (8).) Очевидно, что для любых векторов/1, ...,/пеУ существует един- ственный линейный оператор а/, переводящий базисные векторы еъ..., еп в /j,..., fn соответственно. Это оператор, переводящий каж- дый вектор х = 2 xieiв вектор 2 xifi- Следовательно, линейный опе- ратор однозначно определяется своей матрицей, и любая квадрат- ная матрица порядка п является матрицей некоторого линейного оператора (в данном базисе). Найдем явное выражение координат образа у = six вектора х. При х = 2 х;е? имеем j У = S Xjsltj = £ ацх^ = £ У.е,-, J ij * где y.=L<W (3) J Если обозначить через X и Y столбцы координат векторов х и у соответственно, то равенства (3) можно переписать в следующей матричной форме: Г = АХ. (4) (Ср. формулу (9) преобразования координат в § 2.2.) Замечание. Как видно из этих формул, линейные преобразова- ния пространства Кп, определенные в примере 4.1.3, — это то же, что линейные преобразования в смысле определения 1. При этом матрица, определяющая линейное преобразование пространства Кп в смысле примера 4.1.3, — это его матрица в базисе из единичных строк в смысле определения 2. Выясним, как преобразуется матрица линейного оператора при переходе к другому базису (е'1,...,е'п) = (е1,...,ел)С. В силу линейности оператора j/ имеем (sle'v ...,^e'n) = (sle1,..., ^en)C=(e1, ...,en)AC=(e'p.... е^СГ'АС.
236 Глава 6. Линейные операторы Таким образом, если обозначить через А' матрицу оператора зУ в базисе {ер ..., е'п}, то А'= С~1АС. (5) Перейдя к другому базису, матрицу линейного оператора часто можно привести к более простому виду. В частности, такая возмож- ность открывается, если известно какое-либо инвариантное подпро- странство. Определение 3. Подпространство U с V называется инвариант- ным относительно оператора j?/, если аУНси (т. е. jtfu G U для любого и G U), Ограничение линейного оператора зУ на инвариантное под- пространство U является линейным оператором в U. Если базис {ех,..., еп} пространства V выбран таким образом, что U = (в!,..., ек) (а это всегда можно сделать), то матрица опера- тора аУ в этом базисе имеет вид ?)> гдеВ— матрица оператора ^\и вбазисе {еь ..., ек}, С — квадратная матрица порядка и - к и D — какая-то матрица размера к х (и - к). Обратно, если матрица оператора аУ в базисе {е19...,еп} имеет вид (6), где В — квадратная матрица порядка к, то U = (еь ..., ек) — инвариантное подпространство. Еще лучше обстоит дело, когда пространство V удается разло- жить в прямую сумму двух инвариантных подпространств U nW: V = U®W. Если {е1? ...,ек}— базис подпространства U, а {ек+1, ...,еп}— базис подпространства W, то {е1? ...,еп} — базис пространства V и в этом базисе матрица оператора зУ имеет вид А = (о ?)• <7’ где В — матрица оператора зУ|и в базисе {еь ..., ек}> а С — матрица оператора в базисе {ек+1,..., еп}. Более общо, если пространство V разложено в прямую сумму к инвариантных подпространств Ц, У2, •••, то в базисе пространст-
§ 1. Матрица линейного оператора 237 ва V, составленном из базисов этих подпространств, матрица опера- тора аУ имеет вид fAl а2 0 А = . , (8) где Ai — матрица оператора зУ |Vj. Пример 1. Поворот на угол а является линейным оператором в Е2 (см. пример 5.2.1). В примере 5.2.4 мы доказали, что его мат- рица в ортонормированном базисе {elt е2} есть матрица Л fcosa -sinaA n(a)=Gina cosaj' (9) В частности, поворот на имеет в та- ком базисе матрицу -;)• Найдем его матрицу А' в базисе е'=2е2, е'2 = ег-е2. (10) Как видно из рис. 1, = —Ci — 2е2, ^е2 = е1~»~ е2* Это означает, что Матрица Д' может быть, конечно, найдена и по формуле (5). Из формулы (10) получаем Следовательно, о -1W0 Г|_ 1у-2 П-f-l П 1 0Д2 оД 0 1J V-2 1J' Пример 2. Аналогично, поворот вокруг какой-либо оси на угол а является линейным оператором в Е3. В ортонормированном базисе {ei,e2, е3}, при условии, что вектор е3 направлен по оси поворота,
238 Глава 6. Линейные операторы матрица этого оператора имеет вид /cos a -sin а 04 А = sin a cos а 0 = I n I. к 0 0 17 7 Этот вид согласуется с разложением пространства Е3 в прямую сум- му двух инвариантных подпространств: Е3 = (е1)е2)Ф(е3). (11) Пример 3. В примере 5.2.2 мы рассматривали ортогональное проектирование на плоскость как линейное отображение прост- ранства Е3 в пространство векторов этой плоскости. Однако его можно рассматривать и как линейный оператор в пространстве Е3. В ортонормированном базисе, первые два вектора которого лежат в плоскости проектирования, его матрица имеет вид Z1 0 0\ А= 0 1 0 . ко о о7 Разложение (11) и в этом случае является разложением в прямую сумму инвариантных подпространств. Пример 4. Дифференцирование — линейный оператор в прост- ранстве многочленов. Это пространство бесконечномерно, но оно является объединением конечномерных инвариантных подпрост- ранств, состоящих из многочленов не выше заданной степени. В ба- зисе {1, х, х2,..., хп} пространства многочленов степени не выше п оператор дифференцирования имеет матрицу (0 1 0 .. .. 0 ок 0 0 2 ., ,. 0 0 А — 0 0 0 .. .. 0 0 0 0 0 ., .. 0 п <0 0 0 . .. 0 о) В базисе {1, матрицу Х^ 1 — J этот же оператор имеет более простую /0 1 0 ... 0 (Л 0 0 1 ... 0 0 0 0 0 ... 0 0 (12) 0 0 0 ... 0 1 ко о о ... о о7
§ 1. Матрица линейного оператора 239 Пример 5. Пусть — какое-либо биективное преобразование множества X. Тогда отображение определяемое формулой W)(x) = /(</> Л*)), (13) является линейным оператором в пространстве F(X, К) функций на X со значениями в К. (Можно было бы действовать на аргумент функции самим преобразованием </>, а не его обратным, но послед- нее удобнее по причине, которая будет объяснена в гл. 10.) Напри- мер, пусть X = R, K = R, + a (aGR). Тогда (^/)(х)=/(х-а). (График функции у?*/ получается из графика функции f сдвигом вправо на а.) Так как cos(x - а) = cos а • cos х 4- sin а • sin х, sin(x - а) = -sin а • cos х + cos а • sin х, то подпространство (cos х, sin х) инвариантно относительно при- чем матрица ограничения преобразования на это подпростран- ство в базисе {cos х, sin х} имеет вид fcosa -sinaA Л Una cosaj:=ri(a)- Пример 6. В любой алгебре преобразование La:x—>ax (aGA), называемое левым умножением на элемент а, является линейным оператором. Рассмотрим, например, поле С как алгебру над R. Ра- венства (а 4- bi) • 1 = a 4- bi, (а 4- bi) • i = -b 4- ai показывают, что матрица оператора La+bi в базисе {1, i} есть fa -ЬЛ \Ь ay Задача 1. Найти матрицу левого умножения на А = Q в ал- гебре L/K) в базисе, составленном из матричных единиц. Доказать инвариантность подпространств (ЕП,Е21) и (^12» ^22)-
240 Глава 6. Линейные операторы Линейные операторы в одном векторном пространстве можно складывать, умножать друг на друга и умножать на числа. Эти опе- рации определяются так же, как для общих линейных отображений (см. §5.2). Им соответствуют такие же операции над матрицами, т. е., например, матрица произведения двух линейных операторов в каком-либо базисе равна произведению их матриц в том же ба- зисе. Из свойств операций над линейными отображениями, доказан- ных в § 5.2, следует что совокупность всех линейных операторов в векторном пространстве V является ассоциативной алгеброй. Мы будем обозначать эту алгебру через L(V). Отметим, что если dim V = = и, то dim L(V) = dim Ln (К) = n2. Алгебра L(V) обладает единицей. Ею является тождественный оператор, который мы будем обозначать буквой &. Матрица опера- тора <£ в любом базисе есть единичная матрица Е. Линейный оператор а/ G L(V) обратим тогда и только тогда, ко- гда Кег аУ = 0 и Im аУ = V. Из теоремы 5.2.2 следует, что в конечно- мерном случае, если Кег аУ = 0, то автоматически Im аУ = V, и обрат- но. С другой стороны, ясно, что линейный оператор обратим тогда и только тогда, когда его матрица обратима, т. е. невырожденна. Невырожденные линейные операторы в пространстве V обра- зуют группу, обозначаемую GL(V) и называемую полной линейной группой пространства V. В общем случае размерность подпространства Im аУ называется рангом линейного оператора аУ и обозначается через rk аУ. В силу теоремы 5.2.1 она равна рангу матрицы оператора аУ (в любом ба- зисе). Из формулы (5) следует, что определитель матрицы оператора аУ не зависит от выбора базиса. Он называется определителем линей- ного оператора si и обозначается через det аУ. § 2. Собственные векторы Основная задача теории линейных операторов состоит в приве- дении матрицы линейного оператора к возможно более простому виду за счет выбора подходящего базиса. Как мы уже отмечали, для этого полезно знать инвариантные подпространства. Особую роль играют одномерные инвариантные
§ 2. Собственные векторы 241 подпространства. Их рассмотрение приводит к понятию собствен- ного вектора. Определение 1. Ненулевой вектор е е V называется собствен- ным вектором оператора аУ, если аУе = Ле. Число Ле К называется при этом собственным значением оператора jtf, отвечающим соб- ственному вектору е. Очевидно, что ненулевой вектор е является собственным тогда и только тогда, когда одномерное подпространство (е) инвариантно. В базисе, составленном из собственных векторов (если таковой су- ществует), матрица оператора диагональна, что является пределом мечтаний. Пример 1. Для оператора дифференцирования в пространстве многочленов единственным с точностью до пропорциональности собственным вектором является многочлен 1 (причем соответству- ющее собственное значение равно 0). Таким образом, в этом случае из собственных векторов нельзя составить базиса. Пример 2. Собственные векторы поворота на угол а / ктг в трех- мерном пространстве — это векторы, лежащие на оси поворота, причем соответствующее им собственное значение равно 1. При а = ктг собственными (с собственным значением (—1)к) являются также векторы, ортогональные оси поворота. Таким образом, базис из собственных векторов в этом примере существует только тогда, когда а = 0 или я (если считать, что 0 $ а < 2тг). Для существования собственного вектора с собственным значе- нием Л необходимо и достаточно, чтобы оператор а/ - Л^ был вы- рожден, т. е. чтобы det(ay - Л£) = 0. Если А = (а[}) — матрица опера- тора аУ в каком-либо базисе, то all-f а12 ••• а1п det(ay-t<?)= °21 °22 f anl ап2 ^пп откуда видно, что det(a?/ -представляет собой многочлен степе- ни п от L Определение 2. Многочлен (О = (-1)" det(a/ -t<£) = det (t <Г - аУ) называется характеристическим многочленом оператора аУ. Легко видеть, что коэффициент при tn многочлена Лу (О равен 1, а коэффициент при f7”1 равен —trA, где trA— след матрицы А
242 Глава 6. Линейные операторы (сумма ее диагональных элементов). Свободный член многочлена ЛДО равен /ДО) = (-1)" det А. Задача 1. Доказать, что коэффициент при tn~k многочлена (О равен (—l)fc х (сумма главных миноров порядка к матрицы А). (Главным минором квадратной матрицы называется определитель ее подматрицы, расположенной симметрично относительно глав- ной диагонали.) Отметим, что характеристический многочлен линейного опера- тора в силу своего определения не зависит от выбора базиса. Отсю- да, в частности, вытекает, что след матрицы линейного оператора не зависит от базиса. Выше была фактически доказана Теорема 1. Собственные значения линейного оператора — этсг в точности корни его характеристического многочлена. Следствие. Любой линейный оператор в комплексном вектор- ном пространстве имеет собственный вектор. Линейный оператор в вещественном векторном пространстве может не иметь собственных векторов, как показывает пример по- ворота плоскости на угол а 00, и. Однако использование комплекс- ных чисел позволяет получить полезную информацию и о линейных операторах над полем вещественных чисел. Это достигается с помо- щью так называемой комплексификации. Пусть V — вещественное векторное пространство. Построим из него комплексное векторное пространство V(C) аналогично тому, как из поля R строится поле С. А именно, элементами пространства V(C) будем считать пары (х,у), где х,у eV. Определим сложение таких пар и умножение на комплексные числа по правилам (*1> У1) + (х2> Уг) = (*1 + *2, У1 +у2)> (А + ig) (х, у) = (Ах - цу, gx + Ay). Легко проверить, что при этом получится векторное пространство над С. Согласно данному определению, сложение пар вида (х, 0) и их умножение на вещественные числа сводится к соответствую- щим операциям над их первыми компонентами. Отождествим каж- дую пару вида (х, 0) с вектором х е V; тогда пространство V окажет- ся вложенным в V(C) в виде вещественного подпространства. При этом окажется, что (x,y)=x + iy.
§ 2. Собственные векторы 243 Любой базис пространства V (над R) является в то же время базисом пространства У(С) (над С). Однако в пространстве У(С) существуют и другие базисы. Любой линейный оператор лУ в пространстве V однозначно продолжается до линейного оператора аУс в пространстве У(С). При этом в базисе, составленном из вещественных векторов, опе- ратор j^c имеет такую же матрицу, как и оператор аУ. Оператор может иметь мнимые собственные значения и со- ответствующие им мнимые собственные векторы. Какой смысл они имеют в вещественных терминах? Предложение 1. Вектор x + iy (х, у G V) является собственным вектором оператора с мнимым собственным значением Л + ip (A, g G R, 0) тогда и только тогда, когда U = (х, у) с V — дву- мерное инвариантное подпространство для оператора d, причем jrfx = Xx — id,y, / (14) аУу =/ix +Ay. Доказательство проводится непосредственным вычислением. Ра- венства (14) означают, что в базисе {х, у} пространства U оператор аУ ly имеет матрицу Из них также следует, что вектор х — iy является собственным век- тором оператора а^с с собственным значением А - ig. Пример 3. Оператор аУ поворота евклидовой плоскости на угол а в ортонормированном базисе {elfe2} имеет матрицу П(а) (см. (9)). Следовательно, вектор в! 4- ie2 является собственным вектором оператора аУс с собственным значением cos а - i sin а, а вектор ег — ie2 — собственным вектором с собственным значением cos а + i sin а. Таким образом, матрица поворота может быть приве- дена к диагональному виду в комплексном пространстве. В качестве следствия предыдущего предложения получается важ- ная Теорема 2. Для любого линейного оператора над полем веще- ственных чисел существует одномерное или двумерное инвариант- ное подпространство. При заданном собственном значении А собственные векторы на- ходятся из системы однородных линейных уравнений (А-АЕ)Х = 0,
244 Глава 6. Линейные операторы где X обозначает столбец координат неизвестного вектора. Вместе с нулевым вектором они составляют подпространство Ул(лУ) = Кег(лУ-А£), называемое собственным, подпространством оператора аУ, отвеча- ющим собственному значению А. Размерность этого подпространст- ва равна п — гк(лУ - А<£), где п = dim V. Теорема 3. Собственные подпространства, отвечающие различ- ным собственным значениям Аь ..., Afc оператора линейно неза- висимы. Доказательство. Докажем утверждение теоремы индукцией по к. При к = 1 доказывать нечего. Пусть к > 1 и ej +... 4-efc_j + ек = 0 (ef G УА( (зУ)). Применяя оператор аУ, получаем AjCj + ... + Afc_1efc_1 + Лкек = 0. Вычитая отсюда исходное равенство, умноженное на Аь получаем (Al - Afc)ei +... + (Afc_x - Afc)efc_i = 0, откуда в силу предположения индукции следует, что =... = ек_1 = 0. Но тогда и ек = 0. □ Следствие. Если характеристический многочлен имеет п различных корней, то существует базис из собственных векторов оператора jtf. Указанное условие не является необходимым для существования базиса из собственных векторов. Так, для тождественного операто- ра 8 все векторы являются собственными, и, стало быть, любой базис состоит из собственных векторов, однако его характеристиче- ский многочлен /ДО = (t - 1)п имеет единственный (но п-кратный) корень 1. Рассмотрим два более интересных (и важных) примера. Пример 4. Пусть V = U Ф W. Линейный оператор &, определяе- мый формулой (у + z) = У (у G U, z G W), называется проектором на U параллельно W. Очевидно, что и = У2(0>), W = Vo(0>).
§ 2. Собственные векторы 245 В базисе пространства V, составленном из базисов подпространств U и W, оператор & записывается диагональной матрицей с числа- ми 1 и 0 по диагонали. Задача 2. Доказать, что линейный оператор 9 является проек- тором (для каких-то U и W) тогда и только тогда, когда & 2 . Пример 5. В тех же обозначениях линейный оператор над полем характеристики / 2, определяемый формулой (у 4- z) = у - z называется отражением относительно U параллельно W. Очевидно, что l/ = V1(^), W = V_1(^). В базисе пространства V, составленном из базисов U и W, опера- тор записывается диагональной матрицей с числами 1 и -1 по диагонали. Задача 3. Доказать, что линейный оператор является отраже- нием (для каких-то U и W) тогда и только тогда, когда Ж2, = £. Для получения необходимого и достаточного условия существо- вания базиса из собственных векторов докажем сначала Предложение 2. Характеристический многочлен ограничения линейного оператора на инвариантное подпространство делит характеристический многочлен самого оператора. Доказательство. Пусть 38 — ограничение оператора аУ на инва- риантное подпространство U с V. В базисе пространства V, первые векторы которого составляют базис подпространства U, матрица А оператора аУ имеет вид (6), где В — матрица оператора . Следова- тельно, Л/ (О = /я (0 ’ det(tE - С). □ (16) Следствие. Размерность собственного подпространства линей- ного оператора не превосходит кратности соответствующего кор- ня характеристического многочлена. Доказательство. Пусть сНшУЛ(аУ) = к. Тогда характеристиче- ский многочлен ограничения оператора аУ на УЛ(зг?) равен (t - A)fc. Применяя предложение 2 к подпространству УЛ(аУ), мы получаем, что (t — A)fc делит характеристический многочлен оператора аУ. □ Пример 6. Рассмотрим оператор дифференцирования в прост- ранстве многочленов степени не выше п. Из вида его матрицы, най- денной в примере 1.4, следует, что его характеристический много-
246 Глава 6. Линейные операторы член равен tn+1. Он имеет корень 0 кратности и + 1, однако раз- мерность соответствующего собственного подпространства равна 1 (см. пример 1). Этот пример показывает, что размерность собствен- ного подпространства может быть строго меньше кратности соот- ветствующего корня характеристического многочлена. Теорема 4. Для существования базиса из собственных векторов линейного оператора j# необходимо и достаточно, чтобы выполня- лись следующие условия: 1) характеристический многочлен разлагается на линей- ные множители; 2) размерность каждого собственного подпространства равна кратности соответствующего корня многочлена Доказательство. Пусть Аь ..., As — все корни многочлена и к1?...,к5— их кратности. Собственное подпространство, отвеча- ющее Ар обозначим через VJ. Согласно следствию предложения 2, dim Ц $ kf и, значит, SdimVJ<Sk,<n. (17) I I Однако единственный способ получить базис из собственных векто- ров— это взять объединение базисов собственных подпространств. Для того чтобы при этом действительно получился базис простран- ства V, необходимо и достаточно, чтобы J^dim Vi = n. i Ввиду (17) это равносильно тому, что ^kt = n и dim = к, для всех I. i Первое из этих условий означает, что (t) разлагается на линей- ные множители, а второе — это как раз условие 2) теоремы. □ § 3. Линейные операторы и билинейные функции в евклидовом пространстве Пусть V — евклидово пространство и {е1(еп} — его ортонор- мированный базис. Каждому вектору a G V соответствует линейная функция (ра(х) = (х,а). (18)
§ 3. Линейные операторы в евклидовом пространстве 247 При этом коэффициенты ^а(е^ = (ef, а) линейной функции <ра в ба- зисе {е1э..., еп} равны координатам вектора а в этом базисе. Отсюда следует, что отображение а —* ipa есть изоморфизм пространства V на пространство V*. Отметим, что определение этого изоморфизма не зависит от выбора базиса. Таким образом, в случае конечномер- ного евклидова пространства как бы исчезает разница между прост- ранством и его сопряженным. Часто говорят «отождествим при по- мощи канонического изоморфизма евклидово пространство V с его сопряженным пространством», имея в виду указанный выше изо- морфизм. Аналогично, каждому линейному оператору в пространстве V соответствует билинейная функция <^(*,У) = (*,^У)- ДО) При этом матрица билинейной функции ^(х, у) в базисе {eltеп} совпадает с матрицей оператора в этом базисе. В самом деле, ^(е,, ej) = (вр аУер есть не что иное, как i-я координата вектора аУе;. Отсюда следует, что отображение аУ —► есть изоморфизм пространства линейных операторов на пространство билинейных функций в пространстве V. Определение этого изоморфизма не зависит от выбора базиса. Однако в неортонормированном базисе матрица функции не обязана совпадать с матрицей операто- ра аУ. Для каждой билинейной функции можно определить «транспо- нированную» функцию ¥>т(х,у) = </?(у,х), матрицей которой в любом базисе является транспонированная матрица функции <р. Линейный оператор аУ*, соответствующий функции называется сопряженным оператором по отношению к аУ. Иначе говоря, сопряженный оператор определяется тожде- ством (Л,7) = (х,аУу). (20) Матрицей оператора аУ* в ортонормированном базисе является транспонированная матрица оператора аУ. Симметрическим (соответственно кососимметрическим) били- нейным функциям соответствуют так называемые симметрические (соответственно кососимметрические) линейные операторы. Они
248 Глава 6. Линейные операторы характеризуются тем, что зУ* = d (соответственно зУ* = — зУ), а в матричных терминах — тем, что их матрица в ортонормированном базисе симметрична (соответственно кососимметрична). Симмет- рические операторы называют также сомосопряженньшп. Пример 1. Ортогональный проектор на подпространство явля- ется симметрическим оператором (проверьте это). Линейные операторы, для которых зУ* = а/-1, называются орто- гональными. Иначе говоря, оператор d ортогонален, если (зУх,зУу) = (х,у), (21) т. е. если зУ сохраняет скалярное произведение векторов. Из тожде- ства (х, у) = | (|х+у|2 - |х|2 - |у I2) следует, что оператор зУ ортогонален тогда и только тогда, когда он сохраняет длины векторов. Замечание. Мы видим, таким образом, что ортогональные ли- нейные преобразования пространства Rn, определенные в приме- ре 4.1.9, — это то же, что ортогональные операторы в смысле данно- го выше определения, если считать, что скалярное умножение в R" определено как в примере 5.5.2. Пример 2. Линейный оператор, индуцированный в пространст- ве геометрических векторов любым движением, ортогонален. Пример 3. Ортогональное отражение относительно подпрост- ранства (т.е. отражение параллельно ортогональному подпростран- ству) является ортогональным оператором. В матричных терминах ортогональные операторы характеризу- ются тем, что их матрица в ортонормированном базисе ортогональ- на (см. определение 5.5.4). Предложение 1. Линейный оператор любого из рассмотренных выше трех типов, т. е. симметрический, кососимметрический или ортогональный, обладает следующим свойством: если подпростран- ство U инвариантно, то и его ортогональное дополнение U1 инва- риантно. Доказательство. Рассмотрим наиболее сложный случай ортого- нального оператора зУ. Заметим, прежде всего, что оператор jzf\v также ортогонален и, следовательно, невырожден. Поэтому для лю-
§ 3. Линейные операторы в евклидовом пространстве 249 бого вектора х G U найдется такой вектор z G U, что х = dz. Возь- мем теперь любой вектор у G LT1. Тогда, используя предыдущие обо- значения, получаем для любого х 6 U (х, jtfy) = (аУг, аУу) = (z, у) = О, откуда следует, что аз/у G U1. □ С помощью этого предложения и теоремы 2.2 мы можем, рас- суждая индукцией по размерности, получить канонический вид для матриц линейных операторов рассматриваемых трех типов. Теорема 1. Для любого симметрического оператора d суще- ствует ортонормированный базис из собственных векторов. Доказательство. Достаточно доказать существование хотя бы одного собственного вектора. В силу теоремы 2.2 достаточно сде- лать это для двумерного пространства. Матрица симметрического оператора в ортонормированном базисе в этом случае имеет вид М Ц \ Ь с г и хаРактеРистическии многочлен равен Ъ (О = t2 - (а + с) t + (ас - Ь2). Дискриминант этого квадратного трехчлена D = (а + с)2 - 4(ас - Ь2) = (а - с)2 4- 4Ь2 всегда неотрицателен, так что (t) имеет вещественные корни и, значит, j# имеет собственные векторы. □ Следствие 1. Характеристический многочлен симметрического оператора разлагается на линейные множители (над R); размер- ность каждого собственного подпространства равна кратности со- ответствующего корня; собственные подпространства, отвечаю- щие различным корням, ортогональны друг другу Доказательство. Для доказательства последнего утверждения надо заметить, что если {е1? ...,еп}— базис из собственных векто- ров оператора аУ, причем аУе1 = А1е1, то УА(аУ) есть линейная обо- лочка тех ef, для которых Л, = Л. Впрочем, его легко можно доказать и непосредственно. В самом деле, пусть хе УА(аУ), у еУДаУ), Л/pt. Тогда Л(х, у) = (аУх, у) = (х, аУу) = р(х, у), откуда (х, у) = 0. □
250 Глава 6. Линейные операторы Используя описанное выше соответствие между симметрически- ми операторами и симметрическими билинейными функциями, по- лучаем Следствие 2. Для любой квадратичной функции q в евклидовом пространстве существует ортонормированный базис, в котором ее матрица диагоналъна, т. е. q(x) = X1xl + ... + Xnx^. (22) Нужно понимать, что в формулировке этого следствия речь идет об ортонормированности в смысле скалярного умножения, а не в смысле симметрической билинейной функции ip, соответствую- щей q. Однако, поскольку матрица функции в указанном базисе диагональна, этот базис является также ортогональным (но, вообще говоря, не ортонормированным) в смысле функции </?. Отметим, что числа Аь ..., Лп —это собственные значения соот- ветствующего симметрического оператора и, следовательно, опре- делены однозначно с точностью до перестановки. Выражение (22) называют каноническим видом квадратичной функции q, а нахождение ортонормированного базиса, в котором функция q имеет такой вид, часто называют приведением к главным осям. Используя соответствие между симметрическими операторами и квадратичными функциями в евклидовом пространстве в обрат- ном направлении, можно получить другое доказательство существо- вания собственного вектора у симметрического оператора. А именно, пусть q — квадратичная функция, соответствующая данному симметрическому оператору аУ, т. е. q(x) = (a^x, х). Заметим, что функция q, будучи непрерывной, должна иметь макси- мум на единичной сфере S пространства V, задаваемой уравнением (х, х) = 1. Предложение 2. Всякая точка максимума функции q на сфере S является собственным вектором оператора jtf, а сам максимум ра- вен соответствующему собственному значению. Доказательство. Касательное пространство сферы S в точке х задается уравнением (х, dx) = 0,
§ 3. Линейные операторы в евклидовом пространстве 251 т. е. представляет собой ортогональное дополнение к подпростран- ству (х). С другой стороны, дифференциал функции q равен dq(х) = (jtfdx, х) + (jtfx, dx) = 2( аУх, dx). Если функция q достигает максимума в какой-то точке е е S, то ее дифференциал обращается в нуль на касательном пространстве сфе- ры S в этой точке. В силу предыдущего это означает, что вектор jtfe ортогонален всем векторам, ортогональным е, откуда ^Уе = Ае. При этом q(е) = (jtfe, е) = А(е, е) = А. □ В этом доказательстве мы использовали только необходимое условие максимума, которое выполнено в любой критической точке функции q на S, в частности в любой точке минимума. Ясно, что собственный вектор е е S действительно является точкой максиму- ма, только если А — максимальное собственное значение операто- ра зУ. Симметрический оператор называется положительно определен- ным, если соответствующая ему квадратичная функция положитель- но определенна или, что равносильно, если все его собственные значения положительны. Перейдем теперь к линейным операторам других типов. Теорема 2. Для любого кососимметрического линейного опера- тора d существует ортонормированный базис, в котором его матрица имеет вид г НС^) о к О 7 гдеН(а) = ^а "J). Доказательство очевидно, поскольку Н(а) — это общий вид матрицы кососимметрического оператора в ортонормированном базисе в двумерном евклидовом пространстве. □
252 Глава 6. Линейные операторы Теорема 3. Для любого ортогонального оператора d существу- ет ортонормированный базис, в котором его матрица имеет вид Maj гт' ч fcosa —sinaA гдеП(а) = ^па cosaJ. Заметим, что, используя матрицы П(я) = ( 0 J и П(0) = fl 0\ ' к } . = I о ! ), можно при желании оставить не более одного свободного диагонального элемента, равного -1, и не более одного, равного 1. Доказательство. Достаточно рассмотреть ортогональные опера- торы в одномерном и двумерном пространствах. В одномерном про- странстве ортогональный оператор — это умножение на ±1. В двумерном пространстве всякий ортогональный оператор лУ, как мы показали в примере 4.1.9, есть либо поворот на некоторый угол а, либо отражение относительно некоторой прямой. В первом случае матрица оператора d в (любом) ортонормированном бази- се имеет вид П(а). Во втором случае существует ортонормирован- ныи базис, в котором матрица оператора d имеет вид I 0 I. □ В частности, в трехмерном евклидовом пространстве матрица любого ортогонального оператора а/ в подходящем ортонормиро- ванном базисе имеет один из следующих двух видов: ГП(а) ОА ГП(а) ОА V О 1J’ О -1/ В первом случае оператор d представляет собой поворот на угол a вокруг некоторой оси, во втором—зеркальный поворот, т. е. пово- рот, совмещенный с отражением относительно плоскости, ортого- нальной оси поворота. Ясно, что зеркальный поворот не может быть результатом непре- рывного движения, так как он изменяет ориентацию пространства.
§ 3. Линейные операторы в евклидовом пространстве 253 Следовательно, конечный результат сколь угодно сложного реально- го движения твердого тела с закрепленной точкой — такой же, как при простом повороте вокруг подходящей оси на подходящий угол. Эта совершенно не тривиальная теорема называется теоремой Эй- лера. Ортогональные операторы в евклидовом пространстве V обра- зуют подгруппу группы GL(V), называемую ортогональной группой и обозначаемую O(V). Соответственно этому ортогональные мат- рицы образуют подгруппу группы GLn(R), обозначаемую Оп (это согласуется с обозначением, введенным в примере 4.1.9). Как мы уже заметили в § 5.5, определитель ортогональной матри- цы равен ±1. Ортогональные матрицы с определителем 1 образуют подгруппу индекса 2 в Оп, обозначаемую SOn. Соответственно этому ортогональные операторы с определителем 1 образуют подгруппу индекса 2 в О(У), называемую специальной ортогональной группой и обозначаемую SO(V). Операторы из SO(V) геометрически истол- ковываются как ортогональные операторы, сохраняющие ориента- цию пространства (см. пример 4.6.16). Пример 4. Группа О2 = О(Е2) состоит из поворотов, составляю- щих подгруппу SO2 = SO(£2), и отражений относительно прямых. Обозначим через sa поворот на угол а и через га — отражение от- носительно прямой, образующей угол а с какой-либо фиксирован- ной прямой I. Ясно, что sasp =sa+p. Далее, произведение поворота и отражения меняет ориентацию и, следовательно, является отраже- нием. Проследив за какой-нибудь одной точкой (см. рис. 2, а), б)), легко установить, что 5аГр=Гр + ^ Гр5а=Гр_а2. Наконец, произведение двух отражений сохраняет ориентацию и, следовательно, является поворотом. Проследив за одной точкой Рис. 2, б) Рис. 2, а)
254 Глава 6. Линейные операторы \ / (рис. 3), легко установить, что Га Г/3 = 52(а-Д)> \ / т. е. произведение двух отражений есть \ LaSn поворот на удвоенный угол между их -------Уп осями. В частности, отсюда следует, / /\ 1 что группа О2 порождается отраже- / \ ниями. рис> з Задача 1. Доказать, что группа О(У) порождается отражениями относитель- но (п — 1)-мерных подпространств (где п = dim V). Всякий линейный оператор в евклидовом пространстве един- ственным образом представляется в виде суммы симметрическо- го и кососимметрического операторов (ср. пример 5.1.1). Имеется мультипликативный аналог этого разложения, в котором кососим- метрический оператор заменяется ортогональным (почему так про- исходит, станет ясно в гл. 12). Теорема 4. Всякий невырожденный линейный оператор в евкли- довом пространстве единственным образом представляется в виде произведения положительно определенного симметрического и ор- тогонального операторов. Такое представление линейного оператора называется его поляр- ным разложением. Перед тем как доказывать эту теорему, докажем следующее Предложение 3. Всякий положительно определенный симмет- рический оператор 38 единственным образом представляется в ви- де 38= Ч>2, где — также положительно определенный симметри- ческий оператор. Доказательство. Пусть A1,...,AS — (различные) собственные значения оператора и Уь ..., Vs — соответствующие собственные подпространства. По условию Af положительны. Положим /2, = /А~ (арифметическое значение корня). Тогда линейный оператор действующий в Vt как умножение на gf, удовлетворяет условиям предложения. (В частности, он симметричен, поскольку его мат- рица в ортонормированном базисе, составленном из собственных векторов оператора 38, диагональна.) Обратно, пусть оператор удовлетворяет условиям предложе- ния. Пусть pLlf...i[is — его (различные) собственные значения и W1}..., Ws — соответствующие собственные подпространства. Тогда
§ 3. Линейные операторы в евклидовом пространстве 255 оператор Ч?2 — & действует на WJ как умножение на g?. Следова- тельно, при подходящей нумерации g? = Af и WJ= VJ. Это показыва- ет, что оператор определен однозначно. □ Доказательство теоремы 4. Пусть — невырожденный линей- ный оператор. Предположим, что d = 4>б, где — положительно определенный симметрический, а б — ортогональный операторы. Тогда Ввиду предложения 3 этим однозначно определяется оператор , а тем самым и б. Обратно, из равенства (х,аУаУ*у) = (лУ*х, зУ*у) и невырожденности оператора d (и, значит, зУ*) следует, что зУзУ* — положительно определенный симметрический оператор. Пользуясь предложением 3, найдем такой положительно опреде- ленный симметрический оператор <#, что зУзУ* = и положим ^ = <^“1зУ. Тогда зУ = и зУзУ* = ^^^*^ = ^2, откуда после сокращения на получаем, что б б* = <£, т. е. б — ортогональный оператор. □ Пример 5. Всякую деформацию твердого тела с закрепленной точкой в первом приближении можно рассматривать как невырож- денный линейный оператор. Пусть зУ = б — полярное разложе- ние этого оператора. Тогда б — это поворот вокруг некоторой оси, который не является истинной деформацией в том смысле, что он не приводит к возникновению каких-либо напряжений в теле. С дру- гой стороны, оператор по теореме 1 есть комбинация растяже- ний (или сжатий) в трех взаимно перпендикулярных направлениях и тем самым представляет собой «чистую деформацию». Именно этот оператор, называемый тензором деформации, участвует в фор- мулировке закона Гука. Задача 2. Доказать, что всякую матрицу А G GLn (R) можно пред- ставить в виде А = О^Оз, где ОЪО2 — ортогональные матрицы, a D — диагональная матрица с положительными элементами. На- сколько однозначно такое представление? Аналогичная теория имеется для линейных операторов в эрми- товом пространстве, причем она даже проще, так как в эрмитовом пространстве всякий линейный оператор имеет собственный век-
256 Глава 6. Линейные операторы тор. Изложим ее вкратце, опуская доказательства, аналогичные при- веденным выше в евклидовом случае. Для любого линейного оператора d в эрмитовом пространстве определяется сопряженньш оператор по формуле (20). Если опе- ратор аУ в некотором ортонормированием базисе имеет матрицу А, то оператор лУ* в том же базисе имеет матрицу Л*. (Напомним, что А* = АТ.) Линейный оператор а/ называется эрмитовым (соответственно косоэрмитовым, унитарным), если = d (соответственно аУ* = = }). Это эквивалентно тому, что его матрица в ор- тонормированием базисе эрмитова (соответственно косоэрмитова, унитарна). Эрмитовы операторы называют также самосопряжен- ными. Для любого из этих типов линейных операторов доказывается су- ществование ортонормированного базиса из собственных векторов. При этом собственные значения эрмитова оператора вещественны, косоэрмитова — чисто мнимы, а унитарного — по модулю равны единице. Докажем, например, что собственные значения эрмитова опера- тора d вещественны. Пусть е — собственный вектор оператора d с собственным значением А. Тогда А(е, е) = {de, е) = (е, jtfe) = А(е, е), откуда А = А. Формула (19) устанавливает биекцию между множествами эрми- товых операторов и эрмитовых полуторалинейных функций. При этом в любом ортонормированном базисе матрицы эрмитова опе- ратора и соответствующей ему эрмитовой функции совпадают. Применяя теорему о существовании ортонормированного бази- са из собственных векторов эрмитова оператора, мы получаем, что для любой эрмитовой квадратичной функции q в эрмитовом прост- ранстве существует ортонормированный базис, в котором ее матри- ца диагональна, т. е. q(x) = A1|x1|2 + ... + An|xn|2. (23) Числа Аь ..., Ап определены однозначно с точностью до перестанов- ки, так как это собственные значения соответствующего эрмитова оператора. Выражение (23) называют каноническим видом эрмито- вой квадратичной функции q.
§ 3. Линейные операторы в евклидовом пространстве 257 Эрмитов оператор называется положительно определенным, ес- ли соответствующая ему эрмитова квадратичная функция положи- тельно определенна или, что равносильно, если все его собственные значения положительны. Унитарные операторы в эрмитовом пространстве V образуют подгруппу группы GL(V), называемую унитарной группой и обозна- чаемую U(V). Соответственно этому унитарные матрицы образуют подгруппу группы GLn(C), обозначаемую Un. Унитарные операторы (соответственно матрицы) с определите- лем 1 образуют подгруппу в U(V) (соответственно в Un), называе- мую специальной унитарной группой и обозначаемую SU(V) (соот- ветственно SUn). Всякий невырожденный линейный оператор в эрмитовом про- странстве единственным образом представляется в виде произве- дения положительно определенного эрмитова и унитарного опера- торов. Такое представление линейного оператора называется его полярным разложением. В одномерном случае линейный оператор есть просто комплексное число, а его полярное разложение — триго- нометрическая форма этого числа. Поскольку тригонометрическая форма комплексного числа связана с полярными координатами на плоскости, это объясняет термин «полярное разложение» в общем случае. Комплексификация У(С) евклидова пространства V канониче- ским образом превращается в эрмитово пространство, если опреде- лить скалярное умножение по формуле (*i + *Уь х2 + (Уг) = *2) + СУъ У2)] + iСCati, у2) - (уъ х2)]. При этом комплексное продолжение аУс симметрического (соответ- ственно кососимметрического, ортогонального) оператора аУ бу- дет эрмитовым (соответственно косоэрмитовым, унитарным) опе- ратором. Используя эти соображения, можно дать еще одно доказатель- ство существования собственного вектора у симметрического опе- ратора аУ в евклидовом пространстве V. А именно, пусть х -F iy (х, у G V) — какой-либо собственный вектор оператора аУс. Так как оператор аУс эрмитов, то соответствующее собственное значение А вещественно и, значит, а/х = Ах, аУу = Ау.
258 Глава 6. Линейные операторы Хотя бы один из векторов х, у отличен от нуля; он и будет собствен- ным вектором оператора j?/. § 4. Жорданова форма Для некоторых специальных типов линейных операторов, как, например, симметрических, эрмитовых и унитарных, рассмотрен- ных в предыдущем параграфе, удается доказать возможность приве- дения их матрицы к диагональному виду. В общем случае для этого имеются препятствия, указанные в теореме 2.4. Первое из них состоит в том, что характеристический многочлен может не разлагаться на линейные множители, т. е. иметь менее чем п корней. Его не существует для линейных операторов над по- лем комплексных чисел. В случае линейного оператора над полем вещественных чисел можно работать с его комплексификацией, что в какой-то мере снимает проблему: выбор удачного базиса из ком- плексных векторов позволяет понять и действие исходного операто- ра в вещественном пространстве. Так, в § 2 мы видели, что всякому мнимому собственному вектору отвечает двумерное инвариантное подпространство в вещественном пространстве. Как будет показа- но в § 9.5, аналогичное расширение основного поля возможно и в общем случае. Второе препятствие состоит в том, что размерность какого-ли- бо собственного подпространства может оказаться меньше кратно- сти соответствующего корня характеристического многочлена. То- гда приходится расстаться с мечтой привести матрицу оператора к диагональной форме, но, если характеристический многочлен раз- лагается на линейные множители, ее можно привести к так называ- емой жордановой форме, минимально отличающейся от диагональ- ной. Этому и посвящен настоящий параграф. Коль скоро собственных векторов может оказаться недостаточ- но, естественно рассмотреть какие-то более общие векторы. Определение 1. Вектор е G V называется корневым вектором ли- нейного оператора а?/, отвечающим числу A G К, если (ааГ-Л<?)те = О для некоторого meZ+. Наименьшее из таких т называется высо- той корневого вектора е.
§ 4. Жорданова форма 259 В частности, собственные векторы — это корневые векторы вы- соты 1. Удобно считать нулевой вектор корневым вектором высо- ты 0 (отвечающим любому Л). Пример 1. Для оператора дифференцирования в пространстве C°°(IR) бесконечно дифференцируемых функций собственные век- торы, отвечающие числу Л — это функции, пропорциональные е**, а корневые векторы — это функции вида р(х)еХх, где р(х)— мно- гочлен; при этом высота такого корневого вектора равна deg р 4-1. В частности, корневые векторы, отвечающие числу 0, — это много- члены. Если е — корневой вектор высоты т > 0, то вектор собственный с собственным значением Л. Следовательно, Л — ко- рень характеристического многочлена. Легко видеть, что корневые векторы, отвечающие корню Л, об- разуют подпространство. Оно называется корневым подпростран- ством и обозначается Vх (а/). Ясно, что Если е — корневой вектор высоты т > 0, то (лУ - А<£)е — кор- невой вектор высоты т — 1. Отсюда следует, что корневое подпро- странство Vх (аУ) инвариантно относительно з& — а значит, и от- носительно лУ. Множество корневых векторов высоты т — это не что иное, как ядро оператора (а/ - А<£)т. Таким образом, корневое подпро- странство Vх (зг?)—это объединение возрастающей цепочки под- пространств Кег(аУ - А£) С Кег(а/ - А£)2 с ... В конечномерной ситуации эта цепочка, начиная с некоторого ме- ста, стабилизируется, и, значит, Vх (зг?) = Кег(л/ — А<£)т для некото- рого т. В базисе пространства согласованном с этой цепоч- кой подпространств, оператор л/ - А<£ записывается нильтреуголь- ной матрицей (т.е. треугольной матрицей с нулями на диагонали), а оператор зг/ соответственно этому — треугольной матрицей с чис- лом А на диагонали. Отсюда мы получаем два следствия: 1) характеристический многочлен ограничения оператора зг/ на Vх(зг/) равен (Г —А)\ где k = dim Vх (зг/); 2) при g / А оператор з# невырожден на Vх (згГ).
260 Глава 6. Линейные операторы Задача 1. Доказать, что высота любого корневого вектора, отве- чающего корню А, не превосходит dim Ул(аУ). Докажем теперь ключевое утверждение, оправдывающее поня- тие корневого вектора. Предложение 1. Размерность корневого подпространства рав- на кратности соответствующего корня характеристического мно- гочлена. Доказательство. В базисе {еь..., еп} пространства V, первые к векторов которого составляют базис подпространства Vх (аУ), матрица А оператора j/ имеет вид (6), где В — матрица оператора = ^|уА(0<). Следовательно, Л/ W = (Г) • det(tE - С) = (t - Л/ det «Е -С). Пусть —линейный оператор в пространстве W = {ек+1,..., еп), за- даваемый матрицей С. Нам нужно доказать, что Л не является кор- нем многочлена det(tE — С), т.е. собственным значением операто- ра , Предположим противное. Тогда существует такой ненулевой век- тор е € W, что 4>е = Ле. Это означает, что j/e = Ae + u, ugV;(j/), и, следовательно, («хУ - Л<£)е = и — корневой вектор, но тогда и е — корневой вектор, что противоречит определению Vх (лУ). □ Предложение 2. Корневые подпространства, отвечающие раз- личным корням Ль ..., Лк, линейно независимы. Доказательство. Доказательство аналогично доказательству теоремы 2.3 о линейной независимости собственных подпрост- ранств. Пусть е j -+-... + e^-i + = 0 (et G (лУ)). Применим к этому равенству оператор — Лк<£)т, где т — высота вектора ек, Мы получим (аУ - Л^)гпе1 +... + (л/ - Л^)^.! =0. Если доказывать предложение индукцией по к, то предположение индукции даст (лУ - Afc<g,)me1 =... = (лУ - Л^)тек_! = 0.
§ 4. Жорданова форма 261 Так как оператор аУ — Afc<£ невырожден на каждом из подпрост- ранств УЛ1 (аУ),У**-1 (аУ), то отсюда следует, что ej =... = efc_! = 0; но тогда и ек = 0. □ Предложения 1 и 2 в совокупности позволяют сделать следую- щий вывод. Теорема 1. Если характеристический многочлен (t) разлага- ется на линейные множители, то 1=1 где А1?..., As— (различные) корни многочлена f^(t). Исследуем теперь более подробно действие оператора а/ на каж- дом из корневых подпространств. Определение 2. Линейный оператор *Ж называют нильпотент- ным, если существует такое т € Z+, что Ж™ = 0. Наименьшее из таких т называют высотой нильпотентного оператора с#. Пример 2. Оператор дифференцирования в пространстве мно- гочленов степени не выше п является нильпотентным оператором высоты п + 1. Так как Ул(а/) = Кег(а/ — A<S*)ni для некоторого т, то оператор «Ж = (d — А<£)|уЛ( нильпотентен. Поэтому наша задача сводится к исследованию ниль- потентных операторов. Пусть с# — нильпотентный оператор в векторном пространст- ве V. Высотой вектора е G V относительно Л называется наимень- шее т, для которого сЖте = 0, т. е. высота вектора е как корневого вектора оператора Л (отвечающего корню 0). Очевидно, что вы- сота любого вектора не превосходит высоты самого оператора Ж, причем существуют векторы, высота которых равна высоте опера- тора сЖ. Мы будем обозначать высоту вектора е через ht е. Предложение 3. Если е G V — вектор высоты т, то векторы е, Ле, Л2е,..., Лт~хе линейно независимы. Более точно, всякая нетривиальная линейная комбинация и = Аое 4- Alt#e -I- А2Ж2е -I-... -I- ХТп_1ЛТп~1е
262 Глава 6. Линейные операторы является ненулевым вектором высоты т — к, где к — номер первого ненулевого коэффициента. В частности, если Ао / О, то и — вектор высоты т. Доказательство. Так как 0 0, но Лте = 0, то = Лт~ки = 0. □ Определение 3. Подпространство (е, J/t, c#'n-1e) (т = = ht е) называется циклическим подпространством нильпотентного оператора <#, порожденным вектором е. Очевидно, что циклическое подпространство инвариантно от- носительно с#. Ограничение оператора Л на циклическое под- пространство (е, <#е, с#2е, ...,Лт~хе} имеет высоту т и в базисе {t#m-1e, <#т”2е,с#е, е} задается матрицей Л0) = го 1 0 .. .. 0 ОА 0 0 1 ., .. 0 0 0 0 0 ., .. 0 0 0 0 0 .. 0 1 \0 0 0 . .. 0 oj называемой нильпотентной жордановой клеткой (порядка гл) (ср. пример 1.4). Предложение 4. Пусть е G V — вектор максимальной высоты т (равной высоте оператора <#) и U = {e, Ле, Л2е, ...,Лт~хе) — порожденное им циклическое подпространство. Тогда существу- ет инвариантное подпространство W с V, дополнительное к U (т. е. такое, что V = UQW). Доказательство. Нам нужно доказать существование такого ин- вариантного подпространства W с V, что Ur\W = 0nU + W = V. За- ведомо существуют инвариантные подпространства, обладающие первым из этих свойств: таковым является, например, нулевое под- пространство. Выберем из них максимальное (т. е. такое, которое нельзя увеличить с сохранением указанного свойства). Обозначим его через W и докажем, что U + W = V. Предположим, что это не так, и пусть v фи + W. Так как Лти = О, то существует такое к, что Л^и фи + W, но Лки eU+W. Заме-
§4. Жорданова форма 263 нив v на 1v, мы можем считать, что Лиеи + W. Пусть Л^и + w (ugU, u/gW). Из равенства и = 0 получаем j^m~1u 4-с#т“1ш = О, откуда t#m”1u = 0. (Напомним, что подпространства U и W инвари- антны и линейно независимы.) Это означает, что ht и < т. Согласно предложению 3, отсюда следует, что и содержится в подпростран- стве <#[/ = С#е, с#2е,..., <Лт-1е). Пусть и = (u' G U). Тогда c#(v - и') g W. Заменив и на и - и', мы можем считать, что JfveW. Рассмотрим теперь подпространство W' = W + (v) Из нашего условия следует, что оно инвариантно. Докажем, что unw'=o. Предположим противное. Пусть у G U П W' — ненулевой вектор. Так как l7nlV = 0, тоу = г + Xv, и Л # 0. Разделив у на Л, можно считать, что Л = 1, т.е. у = z4-и. Но тогда v = y — zeU + W, что противоречит нашему выбору вектора и. Таким образом, U П W' = 0, что противоречит нашему выбору подпространства W. Следовательно, U 4- W = V, что и требовалось доказать. □ Предложения 3 и 4 позволяют доказать следующую теорему. Теорема 2. Пространство V может быть разложено в прямую сумму циклических подпространств оператора Jf. Количество сла- гаемых в таком разложении равно dim Кег Доказательство. Будем доказывать теорему индукцией по п = = dim V. При п = 1 утверждение теоремы очевидно. При п > 1 пусть U с V — циклическое подпространство, порожденное каким-либо вектором максимальной высоты. Согласно предложению 4, суще- ствует такое инвариантное подпространство W с V, что V = U Ф W. По предположению индукции пространство W может быть разложе- но в прямую сумму циклических подпространств. Вместе с подпро- странством U это дает нужное разложение всего пространства V.
264 Глава 6. Линейные операторы Докажем второе утверждение теоремы. Пусть 7 = 71Ф...Ф7к — разложение пространства 7 в прямую сумму циклических подпро- странств оператора с#. Очевидно, что Кег Я = Кег Л\V] Ф... ® Кег Л\Vk. Так как dim КеГс#|ц = 1 при любом i, то dim Кег = к. □ Возвращаясь к произвольному линейному оператору аУ, заме- тим, что в циклическом подпространстве нильпотентного операто- ра с#= (аУ - А<^) | оператор аУ задается матрицей вида М 1 0 ... О (Л О Л 1 ... О О О О Л ... О О J(A)=J(O) + AE = О 0 0 ... Л 1 V) о о ... о х] Такая матрица называется жордановой клеткой с собственным зна- чением Л. Определение 4. Жордановой матрицей называется клеточно- диагональная матрица в которой Jb J2>Jk — какие-то жордановы клетки. Комбинируя теоремы 1 и 2, мы приходим к следующему резуль- тату. Теорема 3. Если характеристический многочлен разлага- ется на линейные множители, то существует базис, в котором матрица оператора жорданова. Следствие. Матрица любого линейного оператора над полем комплексных чисел приводится к жордановой форме. Базис, в котором оператор лУ имеет жорданову матрицу, назы- вается жордановым. Как видно из доказательства теоремы 2, в его
§ 5. Функции от линейного оператора 265 выборе, вообще говоря, имеется большой произвол. Однако сама жорданова форма матрицы линейного оператора определена одно- значно с точностью до перестановки клеток. Это будет доказано в §9.3. Очевидно, что в жордановой форме матрицы оператора зУ сум- ма порядков жордановых клеток с собственным значением Л равна dim УЛ(зУ), т. е. кратности Л как корня характеристического много- члена. Из второй части теоремы 2 следует, что число жордановых клеток с собственным значением Л равно dim Задача 2. Доказать, что максимальный порядок жордановых клеток с собственным значением Л в жордановой форме матри- цы оператора зУ равен высоте нильпотентного оператора = = (зУ — Л(?) |уЛ(^). Матрицы А и В называются подобными, если существует такая невырожденная матрица С, что В = С-1 АС. Подобные матрицы мож- но рассматривать как матрицы одного линейного оператора в раз- ных базисах. Следствие теоремы 3 можно сформулировать таким образом, что всякая комплексная матрица подобна жордановой. Задача 3. Доказать, что всякая комплексная матрица подобна своей транспонированной матрице. § 5. Функции от линейного оператора Пусть зУ — линейный оператор в п-мерном векторном простран- стве V над полем К. Для любого многочлена у(0 = aotm + +... + ani-it + ат еК[с] можно определить его значение от оператора зУ по формуле /(зУ) = aQj^m + +... Ч-а^зУ + ат£. Ясно, что (/ + g) (^У) = f С*У) + g (аУ ), (/g) (зУ) = /(зУ)я(зУ). (24) Аналогичным образом можно определить многочлен от матрицы. При этом, если оператор зУ имеет в некотором базисе матрицу А, то оператор f (зУ) будет иметь в том же базисе матрицу f (А).
266 Глава 6. Линейные операторы Так как пространство всех линейных операторов конечномерно (при нашем молчаливом предположении, что пространство V конеч- номерно), то среди степеней оператора аг/ может быть лишь конеч- ное число линейно независимых. Следовательно, существуют такие ненулевые многочлены /, что /(аУ) = 0. Они называются аннулиру- ющими многочленами оператора аг/. Аннулирующий многочлен наи- меньшей степени называется минимальным ^аннулирующим) мно- гочленом оператора аг/. Мы будем обозначать его через т^. Всякий аннулирующий многочлен f делится на минимальный. В самом деле, если остаток от деления f на т^ отличен от ну- ля, то он является аннулирующим многочленом меньшей степени, чем т^, что противоречит определению минимального многочле- на. Отсюда, кстати, следует, что минимальный многочлен опреде- лен однозначно с точностью до постоянного множителя. Для того чтобы определить его вполне однозначно, будем считать, что его старший коэффициент равен единице. Задача 1. Найти минимальные многочлены нулевого и тожде- ственного операторов. Аналогично определяются аннулирующие и минимальный мно- гочлены матрицы. Минимальный многочлен линейного оператора равен минимальному многочлену его матрицы в любом базисе. Если пространство V разложено в прямую сумму инвариантных подпространств оператора аг/, то минимальный многочлен операто- ра аг/ равен наименьшему общему кратному минимальных много- членов его ограничений на эти подпространства. Пользуясь этим, легко найти минимальный многочлен линейного оператора по жор- дановой форме его матрицы (если, конечно, она приводится к жор- дановой форме). Для этого надо прежде всего найти минимальный многочлен жордановой клетки. Лемма 1. Минимальный многочлен жордановой клетки поряд- ка тс собственным значением А равен (t — A)m. Доказательство. Пусть аг/ — линейный оператор, задаваемый такой жордановой клеткой. Тогда = аг/ - А<£ — нильпотентный оператор высоты т, т. е. Это означает, что (t - A)m — аннулирующий многочлен, но ника- кой его собственный делитель не является аннулирующим много- членом. Следовательно, (t - — минимальный многочлен. □
§ 5. Функции от линейного оператора 267 Пусть теперь j/ — произвольный линейный оператор, характе- ристический многочлен которого разлагается на линейные мно- жители. Пусть As — все (различные) корни многочлена f^. Из леммы 1 и предшествующего ей замечания следует Теорема 1. Минимальный многочлен оператора si равен = П(г -Л,)"1', 1=1 где —максимальный порядок жордановых клеток с собственным значением в жордановой форме матрицы оператора si. Следствие 1. Жорданова форма матрицы оператора si диаго- нально тогда и только тогда, когда его минимальный многочлен не имеет кратных корней. Пример 1. Пусть si — линейный оператор в комплексном век- торном пространстве, удовлетворяющий условию sim = € для неко- торого натурального гп. Тогда многочлен tm — 1 является аннулиру- ющим для оператора si. Так как он не имеет кратных корней, то минимальный многочлен оператора si тем более не имеет кратных корней. Следовательно, жорданова форма матрицы оператора st диагональна. Ясно, что ее диагональные элементы (собственные значения оператора si) суть какие-то корни гп-й степени из 1. Пример 2. Найдем все линейные операторы st, удовлетворяю- щие условию st3 = si2. Это условие означает, что t3 — t2 является ан- нулирующим многочленом оператора si или, что равносильно, ми- нимальный многочлен оператора si делит t3 -12 = t2(t - 1). Ввиду теоремы 1 оно выполняется тогда и только тогда, когда жорданова форма матрицы оператора st состоит только из клеток вида с;). Число клеток каждого вида может быть произвольным (в том числе равным нулю), лишь бы сумма их порядков равнялась п. Следствие 2. Если жорданова форма оператора si диагональна, то и жорданова форма его ограничения st\v на любое инвариантное подпространство U с V диагональна. Доказательство. Очевидно, что минимальный многочлен т оператора st является, во всяком случае, аннулирующим многочле- ном для оператора si\v. Следовательно, минимальный многочлен оператора st\v делит многочлен т^, и если последний из этих
268 Глава 6. Линейные операторы многочленов не имеет кратных корней, то и первый обладает этим свойством. □ Следствие 3 (теорема Гамильтона—Кэли). /^(аУ) = 0. В частности, для линейного оператора зУ в двумерном вектор- ном пространстве получаем: J/2 - (tr jyw + (det = 0. Конечно, это легко проверить и прямым вычислением (проделайте это!). Замечание 1. Теорема Гамильтона—Кэли верна и без предположения о том, что характеристический многочлен разлагается на линейные множители. Это можно доказать следующим образом. Как будет показано в § 9.5, существует расширение L поля К, в котором разлагается на линей- ные множители. Рассматривая матрицу А оператора зУ как матрицу с эле- ментами из L, мы можем утверждать в силу предыдущего следствия, что она аннулируется своим характеристическим многочленом; но очевидно, что характеристический многочлен матрицы А не зависит от того, рассматри- ваем мы ее как матрицу с элементами из К или как матрицу с элементами из L. Этим же способом доказывается, что если минимальный многочлен оператора зУ разлагается на линейные множители над К, то и его характе- ристический многочлен разлагается на линейные множители над К. Пользуясь теоремой Гамильтона—Кэли, можно свести вычисле- ние любого многочлена f от линейного оператора зУ к вычислению многочлена степени < п от этого оператора. А именно, разделим f на с остатком: , / = Ч/.^+Р> degp<n. (25) Тогда /(зУ)=р(зУ). Предположим, что К = R или С и многочлен разлагается на линейные множители (что всегда имеет место, если К = С). Пусть Аь ..., As — все его (различные) корни и кь..., ks — их кратности, так что кт 4-... 4-ks = и. (26) Тогда из (25) следует, что /O)(Xi)=pO)(A1.) при i = 1,s; j = 0,1,к, — 1. (27)
§ 5. Функции от линейного оператора 269 (Мы считаем здесь, что /(0) = f для любой функции /.) Равен- ства (27) однозначно определяют многочлен р, как показывает следующее Предложение 1. Пусть Л1?AsеК —различные числа и ... ..., ks — натуральные числа, удовлетворяющие условию (26). Обозна- чим через Рп пространство многочленов степени < п. Тогда отобра- жение 7?: Рп —> Кп, ставящее в соответствие каждому многочлену реРп набор чисел (p(>)(A1):i = l,...,s;J = O) 1, 1), является изоморфизмом векторных пространств. Доказательство. Очевидно, что — линейное отображение. Так как dim Рп = dim Кп = п, то достаточно доказать, что Кег <р = 0. Но Кег ср состоит из многочленов, для которых каждое из чисел Л, является корнем кратности а ненулевой многочлен степени < п не может иметь так много корней (с учетом кратностей). □ Задача нахождения многочлена р степени < п, для которого чис- ла p(j)(At) (i = 1,..., s; j = 0,1,..., ki — 1) равны каким-то заданным числам, называется задачей интерполяции (с кратными узлами). В случае простых узлов, т. е. когда кх =... = к5 = 1, ответ может быть дан в виде интерполяционной формулы Лагранжа. Пример 3. Вычислим Ат, где ( 1 0 А = 1-1-6 к-1 2 5J Имеем t-1 0 3 -1 t+1 6 = t3-5t2 + 8t-4=(t-l)(t-2)2 1 -2 t —5 Интерполяционный многочлен p(t) =at2 + bt + c определяется условиями p(l) = a + b + c = l, р(2) = 4а4-2Ь4-с = 2т, p'(2) = 4a + b = m-2ni"1,
270 Глава 6. Линейные операторы откуда a = (m-2)-2m-1 + l, b = -(3rn-8)-2m-1-4, c=(2m-6)-2'n-1 + 4. Следовательно, Ат = 2m-! [(m - 2)А2 - (3m - 8)А + (2m - 6)Е] + А2 - 4А + 4Е = 73m-6 -6m+ 12 -9m + 12\ 74 -6 -6\ = 2m"1 [3m-4 -6m+ 8 -9m + 6 I + I 2 -3 -3 1. k -m 2m 3m + 2 J \0 0 oj Изложенная теория может быть обобщена с многочленов на про- извольные аналитические функции, но для этого мы должны иссле- довать топологические свойства алгебры линейных операторов. Пусть V — векторное пространство над полем К = R или С. Определение 1. Нормой в пространстве V называется всякая функция || • ||: V—>R, обладающая свойствами 1) ||х|| >0 при х/0; 2) ||Ах|| = |Л|||х||; 3) ||х + уК1|х|| + ||у||. Приведем примеры норм в Кп. Пример 4. ||x|| = max|Xi|. Пример 5. Евклидова (эрмитова) норма ||х|| = .|xj2. Примерб. ||х|| = £ |х,|. ’< Определение 2. Последовательность векторов хт называется сходящейся по норме к вектору х G V, если lim 11хт — х11 = 0. т—»» Легко видеть, что сходимость по любой из приведенных выше норм означает просто покоординатную сходимость. На самом деле это справедливо вообще для всех норм в конечномерном простран- стве, как показывает следующее Предложение 2. Для любых двух норм || • ||х и || • ||2 в конечномер- ном векторном пространстве V существуют такие положитель- ные константы aub, что а трф b при всех х G V, х / 0. V х
§ 5. Функции от линейного оператора 271 Доказательство. Достаточно сравнить произвольную норму с какой-либо фиксированной. Пусть Цх^ = 2 1*Л где -">хп — координаты вектора х в базисе {еь еп}. Тогда i где b = max ||е£||2. Неравенства i |||х +Дх||2-||х||2| ||Дх||2^Ь||Дх||1 показывают, что || • ||2 — непрерывная функция в топологии покоор- динатной сходимости. Пусть а — ее минимум на «единичной сфе- ре» ||х||j = 1 в смысле первой нормы. Тогда ||х||2 a||x||i при всех xeV. □ Замечание 2. В бесконечномерном пространстве различные нормы, во- обще говоря, определяют различные топологии. Проверьте это, например, для норм f1 11/111= \fto\dx, ||/||2=max|/(x)| Jo 0<xC1 в пространстве непрерывных функций на отрезке [0,1]. Пусть V — конечномерное векторное пространство с фиксиро- ванной нормой || • ||. 00 Определение 3. Ряд 2 xm (хт е У) называется абсолютно схо- т=1 00 дящимся, если ЧИСЛОВОЙ ряд 2 ll*m II СХОДИТСЯ. т=1 Точно так же, как для числовых рядов, доказываются следующие утверждения. ж Предложение 3. Всякий абсолютно сходящийся ряд 2 хт (хт е е V) сходится, причем m=1 L хт L ||хт||. т=1 т=1 Предложение 4. Сумма абсолютно сходящегося ряда не изменя- ется ни при какой перестановке его членов. Определим теперь норму в пространстве линейных операторов на V.
272 Глава 6. Линейные операторы Определение 4. Нормой линейного оператора d называется число ||^|| = max ||jyx|| = max ||х||=1 х#0 ||х|| Предложение 5. Определенная таким образом функция в про- странстве линейных операторов действительно является нормой. Кроме того, она обладает свойством 11^11 им Доказательство. Имеем ||j?/ + ^|| = max ||(j/+^)x|| = max ||аУх + ^х||^ M=i м=1 max(||j/x|| +1|^х||) max ||аг/х|| + max ||^х|| = ||jz/|| +1|^||. М=1 М=1 ||х||=1 Остальные свойства нормы очевидны. Далее, 1^3|1=тах«4«л!! = тах!!^!!.!й£!!4 х#0 М ||#х|| ||х|| . ||j/^x|| ||<Вх|| . 11^011 ||^х|| II _/|1 II/э»|| г-1 max -.у-- - max --трутах V^-max V-~= • D ll^xll ях/о ||x|| y/o llyll x#o IMI Задача 2. Найти явный вид нормы линейного оператора для каждой из трех приведенных выше норм в пространстве Кп. Очевидно, что норма линейного оператора не меньше, чем мо- дуль любого его собственного значения. 00 Теорема 2. Пусть ряд f(,t) = 2 amtm (ат сходится при т=0 |t| <R. Тогда ряд М)=£ат4т (28) m=0 абсолютно сходится для любого линейного оператора d, удовлетво- ряющего условию ||j/||<R. Доказательство. Как известно, из сходимости степенного ряда /(О при |t| <R следует его абсолютная сходимость в том же интер- вале (круге). Так как ||ama/m||^|am|||a/||m, то ряд У(j/) абсолютно сходится при || j/|| < R. □
§ 5. Функции от линейного оператора 273 Равенство (28) считается определением функции f от линейного оператора При этом сохраняются свойства (24). Аналогичным образом определяется функция от матрицы. Как и в случае много- членов, если А — матрица оператора аУ в каком-либо базисе, то /(А) — матрица оператора в том же базисе. Предположим теперь, как и выше, что характеристический многочлен имеет корни Ль ...,AS кратностей kb ...,ks, причем кг 4-... + ks = п. Если ||лУ|| <R, то |AJ <R при i = 1,..., s. Теорема 3. В условиях теоремы 2 найдем многочлен р степени < п, удовлетворяющий условиям (27). Тогда /СяГ) = рС*Г). Доказательство. Для любого т положим т fmW=T.aktk к=0 и обозначим через рт многочлен степени < п, удовлетворяющий условиям (27) для многочлена fm вместо /. Согласно предыдущему, /щ(^) = Из предложения 1 следует, что lim pm = р. Имеем т—»°о теперь /(Х)= lim /т(Х)= lim рт(зУ) = р(лУ). □ /и—»оо т—»°° Согласно сформулированному выше общему принципу, для лю- бого линейного оператора можно определить его экспоненту е ^ (= exp j/) по формуле е^ = |?+^ + ^ + ^ + ... (29) Как и для чисел, путем перемножения рядов с использованием предложения 4 устанавливается Теорема 4. е^+® =е^е® при — (При это свойство, как правило, не имеет места, и можно сказать, что лишь благодаря этому обстоятельству суще- ствует теория групп Ли.) При фиксированном j/ положим ^(t)=ef^ (teK). (30) Очевидно, что ^(0) = 8. Из теоремы 4 следует, что ^(c + s) = ^(c)^(s), tf(-t) = ^(t)-1. Таким образом, операторы ^(t) образуют группу. Она называется однопараметрической группой, порожденной оператором j/.
274 Глава 6. Линейные операторы Пример 7. Пусть Q — оператор дифференцирования в простран- стве многочленов степени $ п. Тогда (er®/)(x)=/(x) + ^t + ^lt2 + ...=/(x + t). гт л fG о) /'cost -sint\ , ч Пример 8. е = , (проверьте). \ Olli L wo 1 J Для операторной функции вещественной или комплексной пе- ременной можно обычным образом определить производную. При этом очевидно, что дифференцирование операторной функции сво- дится к дифференцированию матричных элементов. Теорема 5. #'(0 = = аУ^(Г). Доказательство. Так как 4- ДО = (Дс) = ^(Д0^(0, то и доказательство, как и в случае числовой экспоненты, сводится к выводу «замечательного предела» lim = (31) t-o t Имеем Ряд, заключенный в круглые скобки, при 111 < 1 мажорируется сходя- щимся числовым рядом ll^ll I ll^ll2 I IMI3 2! "Г 3! "Г 4! и потому абсолютно сходится, причем его сумма по норме не превос- ходит суммы указанного числового ряда. Отсюда и следует (31). □ Теорема 5 позволяет найти в общем виде решение системы од- нородных линейных дифференциальных уравнений с постоянными коэффициентами = (i = l,и). (32) J=1
§ 5. Функции от линейного оператора 275 (Здесь ^(t),xn(t)—неизвестные функции переменной t.) Со- гласно общей теории, система (32) имеет единственное решение, удовлетворяющее начальным условиям вида x/(O)=xio (i = l, ...,п). (33) Перепишем систему (32) в векторной форме: x'(t)=Ax(t), (34) где x(t) — вектор-столбец с координатами xf(t), а А — матрица с эле- ментами . Начальное условие (33) можно записать в форме х(О)=хо, (35) где х0 — вектор-столбец с координатами xl0. Тогда решением будет x(t) = eb4x0. (36) Доказательство этого получается непосредственной проверкой с по- мощью теоремы 5. Пример 9. Найдем решение системы дифференциальных урав- нений {Xi(t) = x1(t)-3x3(t), X^Ct) = Xj (t) — х2(с) — 6x3(t), x3(t) = -Xi (t) + 2x2(t) + 5x3(t), удовлетворяющее начальным условиям Х!(0) = 1, х2(0) = 1, x3(0) = 0. Матрица А этой системы совпадает с матрицей примера 3. Мы долж- ны вычислить /(А), где /(u) = efu (здесь t выступает как констан- та). Интерполяционный многочлен р(и) = аи2 + Ьи + с определяется условиями p(l) = a + b + c = ef, p(2) = 4a + 2b + c = e2t, p'(2) = 4a + b = te2t, откуда a = (t — l)e2t + e£, b = —(3t —4)e2t —4е£, c=(2t-3)e2t + 4ef.
276 Глава 6. Линейные операторы Следовательно, ем = е2с [(t - 1)А2 - (3t - 4)А 4- (2t - 3)Е] + е1 (А2 - 4А + 4Е) = <3t-3 -6t + 6 —9t + 6> М -6 -6\ = e2tI 3t —2 —6t + 4 -9t + 3 +ef 2 -3 -3 V -t 2t 3t +1 J kO 0 0 J Решение, удовлетворяющее заданным начальным условиям, полу- чается умножением матрицы на столбец находим Таким образом X1(t) = (-3t + 3)e2f-2ef, х2(С) = (-Зс + 2)е2г-е', x3(t) = te2f.
Глава 7 Аффинные и проективные пространства § 1. Аффинные пространства В элементарной геометрии мы имеем дело не только с вектора- ми, но и с точками (и даже главным образом с точками). Подобно тому как аксиоматика векторного пространства отражает в обоб- щенном виде свойства векторов элементарной геометрии, аксиома- тика аффинного пространства отражает свойства точек и векторов элементарной геометрии в их взаимосвязи. В «обычном» евклидовом пространстве элементарной геометрии можно определить операцию сложения точки и вектора. А именно, суммой точки р и вектора х называется точка, являющаяся концом вектора, равного х, отложенного от точки р. Свойства этой опера- ции и лежат в основе следующего определения. Пусть V — векторное пространство над полем К. Определение 1. Аффинным пространством, ассоциированным с векторным пространством V, называется множество S вместе с операцией сложения S х V —* S, удовлетворяющей следующим условиям: 1) р + (х + у) = (р + х)+у (pGS, x,yGV); 2) р + 0 = р (р G S, О — нулевой вектор); 3) для любых р, q gS существует единственный вектор х, такой, что р + x = q. Элементы множества S называются точками. Вектор х из усло- вия 3) называется вектором, соединяющим точки р и q, и обознача- ется через pq. Из условия 1) следует, что pq+qr = pr Vp,q,rGS. Всякое векторное пространство V можно рассматривать как аф- финное, считая, что точки — это те же векторы, и определив опера- цию сложения точки и вектора как сложение векторов. При этом вектор pq будет разностью векторов q и р. С другой стороны, если в аффинном пространстве S фиксиро- вать некоторую точку о — «начало отсчета», то можно отождествить
278 Глава 7. Аффинные и проективные пространства каждую точку р с ее радиус-вектором ор, При этом сложение точ- ки и вектора превратится просто в сложение векторов. Такое отож- дествление точек с векторами называется векторизацией аффинно- го пространства. (Конечно, оно зависит от начала отсчета.) Размерностью аффинного пространства по определению счита- ется размерность соответствующего векторного пространства. Точка о (начало отсчета) вместе с базисом {е2,..., еп} простран- ства V называется репером аффинного пространства S. С каждым репером связана аффинная система координат в пространстве S. А именно, каждой точке р е S приписываются координаты, равные координатам вектора ор в базисе {еь ..., еп}. Легко видеть, что 1) координаты точки р+х равны суммам соответствующих ко- ординат точки р и вектора х; 2) координаты вектора pq равны разностям соответствующих координат точек q и р. Основными объектами элементарной геометрии являются пря- мые и плоскости. Следующее определение вводит соответствующие понятия в геометрию аффинных пространств. Определение 2. Плоскостью в аффинном пространстве S назы- вается подмножество вида P = Po + U, (1) где pQ — некоторая точка, a U — подпространство пространства V. Подпространство U однозначно определяется как совокупность всех векторов, соединяющих точки плоскости Р, и называется на- правляющим подпространством плоскости Р. Сумма точки из Р и вектора из U принадлежит Р. Относительно этой операции плос- кость Р является аффинным пространством, ассоциированным с векторным пространством U, По определению dim Р = dim U. Нульмерная плоскость есть точ- ка. Одномерная плоскость называется прямой. Плоскость размерно- сти п - 1 называется гиперплоскостью, В качестве точки р0 в равенстве (1), определяющем плоскость Р, может быть взята любая точка этой плоскости. Очевидно, что пересечение плоскостей, если оно не пусто, также является плоскостью. Для любого подмножества М с S и любой точки pQeM плоскость Ро + (РоР: реМ)
§ 1. Аффинные пространства 279 является наименьшей плоскостью, содержащей М. Эта плоскость называется аффинной оболочкой множества М и обозначается через affM. Теорема 1. Через любые к 4-1 точек аффинного пространства проходит плоскость размерности $ к; при этом, если эти точки не содержатся в плоскости размерности < к, через них проходит единственная плоскость размерности к. Доказательство. Пусть р0, рь ..., рк е S. Тогда Р = Ро + {РоР1,--,РоРк} есть плоскость размерности $ к, проходящая через р0, р19..., рк. Если dimP = k, то векторы рор1?pQpk линейно независимы и Р является единственной k-мерной плоскостью, проходящей через Ро,Р1,-,Рк- п Точки pQ, р1}рк е S называются аффинно зависимыми, если они лежат в плоскости размерности < к, и аффинно независимыми в противном случае. Из доказательства теоремы 1 видно, что точки р0, Pi, •••> Рк аффинно зависимы тогда и только тогда, когда векторы PoPi, • • •> РоРк линейно зависимы. В то же время из определения ясно, что свойство точек быть аффинно зависимыми или независимыми не зависит от их нумерации (в частности, от того, какую из них мы возьмем за р0). Другая точка зрения на плоскости состоит в том, что это множе- ства решений систем линейных уравнений. Пусть дана система линейных уравнений £аох,=Ь( (i = l, (2) i=i Будем интерпретировать ...,хп как координаты точек п-мерно- го аффинного пространства S относительно некоторого репера (о; еь ..., еп). Тогда решения системы (2) можно понимать как точки пространства S. Предположим, что эта система совместна и р0 G $ — одно из ее решений. Тогда, согласно теореме 2.1.3, множество всех решений системы (2) имеет вид р0 + U, где U с V — подпростран- ство решений соответствующей системы однородных линейных уравнений, и, стало быть, является плоскостью пространства S. Обратно, пусть Р = р0 + U — некоторая плоскость. Согласно тео- реме 5.3.4, подпространство U может быть задано системой одно- родных линейных уравнений. Заменив свободные члены этих урав-
280 Глава 7. Аффинные и проективные пространства нений значениями, принимаемыми левыми частями в точке р0, мы получим систему линейных уравнений, задающую плоскость Р, Тем самым доказана Теорема 2. Всякая плоскость есть множество решений, некото- рой системы линейных уравнений. Обсудим взаимное расположение двух плоскостей Pl=Pl + l/l, P2 = p2 + U2- Очевидно, что если они пересекаются и р0 — °Дна из точек пересе- чения, то Pi ПР2 = Ро + (^1 Теорема 3. Плоскости Рх и Р2 пересекаются тогда и только то- гда, когда Р1Р2€^1 + ^2- Доказательство. Плоскости Рг и Р2 пересекаются тогда и только тогда, когда существуют такие векторы иг G Ulf и2 е U2, что Р1 + ^1=Р2 + ^2- Это равенство может быть переписано в виде pTpI=u1-u2- Поэтому существование таких векторов щ,и2 как раз и означает, что Р1Р2^^1 + ^2- □ Плоскости Pj и Р2 называются параллельными, если с U2 или U2 с Ui, и скрещивающимися, если Рг ПР2 = 0 и Щ nU2 = 0. Задача 1. Какова наименьшая размерность пространства, в ко- тором существуют скрещивающиеся двумерные плоскости? Задача 2. Определить dim aff UP2). Линейные комбинации точек аффинного пространства, вооб- ще говоря, не определены. Однако некоторым из них можно при- дать смысл. А именно, назовем барицентрической линейной ком- бинацией точек plf..., pke S линейную комбинацию вида ^А^р,, где А, = 1, и будем считать ее равной точке р, определяемой i равенством op = SA<op?>
§ 1. Аффинные пространства 281 где о е S. Благодаря условию £ Af = 1 это определение не зависит i от выбора точки о. Действительно, пусть о' — любая другая точка. Тогда о'р = о'о + ор = ^-i (.o'о + орд = Л, о'pt. i i В частности, центр тяжести системы точек {рь ...,рк} можно определить как center(p1,...,pk) = |(p1 + ... + pfc). Задача 3. Показать, что на обычной евклидовой плоскости а) центр тяжести точек р есть середина отрезка pq; б) центр тяжести множества вершин треугольника есть точка пересечения его медиан. Барицентрическая комбинация Ар 4- pq двух точек р и q есть точка г, лежащая на прямой pq и обладающая тем свойством, что pr=yrq (3) л (если А = 0, р = 1, то г = q). В самом деле, приняв точку г за точку о в данном выше определении барицентрической линейной комбина- ции, мы получаем: 0 = Arp4-prq, откуда и следует (3). В случае обычной евклидовой плоскости точка г = Ар 4- pq делит отрезок pq в отношении р: А (она лежит на самом отрезке, если А, р 0, и на его продолжении, если А < 0 или р < 0). Допуская вольность речи, мы будем употреблять это выражение и в общем случае, когда понятие отрезка не имеет смысла. Задача 4. Аффинная оболочка множества М с S есть совокуп- ность всех барицентрических линейных комбинаций точек из М. Предположим, что поле К содержит более двух элементов. Теорема 4. Непустое подмножество PC.S является плоскостью тогда и только тогда, когда вместе с любыми двумя различными точками оно содержит проходящую через них прямую. Доказательство. Утверждение «только тогда» очевидно. Пусть теперь Р с S — непустое подмножество, обладающее указанным свойством. Фик- сируем произвольную точку роеР и рассмотрим подмножество U = {иеV: P04-ugP}cV. Нам нужно доказать, что U — подпространство. Ясно, что
282 Глава 7. Аффинные и проективные пространства оно содержит 0. Далее, если и G U —любой ненулевой вектор и Л G К, то точка pQ + Ли лежит на прямой, проходящей через р0 и р0 4- и и, следователь- но, Ли G U. Докажем, наконец, что если u:, и2 в U — непропорциональные векторы, то Uj + u2 G U. Пусть Л—любой элемент поля К, отличный от 0 и 1. Легко видеть, что точка р = р0 4- иг 4- и2 лежит на прямой, проходящей через точки Pi = р0 4- Хщ G Р и р2 = Pq 4- —-г u2 G Р, а именно Л 1 п- 1„ хА-1п p-XPl + ~P2’ Следовательно, р G Р, □ Замечание 1. Если поле К состоит из двух элементов, то любая прямая пространства S состоит всего из двух точек и, таким образом, любое непу- стое подмножество Р с S удовлетворяет условию теоремы (но не любое непустое подмножество является плоскостью). Пусть Ро>Р1>--->Рп—такие точки п-мерного аффинного прост- ранства S, что векторы роръ ..., рорп линейно независимы. Тогда каждая точка р G S единственным образом представляется в виде P = Z>iPi> W £х, = 1. i=0 i=0 В самом деле, это равенство можно переписать в виде РоР = S xiPoPb 1=1 откуда следует, что в качестве ..., хп можно (и должно) взять ко- ординаты вектора рор в базисе {роръ ..., рорп}; после этого х0 опре- п деляется равенством х0 = 1 “ X хг i=l Числа х0, ..., хп называются барицентрическими координата- ми точки р относительно р0, рь..., рп. Пример 1. Пусть точки u, и, w, лежащие на сторонах qr, гр, pq треугольника pqr (см. рис. 1), делят эти стороны в отношениях Л : 1, р : 1, v : 1 соответственно. Докажем теорему Чевы\ прямые pu, qv, rw пересекаются в одной точке тогда и только тогда, когда Л/iv = 1. Для этого рассмотрим барицентрические координаты относительно точек р, q, г. Барицентрические координаты точек и, v, w суть
§ 2. Аффинные отображения 283 Рис. 1 Рис. 2 соответственно. Точки прямой ри являются барицентрическими комбинациями точек р и и. Их барицентрические координаты х, у, z характеризуются тем, что z : у = Л. Аналогично, барицен- трические координаты точек прямой qv характеризуются тем, что х: z = g, а барицентрические координаты точек прямой rw — тем, что у: х = v. Точка, барицентрические координаты которой удовле- творяют всем этим трем условиям, существует тогда и только тогда, когда Agv = 1. Задача 5. Точки р0, ръ ..., рк аффинно независимы тогда и толь- ко тогда, когда ранг матрицы, составленной из их барицентриче- ских координат, равен к +1. Задача 6. Пусть точки и, v,w, лежащие на сторонах qr, rp,pq треугольника pqr или их продолжениях (см. рис. 2), делят эти сторо- ны в отношениях Л: 1, g: 1, v : 1 соответственно. Используя преды- дущую задачу, доказать теорему Менелая: точки и, и, w лежат на одной прямой тогда и только тогда, когда Agv = -1. § 2. Аффинные отображения Пусть S и S' — аффинные пространства, ассоциированные с век- торными пространствами V и V' соответственно (над одним и тем же полем). Определение 1. Аффинным отображением пространства S в пространство S' называется всякое отображение f: S —► S', обладаю- щее свойством Др + х) = Л₽) + Лх) (р е S, х е V), (4) где <р — некоторое линейное отображение пространства V в про- странство V'.
284 Глава 7. Аффинные и проективные пространства Из (4) вытекает, что Cp,qeS). (5) Тем самым линейное отображение однозначно определяется по /. Оно называется дифференциалом отображения f и обозначается че- рез df. Векторизуем пространства S и S', приняв за начала отсчета ка- кие-то точки о и о' соответственно. Полагая в (4) р = о, мы получаем следующее представление аффинного отображения f в векторизо- ванной форме: /(х) = <р(х) + Ь (ЬеГ), (6) где b = о'/(о). Отсюда, в свою очередь, получается запись отображе- ния f в координатах: = S aijxj + bi (i = 1> • • , rn), (7) j=i где Xj,...»xn — координаты точки x, а уг,..., ym — координаты точки y=fW. Обратно, как легко проверить, для любого линейного отображе- ния ip: V —► V' и любого вектора b е V' отображение, определяемое формулой (6), аффинно и его дифференциал равен Пусть S" — еще одно аффинное пространство и g: S' —► S" — аф- финное отображение. Предложение 1. Отображение gf:S^>S" является аффинным, причем d(gf) = dg-df. (8) Доказательство. При р G S, х G V имеем = g(/(p)) + dg(d/(x)) = (g/)(p) + (dg- d/)(x). □ При К = R дифференциал аффинного отображения есть частный случай дифференциала произвольного гладкого отображения, рас- сматриваемого в анализе, а формула (8) есть частный случай фор- мулы для дифференциала произведения гладких отображений (или «сложной функции»). Предложение 2. Аффинное отображение биективно тогда и только тогда, когда его дифференциал биективен.
§ 2. Аффинные отображения 285 Доказательство. Выберем начала отсчета о и о' в простран- ствах S и S' таким образом, чтобы /(о) = о'. Тогда отображение f в векторизованной форме будет совпадать со своим дифференциа- лом, откуда и следует доказываемое утверждение. □ Биективное аффинное отображение называется изоморфизмом аффинных пространств. Аффинные пространства называются изо- морфными, если между ними существует изоморфизм. Следствие. Конечномерные аффинные пространства (над одним и тем же полем) изоморфны тогда и только тогда, когда они име- ют одинаковую размерность. Очевидно, что при аффинном отображении f:S—>S' всякая плос- кость Р = р 4- U пространства S переходит в плоскость /(Р) = /(р) 4- 4- df(U) пространства Sz. Если f биективно, то dim /(Р) = dim Р. Предложение 3. Пусть f:S^S/ — аффинное отображение. То- гда ffaipi^llwpd 4 i i для любой барицентрической линейной комбинации ^iPi точек Рь •••, Рк- Доказательство. Векторизуем пространство S. Тогда f запишет- ся в виде (6), и мы получим f (S *.Р.) = «Р (S А.Р,) + ь = S Л,(<р(р() + b) = S Л,/(р,). □ В частности, центр тяжести системы точек при аффинном отоб- ражении переходит в центр тяжести системы их образов. Частным случаем аффинных отображений являются аффинно- линейные функции. Определение 2. Аффинно-линейной функцией на аффинном про- странстве S называется всякая функция f:S-+K, обладающая свой- ством ftp + х) = ftp) + а(х) (р е S, х G V), (9) где а — некоторая линейная функция на векторном пространстве V, называемая дифференциалом функции f и обозначаемая через df. Иначе говоря, аффинно-линейная функция — это аффинное отображение пространства S в поле К, рассматриваемое как аффин- ная прямая.
286 Глава 7. Аффинные и проективные пространства В векторизованной форме с началом в точке о аффинно-линей- ная функция f записывается в виде /(x) = a(x) + b (be К), (10) где b = /(о). Отсюда, в свою очередь, получается запись функции f в координатах: /(x) = Sa,xi + b. (11) i Частным случаем аффинно-линейных функций являются посто- янные функции. Они характеризуются тем, что их дифференциал равен нулю. Если f — непостоянная аффинно-линейная функция, то ее многообразия уровня f(p) = c суть параллельные гиперплоско- сти с направляющим подпространством, задаваемым уравнением df(x)=0. Аффинно-линейные функции образуют (п + 1)-мерное подпро- странство (где n = dimS) в пространстве всех функций на S. Это ясно хотя бы из их координатной записи (11). Докажем одно утверждение, которое нам понадобится в следую- щем параграфе. Предложение 4. Барицентрические координаты суть аффинно- линейные функции. Доказательство. Пусть х0, хь ...,хп— барицентрические коор- динаты относительно точек р0, Pi, •••, Рп- Если векторизовать про- странство S, приняв точку pQ за начало отсчета, то х1?...,хп бу- дут обычными координатами относительно базиса (рор1э..., рорп). Следовательно, х1э ...,хп— аффинно-линейные функции. Так как п xQ = 1 - 2 xi, то *о — также аффинно-линейная функция. (Это мож- i=l но было бы также доказать, приняв за начало отсчета какую-нибудь другую из точек р( .) □ Аффинное отображение аффинного пространства S в себя назы- вается аффинным преобразованием. Биективные аффинные преоб- разования образуют группу, называемую полной аффинной группой пространства S и обозначаемую через GA(S). (Это согласуется с тем определением, которое было дано в § 4.2 в векторной форме.) В силу предложения 1 отображение d: GA(S)->GL(V)
§ 2. Аффинные отображения 287 является гомоморфизмом групп. Его ядро есть группа параллельных переносов ta:p<-»p + a (aeV). Обозначим ее через Trans (S). Предложение 5. Для любых f € GA(S) и а е V имеем РаГ1^^- (12) Доказательство. Применяя преобразование /га/-1 к точке q = = /(р), получаем ftaf'1 (<?) = Л»(Р)=/(р + а) =7(Р) + df (а) = q + d/(a). □ Тот факт, что преобразование Д,/”1 является параллельным пе- реносом, можно было бы доказать, вычислив его дифференциал при помощи предложения 1. Если фиксировано начало отсчета о G S и тем самым аффинное пространство S отождествлено с векторным пространством V, то группа GL(V) становится подгруппой группы GA(S). Это не что иное, как стабилизатор точки о в группе GA(S). Из записи аффинных преобразований в векторизованной форме (6) следует, что всякое аффинное преобразование / € GA(S) единственным образом пред- ставляется в виде / = tb¥> (ср GGL(V), bG V). (13) Ясно, что = df не зависит от выбора начала отсчета, но вектор Ь = о/(о) от этого, вообще говоря, зависит. Задача 1. Доказать, что при переходе к началу отсчета oz = о 4- а (a G V) вектор b заменяется на вектор b' = b + <p(a)-a. (14) Пример 1. Согласно предложению 4.2.2, всякое движение евкли- довой плоскости Е2 является (биективным) аффинным преобразова- нием. То же верно для евклидова пространства Е3. Пример 2. Гомотетия с центром в точке о и коэффициентом А есть аффинное преобразование, задаваемое формулой /(о + х) = о +Ах. Ясно, что df = А<£. Докажем, что всякое аффинное преобразование /, для которого d/ = А<? (А 01), есть гомотетия с центром в некоторой
288 Глава 7. Аффинные и проективные пространства точке. Для этого достаточно доказать, что f имеет неподвижную точку. Запишем f в векторизованной форме: /(х) = Лх + Ь (ЬеУ). Уравнение /(х) = х приводится к виду (1 - Л)х = b и, следовательно, имеет (единственное) решение. Гомотетия с коэффициентом -1 называется центральной сим- метрией. Задача 2. Доказать, что произведение гомотетий с центрами в разных точках с коэффициентами А и g при Лр, /1 есть гомотетия, а при Лр = 1 — нетривиальный параллельный перенос. Группа аффинных преобразований определяет аффинную гео- метрию в том смысле, что задачей аффинной геометрии является изучение свойств фигур, инвариантных при (биективных) аффин- ных преобразованиях. Так как при таких преобразованиях любая плоскость переходит в плоскость той же размерности, а любая бари- центрическая линейная комбинация точек — в барицентрическую линейную комбинацию их образов с теми же коэффициентами, то понятия плоскости и барицентрической комбинации точек, а сле- довательно, понятия параллельных прямых, параллелограмма, от- резка, середины отрезка, центра тяжести системы точек, выпуклого множества, симплекса и т. д. относятся к числу понятий аффинной геометрии. Но, например, понятия квадрата и окружности к числу таковых не относятся, так как при аффинном преобразовании квад- рат может перейти в параллелограмм, не являющийся квадратом, а окружность — в эллипс, не являющийся окружностью. Следующая теорема показывает, что в аффинной геометрии все симплексы равны (например, на аффинной плоскости все треуголь- ники равны). Теорема 1. Пусть {р0, р1}..., рп} и {q0, qlf..., qn}— две системы аффинно независимых точек в п-мерном аффинном пространстве S. Тогда существует единственное аффинное преобразование f, перево- дящее pi в qt при i = О,1,..., п. Доказательство. Существует единственное линейное преобра- зование пространства V, переводящее базис {роръ ..., РоРп} в ба- зис {ЧоЧТ, •••> ЯоЯпУ Векторизуем пространство S, приняв за начало отсчета точку р0. Тогда искомое аффинное преобразование f запи- сывается в виде f(x) = <p(x) + p^fo. □
§ 2. Аффинные отображения 289 Задача 3. Доказать, что в вещественной аффинной геометрии все параллелепипеды равны. Задача 4. Пусть Р2, Р{, Р2С$ — плоскости с направляющими подпространствами U2, U'v U2 соответственно. Предположим, что dim Pj = dim Р', dim Р2 = dim Р2, dim Щ П U2 = dim U' П U2 и пере- сечения Р} ПР2 и Pj ПР2 пусты или непусты одновременно. Доказать, что тогда существует преобразование f G GA(S), переводящее Pj в Р' и Р2 в Р^. В аффинной геометрии не существует понятия расстояния меж- ду точками, так как любую пару различных точек с помощью аффин- ного преобразования можно перевести в любую другую такую пару. Однако при аффинных преобразованиях сохраняется так называе- мое отношение тройки точек, лежащих на одной прямой. Пусть точки рь р2, р3 лежат на одной прямой I. Тогда если р2 / р3, то Р1Рз = сРзРг (с в К). Число с и называется (простым) отноше- нием тройки точек Pi,p2, Рз и обозначается через (Р1,Р2,Рз)- Ес- ли pi / р2 = Рз, то полагают (ръ р2, р3) = <». Если = р2 = р3, то (Pi, р2, р3) не определено. Если с = -, то говорят также, что точка р3 М делит отрезок pjp2 в отношении Л: р (хотя само понятие отрезка определено только в вещественной геометрии). При Л 4- м = 1 это означает, что РЗ = МР1+^Р2- Ясно, что отношение точек рь р2, р3 сохраняется при любом аффин- ном преобразовании, не стягивающем прямую I в точку (в частно- сти, при любом биективном аффинном преоб- разовании). Задача 5. Выяснить, как изменяется отно- /\ шение тройки точек при перестановках этих / точек. Какое наибольшее и какое наименьшее и / 'к число различных значений оно может прини- 7 \ мать? Z-----•-------А Л „ D W Q Задача 6. Построить треугольник pqr по г точкам и, и, ш на его сторонах qr, гр, pq (или Рис. з их продолжениях), делящих их в отношениях Л: 1, р : 1, v : 1 соответственно (рис. 3). (Указание: рассмотреть произведение гомотетий с центрами в точках и, v, w, переводящих г в q, р в г, q в р соответственно.)
290 Глава 7. Аффинные и проективные пространства § 3. Выпуклые множества Пусть S — аффинное пространство, ассоциированное с вектор- ным пространством V над полем вещественных чисел. Определение 1. Отрезком, соединяющим точки р, q е S, называ- ется множество pq = {Ap + (l-A)q: 0^A$l}cS. Определение 2. Множество М с S называется выпуклым, если вместе с любыми двумя точками оно содержит соединяющий их отрезок. Очевидно, что пересечение выпуклых множеств выпукло. Любая плоскость является выпуклым множеством. Определение 3. Выпуклой линейной комбинацией точек прост- ранства S называется их барицентрическая линейная комбинация с неотрицательными коэффициентами. Предложение 1. Выпуклое множество М с S вместе с любыми точками р0, plf..., pfc содержит любую их выпуклую линейную ком- бинацию р = ^iPi- Доказательство. Докажем, что р G М, индукцией по числу I ко- эффициентов Ао, ..., отличных от нуля. При I = 1 точка р совпадает с одной из точек р0, рь ..., рк, так что доказывать нечего. Пусть I > 1. Будем считать для определенности, что / 0. Заметим, что /1, так как иначе все остальные коэффициенты были бы равны нулю. Имеем: А-i А А Р = Е jT^Pi )+Л<сРЪ М=0 k J т. е. р лежит на отрезке p'pfc, где По предположению индукции р' GМ. Следовательно, и р GМ. □ Предложение 2. Д,ля любого множества MaS множество convM всевозможных выпуклых линейных комбинаций точек из М являет- ся выпуклым множеством.
§ 3. Выпуклые множества 291 Доказательство. Пусть р = £ ^tPi и q = £ — выпуклые ли- нейные комбинации точек из М. Тогда при 0 $ Л $ 1 Лр + (1 - A)q = £ AA,p, + £(1 - Л)ptfqf i i есть также выпуклая линейная комбинация точек из М. □ Множество convM является наименьшим выпуклым множе- ством, содержащим М; оно называется выпуклой оболочкой множе- ства М. Выпуклая оболочка системы {р0, Pi, • ••, РпУ аффинно независи- мых точек п-мерного пространства называется п-мерным симплек- сом с вершинами в точках р0, рь рп. Иными словами, симплекс состоит из точек, барицентрические координаты которых относи- тельно Ро,Р1,---,Рп неотрицательны. Нульмерный симплекс — это точка, одномерный симплекс — отрезок, двумерный — треугольник, трехмерный — тетраэдр (треугольная пирамида). Точка множества М с S называется внутренней, если некоторая ее окрестность целиком содержится в М, и граничной в против- ном случае. Очевидно, что точки симплекса, барицентрические ко- ординаты которых относительно вершин симплекса положительны (и только они), являются внутренними. Предложение 3. Выпуклое множество М содержит внутренние точки тогда и только тогда, когда aff М = S. Доказательство. Если aff М = S, то М содержит систему из п 4-1 аффинно независимых точек. Но тогда М содержит симплекс с вер- шинами в этих точках и, значит, содержит внутренние точки. Обрат- ное очевидно. □ Задача 1. Доказать, что замыкание выпуклого множества выпук- ло, причем всякая его внутренняя точка является внутренней точ- кой самого множества. Выпуклое множество, содержащее внутренние точки, называет- ся выпуклым телом. Предложение 4. Пусть р — внутренняя точка выпуклого те- ла М и q —любая его точка. Тогда все точки отрезка pq, за исклю- чением, быть может, точки q, являются внутренними точками тела М. Доказательство. Рассмотрим точку r = Ap + (l-A)q (0 < Л 1).
292 Глава 7. Аффинные и проективные пространства Имеем P = |r + ^q. Если точка г' достаточно близка к г, то точка Р/ = Хг/ + ^Гч близка к точке р и, следовательно, лежит в М (см. рис. 4). Так как r' = Ap' + (l-A)q, то отсюда следует, что г'ЕМ. □ Следствие 1. Внутренние точки выпуклого тела образуют вы- пуклое множество. Следствие 2. Всякая точка выпуклого тела является пределом его внутренних точек. Множество внутренних точек выпуклого тела М обозначим че- рез М°. Это открытое выпуклое тело. Согласно предложению 3, всякое выпуклое множество М с S яв- ляется выпуклым телом в aff М. Допуская вольность речи, часто го- ворят о внутренних точках произвольного выпуклого множества М, имея в виду его внутренние точки в пространстве aff М. Для любой непостоянной аффинно-линейной функции f на про- странстве S (см. § 2) положим Hy = {pGS:f(p) = 0}, H+ = {peS:/(p)^0}, H; = {peS:/(p)^0}(=H^). Множество Hf является гиперплоскостью. Множества и на- зываются (замкнутыми) полупространствами, ограничиваемыми гиперплоскостью Ну. Из предложения 2.3, примененного к аффин- но-линейной функции /, следует, что всякое полупространство яв-
§ 3. Выпуклые множества 293 ляется выпуклым множеством. С другой стороны, всякий отрезок, соединяющий точку из Hf с точкой из HJ, пересекает гиперплос- кость Hf. Определение 4. Гиперплоскость Hf называется опорной гипер- плоскостью замкнутого выпуклого тела М, если МсН^ и Hf содер- жит некоторую (граничную) точку тела М. Полупространство Hf называется при этом опорным полупространством тела М. Предложение 5. Гиперплоскость Н, проходящая через гранич- ную точку замкнутого выпуклого тела М, является опорной тогда и только тогда, когда Н П М° = 0. Доказательство. Если Н П М° 0 0, то точки множества М° (и тем самым точки тела М) имеются по обе стороны от Н. Обратно, если точки тела М имеются по обе стороны от Н, то, поскольку каждая точка тела М является пределом точек множества М°, по обе стороны от Н имеются даже точки этого множества. Отрезок, соединяющий две такие точки, целиком лежит в М° и пересекает Н, так что НРМ°/0. □ Ключевой теоремой теории выпуклых множеств является следу- ющая теорема отделимости. Теорема 1. Через любую граничную точку замкнутого выпукло- го тела проходит опорная гиперплоскость. Доказательство. Пусть р — граничная точка замкнутого выпук- лого тела М в п-мерном аффинном пространстве. Докажем индукци- ей по к, что при k п — 1 через точку р проходит k-мерная плоскость, не пересекающая М°. При к = 0 такой плоскостью является сама точка р. Предположим, что уже удалось найти (к — 1)-мерную плоскость Р с нужными свой- ствами. Выберем любую (к + 1)-мерную плос- / М \ кость S', содержащую Р и какую-нибудь внут- [ . ; . ] реннюю точку р0 тела М, и попытаемся найти \ J нужную нам k-мерную плоскость среди плоско- X. стей, содержащих Р и содержащихся в S'. Рассмотрим выпуклое тело М' = М П S' в про- Рис-5 странстве S'. Ясно, что М° nS' с (М')°. Обратно, всякая точка г G (М')° является внутренней точкой отрезка, соединя- ющего точку р0 с некоторой точкой q ЕМ'сМ (см. рис. 5), и потому принадлежит М°. Таким образом, (М')° = М°П5'.
294 Глава 7. Аффинные и проективные пространства В частности, отсюда следует, что Р П (М')° = 0, и нам достаточно до- казать, что в S' существует опорная гиперплоскость тела М', содер- жащая Р. Изменив обозначения, будем считать, что S' = S, М' = М и k +1 — и. Итак, пусть Р — это (п - 2)-мерная плоскость, проходящая через точку р и не пересекающая М°. Докажем, что существует опорная гиперплоскость тела М, содержащая Р. Каждая гиперплоскость Н, содержащая плоскость Р, разбивается ею на две полуплоскости (или полугиперплоскости, если угодно), скажем, Н+ и Н~ (не путать с предыдущими обозначениями полу- пространств). Если ни одна из полуплоскостей Н+ и Н~ не пере- секает М°, то все доказано. Если они обе пересекают М°, то и Р пересекает М°, так что этот случай невозможен. Пусть теперь Н+ пересекает М°, а Н~ не пересекает. Начнем поворачивать гиперплоскость Н вокруг Р, условно говоря, по часо- вой стрелке. Ясно, что при небольшом повороте полуплоскость Н+ по-прежнему будет пересекать М°. Однако при повороте на я она перейдет в полуплоскость которая М° не пересекает. Поэтому существует некий минимальный поворот, при котором Н+ переста- ет пересекать М°. Повернутую таким образом гиперплоскость Н обозначим через Но. Согласно построению, полуплоскость не пересекает множе- ство М°, но при малейшем повороте против часовой стрелки начи- нает его пересекать (см. рис. 6). С другой стороны, если бы полу- плоскость Н~ пересекала М°, то она сохранила бы это пересечение Рис. 6
§ 3. Выпуклые множества 295 при любом небольшом повороте. Но, как мы уже отмечали, обе половины гиперплоскости, содержащей Р, не могут пересекать М°. Следовательно, Hq не пересекает М° и, значит, Но — опорная гипер- плоскость. □ Замечание 1. Фактически мы доказали более сильное утвержде- ние, а именно, что любая плоскость, проходящая через точку р и не пересекающая М °, содержится в некоторой опорной гиперплос- кости. Замечание 2. Через данную граничную точку р тела М может проходить либо единственная опорная гиперплоскость, как на рис. 6, либо бесконечно много таких гиперплоскостей, как на рис. 7. Опорная гиперплоскость может содержать и другие точки тела М, кроме точки р, как на рис. 8. Теорема 2. Всякое замкнутое выпуклое множество М является пересечением некоторого (быть может, бесконечного} числа полу- пространств. Доказательство. Заметим, что всякая гиперплоскость Hf явля- ется пересечением полупространств и HJ, Отсюда следует, что и плоскость любой размерности является пересечением полупро- странств. Поэтому доказательство теоремы сводится к случаю, ко- гда М— тело. Докажем, что замкнутое выпуклое тело М является пересечени- ем своих опорных полупространств. Пусть q М и р — какая-либо внутренняя точка тела М. Отрезок pq пересекает границу тела М в некоторой точке r^q. Проведем через эту точку опорную гипер-
296 Глава 7. Аффинные и проективные пространства плоскость Hf (см. рис. 9). Так как /(р) > 0, а /(г) = 0, то /(q) < О, т.е. q$H+. □ Определение 5. Пересечение конечного числа полупространств называется выпуклым многогранником. Выпуклый многогранник, являющийся телом, называется телесным. Иными словами, выпуклый многогранник есть множество реше- ний конечной системы линейных неравенств. Отметим, что выпук- лый многогранник не обязан быть ограниченным. Так, например, все пространство S является выпуклым многогранником (пересече- ние пустого множества полупространств). Выпуклый многогранник не обязан быть телесным (хотя иногда это и требуют). Очевидно, что пересечение конечного числа выпуклых много- гранников является выпуклым многогранником. Любая плоскость является выпуклым многогранником. Пример 1. Симплекс с вершинами р0, Pi, •••, Рп является выпук- лым многогранником, так как он может быть задан линейными неравенствами xL 0 (i = 0,1,..., и), где х0, ..., хп — барицентри- ческие координаты относительно р0, Pi, Рп- Пример 2. Выпуклый многогранник, задаваемый линейными неравенствами 0 $ х, $ 1 (i = 1,..., и), где хь ...,хп — аффинные координаты относительно некоторого репера, называется п-мерным параллелепипедом. Определение 6. Точка р выпуклого множества М называется крайней, если она не является внутренней точкой никакого отрезка, целиком лежащего в М.
§ 3. Выпуклые множества 297 Теорема 3. Всякое ограниченное замкнутое выпуклое множе- ство М является выпуклой оболочкой множества Е(М) своих край- них точек. Доказательство. Положим М = conv Е (М). Очевидно, что М с М. Докажем индукцией по dim S, что М с М. При dim S = 0 доказывать нечего. Пусть dim S > 0 и р GМ. Докажем, что реМ. Будем считать, что М — тело, так как иначе можно применить предположение ин- дукции. Рассмотрим два случая. 1-й случай. Пусть р — граничная точка. Проведем через р опорную гиперплоскость Н. Тогда М ГУН — ограниченное замкну- тое выпуклое множество, и всякая его крайняя точка является в то же время крайней точкой множества М. По предположению индукции М ГУН является выпуклой оболочкой множества своих крайних точек. Следовательно, р еМ. 2-й случай. Пусть р — внутренняя точка. Проведем через р лю- бую прямую. В силу ограниченности множества М она пересекает его по некоторому отрезку qr, содержащему точку р. Точки q и г являются граничными точками тела М и по доказанному принадле- жат М. Следовательно, р G М. □ Теорема 4 (теорема Минковского—Вейля). Следующие свойст- ва ограниченного множества М aS равносильны: 1) М — выпуклый многогранник-, 2) М — выпуклая оболочка конечного числа точек. Доказательство. 1) Пусть т М=Г\Н+ (15) 1=1 — выпуклый многогранник. Докажем, что всякая его крайняя точ- ка есть единственная точка пересечения некоторых из гиперплос- костей Hf}, Отсюда будет следовать, что М имеет лишь ко- нечное число крайних точек. С другой стороны, по теореме 3 он является их выпуклой оболочкой. Пусть реМ — крайняя точка. Положим J = U:/;(p) = 0}c{l,...,m}, P = {xeS: fjM = Q при j g J}. Так как /(p) > 0 при i J, то р является внутренней точкой выпук- лого многогранника МГУР в пространстве Р. Но р — крайняя точка
298 Глава 7. Аффинные и проективные пространства множества М и, следовательно, — крайняя точка множества МПР. Это означает, что dim Р = 0, т. е. Р = {р}. 2) Пусть M = conv{pb ..., рк}. Будем считать, что aff M = S, и рас- смотрим выпуклый многогранник ( к 1 М* = {f: f (р,) 0 при i = 1,..к, £ /Cpf) = 1 f V 1=1 J в пространстве аффинно-линейных функций на S. Так как аффин- но-линейная функция на S однозначно определяется своими значе- ниями в точках рь..., рк, а для функций из М* эти значения при- надлежат отрезку [0,1], то М* — ограниченный многогранник. По доказанному он является выпуклой оболочкой конечного числа то- чек, скажем, f19..., fm. По теореме 2 множество М (очевидно, что оно замкнуто) может быть задано линейными неравенствами. Следовательно, M = {pGS:f(p)^0 V/GM*} = {pGS:/f(p) 0 при i = l, ...,m}. Таким образом, М — выпуклый многогранник. □ Определение 7. Гранью выпуклого многогранника М называет- ся всякое непустое пересечение этого многогранника с некоторым числом его опорных гиперплоскостей. (Сам многогранник М так- же считается своей гранью как пересечение с пустым множеством опорных гиперплоскостей.) Нульмерная грань называется вершиной, одномерная — ребром, (и - 1)-мерная (где и = dim aff М) — гипергранью. Пусть многогран- ник М задан формулой (15). Следующая теорема показывает, что для нахождения его граней можно ограничиться рассмотрением ги- перплоскостей Hf . Теорема 5. Всякая грань Г многогранника М имеет вид г=мп(Г|нД (16) где 7с{1, Доказательство. Пусть Г' — грань многогранника М. Положим 7 = {;:Г'сНЛ}С{1,...,гп}. Для каждого i ф J существует такая точка р, G Г', что fi(Pi) > 0. Пусть р — центр тяжести системы этих точек. Тогда /;(р)>0 при всех Определим теперь грань Г по формуле (16) и докажем, что Г' = Г. Ясно, что Г с Г и что точка р является внутренней точкой гра-
§ 3. Выпуклые множества 299 ни Г. Следовательно, всякая опорная гиперплоскость, проходящая через р, содержит Г. Значит, Г' = Г. □ Таким образом, если выпуклый многогранник задан системой линейных неравенств, то его грани получаются заменой части этих неравенств равенствами (но так, чтобы при этом получилось непу- стое множество). Нужно, однако, иметь в виду, что на определенной таким образом грани некоторые другие неравенства могут автома- тически обращаться в равенства. Пример 3. Грани п-мерного параллелепипеда, задаваемого нера- венствами 0 : $ 1 (i = 1,..., п), выделяются тем, что некоторые координаты равны 0 или 1. В частности, вершины — это точки, все координаты которых равны 0 или 1. Задача 2. Найти грани сечения п-мерного параллелепипеда 0 $ (£ = 1, ...,п) гиперплоскостью + ... + хп = п/2. Задача 3. Найти грани п-мерного симплекса. Задача 4. Доказать, что все грани многогранника сопу{рь ..., рк} являются выпуклыми оболочками некоторых из точек plf..., рк. Изучение комбинаторного строения выпуклых многогранников — это увлекательная и важная область математики. Вот два примера результатов из этой области. 1. Назовем /-вектором п-мерного ограниченного выпуклого многогран- ника последовательность (а0, а1?..., an_i), где ак — число /с-мерных граней этого многогранника. Каковы необходимые и достаточные условия для то- го, чтобы данная последовательность п натуральных чисел была /-векто- ром некоторого п-мерного многогранника? При п = 3 это следующие усло- вия (теорема Штейница): 2а 1 а0-а1+а2 = 2, 4^а0,а2^ “у- В общем случае ответ неизвестен. 2. Назовем вершины р и q выпуклого многогранника смежными, если отрезок pq является ребром этого многогранника. Легко видеть, что един- ственным трехмерным выпуклым многогранником, у которого любые две вершины смежны, является тетраэдр. Совершенно иная ситуация в 4-мер- ном пространстве. Как показал Д. Гейл, там существуют выпуклые много- гранники с любым числом вершин, у которых любые две вершины смеж- ные. Например, пусть М — выпуклая оболочка точек pi = (tl.t12(t13,t14), i = l, где tj,..., tN — различные вещественные числа. Тогда 1) каждая из точек р, является вершиной многогранника М (и это все его вершины: см. задачу 4);
300 Глава 7. Аффинные и проективные пространства 2) каждый из отрезков р(р; (i#J) является ребром многогранника М. Докажите это самостоятельно. Предложение 6. Крайние точки выпуклого многогранника М — это в точности его вершины. Доказательство. Если точка р является внутренней точкой от- резка, целиком лежащего в М, то любая опорная гиперплоскость, проходящая через р, содержит этот отрезок и, следовательно, р не может быть вершиной. Обратно, если точка р не является верши- ной, то она является внутренней точкой некоторой грани положи- тельной размерности и, значит, не может быть крайней точкой. □ Важнейшие применения выпуклых многогранников вне матема- тики связаны с линейным программированием. Основная задача ли- нейного программирования формулируется таким образом: найти максимум (минимум) заданной аффинно-линейной функции на за- данном выпуклом многограннике. Очевидно, что задача о миниму- ме функции f равносильна задаче о максимуме функции поэто- му можно говорить только об одной из этих задач. В основе линейного программирования лежит следующая Теорема 6. Максимум аффинно-линейной функции f на ограни- ченном выпуклом многограннике М достигается в одной из его вер- шин. Доказательство. Согласно теореме 3 и предложению 6, каждая точка р многогранника М представляется в виде выпуклой линей- ной комбинации его вершин ръ ..., pk: к к 1=1 i=l В силу предложения 2.3 к /(р) = L ^/(р,) max f(pi), 1=1 1 откуда и следует утверждение теоремы. □ Приведем два примера ситуаций, в которых возникает задача линейного программирования. Пример 4 (задача о получении максимальной прибыли). Неко- торое предприятие располагает ресурсами Рь ...,Рт в количестве blt..., bm соответственно и планирует произвести продукцию типов
§ 3. Выпуклые множества 301 Пь..., Пп в количестве хь ..., хп соответственно. Пусть — количе- ство ресурса Рн нужное для производства единицы продукции П;, и Cj — цена единицы продукции П;. Очевидно, что должны выпол- няться неравенства = 0 = 1,п). J=i Они задают некоторый выпуклый многогранник М в п-мерном про- странстве с координатами ...,хп. Для получения максимальной прибыли нужно выбрать точку (хъ xn) GM, в которой линейная п функция CjXj (цена произведенной продукции) максимальна. j=i Пример 5 (транспортная задача). Имеются поставщики Аь... ...,Ат, располагающие неким продуктом в количестве а1,...,ат соответственно, и потребители В1,...,Вп, которые должны полу- чить этот продукт в количестве b19...,bn соответственно, причем т п bj. Пусть Ху—количество продукта, которое предпола- i=i j=i гается доставить от А, к Bj, и — стоимость доставки единицы продукта от Aj к Bj. Должны выполняться усло- вия S хц = а1> Е *ц = bj, Xij Z 0. j=l i=l Они задают некоторый выпуклый мно- гогранник в гип-мерном пространстве с координатами х^ (i = 1, ...,т, j = = 1,..., и). Задача состоит в минимиза- ции линейной функции ^2 (общей ij стоимости перевозки) на этом много- граннике. Основной метод решения задачи линейного программирования, называемый симплекс-методом, состоит в движении по ребрам мно- гогранника М в направлении возрастания функции f до тех пор, пока это возможно. Движение заканчивается в одной из вершин, в которых достигается максимум функции f (см. рис. 10).
302 Глава 7. Аффинные и проективные пространства § 4. Евклидовы аффинные пространства Объединяя аксиоматику евклидова векторного пространства с аксиоматикой аффинного пространства, мы можем теперь ввести понятие, охватывающее всю элементарную геометрию. Определение 1. Аффинное пространство S, ассоциированное с евклидовым векторным пространством V, называется евклидовым аффинным пространством (или просто евклидовым пространст- вом, если ясно, о чем идет речь). Среди всех аффинных систем координат в евклидовом простран- стве выделяются системы координат, определяемые ортонормиро- ванными реперами. Они называются прямоугольными системами координат. Расстояние р между точками евклидова пространства определя- ется по формуле p(p,q) = lpql- Оно удовлетворяет аксиомам метрического пространства. В частно- сти, неравенство треугольника следует из неравенства (32) § 5.5 для длины суммы векторов. Нахождение расстояния от точки р е S до плоскости Р = р0 + U с помощью векторизации сводится к нахождению расстояния от вектора х = рор е V до подпространства U. А именно, пусть х = у + z, где у G U, z е I/1. Приняв точку р0 за начало отсчета, мы получаем по теореме 5.5.2: р(р,Р) = р(х, U) = |z|. Точка q = р0 + у является «основанием перпендикуляра, опущенно- го из точки р на плоскость Р». Задача 1. Доказать, что расстояние между плоскостями Pi = Pi + + иТ и Р2 = р2 + U2 евклидова пространства может быть найдено по формуле р(Л> Рг) = I°rtu,+(J2 PTPal- Определение 2. Движением евклидова аффинного пространст- ва S называется всякое его аффинное преобразование, дифферен- циал которого является ортогональным оператором. (В частности, отсюда следует, что всякое движение биективно.) Очевидно, что движение сохраняет расстояние между точками и, обратно, всякое аффинное преобразование, сохраняющее рассто- яние между точками, является движением.
§ 4. Евклидовы аффинные пространства 303 Замечание 1. На самом деле можно показать, что всякое биективное преобразование пространства S, сохраняющее расстояние между точками, автоматически является аффинным преобразованием и, следовательно, — движением. Движения евклидова пространства S образуют группу, обозна- чаемую IsomS. Движение называется собственным (или сохраняю- щим ориентацию), если его дифференциал принадлежит SO(V), и несобственным (или меняющим ориентацию) в противном случае. Собственные движения образуют подгруппу индекса 2 в Isom S, обо- значаемую Isom+ S (ср. пример 4.6.18). Пример 1. Важным примером несобственного движения являет- ся (ортогональное) отражение гн относительно гиперплоскости Н, Пусть е — единичный вектор, ортогональный Н. Всякую точку р G S можно единственным образом представить в виде p = q + Ae (qGH). По определению rHp = q —Ле (см. рис. 11). Дифференциал отражения гн есть (ортогональное) от- ражение относительно направляющего подпространства гиперплос- кости Н в пространстве V. Пусть НТ и Н2 — две гиперплоскости. Если они параллельны, то drH} —drH2 и, следовательно, d(rH/H2) = drH1-drH2 = <?.
304 Глава 7. Аффинные и проективные пространства В этом случае rH] гНг — параллельный перенос на удвоенный общий перпендикуляр гиперплоскостей Нг и Н2 (см. рис. 12). Если же Нг и Н2 пересекаются по (и-2)-мерной плоскости Р, то гН}гН2 — пово- рот вокруг Р на удвоенный угол между и Н2, т. е. движение, остав- ляющее на месте все точки плоскости Р и осуществляющее поворот на указанный угол в любой двумерной плоскости, ортогональной Р (ср. пример 6.3.4). Задача 2. Доказать, что группа Isom S порождается отражения- ми относительно гиперплоскостей. Если в пространстве S выбрано начало отсчета, то всякое движе- ние однозначно представляется в виде (13), где ipGO(V). Однако вектор Ь, вообще говоря, зависит от начала отсчета. Следующая теорема даст некое каноническое представление любого движения. Теорема 1. Для всякого движения f существует однозначно опре- деленная плоскость P = pQ + U со следующими свойствами: 1) плоскость Р инвариантна относительно f, причем f\P — па- раллельный перенос на некоторый вектор beU (быть может, нуле- вой); 2) оператор d = df не имеет ненулевых неподвижных векторов в U1. Доказательство. Если искомая плоскость Р существует, то опе- ратор л/ действует на ее направляющем подпространстве U тожде- ственно и, значит, U совпадает с подпространством неподвижных векторов этого оператора. Пусть, далее, q — любая точка. Предста- вим ее в виде q = р + с, где р еР, а се U1. Имеем: f (<?) = f (р) + = p + b + de = q + b + (de - с).
§ 4. Евклидовы аффинные пространства 305 Так как b G U, а л/с - с € [У1, то вектор лУс - с совпадает с ортого- нальной составляющей вектора q/(q) относительно подпространст- ва U. С другой стороны, так как оператор - € невырожден на СУ1, то вектор с однозначно определяется по вектору - с = (аУ — <£)с. Но, зная вектор с, мы можем найти точку р = q — с плоскости Р. Таким образом, если искомая плоскость существует, то она един- ственна. Проведенный анализ также показывает, как построить нужную плоскость. А именно, в качестве ее направляющего подпростран- ства возьмем подпространство U неподвижных векторов операто- ра а?/. Тогда будет выполнено условие 2). Далее, возьмем любую точ- ку q и рассмотрим вектор а = qf (q). Пусть а = b + d, где b G СУ, d G СУ1. Найдем такой вектор с е СУ1, что аУс - с = d. Положим р = q - с и рассмотрим плоскость Р = р 4- U. Проверим, что для нее выполнено условие 1). Имеем: /(р) = /(q) - = q 4- а - а/с = p4-c4-b4-d - аУс = р 4- b G Р и для любого и G U f(p + u) = f(p) 4- jzfu = p + b + u = (p + u) + b, что и требовалось доказать. □ Задача 3. Доказать, что плоскость Р есть совокупность точек, ко- торые при движении f перемещаются на наименьшее расстояние (равное длине вектора Ь). Плоскость Р называется осью движения f. Движение f определя- ется своей осью P = pQ + U, вектором b G U и ортогональным преоб- разованием 9$ = пространства I/1, не имеющим неподвижных векторов. Как следует из описания ортогональных преобразований, для собственных движений размерность dim СУ1 четна, а для несоб- ственных — нечетна. Пользуясь этой теоремой, опишем движения евклидовой пря- мой, плоскости и трехмерного пространства в терминах элементар- ной геометрии. Через Р будем обозначать ось движения /. Пусть f —движение евклидовой прямой. Возможны 2 случая. 1) dim Р = 1. В этом случае f — параллельный перенос. 2) dim Р = 0, т. е. Р — точка. В этом случае 9& = — € и f — отраже- ние (симметрия) относительно точки Р.
306 Глава 7. Аффинные и проективные пространства Пусть f — движение евклидовой плоскости. Возможны 3 случая. 1) dim Р = 2. В этом случае f — параллельный перенос. 2) dim? = 1, т.е. Р — прямая. В этом случае = -<£ и f — отражение относительно прямой Р или скользящее отражение, т. е. композиция отражения относительно Р и параллельного пере- носа вдоль Р. 3) dim Р = 0, т. е. Р — точка. В этом случае f — (нетривиальный) поворот вокруг точки Р. Пусть, наконец, f — движение трехмерного евклидова простран- ства. Возможны 4 случая. 1) dim Р = 3. В этом случае f — параллельный перенос. 2) dim Р = 2. В этом случае f — отражение относительно плоско- сти Р или скользящее отражение, т. е. композиция отражения отно- сительно Р и параллельного переноса на вектор, параллельный Р. 3) dimP = 1. В этом случае f — (нетривиальный) поворот во- круг прямой Р или винтовое движение, т. е. композиция поворота вокруг Р и параллельного переноса вдоль Р. 4) dim Р = 0. В этом случае f — зеркальный поворот, т. е. компо- зиция (нетривиального) поворота вокруг некоторой прямой и от- ражения относительно плоскости, перпендикулярной этой прямой; при этом указанные прямая и плоскость пересекаются в точке Р. Пример 2. Обозначим через sp a поворот в евклидовой плоско- сти на угол а вокруг точки р. Его дифференциал есть, очевидно, поворот на тот же угол в соответствующем векторном простран- стве. Рассмотрим произведение sp asq p поворотов вокруг разных точек. Вычисляя его дифференциал, мы находим, что оно представ- ляет собой поворот на угол а + /3 вокруг некоторой третьей точки, если только этот угол не кратен 2я (и параллельный перенос — в противном случае). Для того чтобы найти центр поворота, можно воспользоваться следующим предложением. Предложение 1. Пусть pqr — треугольник с углами а, /3, у (см. рис. 13). Тогда Sp,2a sq,2fi sr,2у = Доказательство. Обозначим через I, т, п прямые, содержащие стороны qr, гр, pq треугольника, и через rb гт, гп — отражения отно- сительно этих прямых. Тогда (см. пример 6.3.4) $р,2а~гтгп> sq,2fi~rnrb 5r,2y ’~~ откуда перемножением получается доказываемое равенство. □
§ 4. Евклидовы аффинные пространства 307 Задача 4. Пользуясь доказанным предложением, указать способ построения центра поворота sp a sqp из примера 2. Для любой фигуры М евклидова пространства S можно опреде- лить ее группу симметрии SymM = {/GIsomS: /(М) = М}. Таким образом возникают, например, кристаллографические груп- пы как группы симметрии кристаллических структур. Отметим, что если группа Sym М содержит несобственные дви- жения, то группа Sym+ М = {/ G Isom+ S: /(М) = М} является ее подгруппой индекса 2 как ядро гомоморфизма SymM->{±l}, f •-> det df. Если M — ограниченный выпуклый многогранник, то группа Sym М конечна, так как движение, отображающее многогранник М на себя, однозначно определяется тем, как оно переставляет его вершины, а таких перестановок может быть лишь конечное число. Кроме того, группа SymM сохраняет центр тяжести множества вершин многогранника М и потому фактически представляет собой подгруппу ортогональной группы. Наиболее симметричны так называемые правильные многогран- ники. Пусть М — телесный выпуклый многогранник в п-мерном евкли- довом пространстве. Назовем флагом многогранника М набор его граней {F0,Flf ..^F^}, где dimFfc = k и Foс ... cFn_P
308 Глава 7. Аффинные и проективные пространства Определение 3. Выпуклый многогранник М называется пра- вильным, если для любых двух его флагов существует движение /GSym М, переводящее первый из этих флагов во второй. Так как движение f е Sym М, очевидно, определяется тем, куда оно переводит какой-нибудь один флаг, то порядок группы симмет- рии правильного многогранника равен числу его флагов. Двумерные правильные многогранники — это обычные правиль- ные многоугольники. Их группы симметрии были описаны в приме- ре 4.1.11. Трехмерные правильные многогранники — это платоновы тела, т. е. правильный тетраэдр Т, куб К, октаэдр О, додекаэдр D и икоса- эдр I. (См. рис. 6 §4.5.) Куб и октаэдр, а также додекаэдр и икоса- эдр — это так называемые двойственные правильные многогранни- ки, имеющие одинаковые группы симметрии, так как центры гра- ней одного из двойственных многогранников являются вершинами другого. (Тетраэдр двойствен сам себе.) Согласно предыдущему, порядок группы симметрии Sym Р трех- мерного правильного многогранника Р равен числу его флагов, т. е. |Sym Р| = (число вершин) х х (число ребер, выходящих из каждой вершины) х 2. Следовательно, |Sym Т\ = 24, |Sym К\ = |Sym О| = 48, |Sym D\ = |Sym I\ = 120. Группа Sym+ P имеет вдвое меньший порядок. Она состоит из поворотов вокруг прямых, проходящих через центр многогранни- ка Р и через его граничную точку, которая является либо вершиной, либо серединой ребра, либо центром грани. Задача 5. Перечислить все элементы группы симметрии куба. В рамках группового подхода аналогично евклидовой геометрии столь же просто определяется псевдоевклидова геометрия. Вещественное векторное пространство, в котором фиксирована симметрическая билинейная функция а сигнатуры (k, I), где k, I > 0, к + I = п = dim V, называется псевдоевклидовым векторным прост- ранством сигнатуры (к, /)• Группа линейных преобразований прост- ранства V, сохраняющих функцию а, называется псевдоортогональ- ной группой и обозначается О(У, а). Соответствующая ей группа матриц в базисе, в котором а имеет нормальный вид, обозначает- ся okil.
§ 5. Квадрики 309 Аффинное пространство S, ассоциированное с псевдоевклидо- вым векторным пространством V, называется псевдоевклидовым аффинным пространством соответствующей сигнатуры, а группа Isom S = d"1(O(V, а)) — группой его движений. Геометрия, опреде- ляемая этой группой, и есть псевдоевклидова геометрия. Пространство-время специальной теории относительности — это псевдоевклидово аффинное пространство сигнатуры (3,1). Оно называется пространством Минковского, а группа его движений — группой Пуанкаре. (Соответствующая группа псевдоортогональных преобразований называется группой Лоренца.) Задача 6. Описать группу О1Р (Указание: использовать систему координат, в которой соответствующая квадратичная функция име- ет вид q(x)=xTx2.) Задача 7. Сформулировать и доказать «третий признак равен- ства треугольников» на псевдоевклидовой плоскости. § 5. Квадрики Простейшими объектами аффинной и евклидовой геометрий яв- ляются плоскости, которые, как мы знаем, задаются системами ли- нейных уравнений. Естественным обобщением плоскостей (назы- ваемых также линейными многообразиями) являются так называе- мые алгебраические многообразия — подмножества аффинного про- странства, задаваемые произвольными системами алгебраических уравнений. Их изучением занимается алгебраическая геометрия. Это обширный раздел математики, который не может быть пред- ставлен в настоящем курсе. Мы лишь слегка коснемся некоторых об- щих вопросов алгебраической геометрии в гл. 9, а в этом параграфе рассмотрим простейший после плоскостей тип алгебраических мно- гообразий — квадрики, задаваемые одним алгебраическим уравне- нием второй степени. К их числу относятся такие объекты элемен- тарной геометрии, как окружности и сферы. Будем считать, что char К / 2. Определение 1. Аффинно-квадратичной функцией на аффин- ном пространстве S называется всякая функция Q: S —> К, имеющая в векторизованной форме вид Q(x)=q(x)+!(x)+c, (17)
310 Глава 7. Аффинные и проективные пространства где q — квадратичная функция, I — линейная функция, ас — кон- станта. Пусть q— поляризация квадратичной функции q, т. е. соответ- ствующая ей симметрическая билинейная функция. Лемма 1. При переносе начала отсчета о в точку о' = о + а (a G V) слагаемые выражения (17) преобразуются следующим обра- зом: q'M=q (х), V (х) = 2q (а, х) +1 (х), с! = q (а) +1 (а) + с. (18) Доказательство. Имеем Q(o' + x) = Q(o + a + x) = q(a + x) + !(a + x) + с = = q(a) + 2q(a, х)+q(x)+Z(a)+ I(x)+ с = = q (x) + (2q (a, x) +1 (x)) + (q (a) 4-1 (a) 4- c). □ В частности, квадратичная функция q не зависит от выбора на- чала отсчета. В координатах выражение (17) принимает вид Q(x) = Sao^+Ebixi + c (ау = ар). i>j i Коэффициентам bt и с можно придать следующий смысл: c = Q(o), b, = §(o). (20) Линейная функция !(x) = Sbi*i i называется дифференциалом функции Q в точке о и обозначается d0Q. В случае К = R это согласуется с обычным определением диф- ференциала. Определение 2. Точка о называется центром аффинно-квадра- тичной функции Q, если Q(o4-x) = Q(o-x) VxgV. (21) Ясно, что это имеет место тогда и только тогда, когда d0Q = 0. Поэтому множество всех центров функции Q задается системой ли- нейных уравнений
§ 5. Квадрики 311 Оно либо является плоскостью некоторого числа измерений, либо пусто. Легко видеть, что матрица коэффициентов системы (22) — это удвоенная матрица (а^) квадратичной функции q. Следователь- но, если q невырожденна, то Q имеет единственный центр. Положим X(Q) = {peS:Q(p) = 0}. Определение 3. Множество вида X(Q), где Q — аффинно-квад- ратичная функция, если только оно не пусто и не является плоско- стью, называется квадрикой или гиперповерхностью второго поряд- ка. Квадрика на плоскости называется коникой или кривой второго порядка. Квадрика в трехмерном пространстве называется также поверхностью второго порядка. Определение 4. Точка о называется центром квадрики, если эта квадрика симметрична относительно о, т.е. вместе со всякой точкой о + х (х G V) содержит точку о - х. Центр квадрики, лежащий на ней самой, называется ее вершиной. Квадрика называется центральной, если она имеет (хотя бы один) центр. Очевидно, что всякий центр аффинно-квадратичной функции Q является центром квадрики X(Q). Как будет показано ниже, верно и обратное. Докажем некоторые простые геометрические свойства квадрик. Предложение 1. Любая прямая либо целиком лежит на квадри- ке, либо пересекается с ней не более чем в двух точках. Доказательство. Так как начало отсчета о может быть выбра- но в любой точке, то без ограничения общности можно считать, что прямая проходит через о. Пусть функция Q в векторизован- ной форме имеет вид (17). Тогда пересечение прямой L = о + (х) = = {о + tx: t G К} (х G V) с квадрикой X(Q) определяется условием Q (tx) = t2q (х) + tl (х) + с = 0, (23) представляющим собой квадратное уравнение относительно t. Если все коэффициенты этого уравнения равны нулю, то L с X(Q); в про- тивном случае оно имеет не более двух корней, а это означает, что пересечение L А X (Q) содержит не более двух точек. □ Предложение 2. Если о — вершина квадрики X, то вместе с лю- бой точкой р^о квадрика X содержит всю прямую ор.
312 Глава 7. АффиннМе и проективные пространства Доказательство. Пусть р = о + х (х е V); тогда X содержит три различные точки о, о + х, о - х прямой ор и, следовательно, — всю прямую. □ Всякое подмножество аффинного пространства, содержащее точ- ку о и вместе с любой точкой р^о всю прямую ор, называется ко- нусом с вершиной в точке о. Квадрика называется конической, если она имеет (хотя бы одну) вершину. Предложение 3. Всякая квадрика содержит точку, не являющу- юся ее вершиной. Доказательство. Если бы все точки квадрики были ее верши- нами, то в силу предложения 2 вместе с любыми двумя точками она содержала бы проходящую через них прямую и, согласно тео- реме 1.3, была бы плоскостью, а это противоречит определению квадрики. □ Очевидно, что пропорциональные аффинно-квадратичные функ- ции определяют одну и ту же квадрику. Обратное утверждение не столь очевидно; оно составляет содержание следующей теоремы. Теорема 1. Пусть X — квадрика в аффинном пространстве над бесконечным полем К. Если X = X(Q1) = X(Q2) для каких-то аффин- но-квадратичных функций Q1? Q2, то эти функции пропорциональ- ны. Доказательство. Возьмем в качестве начала отсчета какую-ни- будь точку о квадрики X, не являющуюся ее вершиной. Тогда в век- торизованной форме Qi (х) = qi(x) + ^(х), Q2(x) = q2 (х) +12 (х), где 11г 12 / 0. Точки пересечения прямой {о + tx: t е К} с квадри- кой X определяются любым из уравнений t2qi (х) + г/г(х) = 0, t2q2(x) + Н2(х) = 0. Так как эти уравнения должны иметь одинаковые решения (относи- тельно г), то при 1г (х), 12(х) # 0 мы получаем 41 (х) _ Q2M li(x) 12(х)’ откуда q i (х) l2 (х) = q2(x) Ц (х). (24) Применяя следствие теоремы 3.7.1, получаем, что это равенство вер- но при всех х.
§ 5. Квадрики 313 Предположим, что линейные функции и 12 не пропорциональ- ны. Тогда в подходящем базисе (х) = хь 12М = х2 и равенство (24) записывается в виде q1(x)x2 = q2(x)x1. Рассматривая члены в левой и правой частях этого равенства, мы видим, что должно быть q2 (х) = I (х)хъ q2(x) = I (х)х2, где Z (х) — какая-то линейная функция, и, значит, Qi(x) = (/(х) + 1)хь Q2(x) = (Z (х) + 1)х2. Так как X = X(Qi), то X содержит гиперплоскость Xj = 0. Так как в то же время X = X(Q2), то функция Q2 должна тождественно обращать- ся в нуль на этой гиперплоскости. Однако ни один из ее множителей Z(x) +1 и х2 не обращается на ней тождественно в нуль (первый из них не обращается в нуль уже в точке о). Поскольку в алгебре многочленов нет делителей нуля, мы тем самым приходим к проти- воречию. Итак, 12 = Л/1 (ЛеХ*). Из (24) получаем тогда, что и q2 = Лд2, и, значит, Q2 = AQp □ Следствие 1. Всякий центр квадрики X(Q) является также цен- тром функции Q. Доказательство. Если о — центр квадрики X (Q), то X (Q)=X (Q), где Q(o + x) = Q(o-x). Следовательно, Q = AQ (ЛеХ*). Сравнивая члены второй степени в выражениях Q и Q, мы видим, что должно быть Л = 1, т. е. Q = Q, а это и означает, что о — центр функции Q. □ Следствие 2. Если квадрика X(Q) инвариантна относительно некоторого параллельного переноса, то и функция Q инвариантна относительно этого переноса. Доказательство. Если квадрика X(Q) переходит в себя при па- раллельном переносе на вектор а, то X(Q) = X(Q), где Q(p) = Q(p + a). Далее рассуждаем так же, как в доказательстве следствия 1. □
314 Глава 7. Аффинные и проективные пространства Замечание 1. Анализ приведенного выше доказательства теоремы 1 с учетом замечания 3.7.2 показывает, что она верна и для конечных полей, исключая только поле Z3. (Напомним, что мы считаем, что char К /2.) Над полем Z3 можно привести следующий контрпример: уравнения + 1 = 0их2 + *1х2 + 1 = 0 задают одну и ту же конику в Z^, состоящую из точек (1,1)и(—1,-1). Однако оба следствия теоремы верны и для поля Z3. Пусть аффинно-квадратичная функция Q представлена в векто- ризованной форме выражением (17). Положим KerQ = KerqnKer! (25) (где Kerq = Kerq). Предложение 4. Функция Q инвариантна относительно па- раллельного переноса на вектор а тогда и только тогда, когда a G Ker Q. В частности, отсюда следует, что Ker q П Ker I не зависит от выбо- ра начала отсчета. Доказательство. Инвариантность функции Q относительно па- раллельного переноса на вектор а равносильна тому, что она со- храняет свой вид при переносе начала отсчета из точки о в точку о' = о + а. Ввиду леммы 1 это происходит тогда и только тогда, когда aeKerQ. □ Таким образом, если U = Ker Q / 0, то квадрика X = X (Q) вместе с каждой точкой р содержит целую плоскость р + U. Такая квадрика называется цилиндрической с направляющим подпространством U. Выберем базис пространства V таким образом, чтобы последние d его векторов составляли базис подпространства U. Тогда выраже- ние Q не будет содержать последних d координат. Пусть So с S — любая плоскость, направляющее подпространство которой натяну- то на первые п - d базисных векторов, и Хо — квадрика, задава- емая в So уравнением Q = 0 (т. е. Хо = X П So). Тогда X = Хо + U (см. рис. 14). Квадрика, не являющаяся цилиндрической, называется невырож- денной. Ввиду сказанного выше описание всех квадрик сводится к описанию невырожденных квадрик. Предложение 5. Невырожденная квадрика имеет не более одно- го центра. Доказательство. Пусть о и о' — два центра квадрики X. Обо- значим через s и s' центральные симметрии относительно оно' соответственно. Тогда sX = s'X = Х и, следовательно, ss'X = X. Так
§ 5. Квадрики 315 Рис. 14 как d(ss/) = ds-ds/=(-<?)2 = <§’) то $$' — (нетривиальный) параллельный перенос и, значит, квадри- ка X цилиндрическая. □ Нецилиндрические квадрики можно разбить на три типа. I. Неконические центральные квадрики. Выбрав начало отсчета в центре квадрики и умножив ее уравнение на подходящее число, мы приведем его к виду q(x1} ...,хп) = 1, (26) где q — невырожденная квадратичная функция. II. Конические квадрики. Выбрав начало отсчета в вершине квадрики, мы приведем ее уравнение к виду q(x1,...,xn) = 0, (27) где q — невырожденная квадратичная функция. При этом у нас еще остается возможность умножить уравнение на любое число Л 0. III. Нецентральные квадрики. Так как Kerq Г) Кег/= 0, но Ker q И 0 (иначе квадрика была бы центральной), то dim Ker q = 1 и V = Кег /ф Kerq. (28) Выбрав начало отсчета на квадрике и базис пространства V, согла- сованный с разложением (28), мы приведем уравнение квадрики
316 Глава 7. Аффинные и проективные пространства к виду u(xb ...,хп_1)=хп, (29) где и = q 1кег z — невырожденная квадратичная функция от п - 1 пе- ременных. При этом остается возможность умножить уравнение на любое число Л 0 0, одновременно разделив на Л последний базис- ный вектор. Возможности дальнейшего упрощения уравнения квадрики за счет выбора подходящего базиса в пространстве V зависят от поля К (см. §5.4). При К = С или R мы можем привести квадратичную функцию q к нормальному виду. Рассмотрим более подробно случай К = R. В этом случае урав- нение невырожденной квадрики может быть приведено к одному и только одному из следующих видов: I. Неконические центральные квадрики: х* + ... + х£-х£+1-...-х2 = 1 (0<к$п). (30) II. Конические квадрики: x2 + ... + x2-x2+1-...-x2 = 0 (|ck<n). (31) (Неравенство к достигается за счет возможного умножения уравнения на -1.) III. Нецентральные квадрики: х2 + ... + х2-х2+1-...-х2_1 = хп (^sSk<n). (32) Полученный результат можно интерпретировать как классифи- кацию вещественных квадрик с точностью до аффинных преобра- зований. В самом деле, если квадрики Х} и Х2 задаются одним и тем же уравнением в аффинных системах координат, связанных с реперами {о;еъ ...,еп} и {о';вр ...,е^} соответственно, то Хг пе- реводится в Х2 аффинным преобразованием, переводящим репер {о;еъ ...,еп} в репер {o';e'p ...,е'п}. Обратно, если квадрика Xi пе- реводится в квадрику Х2 аффинным преобразованием /, то Хг и Х2 задаются одним и тем же уравнением в аффинных системах коор- динат, связанных с реперами {о; еь..., еп} и {/(о); dftej,..., d/(en)} соответственно.
§ 5. Квадрики 317 Пара пересекающихся прямых Рис. 15 В частности, при и = 2 и 3 получаются хорошо известные классы вещественных кривых и поверхностей второго порядка, перечислен- ные в табл. 1 и представленные на рис. 15 и 16 соответственно. Таблица 1 п Тип к Название 2 I 2 эллипс 1 гипербола II 1 пара пересекающихся прямых III 1 парабола 3 I 3 эллипсоид 2 однополостный гиперболоид 1 двуполостный гиперболоид II 2 квадратичный конус III 2 эллиптический параболоид 1 гиперболический параболоид
318 Глава 7. Аффинные и проективные пространства Однополостный гиперболоид Конус Гиперболический параболоид Двуполостный гиперболоид Рис. 16
§ 5. Квадрики 319 В произвольной размерности квадрики типа I при к = п назы- ваются эллипсоидами, а при к < п — гиперболоидами; квадрики типа II называются квадратичными конусами; квадрики типа III при k = п — 1 называются эллиптическими параболоидами, а при k < п — 1 — гиперболическими параболоидами. Вещественная квадрика X является гладкой гиперповерхностью (см. определение в § 12.1) в окрестности точки р G X тогда и толь- ко тогда, когда dpQ/O, т.е. когда р не является вершиной; при этом уравнение dpQ(x — р) = 0 задает касательную гиперплоскость квадрики X в точке р. В частности, неконические квадрики гладки всюду. Замечательным свойством вещественных (и комплексных) квад- рик, которым, вообще говоря, не обладают гиперповерхности боль- ших порядков, является высокая степень их аффинной симметрии. Пусть X — вещественная квадрика. Обозначим через G(X) груп- пу всех аффинных преобразований, отображающих X на себя. Теорема 2. Если X — неконическая квадрика, то группа G(X) транзитивно действует на X; если X — коническая квадрика, то группа G(X) транзитивно действует на дополнении к множеству вершин в X. Доказательство. Если X — цилиндрическая квадрика с направ- ляющим подпространством U, то группа G(X) содержит группу параллельных переносов на векторы из U, которая транзитивно действует на любой плоскости вида р + U. Поэтому доказательство теоремы в этом случае сводится к ее доказательству для невырож- денной квадрики Хо в пространстве меньшей размерности (см. обо- значение выше). Пусть X — эллипсоид, задаваемый в векторизованной форме уравнением q(x) = 1, где q — положительно определенная квадра- тичная функция. Превратим пространство V в евклидово, приняв за скалярное умножение поляризацию квадратичной функции q. Тогда X будет единичной сферой в этом пространстве, а группа G(X) будет, во всяком случае, содержать ортогональную группу O(V). (На самом деле она будет с ней совпадать, но нам это не нужно.) Пусть х, х' —любые векторы из X; тогда V = {х} Ф (х)1 = {х') Ф (х')1. Рассмотрим линейное преобразование е GL(V), переводящее х в х' и отображающее подпространство (х)1 на (х')1 таким образом,
320 Глава 7. Аффинные и проективные пространства чтобы это был изоморфизм евклидовых пространств. Очевидно, что (/? gO(V), и по построению ip(x)=x'. Случай, когда X — гиперболоид, разбирается аналогично, с той разницей, что, взяв за скалярное умножение поляризацию квадра- тичной функции q, мы превратим V не в евклидово, а в псевдо- евклидово пространство некоторой сигнатуры (k, I) (где к +1 = и). Подпространства (х)1 и (х')1 в этом случае будут псевдоевклидо- выми пространствами сигнатуры (к — 1,1) и, следовательно, будут изоморфны. Пусть теперь X — квадратичный конус, задаваемый в вектори- зованной форме уравнением q(x) = 0, где q — квадратичная функ- ция сигнатуры (kJ) (где к + 1 = п). Превратим, как и выше, про- странство V в псевдоевклидово. Для любого ненулевого вектора х G X существует такой вектор у G V, что (х, у) 0 0. Нормировав вектор у, можно считать, что (х, у) = 1. Далее, не нарушая этого равенства, можно заменить у на у - (у, у)х и тем самым добиться, чтобы (у, у) = 0. Тогда в двумерном подпространстве (х, у) скаляр- ное умножение будет иметь матрицу К 0 I и, значит, будет невы- рожденным сигнатуры (1,1). Отсюда следует, что V = (^,У>Ф(х,у)1, где (х, у)1— псевдоевклидово (или евклидово) пространство сиг- натуры (k — 1J — 1). Проделав такие же построения для другого ненулевого вектора х' G X, мы получим аналогичное разложение У = (х', у')Ф(х', у')1. Рассмотрим линейное преобразование G GL(V), переводящее х в х', у в у1 и отображающее подпространство (х, у)1 на (х', у')1 таким образом, чтобы это был изоморфизм псевдоевклидовых про- странств. Тогда G O(V, q) С G(X), и по построению </?(х) =х'. Пусть, наконец, X — параболоид, задаваемый в векторизован- ной форме уравнением (29). Всякий вектор xg V будем представ- лять в виде х = у + te, где у G Ker Z, t G R, а е — базисный вектор под- пространства Ker q, так что х G X тогда и только тогда, когда и (у) = Г. Для любого a G Ker I рассмотрим аффинное преобразование fa- y + te^y + a + (t + 2u(a,y) + u(a))e.
§ 5. Квадрики 321 Если u(y) = Г, то и (у + а) = t + 2п(а, у) 4- и(а), и обратно. Это означает, что fa gG(X). Очевидно, что преобразо- вания fa (aGKer?) образуют группу, транзитивно действующую на X. □ Задача 1. Доказать, что если X — параболоид, задаваемый урав- нением (29), то группа G(X) транзитивно действует в области u(Xj, Хп_j) < хп. С каждым параболоидом X = X(Q) каноническим образом связа- но одномерное подпространство Ker q С V, называемое особым, на- правлением параболоида X, Так как Ker q Ker I при любом выборе начала отсчета, то при х е Ker q уравнение (23) имеет ровно одно решение. Следовательно, любая прямая особого направления пере- секает параболоид ровно в одной точке; бо- лее того, это пересечение по той же при- чине трансверсально (см. рис. 17). Задача 2. Доказать, что для любого неособого направления параболоида X су- ществует прямая этого направления, кото- рая не пересекает X. Посмотрим теперь, к какому виду мож- но привести уравнение квадрики в ев- клидовом пространстве, если ог- раничиться прямоугольными системами ко- ординат. Как и в аффинной геометрии, задача сводится к случаю невырожденных квадрик. Рассмотрим, как и выше, три типа таких квадрик. I. Неконические центральные квадрики. Из теоремы о приведении квадратичной функции к главным осям (следствие 2 теоремы 6.3.1) следует, что уравнение такой квадрики в прямоуголь- ной системе координат может быть приведено к виду ^ + ... + ^ = 1 (Ai,...,An/0). (33) Числа Аь ...,АП определены однозначно с точностью до переста- новки. II. Конические квадрики. Уравнение такой квадрики в пря- моугольной системе координат может быть приведено к виду A^J+ ... + Апх„=О (Аг,...,Ап/О). (34)
322 Глава 7. Аффинные и проективные пространства Числа А1?..., Ап определены однозначно с точностью до перестанов- ки и одновременного умножения на число А / 0. III. Нецентральные квадрики (параболоиды). Выбрав на- чало отсчета произвольно и приведя квадратичную функцию q к главным осям, мы получим прямоугольную систему координат, в которой уравнение параболоида будет иметь вид A1x* + ... + An_1x2_1+b1x1 + ... + bn_iXn_i + bnxn + c = 0 (Aj, An_j, bn / 0). За счет переноса начала отсчета по координатам х1?..., хп_х можно убрать линейные члены, содержащие эти координаты. (При этом, вообще говоря, изменится свободный член.) После этого за счет переноса начала отсчета по координате хп можно убрать свободный член. Наконец, умножив уравнение на подходящее число, можно привести его к виду AjX^ +... + An_jX^_j = хп (Aj,An_j/O). (35) Покажем, что начало отсчета, при котором уравнение парабо- лоида приводится к виду (35), определено однозначно. Для этого охарактеризуем его в инвариантных терминах. Пусть {о; е1г..., еп} — репер, в котором уравнение параболоида имеет вид (35). Тогда особое направление этого параболоида есть (еп), а его касательная гиперплоскость в точке о задается уравне- нием хп = 0. Следовательно, если базис {е1э..., еп} ортонормирован- ный, то касательная гиперплоскость параболоида в точке о орто- гональна особому направлению. Такая точка называется вершиной параболоида (хотя это и не согласуется с определением 4), а прохо- дящая через нее прямая особого направления — осью параболоида. Подчеркнем, что эти определения имеют смысл лишь применитель- но к параболоидам в евклидовом пространстве. Предложение 6. Всякий параболоид в евклидовом пространстве имеет единственную вершину. (См. рис. 17, где вершиной изображенной там параболы является точка о.) Доказательство. Пусть р — точка параболоида с координатами х1?..., хп. Дифференцируя уравнение (35), находим, что координаты нормального вектора параболоида в точке р суть 2А1х1,..., 2An_1xn_1, —1.
§ 6. Проективные пространства 323 Для того чтобы точка р была вершиной параболоида, необходимо и достаточно, чтобы этот вектор был пропорционален еп, а это име- ет место тогда и только тогда, когда =... = хп-1 = 0, т. е. р = о. □ Следствие. Коэффициенты в уравнении (35) опреде- лены однозначно с точностью до перестановки и одновременного умножения на -1. Доказательство. Как мы показали, начало отсчета, при котором уравнение параболоида приводится к виду (35), определено одно- значно. Вектор еп как единичный вектор особого направления опре- делен однозначно с точностью до умножения на -1, приводящего к умножению на —1 левой части уравнения (35). Если вектор еп фик- сирован, то мы уже не можем умножить уравнение на число Л 01, не изменив его правой части; но тогда числа Л1?..., An_j определе- ны однозначно с точностью до перестановки как собственные значе- ния симметрического оператора, соответствующего квадратичной функции q. □ Аналогично тому, как это было сделано выше применительно к аффинной классификации квадрик, полученные результаты мож- но интерпретировать как классификацию квадрик в евклидовом пространстве с точностью до движений. § 6. Проективные пространства На фотографическом снимке или (реалистическом) рисунке плоской местности изображения параллельных прямых, вообще го- воря, пересекаются, а изображения равных отрезков одной прямой, вообще говоря, не равны (см. рис. 18 на следующей странице). Это говорит о том, что отображение местности на плоскость снимка или рисунка не является аффинным. То же самое можно сказать и об изображении на сетчатке нашего глаза. Во всех этих случаях мы имеем дело с центральным проектированием. Еще одним житейским примером центрального проектирования может служить световое пятно на полу от лампы с круглым абажу- ром. Когда абажур направлен вертикально вниз, то граница этого пятна имеет форму окружности, как и край самого абажура. Но когда мы начинаем поворачивать абажур вокруг горизонтальной оси, эта окружность превращается в эллипс, который, вытягиваясь все больше и больше, в какой-то момент, когда его дальний край
324 Глава 7. Аффинные и проективные пространства Рис. 18. Гравюра Летнего сада А. Зубова. (Воспроизводится по книге: Вергунов А. П., Горохов В. А. Русские сады и парки. М.: Наука, 1988.) уходит в бесконечность, превращается в параболу. Когда мы продол- жаем поворачивать абажур, парабола «раскрывается», превращаясь в ветвь гиперболы, и если бы мы приставили точно такой же абажур с противоположной стороны лампы, мы увидели бы другую ветвь этой гиперболы. Таким образом, край абажура проектируется на пол то в виде эллипса, то в виде параболы, то в виде гиперболы. Отметим еще одно обстоятельство. На рисунке плоской местно- сти изображения параллельных прямых пересекаются в точке, ко- торая не имеет прообраза на местности (иначе прямые не были бы параллельны). С другой стороны, в тот момент, когда граница светового пятна от лампы с абажуром превращается в параболу, изображение самой высокой точки края абажура исчезает, уходя в бесконечность. Таким образом, мало того, что центральное проек- тирование не является аффинным отображением, оно вдобавок не сюръективно и не всюду определено.
§ 6. Проективные пространства 325 Для изучения центрального проектирования удобно рассмот- реть множество, называемое проективной плоскостью, «точками» которого являются прямые, проходящие через центр проектиро- вания, а пересечения этих прямых с плоскостью проектирования считать изображениями соответствующих «точек». При этом «точ- ки», соответствующие прямым, параллельным выбранной плоско- сти проектирования, не получают никакого изображения. (Но они будут иметь изображение при другом выборе плоскости проекти- рования). Они называются «бесконечно удаленными точками» по отношению к данной плоскости проектирования. Далее, множество «точек», соответствующих прямым, лежащим в какой-либо плоскости, проходящей через центр проектирования, естественно называть «прямой» проективной плоскости. На плоско- сти проектирования такая «прямая», за вычетом ее «бесконечно уда- ленной точки», изображается в виде обычной прямой. Единствен- ным исключением является «прямая», соответствующая плоскости, параллельной плоскости проектирования. Она целиком состоит из «бесконечно удаленных точек» и не получает никакого изображе- ния. Эта «прямая» называется «бесконечно удаленной прямой» по отношению к данной плоскости проектирования. Описанную конструкцию можно интерпретировать как добавле- ние к аффинной плоскости «бесконечно удаленных точек», составля- ющих «бесконечно удаленную прямую». При этом к каждой прямой из пучка параллельных прямых аффинной плоскости добавляется одна и та же «бесконечно удаленная точка». В построенной таким образом «плоскости» любые две прямые пересекаются. Важно, однако, отметить, что все «точки» и «прямые» проектив- ной плоскости равноправны. Понятие бесконечной удаленности от- носительно: оно зависит от выбора плоскости проектирования. Обобщая эти идеи на произвольную размерность и произволь- ное поле, мы приходим к следующим определениям. Определение 1. Множество одномерных подпространств (п+За- мерного векторного пространства V над полем К называется п-мер- ным проективным пространством над К и обозначается PV. Для всякого (к 4- 1)-мерного подпространства U с V подмножество PU с CPV называется к-мерной плоскостью пространства PV. В частности, нульмерные плоскости — это точки пространст- ва PV; одномерные плоскости называются прямыми, (п - 1)-мер- ные — гиперплоскостями.
326 Глава 7. Аффинные и проективные пространства Очевидно, что пересечение плоскостей, если только оно не пусто, также является плоскостью. Пространство РКп+1, построенное указанным образом по про- странству строк Кп+1, обозначается также КР\ Для всякого ненулевого вектора х € V мы будем обозначать че- рез х одномерное подпространство (х), рассматриваемое как точка пространства PV. Пусть S — какая-либо гиперплоскость пространства V, не прохо- дящая через нуль, и Vs — ее направляющее подпространство. Опре- делим отображение (^s:PV\PVs-S, ставящее в соответствие каждой точке х G PV \ PVS (х G V \ Vs) точку пересечения прямой {х) с S (см. рис. 19). Определение 2. Гиперплоскость {х). S вместе с отображением ips назы- у____________/ вается аффинной картой пространст- Vs (*) z^^Z^ ва РV. Точки гиперплоскости PVS про- ________/ s' странства PV называются бесконечно удаленными по отношению к аффин- zz~7 -—у ной карте S. >z z>q ^z Замечание 1. Термин «аффинная —7Z—___________/ карта» вполне согласуется с обычным рис употреблением слова «карта». Точ- но так же как географическая карта представляет собой отображение части земной поверхности на лист бумаги, аффинная карта представляет собой отображение части проективного пространства на аффинное пространство. Замечание 2. Отождествляя точки проективного пространства с их изображениями на аффинной карте, мы иногда будем говорить об аффинной карте как о части проективного пространства. Имея это в виду, можно сказать, что проективное пространство получает- ся из аффинного пространства добавлением бесконечно удаленных точек. Каждая k-мерная плоскость пространства PV, не лежащая цели- ком в PVS, за вычетом ее бесконечно удаленных точек изображается k-мерной плоскостью на аффинной карте S, Плоскости, целиком лежащие в PVS, называются бесконечно удаленными по отношению к S.
§ 6. Проективные пространства 327 Однородными координатами точки х G PV называются коорди- наты вектора х в каком-либо выбранном базисе пространства V. Однородные координаты точки определены лишь с точностью до одновременного умножения на число Л / 0. Этим они отличаются от координат в привычном смысле слова. Кроме того, они не могут быть равны нулю одновременно. Точка с однородными координата- ми х0, хь ..., хп обозначается (х0: Xj:...: хп). Неоднородными координатами точки пространства PV называ- ются аффинные координаты ее изображения на какой-либо аффин- ной карте. В отличие от однородных координат, неоднородные ко- ординаты точки определены однозначно, но они могут быть вообще не определены, а именно, они не определены для точек, бесконечно удаленных по отношению к выбранной аффинной карте. Установим связь между однородными и неоднородными коорди- натами. Пусть {е0, е1?..., еп} — базис пространства V. Рассмотрим аффинную карту Sq = е0“Ь (^1, •••> (36) s' еоРо (см. рис. 20). Изображением точки --------4---- х = (х0 : Xj : ... : хп) на So служит ______________ точка s' /_____>е2 ~7 X X X °^^е1 / + 1 Л I 1 *А’П _ *------ / —ег +... + — еп> ----------/ Ло х0 , , „ Рис. 20 аффинные координаты которой от- носительно репера {е0; е1?..., еп} суть Таким образом, при указанном выборе аффинной *0 *0 карты и репера неоднородными координатами точки (х0: хг:...: хп) служат отношения Точки с х0 = 0 являются бесконечно Х0 хо удаленными по отношению к So. Аналогично, неоднородными координатами точки х на аффин- ной карте S{ = е( + (е0, ег,.... е^, ei+1,.... еп) (37) Хо X] Х.-1 Х.+1 Хп Л служат отношения —, —,...,---,----,..., —. Точки сх, = 0 являют- J Xi Xi Xi X, Xj ся бесконечно удаленными по отношению к St . Отметим, что карты So, Slf..., Sn составляют «атлас» в том смыс- ле, что они покрывают все пространство PV,
328 Глава 7. Аффинные и проективные пространства Задача 1. Доказать, что не существует атласа пространства PV из меньшего числа карт. Задача 2. Пусть уь ...,уп — неоднородные координаты изобра- жения точки х е PV на карте So. Найти ее неоднородные координаты на карте Теорема 1. Через любые к -I-1 точек проективного пространст- ва проходит плоскость размерности $ к, причем если эти точки не содержатся в плоскости размерности < к, то через них проходит единственная плоскость размерности к. Доказательство. Перевод утверждения теоремы на язык вектор- ных пространств есть следующее очевидное утверждение: любые к 4-1 векторов содержатся в подпространстве размерности к 4-1, и если они не содержатся в подпространстве размерности < к 4-1, то они содержатся в единственном подпространстве размерности к + 1. □ Теорема 2. Пусть Щ и П2 — плоскости п-мерного проективного пространства. Если dimЩ + dimП2п, то П1ПП2^0, причем dim(nj П П2) dim Щ + dim П2 - и. (38) Например, любые две прямые проективной плоскости пересека- ются. Доказательство. Если Щ =PUlf П2 = Р[/2, то dim Uj + dimU2 = dimЩ + dimП2 + 2^п + 2>dimV. Следовательно, иг П U2 # 0 и, значит, Пх ПП2 = Р(1/1 П1/2) / 0. Более точно, dim(1^ П U2) dim Щ + dim U2 - dim V, откуда следует (38). □ Всякий невырожденный линейный оператор зУ е GL(V) перево- дит одномерные подпространства в одномерные подпространства и тем самым определяет некоторое биективное преобразование зУ пространства PV. Определение 3. Преобразования вида зУ, где зУ gGL(V), назы- ваются проективными преобразованиями пространства PV. Очевидно, что проективное преобразование переводит любую плоскость пространства PV в плоскость той же размерности. Отображение з/ —> з/ является гомоморфизмом группы GL(V) в группу преобразований пространства PV. Его образ есть группа
§ 6. Проективные пространства 329 всех проективных преобразований пространства PV, называемая также полной проективной группой пространства PV и обозначае- мая через PGL(V). Лемма 1. Ядро гомоморфизма d —> аУ есть группа скалярных операторов (ЛеК*). Доказательство. Если оператор j/ переводит каждое одномер- ное подпространство в себя, то все ненулевые векторы являются его собственными векторами. Но очевидно, что сумма собственных векторов с различными собственными значениями не может быть собственным вектором. Следовательно, все собственные значения оператора аУ одинаковы, а это и означает, что он скалярен. □ Таким образом, PGL(V)^GL(V)/{A£: Ле К*}. Посмотрим, как представляется проективное преобразование jzf на аффинной карте S. Оператор аУ осуществляет аффинное отображе- ние гиперплоскости S на гиперплоскость a/S. Изображение точки аУх = аУ х (х е S) на карте S есть центральная проекция (с центром в нуле) точки аУхе a/S на S (см. рис. 21). Таким образом, можно Рис. 21 сказать, что, с точки зрения аффинной карты, проективное преобра- зование есть композиция аффинного отображения и центрального проектирования. В координатах это выглядит следующим образом. Пусть матрица оператора а/ в базисе {е0, ..., еп} имеет вид А = {a^j=Q. Рассмот-
330 Глава 7. Аффинные и проективные пространства рим неоднородные координаты в пространстве PV, определяемые репером {е0; еп} аффинной карты So (см. (36)). Пусть х = е0 + х1е1 + ... + хпеп, так что точка х G PV имеет неоднородные координаты Xj,..., хп. Обо- значим через ..., уп неоднородные координаты ее образа. Тогда &i0 + S ^ij^j у, =----------- G = I,.... И). (39) ^00 + aOjXj 7=1 Например, проективные преобразования прямой суть дробно- линейные преобразования У = (ad-bc0O). (40) (При с 0 0 точка —d/с переходит в бесконечно удаленную точку, а бесконечно удаленная точка переходит в точку а/с.) Если л/S = S, то преобразование d представляется на карте S как аффинное преобразование. Следующая лемма показывает, что всякое аффинное преобразование пространства S получается таким образом. Лемма 2. Всякое аффинное преобразование гиперплоскости S с V, не проходящей через нуль, единственным образом продолжается до линейного преобразования пространства V. Доказательство. Репер {е0; еь ..., еп} гиперплоскости S есть в то же время базис пространства V (см. рис. 20). Продолжением аффин- ного преобразования f гиперплоскости S является линейное преоб- разование пространства V, переводящее базис {е0, еь..., еп} в базис {f(e0),df(e1),...,d/(en)}. □ Рассматривая аффинное пространство S как часть проективного пространства PV, можно сказать, что группа GA(S) есть подгруппа группы PGL(V). Задача 3. Доказать, что для всякого проективного преобразова- ния комплексного проективного пространства существует аффин- ная карта, на которой оно представляется как аффинное преобра- зование. Геометрия, определяемая группой проективных преобразова- ний, называется проективной геометрией. Следующая теорема при
§ 6. Проективные пространства 331 сравнении с теоремой 2.1 показывает, насколько группа проектив- ных преобразований богаче группы аффинных преобразований. Назовем систему п + 2 точек п-мерного проективного простран- ства системой точек общего положения, если никакие п +1 из них не лежат в одной гиперплоскости. Теорема 3. Пусть {р0, р1? ..., рп_ц} и {qQ}q1}qn+i} — две си- стемы точек общего положения п-мерного проективного простран- ства PV. Тогда существует единственное проективное преобразова- ние, переводящее pL в qt при i = 0,1,..., п +1. Доказательство. Пусть pt = eit qt =fh где eh f (i = 0,1,..., n 4-1) — ненулевые векторы пространства V. Условие теоремы означает, что {е0, elf..., еп} (соответственно {/о, Л, — базис пространст- ва V и все координаты вектора еп+1 (соответственно /п+1) в этом базисе отличны от нуля. Нормировав векторы е0,е1,...,еп (соот- ветственно ...,/п) некоторым вполне определенным образом, можно добиться того, чтобы еп+1 = е0 + + ... + еп (соответственно /п+1 = /о + Л + ... + /Д ПРИ этих условиях пусть лУ — линейный оператор, переводящий базис {е0, е1?..., еп} в {f0, f19..., fn}. Тогда j</en+1 =/n+i и лУ есть единственное проективное преобразование, удовлетворяющее требованию теоремы. □ В частности, любые 3 различные точки проективной прямой про- ективным преобразованием можно перевести в любые 3 различные точки. Из-за этого в проективной геометрии не существует не толь- ко понятия расстояния между точками, но и понятия отношения тройки точек прямой, имеющегося в аффинной геометрии. Однако существует некий инвариант четверки точек прямой. А именно, пусть рь р2, р3, р4 — точки прямой PU с PV. Выберем в пространстве U какой-либо базис {еъе2} и для любых векторов и, v е U обозначим через det(u, v) определитель матрицы, составлен- ной из их координат в этом базисе. Пусть pt = tzt (i = 1, 2, 3, 4). Легко видеть, что выражение г г, . n n 'I - det(Ul’ Цз) . det<Ul> Ц4) СД-П (Р1> Р2> Рз> Р4) det(u3, u2) det(u4, u2) не зависит ни от нормировки векторов щ, ни от выбора базиса {е1?е2} в U. Оно называется двойным отношением четверки точек Ръ Р2> Рз, Р4- Пусть L — аффинная карта прямой PU. Выберем базис {е1ге2} так, чтобы L = е2 4- (е^, и пусть = е2 4- Тогда х, — неоднород-
332 Глава 7. Аффинные и проективные пространства Ui и2 е2 и3 и4 О ej Рис. 22 Следовательно, ная координата точки р( на карте L (см. рис. 22) и det(ui,uJ)= х‘ , . Ху-Хъ Хх-Х4 (Ръ Р2^ Рз, Р4) “ х _у ' х _у • W2) Л3 Л2 Л4 Л2 Подчеркнем, что в силу наличия инвариантного определения (41) выражение (42) не зависит от выбора аффинной карты и координа- ты на ней. Замечание 3. Двойное отношение считается определенным, ес- ли среди точек ръ р2, р3, р4 нет трех одинаковых. При этом если р2 = Рз или рх = р4, его значение считается равным со. Задача 4. Выяснить что происходит с двойным отношением (Pi, P2J Рз, Р4) = S при перестановках точек рь р2, р3, р4. Доказать, что выражение ках. (52-5 + 1)3 52(5-1)2 не меняется ни при каких перестанов- Задача 5. Изучив изображение четырех симметрично располо- женных вдоль центральной аллеи квадратных цветников на рис. 18, показать, что гравер существенно исказил перспективу. (Указание: сравнить двойное отношение трех равноотстоящих точек централь- ной аллеи, определяемых этими цветниками, и ее бесконечно уда- ленной точки с двойным отношением изображений этих точек на гравюре.) Так как двойное отношение определялось в терминах, инвари- антных относительно линейных преобразований пространства V, то оно сохраняется при любых проективных преобразованиях. Перейдем теперь к проективной теории квадрик. Как мы сей- час увидим, она проще аффинной. Это одно из проявлений совер- шенства проективной геометрии, завораживавшего еще математи- ков XIX в., которые считали, что все геометрии следует выводить из проективной. Подмножество векторного пространства V будем называть ко- нусом, если оно инвариантно относительно умножений на числа, т.е. вместе со всяким вектором содержит все пропорциональные ему векторы. (Это то же самое, что конус с вершиной в нуле в смыс- ле определения, данного в § 5.) В частности, квадрика X с V явля-
§ 6. Проективные пространства 333 ется конусом в этом смысле тогда и только тогда, когда X = X(Q), где Q — квадратичная функция в пространстве V. Такие квадрики будем называть квадратичными конусами (что слегка расходится с терминологией § 5). Для любого конуса X с V назовем его проективизацией и обозна- чим через РХ подмножество пространства PV, образованное всеми одномерными подпространствами, содержащимися в X. Ясно, что