Text
                    М. В. МИЛОВАНОВ
Р. И. ТЫШКЕВИЧ
А. С. ФЕДЕНКО
АЛГЕБРА
И АНАЛИТИЧЕСКАЯ
ГЕОМЕТРИЯ
Часть 1
Допущено Министерством высшего
и среднего специального образования БССР
в качестве учебного пособия для студентов
математических специальностей универси-
университетов и педагогических институтов
Минск
«Вышэйшая школа»
1984


ББК 22.151.5 я73 М60 УДК 512 + 514]@75.8) Рецензенты: кафедра алгебры Ленинградского государственного уни- университета им. А. А. Жданова; Ю. Г. Лумисте, доктор физико-математи- физико-математических наук, профессор, заведующий кафедрой геометрии Тартуского го- государственного университета 1702010000—076 ММ304@5)—84 19~85 ©Издательство «Вышэйшая школа», 1984.
ПРЕДИСЛОВИЕ Эта книга написана на основе курсов лекций по алгебре и ана- аналитической геометрии, которые читаются авторами на механико-ма- механико-математическом факультете Белорусского государственного универси- университета им. В. И. Ленина. Указанные курсы имеют много точек соприкосновения. Поэтому в некоторых университетах определенные их разделы объединяются в единый курс линейной алгебры и аналитической геометрии, кото- который читается во втором семестре. В первом семестре параллельно изучаются алгебра и аналитическая геометрия. Наконец, в третьем семестре читается только курс алгебры. Настоящая книга написана в двух частях и отличается тем, что охватывает содержание всех указанных курсов, т. е. весь материал, предусмотренный программами для математических факультетов уни- университетов по курсам алгебры и аналитической геометрии. Данное пособие значительно отличается от изданного в 1976 г. (авторы Р. И. Тышкевич, А. С. Феденко), в котором общая алгебра излагалась лишь в объеме, необходимом для понимания линейной алгебрьь С другой стороны, некоторые разделы пособия, изданного в 1976 г., перешли в настоящую книгу без существенных изменений. В настоящее пособие включены упражнения, выполнение которых должно способствовать лучшему усвоению материала. Состоит оно из четырех разделов. Первый раздел «Основы алгебры» охватывает материал курса алгебры, читаемый обычно в первом и третьем се- семестрах. Строгое и однозначное распределение материала по семе- семестрам не представляется возможным и зависит от конкретных усло- условий, в которых будет использоваться пособие. В книге приведен один из возможных вариантов такого распределения, сложившийся в Белорусском университете (параграфы, предназначенные для изуче- изучения в третьем семестре, отмечены звездочкой). Содержание материа- материала первого семестра определялось не только желанием изложить в логической последовательности отдельные разделы курса алгебры. Одновременно учитывались требования параллельно читаемых курсов аналитической геометрии и математического анализа. Второй раздел «Элементарная аналитическая геометрия» содержит материал, соответствующий лекционным часам, отведенным в первом семестре на аналитическую геометрию. Изложение опирается здесь на те понятия -плоскости и пространства, которые изучались в средней школе. По замыслу авторов этот раздел должен содержать прежде всего материал, необходимый для параллельно изучаемого курса ма-
тематического анализа. С другой стороны, изложение строится так, чтобы подготовить студентов к изучению линейной алгебры в п-мер- ном пространстве. Заметим, что в этой книге вместо традиционных названий «кри- «кривые и поверхности второго порядка» употребляется выражение «фи- «фигуры второго порядка». Последнее название, по нашему мнению, лучше отражает существо вопроса. Мы сочли уместным также дать общее (точное) определение уравнения фигуры на плоскости и в пространстве и описать соотношение между произвольными фигура- фигурами и уравнениями. Обычно этот вопрос оставляется без внимания и в средней школе, и в вузовском курсе математики. Авторы выражают благодарность рецензентам книги: коллективу кафедры алгебры и теории чисел Ленинградского университета, воз- возглавляемому профессором 3. И. Боревичем, профессору заведующему кафедрой алгебры и геометрии Тартуского университета Ю. Г. Лу- мисте — за многие ценные советы и пожелания. Все замечания по улучшению и совершенствованию учебного по- пособия просим направлять по адресу: 220048, Минск, проспект Ма- шерова, 11, издательство «Вышэйшая школа». Авторы
Раздел 1 ОСНОВЫ АЛГЕБРЫ 1. АРИФМЕТИКА ЦЕЛЫХ ЧИСЕЛ В этой главе излагаются основные сведения о делимости целых чисел, которые понадобятся в дальнейшем. Многие изложенные здесь понятия и конструкции носят общий характер и значение их выходит за рамки теории целых чисел. 1.1. Основные понятия Как обычно, множество всех целых чисел будем обозначать бук- буквой Z. Таким образом, Z = {0, ±1, ±2, ±3,...}. Сумма, разность и произведение двух целых чисел а и Ь также яв- являются целыми, но частное alb может быть как целым, так и не це- целым. Определение 1.1. Пусть a, b?Z, ЬфО. Говорят, что Ъ де- делит а или что а делится на Ь, если а = bq, где q ? Z. При этом b называют делителем числа а, а — кратным числа Ь. Ясно, что нуль делится на любое целое число, отличное от нуля. Мы будем часто пользоваться следующим утверждением. Предложение 1.1. Если в равенстве а{ + ... + ат = Ьх + ... + bk> где aif b\ ? Ъ, все слагаемые, за исключением, быть может, одного, делятся на c?Z, то и это оставшееся слагаемое делится на с. ^ Пусть а2 =cq2f ..., ат = cqm и Ь\ —ср\, ..., bk =cpk. Тогда о>\ = Ь] + ... + bk — а2 — ... — ат = (pi + ... + Pk — Q2 — ... — — qm)c < Теорема 1.1 (теорема о делении с остатком). Пусть a, b?Z, b> 0. Тогда существует единственное представление чис- числа а в виде где q, r?Z, 0<r<&. > Сравнивая число а со всевозможными произведениями вида Ьп, где п пробегает все целые числа, заключаем, что найдется q ? Z, для которого bq^a<.b(q + I). Поэтому a = bqJr(a — bq), где О^а — — bq<Cb. Если положить г = а — bq, то а = bq + г — искомое пред- представление. Докажем единственность такого представления. Пусть а = bq\ + + П, 0^ri<6 — другое представление. Тогда, вычитая его из пер- первого, получаем 0 = b(q — ^i) + (г — г{)9 откуда следует, что г — Г| кратно Ь. Но абсолютная величина г — Г\ меньше Ь. Следовательно, г — г\ =0, а поэтому и q — q\ =0. ^
Число q называется неполным частным (или просто частным), а число г — остатком от деления а на Ь. Отметим, что г = 0 тогда и только тогда, когда а делится на Ь. Несмотря на свою элементарность, теорема о делении с остатком играет весьма важную роль в арифметике целых чисел. Упражнения 1. Докажите, что для любого натурального числа п существует целое число, записываемое только единицами и нулями, которое делится на п. 1.2. Наибольший общий делитель. Алгоритм Евклида 1 Пусть аъ а2у ..., ak — целые числа, не все равные нулю. Всякое це- целое d, которое делит каждое из щ, называется их общим делителем. Очевидно, —d тоже есть общий делитель аи а2у ..., а^ поэтому в дальнейшем будем рассматривать только положительные общие дели- делители. Так как а[у а2, ..., ak имеют лишь конечное число общих дели- делителей, то среди них есть максимальный, который называется наи- наибольшим общим делителем чисел аи а2, ..., а}г и обозначается сим- символом НОД: НОД {аи а2, ..., ak). Мы начнем с изучения общих делителей двух целых чисел. Лемма 1.1. Если а = bq + с, то числа a, b имеют те же общие делители, что и числа Ь, с; в частности, НОД (а, Ь) = НОД (Ь, с). !> Действительно, если d — общий делитель а, Ь, то d делит с. Но тогда d есть общий делитель Ьу с. Аналогично общий делитель Ьу с является общим делителем а, Ь. <4 Пусть теперь a, b?Z, a>6>0. По теореме о делении с остат- остатком a = bqJrr1 0^г<6. Согласно лемме, НОД (а, Ь) = Н0ДF, г). Но а>6>г^0, и задача нахождения НОД (а, Ь) сводится к зада- задаче нахождения НОД чисел Ь, г, каждое из которых меньше а. Это простое замечание лежит в основе общего метода отыскания НОД двух чисел, предложенного еще Евклидом. Данный метод — алго- алгоритм Евклида. Пусть a, b ? Ъ, a J> b > 0. Если а делится на 6, то НОД (а, Ь) = Ь. Поэтому будем в дальнейшем считать, что b не делит а. Применяя несколько раз теорему о делении с остатком, получаем ряд равенств: а = ЬаЛ + г\, b = f\q2 -f- г2у t'n—2 -~ Пг—lQn ~ rn—\ = rnqnj.\, где b> r{ > r2> ... > rn-x >rn>0. B)
Ряд A) заканчивается тогда, когда некоторое гп+\ = 0. В силу B) я+1<&. Рассматривая равенства A) (сверху вниз), мы можем на основании леммы заключить, что пары целых чисел а, Ь; Ь, Т\, Г\, г2; г2, Тъ1 •••/ гп—ъ ?п—ь гп—\> Тп> Гп> 0 имеют одни и те же общие делители. Следовательно, общие делите- делители чисел а и Ъ совпадают с делителями числа гп — последнего от яичного от нуля остатка в алгоритме [Евклида. В частности, НОД (а, Ь) = гп. Итак, доказана следующая Теорема 1.2. НОД чисел а и b равен последнему отличному от нуля остатку в алгоритме Евклида. Множество общих делителей чисел а и Ь совпадает с множеством делителей их НОД. Пример 1.1. С помощью алгоритма Евклида найти НОД A001, 390). Решение. 1001 780 52 52 0 390 221 221 169 1691 169 52 156 3 13 221 390 1001 =390 -2 + 221, 390 = 221 • 1 + 169, 221 = 169 - 1 + 52, 169 = 52-3+ 13, 52 = 13 • 4. Так как последний отличный от нуля остаток равен 13, то НОД A001, 390) =¦ — 13. Из алгоритма Евклида можно вывести следующее важное свойст- свойство НОД. Теорема 1.3. Если d == НОД (а, Ь), то d можно представить в виде d = ak-\~ bs, где k, s(EZ. ^ Очевидно, достаточно доказать теорему при условии а ^ b > 0. В случае, когда а делится на 6, НОД (a, b) = b и b ~ а • 0 + b • 1. Поэтому будем считать, что b не делит а, и проведем доказательство индукцией по числу п отличных от нуля остатков в алгоритме Евк- Евклида A). Пусть п = 1. Тогда d = rx и d = а — bq\ = а • 1 + b (— q\). Пред- Предположим, что утверждение теоремы справедливо для п — 1, и дока- докажем его для п. Если в формулах A) зачеркнуть первое равенство, то оставшийся ряд равенств станет алгоритмом Евклида для чисел 6 и rj. Он со- содержит п — 1 отличных от нуля остатков, а гп есть НОД чисел b и гх. По предположению индукции rn ^ bkf + ns', где k\ sf ?Z. Из первого равенства г\ = а • 1 + b (— q\). Поэтому d = гл •= bkf + (а х X 1+6(—#0)s' = as' + b(k' — s'qi) есть искомое представление. ^
Пример 1.2. Пусть а =1001, b =» 390. Представить d = НОД"(а, 6) в виде d=*ak + bs, k, s?Z. Решение. Алгоритм Евклида для чисел а и Ь указан в примере 1.1; d => 13. Из четвертого равенства d=169 + 52(—3). Из третьего равенства 52 = 221 + + 169 (—1). Отсюда d= 169+B21 + 169 (—1)) (—3) = 221 (—3) + 169- 4. Из второго равенства 169 = b + 221 (—1). Отсюда d =» 221 (—3) + (b + + 221 (—1)) 4 = 6 • 4 + 221 (—7). Из первого равенства 221 = а + b (—2). Отсюда d= b • 4 + (a + b (—2)) (—-7) = « а (—7) + 6-18, т.е. k = —7, s = 18. Определение 1.2. */^сла аь а2, ..., ak, at ? Z, называются взаимно простыми, если НОД (а^ а2, ..., ak) = I. Теорелга 1.4. Пусть а, Ь, с ? Z и произведение аЪ делится на с. Если а и с взаимно просты, то b делится на с. > Так как 1 = НОД (а, с), то, согласно теореме 1.3, \=ak-\- + cs, k, s ? Z. Умножая левую и правую части этого равенства на 6, получаем b = (ab)k + c(bs). C) По условию аЬ делится на с; поэтому оба слагаемых в правой части формулы C) делятся на с. Значит, и b делится на с. ^ Теорема 1.4 будет играть главную роль при доказательстве ос- основной теоремы арифметики. Задача нахождения НОД нескольких чисел сводится к аналогич- аналогичной задаче для двух чисел. Именно, пусть аи а>2> •-, ctk—целые числа и пусть d2 = НОД (аи а2), d3, = НОД (d2, a3), d, = НОД (d3, a,\ ..., dk = _ь ak). Тогда dk =НОД(аь а2, ..., ак). Доказательство этого утверждения легко следует из теоремы 1.2 и предлагается читателю в качестве упражнения. Упражнения 1. Пусть а> b, c?Z. Докажите, что уравнение ах + by =з с имеет решение в целых числах тогда и только тогда, когда с делится на НОД {а, Ь). 2. Докажите, что если числа а и b взаимно просты, то существует натураль- натуральное /я, для которого ат— 1 делится на Ь. 1.3. Наименьшее общее кратное Пусть аь а2, ..., ak — целые числа, отличные от нуля. Всякое целое, кратное каждому aiy называется их общим кратным. Наи- Наименьшее положительное из таких общих кратных называется наимень- наименьшим общим кратным (НОК) чисел аи а2, ..., а* и обозначается сим- символом НОК (аи а2, ..., ak). < Очевидно, если b кратно а, то b кратно и — а. Поэтому можно огра- ограничиться изучением общих кратных положительных чисел. Рассмотрим сначала случай двух положительных чисел а\ и а2 и попытаемся описать любое их общее кратное. 8
Пусть d = HOJ\ (аи а2). Тогда а{ = М, a2 = b2d. При этом Ь\ и Ь2 взаимно просты. В противном случае а\ и а2 имели бы общий де- делитель, больший d. Пусть т — произвольное общее кратное а\ и а2. Тогда т = с\п\ = -- C\b\d и т = с2а2 = c2b2d. Очевидно, Cib\ = С2&2. Так как 6i и &2 взаимно просты и &i делит c2b2, то по теореме 1.4 с2 делится на Ь\9 т. е. c2 = tbu t?Z. В результате m = tb{b2d. (l) Формула A) дает общий вид всех общих кратных а\ и а2. С дру- другой стороны, &iM есть положительное общее кратное п\ и а2. Поэтому d НОД (ax, а2) Итак, доказана Теорема 1.5. Всякое общее кратное двух чисел кратно их наи- наименьшему общему кратному, которое задается формулой HOK(a"a2) = S5^j- Нахождение НОК нескольких чисел сводится к уже разобранно- разобранному случаю двух чисел. Пусть требуется найти НОК чисел аи а2, ..., #?. Если то НОК(аь а2, ..., аи) = т^ Читателю будет полезно провести доказательство этого утвержде- утверждения самостоятельно. Упражнения 1. Покажите, что формула НОК (яъ #2» #з) = неверна. НОД (alt a2, а3) 1.4. Простые числа. Основная теорема арифметики Определение 1.3. Целое число а>1 называется простым, если его нельзя представить в виде произведения меньших целых по- положительных чисел. В противном случае а называется составным. Например, числа 2, 3, 5, 7, И простые, а числа 4, 6, 8, 9, 10 составные. Очевидно Предложение 1.2. Целое а > 1 является простым тогда и только тогда, когда всякий его положительный делитель есть либо 1, ли- либо а. В данном параграфе будут рассматриваться лишь положительные делители целых чисел. 9
Предложение 1.3. Наименьший отличный от I делитель цело- целого а> 1 есть число простое, ^ Пусть d — наименьший отличный от 1 делитель а. Если бы d было составным, то d = did2, где 1<^<Л, i = 1,2. Так как d{ де- делит d, a d делит а, то d[ — отличный от 1 делитель а, меньший d. Но это противоречит выбору d. <4 Таким образом, всякое целое а>\ имеет простой делитель. Теорема 1*6* Простых чисел бесконечно много. ^ Предположим, что существует лишь конечное множество про- простых чисел piy р2, ..., Pk- Пусть q = pip2 • • • Pk + 1- Так как q есть целое, большее единицы, то оно имеет простой делитель d. Но тогда d совпадает с некоторым pi9 и 1 = q — p\p2 • • • Pk делится на piy что неверно. <4 Предложение 1А. Если р — простое число, то всякое целое а либо взаимно просто с р, либо делится на р. ^ Пусть ^ = НОД(а,р). Так как d — делитель р, то, согласно предложению 1.2, d либо равно 1, либо равно р. В первом случае аир взаимно просты, во втором а делится на р. ^ Теорема 1-7 (основная теорема арифметики). Всякое целое число, большее единицы, разлагается в произведение простых чисел. Это разложение определено однозначно с точностью до порядка со- множителей. Замечание. В формулировке теоремы подразумевается, что разложение простого числа в произведение простых чисел содержит всего один сомножитель— данное число. ^ Докажем сначала существование разложения на простые со- сомножители. Пусть a?Z, a>\. Согласно предложению 1.3, а имеет простой делитель рь так что а = р{а\у aj?Z. Если ai>l, то суще- существует простой делитель р2 числа аи ах = р2а2у a2?Z. В результате приходим к такому разложению числа а:а = р\р2а2. Если а2>\> то это рассуждение можно продолжить, пока не придем к какому- либо аи — 1 • Тогда а = р\р2 * • • pk будет искомым разложением. Для доказательства единственности разложения на простые сом- сомножители нам понадобится Лемма 1.2. Если произведение целых чисел аь а2, ..., ап делится на простое р, то хотя бы один из сомножителей делится на р. Доказательство леммы проведем индукцией по числу сомножите- сомножителей п. Для п = 1 утверждение очевидно. Предположим, что лемма справедлива для случая п — 1 сомножителя и докажем ее справед- справедливость для п сомножителей. Рассмотрим первый сомножитель а\. Мы знаем (предложение 1.4), что либо а\ делится на р, либо НОД(аь р) = 1. В первом случае до- доказательство не требуется. Предположим, что НОД(аь р) = 1. Так как а\ (а2 • • • ап) делится на р, то по теореме 1.4 а2 • • • ап делится на р. Но тогда по предположению индукции хотя бы одно из чисел а,2, ..., ctn делится на р. Лемма доказана. 10
Пусть теперь а 6 Z a> 1 и а = рхр2 • • • рп, а= Я\Ц2 • • • <7т есть два разложения а на простые сомножители. Покажем, что п = m и разложения могут отливаться лишь порядком сомножителей. Имеем Pi/?2 • • • Ря^ q\Q2 • • • 9«. A) Левая часть A) делится на р\. Следовательно (см. лемму 1.2), хотя бы один из сомножителей правой части делится на р\. Можно считать, что р\ делит ^.Но q\ —простое число и всякий его дели- делитель есть либо 1, либо q\. Поэтому р\ = q\. Сокращая обе части ра- равенства A) на ри получаем р2 • • • рп = Ц2 • * • Чт- Это рассуждение можно повторять до тех пор, пока, наконец, в одной части равенства A), например в правой, не сократятся все сомножители. Но одновре- одновременно должны будут сократиться и все сомножители левой части. В противном случае мы получили бы равенство pkpk+\ ••• pn=U что невозможно. Этим доказано, что любые два разложения а на простые сомножители отличаются лишь порядком сомножителей. <4 Заметим, что если возможность разложения на простые сомножи- сомножители почти очевидна, то доказательство единственности весьма содер- содержательно и получается не сразу. Первую формулировку основной теоремы арифметики и ее доказательство дал немецкий математик К. Ф. Гаусс в 1801 г. В разложении целого а>1 на простые сомножители некоторые из них могут повторяться. Если обозначить буквами pi, р2, ..., ps все различные простые числа, входящие в разложение а, то а мож- можно записать в виде а - р\*р$ .. • р*;% B) где f/6Z, //>0. Представление B) называется каноническим разло- разложением числа а. Упражнения 1. Пусть а = p*i ••• pts — каноническое разложение числа а. Докажите, что числа вида d = pkl ••• pks, 0<fy </,., ki ?Z, и только они являются делителя- делителями числа а. 2. Получите известные из к\рса средней школы правила нахождения НОД и НО К двух целых чисел, заданных сеоими каноническими разложениями. 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. МАТРИЦЫ Цель этой главы — дать метод решения систем линейных (алгсб раических) уравнений общего вида <-*12*2 \ ••• i а\пХп — с/1, + 0^2*2 + ... + U
Здесь кип — произвольные натуральные числа, а коэффициенты при неизвестных и свободные члены — произвольные действительные числа. Системы такого вида встречаются не только в алгебре, но практически во всех областях математики. Основным инструментом исследования линейных систем служит понятие матрицы. 2.1. Матрицы Пусть М — произвольное множество, a к и п — натуральные числа. Прямоугольная таблица п\\ п\2 ... CL\n #21 #22 .-. #2я A) Lak\ ak2 ... akn- составленная из элементов множества М, называется матрицей над М или просто матрицей, если из контекста ясно, какому множест- множеству М принадлежат составляющие ее элементы. Элементы матрицы нумеруются двумя индексами. Первый индекс указывает номер строки, а второй — номер столбца, на пересечении которых находится данный элемент. Таким образом, элемент пц матрицы A) расположен в t-й строке и /-м столбце. Если матрица имеет к строк и п столбцов, то ее называют к X п- матрицей («ка» на «эн»-матрицей). Если число строк матрицы равно числу ее столбцов и равно пу то матрица называется квадратной порядка п, в противном случае говорят о прямоугольной матрице. Для обозначения матрицы A) употребляется также запись [пц]. При этом еще следует дополнительно указать размеры матрицы, т. е. число ее строк и столбцов: [а/у], I = 1, 2, ..., k; /= 1, 2, ... п. Равенство матриц А = [а?1 ] к В = \Ъц ] над М означает, что их раз- размеры одинаковы и элементы этих матриц, стоящие на одинаковых местах, равны, т. е. ац = Ьц для всех i, /. Множество всех k X п- матриц над М будем обозначать символом М^,п- Как правило, в качестве М берется множество с определенной алгебраической структурой. Так, везде в этой главе будут рассмат- рассматриваться матрицы над R, где R — множество всех действительных чисел. 2.2. Элементарные преобразования матрицы Пусть А — произвольная матрица над R. Элементарными пре- преобразованиями строк матрицы А называют следующие операции: 1) умножение какой-либо строки матрицы А на отличное от нуля число из R, т. е. умножение каждого элемента этой строки на указанное число; 2) прибавление к строке матрицы А другой ее строки, умно- умноженной на произвольное число X?R, т. е. прибавление к каждому 12
элементу какой-либо строки соответствующего (находящегося в том же столбце) элемента другой строки, умноженного на К. Если матрица В получается из матрицы А в результате приме- применения к А одного или нескольких элементарных преобразований строк, то говорят, что матрица А эквивалентна матрице В и пи- пишут А ~ В Пример 2.1. Пусть Г2 1 -3] Л= 4 —1 0 . L5 -4 2] Если первую строку матрицы А умножить на 2, то получится матрица Г4 2 -61 В= 4 —1 0 . L5 -4 2J Прибавляя ко второй строке матрицы В ее ^первую строку, умноженную на {—1), получаем матрицу Г4 2 -6] С-= 0 —3 6 . L5 -4 2\ Очевидно, А ~ С. Отметим следующее полезное свойство элементарных преобразо- преобразований. Предложение 2.1. С помощью элементарных преобразований можно поменять местами любые две строки матрицы. >> Переставить строки с номерами I и / можно, например, ис- используя следующую цепочку элементарных преобразований: 1) к t-й строке прибавим ;-ю; 2) из /-й строки вычтем i-ю; З) к i-й строке прибавим ;-ю; 4) /-ю строку умножим на —1.^ Ступенчатой называется матрица А = [а//], обладающая следующи- . ми свойствами: 1) е^ли i-я строка нулевая, т. е. состоит из одних нулей, то (i + 1)-я строка также нулевая; 2) если первые ненулевые элементы i-й и (i + 1)-й строк располагаются в столбцах с номерами k и /, то k<L Пример 2.2. Матрицы 1 2 —П Г2 —1 3" 0 3*4,0 07 _о о 1J Lo оо являются ступенчатыми; матрица Г2 1 —Г 0 0 3| L0 4 1. ступенчатой не является. Матрица размеров k X п, состоящая сплошь из нулей, называется нулевой и обозначается О^. Нулевая матрица ступенчатая. Следующая ^теорема занимает центральное место в изложенном ниже способе решения-систем линейных уравнений. 13
Теорема 2.1. Всякую матрицу с помощью элементарных пре- преобразований строк можно привести к ступенчатому виду. ^ Пусть А — k X n-матрица. Доказательство проведем индукцией по k. При k = 1 А является ступенчатой. Пусть &> 1, и предполо- предположим, что для матриц размеров (k— 1) X п теорема уже доказана. Если А—нулевая матрица, то она ступенчатая. Пусть теперь А = [ац] — нулевая матрица и ]\ — номер первого из ее столбцов, содержащих ненулевые элементы. Можно считать, что #iyj =^=0. Этого всегда можно добиться, меняя местами строки матрицы А. Прибавим ко второй строке матрицы А ее первую строку, умноженную на — аТ}\а2;1, затем к третьей строке — первую строку, умноженную на —аг} }\ р и т. д. Матрица А приведется к виду О ... О #i/j #iyj _j-1 ... а\п О ... О О 62/, +1 ••• Ь2п Матрица 0 ... 0 0 bkf Ьпл 0) V2n »Л/1 + 1 ... bkn имеет Л — 1 строк и, согласно индуктивному предположению, может быть приведена с помощью элементарных преобразований строк к ступенчатому виду. Применяя те же элементарные преобразования к соответствующим строкам матрицы A), 'приведем эту матрицу к сту- ступенчатому виду. <4 Методом, изложенным при доказательстве теоремы, пользуются на практике. Пример 2.3. Привести матрицу  7 3 .=|3 9 4 1 5 3 к ступенчатому виду с помощью элементарных преобразований строк. Решение. Поменяем местами первую и последнюю строки матрицы Л: Из второй строки полученной матрицы вычтем утроенную первую, а из третьей- удвоенную первую: 1 5 3" I 0 —6 —5 L0 -з -з_ Поменяем местами вторую и третью строки: Г1 5 31 0 -3 -3 0 -6 —5 14
Наконец, из третьей строки вычтем удвоенную вторую. Тогда Г1 5 31 О —3 —3 Lo о 1J есть искомая ступенчатая матрица. Упражнения 1. Если матрица А эквивалентна'матрице В, той В эквивалентна А, Докажите. 2.3. Системы линейных уравнений. Метод Гаусса Рассмотрим совокупность k уравнений ¦ #12*2 ~Ь ... ~Ь #1л*/г = Ь\Л #21*1 + #22*2 + ... + CL2nXn ~ Ь2,{ /j\ где a//, bi — действительные числа, a x\f x2, ..., л:^ — неизвестные. Эту совокупность называют системой линейных уравнений над R с п неизвестными, ац — коэффициентами системы A), bi—свободны- bi—свободными членами. Последовательность (Я], K2i..., Яд) п действительных чисел называется решением системы A), если после подстановки в каждое из уравнений A) вместо неизвестных %i соответствующих чисел Я/, i = 1, 2, ..., п, это уравнение прев- превращается в верное равенство. Система A) называется совместной, если она имеет хотя бы одно решение, и несовместной — в против- противном случае. Две системы линейных уравнений с п неизвестными называются эквивалентными, если множества их решений совпадают. Это озна- означает, что либо обе эти системы совместны и любое решение каждой из них служит решением другой, либо они несовместны. Матрица ап п\2 ... а 021 #22 ••• а2 * __ составленная из коэффициентов системы A), называется матрицей этой системы. Если приписать к А справа столбец сводных членов системы A), то получится матрица 1Яц #12 ... п\п Ь\ - #21 #22 ••• #2/1 Ь2 ak\ ak2 ... akn^ bk л которая называется расширенной матрицей системы A). Очевидно, система линейных уравнений и ее расширенная матрица однозначно определяют друг друга. 15
Всякую содержащую более одного столбца матрицу над R можно рассматривать как расширенную матрицу некоторой линейной сис- системы. Будем называть систему линейных уравнений ступенчатой, если ее расширенная матрица ступенчатая. Рассмотрим способ решения систем линейных уравнений, который называется методом Гаусса (метод исключения неизвестных). В его основе лежат следующие два факта: 1) существует весьма простой способ решения любой ступенчатой линейной системы; 2) всякая система линейных уравнений эквивалентна некоторой ступенчатой линейной системе. Изложим сначала способ решения ступенчатых линейных систем. Заметим, что если из системы линейных уравнений убрать уравнение, у которого все коэффициенты и свободный член равны нулю, то получится линейная система, эквивалентная исходной. Поэтому мож- можно ограничиться рассмотрением систем линейных уравнений, расши- расширенная матрица которых не содержит нулевых строк. Если расширенная матрица системы содержит строку вида 0 0 ... О Ь, где ЬфО, то рассматриваемая линейная система несовместна, так как в нее входит уравнение О- xi + 0- х2 + ... + 0. хп =6. Этот случай в дальнейшем исключим из рассмотрения. Итак,* пусть дана ступенчатая система линейных уравнений. Мож- Можно считать, что ее расширенная матрица имеет вид г0 ... 0 0 ... 0 А = 0 ... ащ ... аУ]г ... а1п ... \ащ ... a2Jr ... а2п 0 ... 6 6 ... 0 ... \arir ... аг/п Ьг _ где числа aVlv a2fv ..., arJr отличны от нуля. Возможны два случая: г = яиг<я. В первом случае А = #11 #12 ... #1/г ^1 0 #22 ... #2я Ь2 _0 0 ... апп Ьп „ , аиф0, i= 1, 2, ..., п. Соответствующая система линейных уравнений* #12*2 + ... + ainxn = bu f-... + a2nxn = b2, — Ьп. B) Система B) имеет единственное решение. Мы получим его, если из последнего уравнения определим хП9 затем из предпоследнего, уже зная хП9 найдем хп-\ и т. д. 16
Разберем второй случай: г<я. Мсжно считать, что /i = 1 j2 =2, ..., jr = г. Этого всегда можно добиться, перенумеровав не- неизвестные. Таким образом, ^11 ^12 ... @1г ••• ^1/г *?1 "" ~т 0 а22 ,.. а2г ... а2п Ъ2 _0" 0 ... агг ... агп Ъг Матрице Л соответствует следующая линейная система: а\\Х\ -j- а\2х2 -р ... -р a\fXf -\-... ~f- a\nXn == а22х2 -j- ... -f- ^2/--^r ~Ь • • • ~Ь cL2nxn = arrXf ~у~ ... ~j~ а^Хп == Неизвестные ^г + ь ^r + 2, ..., xn будем называть свободными не- неизвестными. Перепишем систему C) так: +ai2x2 + ... + ct\rXr = b\ — air + \Xr + \ — ... — a\nxn, a22x2 + ... + a2rxr ^b2—a2r + ixr + l — ... — a2nxn, arrxr = br — arr + \xr +1 —... D) Если теперь свободным неизвестным придать произвольные значения из R, то относительно оставшихся неизвестных систему D) можно решить так же, как и систему B). При заданных значениях свободных неизвестных оставшиеся неизвестные определяются однозначно. Не- Несложное рассуждение, которое читателю будет полезно провести самостоятельно, показывает, что описанным путем получаются все решения системы C). Мы еидим, что ео втором случае система име- имеет бесконечно много решений. Покажем теперь, как для произвольной системы линейных урав- уравнений A) найти эквивалентную ей ступенчатую линейную систему. Пусть А — расширенная матрица системы A). Согласно теореме 2.1, матрицу А с помощью элементарных преобразований строк мож- можно приЕести к ступенчатой_матрице В. Система линейных уравнений, соответствующая матрице В, и будет искомой ступенчатой линейной системой, эквивалентной системе A). Действительно, справедлива Теорема 2.2. Если А ~ В, то системы линейных уравнений, соот- соответствующее матрицам Л и В, эквивалентны. ^ Очевидно, достаточно доказать теорему для того случая, когда В получается из Л с помощью одного элементарного пре- преобразования строк. __ __ Пусть, например, В получается из А прибавлением к перЕой стро- строке матрицы Л ее второй строки, умноженной на число с. Таким образом, если 17
А = an al2 ... п\п b\ 021 022 • • a2n Ь2 ak\ ak2 ... cLkn bk то D __. ап + ca2i al2 + ca22 a2n +cb2 b2 bk Линейные системы, соответствующие А и В, имеют вид + ^12*2 + ... + пщХп = 61 Л 021*1 + 022*2 -Ь ... + 02л*/2 =62,1 0*1*1 ... + (flla 021*1 Пусть х, ..-, Л/г) E) F) G) есть решение системы E). Покажем, что G)—решение системы F) Очевидно, достаточно проверить, что решение G) удовлетворяет первому уравнению системы (б): (ап + са21) Ац + ... + (ат + са2п) К = (Х К) + ... + cb2. )+¦ Итак, если система E) совместна, то всякое ее__ргшзние есть ре- решение системы F). С другой стороны, матрица А получается из ~В прибавлением к первой строке матрицы В ее второй строки, умноженной на число — с. Поэтому всякое решение системы F), если оно есть, является решением системы E). Эго доказывает эквива- эквивалентность систем E) и F). __ Случай, когда В получается из А умножением строки матрицы "А на отличное от нуля действительное число, предлагается читате- читателю в качестве простого упражнений. <4 Сформулируем полученныа результаты. Итак, для того чтобы решить систему линейных уравнений A) методом Гаусса, следует: 1) выписать расширенную матрицу А системы j[l); 2) с помощью элементарных преобразований строек привести А к ступенчатой мат- матрице Ъ; 3) найти все решения (если они^есть) ступенчатой линей- линейной системы, соответствующей матрице В. 18
Полученные решения будут искомыми решениями системы A). Ес- Если ступенчатая система несовместна, то несовместной является и си- система A). Если система A) совместна, то она имеет либо единствен- единственное решение, либо бесконечно много решений. Пример 2.4. Решить систему 3*! — 2л;3 + 5*з + 4*4 = 2,1 6*! —4*2 + 4*8 + 3*4=3, (8) 9*! — 6*2 + 3*3 + 2*4 = 4. j Решение. Выпишем 'расширенную матрицу системы (8), и с помощью эле- элементарных преобразований строк приведем ее к ступенчатому виду ГЗ -2 5 4 2] ГЗ -2 5 4 2] ГЗ -2 5 4 2] 6-4433-0 0-6 -5 —1~о 0-6-5-1 [9—6 3 2 4J [о 0 —12 —10 — 2] [о 0 0 0 0J. Соответствующая ступенчатая система имеет вид 3*!- 2*2 +5*з + 4*4 = 2, \ ,q) -6*3-5*4 =-К/ (У) Неизвестные *2 и *4 объявляем свободными и переписываем систему (9) так: 3*i + 5*з = 2 + 2*2 — 4*4,1 6*з = 1—5*4. / Придавая *2 и *4 произвольные значения а и Ъ из R, получаем 3*!+ 5*з = 2 +2а —46,\ 6*з - 1 — 56, / откуда *3 = A — 56)/6, *i = G + 12а + Ь)/18. Таким образом, система (8) имеет бесконечное множество решений вида (G+12а + 6)/18, а, A _ 56)/6, Ь), где а, Ь — произвольные действительные числа. Других решений система не имеет. 2.4. Операции над матрицами Ознакомимся с основными операциями над матрицами. Напомним, что мы будем рассматривать лишь матрицы над множеством R дей- действительных чисел. Множество всех таких матриц размеров k x n обозначим символом Цк,п. Определение 2.1. Если А =- [ач] и В = [btj] — матрицы из Rm, то их сУмм°й называется k х п-матрица С = [сц], у которой Сц U[j + Оц для всех i = 1, 2, ..., k\ j = 1, 2, ..., п. В этом случае будем пи- писать С = А + В. Таким образом, сложение матриц сводится к сложению их эле- элементов, стоящих на одинаковых местах. Пример 2.5. Г1 -1 21 , Г2 1 3] ГЗ 0 5]. [з 0 -lJ+Ll 0 2 J= L4 0 if Отметим следующие очевидные свойстга сложения матриц: 1) А+(В + С) = (А+В) + С для любых А, В, С 6 R*;; 2) А + В = В + А для любых A, BeRk.n', 19
3) А + Okffl = Oktn + А=А,гдеА?Rk,n, а ОкуП— нулевая матрица) 4) для любой А ? Rk,n существует матрица В g Rk$n, такая, что А-\- В = В + А = О^л. Я/ж 5/пож, если А — [а,7], то 5 = [&//], где Матрица В называется матрицей, противоположной матрице А. Определение 2.2. Пусть A =[a*/j 6Ra,«» ^6R- Произведением матрицы А на число % называется k X п-матрица В = [Ьц], у ко- которой для всех t = l, 2, ..., &; /=1, 2, ..., п. В этом случае пишут В = Ы. Мы видим, что умножение матрицы на число сводится к умно- умножению на это число каждого элемента матрицы. Пример 2.6. о Г1 2 —31 ГЗ 6 —9"! 3 [2 _1 0J = [.б -3 0j# Перечислим основные свойства матриц, связанные с умножением матрицы на число: 1) 1 • А = А для лю5ой матрицы Л; 2) (аЬ)А =а(ЬА) для любой матрицы А и любых чисел а,Ь\ 3) (а + Ь) А = аА + ЬА для любой матрицы А и любых чисел а, Ъ\ 4) а(А + В) = аА + аВ для любых Л, В g R^ и любого числа а. Элементарные доказательства этих свойств оставляем читателю. Хотя мы никак не мотивировали введение операций сложения матриц и умножения матрицы на число, они едва ли вызвали у чи- читателя чувство недоумения в силу своей простоты и естественности. Следующая операция, которую мы сейчас рассмотрим, уже не обла- обладает этими качествами. Определение 2.3. Пусть А = [ац] и В = [Ьц] — две квадрат- ныв матрицы из R^. Произзгдгнием матриц А и В называется матрица С = [с.ц] ? Rn,n, У которой сц = аиbif -f ai2b2j + ... + ainbn] A) для всех t, /= 1, 2, ..., п. При этом пишут С = АВ. Заметим, что an, Я/2, .-, йщ — элементы ?-й строки матрицы Л, a b\hb2j, ..., bnj — элементы/-го столбца матрицы В. Таким образом, элемент матрицы С, стоящий на пересечении ее ?-й строки и /-го столбца, равен сумме всех произведений элементов i-й строки матри- матрицы Л на соответствующие элементы /-го столбца матрицы В. Такой странный, на первый взгляд, способ умножения квадрат- квадратных матриц объясняется тесной связью этой операции с операцией умножения линейных отображений, которые будут изучаться во второй части нашей книги. Теория матриц находит многие важные применения именно при изучении линейных отображений. Пример 2.7. Пусть 20
Найти АВ и В А. Решение. По определению Аналогично 1 + 1 -2 2-1 + 1.1 I Г4 31 1I + 3.2 (-1I+3. lj — L5 2_|# вл_Г1-2+1(-1) I- 1 + 1 -31Г1 41. tiA~'\2. 2+1(— 1) 2.1 + 1.3J L3 5J Таким образом, Л В ф В А. Пример 2.8. Пусть Г1 3 11 0 2 1, Ll 0 lj 1 2 -3 2 4 6 —13 2 Найти произведение С = [с/у] = АВ. Решение. Вычисляя ct •, получаем Г6 С= 3 [о 6 17 17 11 14 5 -1 Так, с23 = 0 (—3) + 2 • 6 + 1 • 2 => 14. Пример 2.7 показывает, что существуют матрицы Л и В, для которых А В Ф Ф В А, т. е. умножение матрац некоммутативно. Укажем основные свойства умножения матриц: /) А(ВС) = (АВ)С для любых Л, В, C6Rrtfrt, т. е. умножение матриц ассоциативно; 2) для любой матрицы A g Rrttrt имеют место равенства АЕп = = ЕпА = А, где Еп—единичная матрица, т. е. матрица вида rl 0 ... От р _ 0 1 ... 0 -С/г — _о" 6 ..." ij 3) (А+В)С = АС + ВС и А(В + С)=-АВ + АС для любых Л, Bt C,?Rn,n> т. е. умножение матриц дистрибутивно относитель- относительно сложения; 4) а {АВ) = (аА) В = А (аВ) для любых А,В? Яп,п и любого а 6 R. 5) АОп,п = Оп,пА = Оп,п для любой A 6Rrt>rt. Однако из равенства АВ = Оп,п не следует А = Оп%п или В = Ouin\ Действительно, Г1 01Г0 01 _ ГО 01 Lo oJLo ij — Lo oj- Свойства четвертое и пятое достаточно очевидны, свойства вое, второе и третье нуждаются в доказательствах. С^этой целью введем общеупотребительную символику суммирования. " Всякую сумму вида ах + а2 + ... + ап сокращенно обозначим че- п рез 2 щ\ i называется индексом суммирования. Разумеется, вместо i мы могли использовать любую другую букву. 21
В этих обозначениях формула A) для произведения матриц запи- записывается гораздо компактнее: j 2j j Отметим следующие дЕа очевидных свойства знака ]?: /=i i!(fl/+ft/). C) Очень часто приходится иметь дело с суммами, состоящими из слагаемых с двумя индексами. Пусть, например, рассматривается сумма 5 чисел aih где i= 1, 2, ..., k\ /= 1, 2, ..., /г. Попробуем кратко записать эту сумму, пользуясь знаком 2> который мы вве- ввели выше. Числа ац естественным образом составляют матрицу пц al2 ... ct\n ll ^22 ••• @2n D) Пусть bi — сумма Есех элементов f-й строки матрицы D), т. е. п bi = 2 aij" Тогда, очевидно, С другой стороны, если q — сумма всех элементов /-го столбца матрицы D), то k n n I k С/ = 2 я*/ и S = сх + с2 + ... + сп = 2 С/ = 2 2 Таким образом, kin \ п г к =2 и мы видим, что в двойной сумме можно менять порядок суммиро- суммирования. Учитывая это обстоятельство, в случае k — n часто пишут не указывая, в каком порядке идет суммирование. Перейдем к доказательству первого свойства. Пусть А = [пц]> В = [bti], С - [ctj], ВС = [Ь'и], AB = [aiI]t A(BQ = [b]j]t (AB)C = = [ац]. Требуется проверить, что Ьц = ач. 22
Выразим Ьц и а'ц через элементы матриц Л, ВУС: п U V „ U Оц = jLJ alk Vkj- 6=1 п п / п \ п Так как 6^- — 2 &?/?//» то bf-y- = 2 aik 2 &?/?// — 2 /=i 6=i \/=1 У 6=i \/=i В последнем равенстве мы воспользовались формулой B). Аналогичным образом п п / п \ пц= 2j ttikCkj = 2j \\2j CtilOlk) Ckj = 6=1 6=1 \ l=\ 1 2«//b/^/) = 2 В данном равенстве мы использовали независимость двойной суммы от порядка суммирования. Так как мы можем выбирать обозначения, то, меняя местами / и к в последней формуле, получаем \ . \ . Zj dikbkiCij = Ьц. 6=i \/=i / Проверим справедливость второго свойства. Пусть Л = [ац], Еп = [Ьц], АЕп = [Сц]. Так как ?л — единичная матрица, то Ьц = 0, если 1Ф], и Ь/7 = 1, Сц = 2 a>ikbkj = ^t/Ь// = fl//i т. е. Л?,г = Л. Равенство ЕпА = Л полу- получается аналогично. Докажем, наконец, третье свойство. Проверим равенство (A -f В) С = ЛС + ВС. Пусть Л = [а/7], В = [Ь/7], С = [Сц], А + В = разим с// и а// через элементы матриц Л, В, С: п п п п Сц = ^j Ciifikj = ^7j ^//j ~Г С//&; С/5у — ^7j [UikCkj -f- OikCkj) — Za uikCkj ~T 6=1 6=1 6=1 6=1 n В последнем равенстве мы воспользовались формулой C). Далэе п п Ctn = an 4- Ьп z=z У\ ttikCbi ~\~ 2j bitfibi = Сц. tj ij I lJ Jmmk LK KJ I Jimmi IK KJ 4 6=1 6=1 Это означает, что (А + В) С = ЛС + ВС. Доказательство равенства Л (В + С) = АВ + ЛС оставляем чита- читателю в качестве упражнения. Пусть задана матрица Л = [ац] ?Яп,п- Элементы а1Ъ а.1Ъ ..., апп составляют ее (главную) диагональ. Если все недиагональные эле- 23
менты в Л равны нулю, т. е. ац = 0 при хф\л т о Л называется диагональной матрицей. В этом случае часто пишут A = diag[alx, а22, ..., апп]. Если, кроме того, ап = а22 = ... = алл , то Л называется скалярной матрицей. Так, единичная матрица является скалярной. Очевидно, любую скалярную матрицу /г-го порядка можно записать в виде^ /??л при некотором a?R. Пусть [flu ••• flial Г611 ... 6i/l Грп ... pi« 1 [ в=\ ,.••,/>= Дм ... a/aU Lb/i ... &//J ipm\ •-. /WJ есть произвольные квадратные матрицы. Квадратная матрица S вида 'flu ... flift 0 ... О ... О ... О akl ... 0 ... 0 ... 0 ... O-kk 0 0 0 0 ... bn ... bn - 0 ... 0 ... bu ... bu ... 0 ... 0 ... 0 ... 0 ... Pll... 0 0 0 p 0 0 0 ... 0 ... pm\ ... Pmm__ называется квазидиагональной или распавшейся. В зтом случае го- говорят, что S распадается на клетки Л, В, ..., Р, и пишут S = = diag[i4, В, ..., Р]. Квадратная матрица называется верхней (нижней) треугольной, если все ее элементы, расположенные ниже (выше) главной диаго- диагонали, равны нулю. В отличие от операций сложения матриц и умножения матрицы на число произведение матриц АВ определено нами лишь для слу- случая квадратных матриц. Однако формула A), с помощью которой перемножаются А я В, имеет смысл для произвольных матриц А и В, если только длина строки матрицы А совпадает с длиной столб- столбца матрицы Bt т. е. если количество столбцов в А равно количест- количеству строк в В. При этом I должно «пробегать» номера строк матрицы Л, а / — номера столбцов матрицы В. Определение 2.4. Пусть А = [ац] и В = [Ьц] — матрицы раз- размеров k X п и п X s соответственно. Произведением матриц А и В называется k X s-мстрица С = [^/], у которой с ц = ai2b2j + Gi для всех i = 1, 2, ..., k\ j = 1, 2, ..., п. Не следует думать, что это обобщение носит лишь формальный характер. Уже в главе 4 операция умножения прямоугольных мат- матриц найдет содержательное применение. 24
Пример 2.9. Если  3 1 0 2 1 |, В 1 О 1 то АВ -0- но В А не определено. Пример 2.10. 2 3 Л = [1 2 3], jB = | 2 |, ЛЯ = [8], ВА=п\2 4 6 12 3 !]¦ Нетрудно проверить, что для прямоугольных матриц остаются справедливыми (после очевидных уточнений) все свойства квадратных матриц, связанные с умножением. Например, имеет место закон ассо- ассоциативности умножения прямоугольных матриц: если одно из произ- произведений (А В) С у А (ВС) определено, то второе также определено и справедливо равенство (АВ)С = А (ВС). Нам осталось рассмотреть еще одну операцию над матрицами — операцию транспонирования. Эта операция ставит в соответствие каждой матрице A?Rk9n новую матрицу АТdRn,k, которая получа- получается из Л, если строки матрицы А сделать столбцами с теми же номерами. Матрицу Ат называют матрицей, транспонированной к А. Таким образом, если А = то [аи а21 ... a аХ2 а22 ... ak2 пщ 0<2п ... CLkn- Пусть А = [аИ], AT = [alf]. Тогда а'ц^ац. Отметим следующие свойства матриц, связанные с операцией транс- транспонирования: 1) если А и В — такие матрицы, что произведение АВ опре- определено, то определено также произведение ВТАТ и верно равенство (АВ)Т = ВТАТ; E) 2) если А и В — матрицы одинаковых размеров, то (А+В)Т=:АТ + ВТ- 3) если А — произвольная матрица, а — произвольное число, то (аА)Т = а(А)Т- 25
Мы ограничимся доказательством первого свойства» оставляя эле- элементарные доказательства двух остальных читателю. Если А есть k X я-матрица и произведение АВ определено, то В есть п X s-матрица. Поэтому Вт и Ат имеют размеры s X п и п X к соответственно, так что произведение В А действительно определе- определено. Проверим равенство E). Прежде всего заметим, что (АВ)Т и ВТАТ есть матрицы одинаковых размеров s X k. Пусть А ~ [ац], В = [%], Ат = [ац1 Вт" = [Ь'ч], АВ = [сц], (ABf - [си], ВТАТ - [d?j]. Надо до- доказать, что Cii = dih i= I, 2, ..., s; /= 1, 2, ..., Л. Действительно, п п п dij = 2 *//«// = 2 6/i«/z = 2 апЬц =¦ су7 = ci/. Важную роль в теории матриц играют матрицы, не меняющиеся при транспонировании. Их называют симметрическими матрицами. Если А = [ciij] — симметрическая матрица, то АТ = А и, значит, А — квадратная матрица с условием ац = ац. Обратно, всякая квадрат- квадратная матрица с таким условием является симметрической. Упражнения 1. Проверьте, что скалярная матрица порядка п перестановочна с любой квад- квадратной матрицей того же порядка, т. е. (аЕп)В = В (аЕп), В С Rn>Al, a 6 R. 2. Пусть y4 = diag[j4j, ..., Am], ? = diag[?p ..., Bm\, причем для каждого /el, ..., m клетки At и Bt имеют одинаковые размеры. Докажите, что A+B^dlag^+Bu .... Am+Bm], fli4 = diag[fli4lf ..., aAm], «6R, 3. Докажите, что если А и В — верхние (нижние) треугольные матрицы оди- накоЕых размеров, то А -\-В, аА, АВ — тоже верхние (нижние) треугольные мат- матрицы. 4. Докажите, что произведение симметрических матриц является симметричес- симметрической матрицей тогда и только тогда, когда эти матрицы перестановочны. 3. МНОЖЕСТВА И ОТОБРАЖЕНИЯ Понятия множества и отображения принадлежат к основным по- понятиям современной математики, а язык теории множеств является в настоящее время универсальным языком математических теорий. Все дальнейшее изложение в нашей книге основывается на поня- понятиях и фактах, изложенных в этой главе. 3.1. Понятие множества. Операции над множествами В математике постоянно приходится встречаться с различными множествами. Мы говорим о множестве простых чисел, множестве точек на прямой, множестве решений системы линейных уравнений и т. д. Понятие множества настолько общее, что обычно его рас- 26
сматривают как первичное математическое понятие, не требующее определения. Будем понимать под множеством любую совокупность объектов, называемых элементами множества. Тот факт, что а есть элемент множества Л, символически записывается так: а?А (а принадлежит Л). Запись а?А означает, что а не является элементом Л. Если множество А выделяется некоторым свойством Р9 присущим только элементам из Л, то это множество удобно записывать в виде Л = {а | а удовлетворяет свойству Р). Так, если Л—множество всех делителей целого числа пу то Л ={a?Z\n = aqy где q^Z). Множество, состоящее из конечного числа элементов, может быть описано перечислением всех элементов. Например, {1, 2, 3, 6} — множество всех положительных делителей числа 6. В случае, ког- когда Л — конечное множество, \А\ будет обозначать число всех эле- элементов из Л. Если каждый элемент множества Л принадлежит множеству В, то говорят, что Л есть подмножество множества ?, и пишут Л а В (А содержится в В). Равенство множеств А и В (А = В) означает, что Acz В и BczA. Так, множества решений двух эквивалентных линейных систем равны. Иногда мы не знаем заранее, содержит ли данное множество (например, множество действительных корней некоторого алгебраи- алгебраического уравнения) хотя бы один элемент. Поэтому целесообразно ввести понятие пустого множества, т. е. множества, не содержаще- содержащего ни одного элемента. Пустое множество принято обозначать сим- символом 0. Будем считать, что любое множество содержит 0 в ка- качестве подмножества. Нередко вместо выражения «множество элементов такого-то вида» будем говорить «семейство элементов такого-то вида». Это поможет избежать неудачных словосочетаний типа «множество множеств». Рис. 3.1 Рис 3.2 Пусть Л и В — произвольные множества Их объединением А [} В называется множество, состоящее из всех элементов, принадлежащих хотя б а одному из множеств Л, В (рис. 3.1), т. е. Л U В ={с\сеА или сеВ}. Аналогично определяется объединение любого (конечного или бесконечного) семейства множеств {Л;}, i ? /: U Ai={a\ существует i?I такое, что a?Ai]. 27
Пересечением множеств А к В называется множество А [\ В, со- состоящее из всех элементов, принадлежащих как Л, так и В (рис. 3.2). Таким образом, А П B = {c\c?A и сеВ}. Аналогично П At ={c\ для каждого i?I, с6Л/}. Разностью множеств Л и Б называется множество Л\В, со- состоящее из всех элементов, принадлежащих Л и не принадлежащих В (рис. 3.3), т. е. Если 5 d Л, то Л \ 5 называют дополнением к В в А. Для любых непустых множеств Л и 5 опре- определяется декартово произведение А X В этих множеств. По определению А X В есть мно- множество всех упорядоченных пар (а, Ь), где а?А, Ь?В. При этом предполагается, что Рис- 3-3 (al9 &i) = (a2, 62) тогда и только тогда, ког- когда ах =а2, Ь± == 62. Итак, Л Хй={(а, &)|а?Л, Пример 3.1. Пусть А == {яь д2}, 5 = {&ь Ь2, Ь3]. Тогда Л X В= {(flbNW, (fli, Ь2)# (^ь &з). («2, bi), (д2, Ь2), (а2, Ьз)}. Аналогично определяется декартово произведение трех и более множеств. Например, АхВ X С = {(a, b, c)\a?A, b?B, с?С}. При этом (аъ Ьъ сг) = (а2, b2i c2) тогда и только тогда, когда аг = а2, В том случае, когда множества Л и В совпадают, декартово про- произведение А X В называют декартовым квадратом множества А и Еместо Ах А часто пишут Л2. Важность понятия декартова произ- произведения станет очевидной, если вспомнить, насколько плодотворным оказалось отождествление множества точек плоскости с R2, т. е. с декартоЕым квадратом множества действительных чисел. Упр ажнения 1. Докажите, что число Есех подмножеств мнсжества, ссстсящего из п эле- элементов, равно 2я. 2. Докажите, что для любых множеств А, В, С справедливы формулы А П (В U С) = (Л п В) U (Л П С), А[)(В пС) = (А[) В)(](Л[} С). 3. Пусть {#/}, i?l, — семейство подмножеств множестиа А. Докажите, что A\UBt = П (A\Bt), А\{\В( = U (Л\?.). 4. Пусть Л и В — конечные множества, причем |Л| = s, |В| = /. Проверьте чю \А X В| = st, \A[) B\ = s + t — \A(\ B\. 2S
3.2. Отношение эквивалентности Рассмотрим множество целых чисел Z. Между элементами этого множества существуют различные отношения. Так, если a, b?Z, то а либо делит Ь, либо не делит. В первом случае говорят, что а находится в отношении делимости к Ь. Совсем другой пример отно- отношения возникает при изучении вопроса о взаимно простых числах. Если числа а и Ь взаимно простые, то говорят, что а и Ъ находят- находятся в отношении взаимной простоты. Еще один пример отношения на множестве Z дает отношение порядка: число а находится в от- отношении порядка к числу &, если а^Ь. Заметим, что в первом и третьем примерах порядок элементов а и Ь играет существенную роль. Действительно, из того, что а де- делит Ь, вовсе не следует, что Ь делит а. Другими словами, нельзя путать делитель и делимое. Что же такое отношение? Как дать определение этого понятия, пригодное при изучении любых множеств? Пусть Л — произвольное непустое множество. Очевидно, задание на множестве Л отношения равносильно описанию всех пар (а, Ь) элементов из Л, связанных этим отношением. При этом, как уже указывалось, важен порядок элементов пары. Но множество всех упорядоченных пар элементов из А мы называли (см. § 3.1) декарто- декартовым квадратом множества А. Таким образом, всякому отношению R на множестве А соответствует некоторое вполне определенное под- подмножество Л2, состоящее из Есех пар (а, Ь), таких, что а находится в отношении R к Ь. Это подмножество содержит всю информацию об отношении R. До сих пор мы доеольствоезлись интуитивным восприятием по- понятия отношения, навеянным конкретными примерами. Приведенное рассуждение делает естественным Определение 3.1. Пусть А — произвольное множество, А ф&. Всякое подмножество Ra Л2 называется (бинарным) отношением, заданным на множестве Л. Говорят, что элемент а из А нахо- находится в отношении R к элементу Ъ из А, и пишут aRb, если па- пара (ау Ь) 6 R. Указанные три отношения на множестве Z можно теперь опре- определить так: #! = {(а, Ь) е Z2 | а делит Ь), ^2 = {(я» Ь) 6 Z2 | а и Ь взаимно просты}, Важную роль в математике играет один специальный класс от- отношений — отношения эквивалентности. Определение 3.2. Отношение R на множестве А называет- называется отношением эквивалентности, если оно .обладает следующими свойствами: 1) aRa для любого а?А (рефлексивность)', 2) если aRb, то bRa (симметричность)', 3) если aRb и bRc, то aRc (транзитив- (транзитивность). Обозначим отношение эквивалентности символом ~. 29
Очевидно, R2 есть отношение эквивалентности на множестве Z, но Ri и R3 таковыми не являются. Важность понятия отношения эквивалентности объясняется в первую очередь тем, что оно тесно связано с разбиением множества на классы. Если множество А представлено тем или иным способом как объединение своих попарно непересекающихся подмножеств, то го- говорят о его разбиении, а входящие в это разбиение подмножества называют классами разбиения. Например, множество точек плоскос- плоскости можно разбить на прямые, параллельные оси х\ множество це- целых чисел разбивается на классы, состоящие из чисел, дающих один и тот же остаток при делении на фиксированное натуральное чис- число п. В первом случае имеем бесконечное семейство классов, во вто- втором случае классов разбиения будет ровно п. Покажем сначала, что каждое отношение экв ивалентности на множестве А задает некоторое вполне определенное разбиение А. Пусть Ка—класс элементов из Л, эквивалентных фиксированному элементу а, т. е. Ка = {с 6 А \ с ~ а}. В силу свойства рефлексивности а?Ка- Покажем, что любые два класса Ка и Кь, имеющие общий элемент, совпадают. Пусть эле- элемент с принадлежит одновременно Ка и Кь, т. е. с ~ а и с ~ Ь. В силу симметричности а ~ с, и в то же время с~Ь. Используя транзитивность, заключаем, что а ~Ъ. A) Пусть теперь х— произвольный элемент класса Ка- Тогда х~а, и в силу A) и свойства транзитивности х ~ Ьу т. е. х ? Кь- Этим дока- доказано включение Ка cz Кь- Точно так же доказывается, что Кь cz Ka. В итоге Ка = Кь, т. е. Ка и Кь — различные обозначения одного и того же подмножества из Л. Итак, мы видим, что всякий элемент из А лежит в некотором классе и различные классы не пересекаются. Тем самым получается разбиение множества А на классы эквивалентных элементов. Рассмотрим теперь произвольное разбиение множества А на клас-* сы. Два элемента а и Ъ из А будем считать эквивалентными (а~ Ь), если они лежат в одном классе. Тривиально проверяется, что ~ есть отношение эквивалентности на множестве Л. Таким образом, отношение эквивалентности дает универсальный способ разбиения множества на классы. Упражнения 1. Пусть А — конечное множество и \А\ =• п. Сколько различных отношений существует на множестве Л? 3.3. Отображения О пред ел ени е 3.3. Пусть X и Y — произвольные непустые множества. Будем говорить, что определено отображение мно- множества X в множество Y, если каждому элементу х множества X 30
поставлен в соответствие некоторый вполне определенный элемент у множества Y. Этот элемент у называется образом элемента х при данном отображении. Отображение часто обозначают одной буквой (например, /), и тогда символ /: X $ Y заменяет фразу «/ — отображение множества X в множество Y». Образ элемента х при этом отображении обозна- обозначается символом f(x). Подчеркнем, что каждый х?Х имеет единст- единственный образ f(x). Отображение /: X?Y можно представлять себе как некое дей- действие, которое переводит элементы х-+Х в их образы f(x)?Y. Пример 3.2. Если каждому действительному числу х поставить в соответствие число д;2, то тем самым будет определено отображение /:R-*R. Это отображение встречается в школьном курсе математики, где оно фигурирует как функция у = х2. Пример 3.3. Есякую ф^нкиию действительного переменного у — ф (х) можно рассматривать как отображение некоторого подмножества X из R в R. Здесь X — область определения функции. При этом каждому х?Х ставится в соответствие действительное число ф (х) (рис. 3.4). Рис. дЛ Рис. 3.5 Понятия «функция» и «отображение» иногда отождествляют, поль- пользуясь ими как синонимами. Все же .чаще под функцией понимают отображение одного числового множества в другое. Мы будем при- придерживаться именно такой точки зрения. Пример 3.4. Пусть X — множество точек плоскости. Выберем в X какую-ни- какую-нибудь точку О. Тогда поворот плоскости вокруг точки О на угол а естественны?^ образом задает отображение f:X->X, при котором / (М) = Мг (рис. 3.5). Пример 3.5. Пусть X = |хь х2, ..., xnj — конечное, а У— произвольное мно- множества. В этом случае отображение /: X -» Y удобно записывать таблицей f(x{) f(x2) ... f(xn))t где ниже элемента х из X указан его образ f (х). Так, если X = A, 2, 3, 4}, та отображение /: X -» X с таблицей (I 2 3 4\ 13 1 4 I переводит 1 в 3, 2 в 1, 3 в 4, 4 в 1, Равенство отображений f: X->Y и g: X'-+Y' Х = Х/, Y = Y\ и для каждого х?Х }(x)=g(x). означает, что
Пусть /: X-+Y. Множество /(X) = {/ (х) \ х? X} образов всех эле- элементов из X называется образом множества X при отображении f. Аналогично определяется образ любого подмножества А множест- множества X: Пусть у — фиксированный элемент из У. Подмножество множества X, состоящее из всех тех х?Х, для которых у является образом при отображении /, называется полным прообразом элемен- элемента у при отображении /. Каждый элемент из /-1 {у) будем назы- называть прообразом элемента у при отображении /. Может случиться, что /-1 (у) = 0 для некоторого у ? У. Если В — произвольное подмножество У, то его полный прообраз определяется аналогично Пример 3.6. Рассмотрим отображение /: R -> R, гдг f(x) = х2 для любого х ? R, Тогда /-*(!) = {1, ^1), Г!@) = W.r^-l) =-0- Наиболее важные классы отображений составляют инъективные, еюръективные и биективные отображения. Отображение /: X ->¦ Y называется инъективным или инъекцией^ если для любых хъ х2Х Другими словами, / инъективно, если разные элементы множества X имеют разные образы при отображении /. Отображение /: Х->У называется сюръективным или сюръек- цией, если /(X) = У, т. е. если каждый элемент множества У имеет хотя бы один прообраз. Отображение, которое одновременно инъективно и сюръективно, называется биективным или биекцией. Часто биекцию называют взаимно однозначным отображением. Очевидно, /: Х->У биектив- биективно тогда и только тогда, когда каждый элемент множества У имеет точно один прообраз. Пример 3.7. Пусть X =» {1, 2, 3), К =» {1, 2). Тогда отображение /: X -* Y, где 2 3 2 1 сюръехтивно, но не инъективно, а отображение g: У -> X, где 2={2 з) инъективно, ноне сюръективно. Пример 3.8. Рассмотрим функцию у = \gx. Ее область определения есть мно- множество всех положительных действительных чисел. Поэтому она задает отображе- отображение /: @, + оо) -> R. Имея перэд собой график логарифмической функции, легко понять, что / — биективное отображение (рис. 3.6). 32
Рис. З.Ь Пусть задано отображение / : X -> Y и X' — некоторое подмножество множества X. Тогда можно рассмотреть отображение f\X':X'-+Y, определяемое равенством f\X'(x) = f(x) для любого х?Х'. Отобра- Отображение f\Xf называется ограничением {сужением) отображения f. В нашем учебном пособии особенно часто будут встречаться отображения множеств в себя, т. е. отображения ви- вида f:X->X. Такие отображения назы- называют преобразованиями множества X. Биективные преобразования / : X -> X на- назовем подстановками мнооюества X. Преобразование ex: X-+X, такое, что ех {х) = х для любого х ? X, называется тождественным преобразованием мно- множества X. Таким образом, ех оставляет на месте каждый элемент из X. Часто вместо ех пишут просто е, если из контекста ясно, какое множество X имеется в виду. Упражнения 1. Докажите, что если X и У — конечные множества, причем |Х| = я, \У\ =&, то число различных отображений множества X в множество Y равно kn. 2. Определите, какие из отображений, задаваемых с помощью перечисленных ниже функций, инъективны, сюръективны, биективны: у = 2х — 1, у = sin х, у = х3, у = 2х, у = lg \x\. 3. Докажите, что если X — конечное множество, то инъективность отображе- отображения / : X -» X равносильна его сюръективности. 3.4. Умножение отображений Пусть имеются два отображения вида /:Х->7; g:Y->Z. Выберем произвольный элемент х ? X и применим к нему отображе- отображение /. Под действием / элемент х перейдет в элемент у = f{x) из множества Y. Если теперь к элементу у применить отображение g", то у перейдет в элемент z = g{y) из множества Z. В результате каждому х?Х ставится в соответствие вполне определенный эле- элемент z = g(f(x)) множества Z (рис. 3.7). Таким образом, последова- последовательное применение отображений fug приводит к отображению множества X в множество Z, которое называется произведением (или композицией) отображений g и /. Так как произведение отображе- 2 Зак. 3670 33
ний g и f переводит элемент х ? X в элемент g(f(x)), то это произ- произведение естественно обозначать символом g о f или просто gf. По определению (g ° f) (х) = g(f(x)) для любого х?Х. Отметим, что произведение отображений g:X' -+Y' и / : X ->- Y определено лишь в случае, когда X' = Y. В частности, может слу- случиться, что gof определено, a /og не определено. Очевидно, если fug — преобразования множества X, то определены оба произведе- произведения gof и fog. Они также являются преобразованиями X. Пример 3.9. Пусть Х= {1, 2, 3}. Рассмотрим следующие два преобразования множества X: г fl 2 3\ /1 2 3\ ' - U 1 lj и ?-B 3 \у Посмотрим, как произведение gof-.X-^X действует на элементы множества X: (*°Я О) = * (/Н2) /1 2 3\ /12 3\ Итак, gо f = I . ^ о)- Аналогично получаем, что f°g= li t о . Таким об- образом, g о f ijk f о g и, следовательно, произведение отображений, вообще говоря, зависит от порядка сомножителей. Пример 3.10. Пусть / и g — преобразования множества R, соответствующие функциям у = sin х и у = х2, т. е. / (х) = sin x, g (х) = х2 для каждого х С R. Произведения gof и / о g определены и (gof) (х) = g (/(*)) = g (sin jc) = (sin xJ, (f о g) (X) = / (gr(^)) = / (x2) = sin д:2. Очевидно, g о f ^ / o g. Заметим, что операция умножения преобразований множества R называется в математическом анализе суперпозицией функций, так что g о f — сложная функция, а под произведением функций понимается совсем другая операция, использующая умножение действительных чисел. Важнейшее свойство умножения отображений — его ассоциативность. Теорема 31. Пусть f, g, h — три таких отображения, что одно из произведений {h°g)of, ho (gof) определено. Тогда определено и другое произведение, причем (hog)of = ho(gof). ^ Пусть, например, определено ho (gof). Если f:X-*Y, то g должно быть отображением вида g:Y-*-Z. Но тогда gof:X-+-Z и, значит, h :Z-+U. Проверим, что (hog)o f тоже определено. Действительно, hog определено и ho g:Y-*U Следовательно, определено и (h о g) о Д причем (h о g) о f : X ->• U. Покажем теперь, что отображения (hog) of и h о (g о f) равны, т. е. для каждого х G X Имеем ((hog) о f) (X) =(hog) (f(X)) = h(g(f(X))), (ho (go f))(x) = h((g о f)(x)) = h(g(f(x))). 4 Опираясь на понятие произведения двух отображений, можно определить композицию трех, четырех и более отображений. 34
Пусть, например, fx, /2, ..., fk—преобразования множества X. Их произведение fko ...of2cf1 определим индуктивно: f2ofi уже определено, /3 ° /2 ° /i = /з ° (/2 ° /i) и> вообще, если i < fe и Д о ...о /2 о Д уже определено, то положим • Д-+1 ° ft ° ••• ° /2 °/i = Д4-1 ° (А* ° ••• ° /2° /i)- Пользуясь ассоциативностью умножения отображений, нетрудно доказать, что справедливо Предложение 3.1. fk ° ••• ° /н-i ° ft ° »-°fi= (fk °... о/ж) ° (А ° ••• с/х) для любого 1 ^ i < &. Укажем еще несколько важных свойств композиции отображений. Теорема 3.2. Пусть f:X-+Y9 g:Y-+Z, /г---go/. Тогда: 1) если fug инъективны, то и h инъективно; 2) если fug сюръективны, то и h сюръективно; 3) если fug биективны, то и h биективно. > Очевидно, третье свойство есть прямое следствие первых двух. Пусть / и g — инъекции. При любых хь х%?Х, ххфх29 f(xx), f (x2) 6 Y и / (Хх) Ф f (х2) в силу инъективности /. Но тогда g (/(^i)) Ф ?=g(f(x2)) из-за инъективности g. Это доказывает инъективность /г, так как и, следовательно, /г (хх) ^ /г (х2). Пусть теперь fug сюръективны. Надо доказать, что и h:X-+Z сюръективно, т.е. h(X)=Z. Обозначим буквой z произвольный элемент множества Z. Так как g:Y-+ Z сюръективно, то существу- существует хотя бы один элемент y?Y, такой, что g(y) = z. В свою оче- очередь, из сюръективности f:X-+Y вытекает существование такого элемента х ? X, что f(x) = y. Но тогда h(x)=g (f{x)) =g(y)=: z, т. е. h{X) = Z. 4 Особую роль при умножении отображений играет тождественное отображение. Именно: если /:X->F, то f ° вх — / и ey°f=f. Проверим, например, справедливость первого равенства. Для лю- любого х?Х (f°ex)(x)=f(ex(x)) = f(x), т. е. / о ех = /. В случае, когда / — преобразование множества X, имеем / о ех = ех о / = /. Упражнения 1. Пусть Л' — плоскость, а / — ее произвольная пря- прямая. Симметрией (отражением) плоскости относитель- относительно прямой I называется преобразование / : X -» X, кото- которое каждую точку плоскости А переводит в точку В, сим- симметричную А относительно / (рис. 3.8.) Покажите, что композиция двух симметрии относительно пересекающихся прямых плоскости X есть поворот плоскости вокруг точ- Рис. 3.8 ки пересечения этих прямых. Определите угол поворота. 2. Постройте пример таких отображений / и g, что: 1) / не сюръекшвно; 2) g не инъективно; 3) gof биективно. 2* 35
3.5. Обратное отображение Пусть/:Х->У — биективное отображение. Тогда для любого элемента у ? У существует единственный элемент х 6 X, такой, что f(x)=y. Отображение f~l :У->Х, которое ставит в соответствие каждому у 6 У его прообраз х ? X при отображении /, называется обратным к /. Таким образом, если / переводит х в у, то /-1 пе- переводит у в х. Инъективность и сюръективность отображения /-1 очевидны, и, следовательно, для любого биективного отображения обратное к не- нему тоже биективно. При этом (f~l)~l = /» т- е- обратное отображе- отображение к /-1 совпадает с /. Пример 3.11. Пусть Х= {1, 2, 3, 4} и г /1 2 3 41 ' ~ B 3 4 1/ есть подстановка множества X. Тогда 2 3 4\ 1 2 3)' Действительно, так как / переводит 4 в 1, то f~x переводит 1 в 4; / пере- переводит 1 в 2 и, значит, f~~x переводит 2 в 1 и т. д. Пример 3.12. Если / — поворот плоскости вокруг точки О на угол а, то f~~l — поворот плоскости вокруг той же точки на угол —а. Пример 3.13. Пусть f:R-+(O, +оо), где / (х) = 10* для каждого х ? R. Тогда f~l : @, +оо) -> R, где f~l (у) = lg г/ для каждого у ? @, +оо). Очевидно, определены композиции f~~l°f и Д0/", причем Действительно, f-lof:X-±X и для любого х[?Х Аналогично проверяется второе из равенств A). Следующая теорема показывает, что равенства A) можно ис- использовать в качестве определения обратного отображения. Теорема 3.3. Если для отображения f: X->Y существует отображение g'.Y-t-X, такое, что g о f = ех и f о g = eYt то f би- биективно и g = /~~!. ^ Пусть л*, х2?Х таковы, что f(xx) = f(x2). Тогда и g(f(xx)) = = g"(/(x2)), или g о f (xx) = g о f (x ). B) Но go f = ex, так что из B) следует хх = х2. Это доказывает инъек- инъективность /, так как из ххфх2 вытекает f(xx)^f(x2). Переходя к доказательству сюръективности /, рассмотрим произ- произвольный элемент у 6 У: У = eY (у) = fog(y) = f (g(y)), т. е. у имеет по меньшей мере один прообраз g(y). Итак, / сюръек- тивно, а поэтому и биективно. Проверим, наконец, что g = f~l. Действительно, композиции 36
g°(f° f~{) и (S°f)° f~l определены и в силу ассоциативности ум - ножения отображений g ° (f ° /~!) = (g ° /) ° /~!. Но g°(f ° f~~l) — = goeY = g, a (gof)of-i^exof-l=f-K ^ Итак, мы видим, что обратное отображение к отображению f:X-^Y можно определить, как отображение g:Y-^X, для ко- которого g о f =ех и / о g — eY . При этом g существует тогда и толь- только тогда, когда / биективно. Предложение 3.2. Если f:X-+Y и g:Y-+Z — биещии, то (g°f)~l=f-l°g-1. > gof:X->Z. Так как g~l:Z-+Y, f~l:Y-*X, то f~log^: :Z-+X. Пусть х?Х, f(x)=y, g(y)=z. Тогда (gof)(x) = z, z?Z, (f~l о g~l) (г) = f-^g-Kz)) - /-1 (У) - x. Итак, если g о f переводит х в z, то f~l э g-1 переводит 2 в х, т. e.f~log—i — обратное отображение к go/. ^ Пусть / : Х-> Y — произвольное отображение. Если у ? F, то пол- полный прообраз элемента у при отображении / обозначается симво- символом f~l (у). В случае, когДа / биективно, символ f~{ имеет уже самостоятельное значение и /-1 (у) можно понимать как образ эле- элемента у при отображении /-1. Никакой путаницы, однако, по этой причине не происходит, так как в данном случае полный прообраз элемента у при отображении / состоит из одного элемента — обра- образа у при отображении /-1. Упражнения 1. Приведите пример отображений / i X -* Y и g :Y-» X, таких, что go f = = ех, но fog^ey. 3.6. Перестановки и подстановки В дальнейшем нам понадобятся некоторые дополнительные све- сведения о подстановках конечных множеств. Пусть X — конечное множество, состоящее из п элементов. Эти элементы можно перенумеровать с помощью первых п натуральных чисел. Так как природа элементов множества X для нас не важна-, то будем считать, что Х = {1, 2, ..., п}. Всякое преобразование / множества X будем записывать так: М 2 ... я /О) /B) ... f(n) Если / — подстановка, т. е. биективное преобразование, то в стро- строке /A), /B), ..., f(n) выписаны все числа 1, 2, ..., п без повторе- повторений, только, может быть, в другом порядке. Строки такого вида называются перестановками из п чисел. Таким образом, переста- ковка из п чисел — это расположение чисел 1, 2, ..., п в некото- некотором определенном порядке. Две перестановки из п чисел различа- различаются порядком элементов, но не элементами. Пример 3.14. 1, 2, 3, 4; 3, 1, 2, 4; 4, 2, 1, 3 — различные перестановки из четырех чисел. 37
Итак, если / — подстановка множества X, то нижняя строка A) есть• некоторая перестановке из п чисел. Обратно, если аъ аг, ..., ап — произвольная перестановка из п чисел, то преобразование г ( 1 2 ... п ( ах а2 ... ап множества X является, очевидно, подстановкой. При этом различ- различным перестановкам соответствуют различные подстановки. Теорема ЗА. Количество различных перестановок из п чисел равно п!. > Доказательство проведем индукцией по п. При п = 1 утвер- утверждение теоремы очевидно. Будем считать, что п > 1 и число раз- различных перестановок из п—1 чисел равно (п— 1)!. Разобьем множество всех перестановок из п чисел на классы, состоящие из перестановок с одинаковым последним числом. Таких классов будет ровно п. Перестановок, лежащих в одном классе с перестановкой alf a2i ..., ап, будет столько, сколько существует раз- различных перестановок из чисел аъ а2, ..., ап—и т- е- (п—!)'• Так что каждый класс содержит ровно (п—1)! перестановок. Но тогда число всех перестановок из п чисел равно п(п—1)! = п\. ^ Следствие 3.1. Число всех подстановок множества X из п элементов равно п\ Пример. 3.15. Выпишем все перестановки из трех чисел: 1, 2, 3; 1, 3, 2; 2, 1, 3; 2, 3, 1; 3, 1, 2; 3, 2, 1. Так как число различных перестановок из трех чисел равно 3! = 6, то других перестановок нет. Определение 3.4. Пусть аъ а2, ..., ап A) есть перестановка из п чисел. Подмножество {1,]'}(={1, I}) множе- множества {1, 2, ..., п} называется инверсией в перестановке A), если большее из этих двух чисел стоит в перестановке A) перед мень- меньшим. Если же большее из чисел i, j стоит в A) после меньшего, то подмножество {I, /} называется порядком в перестановке A). Пример 3.16. В перестановке 3, 5, 4, 1, 2 {3, 4}—порядок, а {3, 1} — инверсия. Определение 3.5. Перестановка называется четной, если она содержит четное число инверсий. В противном случае пере- перестановку называют нечетной. Пример 3.17. Определить характер четности перестановки 3, 5, 4, 1, 2 B) Для этого выпишем все инверсии перестановки B): 3, 1}, {3, 2}, 5, 4}, {5, 1}, {5,2}, 4, 1}, {4, 2}, 38
Так как их оказалось семь, то B)—нечетная перестановка. Пример 3.18. Перестановка 1, 2, ..., п имеет 0 инверсий и поэтому является четной. Пусть th, Ъ2% .... Ьп C) и съ съ ..., сп D) есть две перестановки из п чисел, а / — подстановка множества X. Будем говорить, что подстановка / переводит перестановку C) в перестановку D), если f(bt) = ch i=l, 2, ..., п. Таким образом, фраза «применить к перестановке C) подстановку /» будет озна- означать «заменить перестановку C) перестановкой /(fei), f(b2), ..., f (bn)». Особый интерес для нас будут представлять подстановки одного специального вида. Подстановка / множества X называется транс- транспозицией, если для некоторой пары чисел j, j?X, 1ф\, /@=/, f{j) = i, а всякое другое число из X f оставляет на месте. Такую транспозицию удобно обозначать символом (*, /) (не путайте с эле- элементом множества X2!). Очевидно, (j, /) = (/, i) — равенство отобра- отображений. Если транспозицию (j, /) применить к перестановке то, очевидно, получится перестановка где многоточия указывают числа, остающиеся без изменения. Таким образом, после применения к перестановке транспозиции (i, j) эле- элементы i, j меняются местами. Теорема 3.5. Если к перестановке один раз применить транс- транспозицию, то характер четности ее изменится на противопо- противоположный. ^ Рассмотрим сначала случай, когда транспозиция (j, /) приме- применяется к перестановке ..., I, /, .-, E) в которой числа i, j стоят рядом. В результате получается пере- перестановка ..., /, i, ... F) Число инверсий в перестановке F) на единицу больше или меньше, чем в E). Действительно, взаимное расположение чисел i, j с остальными числами, входящими в перестановки E), F), не изме- изменилось. В то же время, если {i, /} — инверсия в E), то {i, j} — по- порядок в F), если же {*',/} — порядок в E), то{/,/} — инверсия в F). Пусть теперь транспозиция (i, j) применяется к перестановке .... *\ аь .-, as, /, ... G) 39
Эта транспозиция переводит G) в перестановку ..., /, а19 ..., as, i, ... (8) С другой стороны, перестановку (8) можно получить из переста- перестановки G), применяя последовательно транспозиции (j, ах), (i,a2), ..., (г, as), (?, /), (/, as), (/, as-i), ..., (/, ^x). Всего s+ 1 + 5 = 2s + 1 транспозиций. Так как на каждом шаге меняются местами соседние числа, то, согласно уже доказанному, всякий раз мы теряем или приобретаем точно одну инверсию, т. е. изменяем характер четности перестановки на противоположный. Теперь ясно, что характеры четности перестановок G) и (8) различны. Следствие 3.2. Если п > 1, то количество всех четных пе- перестановок из п чисел равно количеству всех нечетных перестано- перестановок из п чисел и, следовательно, равно п\/2. > Обозначим буквой а количество всех четных перестановок из п чисел, а буквой Ъ — количество всех нечетных перестановок из п чисел. К каждой из четных перестановок применим одну и ту же транспозицию. Все полученные в результате этого перестановки нечетны и различны, их число равно а. Следовательно, а ^ Ъ. Ана- Аналогично доказывается, что Ь^а. В результате а—Ь и, так как различных перестановок из п чисел ровно п\у получаем а =•• b = = п\/2. 4 Предложение 3-3. Пусть п > 1. От любой перестановки из п чисел можно перейти к любой другой перестановке из п чисел, последовательно применив несколько подходящих транспозиций. ^ Пусть аъ а2, ..., ап (9) и Ьг, &а, ..., Ьп A0) есть произвольные перестановки из п чисел. Если ахФЬъ то, при- применив к перестановке (9) транспозицию (аъ Ьх), получим переста- перестановку из п чисел вида Ьъ с2, ..., сп. A1) Если с2ФЬ2, то применим к перестановке A1) транспозицию (с2, Ь2). В результате получим перестановку вида bXy b2, d3, ..., dn. Продол- Продолжая этот процесс, получаем требуемое. ^ Пример. 3.19. Найти последовательность транспозиций, переводящую переста- перестановку 1, 2, 3, 4 в перестановку 4, 1, 2, 3. Решение. Записываем A, 4) B, 1) C, 2) 1, 2, 3, 4, —>4, 2, 3, 1, >4, 1, 3, 2, —>4, 1, 2, 3, так что A,4), B, 1), C, 2) — искомая последовательность транспозиций. Вернемся к изучению подстановок конечного множества. Для любых двух подстановок fug множества X определено произведе- 40
ние gof, которое снова есть подстановка X. Договоримся вместо gof писать в дальнейшем gf. Пример 3.20. Пусть * /1 2 3\ A2 3\ I- \2 3 1> g== [3 1 2)' Проверить, что at (l 2 3^ 8f=[l 2 3)' Решение. Действительно, gf A) = g (/A)) = g B) = 1; gf B) = g (/B)) = C) 2 /C)(/C))(l) 3 Так как всякая транспозиция множества X есть подстановка этого множества, то транспозиции можно перемножать. При этом произведение транспозиций есть некоторая подстановка множества X, но, как правило, не транспозиция. Пример 3.21. Если Х= {1, 2, 3}, то произведение A,3)A, 2) = (* I 3) не является транспозицией. Теорема 3-6. Всякую подстановку конечного множества X, со- содержащего не менее двух элементов, можно представить в виде произведения транспозиций этого множества. > Если е — тождественная подстановка множества X, то е = = (*\ /) (*\ /)> гДе 0> /) — любая транспозиция X. Пусть / = М 2 ... п\ \ах а2 ... ап) есть произвольная нетождественная подстановка X. Рассмотрим пе- перестановки 1, 2, ..., п A2) и- аъ аъ ..., ап. A3) Согласно предложению 3.3, существует последовательность транс- транспозиций tu t2, -., tk, переводящая перестановку A2) в перестанов- перестановку A3). Это означает, что для любого i ~ 1, 2, ..., п h ... Vi @=^- Но тогда / /f A 2 ... п Л 21 W а2 ... a т. е. / = /Л ••• ^х. Ч Пример. 3.22. Представить подстановку A 2 3 4\ U 3 1 2) в виде произведения транспозиций. 41
Решение. Найдем последовательность транспозиций, переводящих переста- перестановку 1, 2, 3, 4 в перестановку 4, 3, 1, 2: A, 4) B, 3) A, 2) lf 2, 3, 4—> 4, 2, 3, 1 >4, 3, 2, 1 >4. 3, 1, 2 Следовательно, A 2 3 4"l П 9^ Г9 ^ Л ^ Разложение подстановки в произведение транспозиций определе- определено не однозначно. Так, например, к любому такому разложению всегда можно приписать произведение (i, /) (i, /) = е. Однако верна Теорелга 3.7. Характер четности числа сомножителей в раз- разложении подстановки в произведение транспозиций не зависит от выбора разложения. )> Пусть х /1 2 ... п\ \а± а2 ... ап I и f = tk ••• tjx — произвольное разложение / в произведение транс- транспозиций. Покажем, что k имеет тот же характер четности, что и перестановка аъ а2У ..., ап. В самом деле, так как f = tk ... t2tx, то для любого t = l,2,..., n tk ... tJ\{i) ~ &v Это означает, что последовательность транспозиций tx, to, ..., tk переводит перестановку 1, 2, ..., п в перестановку аъ аъ ..., ап. Но перестановка 1, 2, ..., п четная, а каждое приме- применение транспозиции меняет характер четности перестановки. Поэто- Поэтому число k является четным тогда и только тогда, когда переста- перестановка аъ а2, ..., ап четная. Это доказывает теорему. ^ Определение 3.6. Подстановка называется четной, если она разлагается в произведение четного числа транспозиций, и нечет- нечетной в противном случае. Из доказательства теоремы 3. 7. следует Предложение 3.4. Подстановка f==(l 2 ... п \ \ах а2 ... ап1 является четной тогда и только тогда, когда аъ а2, ..., ап — чет- четная перестановка. Следовательно, количество четных подстановок из п чисел равно п\12. Предложение 35. Подстановки f и f~l имеют один характер четности. > Достаточно проверить, что если / = tk • • • t2tx — произведе- произведение транспозиций, то /-1 = txt2 • • • tk. «4 В заключение сделаем одно полезное замечание. Подстановку f _ / 1 2 ... п \ /-U/n д2) ... f(n)l иногда удобно записывать в виде ' \/Ы /(а2) ... tiflV* { ' 42
где аъ а2, ..., ап — некоторая перестановка из п чисел. Так, если fl\ 2 ... п \ах а2 ... ап то ^ "Ml 2 ... X* При необходимости всегда можно перейти от записи A4) к обычной записи. Пример 3.23. D 1 3 2\ (\ 2 3 4\ \1 3 4 2J ~ \3 2 4 lj* 4. ОПРЕДЕЛИТЕЛИ Понятие определителя естественно возникает при решении ли- линейных систем, у которых число уравнений совпадает с числом не- неизвестных. Пользуясь этим понятием, можно указать формулы, ко- которые (при выполнении некоторого условия) дают решение такой системы через ее коэффициенты и свободные члены. Заметим, что роль теории определителей в математике гораздо шире затронутой здесь темы. В нашем пособии мы будем часто об- обращаться к ним при изучении линейной алгебры. 4.1. Определители второго и третьего порядков с двумя не A) Рассмотрим систему двух линейных уравнений с двумя неиз- неизвестными atlxt + al2x2 = bl9] коэффициенты которой пц 6 R составляют квадратную матрицу вто- второго порядка ап а12] а2Х а22\ B) Умножая обе части первого уравнения на а22, обе части второго уравнения на—а12, а затем складывая оба уравнения, исключаем неизвестное х2: (апа22 — а12а21) хг = Ьха22 — a12b2. Аналогично (апа22 — а12а21) х2 = anb2 — a2lbx. Предположим, что апа22 — аХ2а21^=0. Тогда v «11^2—"«21^1 /О\ 9 х2 = . F) 9 2 «12^21 «11^22 — Легко видеть, что при сделанном предположении C) служит един- единственным решением системы A). 43
Выражения C) имеют один знаменатель, который очень просто выражается через элементы матрицы B): #11 #22 #12 #21- Это число называется определителем матрицы B) (определителем второго порядка) и обозначается следующим образом: ап #12 #22 Итак, согласно определению, #11 #12 #21 #22 : #11#22 — #12#21- D) Пример 4Л. I 2 7 — 3 4 = 2 • 4 — G)(— 3) = 29. Обладая понятием определителя второго порядка, формулы C) можно переписать в таком виде: «12 «22 «11 «12 I «21 «22 I Хо '¦— «11 «21 «11 «12 «21 «22 I E) Перейдем теперь к системе трех уравнений с тремя неизвест- неизвестными с матрицей + #12*2 + #13*3 = #21*1 Н~ #22*2 4" #23*3 = #31*1 + #32*2 + #33*3 = |#11 #12 #13] а21 а22 а23 . #31 #32 #33j F) G) Если умножить обе части первого из уравнений F) на число #22#зз — #23#32i °бе части второго уравнения — на число ахза32 — — #12#зз> °бе части третьего уравнения — на число а12а23 — #1з#22 и сложить все три уравнения, то коэффициенты при неизвестных х2, х3 окажутся равными нулю, и мы получим равенство 33 + #12а23#31 + #13#21#32 #13#22#31 #12#21#33 #11#23#32) *1 = = Ьха22а33 + а12а2ф3 + a13b2a32 — a13a22b3 — al2b2a33 — bta23a32. (8) Коэффициент при хх в этом равенстве выражается через элемен- элементы матрицы G) и называется определителем этой матрицы (опре- (определителем третьего порядка). Для его записи употребляется та- такая же символика, как и в случае определителей второго порядка. Итак, 44
#11 #12 #13 #21 #22 #23 #31 #32 #33 #11#22#33 + #12#23#31 #13#21#32 ~ #13#22#31 ~ #l2#2l#33 ~ — #11#23#32- (9) Хотя выражение (9) сложнее выражения D), все же закон, по которому оно составлено из эле- элементов матрицы G), довольно прост и указан схематично на рис. 4.1 (слева дано правило вычисле- вычисления положительных членов опреде- Рис. 4.1 лителя третьего порядка, справа — правило вычисления его отрицательных членов). Пример 4.2. 1 2 3 4 5 6 7 8 9 = 1.5.9 + 2-6-7,+3-4.8 — 3-5.7 — 1.6-8 — 2-4- 9=40. Обозначим определитель (9) буквой d, а определитель матрицы, получающейся из матрицы G) заменой ее /-го столбца (/ = 1, 2, 3) столбцом из свободных членов системы F), — символом dj . Тогда нетрудно проверить, что правая часть равенства (8) есть в точности di, а само равенство приобретает вид dxx = dx. Предположим, что d=?0. Тогда хх = djd. Аналогично, умножая уравнения системы F) соответственно на числа #i3#3i — #21#зз> #1з#зз— #1з#зъ #1з#21 — — #а#2з> получаем x.z=^d2/d. Наконец, умножая эти уравнения со- соответственно На ЧИСЛа #21#32 —#22#ЗЬ #12#31 — #U#32> #11#22 — #12#2Ь находим х3 — d3/d. Итак, если d^O и система F) имеет решение, то оно опреде- определено однозначно и имеет вид хх = d±/d9 x2 = d2/dy x3 = d3/d. A0) Непосредственная проверка показывает, что A0) действительно яв- является решением системы F). Если сравнить формулы решения линейных систем A) и F), то видно, что формулы E) решения системы A) можно записать в том же виде, что и формулы A0): хх'= djd, x2 = d2/d, где d — определитель матрицы B); dj , / = 1, 2, — определитель матрицы, которая получается из матрицы B) заменой ее /-го столб- столбца столбцом свободных членов системы A). Естественно предположить, что аналогичные формулы сущест- существуют и для произвольных линейных систем из п уравнений с п не- неизвестными. Однако мы не будем пытаться обобщать ход решения уже разобранных случаев п = 2; 3 на случай произвольного п. Оп- Определители второго и третьего порядков послужат тем исходным материалом, который поможет нам ввести общее понятие определи- 45
теля /г-го порядка. Детально изучив его свойства, мы найдем иско- искомые формулы решения линейных систем. Разумеется, тем самым бу- будет получено новое решение задачи для случаев п = 2; 3. 4.2. Определители /г-го порядка Рассмотрим определитель третьего порядка 13 #11 #12 #: #21 #22 #23 #31 #32 #33 а12а23а31 + #1з#21#з2 — #п#2з#з2 — #12#21#зз — — #13#22#31- (О Он состоит из шести слагаемых (членов определителя), каждое из которых есть произведение трех элементов матрицы третьего поряд- порядка #11 #12 #13 #21 #22 #23 #31 #32 #33 взятое с подходящим знаком. Любое такое произведение имеет вид (±1)#1/1#2/2, #3/3, B) так как его сомножители взяты из разных строк матрицы А. Слагаемые в A) различаются лишь последовательностью номе- номеров столбцов /ь /2, /3. Выписывая эту последовательность для каж- каждого из слагаемых, получаем 1, 2, 3; 2, 3, 1; 3, 1, 2; 1, 3, 2; 2, 1, 3; 3, 2, 1. C) Очевидно, C) есть в точности множество всех перестановок из трех чисел. В частности, среди номеров /ь /2, /3 не бывает повторений, так что сомножители произведения B) взяты из разных столбцов матрицы А. Заметим теперь, что первые три перестановки из C) четные, а последние три нечетные. Это обстоятельство с учетом формулы A) показывает, что слагаемое B) берется со знаком +» когда переста- перестановка /ъ /2, /3 четная, и со знаком —, если эта перестановка не- нечетная. Итак, определитель третьего порядка матрицы А состоит из сум- суммы произведений вида B), где /ь /2, /3 пробегает всевозможные пе- перестановки из трех чисел, а знак произведения определяется чет- четностью соответствующей перестановки. В частности, элементы мат- матрицы Л, входящие в такое произведение, лежат в разных строках и разных столбцах (см. рис. 4.1). Подмеченная закономерность построения определителя третьего порядка естественным образом подводит нас к общему понятию оп- определителя /г-го порядка, где п — произвольное натуральное число. Определение 4*1. Пусть дана квадратная матрица п-го по- порядка 46
an al2 ... aln Л = Un2 с элементами On^R. Пусть, далее, ]\, /2, ..., jn — произвольная перестановка из п чисел; t — число инверсий в этой перестановке. Тогда число (—1)' aljla2h ••• anjn D) называется членом определителя п-го порядка матрицы А. Таким образом, четной перестановке /ь /2, ..., jn соответствует член определителя со знаком +, а нечетной — со знаком —. Отметим еще, что член определителя п-го порядка содержит, как видно из определения 4.1, в качестве сомножителей п элемен- элементов матрицы Л, взятых из различных строк и разных столбцов. Верно и обратное утверждение, а именно: произведение п элемен- элементов матрицы Л, лежащих в разных строках и разных столбцах, есть с точностью до знака член определителя матрицы Л. Если оун X X а2/2 • • • onjn — такое произведение, то ( 1) a\j1a2j2 • • • anjn , где t — число инверсий в, перестановке /ь /2, ..., \т есть член опре- определителя Л. Члены определителя, соответствующие различным перестановкам, считаются каждый в отдельности, хотя они могут быть равными числами. Так что существует ровно п\ членов определителя п-то порядка. Определение 4.2. Сумма всех членов определителя п-го по- порядка матрицы А называется определителем (детерминантом) п-го порядка этой матрицы и обозначается символом \ А | (det Л). Итак, согласно* определению 4.2, И| = 2 ( 1)' a\l\a2j2 ••• (*njn , E) /i in где суммирование ведется по всем перестановкам из п чисел, так что число слагаемых в сумме E) равно п\. При этом число / не является константой, а зависит от перестановки /ь /2, ..., \п. Подчеркнем, что в то время как матрица Л есть числовая таб- таблица, ее определитель | Л | есть число, определенным образом свя- связанное с этой таблицей. Ясно, что определитель п-го порядка при п == 3 превращается в уже знакомый нам определитель третьего порядка. Пусть теперь п = 2, т. е. Л = аХ2\ а221 Существует только две перестановки из двух чисел: 1, 2 и 2, 1. Первая из них четная @ инверсий), вторая нечетная A инверсия). 47
Перестановке 1, 2 соответствует член определителя апа2.2, а пере- перестановке 2,1—член определителя (—1)а12а21. Следовательно, со- согласно определению 4.2, \А\ = т. е. получился уже рассмотренный выше определитель второго по- порядка. Итак, понятие определителя п-то порядка является естествен- естественным обобщением определителей второго и третьего порядков. В случае п = 1 матрица состоит из одного элемента А = ап. Существует лишь одна перестановка из одного числа — само это число. Естественно считать, что она имеет 0 инверсий, так что т. е. определитель матрицы, состоящей из одного элемента, равен самому этому элементу. Для некоторых матриц специального вида можно вычислить их определители исходя непосредственно из определения. Пример 4.3. Пусть 312 ••' а\ л-1 а\п зоо ... а0 „_i а0 Л2 л-1 л у! = О 0 ... а„_, „_, а„_,„ О 0 ... О а„„ есть квадратная верхняя треугольная матрица. Показать, что т. е. определитель треугольной матрицы равен произведению ее диагональных эле- элементов. Решение. Если все члены определителя равны нулю, то и сам определи- определитель равен нулю. С другой стороны, апа22 ••• апп есть член определителя и по- поэтому тоже равен нулю. Таким образом, в данном случае равенство F) очевидно. Предположим, что определитель матрицы А содержит члены определителя, от- отличные от нуля. Так как такой член содержит произведение п элементов матри- матрицы Л, взятых из разных столбцов, то в качестве множителя он включает элемент первого столбца. Ясно, что это будет Яц, так как все остальные элементы перво- первого столбца равны нулю. Далее, рассматриваемый член определителя должен со- содержать в качестве сомножителя некоторый элемент второго столбца матрицы А. Этим элементом может быть только а22, так как все элементы второго столбца, начиная с третьего, равны нулю, а первый элемент а12 этого столбца лежит с ап в одной строке и поэтому не может входить в член определителя, содержащий ап. Про- Продолжая это рассуждение, приходим к выводу, что член определителя матрицы Л, отличный от нуля, должен содержать в качестве сомножителей диагональные эле- элементы ап,а22, ..., апп и, следовательно, равен произведению а\\а22 ••• апп (учитываем, что перестановка 1, 2, ..., п четная). Это и означает справедли- справедливость формулы D). В общем случае вычислять определители, пользуясь только их определением, трудно и нецелесообразно. Уже при вычислении опре- определителя матрицы пятого порядка пришлось бы искать 5! = 120 его 48
членов. Вместо этого при вычислении определителей пользуются приемами, основанными на их свойствах. Упражнения 1. Проверьте, что произведение я3за16#72#27#55#6i#44 есть с точностью до знака член определителя седьмого порядка, и определите знак этого члена. 2. Найдите такие значения /ens, чтобы произведение (—^) %2akSa33as4a46a2i было членом определителя шестого порядка. 4.3. Свойства определителей Нас будут интересовать, с одной стороны, условия равенства определителя нулю и, с другой, преобразования матрицы, которые не меняют ее определителя или же подвергают его легко обозри- обозримым изменениям. Ради краткости будем говорить об элементах, строках и столб- столбцах определителя \ А |, имея в виду элементы, строки и столбцы соответствующей матрицы Л. Теорема 4.1. Если в матрице А поменять местами две стро- строки, то получится матрица В, такая, что \В\ = -\А\. A) Другими словами, если в определителе поменять местами две строки, то он изменит знак на противоположный. ^ Пусть A = [aij], B = [bij], k и s — номера строк матрицы Af которые меняются местами, k < s. Тогда Ьц = аИ, если i ?=k,s; ) ,2\ bkj = asi, bsj = akj для / = 1, 2, ..., п.) Пусть, далее, (± 1) aVn О2/2 • • • akjk • • • asjs •. - anjn C) есть произвольный член определителя |Л|, соответствующий пере- перестановке /ь /2> •••> /л» •••> Js> —t in- D) Учитывая B), получаем Ho (±1N1/! — bk,-8 ••• bsjk •-. bnjn E) есть член определителя | В |, соответствующий перестановке /i, /2, ..., is у •••, ik у •••> in • F) Знак члена определителя C) зависит от четности перестановки D), а знак члена определителя E) — от четности перестановки F). Так как перестановка F) получается из перестановки D) с помощью 49
одной транспозиции (jk, js), то эти перестановки имеют противопо- противоположный характер четности , т. е. у членов C) и E) противополож- противоположные знаки. Итак, член определителя | А |, соответствующий перестановке D), равен члену определителя |В|, соответствующему перестановке F), взятому с обратным знаком. Это и доказывает равенство A). <4 Теорема 4-2- Определитель, содержащий две одинаковые стро- строки, равен нулю. ^ Пусть | А | — данный определитель. Если в нем поменять мес- местами две одинаковые строки, то определитель останется прежним. С другой стороны, по теореме 4.1 он должен изменить знак. Сле- Следовательно, | А | =¦= —\А\У т. е. | А | = 0. ^ Теорема 4*3* Общий множитель всех элементов (произвольной) строки определителя можно вынести за знак определителя. ап п ... Kain ап\ ... апп = S(—l)r «1/ ап •• anjn = din строки опре- опреanl . Из теорем 4.3 и 4.2 вытекают очевидным образом следующие следствия. Следствие 4.1. Если все элементы какой-либо делителя — нули, то определитель равен нулю. Следствие 4.2. Определитель, содержащий две пропорцио- пропорциональные строки, равен нулю. Заметим, что две строки считаются пропорциональными, если одна из них получается из другой умножением на некоторое число. Теорема 4-4. Если все элементы i-й строки определителя п-го порядка представлены в виде суммы двух слагаемых j = 1, 2, п, то определитель равен сумме двух определителей, у которых все строки, кроме i-й, такие же, как и в заданном определителе, а i-я строка в одном из слагаемых состоит из элементов bj, в дру- другом — из элементов Cj. Таким образом, ап >\ I ап С\ ... Ьп ап С\ сп G) ап\ ап\ апХ ... апп
> Пусть d — исходный определитель, du d2~~-ABa других опре- определителя, входящих в равенство G). Если anJn есть произвольный член определителя (напомним, что t — число ин- инверсий в перестановке ]\ , ..., /, , ..., jn), то ал/я = S (-1)' an!n 2 (-1 anjn = Теорема 4-5. Определитель не изменится, если к одной его строке прибавить любую другую строку, умноженную на произ- произвольное число. > Пусть определитель dr получается из определителя d при- прибавлением к его s-й строке t-й строки, умноженной на число X. Таким образом, если an ... ain , то dr = &i\ ... ain as\ + кац ... asn + кщп Применяя последовательно теоремы 4.4, 4.3 и 4.2, получаем ... ain kaiX ... Теорема 4-6. Определитель не меняется при транспонировании. >Пусть А = [fl/y], АТ = [bij] — транспонированная к А матрица,т. е. Ьц =an. Требуется доказать, что \ А\ = | AT\. Рассмотрим произвольный член определителя \АТ\ (—\У ЬЧх Ьщ • •• bnjn , где t — число инверсий в перестановке /ъ /г» •••» ]п • Учитывая (8), перепишем (9) в виде (-1У bih b2i2 ••• Ьп}п=-~(—\у aI{lai22 ••• ain (8) (Ю) A1) Так как A0) — перестановка из п чисел, то правую часть A1) мож- можно переписать следующим образом: (—\yahlal22 ••• aJnn = (—iyaUla2i2 ••• anin. A2) Ы
Это равносильно тому, что подстановка ( 1 2 In п записывается в виде 1 2 h h n In A3) A4 A7) Из A1) и A2) получаем (—1)' Ьщ Ьщ • • • bnin = (—1У ащ ащ • • • ащп . A5) Правая часть равенства A5) есть с точностью до знака член опре- определителя | А |. Покажем, что перестановка /ъ /2, .-, U A6) имеет тот же характер четности, что и перестановка A0). Действительно, перестановка A6) имеет ту же четность, что и подстановка A4), равная подстановке A3). Четность подстановки A3) совпадает с четностью обратной к ней подстановки A ? - п \1г h .» In см. § 3.5). Наконец, подстановка A7) имеет ту же четность, что и перестановка A0). Итак, если k — число инверсий, в перестановке A6), то с учетом A5) имеем (—iybihb2}2 ••• bnjn =(—\)kaUla2i2 ••- anin , т. е. член определителя |ЛГ|, соответствующий перестановке A0), равен члену определителя |Л(, соответствующему перестановке A6). Отсюда и следует равенство определителей \А\ и \АТ\. <4 Так как при транспонировании матрицы столбцы становятся строками, то из теоремы 4.6 следует, что все утверждения, кото- которые доказаны нами для строк определителя, верны и для его столб- столбцов. Сформулированные в этом параграфе свойства определителей можно использовать для их вычисления. Пример 4.4. Вычислить определитель 0 111 10 11 110 1 1110 Решение. Согласно теореме 4.5, определитель не изменится, если к его первой строке прибавить последовательно вторую, третью и четвертую строки: 3 3 3 3 10 11 110 1 1110 52
Из первой строки (по теореме 4.3) общий множитель 3 можно вынести за знак определителя: 1 1 Применяя вновь теорему 4.5, вычтем из второй, третьей и четвертой строк этого определителя его первую строку: 1111 Q 0 —1 О О ^0 0—1 0 0 0 0—1 = 3(—1)= 3. Последний определитель треугольный и, значит, равен произведению своих диаго- диагональных элементов. Итак, исходный определитель равен —3. 4.4. Миноры и их алгебраические дополнения Пусть d — определитель п-го порядка и l^k^Cn. Выберем в этом определителе k различных строк с номерами ily г2, ..., ik и k различных столбцов с номерами Д, /2, ..., jk. Элементы, стоящие на пересечении этих строк и столбцов, составляют некоторую матрицу fe-ro порядка. Определитель этой матрицы называется минором k-vo порядка определителя d. Обозначим его буквой М. Часто говорят, что минор М расположен в строках с номерами iu i2, ..., ik и столбцах с номерами /ь /2, ..., \k. Элементы определителя d, которые не лежат в выделенных стро- строках и столбцах (при k < n), образуют в свою очередь матрицу по- порядка п — k. Определитель этой матрицы называется дополнителъ- npLM минором к минору М и обозначается символом М±. Можно сказать, что М1 есть определитель, получающийся после вычеркива- вычеркивания в определителе d k строк с номерами iu i2, ..., ik и k столбцов с номерами Д, /2, ..., jk. Пример 4.5. Пусть «11 «12 «13 «14 «21 «22 «23 «24 «31 «32 «33 «34 041 «42 «43 «44 k = 2, i'i = l, 1*2 = 3, /i=l, /2 = 4. Тогда «11 «14 дд _ «22 «23 «31 «34 ' «42 «43 Если минор М расположен в строках с номерами гъ ..., ik и столбцах с номерами Д, ..., jk, то назовем алгебраическим дополне- дополнением минора М его дополнительный минор Мь взятый со знаком (—l)s , где s = ix -f- ... -\-ik +Д + ... + jk . В случае k = 1 минор М есть некоторый элемент ац определителя d, а его алгебраичес- алгебраическое дополнение — определитель (п—1)-го порядка, получающийся из d вычеркиванием f-й строки и /-го столбца и взятый со знаком (-1 )<¦+/. 53
Пусть А= (—l)s Мг — алгебраическое дополнение минора М. Членом алгебраического дополнения А будем называть член минора Л1Ъ умноженный на ( — l)s . Смысл этого нового понятия проясня- проясняет следующая лемма, содержащая основные технические трудности изложенного ниже доказательства теоремы Лапласа. Лемма 4.1. Пусть d — определитель п-го порядка; М — его ми- минор порядка k, k<in; A—алгебраическое дополнение минора М. Тогда произведение любого члена минора М на любой член его ал- алгебраического дополнения А есть некоторый член определителя d. > Пусть d = | [ciij] |, /, /= 1, 2, ..., п. Рассмотрим случай, ког- когда М находится в левом верхнем углу определителя d, т. е. М = ап ... пьл ... СХи При этом п k-\-\ ... CLnn есть определитель (п — /г)-го порядка, который нам удобно записать в виде \п—k Ьп bn-kl Таким образом, b-u — ak+t k+j • Так как в данном случае s = 2A +•••+ k), то А = (—l)s Мг ~ Рассмотрим произвольный член минора М: (—1)^ a\jx • • • akjk , где t — число инверсий в перестановке /ь ..-, Ik чисел 1, 2, ..., k. Пусть A) B) C) есть произвольный член алгебраического дополнения А = Мъ где г — число инверсий в перестановке /ь -.., ln-k D) чисел 1, 2, ..., п — k. Тогда произведение члена A) минора М на член C) алгебраического дополнения А имеет вид akjk n_k E) 54
Так как B) — перестановка чисел 1, 2, ..., k, a D) — переста- перестановка чисел 1, 2, ..., п — k, то U , -., h ,' k + /i , ..., ? + ln-k F) есть перестановка чисел 1, 2, ...., д. Это означает, что E) есть с точностью до знака член определителя d. Подсчитаем число всех инверсий в перестановке F). Так как всякое ji <& + 1, то никакое из первых k чисел перестановки F) не может образовывать инверсию с каким-либо из последних п — k чисел этой перестановки. Поэтому число инверсий в перестановке F) есть сумма числа / инверсий в перестановке B) и числа инвер- инверсий в перестановке k + /i, ..., k + ln-k- Но это последнее число совпадает с числом г инверсий в переста- перестановке D). Таким образом, перестановка F) содержит t-\-r инверсий, и, следовательно, E) есть член определителя d. Перейдем к общему случаю, когда минор М находится в стро- строках с номерами i\ , ..., ik и столбцах с номерами ]\ , ..., ]k . Этот случай можно свести к рассмотренному выше, воспользовавшись следующим фактом, полученным при доказательстве теоремы 4.1: если в определителе d поменять местами две строки (два столбца), то получится определитель, у которого каждый член определителя равен некоторому члену определителя d, взятому с обратным знаком. Основная идея доказательства заключается в том, чтобы, меняя местами в определителе d сначала строки, а затем столбцы, полу- получить новый определитель d, у которого в левом верхнем углу стоит исходный минор УИ, а дополнительный минор к М в определителе d совпадает с дополнительным минором Мх в определителе d. Этого можно добиться следующим образом. Поменяем местами /гю строку определителя d c(ix—1)-й, затем с (ix — 2)-й и далее, до тех пор пока 1х~я строка не займет место первой строки. Всего нам придется переставить строки ix—1 раз. Аналогично 12-ю строку можно передвинуть на место второй строки, поменяв местами строки i2 — 2 раз и т. д. Наконец, 1к-я строка займет место k-й строки после ik — k перестановок соседних строк. Всего потребуется (i\— 1) + (i2 — 2) + ••• Н (hk) = (h + + f2 -f ... + ik) — A + 2 + ... -\- k) перестановок строк. Аналогично, меняя последовательно местами соседние столбцы определителя, добьемся того, что Д-й столбец займет место первого, /2-й — место второго, jk-n — место k-то столбца. Для этого потребу- потребуется переставить столбцы (jx — 1) -f- (/2 — 2) + ••• + (jk — Щ = (Л + + J2+ - +/*) —A+2+ ... +k) раз. Искомый определитель d получается из определителя d с помощью ( i) ( /JA ft) 21 ( k ( /Л)( ( ) перестановок соседних строк и столбцов. Поэтому любой член определителя d равен некоторому члену определителя d, умноженному на (—l)s~~2(*+ ••• +k* — (—l)s . 55
Пусть теперь / — некоторый член минора М, fx — член дополни- дополнительного минора Мх. Согласно определению, (—l)s/x — член алгеб- алгебраического дополнения М. Имеем /(-l)s/x = (-l)s//i- G) Так как минор М находится в левом верхнем углу определителя d, а Мх— дополнительный минор к М в Я, то ffx есть член определи- определителя Ъ. Но тогда выражение G) должно быть членом определите- определителя d. <4 Доказанная лемма позволяет получить следующую важную тео- теорему. Теорема 4J (теорема Лапласа)- Пусть в определителе d п-го порядка выделено k произвольных строк, k<^n. Тогда опреде- определитель d равен сумме произведений всех миноров k-го порядка, расположенных в этих строках, на их алгебраические дополнения. > Будем считать, что выделенные строки — первые k строк оп- определителя d. И пустьМ\ , М2 , ..., Ms—все миноры ?-го порядка, расположенные в этих строках, А\ , А2 , ..., As — их алгебраические дополнения. Легко видеть, что s совпадает с числом сочетаний из п чисел по &, т. е. s = . Всякий минор ML , как опреде- литель k-ro порядка, есть сумма k\ своих членов. Аналогично вся- всякое алгебраическое дополнение At есть сумма (п — k)\ членов ал- алгебраического дополнения. Поэтому МгАг+ ... +MSAS (8) есть сумма k\(n — k)\ '¦ — п\ произведений вида ftgi , где k\ (п — k)\ fi —-член минора Mi , a gt —член его алгебраического дополнения At . В силу леммы 4.1 Д- gt является членом определителя d. Та- Таким образом, сумма (8) есть сумма п\ членов определителя d. Тео- Теорема будет доказана, если мы убедимся, что в этой сумме нет по- повторений. Последнее равносильно утверждению, что всякий из п\ членов / определителя d можно представить в виде / = ft gt . Действительно, пусть / = (± 1)ащ • • • akjk аш / k+l • • • anjn есть произвольный член определителя d. Произведение a\jx • • • ak]-k с точностью до знака будет членом Д- одного из миноров Mi , a произведение ак+\ / k+l • • • ап\п — членом gi его алгебраического до- дополнения Ai , тоже взятого с точностью до знака. Таким образом, fi=(±l)alh ••• akik, gi = (±l)ak+ifk+l ••• anjn. Но, согласно лемме 4.1, figi есть член определителя d. Поэтому Разумеется, теорема Лапласа остается справедливой и в приме- применении к столбцам. 56
Особенно часто теорема Лапласа применяется в случае k~\. Договоримся обозначать алгебраическое дополнение элемента alh который рассматривается как минор первого порядка, символом Ац. Напомним, что Ац = (—1)*+'Мг/, где Мц—определитель (п—1)-го порядка, получающийся вычеркиванием из исходного определителя i-й строки и /-го столбца. Выделяя в определителе d i-ю строку, получаем d = atl Ап ainAiny т. е. разложение определителя d по элементам i-й строки. Совершенно аналогично находим разложение определителя d по элементам /-го столбца: d — a2iA2j Эти разложения позволяют сводить вычисление определителя порядка п к вычислению п определителей порядка п — 1. Особенно удобно разлагать определитель по элементам строки (столбца), если в ней много нулей. Так, если в i-й строке определителя d все эле- элементы, начиная со второго, равны нулю, то d=--anAn. Это замечание подсказывает следующий способ вычисления оп- определителей, которым часто пользуются на практике: приме- применяя свойства определителей, добиваются, чтобы в какой-либо строке (столбце) определителя стало как можно больше нулей, и лишь затем разлагают определитель по этой строке (столбцу). Пример 4.6. Вычислить определитель d = 2—5 12 -3 7—14 5—9 2 7 4—6 12 Решение. Вычитая из четвертой строки первую, из третьей — удвоенную первую и прибавляя первую строку ко второй, получаем 2—512 —1 2 0 6 1 10 3 2—100 Разложим этот определитель по элементам третьего столбца: —1 2 6 1 13. 2—10 Вычтем из первой строки последнего определителя удвоенную вторую и затем раз- разложим полученный определитель по третьему столбцу: -3 0 0 1 1 3 2—10 \2+3 Пример 4.7. Определителем Вандермонда называется определитель п-го по- порядка, п > 2, вида 57
«Г1 И—1 р 1. где ах , а2 , ..., ап — произвольные действительные числа. Показать, что при любом п определитель Вандермонда равен произведению всех разностей aL —а- , где ?, / удовлетворяют условию п~^ i Решение. Если п = 2, то 1 1 Воспользуемся принципом математической индукции и предположим, что на- наше утверждение верно для определителей Вандермонда (п— 1)-го порядка. Вычитая поочередно из каждой строки определителя d, начиная с п-й, преды- предыдущую строку, умноженную на alt получаем 11 ... 1 d = О а, О ¦2—  ••• ап —  а2~а\ )••' ап{ап — а\ О (ап — а(ап Последний определитель разложим по элементам первого столбца: ао - а а„ ¦ а а2 (п2 - а\ ап (ап ~ а\ («а Вынося за знак определителя из первого столбца я2 — ai, из второго — а3 — а1г из последнего — ап — ах , получаем d = (а2 — аг) (а3 — (ап — аг) 1 а2 аГ2 ... 1 ... ап ... а%-2 Входящий в последнее равенство определитель п—1-го порядка есть определи- определитель Вандермонда, равный по предположению индукции произведению всех раз- разностей aL — а- , где п ^ i > / ^ 2. Поэтому d = (аа — fli) (^з — fli) ... (ал — fli) X X (a3 — a2) ... (an — fl2) X X есть Очевидно, d = 0 тогда и только тогда, когда среди чисел аъ а2, ..., равные. Упражнения 1. Покажите, что в определителе я-го порядка существует ровно ( С^J = (n\/k\ (п—k)\J различных миноров ^-го порядка (два минора &-го порядка счи- считаются одинаковыми тогда и только тогда, когда они расположены в одних и тех же строках и столбцах). 58
2. Рассмотрите определитель d и его минор М из примера 4.5. Методом, ука- указанным в доказательстве леммы 4.1, получите из d определитель d, у которого М находится в левом верхнем углу. Проверьте, что дополнительный минор к М вЗ совпадает с дополнительным минором М в d. 4.5. Определитель произведения квадратных матриц Теорема Лапласа позволяет доказать факт фундаментальной важ- важности — теорему об умножении определителей. Теорема 4Я> Определитель произведения двух квадратных матриц равен произведению определителей этих матриц, т. е. ес- если A,B?Rnt n, то \АВ\=\А\-\В\. > Рассмотрим вспомогательный определитель d порядка 2л вида A On —Еп В B) где Оп и Еп — нулевая и единичная матрицы n-го порядка. Выде- Выделим в этом определителе первые п строк и воспользуемся теоремой Лапласа. Тогда a — i /x | ^ l ^ •"' • • • ~i~ ' j.o| — j /\ j * i Lj j. \^) С другой стороны, определитель B) можно привести к виду D) On С -Еп В где С = АВ, воспользовавшись одним из свойств определителя, со- согласно которому определитель не меняется, если к любой его строке прибавить любую другую строку, умноженную на произвольное чис- число. Применяя теорему Лапласа к первым п строкам определителя D), находим = \C\ (—1) () () HC|A)WO |C| E) С равнивая равенства C) и E), получаем искомое равенство A). Для завершения доказательства теоремы осталось показать, что определитель B) приводится к виду D). п Пусть А = [aij], В = [bij]y С = [сц]. При этом ci} =2 а/л&л/- Вы- пишем определитель B) в явном виде 59
ап 021 dn\ — 1 0 al2 #22 0 j ... Cl\n ¦ ¦¦ a2n ... Una ... 0 ... 0 0 0 0 bu b21 0 0 0 bn b22 ... 0 ... 0 ... 0 bin ¦¦¦ b2n 0 0... —1 bn2 F) Преобразуем определитель F) так, чтобы на местах, занимае- занимаемых элементами #//, появились нули. С этой целью к его первой строке прибавим (/г+1)-ю строку, умножению на <2ц; (п -f 2)-ю строку, умноженную на а^; ...; B/г)-ю строку, умноженную на а\п. В полученном определителе первые п элементов первой строки будут нулями, а п других элементов станут такими: anbn п\\Ь\2 n + a-iibin + ... 4- пщЬпп = Сщ- Аналогично получают нули во 2-й, ..., /г-й строках определителя F), причем последние п элементов в каждой из этих строк станут соответствующими элементами матрицы С. В результате определитель F) преобразуется в равный ему определитель D). ^ 4.6. Обратная матрица Рассмотрим следующую задачу. Пусть А и В — две матрицы из R/г, п- Требуется найти все X 6 Rtt, л, удовлетворяющие матричному уравнению АХ = В. A) В случае п = 1 это уравнение превращается в простейшее урав- уравнение ах = Ъ, B) где а и b — действительные числа, ах — неизвестное действительное число. Если афО, то уравнение B) имеет единственное решение х = Ь/а. Проанализируем, как получается это решение, имея в виду возможность аналогичного решения более сложного уравнения A). Так как а Ф 0, существует обратное а число а~х. Тогда ах = = Ъ =>¦ а-1 (ал:) - а~!& ^ (оНа) * = a~lb => 1 • х = a~~lb =>х = агхЪ. Та- Таким образом, если уравнение B) имеет решение, то оно должно вы- выражаться в виде х = а~-хЬ. Проверим теперь, что х = arlb действи- действительно является решением уравнения B): = (aa-l)b= 1 • b = b. Вернемся к уравнению A). Мы знаем (см. § 2.4), что при умно- умножении матриц из Rn, n единичная матрица Еп играет роль единицы, 60
так как Еп А = АЕп = А для любой А 6 Яп, n. Можно дословно пов- повторить для уравнения A) изложенный выше ход решения уравнения B), если бы для матрицы А нашлась матрица С 6 R«, n, удовлетво- удовлетворяющая условию СА = АС = Еп. C) Определение 4.3. Пусть А ?Rn, n- Матрица С (zRn, n назы- называется обратной матрицей к матрице А, если выполняется усло- условие C). Обычно вместо Еп пишут просто Е, что мы и будем делать. Теорема 4.9. Если для данной матрицы А существует обрат- обратная матрица, то она определена однозначно. ^ Пусть С± и С2 — обратные матрицы к матрице А. Покажем, что Сх = С2. Действительно, С другой стороны, d (АС2) = (СХА) С2 = ЕС2 = С2. 4 Обратную матрицу к матрице А обозначают символом Л~~!. Теорема 4.10. Матрица А имеет обратную матрицу тогда и только тогда, когда |Л|=й=О. > Пусть А имеет обратную матрицу. Тогда АА~1 = Е и, при- применяя теорему об умножении определителей, получаем \A\-\ Arx \ = = | Е | или | А | • | А~11=1. Следовательно, | А \ Ф 0. Пусть, обратно, | А \ Ф 0. Покажем, что А имеет обратную мат- матрицу. Можно указать явное выражение А через элементы матрицы А, а именно: если А = [а*;], i, j= I, 2, ..., /г, то Ли Л21 ... Ani An Л22 ... Ап2 12я D) где Л// — алгебраическое дополнение к элементу а,ц. Матрица D) получается из матрицы Л следующим образом. Сна- Сначала вместо каждого элемента ац пишется его алгебраическое до- дополнение, затем полученная матрица транспонируется и умножается на величину, обратную |Л|. Для проверки того, что D) действительно является обратной мат- матрицей к Л, нам понадобится один простой факт из теории опреде- определителей. Пусть а2\ ... #2/г 61
Тогда d = + a2fA2j -f ... + anjA nj есть разложение определителя d по /-му столбцу. Если Ъъ Ь2, ..,, Ьп — произвольные действительные числа, то рассмотрим вспомога- вспомогательный определитель 1, _ ап ... Ь\ #21 • • • ^2 отличающийся от d лишь /-м столбцом. Разлагая его по этому столбцу, получаем d' = &! i4i/ + &2 A2j + ... + 6n Anl. Мы использовали здесь то обстоятельство, что алгебраическое до- дополнение к элементу Ъ-ь в определителе dr совпадает с алгебраичес- алгебраическим дополнением к элементу ац в определителе d, i=l, 2, ..., п. Пусть теперь &i = аш Ь2 = а2ь •••, bn = ank, т. е. /-й столбец определителя dr совпадает с k-м столбцом определителя d. Если кф], то dr содержит два одинаковых столбца и поэтому равен ну- нулю. Если же k — /, то dr = d. Таким образом, имеет место формула E) Аналогичный результат справедлив, разумеется, и для строк опре- определителя d. Воспользуемся формулой E) для проверки равенства А~{А - ?, где А~1 задается формулой D). Пусть А~1 А = (tij). Тогда ttJ = J4/ м/ ' а2/ о.- 4- ;/- Это означает, что Л-1Л = ?. Равенство АА*1 = Е доказывается совершенно аналогично, если вместо формулы E) использовать сходную с ней формулу для строк определителя. ^ Следствие 4.3. В случае \А\ФО уравнение A) имеет един- единственное решение х = А~1В. Матрица с отличным от нуля определителем называется невырож- невырожденной. Теорема 4.10 утверждает, что обратную матрицу имеют лишь невырожденные матрицы. 62
Пример 4.8. Пусть '2 5 7 Л = I 6 3 4 5 —2 —3 Найти Л , пользуясь формулой D). Решение. Так как | А \ = —1, то А ческие дополнения элементов матрицы А: 1 3 4 -2 —3 5 7 —2 —3 = -1, Л12 = - 6 41 5 — 3 существует. Вычислим алгебраи- 6 3 1 9? 5 -2Г=~27> = 1, Л22 = 2 5 5 —2 = 29, Л 31 = 5 7 = —1, Л32 = — 2 7 6 4 '34, А33= I § = —24. Матрицу Л —1 находим в два приема 1 38 —27 1—41 29 1 34 —24 , согласно формуле D): 1 Г -1 1 -1] 38 —41 34 —l L—27 29 — 24 J Г = —38 27 41 —29 —34 I = A 24 —1 В заключение приведем следующее Предложение 4.1. Если А и В — невырожденные матрицы оди- одинаковых порядков, то их произведение АВ — тоже невырожденная матрица, причем (АВ)-1 = 5-М-1. Простое доказательство этого факта читателю будет полезно провести самостоятельно. Упражнения 1. Пусть Л — невырожденная целочисленная матрица, т. е. все ее элементы — целые числа. Докажите, что матрица Л является целочисленной тогда и только тогда, когда | Л | = +1. 2. Докажите, что матрица, обратная к верхней (нижней) треугольной матри- матрице, есть верхняя (нижняя) треугольная матрица; аналогично матрица, обратная к диагональной, есть диагональная матрица. I 3. Докажите, что если для квадратных матриц А п С СА = Е, то С = А 4.7. Правило Крамера Мы можем теперь вывести общие формулы решения линейных систем из п уравнений с п неизвестными, аналогичные формулам, полученным в § 4.1 для случаев п = 2,3. Рассмотрим систему 0ц*1 + 021*1 + 022*2 + 0«1*1 + 0«2*2 + + a2nxn = Ъ2 + CLnnX п=Ьп A) 63
где aih bi 6R. Пусть Л = [aiy]— матрица этой системы. Определи- Определитель этой матрицы d = \A\ называется определителем системы A). Теорема 4Л1 (теорема Крамера). Если определитель d сис- системы п линейных уравнений с п неизвестными отличен от нуля, то система имеет единственное решение где dj — определитель, который получается из d, если его \-й столбец заменить столбцом свободных членов этой системы. Р- Идея доказательства заключается в том, чтобы переписать систему A) в форме матричного уравнения. Положим V" __ х2 и рассмотрим уравнение ЛЛ = и (Z) с неизвестной матрицей-столбцом X. Так как Л, X, В — матрицы размеров п X пу п X 1, /г X 1 соответственно, то произведение пря- прямоугольных матриц АХ определено и имеет те же размеры, что и матрица В. Таким образом, уравнение B) имеет смысл. Связь между системой A) и уравнением B) заключается в том, что (A,i , К2 у -.., hn ) является решением данной системы тогда и только тогда, когда 7 Х = есть решение уравнения B). Действительно, утверждение о том, что "я, х = есть решение уравнения B), означает выполнение равенства #11 Cii2 ... CL\n #21 #22 ••• #2az ап\ ап2 ... апп Я/2 'by' ь2 Ьп или 64
••• ~f CLn\k\ -[- аЛ2 6л Последнее равенство, как равенство матрицы, равносильно систе- системе равенств которая означает, что (К\ , Я2, ..., Ящ) — решение системы A). Итак, решение системы A) сводится к решению матричного урав- уравнения B). Так как определитель d матрицы А отличен от нуля, она имеет обратную матрицу А~{. Тогда АХ = В => А~\АХ) = А~1В =* (А-1 А) X - А~1В =>ЕХ = = А-1В=>Х = А-1В. C) Следовательно, если уравнение B) имеет решение, то оно зада- задается формулой C). С другой стороны, А (АВ) - (ЛЛ-1) В = ЕВ = 5, поэтому X = Л"^ есть единственное решение уравнения B). Так как Ли А2{ ... Ап\ Л12 Л22 ••• An2 Л9 Л i\n где Л г/ — алгебраическое дополнение элемента d, то в определителе Х2 —- (&i Л12 а b2 Л22 ¦ b2 A2n ¦ ... +bnAnn) откуда xj = — F1 Л17 a Л2/ 6Л Anj), j - 1, 2, ..., /1. D) В равенстве D) в скобках написано разложение по элементам /-го столбца определителя d; , который получается из определителя d после замены в нем /-го столбца столбцом свободных членов (см. § 4.6). Поэтому х/ = d,- Id. 4 3 Зак. 3670 65
Теорема Крамера имеет в основном теоретическое значение. Хо- Хотя она дает формулу для выражения решения системы линейных уравнений через ее коэффициенты и свободные члены, однако фак- фактически находить значения неизвестных по этим формулам неудоб- неудобно, так как требуется вычислить п + 1 определителей порядка п. На практике системы линейных уравнений, к которым применимо правило Крамера, гораздо удобнее решать методом Гаусса, пригод- пригодным для произвольных линейных систем. 4.8. Вычисление обратной матрицы элементарными преобразованиями Указанный в § 4.6 способ вычисления обратной матрицы носит скорее теоретический характер. Эффективнее обратная матрица вы- вычисляется с помощью элементарных преобразований строк исходной матрицы, с которыми мы уже встречались при изучении метода Га- Гаусса (см. главу 2). Нам понадобится одно вспомогательное понятие. Рассмотрим его. Квадратная матрица Р называется элементарной, если она есть матрица одного из следующих двух видов: 1) Р — диагональная матрица, одним из диагональных элементов которой является произвольное отличное от нуля действительное число, а все другие диагональные элементы равны 1; 2) все диаго- диагональные элементы матрицы Р равны 1, а все ее остальные элемен- элементы равны 0, кроме одного, который равен произвольному отличному от нуля действительному числу. Очевидно, всякая элементарная матрица невырожденная. Основой нового способа нахождения обратной матрицы является следующее утверждение. Предложение 4>2. Применение к строкам матрицы элементар- элементарного преобразования равносильно умножению ее слева на подходя- подходящую элементарную матрицу. )> Непосредственными вычислениями проверяется, что умноже- умножение 1-й строки k х n-матрицы А на число К Ф О равносильно умно- умножению матрицы А слева на элементарную матрицу &-го порядка первого вида, у которой на месте (i, i) стоит %. Аналогично при- прибавление к i-й строке k X n-матрицы А ее /-й строки, умноженной на число К Ф О, равносильно умножению матрицы А слева на эле- элементарную матрицу &-го порядка второго вида, у которой на месте (i, j) стоит К. Читатель вполне поймет доказательство, проведя указанные вы- вычисления для случая квадратной матрицы А. ^ Следствие 4.4. Пусть А—невырожденная матрица поряд- порядка п. Тогда с помощью элементарных преобразований строк матрицу А можно превратить в матрицу Еп . Применяя те же элемен- элементарные преобразования в том же порядке к строкам матрицы Еп , получаем матрицу А~1. ^ Мы знаем, что элементарными преобразованиями строк мат- матрицу А можно привести к матрице В ступенчатого вида (см. § 2.2). 66
Так как при элементарных преобразованиях квадратной матрицы ее определитель либо не меняется, либо умножается на число, от- отличное от нуля, то матрица В должна быть невырожденной и, сле- следовательно, не содержит нулей на диагонали. Поэтому Ьп О ... b \п О 0 ... bnn ), i= 1, 2, ..., п. Умножая первую строку матрицы В на Ьц , вторую на Ь22 и да- далее, получаем матрицу 1 С\2 .-. Сщ О 1 ... с2п О 0 ... 1 Ее легко привести с помощью элементарных преобразований строк к единичной матрице Еп , получая поочередно в каждом столбце, начиная с последнего, нули выше диагонали. Тем самым доказано первое утверждение теоремы. Согласно предложению 4.2, р р Р Р Л где Ph i=lt 2, ..., s — элементарные матрицы, примененным нами элементарным преобразованиям равенство A) справа на матрицу Л, получаем Л-1 — р р p^F т. е. А~х получается из матрицы Еп после тех же элементарных преобразований строк, что и Еп из матрицы А. <4 Любопытно, что хотя элементарные матрицы сыграли существен- существенную роль в обосновании нового способа вычисления обратной мат- матрицы, сам способ имеет дело лишь с элементарными преобразовани- преобразованиями, что делает его весьма удобным. A) соответствующие строк. Умножая если Пример 4.9. Найти с помощью элементарных преобразований матрицу А—1 Г2 7 31 • = 39 4 . [l 5 3j Решение. Так как к строкам матриц А и ?3 нам надо будет применять одни и те же элементарные преобразования, то удобно из А и ?3 составить одну матрицу 2 7 3 3 9 4 1 5 3 1 0 0] 0 1 0 , 0 0 1J строки которой мы и будем преобразовывать. Изменим порядок строк: 67
[15 3 0 0 1 2 7 3 10 0 1_3 9 4 0 1 0 Из второй строки вычтем удвоенную первую, а из третьей — утроенную первую: Г1 5 3 0 0 П 0 —3 —3 1 0 —2 . [0 —6 —5 0 1 —3J Из третьей строки вычтем удвоенную вторую: 15 3 0 0 1 0—3—3 10—2 0 0 1—2 1 1 Ко второй строке прибавим утроенную третью, а из первой строки вычтем утроенную третью: Г1 5 0 6—3 ~Т 0—3 0—5 3 1 |_0 0 1 — 2 1 1 Вторую строку разделим на —3: 15 0 6—3—2 1 0 10 5/3 —1 —1/3 . 0 0 1—2 1 1 J Наконец, из первой строки вычтем вторую, умноженную на 5: [1 0 0 —7/3 2 —1/31 0 10 5/3 —1 — 1/3 . L0 0 1 —2 1 1 J Итак, Г-7/3 2 -1/31 1-1= 5/3 —1 —1/3 . L -2 1 1 J 5. ОСНОВНЫЕ АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ (ГРУППЫ, КОЛЬЦА, ПОЛЯ) В предыдущих главах мы изучали конкретные математические объекты — множество целых чисел Z, множество подстановок из п элементов Sn, множество матриц с действительными элементами Rn,n- На первый взгляд, они не связаны между собой, так как состоят из элементов совершенно разной природы. Однако развитие алгебры привело к выработке общих концепций, которые позволяют по-ново- по-новому взглянуть на казалось бы разобщенные факты. В настоящей главе мы введем фундаментальные для всей алгебры понятия груп- группы, кольца и поля, ограничившись знакомством с их простейшими свойствами. 5.1. Алгебраическая операция Рассмотрим множества Z, Sn, Rn, n- На каждом из них определе- определена операция умножения, ставящая в соответствие любым двум элементам множества некоторый третий элемент того же множества, который называется произведением соответствующих элементов, 68
Заметим, что переместительный закон умножения выполняется для чисел и, вообще говоря, не верен для подстановок и матриц. Вместо операции умножения на множествах Z и Rn> n можно рас- рассматривать операцию сложения, которая ставит в соответствие каж- каждой паре элементов данного множества их сумму, принадлежащую этому же множеству. Следующее общее определение позволяет рассматривать такого рода операции с единой точки зрения. Определение 5.1. Пусть X — произвольное непустое мно- множество. Будем говорить, что на множестве X определена алгебра- алгебраическая операция, если каждой упорядоченной паре (а, Ъ) элемен- элементов этого множества ставится в соответствие некоторый вполне определенный элемент с из этого же множества. При этом с будем называть композицией элементов а и Ь и писать с =aob. Таким образом, значок «о» употребляется как символ алгебраи- алгебраической операции. Часто бывает удобно называть алгебраическую операцию умножением или сложением (как в рассмотренных при- примерах). В этом случае вместо а°Ъ пишут соответственно ab и а-\-Ъ. Вспоминая, что множество всех упорядоченных пар элементов из X называется декартовым квадратом этого множества, заключаем, что алгебраическую операцию на X можно рассматривать как про- произвольное отображение X2—»-Х. Если X — {аъ аъ ..., ап} есть конечное множество, то алгебраи- алгебраическую операцию на нем можно записать с помощью квадратной таблицы I aL I а2 I ... I ап В клетке этой таблицы, расположенной на пересечении строки, проходящей через элемент ak> и столбца, проходящего через эле- элемент аь следует записать композицию элементов ak и at. Рассмотрим опять множества Z, Sn, Rn, n вместе с операциями умножения. Во всех трех случаях каждое из этих множеств содер- содержит некоторый элемент, произведение которого на произвольный элемент а данного множества есть снова а. Роль такого особого элемента в случае Z играет единица, в случае Sn — тождественная подстановка, в случае Rrtj n — единичная матрица. Определение 5.2. Будем говорить, что элемент п?Х явля- является нейтральным относительно алгебраической операции «с», если для каждого а?Х аоп = поа = а. В случае, когда на Z и R^ n рассматриваются соответственно операции сложения чисел и матриц, роль нейтрального элемента 69
играют число нуль и нулевая матрица. Если алгебраическую опера- операцию считают умножением, нейтральный элемент принято называть единицей. Если же операцию считают сложением, то нейтральный элемент называют нулем. Нейтральный элемент существует далеко не для всякой алгебраической операции. Предложение 5.1. Для любой алгебраической операции суще- существует не более одного нейтрального элемента. ^ Предположим, что пх и п2 — нейтральные элементы относи- относительно алгебраической операции «о». Покажем, что пг = п2. Действительно, __ Ыъ так как п2 — нейтральный элемент, ^1 ° п2 = [^ так как Пх — нейтральный элемент. Следовательно, пх = п2, так как для данных двух элементов их ком- композиция определена однозначно. М Определение 5.3. Алгебраическая операция «о» на множест- множестве X называется ассоциативной, если для любых а, Ь, с?Х а о ф о с) = (а о Ь) о с. Сложение и умножение чисел, умножение подстановок, сложение и умножение матриц — все это примеры ассоциативных алгебраиче- алгебраических операций. Приведем пример неассоциативной операции. Пример 5.1. Пусть X = R\{0}. В качестве алгебраической операции на мно- множестве X рассмотрим деление чисел: а^ Ь = b/а. Тогда а о (р о с) = а с с/ b = c/ab; (а о Ь) о с = (Ь[а) о с = (са)/Ь. Если «о» — алгебраическая операция на множестве X, а, Ъ, с ? X, то можно определить естественным образом композицию а о Ь о с. а о Ьо с = а о (fro с). Аналогично определяется композиция любого конечного числа элементов аъ а2, ..., а„?Х. Если комгюзиция ап-\ о ... с а2 о «1 уже определена, то положим ап ° Ял—1 ° ...с #2 ° ci\ = апо {ап—\ о ... о a<i о aj). Предложение 5»2. Если алгебраическая операция ассоциативна, то для любого натурального числа i, удовлетворяющего условию 1 (апо ... ofl,-+i)o(flt-o ... oa^rr^o ... о а/_|-1 оaf-о ... о а^ A) ^ Докажем равенство A) индукцией по п. Если п = 2, то t = l, и равенство очевидно. Перейдем к произвольному п в предположе- предположении, что для меньших значений п равенство A) доказано. Если n = i+l, то равенство верно по определению. Пусть п > i + 1. Тогда 70
(апо ... ofl/+1)o(a/O ... с ах) = (ап о (ап-\ о ... о =-ая о ((ал__! о #t. ofl|+1)o(flj.o ... Определение 5.4. Пусть на множестве X определена алге- алгебраическая операция «с», которая имеет нейтральный элемент п. Элемент Ь^Х будем называть симметричным элементу а, если их композиция в любом порядке дает нейтральный элемент: aob =-- Ь о а = п. B) В случае, когда операцию называют умножением, равенство B) записывается в виде ab = Ъа = 1, и элемент Ь называется обратным элементу а. Если же операцию называют сложением, то B) записывается так: а элемент b называется противоположным элементу а. Предложение 5-3- Если алгебраическая операция на множестве X ассоциативна, то для каждого а^Х существует не более од- одного симметричного элемента. ^ Пусть b и с — элементы, симметричные элементу а. Покажем, что b = с. Для этого рассмотрим композицию b о а о с. С одной сто- стороны, В то же время в силу ассоциативности Следовательно, b = с. ^ Отметим, что в общем случае множество всех элементов из X, обладающих симметричными элементами, не совпадает с X. Определение 5.5. Будем называть алгебраическую операцию коммутативной, если для любых a, b?X aob = bo a. Из пяти алгебраических операций, приводимых в упражнении 4, коммутативными являются первая, вторая и пятая. Третья и чет- четвертая операции при п > 2 и п > 1 соответственно некоммутативны. Упражнения 1. На множествах: 1) всех четных натуральных чисел; 2) всех нечетных нату- натуральных чисел; 3) всех отрицательных целых чисел — рассмотрите операции: а) сло- сложения; б) вычитания; в) умножения. В каких случаях эти операции являются алгебраическими? 2. Найдите число различных алгебраических операций на множестве из п элементов. 3. Постройте алгебраическую операцию без нейтрального элемента на мно- множестве X из двух элементов. 4. Пусть заданы следующие множества: 1) X — Z с операцией умножения чисел; 2) X == Z с операцией сложения чисел; 3) X = Sn с операцией умножения подстановок; 4) X = Rn п с операцией умножения матриц; 5) X = Rw n с опера- операцией сложения матриц. Докажите, что множество Y всех элементов из X, для 71
которых существуют симметричные элементы, в каждом из перечисленных случаев имеет вид: \) Y = {—1, 1}; 2) У = X; 3) F = X; 4) У = {Л ? X | | Л | =? 0}; 5) К = X. 5. Проверьте, что следующая таблица задает на множестве Х={1, 2, 3} коммутативную, но не ассоциативную алгебраическую операцию: 1 2 3 1 1 3 2 2 3 2 1 3 2 1 3 5.2 Группы Теория групп возникла вследствие необходимости найти аппарат для изучения закономерностей симметрии. Познание свойств симмет- симметрии каких-либо геометрических тел или других математических объектов часто дает ключ к выяснению строения этих тел и объек- объектов. Точная и общая формулировка того, что такое симметрия, особенно количественный учет свойств симметрии, требуют исполь- использования теории групп. Теория групп возникла в конце XVIII — начале XIX веков. Пер- Первоначально она развивалась как вспомогательный аппарат для ре- решения алгебраических уравнений высших степеней в радикалах (Ж- Лагранж, Н. Абель, Э. Галуа), когда впервые было замечено, что соображения симметрии являются основными для решения всей задачи. Позднее важная роль закономерностей симметрии выявилась во многих других разделах науки: геометрии, кристаллографии, фи- физике, химии. Благодаря этому методы и результаты теории групп получили широкое распространение и, постепенно развиваясь, оказа- оказались весьма существенными не только для изучения закономернос- закономерностей симметрии, но и для решения многих других вопросов. В настоящее время понятие группы стало одним из важнейших обобщающих понятий современной математики, а теория групп за- заняла видное место среди математических дисциплин. Поясним ска- сказанное простым примером. Пусть G —множество всех движений плоскости, т. е. таких преобразований плоскости, которые сохраняют расстояния между точками. Параллельный перенос, поворот, осевая симметрия — все это примеры движений. Всякое подмножество плоскости будем на- называть фигурой. Говорят, что фигура X симметрична относительно движения ф6(/, если ф совмещает X с X, т. е. <р(Х) = X. Мно- Множество всех движений плоскости, относительно которых X симмет- симметрична, назовем группой симметрии фигуры X и обозначим Gx • Та- Таким образом, Симметрия фигуры X характеризуется ее группой симметрии. Чем богаче и разнообразнее группа симметрии Gx, тем большей степенью симметричности обладает X. В частности, если Gz не со- содержит никаких движений, кроме тождественного преобразования, 72
то фигуру X можно назвать несимметричной. Наше интуитивное понимание симметрии плоской фигуры хорошо согласовано с такой точкой зрения. Рассмотрим, например, на плоскости квадрат, ромб, не являющийся квадратом, и параллелограмм, не являющийся ром- ромбом (рис. 5.1). При интуитивном понимании симметрии геометриче- геометрических фигур квадрат представляется наиболее симметричной из трех В К данных фигур, а параллелограмм — наим^рее симметричной. Посмот- Посмотрим, как данное обстоятельство согласуется с нашим подходом к понятию симметрии. Степень симметричности квадрата на плоскости характеризуется совокупностью движений плоскости, приводящих к самосовмещению квадрата. Но если квадрат совмещается сам с собой, то точка пере- пересечения его диагоналей также должна совмещаться сама с собой. Поэтому искомые движения оставляют центр квадрата неподвижным, т. е. имеют неподвижную точку, и являются либо поворотами около центра квадрата, либо отражениями относительно прямых, проходя- проходящих через центр. Из рис. 5.1 видно, что группа симметрии квадра- квадрата ABCD состоит из четырех поворотов вокруг его центра О на углы, кратные 90°, и четырех отражений относительно диагоналей AC, BD и прямых KL, MN\ Аналогичные рассуждения показывают, что группа симметрии ромба состоит из двух поворотов на 0 и 180° вокруг его центра и двух отражений относительно диагоналей ромба. Наконец, группа симметрии параллелограмма состоит всего лишь из двух поворотов вокруг центра на 0 и 180°. Таким образом, квадрат имеет наиболь- наибольшую группу симметрии, а параллелограмм — наименьшую. Всякая группа симметрии Gx заведомо обладает следующими свойствами: 1) композиция двух движений из Gx снова принадлежит Gx,m.e. на Gx определена естественная алгебраическая операция; эта опе- операция ассоциативна ввиду ассоциативности умножения отобра- отображений; 2) тождественное преобразование принадлежит Gx и, следова- следовательно, существует нейтральный элемент относительно рассмат- рассматриваемой алгебраической операции; 3) если движение y?Gx, то и обратное движение ф принад- принадлежит Gx> т. е. всякий элемент множества Gx имеет симмет- симметричный элемент относительно определенной на Gx алгебраической операции. 73
Действительно, композиция двух движений есть движение и, если фх, cp26Gx, то (ф1ф2) (X) = Фх (ф2 (X)) = ф1 (X) = X. Это доказывает первое свойство. Второе свойство очевидно, так как тождественное преобразование е есть движение и е (X) = X. Нако- Наконец, если ф — движение, то и ср— движение, причем 1(Х) ( W) A) W (Х) X Т р ( = Ф~~х (Ф W) = (ф~~1(р) W = е(Х) = X. Тем самым доказано третье свойство. Перечисленные свойства произвольной группы симметрии и по- положены в основу определения общего понятия группы. Определение 5.6. Непустое множество G элементов произ- произвольной природы называется группой, если на нем определена ал- алгебраическая операция, удовлетворяющая следующим трем ак- аксиомам: 1) эта операция ассоциативна; 2) в G существует нейтральный относительно данной опера- операции элемент; 3) для каждого элемента множества G в этом множестве су- существует симметричный элемент. Когда говорят, что G — группа, то всегда имеют в виду опреде- определенную алгебраическую операцию, относительно которой множество является группой. На том же множестве G могут быть заданы и другие алгебраические операции, и относительно каждой из них G может быть, а может и не быть группой. Например, множество всех целых чисел является группой относительно сложения, но не является группой относительно умножения. Алгебраическая опера- операция, относительно которой множество G — группа, называется груп- групповой операцией. Естественно называть групповую операцию умно- умножением или сложением, ибо ей присущи многие формальные свойства умножения и сложения чисел. В первом случае группу называют мультипликативной, во втором — аддитивной. Если групповая опе- операция коммутативна, то группу называют коммутативной или абелевой. Пример 5.2. Всякая группа симметрии плоской фигуры является группой. Пример 5.3. Множество всех подстановок произвольного множества X явля- является группой относительно алгебраической операции умножения подстановок. При этом тождественная подстановка играет роль нейтрального элемента, а симметрич- симметричным элементом для данной подстановки является обратная к ней подстановка. Группу всех подстановок множества А' называют симметрической группой мно- множества X. Обозначим эту группу символом S(X). Если X — конечное множество из п элементов, то вместо S (X) будет употребляться символ Sn. Пример 5.4. Рассмотрим множество GL (n, R) всех квадратных пх«-матриц с вещественными элементами и с отличным от нуля определителем: GL(n, *) = [А?ЪПшП\1А\*0}. Согласно теореме об умножении определителей, | АВ ( = | А | • / В | для любых матриц Л, B?Rnn. Поэтому если Л, B?GL(n, R), то и их произведение AB(iGL(n, R). Это означает, что умножение матриц задает на GL(n, R) алгебра- алгебраическую операцию. Мы уже знаем, что эта операция ассоциативна, что единичная 74
матрица ? играет относительно нее роль нейтрального элемента. Кроме того, для каждой матрицы A?GL (n, R) в силу ее невырожденности существует обратная матрица А—1 ? GL (/г, R), для которой АА~г = А~ХА = Е. Следовательно, мно- множество GL (/г, R) вместе с операцией умножения матриц образует группу, которая называется полной линейной группой степени п над R. Важность этой группы объ- объясняется тем, что она содержит много других интересных групп. Пример 5.5. Множество всех отличных от нуля действительных чисел — груп- группа относительно умножения. Это мультипликативная группа действительных чисел. Пример 5.6. Множество всех действительных чисел является группой относи- относительно сложения. Это аддитивная группа действительных чисел. Группы, приведенные в примерах 5.5 и 5.6, коммутативны. Группы, которые содержат конечное число элементов, называют- называются конечными. Число элементов в конечной группе называется по- порядком группы. Так, симметрическая группа Sn конечна и имеет порядок п\ Группы симметрии квадрата, ромба и параллелограмма являются соответственно конечными группами восьмого, четвертого и второго порядков. Групповую операцию конечной группы можно записать с по- помощью таблицы, приведенной в § 5.1. Пусть, например, G — группа симметрии ромба ABCD (см. рис. 5.1.). Обозначим повороты вокруг центра ромба на 0 и 180° соответственно через е и а, а отражения относительно диагоналей ромба АС и BD — через Ь и с. Тогда G = {е, а, 6, с}, и таблица умножения в группе имеет вид е а Ь с е е а b с а а е с b Ь b с е а с с b а е Проверим справедливость приведенной таблицы. Каждое преоб разование из группы G можно записать в виде таблички из двух" строчек, где в верхней строчке перечислены все вершины ромба, а нижняя строчка показывает, куда каждая из них переходит под действием данного преобразования. Записываем: (А е = \А (А в в в D С С С С D,« D\ а с (А -\с (А = С В D В В С А С А D\ Bj D\ } Чтобы найти, например, произведение ас, достаточно записать его в виде такой таблички. Так, преобразование с переводит верши- вершину Л в С, а преобразование а переводит вершину С в А. Таким об- образом, преобразование ас переводит вершину А в А. .Аналогично можно получить, что вершина В переходит в Д вершина С — в С, а вершина D — в В. Отсюда (А В, С D\ пс-[а ас в)> . . т. е. ас = Ь. 75
Отметим некоторые простейшие свойства произвольной группы для определенности будем считать, что рассматриваемые группы мультипликативны): 1) В группе лишь одна единица, и для каждого элемента есть лишь один обратный элемент. Это свойство непосредственно следует из определения группы и предложений 4.1 и 4.2. Будем обозначать единицу группы бук- буквой е, а элемент, обратный к элементу g, — символом g; 2) для любых элементов а и b группы G каждое из уравнений ах^Ь A) и уа = Ь B) имеет в G единственное решение: х = а~хЬ, у = Ьа~х. Проверим сначала, что х = а~хЬ есть решение уравнения A): а {а-Щ = (аа) b = eb = b. Покажем, что других решений уравнение A) не имеет. Действитель- Действительно, если х0 — решение A), то ах0 = 6, откуда а" (ах0) = а~~хЬ или х0 = а~~хЬ. Уравнение B) исследуется аналогично; 3) для любых элементов а и b группы Действительно, (ab) {Ь-га-г) = афЬ-1) а = (ае) а~1 == аа = е. Аналогично (b~~1a~~1)ab = e. Отметим, что для коммутативной группы доказанная формула принимает вид Упражнения 1. Составьте таблицу умножения группы симметрии квадрата. 2. Найдите группу симметрии равностороннего треугольника и составьте ее таблицу умножения. 3. Докажите, что если аа = е для любого элемента а группы G, то эта груп- группа абелева. 4. Покажите, что конечное множество G, на котором определена ассоциатив- ассоциативная алгебраическая операция и каждое из уравнений ах — b, ya — b для любых а и Ъ из G имеет в G не более одного решения, является группой. 5.3. Подгруппы Определение 5.7. Подмножество группы G называется под- подгруппой группы G, если оно само является группой относительно групповой операции в G. Введение понятия подгруппы частично объясняется следующими двумя обстоятельствами: во-первых, многие интересные группы яв- являются подгруппами сравнительно небольшого числа известных 76
групп; во-вторых, изучение группы в значительной мере сводится к изучению ее подгрупп, которые часто устроены проще самой группы. Тот факт, что Н — подгруппа группы G, принято кратко записы- записывать так: Н < G. Будем называть групповую операцию в G умно- умножением. Имеет место следующий критерий подгруппы. Теорема 5*1- Непустое подмножество Н группы G является подгруппой тогда и только тогда, когда выполняются следующие два условия: 1) для любых элементов а, Ь?Н произведение ab?H; 2) для любого элемента а?Н обратный к нему а~1?Н. )> Пусть Н < G. Тогда умножение элементов Я, рассматривае- рассматриваемых как элементы G, есть алгебраическая операция на //, т. е. справедливо первое условие. Покажем, что единица е0 подгруппы Н совпадает с единицей е группы G. Воспользуемся очевидным равен- равенством еоео = е0. Так как е0 6 G, то существует элемент eo~l ? G. Ум- Умножая последнее равенство слева на е^\ получаем ^(Г1 (^о) = ео~1ео => [е^1ео) е0 = е => ее0 = е =>¦ е0 = е. Покажем теперь, что если а?Н, то элементы, обратные к а в G и Я, совпадают. Второе условие теоремы 5.1 вытекает из этого утверждения очевидным образом. Пусть а~г обозначает элемент из Я, обратный к а. Тогда а~га = аа~г = е0 = е. Но это означает, что а~г — элемент, обратный к а в группе G. Предположим, что для подмножества Я справедливы оба усло- условия теоремы 5.1 Из первого условия следует, что умножение в группе G определяет на Я алгебраическую операцию умножения. Согласно второму условию, элемент а~х группы G, обратный к а, тоже принадлежит Я. Отсюда, применяя первое условие, получаем а~1а = ^еЯ, A) т. е. единица группы G лежит в Я и, очевидно, играет в Я роль единицы. Из равенства A) следует, что для каждого элемента мно-' жества Я в Я существует обратный. Ассоциативность умножения в Я вытекает из ассоциативности умножения в G. ^ Пример 5.7. Для любой группы G сама она и множество {е}, содержащее лишь единицу е этой группы, являются подгруппами G. Эти подгруппы часто на- называют тривиальными. Пример 5.8. Множество всех четных чисел есть подгруппа аддитивной группы целых чисел. Пример 5.9. Множество всех четных подстановок симметрической группы Sn является подгруппой Sn (см. § 4.1) и называется знакопеременной группой степени п. Пример 5.10. Пусть X — произвольное множество и х0 — его фиксированный элемент. Рассмотрим множество Sx всех подстановок множества X, оставляющих элемент х0 неподвижным: Проверим, что 5^ <S(X). Очевидно e?Sx, так что SXo не пусто. Далее, если ф€5^, то Ф(#о) = *е> и поэтому х0 = ф~! (х0), т. е. ф" ? SAV Если еще г|5 6 SXo, то°^ф (*0) = г|? (ф (-го)) = if (*о) = *о, откуда ф<р € SXq. 77
Пример 5.11. Обозначим через SL (n, R) подмножество полной линейной груп- группы GL (я, R), состоящее из матриц с определителем, равным единице. Тогда SL (n, R) < GL (/г, R) и называется специальной линейной группой степени п над R. Под ат, где т — произвольное натуральное число и а — произ- произвольный элемент группы G, будем понимать произведение а ... а, где число сомножителей равно т. Упражнения 1. Докажите, что пересечение любого множества подгрупп группы G есть подгруппа G. 2. Найдите все подгруппы в группе симметрии квадрата. 3. Докажите, что (ат)~~1 = (яГ~1)т, где т — натуральное число. Таким образом, (ат)~~1 и (а~~1)т при т натуральном — это один и тот же элемент, который будем обозначать сГ~т. Кроме того, положим а°=е для любо- любого элемента а. 4. Докажите: 1) атап = ат~^п для любых целых чисел т и п\ 2) (ат)п = = атп для любых целых чисел тип. 5.4. Кольца Мы уже встречались с множествами, например, Z и Цп,п, на ко- которых определены не одна, а две алгебраические операции. Такие множества часто встречаются в математике. Рассмотрим в данном параграфе одно из важнейших понятий современной алгебры —по- —понятие кольца, позволяющее с единой точки зрения изучать многие из этих объектов. Изучим более внимательно множество целых чисел Z и мно- множество матриц Rn, n- На каждом из них определены алгебраические операции сложения и умножения. В обоих случаях операция сло- сложения ассоциативна и коммутативна и обладает нулевым элементом. Роль нуля в Z играет число 0, а в Rn, n — нулевая матрица. Эле- Элементом, противоположным числу а, является число —а, а матрице А — матрица —А. Это означает, что Z и Rn,n есть абелевы группы относительно операции сложения. Что касается операции умножения, то в обоих случаях отметим ее ассоциативность и связь с операцией сложения законами дистри- дистрибутивности: аф + с) = ah + ас для любых а, 6, с ? Z; А (В -f С) = = АВ + АС, (В + С)А=ВА + СА для любых Л, В, C?Rntn. Раз- Разница в записи условий дистрибутивности объясняется некоммута- некоммутативностью умножения в Rrt, n. Определение 5.8. Непустое множество К элементов произ- произвольной природы называют кольцом, если на нем определены две алгебраические операции, называемые сложением и умножением, удовлетворяющие следующим аксиомам: 1) относительно сложения К является абелевой группой; 2) умножение ассоциативно; 3) сложение и умножение связаны законами дистрибутивности, т. е. для любых элементов а, Ъ, с?К a(b + c)=ab + ас, (Ь + с) а = Ьа + са. 7Я
Таким образом, каждое из множеств Z и Rn,n является кольцом. Приведем еще несколько примеров колец. Пример 5.12. Множества всех рациональных и всех действительных чисел (относительно обычных действий сложения и умножения чисел) являются кольцами. Относительно этих же операций множество К = {а-}-b У^ 2 \at b?Z} тоже есть кольцо. Элементами всех этих колец являются числа, в силу чего и сами кольца называются числовыми. Арифметические свойства числовых колец — предмет изучения теории алгебраических чисел. Пример 5.13. Пусть Сга ^ обозначает множество всех непрерывных вещест- вещественных функций, заданных на отрезке [а, Ь]. Сумму и произведение функций Ф, г|?? С[а> 6j определим формулами (<р -f t) (х) = Ф (х) + Ф (*)» ФФ (х) = Ч>(Х)МХ) для любого х€[а, Ь], т. е. так, как это делается обычно в математическом ана- анализе (не путайте такое умножение функций с умножением отображений!) Читате- Читателю предлагается самостоятельно проверить, что множество Сга ^ относительно определенных таким образом сложения и умножения является кольцом. Нулем этого кольца служит функция, тождественно равная нулю на [а, Ь]. Отметим, что кольца функций играют важную роль в функциональном анализе. Замечание. Если из определения кольца убрать аксиому ассоциативности, то мы включаем в рассмотрение и так называемые «неассоциативные кольца». Важ- Важнейшие примеры таких колец, играющие существенную роль в современной мате- математике, получаются из колец в смысле определения 5.8, при замене операции умножения операцией коммутирования: [a, b] = ab — Ьа. Мы, однако, исключаем неассоциативные кольца из рассмотрения ввиду того, что в нашем курсе они не будут использоваться. Кольцо называется коммутативным, если умножение в нем коммутативно. Все рассмотренные выше кольца, за исключением Rn, „, являются коммутативными. Рассмотрим простейшие свойства произвольного кольца К: 1) согласно определению кольца, множество всех его элементов относительно сложения образует абелеву группу. Эта группа называется аддитивной группой кольца. Для нее справедливы (см. § 5.3) следующие утверждения: в К лишь один нуль 0; для любого элемента а?К в К есть единственный проти- противоположный элемент —а\ для любых элементов а и b уравнение а + х = Ь A) имеет в К единственное решение х = (-—а) + 6 = 6+ (—#)• Решение уравнения A) называется разностью b — а. Таким об- образом, в кольце определяется вычитание, и по определению b — а = = b + (—а). Очевидно, а — а = 0; 2) умножение дистрибутивно относительно вычитания, т. е. для любых а, 6, с 6 К а F*— с) = ab — ас, (Ь — с) а = Ьа — са. Первое равенство равносильно равенству а (Ь — с) + ас = ab. Да- Далее, а(Ь — с) + ас = а(ф — с) + с) ---¦ а({Ь + (—с)) + с) =аф+((—с)+ + с)) = а ф + 0) = ab. Второе равенство доказывается аналогично; 3) для любого элемента а?К а • 0 = 0а - 0. 7Q
В самом деле, а • 0 = а (а — а) = аа — аа ¦= 0. Второе равенство доказывается так же просто. Отметим, что существуют кольца, в которых из равенства ab=0 не следует равенство нулю хотя бы одного из сомножителей. Так, в кольце R2, 2 1 01 ]0 0] ГО 01 0 0J 10 1J = |0 Op Аналогичная ситуация имеет место в кольце С[а> ь]. Произведе- Произведение двух функций, не равных тождественно нулю, может оказаться функцией, принимающей нулевое значение в каждой точке [а, Ь]. Читателю рекомендуется самостоятельно построить соответствую- соответствующий пример. Если элементы а и Ь кольца К отличны от нуля, но ab == 0, то аи b называются делителями нуля. Таким образом, R2, 2 и С[а? ^ есть кольца с делителями нуля. Напротив, все числовые кольца не имеют делителей нуля; 4) пусть а — отличный от нуля элемент кольца К, не являю- являющийся делителем нуля. Если для элементов Ь, с?К справедливо равенство аЪ --• ас или равенство Ьа = са, то b = с. Пусть, например, ab = ас. Тогда ab — ас = 0 и, согласно второ- второму свойству, а(Ь — с) =0. Так как а не является делителем нуля, то & — с = 0, т. е. b = с; 5) для любых элементов a, b?K (—a) b = a (—b) = —ab. Проверим, например, что (—a) b = —ab. Это равносильно про- проверке равенства ab + (—a) b = 0; ab + (—a) b = (a + (—а)) 6 = 0&=0. Все рассмотренные кольца обладают единицей. Однако существу - ют кольца без единицы, например кольцо, состоящее из четных целых чисел; 6) кольцо не может иметь более одной единицы. Если кольцо содержит более одного элемента и имеет единицу, то она не явля- является нулем. Первое утверждение есть конкретизация общего факта (см. пред- предложение 5.1). Для доказательства второго предположим, что кольцо К содержит единицу 1, которая в то же время играет роль нуля, т. е 1=0. Тогда для любого а 6 К имеем la = а и la = 0а = 0, т. е. а = 0. Но это означает, что кольцо К состоит из одного эле- элемента 0=1, что исключено. Пусть К — кольцо с единицей 1. Если для элемента а?К в К существует обратный элемент, то а называется обратимым элемен- элементом кольца К. Если а — обратимый элемент кольца, то обратный к нему элемент а~х определен однозначно (в силу ассоциативности умножения и предложения 5.3); 7) в кольце К с единицей множество /С* всех обратимых эле- элементов является группой относительно умножения. Проверим сначала, что операция умножения есть алгебраическая операция на множестве /(*, т. е. для любых элементов а, Ь?К* их произведение ab 6 ^С*- 80
Рассмотрим произведение Ь~га~г элементов кольца /С, обратных b и а: (b~1a~1)ab = Ь~1(а~~1а)Ь = Ь~гЬ = 1. Аналогично ab(b~1a~~1) = 1. Это означает, что Ь~~1а~1 есть элемент, обратный ab, т. е. ab?K*. Согласно одной из аксиом кольца, умножение в /С, а поэтому и в К* ассоциативно. Очевидно, 1 ? /С* и играет в /С* роль единицы. Наконец, если элемент а?К*, т. е. обратим, то обратимым будет и элемент а, т. е. а~г?К*. Так что для каждого а 6 /С* в /С* существует обратный элемент. Группу К* называют мультипликативной группой кольца К. Пример 5.15. Для кольца Z целых чисел Z*= {1, —1}. Пример 5.16. Для кольца матриц Rn n мультипликативная группа R*^ n сов- совпадает с полной линейной группой GL(n, R). В заключение введем понятие подкольца, которое является ана- аналогом понятия подгруппы. Определение 5.9. Подмножество L кольца К называется подкольцом кольца К, если L само является кольцом относительно операций в кольце К. Имеет место следующий критерий подкольца. Его несложное до- доказательство предлагается читателю. Теорема 5*2» Подмножество L кольца К является подкольцом в К тогда и только тогда, когда выполняются следующие два условия: 1) L является подгруппой аддитивной группы кольца К; 2) для любых элементов a, b?L произведение ab?L. Пример 5.17. Множество всех целых чисел, кратных данному натуральному п, являются подкольцом кольца целых чисел Z. Пример 5.18. Множество всех /гX «-матриц с целыми (рациональными) элемен- элементами есть подкольцо кольца матриц Rn n. Пример 5.19. Множество С[а ^ всех один раз непрерывно дифференцируемых вещественных функций, заданных на отрезке [а, Ь], есть подкольцо кольца С[а, ьу Проверьте, что во всех трех примерах выполняется критерии подкольца. Упражнения 1. Элемент а ^ 0 кольца К называется нильпотентным, если ап — 0 для не- некоторого натурального п. Докажите, что если кольцо К с единицей, то из ниль- нильпотентности элемента а следует обратимость элемента 1 — а. 5.5. Поля Определение 5.10. Коммутативное кольцо Р с единицей, в котором каждый ненулевой элемент обратим, называется полем. Предполагается, что Р содержит не менее двух элементов, что- чтобы исключить случай Р = {0}. Таким образом, мультипликативная группа поля Р* = Р\{0}. 8!
Пример 5.20. Полями являются множество всех вещественных чисел R и мно- множество всех рациональных чисел Q. Их роль в математике общеизвестна. Пример 5.21. Примером поля, совсем непохожего на R и Q, является конеч- конечное поле Р~ {0,1} из двух элементов. Сложение и умножение в Р задаются сле- следующими таблицами: + 0 1 0 0 1 1 1 0 0 1 0 0 0 1 0 1 Несмотря на чрезвычайно простую структуру, поле Р= {0,1} находит важные применения в алгебраической теории кодирования, при конструировании автомати- автоматических систем связи. Рассмотрим простейшие свойства полей: 1) так как поле является кольцом, то для него выполняются все свойства колец (§ 5.4); 2) в поле нет делителей нуля. Пусть аЪ = 0 для некоторых элементов поля а и Ь. Покажем, что хотя бы один из сомножителей равен нулю. Если а Ф 0, то, умножая обе части последнего равенства на элемент а, получаем a (ab) = а~1 • 0 или Ь = а~1 -0 = 0; 3) для любых элементов а,Ь?Р, афО. уравнение ах = b имеет единственное решение х = а~гЬ. При ЬфО это свойство группы Р*. Если же Ь = 0, то уравне- уравнение принимает вид ах = 0, и так как в поле нет делителей, то х = = 0 = а~~г0 — его единственное решение. Произведение a~lb записывается в виде дроби Ыа. Таким обра- образом, в поле определено деление на любой не равный нулю элемент. Из отмеченных свойств полей и аксиом, входящих в определение поля, следует, что в поле можно производить операции сложения, умножения, вычитания и деления по обычным для арифметики фор- формальным законам (приведение подобных элементов, раскрытие ско- скобок, сложение дробей и др.). Это обстоятельство приводит к тому, что изложенные в преды- предыдущих главах для случая поля действительных чисел R алгебра матриц, метод Гаусса решения систем линейных уравнений, теория определителей и правило Крамера дословно переносятся на случай произвольного основного поля Р. При этом речь идет не только о полученных результатах, но и об их доказательствах. Уточнения требуют лишь утверждения о существовании беско- бесконечного множества различных решений систем линейных уравнений. Они перестают быть справедливыми, если поле Р конечно. Кроме того, для случая произвольного поля в новом доказательстве нуж- нуждается равенство нулю определителя, содержащего две одинаковые строки. По аналогии с понятиями подгруппы и подкольца вводится по- понятие подполя. Определение 5.11. Подмножество F поля Р называется под- полем поля Р, если F само является полем относительно опера- операций в поле Р. 82
Вместо выражения «поле F является подполем поля Р» часто говорят, что «поле Р есть расширение поля Т7». Сформулируем кри- критерий подполя. Теорема 5-3. Подмножество F поля Р, содержащее не менее двух элементов, является подполем в поле Р тогда и только тог- тогда, когда выполняются следующие два условия: 1) F является подкольцом в поле Р; 2) для каждого элемента a?Fy афО, обратный к нему a~i^F. Простое доказательство этой теоремы мы оставляем читателю. Пример 5.22. Множество целых чисел Z есть подкольцо, но не подполе поля Q. Пример 5.23. Поле Q есть подполе поля R. Пример 5.24. Поле Р = {а + Ь У 3 | а, Ъ ? Q} есть расширение поля Q (см. упражнение 1). В заключение отметим, что концепции кольца и поля в общем виде впервые появились в работах немецких математиков Ю. В. Р. Де- декинда и Л. Кронекера (середина XIX в.). Упражнения 1. Проверьте, что множество Р = {а + a Y 3 | а, Ъ ? Q} относительно сложе- сложения и умножения чисел есть поле. 2. Докажите, что конечное коммутативное кольцо без делителей нуля, содер- содержащее более одного элемента, является полем. 3. Если Р есть расширение поля F, то единица и нуль поля Р совпадают с единицей и нулем поля F. Докажите. 6. КОМПЛЕКСНЫЕ ЧИСЛА В школьном курсе математики несколько раз происходило рас- расширение понятия числа. Этот процесс можно схематично изобразить в виде цепочки включений: NczZczQczR, где N, Z, Q, R обозначают соответственно множества натураль- натуральных, целых, рациональных и действительных чисел. При этом вся- всякое очередное расширение числовой системы приводило к системе чисел, сохраняющей все основные свойства предыдущей системы и в то же время обладающей рядом новых полезных свойств. Так, переход от N к Z позволил ввести операцию вычитания, переход от Z к Q — операцию деления. В системе R можно извлекать корни любой степени из положительных чисел, в то время как в Q даже выражение ]/" 2 не имеет смысла. Однако и в поле действительных чисел R такое простое алгебраическое уравнение, как х2 + 1 = О, неразрешимо. Так как многие математические задачи приводят к различным алгебраическим уравнениям, требуется построить новую систему, содержащую решение любого такого уравнения. В этой главе будет детально изучено некоторое расширение поля R — поле комплексных чисел С, которое решает поставленную проблему. 83
6.1. Построение поля комплексных чисел Мы начнем с задачи, которая, на первый взгляд, кажется гораз- гораздо более узкой, чем сформулированная выше проблема. Пусть требуется построить поле С, которое было бы расширени- расширением поля R и содержало решение уравнения х2 4- 1 =0. Отметим, что, согласно определению расширения поля, сложение и умноже- умножение элементов из R, рассматриваемых как элементы поля С, должны совпадать со сложением и умножением действительных чисел. При этом единица и нуль поля С совпадают с единицей и нулем поля R (см. упражнение 3, § 5.5). Предположим, что искомое поле С существует. Тогда в С най- найдется некоторый элемент t, такой, что i2 + 1 = 0 или Р = —1. Здесь i возводится в квадрат и складывается с 1, согласно операциям умножения и сложения, относительно которых множество С есть поле. Пусть а и 66R. Тогда а, Ь6С, и так как i 6С, то и а + Ы 6С. Каждый элемент а + Ы записывается в таком виде однозначно. Действительно, пусть с = а' + bri. Тогда а + bi=af+bfi=^i(b—&')= = а! — а. Если бы b — br ф 0, то что невозможно. Значит, b — 6' = 0, а тогда и а' — а = 0. Следова- Следовательно, а' = а, Ьг = Ь. Рассмотрим подмножество Р = {a f Ы \ a, b ? R}. Очевидно, Я zd R и /6 Р. Замечательно то, что Р есть подполе поля С. Проверим сначала, что Р является подгруппой аддитивной груп- иц поля С, воспользовавшись критерием подгруппы (§ 5.3). Если с и с'бР, то и с + с'?Р. В самом деле, пользуясь аксиомами поля, получаем (а + Ы) + (а' + &'Л = (а + а') + F + 60 /, A) где а + а', 6 + &'6R- Для любого элемента а + Ы?Р противоположным в поле С является элемент (—а) + (— b) i' ? Р. Покажем теперь, что произведение элементов из Р принадле- принадлежит Р, т. е. что, согласно критерию подкольца (§ 5.4), Р есть под- кольцо поля С: (а + Ы) (а' + b'i) - аа' + ab'i + ha'i + Wi2. Так как i2 = —1, то (а + Ы) (а' + ЬЧ) - {аа' — W) + (at/ + ba') t, B) где аа' — bb\ abf + baf 6 R. Докажем, наконец, обратимость в Р произвольного элемента а -{- Ы Ф 0, откуда и будет следовать, что подкольцо Р есть подпо- подполе поля С (см. § 5.5). Заметим сначала, что (a -f bi) (a + (—b) i) = а2 -{- Ь2. 84
Так как а + ЫФО, то а2 + Ь2Ф0, и последнее равенство можно переписать в виде (а + Ы) ( 5 + ~Ъ f) == 1. C) V ' \ а2 Ч б2 я2 + &2 / ИЛИ Итак, если существует расширение С поля R, содержащее ко- корень i уравнения х2 + 1 = 0, то С содержит поле Р = {а+W | а, &6R}, обладающее тем же свойством. Поэтому в качестве С можно взять поле Р. Это заключение подсказывает возможный способ построения искомого поля С. Обозначим через С декартов квадрат множества R, т. е. мно- множество всех упорядоченных пар действительных чисел: С = {(а, Ь)\а9 ЬеН}, Сопоставляя каждому элементу а + Ы рассмотренного поля Р упо- упорядоченную пару (а, 6), определим на множестве С алгебраические операции сложения и умножения с помощью формул, аналогичных формулам A) и B): (а, Ь) + (а', Ь') = (а + а', b + b% D) (а, Ь) (а\ V) = {аа' — ЬЬ\ abf + ba'). E) Прямые вычисления (которые мы предлагаем читателю в качест- качестве несложного упражнения) показывают, что, как и следовало ожи- ожидать, множество С с таким образом определенными сложением и умножением является полем. При этом пара @, 0) играет роль ну- нуля, пара A,0) играет роль единицы; элемент, противоположный паре (а, 6), есть пара (—а, —Ь)\ наконец, элемент, обратный паре (а, Ь)Ф@, 0), есть пара ^~—t ^^ j (см. формулу C)). Поле С называется полем комплексных чисел. Нам остается убедиться, что построенное поле удовлетворяет всем условиям, указанным в рассматриваемой задаче. Прежде всего покажем, что поле комплексных чисел является расширением поля вещественных чисел. Для этой цели рассмотрим пары вида (а, 0). Ставя в соответствие паре (а, 0) вещественное число а, получаем взаимно однозначное соответствие между рас- рассматриваемым множеством пар и множеством R. Складывая и умножая эти пары по формулам D) и E), находим (а, 0) + (bf 0) = (а + Ь, 0), (а, 0) F, 0) = (ab, 0), т. е. пары (а, 0) складываются и умножаются так же, как соот- соответствующие им вещественные числа. Это позволяет нам отождест- отождествить пару (а, 0) с вещественным числом а и везде в дальнейшем вместо (а, 0) писать просто а. В частности, @, 0) = 0; A, 0)= 1. В итоге можно считать, что R есть подполе поля С. 85
Покажем, наконец, что поле С содержит корень уравнения х2 + 1 = 0. Действительно, пара @, 1) при возведении в квадрат дает вещественное число —1: @, 1J = @, 1)@, 1) = (-1, 0) = -1. Пару @, 1) условимся обозначать буквой i и называть мнимой единицей. Итак, сформулированная в начале параграфа задача получила полное решение. Покажем теперь, что при сделанных отождествлениях (а, 0) = а, @, 1) - i всякое комплексное число (а, Ь) можно записать в виде а -\- Ыу где под суммой и произведением понимаются соответствующие алгебра- алгебраические операции в поле комплексных чисел. В самом деле, Ы = (Ь, 0) @, 1) = @, 6), откуда (а, Ь) = (а, 0) 4- + @, Ь) = а + Ы. Эта запись совпадает с уже встречавшейся выше записью элементов поля Р, и именно ею мы будем пользоваться. В записи комплексного числа z в виде a ~f Ы число а называет- называется действительной частью числа z, а Ы — его мнимой частью. Чис- Числа вида Ы называются часто мнимыми числами. Сложение и умножение комплексных чисел, записанных в виде а + Ы, производится по формулам A) и B); противоположное число находится по формуле — (а + Ы) = (—а) + (—6) i, обратное — по формуле 41 ' a2-\-b* a* + b* Последнюю формулу нет необходимости запоминать. Ее легче вывести, умножая числитель и знаменатель дроби на число а -\- bi а — Ы9 отличающееся от знаменателя лишь знаком при мнимой части, а именно: 1 а — bi а — bi а , —b а 4- Ы (а + bi) (а — Ы) а2 + б2 а2 4- Число а — Ы называется числом, сопряженным с числом z = = а + Ы, и обозначается г. Числом, сопряженным с г, будет, оче- очевидно, z, т. е. можно говорить о паре сопряженных чисел z и z. Если z = z, то z 6 R, и наоборот. Теорема 6-1. Сумма и произведение сопряженных комплексных чисел являются действительными числами. ^ Если z = a'+bi, то z + i = 2а, гг = а2 + Ь2. Л Теорема 6-2- Для любых комплексных чисел гъ z2 86
> Пусть zx = а± + b±i, z2 = a2 + ft2t. Тогда zT + z2 — (а± — bxi) + + (<h - hi) = (fli + a2) — ( — b2i) = (axa2 — 6x62) — (а 62) / = z2f - (^ — ад (a2 — Упражнения 1. Найдите все комплексные числа, сопряженные своему квадрату. 6.2. Комплексная плоскость. Геометрическое истолкование действий с комплексными числами Считается, что впервые комплексные числа стали употребляться итальянскими математиками Д. Кардано A545) и Р. Бомбелли A572). Бомбелли дал первое формальное обоснование действий над ком- комплексными числами. Однако еще длительное время математики не имели ясного представления о комплексных числах. Одна из при- причин такого положения заключалась в отсутствии наглядного гео- геометрического истолкования поля С. Желание иметь такое истолко- истолкование станет понятным, если вспомнить, что геометрической интер- интерпретацией поля R служит числовая прямая. В ясной систематиче- систематической форме геометрическое изображение комплексных чисел и дейст- действий над ними появилось лишь в работах К. Весселя A799) и Ж- Р. Аргана A806) и получило известность после работ К. Гаусса. Выберем на плоскости прямоугольную систему координат с осью абсцисс X и осью ординат Y. Тем самым каждой точке плоскости ставится в соответствие пара чисел (а, 6), составленная из ее коор- координат а и Ь. И обратно, каждой паре (а, 6), где а, Ь 6 R, соответ- соответствует вполне определенная точка плоскости. С другой стороны, каждое комплексное число а + Ы можно рас- рассматривать как упорядоченную пару (а, Ь) и наоборот. В результа- результате получается биекция между множеством комплексных чисел С и множеством точек плоскости, которая позволяет отождествить про- произвольное комплексное число а + Ы с точкой плоскости, имеющей в выбранной системе координат координаты (а, Ь). Комплексная плоскость — это плоскость, точки которой мы рассматриваем как комплексные числа. При этом ось абсцисс состоит из точек, изобра- изображающих действительные числа, а ось ординат — из точек, соответст- соответствующих чисто мнимым числам. Ось абсцисс называют действитель- действительной осью, а ось ординат — мнимой (рис. 6.1). ZL 0 1 __ _ —ф i i i 0 I Г 0 Рис. 6.1 Рис. 6.2
В дальнейшем вместо выражения «точка, соответствующая ком- комплексному числу z», будем говорить «точка г». Так как точки плоскости в отличие от точек прямой не имеют естественного порядка, то для комплексных чисел понятия «больше» и «меньше» теряют смысл. Поэтому комплексные числа нельзя со- соединять знаком неравенства. Отождествление поля С с комплекс- . а+ l * ной плоскостью позволяет дать нагляд- 0 ную интерпретацию основных операций над комплексными числами: сложения, ум- умножения и сопряжения. Особенно простую геометрическую интерпретацию имеет сло- сложение. Пусть гх =а1 + bxiy z2 = fl2 + b2i. Тогда г = 2Х + г2 = (fli + а2) + (b± + b2) i. Рассматривая векторы zx, z2, z3, изобража- изображаемые направленными отрезками, выходя- выходящими из начала координат и оканчивающимися соответственно в точ- точках с координатами (аъ Ьх)9 (я2> Ь2) и (аг + а2, Ьг + Ь2)у заключаем, что z = Zjl + z2, т. е. сложение комплексных чисел геометрически выполняется по правилу сложения векторов (правило параллелограм- параллелограмма) (рис. 6.2). Геометрический смысл умножения комплексных чисел станет яс- ясным лишь после того, как мы введем для них новую форму запи- записи — тригонометрическую форму комплексного числа. Точка комплексной плоскости, изображающая комплексное число z = а + Ы, полностью определяется как декартовыми координатами (а, 6), так и полярными координатами: расстоянием г от начала ко- координат до точки и углом ф между положительным направлением оси абсцисс и направлением из начала координат на эту точку (рис. 6.3). Число г называется модулем комплексного числа z и обознача- обозначается через 121. Очевидно, | z \ ^ 0, причем | г | = 0 лишь для 2=0. Угол ф называется аргументом числа z и обозначается arg?. Един- Единственное число, для которого аргумент не определен, — число 0. Однако это число задается равенством \z\ = 0. В дальнейшем нам будет удобно считать, что аргументом числа 0 может быть любое вещественное число. Для всех прочих комплексных чисел аргумент определяется с точностью до целых кратных числа 2л и может принимать как положительные, так и отрицательные действительные значения. При этом положительные углы отсчитываются против ча- часовой стрелки. Заманчивую мысль добиться однозначной определенности аргу- аргумента с помощью естественного ограничения 0 ^ ф < 2я приходится отбросить, как затрудняющую развитие теории. Пусть z = а + Ы. Из рис. 6.3 ясно, что модуль числа z нахо- находится по формуле аргумент числа z=^=0 определяется из равенств
cos ф = air, sin ф = blr. B) Отсюда z = a + Ы = r cos ф + r sin ф* = г (cos ф 4 i sin ф). Таким образом, всякое комплексное число z можно представить в виде z = r (cos ф + *" sin ф), C) где г = |г|, ф = argz. Обратно, если число г = а + bi записано в виде г = r0 (cos ф0 + + Ыпф0), где г0, Фo€R и го>О, то ro = |z|, q>0 = argz. В случае, когда г0 — О, т. е. z = О, это утверждение очевидно. Поэтому можно считать, что г0ф0. В силу равенств находим, что У а2 + б2 = г0 и, согласно A), го=|2|. Из формул B) получаем, что cos ф — cos ф0, sin ф = sin ф0. Но тогда Фо = ф + -\-2nk при некотором &?Z, т. е. Фо = а^г. Запись числа z в виде C) называется его тригонометрической формой. Тригонометрическая форма комплексного числа чрезвычайно хорошо приспособлена к умножению комплексных чисел. Она встре- встречалась уже у Эйлера и Даламбера. Пусть комплексные числа z и гг заданы в тригонометрической форме: z = г (cos ф + i sin ф), z' — г' (cos ф' + i sin ф'). Тогда гг'= [г(cos ф+^'sin ф)] [r'(cos ф'+t sinq)')]=rrf [(cos фс — sin ф sin ф') + i (cos cp sin ф' -f- sin ф cos ф')] = rrr [cos (ф + ф' + 18т(ф + ф')]- Мы получили запись произведения zzf в тригонометрической форме: zz' = rrr [cos (ф + Ф') + i sin (ф + ф')]. D) Таким образом, справедлива Теорема 6-3- При умножении комплексных чисел их модули перемножаются, а аргументы складываются: |zz4 =|2|.|*4 arg(zz') = argz4-argz'. E) Преимущество формулы D) по сравнению с формулой B), зада- задающей умножение комплексных чисел в обычной форме, несомненно. Напротив, сложение комплексных чисел удобнее производить, когда они записаны в обычной форме. Отметим, что второе из равенств E) перестает быть верным, если ограничить аргумент комплексного числа условием 0<;arg?<2tt. Так как и модуль, и аргумент комплексного числа имеют про- простую геометрическую интерпретацию, сформулированная теорема де- делает понятным геометрический смысл умножения точек комплексной плоскости.
Пусть z и z — комплексные сопряженные числа. Если z = aJrbi, то z = а — Ы. Геометрически гиг являются точками, симметрич- симметричными относительно действительной оси (рис. 6.4). Отсюда вытекают равенства У b 0 -6, ¦я 1 1. 1 1 1 \а л if \г\ = |г|, avgz = ~argz. Вернемся к операции сложения на комплексной плоскости. Мы знаем, что модуль | zx + г21 равен длине диагонали параллелограмма со стороны Ozx и Ог2 (см. рис. 6.2). Поэтому из известной теоремы о сторонах треуголь- треугольника вытекает неравенство IZx + ZaKIZxI + l^l. F) Положим z = zx + г2. Тогда zx = ~г— г2 и \г — z2\ = \zx\. Из рис. 6.2 видно, что | zx | равен расстоянию меж- между точками г3 и г. Таким образом, рас- расстояние между двумя точками комплекс- комплексной плоскости совпадает с модулем их Рис- 6А разности. Полученные результаты позволяют обнаружить тесную связь операций над комплексными числами с основными геометрическими преобразованиями плоскости, известными читателю из курса средней школы, — параллельными сдвигами, поворотами, симметриями отно- относительно прямых, гомотетиями. Зафиксируем некоторое число г0 ? С. Пусть г|)х: С~> С — преобра- преобразование комплексной плоскости, такое, что для любого г 6 С *фх (г) = = г + г0. Вспоминая, что точки комплексной плоскости складывают- складываются по правилу сложения векторов, заключаем, что у\)х есть парал- параллельный сдвиг плоскости на вектор г0. Пусть теперь |го|= 1, т- е- Zo=cos<P0 + * sincp0. Тогда преобразо- преобразование i|vC->C, для которого я|J(г) = гг0 при любом г 6 С, есть по- поворот плоскости вокруг точки О на угол фо = а^го. Действительно, если г = г (cos ср + i sin cp), то, согласно правилу умножения ком- комплексных чисел в тригонометрической форме, гг0 = г [cos (ф + ср0) + -Wsin(cp + (po)]. Оказывается всякий поворот г|) плоскости вокруг любой заданной точки zx на некоторый угол ф0 можно получить с помощью парал- параллельного сдвига г|)х на вектор Oz\ и поворота i|J вокруг точки О на тот же угол ф0. Действительно, из рис. 6.5 видно, что для любо- любого z ее •Ч? (^) = *iWr! (г) = *i*2 (z — zi) = *i i(z — zi) zo) = (г 7 г^ г° + Zl> где г0 = cos ф0 + i sin cp0. Если взять г0 ? R, то преобразование ^gtC-^C, для которого •ф3 (г) = 2г0, есть гомотетия с центром в начале координат и коэф- коэффициентом гомотетии г0. 90
Наконец, преобразование t|L:C->-C, которое ставит в соответст- соответствие каждому комплексному числу z сопряженное с ним число г, есть отражение (симметрия) комплексной плоскости относительно дейст- действительной оси. Итак, систему комплексных чисел можно рассматривать как удоб- удобный аналитический аппарат для изучения преобразований плоскости. Рис. 6.5 Естественно возникает вопрос о существовании числовой системы, играющей аналогичную роль по отношению к преобразованиям про- пространства. Поиски такой системы привели ирландского математика У. Гамильтона в середине XIК в. к открытию системы кватернионов. Эта система удовлетворяет всем аксиомам поля, кроме аксиомы о коммутативности умножения. Кватернионы описываются следующим образом. Рассмотрим мно- множество Я, состоящее из всех упорядоченных четверок веществен- вещественных чисел: Н=:{(а, Ь, с, d)\a, b, с, deR}. Любую такую четверку будем называть кватернионом. Операцию сложения на множестве Я определим формулой, с ко- которой мы уже встречались при сложении матриц и комплексных чисел: (fli, Ьъ съ d1) + (a29 Ьъ с2, d2) = (ai + a2, Ьу+Ь2У сг + с2, d1 + d2). Столь же естественно вводится операция умножения кватерниона на действительное число: к (а, Ь, с, d) = (kay kby кс, kd)y k?R. Введем для четверок A, 0, 0, 0), @, 1, 0, 0), @, 0, 1, 0), @, 0, 0, 1) сокращенные обозначения 1, t, /> к. Тогда каждый ква- кватернион можно однозначно представить в виде (а, 6, с, d) = а • 1 + Ы + с] + dk. Чтобы определить операцию умножения на множестве Я, будем считать, что 1 • h ~ h • 1 = h для любого кватерниона h. Далее по- положим по определению 91
/2 = у2 = k2 = _Jf у = _yi = й> у^ = _?J = ^ # Зная таблицу умножения кватернионов г, /, k, умножение произ- произвольных кватернионов определяем, исходя из законов дистрибу- дистрибутивности. В результате получается формула: (аг ¦ 1 + Ъх i + cj + dxk) (а2 • 1 + b2i + c2j + d2k) = = (ага2 — Ьф2 — dc2 — rfid8) 1 + (аф2 + Ьга2 + с^ — d^) i + — сф2) k. Изучение кватернионов позволило четко выделить понятие век- вектора, определить скалярное и векторное произведения векторов и тем самым создать векторное исчисление, являющееся важнейшим аппа- аппаратом в современной математике и ее приложениях. Кроме того, кватернионы находят применение в алгебре и теории чисел. Следу- Следует, однако, отметить, что роль кватернионов в математике скромнее роли комплексных чисел. Упражнения 1. Представьте в тригонометрической форме число 1 — i У 3 . 2. Найдите тригонометрическую форму комплексных чисел гг = (—3) (cos л/44- + i sin я/4), z2 = sin Зя/4 + i cos Зл/4. \\ z \z\ T7 3. Докажите, что 4. Пользуясь формулой ' | zz' | = j z \ • | г' |, докажите, что произведение двух натуральных чисел, каждое из которых есть сумма квадратов двух целых, снова есть сумма квадратов двух целых. 5. Пользуясь установленной связью между сложением и умножением векторов, с одной стороны, и параллельными сдвигами и вращениями, с другой, докажите, что произведение двух произвольных поворотов вокруг точек Z\ и г2 соответствен- соответственно с углами поворота фх и <р2, | Щ | < 2л, есть снова поворот, если <pi + Ф2 ? О, и есть параллельный сдвиг, если фх + ф2 = 0. 6. Докажите, что всякую гомотетию плоскости и всякое отражение плоскости относительно произвольной прямой можно представить в виде композиции описан- описанных выше преобразований %, ф2> Ч^з* ^4- 6.3. Извлечение корней из комплексных чисел Покажем, что с точки зрения алгебры поле С имеет по сравне- сравнению с полем R существенное преимущество: из любого комплексно- комплексного числа можно извлекать корни любой степени. Начнем с вопроса о возведении комплексных чисел в степень. Пусть п — произвольное натуральное число. Для возведения числа z = а + bi в степень п можно применить к выражению а + Ы формулу бинома Ньютона. Эта формула известна читателю для слу- случая суммы двух действительных чисел, но ее доказательство до- дословно переносится на комплексный случай, так как основано лишь на законах ассоциативности, коммутативности и дистрибутивности, справедливых для любого поля. Итак, 92
(а + bi)" = а" + na«-l(bi) + n( 1} an~2 (bif + + ... + Clan~k {bif + ... +(bi)n, A) где С„ = " " —:^—ч При этом надо учесть равенства i2 =-- —1, t3 = —i, i4 = 1, из которых следует iik = 1, iik+l = i, + H3 .«+2 = _1) -4H-3=_._ Гораздо проще возведение в степень я комплексного числа z, заданного в тригонометрической форме: [г (cos ф + i sin ф)]" = rn (cos яф + i sin яф). B) Эта формула, называемая формулой Муавра, есть прямое следствие правила умножения комплексных чисел в тригонометрической фор- форме. Формула Муавра позволяет дать полное решение задачи об из- извлечении корней из комплексных чисел. Пусть г = г (cos ф + i sin ф) — произвольное комплексное число. Равенство у г = Zo равносильно равенству z = 20. Если г ¦= 0, то из Zo = 0 следует <г0 = 0. Поэтому в дальнейшем можно считать Мы не знаем пока, существует ли хотя бы одно число го?С, такое, что z$ = z. Предположим, что такое число г0 = r0 (cos ф0 + + tsin9o) существует, т. е. [r0 (cos ф0 + i sin фо)]Аг = г (cos ф + i sin q>) или Го (cos я ф0 + i sin я ф0) = г (cos ф + i sin ф). Отсюда, согласно результатам § 6.2, го = г, яфо = ф + 2яй, k = 0, ±1, ±2, ... Следовательно, го = у г и ф0 = -L-J . Под у г здесь понима- п ется однозначно определенное положительное значение корня я-й степени из положительного действительного числа г. Таким образом, если z0 существует, то оно должно иметь сле- следующий вид: г cos-*—: Ь ism -i—^- , C) \ п п ) где k принимает некоторое целое значение. Пользуясь формулой Муавра, убеждаемся, что zq = z при лю- любом целом k. Так что формула C) дает в точности все корни я-й степени из числа 2, когда k пробегает все целые числа. Придавая k различные значения, мы не всегда будем получать различные корни. Действительно, по теореме 1.1 всякое k можно записать в виде k = nq + /, где 0 ^ t ^ я — 1. Тогда я (nq + t) = ф + 2я/ 2 п п 93
т. е. значение аргумента при данном k отличается от значения ар- аргумента при k = t на число, кратное 2я. Это означает, что в фор- формуле C) можно ограничиться лишь значениями k = О, 1, ..., п—1. В то же время при таких значениях k получаются различные корни, так как разность между их аргументами по абсолютной величине меньше 2я. Итак, нами доказана Теорема 6-4* Извлечение корня п-й степени из комплексного числа z = r(cos cp -f- tsincp) всегда возможно и при гфО дает п различных значений, расположенных в вершинах правильного п-угольника, вписанного в окружность с центром в нуле и ра- радиусом V г : у г = v' r cos -Z-Z- 1- *sin -^ , k = 0, I, ..., n— I. \ n n ] Замечание. Извлечение корней п-и степени из комплексного числа без привлечения тригонометрической формы связано с большими трудностями. Это легко понять, сравнив между собой формулы (I) и B) возведения в степень. Исключение составляет случай п = 2. Следует иметь в виду, что задача на- нахождения тригонометрической формы комплексного числа, записанного в виде z = а -\- Ы, имеет точное решение лишь в единичных случаях. Это объясняется трудностью определения точного значения аргумента ф по заданным значениям sin ф и cos ф. Поэтому изложенный ниже способ извлечения квадратных корней из комплексных чисел имеет практический интерес. Пусть z = а + Ы ф 0 и пусть число а0 + boi — один из его квад- квадратных корней. Тогда (а0 + ЬоО2 ~ а + bi, откуда ао—Й = а, 2aobo=b. D) Из равенства D) легко найти значение суммы квадратов а\ -f- + &о, возводя каждое из равенств в квадрат, а затем складывая их: {at + blf =--а2+Ь2 или al + b\ = V а2 + b* . су Положительный знак перед радикалом объясняется тем, что а0 + 4- bl > 0. Зная сумму и разность квадратов неизвестных а0 и Ьо, на- находим al и bl: al=~{a + VcP+P), bl = ±{-a + Va« + ft«). Эти формулы дают для а0 и Ьо по два значения, отличающихся одно от другого знаком. Однако полученные значения нельзя ком- комбинировать произвольным образом, так как по равенству D) знак произведения aobo должен совпадать со знаком Ь. Это дает два чис- числа вида а0 + boi, отличающихся друг от друга лишь знаком. Так как мы уже знаем (теорема 6.4), что У а + Ы имеет ровно два значения, то два найденных комплексных числа являются искомыми корнями. Рассмотрим случай извлечения корней из числа I. Особый инте- интерес к этому случаю объясняется следующей теоремой. 94
Теорема 6.5. Множество G всех корней п-й степени из 1 яв- является конечной абелевой группой порядка п относительно умно- умножения комплексных чисел. > Согласно определению, G состоит из всех комплексных чи- чисел z, для которых zn = 1. Из теоремы 6.4 следует, что G содержит ровно п элементов. Для доказательства теоремы достаточно прове- проверить, что G есть подгруппа мультипликативной группы поля С. Воспользуемся критерием подгруппы. Если гъ z26G, то (адГ = ^й =1-1 = 1, т. е. произведение ле Для любого z?G (I/;?)*- l/z«=- 1/1 = 1, откуда l/z?G. <4 Теорема 6-6- Существует по крайней мере один корень 8 п-й степени из \, такой, что его степени 8°, е1, ..., 8я исчерпывают все корни п-й степени из 1. > Так как 1 = cos 0 + * sin 0, то, согласно теореме 6.4, все кор- корни n-ii степени из 1 задаются формулой \ 1 = cos 1- i sin —, k = О, 1, 2, ..., п— 1. п п И? формулы Муавра следует, что в качестве s можно взять корень 2я . . . 2л . 8 = COS —г- + I Sin . <4 п п Корень п-й степени из 1, удовлетворяющей условию теоремы 6.6, называется первообразным корнем п-й степени из 1. Корень, указанный при доказательстве этой теоремы, в общем случае — не единственный первообразный корень п-й степени. Следующая теоре- теорема позволяет найти все такие корни. Теорема 6.7- Если г есть первообразный корень'п-й степени из 1, то число гк тогда и только тогда будет первообразным корнем п-й степени, когда k — число, взаимно простое с п. ^ Пусть известно, что sk есть первообразный корень /z-й степе- степени. Покажем, что тогда НОД (k, n) = 1. Предположим, что это не так, и НОД (A, n) = d^>l, k = dk\ п = dn'. Тогда (е*)л' = zkn' = enk' = {гп)к' = 1. Так как /|'<пи (sk)° = 1, то среди чисел (е*)°, (&kI, ...t(sk)n~l есть повторения и, значит, они не хмогут пробегать все п корней п-й степени из 1. Но это противоречит тому, что ek — первообраз- первообразный корень п-я степени. Обратно, пусть НОД (&, я) = 1. Докажем, что в этом случае ek—первообразный корень /z-й степени. Предположим, что это не так. Тогда среди чисел (е*)°, (е*I, ..., (&ky-t должны быть повторения, например, (ek)s = (е*)*, 0^s< <^<п. Последнее равенство можно переписать в виде &kV~s) = 1. Но тогда k(t — s) должно делиться на п. Действительно, по теоре- теореме 1.1 k(t — s) = nq + /*, где 0^r<n. Поэтому sk(t-s) _« ел<7+г — (ъпугг = гг 95
и, значит, гг = 1. Так как по условию теоремы е есть первообраз- первообразный корень /z-й степени и е°= 1, то г = 0, т. е. k(t — s) делится на п. Поэтому, учитывая, что кип взаимно просты, заключаем, что t — s делится на п (см. теорему 1.4). Но это невозможно, так как Упражнения ' i + i Y"T \20 1. Вычислите l — i 2. Пользуясь формулами A) и B), найдите выражения для sin пх и cosnx через степени sin x и cos x. 3. Вычислите сумму 1 + a cos ф + #2 cos 2ф -f ... + ak cos kq>. 4. Найдите ^2 —2t. 5. Вычислите 1^3 — 4t . 6. Докажите, что все корни я-й степени из произвольного комплексного числа z можно получить умножением одного из этих корней на все корни я-й сте- степени из 1. 7. Найдите сумму всех корней я-й степени из 1. 8. Докажите, что если а и Ъ — два взаимно простых натуральных числа, то произведение первообразного корня степени а из 1 на первообразный корень степе- степени b из 1 есть первообразный корень степени ab из 1 и обратно. 9. Запишите первообразные корни степени 6. 6.4. Основная теорема алгебры комплексных чисел Напомним, что поле С первоначально строилось нами с целью решения уравнения х2 -4- 1 = 0. Результаты § 6.3 показывают, что любое уравнение вида хп + z — 0, где z — произвольное комплексное (вещественное) число, имеет в поле С хотя бы одно решение. Еще более удивительно, что в С имеет решение любое алгебраическое уравнение с действительными или комплексными коэффициентами. Точнее, справедлива следующая основная теорема алгебры комплек- комплексных чисел. Теорема 6.8. Всякое алгебраическое уравнение алхл-гал-.1*/1-1+ ... +ai* + ao = Of a^C, апф0, я>1 A) имеет хотя бы одно решение в поле С. Замечание. Эта теорема является одним из крупнейших достижений в ис- истории математики, и раньше ее называли основной теоремой алгебры, так как ре- решение алгебраических уравнений долгое время было в центре внимания алгебра- алгебраистов. Первое доказательство этой теоремы было дано Гауссом в 1799 г. , В этом параграфе мы ограничимся лишь некоторыми рассуждениями, которые хотя и нельзя признать вполне удовлетворительными, но которые делают утверж- утверждение теоремы весьма правдоподобным и стимулируют интерес к поискам ее дока- доказательства (см главу 11). Не ограничивая общности, можно считать, что в уравнении A) ая= 1. Рассмотрим отображение f: С ->¦ С, при котором f (г) = zn -) + a/1_1zn~i + ... +ахг-\-а0 для любого z?C. Это отображение яв- является непрерывным в том смысле, что переводит «достаточно близ- 96
У i кие» точки комплексной плоскости в «близкие» точки. Точнее, для каждой точки г0 6 С и для любого вещественного е > 0 найдется ве- вещественное 6>0, такое, что из \г — «го|<^ следует |/(г)—/(zo)|<e. Ситуация здесь вполне аналогична той, с которой приходится иметь дело при изучении непрерывных функций действительного перемен- переменного в курсе математического анализа. Непрерывность / доказывает- доказывается точно так же, как и в случае функции у = хп + ап__ххп~~^ -j- 4- ••• +а1х + а0 с действительными at. При этом используются доказанные нами ранее свойства модуля комплексных чисел: \ху\ = \х\.\у\, \х + у\^\х\ + \у\. Если / @) = 0, то число 0 и есть иско- искомое решение уравнения A). Пусть f @)Ф0. Обозначим через Qr окружность на комплексной плоскости радиуса г с цент- центром в точке О. Ее образ /(Qr) при ото- отображении / есть некоторая «непрерывная» замкнутая кривая на комплексной плоскости. Из непрерывности / следует, что для достаточно малого г = гх /(QrJ лежит вблизи точки /@), и поэтому не будет «охватывать» точку О (рис. 6.6). Покажем теперь, что при достаточно большом г ^= г2 кривая f(Qr2), напротив, должна «охватывать» точку О. Достаточно потре- потребовать, чтобы г2>тах{1, 2(\ап-\\ + ... + \а±\ + \ао\)}. Сравним между собой гп и /(z), когда г пробегает Qr,. В этом случае из формулы Муавра следует, что точка гп пробегает окруж- окружность с центром в точке О радиуса г". С другой стороны, Рис. 6.6 Так как расстояние от точки /(г) до точки z", равное \f(z)—zn\y не превосходит г§/2, то кривая /(Q^) лежит в кольце, заключен- заключенном между окружностями с центром в точке О радиусов гЦ2 и Зг^/2, и «охватывает» точку О (см. рис. 6.6). Пусть теперь радиус г непрерывно изменяется от г2 до rv Тогда окружность Qr2 непрерывно переходит в окружность Qri, и в силу непрерывности / кривая f(Qrt) непрерывно деформируется в кривую f (Qri). Интуитивно ясно, что при этом найдется такой радиус г0, ^i<ro<^2» что кривая /(Q,-o) проходит через точку О. Это означа- означает, что существует точка zo6^ro, для которой /(zo) = O, т. е. го~ искомое решение нашего уравнения. 4 Зак. 3670 97
Приведенное рассуждение носит топологический характер и весь- весьма поучительно, несмотря на некоторые пробелы и необходимость в уточнении части используемых понятий. 7. ГРУППЫ В этой главе понятие группы подвергается более глубокому изу- изучению. При изложении общих вопросов будем пользоваться мульти- мультипликативными обозначениями; аддитивные обозначения будут упот- употребляться лишь в конкретных примерах. Исключение составляет § 7.7, посвященный конечным абелевым группам. 7.1. Изоморфизмы групп Начиная более основательное изучение теории групп, естественно задаться вопросом: какие две группы следует считать устроенными одинаково. Пусть G — некоторая группа, G' — произвольное множество и cp:G->G' биекция. Как можно было бы превратить множество Gr в группу, определив на нем подходящую алгебраическую операцию? Естественно использовать при этом наличие групповой операции на множестве G. Пусть а'и 6' — произвольные элементы множества G'. Так как ф биективно, то можно рассмотреть элементы ц)~1(аг) = а и ^~i(br)==b из группы G. Пусть ab = c, c?G и у(с) = сг. Тогда естественно определить произведение элементов а' и Ъ' так: а'Ь'=с'. Тем самым умножение элементов множества G' сводится к умноже- умножению их прообразов в группе G (рис. 7.1). Интуитивно ясно (и мы Рис. 7.1 опускаем формальную проверку), что при этом Gr превращается в группу, которая ничем существенным не отличается от группы G. Фактически разница между ними лишь в обозначении элементов. Биекция y:G-+-G' связывает групповую операцию в G с новой групповой операцией в G' следующим образом: Ф (аЬ) = Ф (с) = с' = а'Ъ' = ф (а) ф (Ь) или ф (аЪ) = Ф (а) ф (Ь). Все сказанное делает естественным следующее 98
Определение 7.1. Пусть G и G' — две группы. Отображе- Отображение ф : G ->¦ Gr называется изоморфизмом группы G на группу G', если ф биективно и для любых элементов a, b?G справедливо равенство Ф(а6) = Ф(а)ФF). A) Если условие A) выполняется, будем говорить, что ф сохраняет умножение. Замечание. Хотя умножение в левой и правой частях формулы A) обоз- обозначается одним и тем же символом, следует иметь в виду, что речь здесь идет, вообще говоря, о совершенно различных групповых операциях, определенных на разных множествах. Определение 7.2. Будем говорить, что группа G изоморф- изоморфна группе Gr, если существует изоморфизм G на G'. В этом слу- случае принято писать G^G'. Отметим простейшие свойства изоморфизмов групп: /) тождественное отображение еа группы G есть изоморфизм G на себя. Так что G ^ G; 2) если <p:G-+G' есть изоморфизм групп, то и (f~1:Gr->G есть изоморфизм. Поэтому, если G^G\ то и Gr^G. Существование ф и его биективность следуют из биективности ф. Покажем, что для любых элементов а\ Ъг 6 G' имеет место равенство <р-1(а'&') - ф-Ча') ф-ЧЬ')- B) Так как ф биективно, то B) равносильно равенству Ф (ф-ч*'*')) = ф (ф-ЧОф-ЧЬ'))> C) Но y(q)-l(arbr)) = а'Ь'. С другой стороны, ф (ф~~ЧаО Ф~"Ч^)) = = Ф (ф~~ЧаО) ф(ф~Ч^0) = а'Ъг, так как ф сохраняет умножение. Это доказывает равенство C), а вместе с ним и равенство B); 3) если y:G-+Gr и ij): Gr -> G" — изоморфизмы групп, то и их произведение ty<p:G->G" есть изоморфизм. Следовательно, из G^G' и Gr ?* G" вытекает G & G". Произведение биекций \|)ф есть биекция. Проверим, что я|?ф сох- сохраняет умножение. Для любых a, b(:G имеем (а) ф(Ь)) Приведенные свойства в совокупности означают, что отношение изоморфизма на множестве всех групп есть отношение эквивалент- эквивалентности и поэтому оно разбивает данное множество на непересекаю- непересекающиеся классы изоморфных групп. Так как при изоморфизме сохраняется умножение, то те свойства, которые могут быть выражены в терминах групповой операции, у изоморфных групп одинаковы и, если нас интересуют именно такие свойства, мы можем изоморфные группы не различать. Это заключе- заключение можно было бы Еыразить по - другому, сказав, что мы будем изучать те и только те свойства групп, которые сохраняются при 4* 99
изоморфизмах. С такой точки зрения, изоморфные группы устроены совершенно одинаково. Пусть, например, R+— мультипликативная группа положитель- положительных вещественных чисел, a R— аддитивная группа всех веществен- вещественных чисел. Тогда логарифмическая функция у = \gx осуществляет изоморфизм R+~^R. Действительно, это отображение биективно и имеет место равенство которое соответствует в данной ситуации равенству A) в определе- определении изоморфизма. Любопытно, что, оставаясь в поле рациональных чисел, систему логарифмов построить невозможно. В самом деле, покажем, что ото- отображение cp:Q+~^Q мультипликативной группы положительных ра- рациональных чисел Сц. на аддитивную группу Q всех рациональных чисел, удовлетворяющее условию Ф (аЬ) - ф) + ФF) D) для любых а, Ь ? Q_}-, не может быть инъективным. Пусть ф удовлетворяет равенству D). Выберем в Q+ два различ- различных простых числа рх и р2, для которых ф (рх) и ф (р2) есть рацио- рациональные числа одного знака, например больше нуля. Пусть ф (рх) = = qjku Ф (Рг) — ^2^2» гДе Qi » h — натуральные числа. Из условия D) следует, что ф (ап ) = пу(а) для каждого а ? 0+ и каждого натурального п. Очевидно, p\tq% и р\гЧх—различные на- натуральные числа. В то же время i "¦) = Ы Ф (Л) = Ы ~ Ф (Pi "¦) = Ыг Ф (Л) = Ыг ~ = Ф {pk2iQl) = k2qx ф (р2) = k2qx -& = qxq2, «2 т. е. ф не инъективно. Таким образом, группы Q+ и Q не изоморфны, в то время как r;^r. Изоморфизм произвольной группы G на себя называется авто- автоморфизмом этой группы. Множество всех автоморфизмов группы G принято обозначать символом Aut G. Если ф-.G-^G и i|):G-^G — два автоморфизма G, то определено их произведение г|)ф :G-*-G, ко- которое ввиду третьего свойства изоморфизмов групп снова есть авто- автоморфизм группы G. Таким образом, композиция автоморфизмов оп- определяет на Aut G алгебраическую операцию. Ее ассоциативность есть прямое следствие ассоциативности умножения отображений. Тож- Тождественное отображение eG играет роль единицы относительно этой алгебраической операции, и для каждого автоморфизма ф? Aut G ото- отображение ф тоже есть автоморфизм G (первое и второе свойства). Итак, AutG есть группа относительно умножения автоморфизмов. 100
Пусть теперь G — произвольная группа, g — ее фиксированный элемент. Рассмотрим отображение q)g :G->G, для которого Так как из равенства gxxg~l = gx2g~l следует хх = х2, то ср^ инъек- тивно. Далее, для любого элемента у ? G найдется элемент х — g~lyg, такой, что (pg(x) = у. Поэтому cpg сюръективно и, следовательно, би- биективно. Проверим, что q)g сохраняет умножение: Фя (хгх2) = g (xxx2) g~l = (gX!g-l)(gx2g-1) - cpg (хх) yg (x2). Итак, cpg^AutG. Автоморфизм cpg называется внутренним автомор- автоморфизмом группы G, порожденным элементом g. Внутренние автоморфизмы образуют важный класс автоморфизмов группы. Однако лишь в редких случаях каждый автоморфизм груп- группы является внутренним. В заключение докажем важную теорему, которая объясняет, по- почему симметрическую группу Sn следует считать одним из основных объектов в теории конечных групп. Теорема 7.1 (теорема К эли). Любая конечная группа порядка п изоморфна некоторой подгруппе симметрической группы Sn . ^ Пусть G — группа порядка п. Занумеруем произвольным об- образом все ее п элементов: G = {ab a2, ..., ап }. Можно считать, что Sn — группа всех подстановок множества G. Каждую такую подста- подстановку будем записывать в виде таблицы (см. § 3.6) ах а2 ... ап aix ai% ... air Пусть а — произвольный элемент группы G, т. е. а совпадает с од- одним из элементов at , / — 1, 2, ..., п. Поставим в соответствие эле- элементу а подстановку ( ах а2 ... ап \ \аах аа2 ... аап ) Так как среди ааъ аа2, ..., аап не может быть повторений (почему?) и каждое произведение aai есть элемент группы G, то сра — дейст- действительно подстановка множества G. Обратной к ней будет подста- подстановка фа-i. В самом деле, фа-* фа (пс ) = фа-1 (фа (Щ )) = фа~Чаа/ ) = аГ1(Щ ) = Щ , т. е. фа-1фа есть тождественная подстановка. Аналогично фафа-1== = eG. Пусть Ъ — еще один элемент G. Проверим, что ц)а Ф& = Фа&- фа Фь (Щ ) = Фа (Фб (щ )) = Фа (Ьщ ) = a (bat ) = (ab) at - фд6(а« ). Пользуясь критерием подгруппы, заключаем, что подмножество Фа,, Фа2, -.., фаЛ есть подгруппа группы Sn . Обозначим ее через Я. 101
Отображение q>:G-+H, такое, что ф(а/) = фл/» является иско- искомым изоморфизмом. Действительно, сюръектность ф очевидна, и ес- если аь фп} , то и ф(а/ )фц)(а1)у так как ф^ и <рв. по-разному дей- действуют на каждый элемент группы G. Следовательно, ф биективно. Наконец, для любых а, Ь 6 G ф (об) = Фаб = фа Фб - Ф (а) ф F). 4 Упражнения 1. Докажите, что при изоморфизме ф : G -> G' единица группы G переходит в единицу группы G'. 2. Докажите, что если ср : G -> G' — изоморфизм групп и а? G, то ф (а~х) = = ф(а)-1. 3. Докажите, что группа симметрии правильного треугольника изоморфна сим- симметрической группе S3- 4. Докажите, что множество всех внутренних автоморфизмов группы G есть подгруппа Aut G. 5. Докажите, что группа G абелева тогда и только тогда, когда всякий ее внутренний автоморфизм совпадает с тождественным. 6. Пусть G — конечная группа, на которой действует автоморфизм ф, удовлет- удовлетворяющий следующим двум условиям: 1) ф2 = eG ; 2) ф (а) ф а, если а ф е. Дока- Докажите, что G — абелева группа нечетного порядка. 7. Докажите, что с точностью до изоморфизма существует лишь конечное чис- число групп данного порядка п. 8. Опишите с точностью до изоморфизма все группы порядков 2 и 3. 7.2. Циклические группы Пусть G— произвольная группа, a^G. Возможно, найдется на- натуральное л, такое, что ап = е. Наименьшее натуральное п, удовлетворяющее приведенному условию, называется порядком элемента а и обозначается через \а\. Если же при любом л*> 0 ап Ф е, то говорят, что а — элемент бесконечного порядка, и в этом случае пишут | а \ = оо. Предложение 7.1. Если ап ¦¦- е,топ делится на порядок элемен- элемента а. ^ Пусть \a\=k. По теореме 1.1 число п можно представить в виде n = kq + r, где 0<г<&. Тогда ап = akq+r = (pk у аг _ eq flr -^ ar Так как ап = е, то и аг = е. Но k есть наименьшее натуральное число с условием ak=e. В то же время /*<&. Следовательно, г = 0, т. е. п = kq. <4 Не существует простого правила, позволяющего по известным порядкам элементов а и Ь в группе G найти порядок их произведе- произведения ab. Так, например, всякий элемент симметрической группы Sn есть произведение нескольких транспозиций, каждая из которых имеет порядок 2; в то же время без труда находятся ее элементы порядков 1, 2, ..., п. Если элементы а и Ъ перестановочны, то (ab)n =¦= а4 Ьп , и ситуа- ситуация упрощается (см. упражнения 1 — 4). 102
Пусть а — произвольный элемент группы G. Подмножество Н группы G, состоящее из всевозможных степеней элемента а: Н = {ak\keZ} является подгруппой группы G, которую называют циклической под- подгруппой группы G, порожденной элементом а. Действительно, т. е. для подмножества Н си G выполняется критерий подгруппы. Предложение 7.2. Циклическая подгруппа Н, порожденная элементом а порядка п, является конечной группой порядка п, причем H = {cfi, а1, а\ ..., а"-1}. ^ По теореме 1.1 всякое целое k можно представить в виде k = nq -+- г, где г = 0, 1, 2, ..., п]—^1. Поэтому ak = ал«+г4= (ал^ агГ= аг\ Проверим теперь, что среди элементов а0, а1, а2, ..., ап~] нет пов- повторений. Допустим, что аг* = аг*, 0 ^ rL < r2 < л. Тогда аГ2-Г1 = ^, где 0<V2 — ri<in. Но это противоречит тому, что я — порядок элемента а. «4 Предложение 7.3. Если а — элемент бесконечного порядка, то порожденная им циклическая подгруппа Н бесконечна и каждый элемент Н записывается в виде ak 3 k^Z, единственным образом. ^ Допустим, что ?1<&2 иа^ = аЧ Тогда ak*~kl = ey т. е. а — элемент конечного порядка. ^ Определение 7.3. Группа называется циклической, если она совпадает с одной из своих циклических подгрупп. Пример 7.1. Аддитивная группа Z целых чисел является бесконечной цикли- циклической группой, порожденной элементом 1. Пример 7.2. Мультипликативная группа С (п) корней п-й степени из единицы есть конечная циклическая группа порядка /г, порожденная первообразным корнем /г-й степени из единицы (см. §6.3). Теорема 7.2. Любая подгруппа циклической группы цикличес- циклическая. ^ Пусть G — циклическая группа, порожденная элементом а, Н — ее произвольная подгруппа, отличная от единичной (единичная подгруппа, очевидно, циклическая). И пусть k — наименьшее нату- натуральное число, для которого ak ?H. Покажем, что Н есть цикли- циклическая подгруппа, порожденная элементом ak . Пусть ат — произвольный элемент Н. По теореме 1.1 всякое це- целое т можно представить в виде m^kq + r, 0 <г<&. 103
Тогда am=--(ak)qar или ar = (ак)-ч ат. Так как at и ат — элемен- элементы подгруппы Я, то и аг ?Н. Отсюда следует, согласно выбору k и г, что г = О, т. е. ат = (аЛ )^ . Но это означает, что Н совпадает с циклической подгруппой, порожденной ак . ^ Теорема 7-3- Всякая бесконечная циклическая группа изоморфна аддитивной группе целых чисел Z. Всякая конечная циклическая группа порядка п изоморфна группе С(п) корней п-й степени из единицы. > Пусть G — бесконечная циклическая группа, порожденная эле- элементом а. Тогда всякий элемент G единственным образом записыва- записывается в виде ak , k?Z. Пусть cp:G->Z — отображение, которое эле- элементу ak ставит в соответствие целое число k, т. е. ф(а*) = &. Яс- Ясно, что ф — биекция. Кроме того, отображение ф сохраняет группо- групповую операцию: Ф (ak*ak*) = ф (а**+*«) = kx + k2 = ф (aki) + ф (ай«)- Пусть теперь G — конечная циклическая группа порядка я, по- порожденная элементом а: G = {cfl, а1, а2, ..., ап~1}. Мы знаем, что если е — какой-нибудь первообразный корень я-й степени из 1, то C(/i)={e°, е\ е2, ..., е*-1} (см § 6.3). Определим отображение y:G->C(n) естественным обра- образом: ф(а*) = е* , * = 0, 1, 2, ..., /г —1. Биективность ф очевидна. Проверим, что ф (akiak*) = ф (aki) ф (аЛ«) для любых 0 ^ kly k2 < п. Пусть kx + k2 = я? + г, 0 ^ г < я. Тог- Тогда Ф (ak*ak*) = ф (а^»+^г) = ф (а^+0 = ф ((а" )<* аг) =- = (е" )^ ег — + fe+fe ^fe fe) Упражнения 1. Докажите, что, если а и b перестановочны, \а\ = п1у \ Ь\ = п2 и п — наи- наименьшее общее кратное п\ и я2, то (аЬ)п = е. Приведите пример, когда п не яв- является порядком элемента ab. 2. Докажите, что, если а и Ь перестановочны, а их порядки п\ и я2 взаимно просты, то порядок произведения аЪ равен пхп2 = НОК (яъ п2). 3. Пусть элементы а и b группы G перестановочны, \а \ = ti\, \ b \ = п2. Дока- Докажите, что существует элемент c?G, порядок которого равен НОК (ль п<ь). 4. Докажите, что, если а — элемент порядка п и b = ak, то \ b\ = n/d, где d — наибольший общий делитель кип. 5. Докажите, что существуют лишь два автоморфизма бесконечной цикличес- циклической группы G, т. е. | Aut G \ = 2. 6. Пусть G — циклическая группа порядка п. Докажите, что преобразование Ф : G -> G, определенное равенством ф (а) = ak для каждого a?G, является авто- автоморфизмом группы G тогда и только тогда, когда k взаимно просто с п. Покажи- Покажите, что других автоморфизмов группа G не имеет. 104
7.3. Смежные классы по подгруппе Пусть G — произвольная группа. С каждой подгруппой Я груп- группы G связано некоторое специальное разбиение множества G. Это разбиение будет играть в дальнейшем важную роль. Определение 7.4. Левым смежным классом группы G по под- подгруппе Я называется подмножество аН cz G, состоящее из всевоз- всевозможных произведений вида ah, где а — фиксированный элемент группы G, А— любой элемент подгруппы Я. Таким образом, аН = Аналогично определяется правый смежный класс На: Отметим, что подгруппа Я сама является левым смежным клас- классом по Я: Я = еН. Читатель легко проверит, что никакой другой левый смежный класс G по Я подгруппой группы G не является. Теорема 7А- Любые два левых смежных класса группы G по подгруппе Я либо не пересекаются, либо совпадают. Группа G яв- является объединением левых смежных классов по подгруппе Я. ^ Пусть смежные классы аН и ЬН имеют общий элемент с. По- Покажем, что аН => ЬН. Заметим сначала, что если А ? Я, то hH = Я. Действительно, очевидно включение hH а Я. Пусть h' — произвольный элемент Я. Тогда так как ft-1 А' 6 Я. Следовательно, hH = H. Так как с?аН и с ? ЬН, то с = ahlf и с = bh2, где АХА2 ? Я. Но тогда ah± = bh2 и а = b(h2hrl) = 6А, где А = А2АГ! ?Я. В результа- результате Всякий элемент a?G содержится в смежном классе аНу так как Я содержит единицу группы G. Это доказывает последнее утверж- утверждение теоремы. ^ Замечание. Пусть b ?аН. Тогда Ь является общим элементом смежных классов аН и ЬН', и поэтому, согласно теореме 7.4, аН = ЬН. Таким образом, левый смежный класс однозначно определяется любым своим элементом, который мы будем называть представителем этого класса. Отметим также, что теорема 7.4 останется верной, если в ее формулировке левые смежные классы заменить правыми. Теорема 7.4 позволяет получить в качестве простого следствия одну из основных теорем теории конечных групп. Теорема 7.5 (теорема Лагранжа). Порядок любой подгруп- подгруппы конечной группы делит порядок этой группы. 105
^ Пусть G — конечная группа порядка п, Н — ее подгруппа по- порядка k. Если H = {hl9 А2, ..., hk], то аН = {aftb ай2, •••> аЛл }• Ес- Если допустить, например, что ahx = аНъ то мы получили бы равен- равенство hx = /i2, что неверно. Поэтому всякий смежный класс аН со- содержит ровно k элементов, и если обозначить через s число различ- различных левых смежных классов G по Я, то в силу теоремы 7.4 долж- должно иметь место равенство n — ks. «4 Следствие 7.1. Порядок любого элемента конечной группы делит порядок группы. ^ Достаточно заметить, что порядок всякого элемента группы совпадает с порядком порожденной им циклической подгруппы. <4 Следствие 7.2. Всякая группа простого порядка цикличес- циклическая. ^ Пусть группа G имеет своим порядком простое число р. Из теоремы Лагранжа следует, что если Я —подгруппа G, то ее поря- порядок равен либо 1, либо р. В первом случае Я = {#}, во втором H = G. Пусть теперь а — любой неединичный элемент G и Я — порож- порожденная им циклическая подгруппа. Так как Нф{е}у то Н = G, т. е. G — циклическая группа. М Пусть G — произвольная группа, и пусть количество различных левых смежных классов G по ее подгруппе Я конечно и равно s. Тогда Я называется подгруппой конечного индекса в группе G, а число s — индексом Я в G. Как мыТувидим в дальнейшем, смежные классы группы по под- подгруппе существенно используются и для изучения бесконечных групп. Приведем несколько примеров разбиения группы на смежные классы. Пример 7.3. Пусть G— мультипликативная группа С* поля комплексных чисел С, Я— ее подгруппа, состоящая из всех комплексных чисел, модуль которых ра- вен~единице. Геометрически G можно представлять как комплексную плоскость с выколотым началом координат, а Я — как единичную окружность этой плоскости с центром в начале координат. Опишем левые смежные классы G по Я, которые в силу коммутативности группы G совпадают с правыми смежными классами: zH = Hz. Воспользуемся тригонометрической формой записи комплексных чисел. Очевид- Очевидно, Н = {cos ф + i sin ф | ф ^ R}. Пусть z = ro(cos фо + i sin фо) — произвольный элемент G. Тогда zH = {zh | h С Я} = {r0(cos Фо+Ф) + i sin (фо+ф)) I ф € R} = {/*o(cos Ф + i sin q>) | <p ? R}, как фо -f- ф пробегает R, если ф пробегает R. Теперь ясно, что геометрически zH представляет собой окружность радиуса г0 с центром в начале координат. И обратно, всякая такого рода окружность есть некоторый ^смежный класс G по Я. Очевидно, вся комплексная плоскость без на- начала координат есть объединение всевозможных непересекающихся концентриче- концентрических окружностей с общим центром в начале координат (рис. 7.2). Пример 7.4. Пусть теперь G — аддитивная группа поля комплексных чисел, Н — ее подгруппа, состоящая из всех действительных чисел, №
Если представлять G как комплексную плоскость, то Я является ее действительной осью. В силу коммутативности сложения комплексных чисел левый смежный класс z + Я совпадает с правым смежным классом Н -\- z. Пусть z^a + Ы. Тогда z + Я = {(а + Ы) + (г + 0/) | /•? R} = {(а + г) + + Ы | г ? R} = {г + Ы | г € R}, так как (а + г) пробегает R, если г пробегает R. Мы видим, что если z = а -\- Ы, то смежный класс z + Я совпадает с прямой комплексной плоскости, параллельной действительной оси и пересекающей мнимую У О Рис. 7.2 Рис 7.3 ось в точке Ы. При этом всякая прямая такого вида есть некоторый смежный класс G по Я, а вся комплексная плоскость является объединением всевозможных непересекающихся прямых, параллельных действительной оси (рис. 7.3). Пример 7.5. Пусть G=S(X) — симметрическая группа произвольного множест- множества X, состоящая из всех подстановок этого множества. Обозначим через Я под- подмножество G, состоящее из всех подстановок, оставляющих неподвижным некото- некоторый фиксированный элемент х0 ? X. Тогда Я есть подгруппа группы G (см. § 5.3). Опишем произвольный смежный класс аЯ, a?G. Если Ь?аН, то Ь = ah, h?H, и b (х0) = ah (х0) = a (h(x0)) = а (х0), т. е. b действует на элемент х0 точ- точно так же, как и а. Обратно, пусть b ? G и 6 (*0) = а (*о). Тогда а~Ч (х0) = а-1 (Ь(х0)) = = а —1 а(лг0)) = а—га(х0) = х0. Следовательно, а~гЬ = h?H, откуда b = ah Итак, доказано, что т. е. левые смежные классы группы G по подгруппе Я состоят из таких подстано- подстановок множества X, которые одинаково действуют на элемент х0. Так как группа G некоммутативна, то ее правые смежные классы могут не сов- совпадать с левыми. Мы предлагаем читателю описать правые смежные классы G по Я самостоятельно. Упражнения 1. Докажите, что элементы а и b группы G лежат в одном левом смежном классе по подгруппе Я тогда и только тогда, когда a—1b?H. 2. Пусть a, b?G. Будем считать элемент а эквивалентным элементу bt a~b\ если a~~1b?H. Проверьте, что полученное отношение на множестве G есть отн<> шение эквивалентности. Выведите из этого факта теорему 7.4. 3. Докажите, что если Я — подгруппа конечного индекса в группе G, то чис- число различных левых смежных классов G по Я совпадает с числом различных пра- правых смежных классов G по Я. 4. Пусть G — мультипликативная группа С* поля комплексных чисел, Я — ее подгруппа, состоящая из положительных действительных чисел. Опишите смежные классы G по Я и дайте их геометрическую интерпретацию на комплексной плос- плоскости. 10?
5. Докажите, что всякая подгруппа аддитивной группы целых чисел Z имеет в Z конечный индекс. 6. Докажите, что аддитивная группа рациональных чисел Q не имеет собствен- собственных (т. е. отличных от Q) подгрупп конечного индекса. 7.4.* Нормальная подгруппа. Фактор-группа Пусть G — произвольная группа, Я — ее подгруппа. Можно го- говорить о множестве левых смежных классов G/Я, рассматривая каж- каждый такой класс gH как один элемент. Нельзя ли превратить мно- множество GIH в группу, определив на нем подходящим образом алгеб- алгебраическую операцию умножения смежных классов? Можно было бы попытаться определить умножение левых смеж- смежных классов следующим естественным образом: (аН)(ЬН) = (аЬ)Н, A) т. е. произведением смежного класса, содержащего элемент а, на смежный класс, содержащий элемент Ь, объявлять смежный класс, содержащий элемент ab. Однако возникает сомнение, не будет ли это умножение зависеть от выбора представителей а и b данных смежных классов аН и ЬН. В этом случае наша операция не была бы алгебраической, так как произведение (аН) (ЬН) было бы опреде- определено не однозначно. Итак, выясним, какие ограничения надо наложить на Я, чтобы формула A) определяла на множестве GIH алгебраическую опера- операцию умножения. Пусть а' 6 аЯ, V 6 ЬН, так что а'Н = аН, Ь'Н = ЬН. По форму- формуле (Г) (afH) (Ь'Н) - (а'Ь') Я. Должно выполняться равенство (a'b')H=(ab)H ,т. е. а'Ь' и ab должны ле- лежать в одном и том же левом смежном классе по подгруппе Я. Это означает, что а'Ь' = (ab)h, где h 6 Я, или (ab)-\a'br) = h. B) Но а' = ahu b' = Wi2, hl9 /i2 6 Я. Поэтому (ab)~l(a'b') = (b~la-l)(a'b') = ^=b'~xa~xah1bh2 = Ь~хНфНг. Из равенства B) получаем b-%bh2 = h=> b-xhxb - hh^x ? Я. C) Так как мы рассматривали произвольные смежные классы аН и ЬН и их произвольные представители а' и 6', то из C) следует, что подгруппа Я должна обладать следующим свойством: для любого b?G и любого h?H произведение b~lhb^H. Обратно, если это условие выполняется, то (ab)~x(a'b') = ^b-^bh^H и, значит, (a'b')H = (ab) Я. Определение 7.5. Подгруппа Я группы G называется нор- нормальной подгруппой (или нормальным делителем) группы G, если для любого g?G и любого h?H элемент g~lhg?H. В этом слу- случае будем писать H<\G.
Замечание. Это определение можно переформулировать, пользуясь поняти- понятием внутреннего автоморфизма группы (см. § 7.1), а именно: подгруппа Н называ- называется нормальной подгруппой группы G, если всякий внутренний автоморфизм G оставляет Н инвариантной, т. е. переводит Н в себя. По этой причине нормальные делители называют иногда инвариантными подгруппами. Пример 7.6. Проверить, что специальная линейная группа SL (n, R) есть нор- нормальная подгруппа полной линейной группы GL (n, R). Решение. Пусть матрица А? SL (n, R), т. е. | А \ = 1, и пусть В — произ- произвольная невырожденная матрица из GL (n, R): |В-Ч- \А\.\В\ = \А\.\В\~1.\В\=\А\ =1. Это означает, что В~±АВ ? SL (/г, R), т. е. SL (/г, R) <\ GL(n, R). Далеко не всегда всякая подгруппа данной группы G является нормальной, хотя это и верно для любой абелевой группы G: Очевидно, для любой группы G сама эта группа и ее единичная подгруппа являются нормальными делителями G. Значение нормальных подгрупп в теории групп раскрывает следующая Теорема 7?. Пусть G — произвольная группа, Н — ее нормаль- нормальная подгруппа, Gi'Н— множество всех левых смежных классов груп- группы G по Н. Если определить на множестве GIH операцию умноже- умножения по формуле (аН) (ЬН) = (ab) H, то GIH превращается в группу, которая называется фактор-груп- фактор-группой G по Н. При этом смежный класс еН = Н служит единичным элементом, а а~1Н — элементом, обратным к аН. ^ Приведенное выше рассуждение показывает, что умножение смеж- смежных классов по нормальной подгруппе не зависит от выбора пред- представителей перемножаемых классов. Поэтому каждой упорядоченной паре смежных классов аН и ЬН ставится в соответствие вполне определенный смежный класс (ab) Я, т. е. мы имеем дело с алгебраи- алгебраической операцией на множестве GIH. Из ассоциативности умножения в группе G сразу вытекает ассо- ассоциативность умножения смежных классов. Действительно, [(аН) (ЬН)] (сН) = [(ab) Н] (сН) = [(ab) c]H = [a (be)} H - (Н)(Ь)Н (Н)ЬН)(Н) Проверим, что роль единицы при умножении смежных классов играет класс Н = еН: (аН) (еН) = (ае) Н = аНу (еН) (аН) = (еа) Н - аН. Наконец, (аН) (агЩ - (аа-') Н = еН, (а~1Н) (аН) = (а-1а) Н = еНу т. е. класс а~1Н является обратным классу аН. <4 Фактор-группы играют исключительно важную роль в теории групп. Многие интересные примеры групп получаются факторизаци- факторизацией уже известных групп по подходящим нормальным подгруппам. 109
Очень часто важную информацию о группе можно получить, изучая ее нормальную подгруппу и соответствующую фактор-группу. Сле- Следующая теорема и ее доказательство хорошо иллюстрируют этот подход. Теорема 7J. Если G — конечная абелёва группа, порядок кото- которой делится на простое число р, то в G существует элемент по- рядка р. ^ Приступая к доказательству, отметим, что элемент g имеет порядок р тогда и только тогда, когда gp == е и g=^e. Воспользуемся индукцией по порядку группы G. Если | G | = 2, то G = {е, а}, а Ф е и а2 = е. Поэтому | а \ = 2. Пусть теперь | G \ =п, и будем предполагать, что теорема верна для всех абелевых групп, порядок которых меньше п. Пусть а — произвольный элемент G, афе, и Я— циклическая подгруппа, порожденная а, причем \а\ = \Н\ = кф\. Возможны два случая: k либо делится на р, либо не делится на р. ]. Пусть k делится на р, k = pq: е = ak = aP* = (а? у . Так как q < k и k — порядок а, то а? Ф е. Поэтому aq — искомый элемент G порядка р. _ 2. Пусть теперь k не делится на р. Так как G — абелева группа, то Н <\ G, и можно говорить о фактор-группе GIH = G'. Если | Gf | = п\ то n = knr. По условию п делится на р, k не делится на р и р простое. Поэтому пг должно делиться на р. Ясно, что пг < д и, как легко видеть, фактор-группа абелевой группы есть абелева группа. Следовательно, к группе G' можно применить предположение индукции. Существует элемент b' ?G', по- порядок которого равен р. Так как G/ состоит из левых смежных классов G по Я, то Ъг ~ ЬН, где b — некоторый элемент G. На- Напомним, что единица ег фактор-группы Gf совпадает с Я: фУ = в' *=> (ЬНУ - Я « № е Я. Учитывая, что | Я | = ?, имеем = е или F* )р - е. Проверим, что bk Ф е, откуда и будет следовать, что bk — искомый элемент группы G порядка р. Если бы bk = e, то (Ь'У = (bH)k = bkH = eH = e'. Но bf — элемент G' порядка р. Поэтому k должно делиться на р, что неверно. <4 Пример 7.7. Пусть G =С* — мультипликативная группа комплексной плоскос- плоскости, Я = {с? С* 11 с | = 1). Так как G— абелева группа, а Я — ее подгруппа, то Н <\G. Требуется описать фактор-группу G/H. Описание смежных классов G по Н было дано в примере 7.1. Каждый такой класс является окружностью на комплексной плоскости с центром в начале коор- координат, и наоборот. Из рис. 7.2 видно, что в каждом классе G по Н существует ровно одно поло- положительное вещественное число, так что в качестве системы представителей (по од- 110
ному из каждого класса) можно выбрать мультипликативную группу R^_ положи- положительных вещественных чисел. Итак, причем (ггН) (г2Н) = (ггг-2) Н, где r!j_ принадлежат не только rL и г2, но и их п роизведению ггг2. Все сказанное приводит к мысли, что группы G/H и R , изоморфны. Нужный изоморфизм ф :R , -+G/H строится просто: Биективность этого отображения уже отмечалась. Кроме того, ф сохраняет умно- умножение: ф (ггг2) = (пг2) Н = (ггН) (г2Н) = ф (п) Ф (г2). Упражнения 1. Докажите, что подгруппа Н группы G является нормальным делителем G тогда и только тогда, когда для любого элемента g^G левый смежный класс gH совпадает с правым смежным классом Hg. 2. Найдите нормальные подгруппы симметрической группы 5з. 3. Пусть G — группа всех движений плоскости, И— ее подгруппа параллель- параллельных переносов. Докажите, что Н есть нормальный делитель G. 4. Приведите пример группы G и ее подгрупп #i и Н2, таких, что Hi <j Я2, Я2 <3 Gy но Hi не является нормальным делителем G. 5. Докажите, что фактор-группа циклическбй группы — циклическая группа. Опишите фактор-группу группы 3 Z по подгруппе 15 Z. 6. Опишите фактор-группу C*/R , . 7. Проверьте, что подгруппа Я всех четных подстановок симметрической груп- группы St] есть нормальный делитель Sn, и опишите фактор-группу $п]Н. 7.5.* Гомоморфизмы групп Понятие гомоморфизма является естественным обобщением уже рассмотренного нами понятия изоморфизма групп. Определение 7.6. Пусть G и G' — группы. Отображение (p:G-*Gf называется гомоморфизмом G в G', если для любых gXt <P(gi ?2) = Заметим, что ср может быть ни инъективным, ни сюръективным отображением. Гомоморфизм ср есть изоморфизм, если ф — биекция. Пример 7.8. Отображение произвольной группы G в произвольную группу G', которое каждый элемент G переводит в единицу группы G7, является, очевидно, гомоморфизмом G в G'. Пример 7.9. Если каждому комплексному числу 2^0 поставить в соответст- соответствие его п-ю степень zn, то получится отображение ф :С*->С*, которое является гомоморфизмом С* в себя. Действительно, Ф (ziza) = (zizz)n = ^4 = Ф Bi) Ф (г2). Так как из любого комплексного числа, отличного от нуля, можно извлечь ровно п ьорней п-и степени, то ф сюръективно, но не инъективно. Пример 7.10. Отображение ф : GL (/г, R) -> R*, которое ставит в соответствие каждой невырожденной матрице Л ее определитель | Л \, является гомоморфизмом 111
L (л, R) в R*. Этот факт является прямым следствием теоремы об умножении пределителей: Ф (АВ) = | АВ | = | А | . | В | = Ф (А) ф (Б). Легко видеть, что ф всегда сюръективно, но не инъективно при п > 1. Предложение 7.4. Если ф : G -> G' — гомоморфизм и е — ?<Эа- яш{а группы G, то у(е) — единица группы G'. ^ Так как е = ??, то ф (#) = ф (?#) = ф (е) ф (#). Умножая левую и правую части равенства ф (е) = ф (е) ф (^) на ф (е)-\ получаем Ф (е) = е', где г' — единица G'. 4 Предложение 7.5. Если ф : G -> Gr — гомоморфизм и g ? G, то ^ Из равенства е = gg~l следует равенство ф(е) = ф (^)ф (g~l). Но ф (ё) = е', так что Предложение 7.6. Если q>:G->G' — гомоморфизм, то есть подгруппа группы G'. У Воспользуемся критерием подгруппы. Пусть g[, g2 6ф (G). Су- Существуют gu g2i 6 G, такие, что g[ = ф (gx), gz = Ф Ы, причем gig2 = ф (fifi) ф Ы - Ф (ЯхЫ 6 Ф(О), так как g!ga ? G. Далее проверим, что (gi) 6 ф (G). Действительно, так как g-f1 6 G. ^ Понятие гомоморфизма оказывается тесно связанным с понятиями нормальной подгруппы и фактор-группы. Определение 7.7. Пусть ф : G ->Gr— гомоморфизм групп. Мно- Множество где ef — единица группы G', называется ядром гомоморфизма ф и обозначается символом Кегф. Теорема 7.8. Ядро гомоморфизма q>:G-*G' является нормаль- нормальным делителем группы G. ^ Проверим сначала, что Кегф есть подгруппа группы G. Так как ср(е) = е\ то Кегф^=0. Пусть а, 6?Кегф. Тогда Ф (qb) — ф (а) ф F) = е'е' = е'=>аЬ? Кег ф, ф (а-1) = ф (д)-1 = (g')-i = ^ => а-1 6 Кег <р. Итак, Кегф<0. Пусть теперь а^Кегф, g^G. Тогда y(g—lag)= = ф(Г1)фИф(г) = ф(^/ф(«г) = ^ т- е. ^одеКегф и, сле- следовательно, Кегф<0. <4 Теорема 7.9. Всякий нормальный делитель группы G есть ядро подходящего гомоморфизма ср :G->G'. 112
^ Пусть Н <]G. Рассмотрим фактор-группу GIH = G'. Ставя в соответствие каждому элементу g группы G тот смежный класс gH, в котором этот элемент лежит, получим отображение (p:G->G', которое будет гомоморфизмом потому, что для любых gly g^^G Ф (gift) = (&&) Я - (ЯхЯ) (?2Я) - ф (&) Ф (ft). Так как единицей в группе Gf служит смежный класс еН = Я, то ясно, что ядро этого гомоморфизма совпадает с Я. ^ Таким образом, нормальные делители группы и только они яв- являются ядрами ее гомоморфизмов. Построенный при доказательстве теоремы 7.9 гомоморфизм назы- называется естественным гомоморфизмом группы G на фактор-группу G/H. Мы уже знаем (предложение 7.6), что образ группы при любом гомоморфизме есть группа. Оказывается, что эта группа определя- определяется ядром гомоморфизма с точностью до изоморфизма. Теорема 7.10 (теорема о гомоморфизмах групп). Если Ф : G -> G' — гомоморфизм групп, то Ф (G) ~ G/Ker ф, т. е. группа ф (G) изоморфна фактор-группе группы G по нормаль- нормальному делителю Кегф. > Пусть g' 6 Ф (G). Что можно сказать о полном прообразе Ф^) этого элемента? По условию найдется элемент g ? G, такой, что ф (g) — gf. Если ЛбКегф, то Ф (gh) = Ф (g) Ф (Л) = g'e' = Я', т. е. Ф^) вместе с элементом g содержит каждый элемент смеж- смежного класса g Кег ф. Пусть теперь а — произвольный элемент ф-1 (g"'). Тогда ф (g—la) — = Ф (g~l) Ф (а) = Ф (Я)" Ф H=(g/)g/ = в/» так 4TOg-]a = А 6 Кег ф, откуда а = gA. Следовательно, a ?g Кег ф. Итак, мы убедились, что для всякого элемента g' ? ф (G) его полный прообраз Ф^') совпадает со смежным классом g Кег ф, где Ф (g) ^ g' • Это означает, что между множеством ф (G) и множеством всех смежных классов G по нормальному делителю Кег ср существу- существует взаимно однозначное соответствие: разным элементам ф (G) соот- соответствуют разные прообразы, т. е. разные смежные классы, и каж- каждый смежный класс g Кег ф соответствует некоторому элементу )() )€p() Рассмотрим отображение \|?: G/Ker ф -> ф (G), при котором Кф) = ф(я). Мы уже видели, что оно биективно. Проверим, что \|? сохраняет умножение смежных классов * [(& Кег ф) (ga Кег ф)] - i|> [(gxg2) Кег ф] = <р (g±g2) = = Ф Ы Ф fe2) = * (8г Кег ф) ij) (g-2 Кег ф). Это означает, что г|? — искомый изоморфизм. ^ Теорема о гомоморфизмах дает общий метод исследования струк- структуры фактор-группы G по нормальному делителю Я. Достаточно по- 113
Пример 7.11. Пусть С* — мультипликативная группа поля комплексных чисел, С (п) — ее подгруппа корней п-и степени из 1. Требуется описать фактор-группу С*/С(п). Рассмотрим отображение ф : С* -> С*, такое, что ф (z) = zn для каждого г? С*. Мы уже видели, что ф есть гомоморфизм, причем ф (С*) = С*. Очевидно, Кегф = ~С(п). Поэтому С*/С(п) ~ С*, что на первый взгляд кажется удивительным. Пример 7.12. Опишем фактор-группу GL (n, R)/SL(n, R). Тот факт, что SL (л, R) < GL (л, R), уже отмечался в § 7.4. Отображение q> : GL (n, R) -> R*, где ср (А) =\Л\ для любой матрицы A^GL(n, R), является гомоморфизмом, причем ф (GL (л, R)) = R*. Группа Кегф совпадает с SL (л, R). Поэтому GL (n,R)/SL (л, R) ~ R* Теорема 7ЛЬ Гомоморфизм (p:G->G' инъективен тогда и только тогда, когда Кегф = {в}— единичная подгруппа. ^ Пусть ф инъективен. Так как у(е) = е', то из инъективности Ф следует, что y~l(e') = ef т. е. Кегф={в}. Обратно, пусть Кегф = {е}. При доказательстве теоремы о гомо- гомоморфизмах было показано, что для любого g' ? ф (G) его полный про- прообраз ф-1^) совпадает со смежным классом #Кегф, где 9(g) = g/. Но Кег ф = {е} и, значит, g Ker ф = {g}, т. е. всякий элемент g' 6 ф (G) имеет единственный прообраз. Это означает, что ф инъективен. ^ Упражнения 1. Докажите, что если ф \G->Gr — гомоморфизм групп и Я< G, то ф (Н) < < G'; если Н <\ G, то и ф (Н) <] ф (G) (но ф (Я) может не быть нормальной под- подгруппой G'\). 2. Докажите, что если ф : G -> Gf — гомоморфизм групп и Hr <G\ то ф-1(Я') < G; если Н' <] Gr, то и у-ЦН') <] G. 3. Пусть G — циклическая группа порядка /г, G'—произвольная конечная группа. Докажите, что число различных гомоморфизмов G в G' совпадает с чис- числом тех элементов группы G'', порядки которых делят п. 7.6.* Прямое произведение групп Конструкция прямого произведения позволяет строить новые группы с помощью уже известных. Пусть d, G2, ..., Gn — произвольные группы. Обозначим через G множество всех упорядоченных строк длины п вида где gi€Gb 6*2 €G2, ..., gn(zGn - Любые две такие строчки можно пе» ремножать по правилу (?ъ ?2> •••> ^«)(gl, fe ..., gn) = (g\gl> g2g2, -.., Sf/zg'/z)» которое сводится к умножению элементов в каждой из групп Gi в отдельности. С этой алгебраической операцией G становится группой. Действительно, ассоциативность умножения строк непосредственно следует из ассоциативности умножения в каждой группе Gi . Роль 114 добрать гомоморфизм ф группы G, удовлетворяющий следующим двум условиям: 1) Кегф = #; 2) w(G) есть уже изученная ранее группа. Тогда
единицы играет строка (ei , ?2» •••, еп), где ei —единица группы Gi . Наконец, для строки (g\ , g2 , ..., grt ) обратным элементом яв- является строка , — 1 — 1 ГГ") Построенная группа G называется прямым произведением групп Gi , G2, ..., G,! и обозначается так: G== G{ x G2 x ... х Gn . Если Gi , ..., Grt —конечные группы, то очевидно, что и G есть ко- конечная группа, порядок которой равен произведению порядков пря- прямых сомножителей Gi , G2, ..., Gn : При аддитивной записи групповой операции в G± , ..., Grt говорят о прямой сумме групп G{ , ..., Gn и пишут G\ © ... © Gn . Предложение 7.7. Если G\ & Н\ ,..., Gn ^ Нп, то и G\ х ... х Gn ^ Нх х ... х #„ . >> Пусть ф1 : G\ -> Hi , ..., <рп: Gn-+ Нп — изоморфизмы групп. Тогда изоморфизм ф: Gi х ... xGn—>Hi х ... X Нп можно опреде- определить следующим образом: Ф ((Si у .... Вп )) = (Ф1 (gi), -., Фп fen )). < Пусть G — произвольная группа, содержащая нормальные под- подгруппы Hi , #2 , ..., Нп . Если каждый элемент g?G единственным образом записывается в виде g=h{h2 ... Ал , где Ы ?Hi , *'= 1, 2, ..., п, то говорят, что группа G есть прямое произведение своих нормальных подгрупп Hi , Я2 ,..., #л . Оправданием этой терминологии служит следующая Теорема 7.12. Если G есть прямое произведение своих нормаль- нормальных подгрупп Hi , #2, ..., Нп , то G изоморфна прямому произве- произведению Нх х Я2х ... X Нп. >> Заметим, что для любых двух нормальных делителей Ht , ffj , i ф /, Hi П Hf = {e}. В противном случае элемент g 6 Hi f| ^/ • g=^ey можно было бы записать двумя способами в виде g = е • • • eht е • • • е, g = е • • • ehj e • • • е, где А/ = А/ = ?. Пусть теперь h? ? #* , А/ ? Я/ , *' Ф \. Покажем, что hi hj = = hj hi , т. е. элементы, взятые из различных нормальных делите- делителей, перестановочны друг с другом. Последнее равенство равносиль- равносильно равенству hflhylhi hj = e. Заметим, что AfV A, hi = (hTxhJ% ) hj g Hj , 115
так как Яу- есть нормальный делитель G, и поэтому ht l hj lhi?Hj* С другой стороны, h-'hy'ht hj = кг%т% hj )ен1у так как нормальным делителем является и Я, , откуда hjxhi hj ? Я,' • В итоге Kfxh~xhi А/ 6 Ht ft Hf = {e}, т. е. hTlhJxhi hj = e. Определим теперь отображение <p: G->-#i x Я2 х • • • X Ял , по- полагая для каждого g = h{ h2 • • - hn <р (g) = (Ai,A2 » • ••> А„ ). Биективность ф очевидна. Если g' = AJAo • • • Л«, то Ф fe^) = Ф [(Ai А2 • •; Ал ) (Ai/is; • • Ал)] = - Ф [(Ai Ai) (А2 Аа) • • • (hnh'n)]-= (h{ h[, h2ti2y ..., А„ А^) = = (Ai, A2 , ..., An)(Ai, A2, ..., А„) = <p(g)<p(g/), т. е. ф — искомый изоморфизм. ^ Теорема 7.12 вместе с предложением 7.7 показывает, что если группа G есть прямое произведение своих нормальных подгрупп Н\ , Я2 , ..., Ял , то изучение G полностью сводится к изучению ее подгрупп Н\ у Я2 , ..., Нп . Точнее, если группа Gf является прямым произведением своих нормальных делителей Н[, Я2, ..., Нп, причем Я! &Hlt Н'2**Н2, ..., Н'п?*НП9 то G' ^ G. Рассмотрим более внимательно случай, когда группа G есть пря- прямое произведение двух своих но рмальных делителей Н\ и Я2 . По условию всякий элемент g?G можно записать как произведение Я^АД, АхбЯ,, А26Я2, A) причем единственным образом. Мы уже отмечали при доказательст- доказательстве теоремы 7.12, что Нх(]Н2 = {е). B) Оказывается, единственность разложения A) вытекает из условия B). Действительно, пусть g = h[h2f h[^Hu h'2?H2. Из равенства AiA2= = AjA2 получаем (A;)-jAi ^h2hVl. C) Левая часть равенства C) принадлежит Яь а правая — Я2. Следо- Следовательно, (h[)-% = е, h2h2x = еу откуда Ai = Ai , А2 = Аа Тот факт, что для всякого элемента g6G имеет место разложе- разложение A) (без предположения единственности), условимся коротко за- записывать так: G = ИХН2. Нами доказана следующая Теорема 7.13- Пусть G — группа, Нг и Я2 — ее нормальные подгруппы. Для того чтобы G была прямым произведением Нх и Я2, необходимо и достаточно, чтобы G = ЯХЯ2 а Нг П Я2 = {^}. 116
Пример 7.13. Пусть G = С*, Н1 == {с ? С* 11 с | = 1}, Я2 =-- R*j_. Так как С*— абелева группа, то Hlf H2<]G. Из тригонометрического представления произволь- произвольного комплексного числа z — r(cos Ф + / sin ф) вытекает, что G — Н\Н^ Наконец, очевидно, что #if|#2 — {1}, так что G есть прямое произведение Н± и Н%. Пример 7.14. Пусть G = R*, #i = {1, —1), Н2 = R+. Так как R* — абелева группа, то #ь #2 <] G. Из равенства г = (+ 1) | г | для любого г ? R следует, что G = #i#2. Очевидно, #1П#2= Н) и, значит, G есть прямое произведение Нх и Я2. Предложение 7*8- Если группа G есть прямое произведение своих нормальных подгрупп Нх и G'', а группа G', в свою очередь, есть прямое произведение своих нормальных подгрупп Н2 и Н3, то Н2, H3<]G и G является прямым произведением Нъ Н2 и Н3. р> Покажем, что H2<-]G. По условию H2<]G'9 так что для лю- любого g' 6G' и любого h2?H2 (g')~lh2g' ?H2. Пусть теперь g — про- произвольный элемент G. Так как G есть прямое произведение Ях и G\ то g^hxg\ /ii6#i> gr?Gr. Рассмотрим элемент g~lh2g и восполь- воспользуемся тем, что элементы Нх и Gr перестановочны. Получим g~[h2g = - №)-Чн№) = te')-1(ftr1A,Ai)g' = (g')~%g'efl2. Это означает, что H2<]G. Аналогично H3<\G. По условию любой элемент g 6 G можно записать в виде g = ^g', hx?Hly gr ?G', а элемент §•'—в виде g'= hji3, hH h3?H3. В итоге A/ 6 Я/ . Покажем, что такое разложение элемента g определено однозначно. Если g = A1A2A3, hi^Ht , то из условия предложения и равенства Ai (А2А3) = h[ (А2А3), где Ах, А| 6 Ях, А2А3, ^2 Аз 6 G', заключаем, что Ах = = Ai и А2А3 = А2А3. А так как G' есть прямое произведение Ях и Я2, то из последнего равенства получаем А2 == Аг, А3 = Аз. <4 Предложение 7.8 без трудна распространяется на случай, когда группа G является прямым произведением п нормальных делителей, каждый из которых, в свою очередь, есть прямое произведение нес- нескольких своих нормальных подгрупп. Упражнения 1. Докажите, что G\ X G2 = G% X G±. 2. Докажите, что группа G\ X G2 X ... X Gn есть прямое произведение неко- некоторых своих нормальных подгрупп Н±, ..., Нп, изоморфных соответственно Gi, ..., Gn. 3. Пусть G есть прямое произведение своих нормальных делителей Нг и Я2. Докажите, что фактор-группа G/#x изоморфна Я2. 4. Докажите, что бесконечная циклическая группа неразложима в прямое про- произведение двух нетривиальных подгрупп. 7.7* Конечные абелевы группы Конечные абелевы группы образуют сравнительно узкий, но важ- важный класс групп. В данном параграфе выясним структуру любой та- такой группы. Рассуждения, которые при этом понадобятся, хорошо 117
иллюстрируют уже рассмотренные в данной главе понятия и методы. По чисто техническим причинам нам будет удобно пользоваться аддитивной формой записи. Так, например, равенства gs+t = gsgt , gst = (gt )s $ где s, 16 Z, в аддитивной форме будут записываться следующим образом: а равенство которое верно для любой абеленой группы, в аддитивной записи принимает вид Если абелева группа А есть прямая сумма своих подгрупп А\ , А2, ..., Ak , то, учитывая, что группы А и Ах © А2 © ... © Ak изоморфны, условимся коротко записывать это обстоятельство так: А = А\ © А2 © ... ©4. Определение 7.8. Конечная абелева группа АФ{0} назы- называется примарной, соответствующей простому числу р, или прос- просто р-группой, если ее порядок есть степень р. Предложение 7.9. Для того чтобы конечная абелева группа А Ф {0} была р-группой, необходимо и достаточно, чтобы порядок любого ее элемента был степенью числа р. ^ Пусть А есть р-группа. По следствию из теоремы Лагранжа порядок любого ее элемента делит порядок А и, значит, есть сте- степень р. Обратно, пусть порядок каждого а ?А является степенью р. Ес- Если бы А не была р-группой, то ее порядок делился бы на некото- некоторое простое рх Ф р. Но тогда (теорема 7.7) группа А содержала бы элемент порядка рь что неверно. ^ Пусть А — конечная абелева группа, \А\ = pt'pl2 • • • plk — кано- каноническое разложение на простые множители. Пусть далее At ={aeA\tf а = 0}, /=1, 2, ,..., k. Легко видеть, что At состоит из всех элементов группы Л, по- порядки которых есть степени числа р,- . Действительно, если а 6 Д- , то р? а = 0 и, значит, порядок элемента а делит р? и поэтому яв- является степенью pt- . Обратно, пусть \а\ = р\. Тогда р\ делит | -Л I = tfpl* •••pi", так что *<s, . Но тогда р? а = р*Г\р\а) = = 0. Оказывается, что Л/ есть р/-подгруппа группы А и А == А\ © А2 Ф ... © Ak . 118
Прямые слагаемые А\ , ..., Ak называются примарными компонен- компонентами группы А и, очевидно, определены этой группой однозначно. Этот важный факт есть простое индуктивное следствие следующей леммы. Лемма 7.1. Пусть А—конечная абелева группа и \А\ = тгщу где тх, т2 — взаимно простые целые числа, большие 1. Тогда А = = ВХ® В2, где Вх - {а 6 А \ тха = 0}, В2 - {а 6 А | т2а = 0}. ^ Рассмотрим отображение ср : А ->¦ Л, при котором ф (а) ~ тха для любого а?А. Так как Ф К + я2) = mi («1 + а2) = тхах + тха2 = ф (ах) + ф (а2), то ф есть гомоморфизм А в А. Но Bi — Кегф, следовательно, Вх есть подгруппа А. Аналогично и В2— подгруппа А. По условию НОД(ть т2) = 1. Поэтому найдутся такие целые а и v, что мтх + у/п2 = 1. Для любого а?А имеем а = 1 . а = (атх + ют2) а ~ и (тха) + у (ща). Так как mima = | Л |, то т2 [а (тха)] = ^ [(^/Пз) а] = и • 0 = 0, т. е. и {ща) € #2. Аналогично у (т2а) 6 Bi. Следовательно, а = Ьх 4 Ь2, где &i?Bi, &26B2- Так что Л ==Bi + B2. В то же время В1ПВ2 = {0} и, значит, Л = BxQB.}. Действительно, для всякого Ъ 6 Вх (] В2 имеем Ь = и (mxb) + + v(m2b) = 0. ^ Пусть теперь | Л | = pl'pl2 • • • plk - Применим индукцию по k. Ес- Если k— 1, то Л = Лх, и утверждение очевидно. Предположим те- теперь, что k > 1 и всякая конечная абелева группа, каноническое разложение порядка которой имеет (k — 1) множитель, есть прямая сумма своих примарных компонент. Применяя лемму 7.1 к случаю, когда т1 = р\\ щ = psf • • • p^fe ,получаем разложение А=Вг® В2, где Вх = {а 6 Л | т^ = 0}, В2={аеА\ т2а = 0}. Очевидно, Вх = Лх. Посмотрим, что можно сказать о порядках Вх и В2. Из предло- предложения 7.9 следует, что Вх есть рггруппа, т. е. \Вг\ = pf, а так как А В В| d^ Е б d< |В| б у х ру \\ p \А | = \ВХ\ • |В2|, то d^Si. Если бы d<sx, то |В2| делился бы на ръ и поэтому нашелся бы элемент Ь?В.г, порядок которого был бы степенью рх. Но из определения группы В2 следует, что порядки ее элементов должны делить т2 = pi2 • • • plk , в то время как рх не делит т2. Значит, d = slf | Вх | = р'1, | В21 — р\г • • • p%k . По предположению индукции В2 = Лз0 ... 0 Ль где 119
Поэтому, согласно замечанию к предложению 7.8, А = Аг® А'2® ... © Ль Ввиду В2 cz А имеем А\ с= Л/ . С другой стороны, если а ? А? , г = 2, ..., k, то из определения Л/ и Б2 видно, что а?В2, а поэто- поэтому и а 6 Л/. Так что Л; = Л/ и, значит, искомое разложение А = А±® Л2© ... © Л* установлено. Доказана Теорема 7.14- Всякая конечная абелева группа есть прямая сумма своих примарных компонент. Применим полученный результат к случаю, когда Л — цикличес- циклическая группа. Так как всякая ее подгруппа тоже циклическая, то А есть прямая сумма своих примарных циклических подгрупп. Даль- Дальнейшее разложение в прямую сумму уже невозможно, как показы- показывает Предложение 7.10. Примарную циклическую группу А нельзя разложить в прямую сумму собственных подгрупп. > Пусть \A\ = ps и Л = А± © Л2,' где Л/ Ф Л. Тогда по теоре- теореме Лагранжа | ^4ХI = pSl, |Л2| = р5г, причем Si < s. Будем считать для определенности, что s±^s2. Пусть а — образующая группы Л и а = аг + а2, аг 6 Аъ а2 6 Л2. Тогда psia = psifa + <h) = PSiai + PSia2 = 0 + p^-S2)(pS2a) = 0 + 0 — 0. Но это противоречит тому, что \а\ = | Л | = ps. ^ Оказывается, что не только циклическая, но и произвольная ко- конечная абелева группа разлагается в прямую сумму примарных цик- циклических подгрупп. Согласно теореме 7.14, достаточно установить этот факт для любой примарной абелевой группы. Пусть s\ , ..., Sk—целые числа^1. Абелева р-группа Л назы- называется группой типа (pSi, ..., psk ), если она есть прямая сумма сво- своих циклических подгрупп порядков рч , i"= 1, ..., k. Теорема 7.15. Всякая конечная абелева р-группа есть прямая сумма своих циклических р-подгрупп. Если она есть группа типа (pSi, ..., psk ), причем s1'^s2^ ... ^ Sfe ^ 1, то последовательность (sly ..., sk) определена однозначно. ^ Пусть Л — конечная абелева р-группа. Нам понадобится Лемма 7.2. Пусть а?А, k — целое число^Х, такое, что р^афО, и ps — порядок элемента pk а. Тогда а имеет порядок pk+s. ^ Так как | pk a \ = ps, то pk+sa = ps (pk a) = о. Покажем, что если рпа = 0, то n^k + s. Это и будет означать, что \а\= pk+s. Заметим сначала, что я> k. Если бы n^.k, то р* а = pfe~rt(prt а) = 0, 120
что неверно. Если допустить, что п <^k + s, то &<ft<&-{~SH О < п — k < s. Тогда p(n-k)(pk а) = рд а = О, т. е. элемент р* а имеет порядок, меньший ps . Приходим к проти- противоречию. -4 Воспользуемся индукцией по порядку группы А. Наименьшим порядком р-группы является число р. Но группа простого порядка должна быть циклической, так что в этом случае утверждения тео- теоремы 7.15 очевидны. Будем считать, что для всех р-групп, порядки которых<|Л|, теорема 7.15 справедлива, и докажем ее для груп- группы А. Пусть ах ? А — произвольный элемент максимального порядка psS A1 — порожденная им циклическая подгруппа. Можно считать, что АгФА. Центральным пунктом в доказательстве теоремы 7.15 является Лемма 7.3. Для любого смежного класса фактор-группы А/А\ найдется его представитель, имеющий тот же порядок, что и данный смежный класс. ^ Очевидно, А/Аг есть р-группа. Пусть Ъ + Ах — ее произволь- произвольный смежный класс порядка ps . Так как Ах есть нулевой элемент А/Аи то ps (b + A1) = psb + A1 = Av Это означает, что ps b лежит в Лх, и так как Ах порождена элемен- элементом пи ТО psb = nau A) где п — некоторое целое число. Это число можно записать в виде п = р1 т, где т взаимно просто с р. Если бы мы знали, что t^s, то, переписав A) в виде ps b = ps (pt~sma1) и обозначив элемент pt~sma1 ? А± через с, имели бы равенство ps b = ps с, c?Av Очевидно, элемент а=^Ь — с есть представитель смежного класса b -\ Аи причем ps a = ps (b~-c) = ps b — ps c = 0. Учитывая, что порядок элемента а не может быть меньше порядка смежного класса a -f- Ах = b + Аъ равного ps , заключаем, что | а | = ps , т. е. а есть искомый представитель смежного класса b + Av Итак, достаточно показать, что неравенство t < s ведет к проти- противоречию. Рассмотрим элемент паг = (р* т) аг ? Av Так как Л1=={а1, 2аъ ..., р^аг}9 то можно считать, что n^pSi и, следовательно, f^Sx. 121
Покажем, что \tna1\ = ps*. Действительно, /тш^ЛхИ, значит, | таг | не может превосходить | Аг \ = р*. Если г {тах) = 0, то (гт) ai= = 0, и поэтому гт должно делиться на | fli | = pSl. А так как (т, р) = = 1, то pSi будет делить г. Это и означает, что \та1\ = ps*. Теперь ясно, что I nek | = | (р' /л) ах | = | р< (та,) | = ps*-'. B) Можно считать, что ps ЬфО, так как в противном случае Ь и есть искомый представитель. Из равенств A), B) и леммы 7.2 сле- следует, что | Ь | = р*к*1-о = psi+fs-o. Если бы выполнялось неравенство ?<s, то |6|>pSl, что противо- противоречило бы максимальности порядка элемента av ^ Продолжим доказательство теоремы 7.15. Рассмотрим фактор-груп- фактор-группу А = А/А±. Так как порядок А меньше порядка Л, то к Л можно применить предположение индукции: —• A ?D ?D Л t —- /12 >I/ ••• >I/ ^^ есть прямая сумма циклических подгрупп порядков ps\ ..., psk . Будем для каждого элемента а ? Л обозначать через а содержа- содержащий его смежный класс по подгруппе Аъ т. е. а = а-\- Аг. Если ф:Л->-Л — естественный гомоморфизм (см. § 7.5), то для любого а?А ф(а) == а. Пусть а2, ..., ak — образующие циклических подгрупп Л2, ..., Л*. Согласно лемме 7.3, можно считать, что щ имеет тот же порядок, что и at , i = 2, ..., ^. Обозначим через Л/ циклическую подгруппу группы Л, порожденную элементом щ , и покажем, что Л есть пря- прямая сумма своих подгрупп Аъ Л2, ..., Ап - Пусть а — произвольный элемент Л. Тогда а = т2а2+ ... + mkak C) при подходящих целых т2, ..., т^ . Рассмотрим элемент Ь = а — т2а2— ... —mkak D) группы Л. Применяя к обеим частям равенства D) гомоморфизм ф и учитывая равенство C), получаем j фF) = ф_(а) — т2ф(а2)— ... j— тл ф(ал ) = — а — т2а2 — ... — rtikCik = 0. Это означает, что Ъ 6 Кег <р = Аг. Поэтому b = mxax при некотором целом тъ и из равенства D) теперь следует, что а = тха, + т2а2+ ... +mkak, E) где т/ at g Л/ . Заметим, что всякий элемент группы Л/ единствен- единственным образом записывается в виде гт щ , где 1 ^ пп <J psi . Поэтому можно считать, что в разложении E) 1 <^т4- ^ рч . 122
Покажем, что такое представление элемента а определено одно- однозначно, т. е. что Л есть прямая сумма Ль Л2, ..., Ak • Пусть наряду с разложением E) имеется некоторое разложение а = rai'fli + т2а2 + ... -}¦ ткак , 1 <mi <р<* . F) Действуя на левые и правые части разложений E) и F) гомомор- гомоморфизмом ф и учитывая, что ср (а±) = 0, получаем равенства а = т2а2 + ... -f mkaky G) а - т2а2+ ... +/ад . (8) Так как Л есть прямая сумма Л2, ..., Л& и каждый элемент At единственным образом записывается в виде /тад-, 1 ^ ть ^ рЧ , то, сравнивая разложения G) и (8), получаем Возвращаясь к равенствам E) и F), видим, что т^ = /п^, откуда тх = гп\. Итак, доказано, что А = А± ® А2 ® ... © Л^ . Предположим, что группа А двумя способами разлагается в пря- прямую сумму своих циклических подгрупп, т. е. является одновремен- одновременно группой типов (Р5*, ..., P*k), (рЧ ..., р*т)% (9) где s±^ ... ^sk^l и ti^ ... >^m^l. Надо показать, что k~m и s/ = ^ . Доказательство будем вести индукцией по порядку А. Если \А\=р> то Л—циклическая группа, и доказываемое утверждение тривиально. Будем считать, что оно верно для всех р-групп поряд- порядка, меньшего, чем у Л. Рассмотрим гомоморфизм ср : Л ->- Л, такой, что ф (а) = ра для любого а?Л. Так как Л содержит элементы порядка р, то Кегф=^={0}, и порядок подгруппы ф (Л) меньше порядка Л. Следо- Следовательно, к ф(Л) применимо предположение индукции. Если Л = Ах ф Л2 ф ... ф Ль то для любого а?А а = = ах + а2 + ... + ^ , я* б Л/ , и ра — рах + ра2 + ... + рак , где paL ? ф(Л^ ). Такое представление элемента ра = ф(а) определено однозначно, потому что ф(Л/ ) cz At , и в то же время Л — прямая сумма At , i= I, 2, ..., ^. Это доказывает, что Ф (Л) - ф (Аг) 0 Ф (Л2) 0 ... 0Ф(ЛЛ). Рассмотрим группу ф(Л,- ). Что можно сказать про ее порядок, если Ас —циклическая подгруппа порядка pst ? Отображение ф можно рассматривать как гомоморфизм ф/ : At -^ф(Л/ ), Кегф^ = {a^Ai \ ра = 0}. Тогда <р (Л/ ) = % (А( ) ^ Л,- /Кег ф, так что | ф (Лг- ) | = | Кет Ф/1 ' 123
Пусть щ —образующая циклической группы At и элемент mat 6 Кегф; , 1 <m</7s/ . Тогда р{тц ) = (рт)ас = 0. Это озна- означает, что рт делится на рч , т. е. т делится на рч -1. Теперь яс- ясно, что Кегф, = {рч -4i , 2рч -1<ц , ..., ррч -^щ }, так что | Кег <pt- \ = р, и, следовательно, | ф (Л/ ) | = /7s/ -1. Это рассуждение доказывает, что группа ф(Л) имеет одновремен- одновременно типы причем если какие-то s,- или // равны 1, то рч -1 и pfj ~l выбра- выбрасываются. По предположению индукции S/ — 1 = U — 1, если s,- или ti > 1. Следовательно, для всех этих номеров sL = tt и последова- последовательности (9) могут различаться только своими последними членами, равными /?, т. е. найдется натуральное п, такое, что (р*, ..., psk) = (p**, ..., /Я*, /7, ..., /7), а раз (/Л, ..., р*т) = (р\ ..., /7%, /7, ..., /7). Р раз Вычисляя порядок группы А с помощью порядков прямых слагаемых в каждом из двух разложений, получаем | А | = /7si+ • • • +sn р<* = р*+ ••• +% рР , откуда а = р, что завершает доказательство теоремы 7.15. ^ Теоремы 7.14 и 7.15 позволяют сформулировать основную теоре- теорему о конечных абелевых группах. Теорема 7.16. Всякая конечная абелева группа АФ{0} разла- разлагается в прямую сумму примарных циклических подгрупп. Следующая теорема показывает, что два разложения одной и той же конечной абелевой группы в прямую сумму примарных цикличес- циклических подгрупп существенно не отличаются друг от друга. Теорема 7.17. Если конечная абелева группа А разложима дву- двумя способами в прямую сумму примарных циклических подгрупп: А = А±® ... ®Ak=B1® ... 0 5™, A0) то для любого целого ps в каждом из этих разложений существу- существует одно и то же число прямых слагаемых порядка ps . ^ Если в любом из двух разложений A0) собрать все прямые слагаемые, относящиеся к данному простому числу /7, то их прямая сумма будет, очевидно, /7-подгруппой группы А и даже /7-примарной компонентой этой группы. Действительно, полученная /7-подгруппа должна содержаться в примарной компоненте группы Л, соответст- соответствующей данному простому р\ и в то же время ее порядок равен наи- наивысшей степени числа /7, на которую делится порядок группы А. Так как /?-примарная компонента Ар группы А определена од- однозначно, то разложения A0) дают, таким образом, два прямых раз- разложения Ар на циклические /7-подгруппы. Из второй части теоремы 7.15 непосредственно следует, что число прямых слагаемых порядка 124.
ps в каждом из этих разложений, а следовательно, и в разложе- разложениях A0) одинаково. <4 Теоремы 7.16 и 7.17 позволяют дать исчерпывающее описание всех конечных абелевых групп. Пусть (пъ п29 ..., nk ) — произвольный конечный набор натураль- натуральных чисел, которые являются ненулевыми степенями простых чисел. Наборы, отличающиеся друг от друга только порядком составля- составляющих их чисел, будем считать одинаковыми. Каждому такому набо- набору соответствует прямая сумма циклических групп, порядками кото- которых служат числа из этого набора. Эта прямая сумма есть конечная абелева группа, причем группы, отвечающие различным наборам, друг другу не изоморфны, а любая другая ненулевая конечная абе- абелева группа изоморфна одной из таких групп. Рассмотрим несколько примеров. При этом символом Сп будем обозначать циклическую группу порядка п. Пример 7.15. Выясним, изоморфны ли группы Ci2 0 С?а и С18фС±8. Решение. Разложим каждую циклическую группу из данных разложений в прямую сумму ее примарных компонент. Так как 12 = 22 • 3, 72 = 23 • З2, 18 = 2 • З2, 48 = 24 • 3 и так как любая подгруппа циклической группы есть цик- циклическая группа, то СХ2 = С± ф Сз, С72 = С8 0 С9, Cis = Сг 0 Сд, С48 = Cie 0 Сз« Отсюда получаем разложения исходных групп в прямые суммы примарных цикли- циклических подгрупп: Ci2 0 С72 = С4 0 Сз 0 С8 0 С9; С18 0 С48 ^С2($С9® C1Q 0 С8. Так как эти разложения существенно различны, то заключаем, что группы Ci2(^C72 и С180С4в не изоморфны. Пример 7.16. Опишем с точностью до изоморфизма все абелевы группы поряд- порядка 72. Решение. Задача сводится к описанию всех возможных наборов (пъ ti2, ..., tik), удовлетворяющих условию п\ Пч • • • nk = 72, и таких, что щ — ненулевая степень простого числа, i = l, 2, ..., к. При этом порядок чисел пи п2, ..., п^ роли не играет. Так как 72 = 23 • З2, то для набора (пъ Пг, ..., я#) имеется шесть возмож- возможностей : B3, З2), B, 22, З2), B, 2, 2, З2), B3, 3, 3), B, 22, 3, 3), B, 2, 2, 3, 3). Следовательно, с точностью до изоморфизма существует ровно шесть абелевых групп порядка 72: С8<$С9, С2($С4$)С9, С20С20С20С9, С8(Т)Сз0С3, С20С40Сз©С3, С20С20С20С30Сз. Упражнения 1. Докажите, что если порядок конечной абелевой группы А не делится на квадрат целого числа, большего 1, то Л — циклическая группа. 2. Пусть А — группа, все ненулевые элементы которой имеют один и тот же порядок р. Докажите, что р — простое число. 3. Пусть А — произвольная конечная абелева группа. Докажите, что для лю- любого делителя d порядка группы А существует хотя бы одна ее подгруппа поряд- порядка d. Сравните это утверждение с теоремой Лагранжа. 125
8. КОЛЬЦА В этой главе подвергается дальнейшему изучению понятие коль- кольца. Рассматриваются сравнения в кольце целых чисел, вводятся и исследуются кольца классов вычетов. Важные результаты получены здесь с помощью групповых соображений. В свою очередь, кольца вычетов доставляют содержательные примеры, иллюстрирующие об- общую теорию. 8.1. Сравнения Пусть т — фиксированное натуральное число, а, Ь, — произволь- произвольные целые числа. Говорят, что а сравнимо с Ъ по модулю т, и пи- пишут az==b(modm), если разность а — Ъ делится на т. Легко проверить следующие свойства сравнений: 1) для любого а^Ъ a^a(modm); 2) если a==fc(modm), то & = a(modm); 3) если a==ifc(modm) и bz===c(modm), то a = c(modm). Проверим, например, свойство 3. Пусть a=ifc(modm), &== = ?(modm), т. е. а — Ь = ти, Ь — с = mv, и, v?Z. Тогда а — с = = (а — Ь) + (Ь — с) = m(u + v), u + v?Z, т. е. a=z=c(modm). Совокупность этих трех свойств означает, что при фиксированном модуле т отношение сравнимости является отношением эквивалент- эквивалентности на множестве Z и поэтому разбивает это множество на попар- попарно непересекающиеся классы сравнимых элементов. Эти классы на- называются вычетами по модулю т. Множество вычетов по модулю т обозначается символом Zm. Итак, Ът — множество классов целых чисел, сравнимых по мо- модулю т. Рассмотрим, как устроен произвольный элемент А ? Zm. Если число а принадлежит классу Л, то A = {xeZ\x^=a (mod m)}. Сравнение x^a(mcdm) означает, что х — а = ту, т. е. х = а -{- myt у ? Z. Поэтому А = {а + ту | у g Z}. Класс чисел, сравнимых по модулю /л, содержащий число а, обозначим символом а. Очевидно, сравнение а = Ъ (mod m) равносиль- равносильно равенству классов а = Ь. Предложение 8.1. a ^==b (mod m) тогда и только тогда, когда а и b имеют равные остатки от деления на т. > Пользуясь теоремой о делении с остатком для целых чисел, представим а и Ъ в виде а = тцх + гъ Ь^тцг-\ г2, где ft, q2, rly r2?Z, 0<гь /*2<т. Тогда a — b = m(g1 — q2) + (rx — га). A) Из равенства A) следует, что а — Ь делится на т тогда и только тогда, когда гг — г2 делится на т. Так как 0^>ь г2<ту то гг — г2 делится на т только при гх — г2 = 0, гх = r2. ^ 126
В качестве остатков при делении целых чисел на га могут фигу- фигурировать только числа 0, 1, 2, ..., га—1, поэтому из предложения 8.1 вытекает, что Zm содержит ровно га элементов: О, 1, ..., /п—1, т. е. Zm = {0, 1, ..., га — 1}. Превратим Zm в кольцо, определив соответствующим образом сложение и умножение классов. Для этого нам потребуются следу- следующие два свойства сравнения: 1) сравнения по одному модулю можно почленно складывать, га. е. если a = b (mod т) и c==d (mod га), то а + с===Ь + d (mod га); 2) сравнения по одному модулю можно почленно умножать, т. е. если a = &(modra), c==d(modra), то ас eh bd(modга). Докажем, например, второе свойство. Пусть a = &(modra), c==d(rnodra). Тогда а = Ъ + ти, с = d-\- то. B) Перемножая равенства B) почленно, получаем ас = bd + га (to + -\-ud\-muv), т. е. ac ==bd (mod га). Доказательство первого свойства оставляем читателю. Определим теперь в Ът сложение и умножение классов равенст- равенствами а + b = а + Ь, а • b = ab. C) Чтобы доказать корректность такого определения, покажем, что сумма и произведение двух классов зависят только от взятых клас- классов. В формуле же C) фигурируют числа а и Ь. Поэтому должно быть доказано, что если а = аъ b = Ьъ то а + b = ах + Ьъ ab = == афх- Для этого воспользуемся свойствами сравнений. Если а = аъ b=~bv то а = аг (mod га), ^^ Складывая эти сравнения почленно, получаем а + b = ах + bx (mod га), а 4- Ь = ах + Ь1в Корректность определения умножения классов проверяется ана- аналогично. Итак, равенства C) действительно определяют алгебраические операции на множестве Zm. Теорема 8.1. Множество Ът относительно операций сложения и умножения, определяемых формулами C), является коммута- коммутативным кольцом с единицей. ^ Сложение и умножение классов по формулам C) сводится к сложению и умножению целых чисел, поэтому операции C) ассо- ассоциативны, коммутативны и связаны свойством дистрибутивности. Для любого a?Z a + 0 = 0 + a = a, так что класс 0 — нуле- нулевой класс — нейтральный элемент относительно сложения. Для 127
класса а противоположным является (—а) — класс, содержащий число —а: а + (—-а) = а + ( — а) = 0, т. е. — а = — а. Доказано, что Ът — коммутативное кольцо. _ Класс 1 является единицей этого кольца: 1«а=1а = а для любого а? Z. ^ Определение 8.1. Кольцо Ът называется кольцом вычетов по модулю т. _ Пример 8.1. т =_2,JZ2 = {б, Т};_б + О = О, 0-}-T =,Т + Т = 2 = 0; 00 = =0, 0-1 =0,1.1 = 1; 5=1, ~4_-0, —1 = 1. Пример 8.2. m = 3, Z3 = {О, 1, 2}; сложение и умножение классов задаются следующими таблицами: 0 Т 2 0 Т 2 1 I 2 0 2 2 0 Т б т 2 0 0 б 0 Г 0 Т 2 2 0 2 т Из теоремы 8.1 вытекает, в частности, что существует бесконеч- бесконечно много конечных колец, а именно: для любого натурального т существует кольцо, содержащее ровно т элементов. 8.2.* Функция Эйлера Введем одну из важнейших теоретико-числовых функций — функ- функцию Эйлера, которая имеет многочисленные применения в разных областях математики. Определение 8.2. Функцией Эйлера называется функция ф, определенная на множестве всех натуральных чисел следующим условием: ср (я) равно числу чисел из отрезка натурального ряда [1, п], взаимно простых с п. Например, ср A) = 1, для простого числа р ср (р) = р — 1, ср D) = 2. Докажем важное свойство функции Эйлера, которое называют свойством мультипликативности. Предложение 8.2. Функция Эйлера ф мультипликативна, т. е. если НОД (а, Ь) = 1, то ф(аб) = ф(а) ф(&). > Пусть НОД (а, Ь) = 1. Для любого натурального числа с НОД(а&, с) -НОД(а, с)НОДF, с), поэтому НОД(а&, с) = 1, если и только если НОД (а, с) = 1 и НОД (&, с) = 1 одновременно. Итак, ф (ab) равно количеству чисел отрезка натурального ряда [1, ab], взаимно простых и с а, и с Ь. Все числа этого отрезка рас- расположим в виде прямоугольной таблицы: 128
а 2а Ф- 1 + 1) 1 1. а + 1 (Ь а 2а 2 + 1) 2 2 а + • 2 ... а а + а = За to --2а Рассмотрим произвольный столбец этой таблицы. Пусть его но- номер j, т. е. он состоит из чисел вида ха-\-[л где 0^х<^Ь. Нам понадобятся следующие два утверждения: 1) либо все числа i-ro столбца взаимно просты с а, либо в этом столбце нет чисел, взаим- взаимно простых с а; 2) в i-м столбце ровно ф ф) чисел, взаимно про- простых с Ь. Так как в первой строке ровно ф (а) чисел, взаимно простых с а, то из этих двух фактов вытекает равенство ф (ab) = ф (а) ф ф). Первое утверждение очевидно, поскольку НОД (ха -+- ?, а) = НОД (i, a). Что касается второго, то заметим, что никакие два числа из одного столбца не сравнимы по модулю Ь. Действительно, если хха -f- i = = х2а -\- i (mod b), то разность (хха -f- i) — (х2а + i) делится на Ь. Эта разность равна (хх — х2) а. Так как а и Ъ взаимно просты, то Xi — х2 должно делиться на Ъ. Но 0 ^^i, х2 << Ьу поэтому хх —х2 = О, хг = х2. Итак, i-и столбец содержит ровно Ъ чисел, попарно несрав- несравнимых по модулю Ь. Но всего существует ровно Ъ классов по мо- модулю Ь: 1,2, ..., Ь, причем наибольшие общие делители с Ь для всех чисел, входящих в один класс, равны. Следовательно, i-й стол- столбец содержит по одному представителю из каждого класса и среди них есть ровно ф ф) чисел, взаимно простых с Ъ. ^ С помощью предложения 8.2 вычисление ф (п) сводится к тому случаю, когда п является степенью простого числа. В самом деле, пусть есть каноническое разложение числа /г, т. е. рь ...» рт —попарно различные простые числа, tu ..., tm?Z, tv ..., tm^0. Тогда НОД (pi1 .. . рт~\, Рт) = 1 и, следовательно, ) Повторив аналогичное рассуждение достаточное число раз, получим A) Остается вычислить ф(рО» гДе Р — простое число. Натуральное число с взаимно просто с р* тогда и только тогда, когда оно не де- делится на р. Следовательно, ф (рг) равно числу чисел из отрезка [1, р*], не делящихся на р. Числа р, 2р, Зр, ..., pt~l-p=:pt из это- этого отрезка делятся на р, т. е. pf~l чисел, а остальные не делятся. Следовательно, Зак. 3670 129
Из формул A) и B) получаем: если п = р\ Pi ... р™— канони- каноническое разложение, то Ф(п) = (Р[1 ~рГ) (pi -рГ1)... (р™ -Р1;г) = -n(\-L\(lJL) dL — /til Pi Д P2 ) \ Pm 8.3.* Мультипликативная группа кольца Zm Рассмотрим мультипликативную группу кольца вычетов по моду- модулю /л, т. е. множество всех элементов Zm, для которых в Ът су- существуют обратные. В частности, исследуем вопрос: при каких зна- значениях т Ът является полем. Напомним, что а означает тот класс чисел, сравнимых по моду- модулю т, который содержит число а, и равенство а = Ъ равносильно сравнению а == Ъ (mod m). Единицей рассматриваемого кольца слу- служит класс 1. Итак, нас интересует мультипликативная группа 1т = {а ? Ът\ существует класс аг1}. Теорема 8.2. Для класса а существует обратный класс а~~хЛ если и только если НОД(а, т) = 1. ^ Обратимость класса а означает, что существует класс X ? Zm, такой, что аХ = Т. A) Если х — произвольное число из X, то X = х, и условие A) пере- переписывается в виде ах^=~1, ах = ~[, т. е. ах =1 (mod m). Последнее верно, если существует целое число (обозначим его —у), такое, что ах — 1 = m (—у), т. е. ах + ту = 1. B) Итак, для существования обратного класса а~1 необходимо и до- достаточно, чтобы нашлись х и у в Z, удовлетворяющие равенству B). Но существование таких х и у необходимо и достаточно, чтобы чис- числа а и т были взаимно просты. ^ Из доказательства теоремы 8.2 вытекает способ вычисления обратного класса arl\ если х и у — целые числа, удовлетворяющие условию B) (их можно найти, например, с помощью алгоритма Евк- Евклида), то а~1 = х. Пример 8.2. Найти З" в кольце Zs. Решение НОД C, 5) = 1, так что класс З" существует. Чтобы его найти, представим 1 в виде 1=3*+ 5#, х, у ?2, C) и затем получим 1 ее Зх (mod 5), Т = Зх = 3-х, х= З". 130
Представление C) можно найти с помощью алгоритма Евклида для чисел 5 и 3. Итак, 5 = 3-1+2; 3 = 2-1 + 1; 2=1-2; НОД E, 3) = 1 = 3 — 2-1; 2 = = 5 — 3 • 1, поэтому 1 = 3 — E — 3) = 3-2 + 5 (—1); х = 2; З = 2. Пример 8.3. Очевидно, Z\ = {\, §}, так как среди чисел 1, 2, 3, 4 только 1 и 3 взаимно просты с 4; Г" = Т; З = 3. Отметим ряд следствий теоремы 8.2. Следствие_8.1. | zA|j= q>(m). ^ Zm = {I, 2, ..., т\\ a^Z*ny если и только если НОД (а, т) = = 1. ^ Следствие 8.2 (теорема Эйлера). Если а и т — взаимно простые натуральные числа, то a^(m) = I (mod m). ^ В рассматриваемой ситуации a^lmj | Zm | = Ф (т). Так как порядок элемента конечной группы делит порядок этой группы, то ф(т) делится на \а\. Но тогда Jfim = аФ(^) = 1, дфС") = 1 (mod m). «4 Теорема Эйлера доставляет еще один способ вычисления обрат- обратного класса а~1: если а и т взаимно просты, то а~1 = аФ(т) —*. Пример 8.4. Найти класс 5" в Zn, Решение. НОД E, 11)=1, ф A1) = 10, поэтому 5" = 5». Далее 52 = = 25 ее 3 (mod 112, 58 = З4 = 81 = 4 (mod 11), 59 = 5-4 = 20 = 9 (mod 11). Итак, 5 = 9. Следствие 8.3 (теорема Ферма). Если а — произвольное натуральное число, а р — простое, то ap = a(mod p). ^ Если а не делится на р, то по теореме Эйлера а?~1 = 1 (mcd m), и поэтому ap=a(mod р). Если же р делит а, то ap^0(mod p) HflsO (mod р), т. е. аР = а (mod p). ^ Следствие 8.4. Кольцо классов Ът является. полем тогда и только тогда, когда т — простое число. > Всегда Ът — коммутативное кольцо с единицей. Оно являет- является полем, если содержит более одного элемента (т. е. т > 1), и для каждого ненулевого элемента из Ът существует обратный. Если /п — простое число, то все числа 1, 2, ..., т — 1 взаимно просты с /77, поэтому для каждого из ненулевых классов Г, 2, ..., т — 1 существует обратный класс. Итак, в случае простого т Ът — поле. Пусть теперь т — составное число, т = ab, 1 < а < т. Тогда афО (а не делится на т) и НОД (а, т) = аф19 т. е. не сущест- существует обратного класса агх, и поэтому Ът не является полем. ^ Поскольку множество простых чисел бесконечно, то, используя следствие 8,4, можно построить сколько угодно примеров конечных полей. 5* 131
Между числовыми и конечными полями есть одно принципиаль- принципиальное различие. Пусть Р — любоэ поле и а — его произвольный эле- элемент. Для всякого натурального п через па будем обозначать сумму а + а + ... + а п раз В частности, п раз Если Р — числовое поле, то среди кратных единицы 1-1, 2-1, 3-1, ..., /г-1, ... не будет повторений, так как мы имеем здесь по- последовательность натуральных чисел 1, 2, 3, ..., п, ... Будем говорить, что поле Р имеет нулевую характеристику, если все кратные единицы поля Р являются различными элемента- элементами этого поля. Таким образом, числовые поля являются полями нулевой характеристики. Положение меняется, если Р — конечное поле. В этом случае среди целых кратных единицы поля заведомо существуют повторе- повторения. Пусть для натуральных чисел k и /, k > /, имеет место равен- равенство k-\ = /• 1, т. е. 1 + 1 + ... + 1 = 1 + 1 + ... -I 1. k раз I раз Тогда, очевидно, (k — /) 1 = 0, т. е. в Р существуют целые крат- кратные единицы, равные нулю. Всякое поле Р с таким свойством на- называется полем положительной характеристики. Если р — наимень- наименьшее натуральное я, для которого пЛ = О, то говорят, что Р — поле характеристики р > 0. Все конечные поля, как мы видели, имеют положительную ха- характеристику. Но существуют и бесконечные поля положительной характеристики. Теорема 8.3. Если поле Р имеет характеристику р > 0, то р — простое число. > Если бы р = kty где & < р, t < p, то (k-1) (М) = A + 1 + ...+ 1) A + 1 + ... + 1) = р. 1 = 0. k раз t раз Так как в поле нет делителей нуля, то отсюда следует, что либо k-l =0у либо t-\ =0, что противоречит определению числа р как наименьшего натурального, обращающего единицу поля в нуль. ^ Упражнения 1. Докажите, что если Р — поле характеристики р > 0, то для любого а?Р имеет место равенство ра = 0. Вывести отсюда, что для любых a, b?P {а + Ь)Р =аР + ЬР. 132
8.4. Изоморфизмы и гомоморфизмы колец Пусть G и G' — группы. Напомним, что отображение q):G->G7 называется гомоморфизмом группы G в группу G', если для любых элементов а и Ъ из G ф (ab) = ф (а) ф F). Гомоморфизм колец определяется аналогично. Разница лишь в том, что в этОхМ случае требуется сохранение обеих алгебраичес- алгебраических операций кольца. Определение 8.3. Пусть К и К' — кольца. Отображение ф:/С->Л^ называется гомоморфизмом кольца К в кольцо К', если для любых элементов а и Ь кольца К верны равенства Ф {а + Ь) = ф (а) + Ф[F), Ф (ab) = ср (а) ф[F). Биективный гомоморфизм у.К-^К' называется изоморфизмом кольца К на кольцо /С'. Если изоморфизм существует, то говорят, что кольцо К изоморфно кольцу К' и пишут К^К'. Поля назы- иаются изоморфными, если они изоморфны как кольца. Естественно, что гомоморфизмы колец обладают свойствами, ана- аналогичными свойствам гомоморфизмов групп. Перечислим эти свойст- свойства (оставляя их доказательство читателю): 1) тождественное отображение ек кольца К есть изоморфизм К на себя, так что К—.К; 2) если ф : /С-> Kf — изоморфизм колец, то ф—1: К' -> К также изоморфизм колец. Поэтому, если К = К', то К' = К; 3) если ф : /С-> К' и i|): /С'->/(" — изоморфизмы колец, то и их произведение грф: К -> К" является изоморфизмом колец. Следова- Следовательно, если К** К' и К' ^ К", то К^ К". Совокупность приведенных свойств означает, что отношение изо- изоморфизма колец является отношением эквивалентности на множест- множестве всех колеи, и поэтому разбивает это множество на непересекаю- непересекающиеся классы изоморфных колец. Как и в случае групп, мы можем отождествлять изоморфные кольца; 4) если ф : К->К' —гомоморфизм колец и 0—нуль кольца К, то ф @) — нуль кольца /С7; для любого элемента а кольца К Ф (—а) = = — Ф (а); 5) если ф:/С->/С7 — гомоморфизм колец и Н — подкольцо коль- кольца К, то ф (Я) — подкольцо кольца /С7. В частности, ф (К)—под- кольцо кольца K'l 6) если ф : К -> К' — гомоморфизм колец и е — единица кольца К, то ф (е) — единица кольца ф (К); если а — обратимый элемент коль- кольца К, то ф (а) обратим в ф (К) и ф (а)-1 = ф (а-1). Докажем последнее свойство. Пусть b — произвольный элемент кольца ф (/С). Тогда Ъ = ф (с), с 6 К, Ф (е) Ь = ф (е) ф (с) = ф (ее) = = ф (с) = 6. Аналогично 6ф (в) = 6, т. е. ф (ё) — единица в <р(К). Далее, ф (а~1) ф (а) = ф (а-1^) = ф (е) — единица в ф (/С), ф (а) ф (а^1) = ==ф(^), поэтому ф(а) — обратимый элемент в ц>(К) и ф (а)~~1 = 133
Пример 8.5. Отображение произвольного кольца К в произвольное кольцо К'', ставящее в соотвэтствие каждому элементу К нуль кольца К', является гомомор- гомоморфизмом К в К'. Пример 8.6. Фиксируем натуральное число т и рассмотрим отображение Ф : Z -> Z/w, гдз для любого а из Z ф (а) = а — класс чисел, сравнимых по моду- модулю т, содержащий а. Тогда ф (а + Ь) = а -{-Ь = а 4- 6 = ф (а) -(- ф F), ф (аб) =. = #& =з а 6 = ф (а) ф F). Поэтому ф является гомоморфизмом кольца Z в кольцо Zm. Эгот гомоморфизм сюръективен, но не инъективен. Пример 8.7. Пусть С — поле комплексных чисел. Для произвольного комплекс- комплексного числа с = a -f- 6i сопряженное ему число а — Ы обозначим символом с. Отоб- Отображение Ф : С -> С, где ф (с) — с, является изоморфизмом С на себя. В самом деле, так как для любых съ с2 € С су. + с2 = Сх + с2> схс2 = сгс2, ТО ф (СХ + С2) ==С1 + С2 = С1 + С2 = <р (Сх) + ф (С2) , ф (СхС2) = СХС2 = CiC2 = ф (Сх) X ХФ (с2). Пример 8.8. Пусть К — множество всех матриц второго порядка, имеющих вид [-Ь 1Ь*€И. Тогда К является кольцом, а отображение ф : С -> К, определяемое формулой есть изоморфизм колец. В самом деле, ф биективно, поскольку представление комплексного числа в виде a-\-bi> a, b ^ R, i2 = —1, однозначно. Докажем, что ф сохраняет сумму и произведение. Пусть Тогда С другой стороны, («! + 6xt) (сг2 + 62i) =. (аха2 — ЬхЬ2) + (аф2 + Ьха2) i. Итак, Ф ((«1 + ^lO («2 + М) = Ф («1 + bii) ф (fl2 + W). Аналогично доказываем, что ф сохраняет сумму. Изоморфизм кольца /С на себя называется автоморфизмом это- этого кольца. Множество всех автоморфизмов кольца К обозначается символом Aut К- Как и в случае автоморфизмов групп, Aut К яв- является группой относительно умножения отображений. Упражнения 1. Пусть ф: К -> К'—гомоморфизм колец, е — единица кольца /С. Всегда ли ф{е)—единица кольца /С7? (Выле доказано, что ф (в) — единица кольца Ф(/С). Всегда ли из обратимости элемента а в кольце К вытекает обратимость ф (а) в кольце К'? 2. Докажите, что кольцо Z и поле Q имеют лишь единственный автомор- автоморфизм — тождественное отображение. Это же утверждение верно и для поля R, хотя доказательство в этом случае * сложнее. Вопрос об автоморфизмах поля комплексных чисел значительно тоньше. 134
8.5. Идеал. Фактор-кольцо Среди всех подколец данного кольца особенно важны те, роль которых аналогична роли нормальных делителей в группе. Эти под- кольца называются идеалами. Подкольцо / кольца К называется идеалом кольца К (двусто- (двусторонним), если каждое из множеств содержится в /. Теорема 8А (критерий идеала). Непустое подмножество I кольца К является в К идеалом тогда и только тогда, когда вы- выполняются следующие условия: 1) для любых элементов а и b множества I а — b?l; 2) для любых а?1 и с?К ас?1 и са?1. )> Заметим, что / является идеалом в К тогда и только тогда, когда / есть подгруппа аддитивной группы кольца /С, удовлетво- удовлетворяющая второму условию теоремы'8.4. Но выполнение первого ус- условия необходимо и достаточно как раз для того, чтобы / оказа- оказалось подгруппой. <4 Пусть К — произвольное коммутативное кольцо. Покажем, что для любого а 6 К подмножество является идеалом К. Воспользуемся критерием идеала. Для любых элементов асх и ас2 из аК разность асх — ас2 = а (сг — с2) (= аК- Далее, для любого с3 ? К произведение с3 (aci) = (асг) с3 = а (схс3) ? аК. Идеал аК называется главным идеалом кольца /С, порожденным элементбм а. Коммутативное кольцо, в котором всякий идеал глав- главный, называется кольцом главных идеалов. Пример 8.9. Покажем, что кольцо целых чисел Z является кольцом главных идеалов. Решение. Пусть / — произвольный идеал кольца Z и пусть т — наимень- наименьшее натуральное число, содержащееся в /. Всякий элемент а ? / можно разделить с остатком на т: ¦ а = тс-\- г, где с? Z, 0 <> < т. Так как т ? /, то и mc?l. Но тогда и г = а — тс есть элемент /. Из усло- условия /*<ш, согласно выбору т, следует, что г не может быть натуральным чис- числом. Значит, г = 0и а = тс. Этим доказано, что I a ml. Так как / — идеал и т ? /, то верно и обратное включение. Введем понятие фактор-кольца. Пусть К — кольцо, / — его идеал. Относительно сложения множество / является нормальным делителем аддитивной группы /С, поэтому можно перейти к фактор- факторгруппе К/1. Элементы этой фактор-группы, т. е. смежные классы а + /, называются смежными классами кольца К по идеалу I. Определим операцию умножения классов, положив (а+I) (Ь + 1)=аЬ + 1. A) 135
Для того чтобы это определение было корректным, надо пока- показать, что произведение классов не зависит от выбора представите- представителей в этих классах. Итак, докажем следующее Предложение 8.3. Если с?а + /, d?b + I, то cd?ab + I. ^ Пусть с = а + h, d = Ь + i29 h> h 61- Тогда cd = (a + У F + h) = ab + (al2 + ixb + hi2). Заключенная в скобки сумма принадлежит идеалу /. Обозначив ее буквой if получим cd = ab+i, i?I, т. е. cd?ab + I. M Из предложения 8.3 вытекает, что равенство A) действительно определяет алгебраическую операцию на множестве смежных клас- классов по идеалу /, т. е. если с + / = а + Л d + I = b + I, то cd + I = = ab + /. Теорема 8.5. Множество всех смежных классов кольца К по идеалу I относительно сложения и умножения классов является кольцом. ^ Относительно сложения рассматриваемое множество является группой — фактор-группой К/1. Умножение классов ассоциативно и дистрибутивно относительно сложения, поскольку обе эти опера- операции сводятся к аналогичным операциям в кольце К, которые ука- указанными свойствами обладают. В самом деле, докажем, например, что (а + 1) ((& + /) (с + 1)) = ((а + 1) (Ь + П) (с + П- Имеем (а + 1) (ф + 1) (c + I)) = (a + I) (bc + I)=a(bc) + I = = (ab)c + I = (ab + I) (c + I) = ((a + I) (b + I)) (с + I). * Кольцо, построенное выше, называется фактор-кольцом кольца К по идеалу I и обозначается, как и фактор-группа, символом К/1. Пример 8.10. Пусть т — фиксированное натуральное число. Множество тЪ = [mc\c?Z] всех целых чисел, кратных т, является идеалом в Z. Рассмот- Рассмотрим смежные классы по этому идеалу. Для а ? Z а + тЪ = {а + тс \ с ? Z} = а — класс целых чисел, сравнимых по модулю т. При этом смежные классы по идеа- идеалу tnZ складываются и умножаются так же, как и соответствующие вычеты, т. е. мы получили другое определение кольца вычетов по модулю т. Итак, 8.6. Теорема о гомоморфизмах колец* Пусть К и К' — кольца, ф : К -> Kf — гомоморфизм колец, (У — нуль кольца К'. Определение 8.4. Множество всех элементаз кольца К, об- образом которых при гомоморфизме ф служит 0', называется ядром гомоморфизма ф и обозначается символом Кегф. Итак, Кег ф - ф-1 @0 = {а ? /С | Ф (а) = 0'}. Предложение 8.4. Ядро произвольного гомоморфизма ср:К-+К' является идеалом кольца /С. 136
> Если 0 — нуль кольца /С, то ф @) ~ (У, и поэтому 0 б Кег ф. Если а, Ь 6 Кег ф, то ф (а — Ь) = ф (а) — ф (Ь) = 0' — (У = 0', так что а — 6 ? Кег ср. Для а ? Кег ср, с ? К <р (от) == ср(а) ф (с) = 0' • ф (с) — О7 и ц>(са) = 0\ поэтому ас, шбКегф. ^ Предложение 8.5. Пусть К — кольцо, I — идеал в К. Тогда отображение ф: К->КИ, ставящее в соответствие каждому эле- элементу а кольца К содержащий его смежный класс а +1, является сюръективным гомоморфизмом колец, ядро которого совпадает с I. > Пусть а, Ь — произвольные элементы кольца /(. Рассмотрим образы их суммы и произведения: Ф(а + й) = (а + 6) + / = (a-f /) + F + /) = Ф(а) (в первом случае использовано определение сложения смежных клас- классов, во втором — определение их умножения). Доказано, что ф — го- гомоморфизм колец. Сюръективность ф очевидна. Рассмотрим его ядро. Элемент а ? Кег ф, если и только если Ф (а) — нуль кольца К/1, т. е. ф (а) = /. Поэтому равенство а-\-1 —• I необходимо и достаточно для а^Кегф. Но это равенство равносиль- равносильно условию а 6/. Итак, Кегф=/. <4 Эти два предложения выясняют роль идеалов кольца: идеалы кольца — это ядра всех его гомоморфизмов. Так же, как в случае групп, по ядру можно судить об инъективности этого гомоморфизма. Предложение 8-6> Пусть y\K->Kf—гомоморфизм кольца К в кольцо К'', a, b ?К. Равенство ф (а) =-- ф (Ь) верно только тогда, когда а и b входят в один смежный класс по Кегф. Следователь- Следовательно, условие Кегф={0} необходимо и достаточно для инъектив- инъективности ф. ^> Равенство ф (а) = ф F) равносильно тому, что ф (а) — ф ф) — = ф (а — Ь) = Q' — нуль кольца К', т. е, а — б^Кегф. Последнее означает а^б+Кегф. ^ Теорема 8S (теорема о гомоморфизмах колец)* Если ф : К->- Кг —произвольный гомоморфизм кольца К в кольцо К'', то ф(/С)^ / ф !> Рассмотрим К и К' как группы относительно сложения. Тог- Тогда ф станет гомоморфизмом этих групп, Кегф — ядром этого гомо- гомоморфизма. Мы уже знаем (теорема о гомоморфизмах групп), что отображение / ставящее в соответствие каждому смежному классу а + Кег ф эле- элемент Ф(я)?ф(#), является изморфизмом групп. Остается доказать, что i|) сохраняет произведение, т. е. что -ф ((а + Кег ф) ф + Кег Ф)) = -ф (а + Кег ф) гр ф + Кег ф). A) Но (а + Кег ф) F + Кег ф) = (ab + Кег ф), откуда и следует ра- равенство A): -ф ((а + Кег ср) ф + Кег ф)) = -ф (ab + Кег ф) = ф (ab) - - Ф (а) Ф ф) = (гр (а + Кег Ф)) (г|) ф + Кег Ф)). Здесь использовано то, что ф сохраняет произведение. ^ 137
9. МНОГОЧЛЕНЫ ОТ ОДНОЙ ПЕРЕМЕННОЙ В этой главе мы начинаем изучать алгебру многочленов. Основ- Основные вопросы, которые здесь возникают, связаны с исследованием корней алгебраического уравнения произвольной степени. Теория многочленов — та область алгебры, где естественность основных понятий и задач сочетается с глубиной и силой развивае- развиваемых методов. Напомним, что теория групп возникла при решении некоторых задач, связанных с алгебраическими уравнениями. 9.1. Кольцо многочленов от одной переменной Пусть К — произвольное коммутативное кольцо с единицей 1, Р — некоторое его подкольцо, содержащее 1. Для любого 1? К обозначим символом Р [t] пересечение всех подколец из К, содержа- содержащих одновременно Р и /. Ясно, что Р |У] — наименьшее подкольцо в /С, содержащее Put. Очевидно, любой элемент / @ = оо -Ь aj + a2t* + ... Ч- ant\ A) где at^P; n — целое ^0, должен принадлежать P[t]. Если является еще одним элементом такого вида, то из свойств сложения и умножения в кольце К следует, что сумма f(t)+g(t) и произве- произведение f(t)g(t) этих элементов могут быть записаны в таком же виде. Действительно, если n^k, то f(t) + g (t) =co + Clt + c2t* + ...+ cnt\ B) где ct= at + bh i = 0, 1, ..., п. При этом подразумевается, что если i > k9 то bt = 0. Далее f if) ё @ = d0 + d±t + d2t* + ...+ dn+tfn+k, C) где dl= 2 apu * = 0, 1, ..., n + k. Например, d2 = a2b0 + axbx + + aob2. Таким образом, множество элементов кольца К вида A) образу- образует подкольцо /С, содержащееся в P[t]9 и, очевидно, включает Р и t. Так как Р [t] — минимальное подкольцо с таким свойством, то При этом вовсе не обязательно, чтобы каждый элемент P[t] запи- записывался в виде A) однозначно. Например, если К = R, Р = Z и t = V~2, то t* = 2t. Хотя подкольцо Р [t] может существенно меняться при измене- изменении 16 К, однако у всех этих колец есть нечто общее, связанное прежде всего с формулами B) и C). Кольцо многочленов и появ- появляется на пути выделения этого общего. 138
Пусть Р — произвольное коммутативное кольцо с единицей. На- Наряду с элементами этого кольца будем рассматривать символ х, ко- который назовем неизвестным (переменным), а также степени неиз- неизвестного: х1 = х, х2, ..., хп. Как обычно, положим я0 = 1. Определение 9.1. Многочленом (полиномом) над кольцом Р называется выражение вида а0 + ахх + а2х2 + ...+ апхп, D) где at?P. Элементы aOj alf ..., ап называются коэффициентами этого многочлена. Для сокращенного обозначения многочленов будем использовать символы f(x), g(x), ф(х) и т. д. Будем говорить, что миогочл.н D) имеет степень k@^k^n)y если его коэффициент ak при xk отличен от нуля, а коэффигиенты при более высоких степенях х, если они вообще есть, равны нулю. Элемент ak называется старшим коэффициентом данного много- многочлена. По этому определению каждому многочлену можно приписать степень, за исключением того случая, когда все его коэффициенты равны нулю. Такой многочлен называется нулевым. Два многочлена f(x) и g(x) считаются равными, f(x)=g(x)f тогда и только тогда, когда они либо оба нулевые, либо имеют одинаковую .степень пу причем коэффициенты f (х) и g(x) при одних и тех же степенях неизвестного, меньших или равных п, совпадают. Множество всех многочленов над кольцом Р будем обозначать символом Р[х]. Формулы B) и C) подсказывают, каким образом мож- можно было бы ввести на множестве Р[х] операции сложения и умно- умножения. Пусть /(х) = ао + агх + ... + апхпу g(x) = bo + bxx +... + bkxk — два произвольных многочлена над кольцом Р, n^k. Суммой многочленов f (х) и g (х) называется многочлен / (*) -tg(x) = co + cxx-\' ...+ спхп, E) где Cj = aj + &j, i = 0, 1, ..., п. Предполагается, что если i>&, то bt = 0. Произведением многочленов f (х) и g(x) называется многочлен = do + dxx+... + dn+k xn+\ F) где dt= 2 «А» ^' = 0, 1, ..., n + k. Из формул E) и F) видно, что результат сложения или умно- умножения двух многочленов не изменится, если заменить исходные многочлены равными им многочленами. Как и следовало ожидать, справедлива следующая Теорема 9.1. Множество Р [х] есть коммутативное кольцо с единицей относительно сложения и умножения многочленов. >> Проверим сначала, что Р[х] есть группа по сложению. Дей- Действительно, сложение многочленов является алгебраической опера- 139
цией на множестве Р[х]у так как если f(x), g(x)?P[x], то и /(*) + +g(x) есть многочлен над кольцом Р. Эта операция ассоциативна, т. е. [/(*) + g(x)] + Ф (х) = /(*) + [g(x) + Ф (х)] для любых f(x), g(x), <p(x)?P[x], потому что сложение многочле- многочленов сводится к сложению их соответствующих коэффициентов, а операция сложения в кольце Р ассоциативна. Роль нулевого элемента в Р[х] играет нулевой многочлен, т. е. 0 = 0 + 0*+ ... + 0хп, и для каждого / (х) = а0 + %*;+... 4- апхп противоположным будет - / (х) =- (-а0) + (- а,) х + ... 4 (-ап)х\ Наконец, сложение многочленов коммутативно, т. е. / (х) + g (х) = = g(x)-\-f(x) для любых f(x)9 g(x)?P[x]. Это следует из комму- коммутативности сложения в кольце Р. Операция умножения многочленов тоже есть алгебраическая опе- операция на множестве Р[х]. Произведение двух многочленов над коль- кольцом Р является многочленом с коэффициентами из Р. Тот факт, что умножение многочленов коммутативно, т. е. f{x)g(x) = g(x)f(x) для любых f(x), g(x)?P[x]f следует из комму- коммутативности умножения в кольце Р и полной симметрии, с которой f(x) и g(x) входят в формулу F). Ассоциативность умножения многочленов менее очевидна. Пусть многочлены f(x), g(x) и ф (х) имеют соответственно коэф- коэффициенты ah bt и cL. Покажем, что lf(x)g(x)]<p(x) = f(x)[g{x)<p{x)]. G) Для этого сравним коэффициенты щ и Р/ при х1 в левой и правой частях равенства G). Если через &ь и еь обозначить соответственно коэффициенты многочленов f(x)g(x) и ^(*)ф(*), то Но 3 s+k=j S ' s+k=l откуда Так как обозначение индексов суммирования произвольно, то ясно, что а/ = рг- . Это доказывает G). Сложение и умножение многочленов связано законом дистрибу- дистрибутивности для любых f(x)t g(x)t 140
Действительно, коэффициентом при х1 в многочлене / (х) [g (x) 4- + Ф (х)] служит элемент 2 M&i + c,), а в многочлене / (х) g (х) + / (я) ф (л:) — равный ему элемент Итак, доказано, что Р [х] есть коммутативное кольцо. Еденицей в этом кольце является многочлен 1 = 1 +0х+ ... + 0хп. <$ Определение 9.2. Кольцо Р[х] называется кольцом много- многочленов над Р от одной переменной х. Коэффициент а0 многочлена f(x) = а0 + ахх + ... + апхп называ- называется свободным членом этого многочлена. Если степень f(x) равна нулю, то f(x) = а0. Всякий ненулевой элемент из Р можно рассматривать как много- многочлен нулевой степени над Р, и наоборот. Элемент 0 ? Р можно счи- считать нулевым многочленом из Р[х]. При этом сумма и произведение tfo> Ьо 6 Р как элементов кольца Р, очевидно, совпадают соответствен- соответственно с их суммой и произведением как многочленов из кольца Р[х]. Поэтому можно считать, что Р содержится в Р[ х] как подкольцо. Рассматривая х как многочлен первой степени 0 + 1-х из Р[х]9 п можно проверить, что всякий многочлен / (х) = 2 щх1 равен сумме многочленов atx\ каждый из которых есть произведение многочлена а-ь на i-ю степень многочлена х. Сравнивая формулы B) и C) с формулами E) и F) и опираясь на условие равенства двух многочленов, получаем следующую важ- важную теорему. Теорема 9.2- Пусть К — произвольное коммутативное кольцо с единицей, содержащее Р в качестве подкольца. И пусть t — про- произвольный элемент /С. Если в кольце Р [х] справедливы равенства V(x) = f(x) + g(x) и то <P(t) = fV)+g(t) и Отметим, что обратное утверждение к теореме 9.2 неверно (объ- (объясните, почему). Сделаем несколько замечаний о степенях суммы и произведения двух многочленов. Везде в дальнейшем степень ненулевого многочлена f(x) будем обозначать символом degf(x). Пусть / (х), g(x)eP [х] и degf (x) = /г, degg (x) = ky n^k. Тогда из формулы E) видно, что deg (f(x) +g(x)) ^п> т. е. deg (/(x) + g(x))<max (deg/(x), degg(x)). Случайно может оказаться, что deg (f(x)+g(x))<in. 141
Что касается произведения f(x)g(x), то из формулы F) следу- следует, что deg f(x)g(x) ^ п + k- При этом коэффициент произведения при xn+k равен произведению старших коэффициентов f(x) и g(x): dn+k = 2 api = a A» an Ф О, 6Л ^ 0. Равенство d^ = 0 означает, что ап и bk есть делители нуля в коль- кольце Р. Поэтому, если Р — кольцо без делителей нуля (например, поле), то dn+k^O и, значит, (х) g (x) = deg / (х) + deg g (x), т. е. степень произведения многочленов равна сумме степеней сомно- сомножителей. В этом случае Р[х] тоже является кольцом без делителей нуля. Условимся вместо записи ... + апхп употреблять, где это будет удобно, аналогичную запись по убываю- убывающим степеням неизвестного: f(x) = anxn + ... + a1x-\-a0. 9.2. Деление с остатком в кольце многочленов. Наибольший общий делитель В дальнейшем будем рассматривать кольца многочленов над по- полями. Большинство результатов о целых числах (см. главу 1) было получено на основе теоремы о делении с остатком. Оказывается, аналогичная теорема справедлива и в кольце Р[х], если Р — поле. Это обстоятельство является первопричиной замечательной аналогии между кольцами Z и Р[х]. Теорема 9-3 (теорема о делении с остатком). Пусть Р — произвольное поле. Для любых двух многочленов f (x), g(x)?P [x], g(x)^§ существуют многочлены q(x)t r(x)?P[x], такие, что f(x) = g(x)q(x) + r(x) A) и degr(x)<^ degg(x) или же г(х) = 0. Многочлены q(x) и г(х), удовлетворяющие этому условию, определены однозначно. ^ Докажем сначала, что q (x) и г (х) определены однозначно. Пусть наряду с равенством A) f(x) представим в виде + 7(x), B) где <7(*), 7(х)?Р[х], deg7(x)<degg(x) либо 7(х) = 0. Сравнивая A) и B), получаем g(x)[q(x)-t(x)]=7(x)-r(x). C) Если бы q(x) — q(x)^0y толевая часть равенства C) была бы многочленом степени не ниже degg(x). В то же время правая часть 142
соотношения C) есть многочлен, степень которого меньше degg"(;t). Полученное противоречие означает, что q(x) = q(x). Тогда из ра- равенства C) вытекает г(х) — г(х). Переходим к доказательству существования представления A). Если f(x) = 0, то равенство A) выполняется при q(x) = г(х) = 0. Будем считать, что / (х) Ф 0, и пусть deg f(x) = n, degg(x) = k, так что / (х) = апхп + .- + ахх + а0, ап ф 0, Применим индукцию по п. Пусть п = 0. Если и k = 0, то / (х) = = ^о» ёг(л:) =^ &о^ и в качестве ^(х) и r(x) можно взять q(x) = -^-, г(х) = 0. Если же А^=0, то A) справедливо при q(x) = Oy r(x) = Пусть д > 0. Предположим, что утверждение теоремы справед- справедливо "для всех /(х), степень которых < п. Если п < ky то в этом случае можно взять <7М = 0, г(*) = /(-^). Рассмотрим случай n^k. Очевидно, старший коэффициент многочлена -^- ^Л-^ (х) совпадает со старшим коэффициентом f(x), поэтому разность имеет степень, меньшую степени многочлена f(x), т. е. degf1(x)<^n. Поэтому к fx (x) можно применить предположение индукции. Най- Найдутся многочлены q(x), r(x)?P[x]y такие, что и degA-(x)<degg(A;) или г(х) = 0. Из равенства D) получаем не- необходимое представление f (х): f(x) = -%- x?-*g (x) + fx (x) = -2- х"-ь g (x) + [g (xfq (x) + 7 (x)]= т.е. </(х) = у^ + ?М,гМ = '"D Ясно, что q(x) и г(л;) принадлежат Р[х]. <4 Многочлен q(x) называется частным от деления f (х) на g(x), г(х) — остатком от этого деления. Деление с остатком для конкретных многочленов f(x) и g(x) проводится в полном соответствии с доказательством теоремы 9.3. Разница лишь в том, что предположение индукции заменяется ко- конечным числом повторений индуктивного перехода (от / к Д). Пример 9.1. Пусть P = Q. Разделить с остатком / (х) = х3 — 2х2 — Зл: 4- 1 Hag(x)=x*+1. 143
Решение. Получаем д;3 _ 2x2 _ ЗХ + 1 I X2 + 1 — 2х2 — 4л: + 1 * "" Z — 2л:2 — 2 — 4JC-+ 3- Таким образом, / (х) = g (х) (х — 2) + (— 4л: + 3), т. е. q (х) = л: — 2, г (*) = = — 4л:+ 3. В дальнейшем многочлены, если не оговорено противное, рас- рассматриваются над фиксированным полем Р. Определение 9.3. Будем говорить, что многочлен g(x) де- делит многочлен f(x), или что f(x) делится на g(x), если g(x)=^0, и при делении f(x) на g(x) остаток равен нулю. Предложение 9.1- Многочлен g (x) тогда и только тогда яв- является делителем многочлена f (x), когда g{x)=^0 и существует многочлен ц>(х), для которого f(x) = g(xL(x). E) ^ Если g(x) есть делитель f(x), то в качестве ор(х) можно взять частное от деления f(x) на g(x). Обратно, пусть ц(х) удовлетворяет равенству E). Переписав это представление в виде и воспользовавшись теоремой о делении с остатком, заключаем, что Ф (х) — частное, а 0 — остаток при делении / (х) на g (x). ^ Укажем простейшие свойства делимости многочленов: 1) если f (х) делится на g {x), a g (x) делится на ф (х), то f (x) делится на ф (х). По условию f{x) = g(x)h(x) и g (х) = ф (х) г|) (х)у откуда /(*) = (){)h{)] 2) если многочлены f (х) и g(x) делятся на ф(х), то их сумма и разность тоже делятся на у(х). Так как / (х) = ср (х) h(x) и g (х) = ф (дс) -ф (х), то / (х) ± g (х) = = ф(х) [h(x) ± я|э(лО]; 3) если fi(x), ..., fk{x) делятся на <$(х), то на ф(х) будет де- делиться и многочлен где gi{x)y ..., gk{x) — произвольные многочлены. Это свойство вы- вытекает из первого и второго свойств; 4) всякий многочлен f(x) делится на любой многочлен нулевой степени. Если а?Я, афО, то f (х) = a[a~l f (х)]; 5) если f(x) делится на g{x), то f(x) делится и на ag(x), а^Р, афО. По условию f{x) = g (x) h (х), откуда / (х) = [ag (x)] [a~l h {x)]\ 6) многочлены f(x) и g(x) делят друг друга тогда и только тогда, когда они ненулевые и g (x) = af (x) при некотором а?Р. 144
Пусть f(x) и g (х) делят друг друга. Так как g(x) = f (x) ф (х) и degg{x) = deg / (x) + deg ф (дс), то deg g (дс) < deg / (х). Точно так же, deg / (х) ^ deg g (x) и, значит, степени многочленов f (х) и g(;t) совпадают. Отсюда следует, что degф (х) = 0, ф (х) = а?Р и g(x) = = af{x). Обратно, если многочлены f (х) и g(x) ненулевые и g(x) = af (x)% а?Р, то f(x) делит g(x). Так как а^=0, то f(x) = a~lg(x)y т. е. g(x) делит f(x). Из предыдущих свойств вытекает следующее свойство: 7) всякий делитель одного из многочленов f (х) и af (x), где а?Р и афО, является делителем другого многочлена. Определение 9.4. Многочлен d(x) называется общим дели- делителем многочленов f (х) и g(x), если он является делителем каж- каждого из них. Так как всякий многочлен делится на любой отличный от нуля элемент поля Р, то среди общих делителей f(x) и g(x) всегда бу- будут многочлены нулевой степени. Если другие общие делители от- отсутствуют, то f (х) и g(x) называются взаимно простыми многочле- многочленами. Отметим еще, что, согласно пятому свойству, если d(x) есть об- общий делитель многочленов f (х) и g{x), то таковым же является и любой многочлен вида ad(x)y где а ?Р и а=^=0. Естественно было бы, имея в виду теорию целых чисел, опреде- определить наибольший общий делитель двух многочленов как их общий делитель наивысшей степени. Однако возникает сомнение, не будет ли таких делителей слишком много, так как совпадение степеней двух многочленов вовсе не означает, что они отличаются лишь мно- множителем из поля Р. В главе 1 было доказано, что НОД двух целых чисел делится на любой другой их общий делитель. Это делает естественным сле- следующее Определение 9.5. Наибольшим общим делителем (НОД) двух ненулевых многочленов f(x) и g(x) называется их об- общий делитель, который делится на любой другой общий делитель этих многочленов. Предложение 9.2- Если НОД многочленов f(x) и g(x) сущест- существует, то он определен с точностью до умножения на любой нену- ненулевой элемент поля Р. ^ Если dx (x) и d2 (x) — наибольшие общие делители многочле- многочленов f (х) и g(x), то, согласно определению НОД, они делят друг друга. Поэтому d2 (х) == adx (х) при некотором а ? Р. Пусть теперь b — произвольный элемент Р, отличный от нуля. Как и d1(x)i многочлен bdx(x) есть общий делитель /(х) и g{x). В то же время любой общий делитель / (х) и g (x) делит dx (x)> а поэтому и bdx (x). Следовательно, bdx (x) является НОД многочле- многочленов f(x) и g(x). ^ Можно добиться полной однозначности НОД, потребовав допол- дополнительно, чтобы его старший коэффициент был равен единице. Од- Однако пока в этом нет необходимости. 145
,(x)qs(x) + r3(x), fn-i\x)gn'(x) + rn\x), Рассмотрим вопрос о существовании НОД двух многочленов. В главе 1 мы познакомились с методом вычисления НОД двух це- целых чисел с помощью алгоритма Евклида, который опирается на теорему о делении с остатком. Так как для многочленов нами до- доказана аналогичная теорема, то можно рассмотреть алгоритм Евкли- Евклида в кольце Р [х]. Лемма 9.1. Если f(x) = g (x) q (х) + г (х), то многочлены f (x), g(x) имеют те же общие делители, что и многочлены g(x), г(х). <4 Пусть d(x) — общий делитель f (х) и g(x). Так как г(х) = = f(x) — g(x)q(x), то d(x) делит г(х) и, следовательно, есть общий делитель g(x) и г(х). Аналогично всякий общий делитель g(x) и г (х) является общим делителем f (х) и g(x).<4 Пусть f(x) и g(x) — два ненулевых многочлена. Если ^(л:) де- делит /(х), то g(x) является их НОД. Будем считать поэтому, что f (х) не делится на g(x). Применяя несколько раз теорему о деле- делении с остатком, получаем ряд равенств: F) где deg g (x) > deg rx (x) > deg r2 (x) > ... > deg rn (x) > 0. Ряд F) заканчивается, как только некоторое /vh = 0- Так как степени остатков все время понижаются, то через конечное число шагов получаем остаток, равный нулю. Рассматривая равенства F) (сверху вниз), можно на основании леммы 9.1 заключить, что пары многочленов f(x), g(x)\ g(x), гг(х)\ гг(х)у г2(х); ...; rn-i(x), rn(x); гп(х), 0 имеют одни и те же общие делители. Следовательно, общие дели- делители многочленов f(x) и g(x) совпадают с делителями многочлена гп (х) — последнего отличного от нуля остатка в алгоритме Евклида. Но это означает, что гп(х) есть общий делитель f(x) и g(x) и де- делится на любой другой общий делитель f(x) и g(x), т. е. есть НОД многочленов f (х) и g(x). Нами доказана следующая Теорема 9.4. Наибольший общий делитель любых двух ненуле- ненулевых многочленов f (х) и g(x) всегда существует. Он равен послед- последнему отличному от нуля остатку в алгоритме Евклида F), если g(x) не делит f(x), и совпадает с g(x) в противном случае. Условимся теперь, что если d(x) есть НОД многочленов f(x) и g(x), то его старший коэффициент будет всегда считаться равным единице. Тем самым d(x) будет определен однозначно, и записыва- записываем d(x) = НОД (f(x), g(x)) ,по аналогии с обозначением НОД це- целых чисел. Очевидно, многочлены / (х) и g (x) взаимно просты тогда и толь- только тогда, когда НОД (f(x), g(x))= 1. 146
Пример 9.2. Пусть Р = Q, / (х) = х3 — 1, g (л:) = х2 + 1. Найти НОД / (х) Решение. Получаем х3 — 1 | х2 -f- 1 х3 — 1 = (х2 + 1) х -j- (—л: — 1), + 1 = (—х— \){—х+ 1) + 2, у 11 Л 1 | х —1 —1 Л2- Л*2 - —X - 1 г 1 Ь х -1 -1 2 с — 1 1 2 л-3 + —X — ¦и 1 —X -f- X 1 1 X О Мы видим, что последний отличный от нуля остаток 2 в данном алгоритме Евклида имеет нулевую степень, и поэтому НОД (х3— 1, л:2 + 1) = 1, т.е. f (х) и g (x) — взаимно простые многочлены. Замечание. Применяя алгоритм Евклида к многочленам с целыми коэф- коэффициентами, мы, вообще говоря, будем производить действия с многочленами, коэффициенты которых есть рациональные дроби. Обычно это приводит к гро- громоздким вычислениям. Однако этого можно избежать, если воспользоваться сле- следующими двумя наблюдениями: 1) если записать алгоритм Евклида в столбик (см. пример 9.2), то, начиная с любого места, мы получим алгоритм Евклида для соответствующих многочленов (разумеется, с тем же самым НОД, что и в исходном алгоритме); 2) из седьмого свойства делимости следует, что для любых ненулевых эле- элементов a, b ? Р НОД (f(x), ?(*)) = НОД (af(x), bg(x)). Чтобы избежать появления в алгоритме Евклида дробных коэффициентов, можно умножить любое делимое или сократить любой делитель на произвольное целое число. Эти действия можно выполнять, не только начиная какое-либо из последовательных делений по общей схеме алгоритма, но и в процессе каждого такого деления, что не исказит искомый НОД. Пример 9.3. Найти НОД многочленов / (х) =х3 — х2 + 3х— 10, g (х) = х3 + 6х2 — 9х — 14 с целыми коэффициентами. Решение. Находим хз _ Х2 + зх — 10 | х3 -f 6х2 — 9х ~ 14 хз + QX2 _ 9л; — 14~ хз + б*2 — 9х — 14 | — 7*2 + 12* + 4 х + 54 - 7*3 — 42х2 + 63л: + 98 - 7л:3 -\- 12л:2 -|™ 4л: (после умножения на — 7); ~54л:2 + 59л: + 98 - 378л:2 + 413л:+686 - 378л:2 -f- 648л: + 216 (после умножения на 7); — 235л: + 470 14/
Сокращаем на 235: —7л;2 + 12* + 4 | —л: 4-2 2 4 — 2л:+ 4 — 2л: + 4 Итак, (—л: -f- 2) — последний отличный от нуля остаток в данном алгоритме Евклида. Следовательно, НОД (/ (a:), g (х)) — х — 2. При изучении целых чисел мы вывели из алгоритма Евклида (см. главу 1), что если d = НОД (а, Ь), то d = ak + bs при некоторых A, s ? Z. Этот факт нашел применение при доказательстве ряда тео- теорем принципиального характера, таких, например, как основная тео- теорема арифметики или основная теорема об абелевых группах. Ана- Аналогичное утверждение справедливо и в кольце Р[х], причем здесь оно играет столь же важную роль. Теорема 9.5. Пусть d(x) = НОД (/(#), g(x)). Тогда существу- существуют такие многочлены ср (х) и л|э (х), что . G) > Если f(x) делится на g(x), то для некоторого = ag (x) и справедливо равенство Поэтому будем считать, что f (х) не делится на g(x), и проведем доказательство существования представления G) индукцией по чис- числу п отличных от нуля остатков в алгоритме Евклида F). Так как d (x) может отличаться от гп (х) лишь некоторым множителем а из поля Я, то достаточно доказать существование многочленов ср (х) и i|)(x), таких, что гп (х) == f (х) ф (х) + g(x) -ф (х), откуда будет следовать нужное представление d(x): d (x) = arn (х) = / (х) [аФ (х)] + ^ W И> W]. Пусть л==1. Тогда гх (л:) — /(л:) — g(x)q1(x)9 т. е. ф (х) == 1, tty(x) = —q1(x). Предположим, что утверждение теоремы справедливо для (п— 1), и докажем его для п. Если в F) зачеркнуть первое равенство, то оставшийся ряд равенств можно рассматривать как алгоритм Евкли- Евклида для многочленов ?(л;) и гг(х), содержащих (п—1) ненулевых остатков. По предположению индукции I (8) при подходящих многочленах ф(х) и ty(x). Из первого равенства F) выражаем г1(х) через f(x) и g(x): r1(x) = f(x)-g(x)q1(x). (9) 148
Формулы (8) и (9) позволяют получить искомое представление гп(х): Гп {х) = g (х)у(х) + [f (x)— g (x) qx (х)]у (х) = = / (*) Ч> (х) + g (х) [ф (х)- qx (х) у (х)}, т. е. ф (х) = f (х), Ч> (х) = ф"(х) — ft jT Пример 9.4. Пусть Р = Q. Найдем многочлены ф (х) и ij) (х), удовлетворяю- удовлетворяющие равенству G) при / (х) = х3 — 1, g (х) = х2 + 1. Алгоритм Евклида уже применялся к / (х) и g (x) в примере 9.3: f(x)=g(x)x+(-x-l), ) (-x-l) (-x+l)-f 2, -x-l=2/-x- \ 2 2 отсюда НОД (/(*), ^д:)) = L Найдем сначала ф (х) и я]з(х), при которых Из второго равенства алгоритма Евклида выражаем число 2 через g (х) и (—л: — 1): 2 = g(x) + (-x-l) (х-~\). A0) Из первого равенства этого алгоритма выражаем (—х— 1) через / (х) и g(x): -x-l=f{x)-g(x)x. (И) Из соотношений A0) и A1) получим нужное выражение числа 2 через f (х) и?(л;): 2 = g(x) + U(x)-g(x)x](x-l)=f(x)(x-l)+g(x)[\-x(x-l)] или 2 = f(x) (x-\)+g(x) (_да + *+1). A2) Умножая левую и правую части равенства A2) на 1/2, получаем искомое выраже- выражение единицы через f (х) и g(x): Теорема 9.6 (критерий взаимной простоты)» Многочлены f (х) и g(x) взаимно просты тогда и только тогда, когда сущест- существуют многочлены q(x) и ty(x), такие, что 1- A3) ^ Если f(x) и g(x) взаимно просты, то НОД(/(л'), g(x))= 1, и существование нужных ср(#) и ty(x) следует из теоремы 9.5. Если же имеет место равенство A3), то всякий общий делитель f(x) и S(x) должен делить 1, и поэтому он имеет нулевую степень. Это означает взаимную простоту f(x) и g(x). Ц Важным следствием теоремы 9.6 является Теорема 9.7. Если произведение многочленов f(x)g(x) делится на многочлен h(x), причем f(x) и h(x) взаимно просты, то g(x) делится на h(x). > Так как f(x) и h(x) взаимно просты, то, согласно теоре- теореме 9.6, 149
при подходящих многочленах ср (х) и ty(x). Умножим левую и пра- правую части этого равенства на g(x): [/ (x)g(x)] ф (х) + h (x) №(x)g(x)] = g (x). A4) По условию произведение f(x)g(x) делится на h(x), поэтому из A4) вытекает, что и g(x) делится на h{x). ^ Понятие наибольшего общего делителя легко распространяется на случай любой конечной системы ненулевых многочленов. Много- Многочлен d(x) называется наибольшим общим делителем (НОД) много- многочленов /i(x), /2 (#),..-, fk{x), если он является общим делителем этих многочленов и делится на любой другой их общий делитель. Как и в случае k = 2, d (x) определен с точностью до ненулевых множителей из поля Р. Поэтому можно потребовать, чтобы его старший коэффициент был равен единице. Следующая теорема доказывает существование d (x) и дает спо- способ его вычисления. Теорема 9.8. Пусть f±(x), /2(*)> •••> fk(x)— произвольная си- система ненулевых многочленов и пусть d2(x) - НОД(Мх), (Ы*)). ds(x) = НОД (d2(x), fs(x)), ..., dk (x) - = НОД D-i (*), fk (x)). Тогда d^ (x) есть НОД этой системы. > Применим индукцию по k. Справедливость теоремы для k = 2 очевидна. Будем считать, что она верна и для системы из (k—1) многочлена, так что dk-{ есть НОД системы Д (х), ..., fk-x (x). Так как dk (х) является общим делителем dk—\ (х) и fk (x)> a dk-\(x) в свою очередь делит каждый многочлен /х(х),..., /&-i (x)> то dk(x) есть общий делитель f1(x)t ..., fk (x). С другой стороны, каждый общий делитель этих многочленов должен делить dk—\ (x), а поэтому и dk (x). ^ Замечание. До сих пор мы рассматривали многочлены над фиксированным полем Р. Предположим теперь, что Р есть подполе некоторого поля Р, Р си Р (например, Р = Q, Р = R). Тогда Р [х] есть подкольцо кольца Р [х], Р [х] сг Р[х]у так что всякий многочлен над полем Р можно рассматривать как многочлен над полем Р, Пусть f(x), g(x) ? Р[х] и, следовательно, /(*), g (х) 6 Р [х]. Многочле- Многочлены f (х) и ?(лг) могут иметь над полем Р общие делители, которых у них нет над полем Р. Например, х2 — 2 и (х2 — 2J имеют над полем R общий делитель х + + V1T, так как х* — 2 = (х + У"Т) (х — V"T), но л: + ]/"Т" не .принадле- .принадлежит Q[x]. Поэтому возникает вопрос, не будет ли НОД / (л:) и ?(лг) зависеть от того, над каким полем мы рассматриваем эти многочлены, т.е. не является ли понятие НОД многочленов понятием относительным. Легко видеть, однако, что алгоритм Евклида, с помощью которого ищется НОД данных многочленов, будет одинаковым над любым полем. Следовательно, НОД многочленов f (х) и g (x) не зависит от выбора поля. Упражнения 1. Докажите, что кольцо Р [х] есть кольцо главных идеалов (см. пример 8.9). 2. Приведите пример многочленов f(x), g (x) и h (#), таких, что произведе- произведение f(x) g(x) делится на h(x), но f (х) и g (х) не делятся на h(x). 150
3. Докажите, что если многочлен h (х) взаимно прост с каждым из многочле- многочленов f (х) и g(x), то он взаимно прост и с их произведением. 4. Докажите, что если h (х) делится на / (л:) и g(x), причем / (х) и g (x) взаимно просты, то h (x) делится на произведение f(x)g(x). 9.3. Неприводимые многочлены Пусть / (х) — произвольный многочлен над полем Р, deg / (х) ^ 1. Согласно простейшим свойствам делимости, f(x) делится на любой многочлен нулевой степени, а также на всякий многочлен вида af(x), где а(=Р, а фО. Если многочлен f (х) не имеет других дели- делителей из Р[х], то он называется неприводимым многочленом над полем Р.* Легко видеть, что многочленами вида af(x) исчерпываются дели- делители f(x), степени которых равны степени f(x). Таким образом, многочлен f(x)?P [х] степени п ^ 1 неприводим над полем Р тогда и только тогда, когда из разложения / (х) = ф (х) г|) (л*), где <р(х), ty(x)?P[x], следует, что степень одного из многочленов ф(х), if(x) равна нулю, а другого п. Неприводимые многочлены играют в кольце Р[х] ту же роль, что и простые числа в кольце Z. Многочлен / (л:) называется приводимым над полем Р, если в кольце Р[х] существуют делители f(x), степени которых больше нуля, но меньше степени f(x). Другими словами, многочлен f(x) степени п J> 1 приводим над полем Р тогда и только тогда, когда его можно представить в виде произведения двух многочленов из Р[х], степень каждого из которых меньше п. Замечание. Неприводимость многочлена существенно зависит от поля, над которым он рассматривается, и есть в этом смысле понятие относительное. Если / (х) ? Р [х] и Р содержится в некотором поле Р, то может оказаться, что f (x) неприводим над Р, но приводим над Р. Пример 9.5. Пусть Р = О/Р =Rh f(x) = *2 — 2. Так как f (х) = (х 4- V 2 ) \х— V 2 ), то / (#) есть приводимый много- многочлен над полем R. Предположим, что он приводим и над полем Q. Тогда / (л:) = = Ф (х) ф (х), Ф (х), -ф(*) 6 Q М, причем deg <р (х) < 2 и deg г|? (х) < 2. Это озна- означает, что ф (х) и я|) (лг) есть многочлены первой степени, т. е. <р (х) = ах + Ь, 'ф(х) = сх + d, где а, Ь, с, d?Q. Но тогда f (х) должен иметь рациональные корни х1 = —Ь/а, х2 = —d/c, что неверно, так как у 2 —число иррациональное. Это доказывает неприводимость / (х) над полем Q. Нам понадобятся следующие свойства неприводимых многочленов над произвольным полем Р: 1) всякий многочлен первой степени неприводим. Если бы какой-нибудь многочлен первой степени оказался при- приводимым, то его можно было бы представить в виде произведения двух многочленов, степени которых меньше единицы, т. е. равны нулю. Но произведение таких многочленов есть многочлен нулевой степени; 2) если многочлен f (x) неприводим, то и af (x), а?Р, афО, тоже есть неприводимый многочлен. 151
Если бы af (х) был приводим, то #/(#) = ф (х) ф (я), degq>(x) и deg -ф (х) < deg af (х), откуда / (х) = Г— <р (хI -ф (*), deg — ф (я) L a J « и dego|>(x)<deg/(x); 3) если f (х) — неприводимый многочлен над Р, то для любого многочлена g(x)?P [х] либо f(x) и g (x) взаимно просты, либо f (x) делит g(x). Пусть d (х) = НОД (/ (х), g(x)). Так как d(x) делит f(x), то из неприводимости / (х) следует, что либо deg d (х) ~ О, либо d (х) = = af(x), а?Р, афО. В первом случае d(x)= 1, т. е. f (х) и g(x) взаимно просты. Во втором случае }(х) делит g(x)\ 4) если произведение многочленов f(x)g(x) делится на неприво- неприводимый многочлен h(x), то хотя бы один из сомножителей делится на h(x). Если f(x) не делится на h(x), то, согласно третьему свойству, f (х) и h(x) взаимно просты. Из теоремы 9.7 теперь следует, что g(x) делится на h(x). Из четвертого свойства легко вывести ана- аналогичное утверждение для любого числа сомножителей. Следующая теорема является аналогом теоремы 1.7 (основной теоремы арифметики). Теорема 9.9. Всякий многочлен f (х) над полем Р степени п ^ i можно представить в виде произведения неприводимых над Р мно- многочленов. Если имеются два таких разложения f(x) = Ф1(*)Ф2(*) ••• ФЛ*) = Ы*) ^2 (х)... %(х), A) то s = k и при подходящей нумерации множителей Ых) = ам(х), i = 1. 2, ..., 5, B) где at — ненулевые элементы поля Р. Другими словами, разложение многочлена на неприводимые множители определено однозначно с точностью до множителей нулевой степени. > Если f{x) неприводим, то первое утверждение теоремы оче- очевидно. Если f (х) приводим, то его можно представить в виде про- произведения двух многочленов степени, меньшей п. Если они непри- водимы, то мы получим искомое разложение. Если же среди этих многочленов есть приводимые, представляем их в виде произведения многочленов меньшей степени и т. д. Этот процесс оборвется через конечное число шагов, так как сумма степеней сомножителей долж- должна быть равна я, а степень каждого сомножителя не меньше 1. Докажем теперь однозначность разложения на неприводимые множители. Применим индукцию по степени f(x). Если п = 1, то f(x) неприводим, и любое его разложение на неприводимые множи- множители состоит из самого этого многочлена. Будем считать, что утвер- утверждение теоремы справедливо для любого многочлена, степень кото- которого меньше п. Из равенства A) видно, что многочлен ^(х) делит произведение ФЛ*) ФгС*)' * 'ФЛ*)- Так как он неприводим, то из четвертого свой- свойства следует, что хотя бы один из сомножителей, входящих в это 152
произведение, делится на ^х(х). Учитывая, что нумерация сомножи- сомножителей здесь несущественна, можно считать, что ^(х) делит фх (л:). Но фх (х) — неприводимый многочлен, a deg \рг (х) ^ 1, поэтому tyx (х)= = ai<Pi (х) ПРИ некотором аг ?Р, а2Ф 0. Подставляя в правую часть A) вместо ^(х) произведение а1цI (х) и сокращая полученное равен- равенство на фх (х), получаем Ф2 (х) • • • <ps (х) - [а№ (х)) • • •% (х). C) Обе части равенства C) — многочлены, степени которых меньше п. К таким многочленам можно применить предположение индукции, согласно которому s — 1 = k — 1 или s = k, a^ (x) = а2(р2 (х) или Ц2(х)==(аГ1а2)<р2(х)> 'Ф/W = а^(a:), i = 3, ..., 5. Полагая а2 = = аГ^2, получаем равенство B). <4 Мы добьемся полной однозначности разложения /(#) на непри- неприводимые множители, если из каждого такого множителя вынесем его старший коэффициент. В результате получается разложение P2{x)---ps{x)> D) где все pt (x) — неприводимые многочлены со старшим коэффициен- коэффициентом, равным 1. Очевидно, а совпадает со старшим коэффициентом fix). Если неприводимый многочлен р(х) встречается в разложении D) несколько раз, то он называется кратным множителем для f(x). Если р(х) встречается в разложении D) ровно k раз (&^>2), то бу- будем называть его k-кратыым множителем. Наконец, р(х) называ- называется простым (однократным) множителем для /(#)> если он вхо- входит в разложение D) лишь один раз. Собирая одинаковые неприводимые множители вместе, можно за- записать / (х) в виде f(x) = aft(x)#(x)-..pkt'(x), E) где рь{х)Ф pj{x)9 если 1Ф\. Таким образом, pt(x) есть ^-кратный множитель для f(x)f i= I, 2, ..., t. Разложение E) будем назы- называть каноническим разложением многочлена / (х). Такое разложение оп- определено для f (х) однозначно. Способ определения НОД двух целых чисел по их разложению на простые множители, известный читателю из курса средней шко- школы, подсказывает, как можно было бы найти НОД двух многочле- многочленов, зная их канонические разложения. Теорема 9.10. НОД многочленов f (х) и g (х) степени > 1 ра- равен произведению неприводимых многочленов, одновременно входя- входящих в канонические разложения f (х) и g (x), причем каждый такой многочлен берется в степени, равной меньшей из его кратностей для f (х) и g(x). > Пусть d(x) = НОД (/(*), g(x)). Так как d(x) делит f(x) и g(x)9 то всякий неприводимый множитель, входящий в каноничес- каноническое разложение d(x), будет входить в канонические разложения f(х) и g(x), причем его кратность для d(x) не может превосходить 153
кратности для f (x) и g(x). Это прямо следует из единственности канонического разложения. Ясно поэтому, что d (x) делит указанное в формулировке теоремы произведение. В то же время это произве- произведение является делителем каждого из многочленов f(x), g(x), а по- поэтому и d(x). Но два многочлена, которые делят друг друга, могут отличаться лишь множителем нулевой степени. А так как их стар- старшие коэффициенты равны единице, то имеет место точное равенство.^ Пример 9.6. Пусть многочлены / (х) g (х) имеют следующие канонические раз- разложения : / (х) = <р? (*) Ф* (х) ф| (х), g (х) = ц>1 (х) ф3 (х) Ф^ (х), % (х) г> % (х). Тогда НОД (/ (*), g (х)) = ф| (х) Ъ (х). Заметим, что теорема 9.10 имеет в основном теоретическое значе- значение, так как не существует общего метода разложения многочленов на неприводимые множители. Более того, даже на вопрос о непри- неприводимости данного многочлена над данным полем в настоящее время не имеется исчерпывающего ответа. Общее решение мы получим только для полей действительных и комплексных чисел, ограничив- ограничившись замечаниями частного характера для случая многочленов над полем рациональных чисел. Тем не менее существует простой метод, позволяющий выяснить, имеет ли данный многочлен f(x) кратные множители, и в случае положительного ответа сводящий задачу о разложении f(x) на не- неприводимые множители к аналогичной задаче для некоторого много- многочлена g(x) меньшей степени, уже не содержащего кратных множи- множителей. Этот метод требует, однако, наложить на поле Р одно сущест- существенное ограничение. Будем предполагать, что характеристика поля Р равна нулю. В частности, Р может быть любым числовым полем. Нам понадобится понятие производной многочлена, с которым читатель уже знаком для случая многочленов над полем R. При этом если / (х) = апхп + a*-!*"-1 -f ... + агх -f a0, F) то /' (х) = пап л"-* + (п— 1) ая-1*"-2 +... + а±. G) Простота, с которой совершается переход от / (х) к /' (х), позволяет перенести эту операцию на многочлены над любым полем нулевой характеристики с сохранением основных свойств дифференцирования: (f(x)+g(x)Y = f'(x)+g'{x)> (8) (/ (х) g (х)У =: /' (х) g(x) + f (x) g' (x). (9) При этом если /(x)N—-многочлен вида F), то его производная f (х) есть многочлен над Р (п— 1)-й степени, определяемый формулой G). Заметим, что если бы Р имело положительную характеристику, то могло бы случиться, что пап = 0. Справедливость формул (8) и (9) 154
для любых многочленов над Р проверяется непосредственным вычис- вычислением. Из формулы (9) вытекает формула (/*(*))'==*/*-* (*)/'(*)• Теорема 9.11. Если р(х) — k-кратный неприводимый множитель многочлена f(x), то он является (k— \)-кратным множителем производной f(х). В частности, если р(х) — простой множитель для f(x), то он не входит е разложение f(x). )> Пусть f(x) = pk(x)g(x), где g(x) не делится на р(х). Диф- Дифференцируя это равенство, получаем Г (х) - [pk (*)]' g (х) + р* (х) g' (х) = Ир*-' (х) р' (х) g (х) + + Pk (x) gf (x) = pk-> (x) [kp' (x) g(x) + p (x) g' (x)]. Покажем, что многочлен cp (x) = kp' (x) g(x) -f p (x) g' (x) не делится на р(х). Это и будет означать, что р(х) есть (k—1)-кратный мно- множитель f (х). Если бы ф (х) делился на р(х), то и многочлен kp/(x)g(x) де- делился бы на р(х). Так как р(х) неприводим, то по четвертому свой- свойству хотя бы один из многочленов kp' (x), g(x) должен был бы де- делиться на р(х), что невозможно, так как g(x) не делится на р(х) по условию, a deg kp' (x) < deg p (x). *4 Из теорем 9.10 и 9.11 непосредственно вытекает Теорема 9.12. Если f(x) = afi(x)pk2'(x)...pkt'(x) есть каноническое разложение многочлена f (х), то НОД / (х) и f (x) имеет следующее каноническое разложение: НОД (/ (х), /' (х)) = ркГх (х) ft~l (x)... pk/ -1 (х). При этом в случае kt = 1 множитель рк.1~х (х) следует заменить единицей, В частности, f(x) не содержит кратных множителей тогда и только тогда, когда он взаимно прост со своей производ- производной. Предположим, что d(x) = НОД (/(*), р(х))Ф1, т. е. /(х) обла- обладает кратными множителями. Из теоремы 9.12 непосредственно вид- видно, что частное g(x) от деления f(x) на d(x) имеет следующее ка- каноническое разложение: = ap1(x)p2(x)---pt(x), и, значит, многочлены f(x) и g(x) имеют одни и те же неприводи- неприводимые множители. В то же время degg(x)< deg/(х) и g(x) не со- содержит кратных множителей. Если неприводимые множители g (x) удается найти, то с помощью алгоритма деления можно определить их кратности в f (х) и получить каноническое разложение f(x). 155
Замечание. Итак, вопрос о существовании кратных множителей многочле- многочлена / (х) ? Р [х] сводится к нахождению НОД(/(#), /' (х)). Пусть Р— расширение поля Р, так что f(x)?P[x]. Ни производная, ни НОД многочленов над Р не за- зависят от того, рассматриваем ли мы эти многочлены над Р или над Р. Следова- Следовательно, если / (х) не имеет кратных множителей над Р, то у него нет кратных множителей и над любым расширением Р поля Р. В частности, неприводимый над Р многочлен / (х) может оказаться приводимым над Р, но кратных множителей над Р он иметь не может, потому что их нет над Р. 9.4. Корни многочленов Пусть / (х) = апхп + ап-\ хп~1 + ... + ахх + а0 есть многочлен над произвольным полем Р. Если с ? Р, то элемент / (с) = ахсп + art_! cn~l + ••• ¦+ агс + а0 поля Р называется значением многочлена f (х) при х = с. Таким образом, каждому элементу с из поля Р можно поставить в соответствие вполне определенный элемент / (с) 6 Р- Это означает, что всякий многочлен f(x)?P [x] задает отображение (функцию) /:Р->Р. При этом если f(x) и g(x) — равные многочлены, то оче- очевидно равенство / (с) = g (с) для любого с 6 Р, т. е. равные много- многочлены определяют равные функции. Из теоремы 9.2 следует, что если Ф М = / М + g (х), Ф (х) = / (х) g (х), то для любых f(x), g(x)?P[x] и любом с 6 Р. Определение 9.6. Элемент с поля Р называется корнем многочлена f(x)?P [х], если f (с) = 0. Следующая важная теорема связывает понятие корня многочлена с понятием делимости многочленов. Теорема 9.13- Элемент с поля Р является корнем многочлена f(x)?P [х] тогда и только тогда, когда f (х) делится на х — с. > Так как х — с есть многочлен первой степени, то остаток от деления f(x) на х — с является многочленом нулевой степени либо равен нулю. В любом случае он является некоторым элементом г поля Р. Поэтому откуда / (с) = (с — с) q(c) + г или / (с) = г. Если с — корень / (х), то / (с) = 0 и г = f (с) = 0. Это означает, что / (х) делится на х — с. Если же f(x) делится на х — с, то г = 0 и f(c) = г = 0, т. е. с — корень f(x). ^ Многочлены первой степени часто называют линейными много- многочленами. Теорема 9.13 показывает, что разыскание корней многочле- 156
на f(x) равносильно разысканию его линейных делителей со стар- старшим коэффициентом 1. Многочлен f(x) можно всегда разделить на линейный многочлен х — ее помощью алгоритма деления с остатком. Существует, одна- однако, более удобный способ такого деления, известный под названием схемы Горнера. Запишем / (х) в виде Пусть / (х) = аохп + а±хп~1 + ... + dn-ix + ап. = (x—c)q(x) + r, A) где Сравнивая коэффициенты при одинаковых степенях неизвестного в левой и правой частях равенства A), получаем систему равенств: хп xn~l хп-2 X х° «i = Оа = ап~\ ап = Ьо, 61 — 60с, Г — Ьп—\Су откуда bQ - aOf 6i = fli b2 = a2 nx + bn-\c. B) Таким образом, старшие коэффициенты f(x) и g(x) совпадают а ко- коэффициент bk частного q(x), l^k^n—1, можно получить, умно- умножая предыдущий коэффициент частного Ьи~\ на с и прибавляя к по- полученному произведению соответствующий коэффициент ak исходного многочлена / (х). Остаток г получается по тому же правилу из Ьп—\ и ап. Для фактического использования схемы Горнера делают таблицу следующего вида: В первой строке этой таблицы выписывают один за другим все коэф- коэффициенты f(x), а во второй строке слева — элемент с. Коэффициенты частного и остаток от деления f(x) на х — с записываются последо- последовательно во второй строке, согласно равенствам B): 157
ао a2 b2 ... an_x ¦•¦ K-X an r Пример 9.7. Требуется разделить / (x) = хъ — л;4 -f xs — х -f- 1 на jc — 2 и вы- выяснить, не будет ли —1 корнем частного q (x) от такого деления. Применим схему Горнера сначала к многочлену f (х), а затем к частному q(x): 2 — 1 1 1 1 1 1 0 1 3 3 0 - 6 3 -1 11 т 1 |23j Таким образом, / (д) = (х — 2) (л:4 + Xs + Зх2 + 6х + 11) + 23. Так как остаток от деления q (х) = л:4 -f- x3 -f- Зл;2 + 6л: -f- 11 на х + 1 равен 8^0, то — 1 не является корнем многочлена q (x). Замечание. При доказательстве теоремы 9.13 было установлено, что оста- остаток от деления многочлена / (х) на линейный двучлен х — с равен значению много- многочлена / (х) при х = с. Это обстоятельство позволяет использовать схему Горнера для вычисления значения многочлена при данном значении неизвестного. Так, если / (х) и g (х) — многочлены из примера 9.7, то / B) = 23, q (—1) = 8. Рассмотрим многочлен f(x)?P[x]. Пусть съ с2, ..., ct—различ- ct—различные корни f(x) из поля Р. Согласно теореме 9.13, f (х) должен де- делиться на линейные многочлены х — с19 х — с29 ..., x — ct. C) Так как каждый такой многочлен неприводим над Р (см. § 9.3), то они являются различными неприводимыми множителями f(x). Поэто- Поэтому на них распространяются все результаты, полученные нами в § 9.3. Определение 9.7. Элемент с поля Р называется k-кратным корнем многочлена f (х) 6 Р [х], если х — с — k-кратный множитель f(x),~m. e. f (х) делится на (х — c)k, но не делится на (х — c)k+l. Из теоремы 9.11 вытекает Теорема 9.14. Если Р — поле нулевой характеристики и с^Р — k-кратный корень многочлена f(x)?P[x], то с является (k—1)- кратным корнем производной /; (х). Из теорем 9.14 и 9.12 получаем следующую теорему. Теорема 9.15. Если Р — поле нулевой характеристики, то мно- многочлен f(x)?P [х] не имеет кратных корней ни в поле Р\ ни в ка- каком-либо большем поле тогда и только тогда, когда он взаимно прост со своей производной. Так как многочлены C) должны входить в каноническое разло- разложение f(x), то их число не может превосходить degf(x). Это прос- простое наблюдение позволяет сформулировать следующую важную тео- теорему. Теорема 9.16. Число различных корней ненулевого многочлена не превосходит его степени. Заметим, что если многочлен нулевой, то любой элемент поля является его корнем. 158
Следствие 9.2. Если два многочлена степени ^п принима- принимают одинаковые значения при п + 1 различных значениях неизвест- неизвестного, то эти многочлены равны. ^ Пусть f(x), g(x)?P[x], deg / (х)</г, degg(x)^n и пусть съ съ ..., сп\\ — такие попарно различные элементы поля Р, что f(ci) = g(cl), i=l, 2, .... n+1. D) Рассмотрим многочлен ф (х) = f (х) — g (х). Очевидно, deg ф (х) ^ п либо ф (х) — нулевой многочлен. Из D) следует, что ф (ct) = О, i = = 1, 2, ..., п + U т- е- фМ имеет п+ 1 различных корней. Теоре- Теорема 9.16 позволяет заключить, что ф (х) — нулевой многочлен, отку- откуда f(x) = g(x). M Мы знаем, что каждый многочлен / (х)?Р [х] можно рассматри- рассматривать как некоторую вполне определенную функцию f:P-^P. Пред- Предположим, что поле Р бесконечно. Доказанное следствие позволяет утверждать в этом случае равенство двух многочленов, задающих одну и ту же функцию. Другими словами, алгебраическая и функ- функциональная точки зрения на равенство многочленов в случае беско- бесконечного поля совпадают. Если же поле Р конечно, то различные в алгебраическом смыс- смысле многочлены могут задавать одну и ту же функцию. Пример 9.8. Пусть Р — поле из двух элементов, Р= {б, 7}, где 0 + 0 = 0, 0 -f- Г == Т, 1+1=0, б.б = о» ьТ=Г, о-Г = о, Рассмотрим многочлены над этим полем. Очевидно, f (x) ^ g(x). В то же время f (х) и g (x) определяют на Р одну и ту же функцию: /@) = Ь0 + Т = 0 + 1 =1, g@) = bO2 + Г = 1.0+ Г= Г, / (Т) = Г-Т + Т = Т+ Г= б, g A) =T."i» + Т = ь Г+ Г = о. Теорема 9.17. Для каждого натурального п существует, и при- притом только один, многочлен степени <Ж который принимает любые наперед заданные значения при п + 1 различных значениях неизвестного. ^ Пусть аъ аъ ..., ап\\ — различные элементы, а Ъъ Ъъ ..., bn+i — произвольные элементы поля Р. Если существует многочлен f(x)?P [x] степени <^я, такой, что f(at) = bh i — 1, 2, ..., п-\- 1, то по следст- следствию из теоремы 9.16 он определен однозначно. Мы можем написать его в явном виде 159
где _ (х — а1)...(х — д._х) (х — д/+1)...(х — д Ф/ («у -«!>... (fl/ - fl/_i) (fl/ - fl/+i) • •. (fl/ ~ an+l) ' Проверим, что f(x) обладает нужными свойствами. Так как <ieg<р;(х) =/г, /= 1, 2, ..., п + 1, то deg/(x)<n. Очевидно, , /1, если t = /, <Mfly) = \0, если iV/, i'=l,2, ..., п+1, поэтому /fo)=2&/Py(a*) = ^ *=1, 2, ...,/i+l.« Многочлен E) называется интерполяционным многочленом Л а- гранжа. Пусть f(x)?P[x]— произвольный многочлен степени /г>1 и есть его каноническое разложение на неприводимые множители. Если все Pi(x) — многочлены первой степени, то говорят, что много- многочлен f(x) разлагается над полем Р в произведение линейных мно- множителей. В этом случае f(x) = a(x-c{p .^ (x-ct)kt. Так как f (х) делится на многочлены х — съ ..., х — си то съ ..., ct — различные корни f (х) в поле Р. Если с — произвольный корень f(x) в Р, то f (х) должен делиться на х — с. Из единственности разло- разложения на неприводимые множители и из неприводимости всякого линейного многочлена следует, что с совпадает с одним из корней съ ...., ct. Это означает, что f(t) не имеет других корней в поле Р. Напомним, что если Р — расширение поля Я, то всякий много- многочлен f(x)?P [x] является в то же время многочленом над полем Р. Пусть Р — произвольное поле. В дальнейшем будет показано, что для любого многочлена f(x)?P [х] степени п ^ 1 существует такое расширение Р поля Р, что f (х) разлагается над полем Р в про- произведение линейных множителей. Поле Р называется полем разло- разложения многочлена f(x). Будем считать старший коэффициент f (х) равным единице: / (х) = х» + аххп^ + а2х»~* + ... + ап. F) Тогда f(x) = (x — c1) (х — с2)--(х — Сп), G) где ct 6 Р, причем среди ct будут повторения, если / (х) имеет крат- кратные корни. Сравнивая коэффициенты при одинаковых степенях не- неизвестного в F) и G), получаем систему равенств 160
a2 = cxc2 H- cic3 + ... + c\cn + c2c3 + ... + cn-\Cn, ап-\ = {—If-1 (Wo- • -Cn-i - an = (—l)nclc2--.cn, которые называются формулами Виета. Эти формулы выражают коэффициенты f(x) через его корни в поле разложения Р. При этом коэффициент ak равен сумме всевозможных произведений по k кор- корней из съ с2, ..., сп, взятых со знаком -)- или —, в зависимости от четности числа к. Несмотря на простоту формул Виета, значение их в теории многочленов велико. Пример 9.9. Если п = 3, то формулы Виета принимают вид а2 — С1С2 ~Т" ^1^3 Н~ ^2С3» В заключение вернемся к вопросу о неприводимых многочленах. Большой интерес для приложений представляет случай неприводи- неприводимых многочленов над полем действительных чисел R. Изучение та- таких многочленов целесообразно заменить исследованием неприводи- неприводимых многочленов над полем комплексных чисел С, содержащем R. При этом задача упрощается и получает решение с максимально простым ответом. Полученный результат в кольце С[х] в свою оче- очередь позволяет решить исходную задачу в кольце R [х], где ответ оказывается несколько сложнее. Необходимые рассуждения в кольце С [х] базируются на основной теореме алгебры комплексных чисел. Эта теорема утверждает, что всякий многочлен с комплексными коэффициентами степени не ниже единицы имеет хотя бы один комплексный корень. Из этого факта следует, что поле С является полем разложения любого многочлена с комплексными коэффициентами. В самом деле, пусть f(x)?C[x], deg/(я) =/z!> 1, и с± — его комплексный корень. Тогда f(x) делится на х — Ci\ где /i(*)€C[*]. Если deg Д (х) ;> 1, то, согласно основной теореме, fx(x) тоже имеет некоторый комплексный корень с2 и, следовательно, откуда / (х) = (х — с±) (х — с2) f2 (x). Продолжая этот процесс, мы при- придем через конечное число шагов к искомому разложению f(x) в произ- произведение линейных множителей над полем С. Так как всякий линейный многочлен неприводим, то справедлива Теорема 9.18. Линейные многочлены, и только они, являются не- неприводимыми многочленами над полем комплексных чисел. Пусть теперь f (х) = апхп + an-ixn~l + ... +а{х + а0 б Зак. 3670 161
есть многочлен с действительными коэффициентами, deg f(x) = n^l. Рассматривая f(x) как многочлен над полем С, заключаем, что су- существует комплексный корень с этого многочлена, т. е. апсп + пп-icr1-1 + ... + ахс + а0 = 0. (8) Так как для любых комплексных чисел сг и с% сг + с2 = сг + с2, схс2 = CiC2> T0 равенство (8) не нарушится, если в нем все числа за- заменить на сопряженные: ancn + an-\cn~l + ... +aiC + ao = O. Но коэффициенты многочлена f (х) — действительные числа, поэтому ап = ап, ап-\ = ап-и •••> а\ = аи во = «о, и, следовательно, anc« + an-ilf1-1 + ... +fl!C + flo = O. (9) Равенство (9) означает, что с тоже является корнем f(x). Пусть теперь известно, что / (х) неприводим над R. Если с 6 R, то с = с, и Г(х) = (х-с)Ш,. где /i(a:NR[x]. Из неприводимости многочлена /(л:) над полем R следует, что /х (х) — многочлен нулевой степени и deg f(x)=r- I. Если ??R, то сф[с, и /(х) = (х-с)(х-с)/х(х), где h(x)eC[x]. Рассмотрим многочлен g (x) = (х — с)(х — с) = х2 — (с + с)х + ее. Так как с + с к ее — действительные числа (см. теорему 6.1), то g(x)€R[x], откуда в свою очередь следует, что fx(x)?R[x]. В ре- результате получается, что f(x) равен произведению двух многочленов g(x) и f(x) над полем R. Из неприводимости многочлена f(x) над R вытекает, что deg fx (x) = 0 и deg f(x)=degg(x) = 2. Мы доказали, таким образом, что всякий неприводимый многочлен над полем R есть либо линейный многочлен, либо многочлен второй степени, не имеющий действительных корней. Так как все такие многочлены заведомо неприводимы над R (почему?), то тем самым получено полное описание неприводимых над R многочленов. Теорема 9.19. Многочлен f (х) 6 R [х] неприводим над полем R тогда и только тогда, когда он есть либо линейный многочлен, ли- либо квадратный многочлен, не имеющий действительных корней. 9.5. Рациональные дроби Среди элементарных функций, изучаемых в курсе математическо- математического анализа, важное место занимают рациональные функции. Всякая такая функция ф(л:) задается рациональной дробью вида f(x)/g(x)f где / (х), g (x) — многочлены над полем действительных чисел, причем 162
g(x) — ненулевой многочлен. Функция ф(х) имеет своей областью определения все те действительные числа xOt для которых g (х0) Ф 0. При этом числу х0 ставится в соответствие действительное число f(xo)/g(xo). Так как ненулевой многочлен имеет лишь конечное чис- число корней, то функция ф (х) определена на всей действительной прямой, за исключением, быть может, конечного числа точек. Равенство двух рациональных функций ф(х) = f (x)/g(x) и Уг(х) = — /i (x)lgx (x) означает, что их области определения совпадают и A) для любого х0 из области определения. Перепишем A) в виде /(*о)Ы*о) = Ы*о)?(*о). B) Так как х0 принимает бесконечно много значений, то условие B) эквивалентно соответствующему равенству в кольце многочленов R[x]: f(x)gi(x) = h(x)g(x). C) Обратно, если выполняется условие C), то для любого xo?R имеет место равенство B), которое можно записать в виде A), если только g(xo)=j?=O и gi{xo)=?0. Это означает, что рациональные функ- функции ф (х) = / (x)lg (х) и ф1 (х) = /х (x)/g1 (x) принимают одинаковые значения в каждой точке, где обе функции определены одновремен- одновременно. И хотя области определения этих двух функций могут не сов- совпадать (почему?), ф(л:) и q>i(x) отличаются друг от друга несущест- несущественно. Поэтому изучение рациональных функций можно заменить изучением рациональных дробей, считая две дроби / (x)/g (х) и /х (x)/gi(x) равными, если для них выполняется условие C). Таким образом, ра- равенство двух рациональных дробей понимается в том же смысле, что и равенство дробей в арифметике. Над рациональными дробями производятся алгебраические опера- операции сложения и умножения по таким же законам, как и над ра- рациональными числами. При этом сумма и произведение рациональ- рациональных функций ц>(х) = f (x)/g (х) и срх (я) = /i (x)/gi (x) есть рациональ- рациональные функции, определяемые соответственно рациональными дробями h(x) /(*)gi(*) + g(*)M*) g(*) giW g(*)gi(*) ' g(x) giW g(*)gi(x)' Из курса математического анализа известно, что часто интеграл от элементарной функции не выражается через элементарные функ- функции в конечном виде, т. е. с помощью конечного числа арифмети- арифметических действий и суперпозиций. Полученное описание неприводимых многочленов над полем R (см. § 9.4) позволяет доказать, что для любой рациональной функции интегрирование всегда может быть вы- выполнено в конечном виде. Основная идея доказательства заключает- заключается в том, чтобы представить произвольную рациональную дробь в виде суммы более простых рациональных дробей, каждую из кото- которых можно без труда проинтегрировать. Мы получим искомое представление в несколько шагов. 6* 163
Определение 9.8. Рациональная дробь называется правиль- правильной, если степень ее числителя меньше степени знаменателя. Предложение 9.3. Всякая рациональная дробь представима в виде суммы многочлена и правильной дроби. ^ Пусть / (x)/g(x) — произвольная рациональная дробь. Если степень f(x) больше степени g(x), то разделим числитель f(x) на знаменатель ^(л:) с остатком: f(x)=g(x)q(x)+r(x), где степень г(х) меньше степени g(x), либо г(х) = 0. Тогда f (x)/g (х) = [g (x) q(x) + r (x)]/g (x) = q(x) + r (x)lg (x) и будет искомое представление. ^ Предложение 9.4. Всякая правильная рациональная дробь раз- разлагается в сумму нескольких правильных дробей, каждая из кото- которых имеет своим знаменателем степень некоторого неприводимого многочлена. > Рассмотрим сначала правильную рациональную дробь / (x)/gi(x) X Х&М» гДе многочлены gi(x), g2(x) взаимно просты. В силу критерия взаимной простоты (теорема 9.6) существуют такие много- многочлены ф(#) и ty(x), что gi(x)q>(x) + g2(x)ty(x) = 1, откуда ft (х) [Ф (х) f (x)] + ft (х) ДО (х) f (x)] = / (x). D) Разделим произведение ty{x)f(x) на gx(x) с остатком: я|) (х) f(x) = = ft № Яг (х) + гг (х), deg гг (х) < degft (х) или [гх (х) = 0. Тогда ра- равенство D) можно переписать в виде ft (*) [Ф (х) f (x) + g2 (x) qi(x)] + g2 (x) гг(х )=f(x), или, полагая r2(x) = <p(x)f (x) + g2 (x)qx(x)9 в виде gi(x)r2(x)+g2(x)rx(x) = f(x). E) Так 'как степень гх(х) меньше степени gi(x), то degg2(x) rx(x)<C <^ggi(x)g2(x). По условию дробь f{x)/(gx(x)g2(x)) правильная, т. е: deg / (х) < deg^ (x) g2 (х). Следовательно, deg gx (x) r2 (х) также меньше deggx(x)g2(x). Это означает, что степень г2(х) меньше сте- степени g2(x). Из E) получаем равенство / (*)/(ft W A W) - \gx (х) г2 (х) + g2 (х) rx (x)]/(gx (х) g2 (х)) - = ri(x)/gi(x) + r2(x)/g2(x)9 в правой части которого стоит сумма правильных дробей. Если хотя бы один из многочленов gx(x), g2(x) представим в виде произведения взаимно простых множителей, то процесс разло- разложения можно продолжить. В результате всякая правильная дробь f(x)lg(x), знаменатель которой имеет каноническое разложение на неприводимые многочлены представляется в виде f(x)/g(x) - /i(x)/p?i (x) + r2{x)lp^ (x) + ... +rs(x)/pks* (x), 164
где все слагаемые в правой части этого равенства являются пра- правильными дробями. М Определение 9.9. Правильная рациональная дробь f(x)/g(x) называется простейшей, если ее знаменатель g(x) является сте- степенью неприводимого многочлена р(х), т. е. g(x) = pk(x), k^l, а степень числителя f(x) меньше степени р(х). Предложение 9.5. Всякая правильная рациональная дробь, ко- торая имеет своим знаменателем степень неприводимого много- многочлена, разлагается в сумму простейших дробей. ^ Рассмотрим правильную дробь вида r(x)/pk(x)t где р(х) — неприводимый многочлен. Пользуясь алгоритмом деления с остат- остатком, разделим г(х) на pk~~l (x), полученный остаток разделим на pk~2(x) и т. д. В результате получаем систему равенств: Г*_2 (*) = р (X) qk-i (X) + /*_i (X). Так как степень г(х) по условию меньше степени pk(x)} степень гг(х) меньше степени pk~l(x), степень г2(х) меньше степени pk~2(x) и т. д., то, очевидно, степени всех частных qi(x), q2(x)r ..., qk-i (x), а также степень последнего остатка rk~\ (x) меньше степени р (х). Из системы F) следует, что /(х) = Pk~l (х) qx (х) + pk~* (х) q2(x)+ ... + р (х) qk^ (x) + rk^ {x)% откуда г(х) Я\(*) . <72М , , ft-iW , rk-l(x) РЛМ 1р(*) pz(x) рь-*{х) Pk(x) есть искомое представление рациональной дроби r(x)/pk(x) в виде суммы простейших дробей. <4 Из предложений 9.3, 9.4 и 9.5 непосредственно вытекает Теорема 9.20. Всякая рациональная дробь представима в виде суммы многочлена и простейших дробей. Так как неприводимый над полем R многочлен есть либо линей- линейный многочлен, либо многочлен второй степени, не имеющий дей- действительных корней, то всякая простейшая дробь может быть за- записана в виде А/(х — a)k, k—~ 1, 2, 3, ..., или в виде (Ах + В)/(х2-\- + px + q)k, где р2/4_9<о, Л = 1, 2, 3, ... В курсе математического анализа указываются приемы интегри- интегрирования таких рациональных дробей. Так как интегрирование мно- многочлена труда не представляет, то можно считать доказанным, что всякая рациональная функция интегрируется в конечном виде. При разложении конкретной правильной рациональной дроби в сумму простейших полезно иметь в виду следующую теорему един- единственности. Теорема 9.21. Всякая правильная рациональная дробь представ- представляется в виде суммы простейших дробей единственным образом. 165
^ Предположим, что некоторая правильная дробь может быть представлена в виде суммы простейших дробей двумя различными способами. Вычитая одно такое представление из другого и склады- складывая дроби с одинаковыми знаменателями, получаем сумму простей- простейших дробей, тождественно равную нулю. Пусть знаменатели (нену- (ненулевых) дробей, входящих в эту сумму, будут некоторыми степеня- степенями неприводимых многочленов рх{х), р2(х), ..., ps(x)> Pi(x)?= P/(*)» к' если i-ф]. И пусть р{(х) — наивысшая степень многочлена pL(x) среди этих знаменателей, t = l, 2, ..., s. Умножим обе части рас- рассматриваемого равенства на произведение р\х~х (х) р\2 (х) • • • pkss (x). Все слагаемые нашей суммы, кроме одной дроби вида г {хIр\х (х)9 превратятся при этом в многочлены. Что же касается указанной дроби, то она превратится в рациональную дробь [г (х) р\г (х) ... ...pkss(x)]/pl(x), все множители числителя которой взаимно просты с Рх(х). Поэтому знаменатель не делит числитель этой дроби. Выпол- Выполняя деление с остатком, получаем, что сумма ненулевой правильной дроби и некоторого многочлена равна нулю: rx{x)/px{x) + g{x)=0. Но тогда Гг(х) = — Pi(x)g(x), что невозможно, так как degrx(A:)< <degp1(x). 4 Пример 9.10. Разложим в сумму простейших дробей правильную дробь + 13 Из полученных результатов следует, что искомое разложение должно иметь вид 2х2 + 2х + 13 Л ( Вх + С Рх + Е (х — 2) (х*+ IJ х — 2 ' х2+\ (л-2+1J' где числа А, В, С, D, Е еще предстоит определить. Перепишем G) в виде равенства многочленов 2х2 + 2х -f- 13 = А (х2 + IJ + (Вх + С) (л:2 + 1) (х — 2) + (Dx + Е) (х — 2). (8) Приравнивая коэффициенты при одинаковых степенях х из обеих частей равен- равенства (8), получаем систему из пяти линейных уравнений с пятью неизвестными: Л А + В = 0, А-3 —2В + С = 0, л2 2A + B — 2C + D = 2, х1 —2S + C — 2D + E = х° А — 2С — 2Е= 13. (9) Система (9) имеет единственное решение, которое можно найти методом Гаусса: Л = 1, В = —1, С = —2, D - -3, Е = -4. Таким образом, 2х2 + 2х+ 13 _ 1 х + 2 Зх + 4 (х — 2)(*2 + О2 ~~ х — 2 х2 + \ (х*-\-\J' 166
Упражнения 1. Будем называть рациональную дробь несократимой, если ее числитель и знаменатель взаимно просты. Докажите, что всякая рациональная дробь равна не- некоторой несократимой дроби, определяемой однозначно с точностью до множителя нулевой степени, общего для числителя и знаменателя. 2. Покажите, что представление рациональной дроби в виде суммы многочлена и правильной дроби определено однозначно. 10. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ Теория многочленов от нескольких переменных по существу от- откосится к особой области математики, которую называют алгебра- алгебраической геометрией. В данной главе мы остановимся лишь на тех разделах этой теории, которые необходимы при более глубоком изу- изучении Еопрсса о корнях многочленов от одной переменной. 10.1. Кольцо многочленов от нескольких переменных Пусть К — произвольное коммутативное кольцо с единицей 1, Р— некоторое его подкольцо, содержащее 1. И пусть ttt t2— про- произвольные элементы кольца /(. Обозначим символом Р [tb t2] пере- пересечение всех подколец из К, содержащих одновременно Р и эле- элементы tly t2. Очевидно, Р [tlf t2] есть наименьшее подкольцо К, содержащее Р, tx и t2. Это подкольцо можно было бы получить другим путем, рассмотрев сначала подкольцо P[tx], а затем добавив к нему элемент t2. Действительно, P[tx]czP[tXj t2] и t2?P[tx, t2]. Поэтому наимень- наименьшее подкольцо P[tx] [t2], включающее P[tx] и t2y должно содер- содержаться в P[ti, t2]. Так как P[ti\[t2] содержит подкольцо Р и эле- элементы tl9 t2i то из включения Р [tx] [t2] с: Р [tx, t2] и минимальности Р[/ь /2] вытекает равенство P[tb t2] = P[tx][t2[. Хотя подкольцо Р [tx, t2] существенно зависит от выбора элемен- элементов tXy t2?K, у Есех таких колец имеются общие черты, которые подсказывают способ введения кольца многочленов Р[хи х2] от двух переменных. Пусть Р — произвольное коммутативное кольцо с единицей. Рассмотрим сначала кольцо многочленов Р[хх] над Р от одной пе- переменной хх. Кольцо Р[хх] является, как и Р, коммутативным коль- кольцом с единицей, и, значит, можно говорить о кольце многочленов P[Xi][x2] над Р[хх] от одной переменной х2. Это кольцо называется кольцом многочленов над Р от двух независимых перемен- переменных (от двух неизвестных) хх и х2 и обозначается символом Р [дс1э х2]. Итак, по определению Ясно, что Р[хъ х2] есть коммутативное кольцо с 1. Всякий элемент / 6 Р [#ъ х%] записывается в виде конечной суммы Д A) 167
В свою очередь ~ \^ /7 г1 п С Р B,} i Из § 9.1 следует, что элементы кольца Р и неизвестное х можно рассматривать как элементы кольца многочленов Р[х]. Отсюда вы- вытекает, что элементы Р и неизвестные хъх2 целесообразно считать многочленами из кольца Р[хъ х2]. Из A) и B) получается следую- следующее представление /: / = S (SaiA) *а = 2 2 <*ux\xl atJ 6 Р. Так как кольцо P[#i, x2l коммутативно, то пц перестановочны с хг и х2, а неизвестное хх перестановочно с неизвестным *2- Повторив данную конструкцию несколько раз, получим кольцо Р[х1ч х2, ..., хп], которое называется кольцом многочленов (полиномов) над Р от п переменных (неизвестных) хи х2} ..., хп. Из определения кольца Р[хъ х2, ..., хп] следует, что элементы Р и неизвестные хъ х2, ..., л*л можно считать многочленами из Р[хь У Г 1 Всякий многочлен f^P[xu x2, ..., хп] представим в виде конеч- конечной суммы ? ^yl /у. . . у'"!у[* уг^ /7- • • Р Р С%\ где I*!, /2> -••» ^л могут принимать неотрицательные целые значения. Произведение xl\xl2 - • • х? называется мономом. Будем говорить, что / есть линейная комбинация мономов с коэффициентами из Р. Так как Р[хь х2, ..., хп] — коммутативное кольцо, то сумму и произведение многочленов из этого кольца, представленных в виде C), легко записать в таком же виде. При этом сложение двух много- многочленов сводится к сложению коэффициентов при одинаковых моно- мономах, а умножение — к перемножению мономов, линейными комбина- комбинациями которых являются исходные многочлены, и последующему приведению подобных членов. Пример 10.1. Пусть / = х^х2 — х\х\ -f- х2 и g = Ъх^х\ — 2х{х2 + 1 есть два многочлена из G[*i, x2]. Тогда + оу3г4 Оу г -4~ y у rz 1- -!_ y 9v г 9v v J ^-v v 9i*^-v^ _L_ 9v'v^ Предложение ЮЛ. Многочлен f равен нулю тогда и только тогда, когда равны нулю все его коэффициенты а-1х[г ... /я. ^ Воспользуемся индукцией по п. При /г = 1 утверждение пред- предложения непосредственно следует из определения нулевого много- многочлена от одной переменной. Пусть /г>1, и предположим, что для многочленов от п — 1 переменных предложение справедливо. 168
Запишем / в виде х1» = 2 1 где есть многочлены от п — 1 переменных. Так как / — многочлен от одной переменной хп над кольцом Р[х1у ..., хп-\] с коэффициентами q>iny то его равенство нулю равносильно равенству нулю всех мно- многочленов ф/л от /г — 1 переменных. Но тогда все коэффициенты a>ixu ... tn этих многочленов должны равняться нулю. ^ Пусть теперь многочлен f?P[xl9 x2f ..., хп] представим двумя способами в виде линейной комбинации мономов: Вычитая из первого равенства второе, получаем откуда на основании доказанного предложения заключаем, что aixi2 ... in — bLxi2 ... /д = 0 или fl/^a ... in =:bi1i2 ... ifl. Это доказывает Предложение 10.2. Представление произвольного многочлена f?P[Xi, хъ ..., хп\ в виде линейной комбинации мономов C) опреде- определено однозначно. Рассмотрим мономы, входящие в разложение многочлена / вида C) с ненулеЕыми коэффициентами. Наибольшее целое число, кото- которое встречается в качестве показателя при xk во всех таких моно- мономах, будем называть степенью многочлена f относительно перемен- переменной xk и обозначать символом degkf. Полной степенью монома x'fx*? ... xl? назовем число ix + i2 + ...+ + in, а полной степенью deg/ многочлена f — наибольшую из пол- полных степеней его мономов с ненулевыми коэффициентами. Нулевой многочлен степени не имеет. Пример 10.2. Пусть / = х\ + х{х2 + х\х\ + х{х2х3 + ххх2х\. Тогда degx/^2, deg2/=l, dcg3/ = 3, deg/ =5. 169
Теорема 10*1. Если Р — кольцо без делителей нуля, то и коль- кольцо многочленов Р [хи х2, ..., хп] является кольцом без делителей ну- нуля. В этом случае для любых ненулевых f, giP[xX} x2, ..., хп] ^ Мы уже знаем (см.§ 9.1), что если Р — кольцо без делителей нуля, то и Р[хх]—кольцо без делителей нуля. Но тогда таким же свойством обладает кольцо от двух переменных Р [хъ х2] = Р [хг] [х2] и т. д. Таким образом, первая часть теоремы 10.1 есть непосредст- непосредственное следствие аналогичного утверждения для кольца многочле- многочленов от одного переменного. Переходя к доказательству второй части теоремы, назовем одно- однородным многочленом степени k многочлен от п переменных, все мономы которого с ненулевыми коэффициентами имеют одну и ту же полную степень k. Собирая вместе все входящие в / мономы одной и той же сте- степени, можно представить f в виде суммы нескольких однородных многочленов различных степеней: / = /o + fi+ ... +fs, * = где i = deg/?, i = 0, 1, ..., s, или ft = 0. Очевидно, fs=?Q. Аналогично Так как Р[хь хъ ..., ха\ не имеет делителей нуля, произведение однородных многочленов есть однородный многочлен, степень ко- которого равна сумме степеней сомножителей. Отсюда fg = fogo + (fogi + figo) + .- +fsgt, так что deg (fg) - deg (fsgt) = deg /, + deg gt = deg f + degg. M Значение кольца многочленов от нескольких переменных в тео- теории коммутативных колец проясняет следующая Теорема 10*2* Пусть К — произвольное коммутативное кольцо с единицей, содержащее Р в качестве подкольца. И пусть tly t29 ..., tn — произвольные элементы /С. Если в кольце Р[хи хъ ..., хп] спра- справедливы равенства Ф(а;ь ..., xn) = f(xly ..., xn)+g(xu ..., хп) и tf(xlf ..., xn) = f{xl9 ..., xn)g(xu ..., хп), то 4>(h tn) = f(tu .., tn)+g(ilt .... U •••- *«)=f(h tn)g(tu .... tn). 170
^ Для случая п = 1 теорема уже доказана (см. теорему 9.2). Рассмотрим кольцо многочленов Р [хъ х2]. И пусть в этом кольце г|ф'!, x2) = f(xly x2)g(xu х2). Покажем, что для любых tly t2?K Wu U) = f(tb tjg(tut2). Воспользуемся тем, что Р[хх, х2] = Р[хх] [х2]. Тогда * / / где а^Хг), bjfa), ct(Xi) ?Р[хг], причем Ci(Xi)= ^(xjbjfa). D) Так как теорема справедлива при п = 1, то из D) следует, что ci^-^a^bjih). E) Рассмотрим многочлены над кольцом Р [tx] от одной переменной х2. Формулы E) означают, что *&» **) = f(tu x.2)g(tx, х2), но тогда Читателю предлагается самостоятельно доказать, что если ф(л"ь x2)=f(xl9 x2) + g(xXj х2), то Общий случай (л > 2) доказывается с помощью индуктивного пе- перехода от п — 1 к /г, который почти дословно совпадает с прове- проведенным рассуждением для п = 2. ^ Следствие 10.1. Всякая перестановка из п чисел аь а2, ..., ап определяет изоморфизм а кольца Р[х1у х2, ..., хп] на себя: ^ Воспользуемся теоремой 10.2 в случае, когда К = Р[хХ) х2, .,., хп], t± = xai9 t2 = Xa2, ..., ^=-^ад. Тогда если 171
то Последние два равенства можно переписать в виде «(/ + *) = *(/) + «&). a (fe) = a (/) a (g), т. e. a сохраняет сложение и умножение в кольце Р[хи хъ ..., хп]. Проверим биективность а. Рассмотрим подстановку 1 2 ... п a2 ... а„ Пусть обратная к ней подстановка имеет вид /1 2 ... п) VPi P2 -. PJ* Обозначим через р отображение кольца P[xx, x2, ..., л:^] на себя, где Легко видеть, что aop = poa — тождественное отображение мно- множества Р[хъ х2, ..., хп], т. е. р — обратное к а отображение. Это и доказывает взаимную однозначность а. Ч Пусть /(*ь х2, ..., хя) = 2а*1*. ... ^i1^1 ... 4Л- Если *i'« ... 'л^ =7^=0, то произведение atlia ,,, inx^xl2 ... а:^1 будем называть членом многочлена /, а а*^, ... ^ — коэффициентом этого члена. Существуют два естественных способа расположения членов мно- многочлена от одного переменного — по убывающим и по возрастающим степеням неизвестного. Для многочлена от нескольких переменных эти способы теряют смысл. Действительно, многочлен / (хи х2, ..., х3) = х\х2х\ + х\х\ + х\х\ можно записать в виде / [х\, х2, Хз) = х\х\ 4- х\х2х\ + xlxl, и нет оснований одну из этих записей считать удачнее другой. Можно, однако, указать вполне определенный способ располо- расположения членов многочлена от нескольких переменных. Он подсказан принципом расположения слов в словаре (поэтому называется лекси- лексикографическим) и для многочленов от одного переменного приводит к расположению членов по убывающим степеням неизвестного. Пусть 44ш -. # F) хп 172 хпп G)
есть два различных члена произвольного многочлена f(xu х2..., хп)?Р[хх, х2, ..-, хп]9 Рассмотрим разности ki—tu k2 — t2, ..., kn — tn. (8) Так как члены F) и G) различны, то не все эти разности равны нулю. Член F) будет считаться выше члена G), если первая из разностей (8), отличная от нуля, положительна. Другими словами, член F) выше члена G), если существует i, l^i^n, такое, что ki = tl9 ...,&;-i = /*-i, но ki>tt. Ясно, что из любых двух членов многочлена f (хх, х2, ..., хп) один будет выше другого. Легко видеть также, что если член F) выше члена G), а член G) выше члена сх\%2 ¦ ¦ ¦ <*, (9) то член F) выше члена (9). Поэтому, записывая сначала тот из двух членов, который выше, получим вполне определенное упорядочение членов многочлена f(xu х2, ..., хп). Такая запись многочлена от нескольких переменных и называется лексикографической записью. Первый член в этой записи будет называться высшим членом мно- многочлена. Пример 10.3. Многочлен g (ЛГ|, #2» лу == Х\Х2 ' Х1 ' Х\^2ХЪ ' Х2^Ъ ^2*3 — Х3 записан лексикографически, х\х2 — его высший член. Лемма 10*1* Высший член произведения двух многочленов из кольца Р[х1у х2, ..., хп] равен произведению высших членов сомножи- сомножителей, если только произведение коэффициентов при этих членах отлично от нуля. > Пусть перемножаются многочлены / и g?P[xh x2, ..., хп] и пусть ах\'х\г ••• xkn" A0) есть высший член /, а а'х№ ••• х[п A1) есть любой другой член этого многочлена. Это означает, что су- существует 1 <л ^.п, такое, что kx = tly ..., ?/__i=fc-_i, kt > t{. Ана- Аналогично пусть bxl'xl2 ... xsn" A2) есть высший член g, VxWj ... xln" A3) есть любой другой член g, так что при некотором 1 ^/^я Sx — 1Ъ ..., 5/_i = //_!, Sj > lj. 173
Рассмотрим произведения члена A0) соответственно на члены A2) и A3): ••• хкп»+\ A4) аЪгх\Л1хх\Л1г ... *?Л+Ч A5) Покажем, что член A4) выше члена A5). Действительно, по усло- условию аЬ Ф 0 и kx + S{ = k{ + /l, -.., kf-i + Sj-i = A/-i + /y_i, ?/ + Точно так же проверяется, что произведение членов A1) и A2), A1) и A3) ниже члена A4). Из доказанного вытекает, что член A4) заведомо выше всех других членов произведения fg, т. е. является высшим членом многочлена fg. ^ 10.2. Симметрические многочлены Будем обозначать через Р (если не оговорено противное) про- произвольное коммутативное кольцо с 1. Определение 10.1. Многочлен f(xx, х2, ..., хп)?Р[хь х2, ..., хп] называется симметрическим, если он не меняется ни при какой перестановке переменных хь х2, ..., хп, т. е. если для любой пере- перестановки из п чисел ссх, сс2, ..., ап имеет место равенство X2, ..., Хп). Пример 10.4. Многочлен х2 равный сумме k - х степеней всех п переменных, очевидно, является симметриче- симметрическим многочленом. Так как всякую перестановку из п чисел можно получить из перестановки 1, 2, ..., п с помощью нескольких транспозиций (см. предложение 3.3), то для проверки симметричности данного много- многочлена достаточно убедиться, что он не меняется ни при какой транс- транспозиции неизвестных. Теорема 10-3- Множество всех симметрических многочленов от п переменных над кольцом Р образует подкольцо кольца Р[хъ х2, ..., хп]. ^ Согласно следствию 10.1, всякая перестановка из п чисел ссь <х2, ..., ап определяет изоморфизм а кольца Р[хъ х2, ..., хп] на себя: Х2, •••» хп)) =/(*<*!, Ха2, ..., Хап). Пусть / и g — симметрические многочлены из Р[хъ хъ ..., хп], т. е. а (/) = / и а (g) = g для любой перестановки ссь а2, ..., ап. Тогда 174
(/ + ?) (/) + («) / + ?, a (-/) = a ((-1)/) = a (-!)«(/) = (-!)/ =-Л (/) /) () / Это означает, что / + g, —/ и fg тоже являются симметрическими многочленами и, значит, симметрические многочлены образуют под- кольцо кольца Р[хъ хъ ..., хп]. <4 Следствие 10.2. Любые линейные комбинации симметриче- симметрических многочленов и их произведения являются симметрическими многочленами. Следующие симметрические многочлены от п переменных играют' весьма важную роль в теории симметрических многочленов: ... +Хп-2Хп-\Хп, art_! = X\X2 • • • Хп-1 + Х\Х2 • • • Хп-2Хп + ... Оп = Х{Х2 • • • Хп. Они подсказаны формулами Виета (см. § 9.4) и называются элемен- элементарными симметрическими многочленами. Можно сказать, что коэф- коэффициенты многочлена от одного переменного со старшим коэффи- коэффициентом 1 являются с точностью до знака элементарными симмет- симметрическими многочленами от его корней. Согласно следствию A0.2), всякий многочлен от элементарных симметрических многочленов сгх, а2, ..., оп должен быть симметри- симметрическим многочленом от переменных хъ х2, ..., хп. Пример 10.5. Пусть п = 3, Р == Z и g (xlt х2, Хз)=х1хз — х2. Тогда g (<*i (xv x2, x3), a2 (xv х2, х3), a3 (xv х2, х3)) = (х{ +х2 + х3) (х^х^ - (х\х2 4" ^1^3 ~Ь х2хз) == Х\Х2ХЪ "Т" Х\Х2ХЪ "Ь Х\Х2ХЪ х\х2 Х\ХЪ — Х2ХЪ" Следующая теорема показывает, что способ построения симмет- симметрических многочленов с помощью элементарных, на самом деле, универсален. Теорема 10 4 (основная теорема о симметрических мно- многочленах)- Для любого симметрического многочлена f ? Р [хъ хъ ..., х„] существует, и притом единственный, многочлен g? Р[хъ хъ ..., x,t], такой, что /Ч*и -., xn)=g(ax(xu ..., хя), ..., ап(хи ..., хп)). Таким образом, всякий симметрический многочлен однозначно пред- представляется в виде многочлена от элементарных симметрических многочленов. >» Докажем сначала существование многочлена g. Пусть aoxUI2 ••• xknn A) есть высший член многочлена f(xb x2, ..., хп). Покажем, что > ... Ж B) 175
Предположим, что при некотором** ^<А/+ь Так как/ — симмет- симметрический многочлен, то наряду с членом A) он должен содержать член Й Й ' • • **"> C) который получается из A) транспозицией xt и дс/+1. Но член C) вы- выше члена A), так как показатели при неизвестных хъ х%, ..., х-ь-\ у них совпадают, а показатель при неизвестном xt у члена C) больше, чем у члена A). Это противоречит тому, что формула A) задает высший член /. Рассмотрим следующее произведение элементарных симметриче- симметрических многочленов: ^ " П— 1 /2 • 1" В силу неравенств B) kt — ^/+i^0, i = l, 2, ..., п—1. Поэтому Фх — симметрический многочлен. Высшие члены многочленов <ть а2, ..., оп равны соответственно Из леммы 10.1 следует, что произведение " ••• xkn« является высшим членом фх, так что высшие члены многочленов / и фх совпадают. Рассмотрим разность /-<Pi = /i- D) Ясно, что Д — симметрический многочлен, и так как при вычитании высшие члены / и фх взаимно уничтожаются, то высший член Д должен быть ниже высшего члена /. Равенство D) перепишем в виде / = <Pi + /i- E) Применяя к Д тот же прием, получаем представление /х в виде /1 = фа4/а> F) где ф2 — произведение степеней элементарных симметрических много- многочленов с некоторым коэффициентом из Р; /2 — симметрический мно- многочлен, высший член которого ниже, чем высший член Д. Из представлений E) и F) вытекает равенство / = ф1 + ф2 + /2. Продолжая этот процесс, получим последовательность симметри- симметрических многочленов Д, /2, ..., Д, ... Эта последовательность не мо- может быть бесконечной. Действительно, высший член многочлена /s 176
ниже высшего члена предыдущего многочлена /s_i и, следовательно* ниже высшего члена A) исходного многочлена /. В частности, h>h. G) В то же время, как мы знаем, h>h> .- >/Л- (8) Ясно, что существует лишь конечное число последовательностей 11у /2, ..., 1п, составленных из целых положительных чисел и удовлет- удовлетворяющих условиям G) и (8). Поэтому при некотором 5 fs = 0, так что / = Ф1 + Ф2 + ••• + Ф.9- Правая часть этого равенства есть не- некоторый многочлен g от сгь сг2, ..., ап с коэффициентами из Р: f — g(ai> ^2» •••» <*п)- Первая часть теоремы доказана. Покажем теперь, что никакого другого выражения / через еть ст2, ..., ап не существует. Предполо- Предположим, что наряду с многочленом g существует многочлен gx ? Р [хи х2, •••> хп], для которого причем gi=7^=g, так что разность есть ненулевой многочлен из кольца Р[хъ х2, ..., хп\ Из теоремы 10.2 следует (при К = Р [хъ х2, ..., хп], t± = оъ t2 = a2, ..., tn = cxj, что i|3(ab (т2, ..., an)=g(au а2, ..., ап) — &(аь а2, ..., ал)=/ —/ = 0. Если мы покажем, что это невозможно, то тем самым будет доказа- доказана единственность многочлена g. Пусть есть один из членов многочлена ij?. Рассмотрим многочлен flof^' ... а^. A0) Согласно лемме 10.1, высшим членом многочлена A0) будет где h = ?2 + ... + Ая, /„'- kn. Отсюда и, следовательно, симметрические многочлены A0), соответствующие различным членам (9) многочлена op, имеют различные высшие чле- члены. Наивысший среди последних будет выше всех прочих членов 177
многочленов A0). Он и будет высшим членом многочлена ^(ах, а2, ..., oj, который, таким образом, не может быть нулевым. ^ Важность теории симметрических многочленов для изучения кор- корней многочленов от одного переменного объясняет Теорема 10*5* Пусть f (х) — многочлен степени п от одной пе - ременной над полем Р. И пусть съ с2, ..., сп — его корни, принад- принадлежащие некоторому полю разложения ~Р многочлена f(x) над Р. Тогда для любого симметрического многочлена ср(хь я*2, ...» хп) ? ?Р[хъ х2, ..., хп] элемент Ц)(сг, с2У ..., сп) принадлежит полю Р. > По теореме 10.4 найдется многочлен g(xx, ..., хп)?Р[хъ ..., хп]у такой, что Ф(хь ..., xj = g(alf(xb ..., хп), ..., оп(хъ ..., хп)). Из этого равенства, согласно теореме 10.2, получаем Ф(<?1, ..., cn)=g(ol(clf ..., сп), ..., оп(съ ..., сп)). Пусть f(x) = аохп + а^-1 + ... + аЛ, az6^- По формулам Виета ot{cu ..., ся) = (— 1)Ч/^о6Л 1 = 1, 2, ..., я, и, значит, <p(q, г2, ..., cn)=g(—ajao, ajao, ..., (—l)nan/a0) ?P. <4 Пусть, например, f (x) — произвольный многочлен п-и степени над полем рациональных чисел Q, Мы знаем, что поле комплексных чи- чисел С есть поле разложения для f (х): f(x) = ao(x — c1)(x — c2) •" {х — сп), с^С. Если Ц){хъ х2, ..., хп) — произвольный многочлен от п переменных над Q, то ф (съ с2У ..., сп)—некоторое комплексное число. Если же многочлен ф(хь х2,..., хп) симметричен, например, ф — jcf + 4+ ••• + -4- Хп, то по теореме 10.5 число ф (съ с2У ..., сп) должно быть рациональ- рациональным, — факт удивительный, если учесть, что мы не знаем ничего конкретного о корнях съ с2, ..,, с/г. Доказательство теоремы 10.4 дает метод, позволяющий практи- практически выразить данный симметрический многочлен через элементар- элементарные. Заметим, что если все члены многочлена f (х1у х2, ..., хп) имеют одну и ту же полную степень т, то / называется формой т-и сте- степени. Например, оъ а2, ..., а,, —формы соответственно 1-й, 2-й, ...' /г-й степеней. Нуль будем считать формой любой степени. Если / и g — формы га-й степени, то, очевидно, их сумма и раз- разность есть формы т-\\ степени. Если / — форма m-й степени, а g — форма k-fi степени, то легко видеть, что их произведение fg есть форма (т + &)-й степени. Вернемся к доказательству теоремы 10.4. Пусть / — форма т-й степени. Рассмотрим многочлен ф1 = aoob-h*<yk22-k* ¦ • • о^-Чт*». Так как a]f a2, ..., <Jn — формы соответствующих степеней, а высшие члены / и фх одинаковы, то q)t является, как и f, формой m-й сте- 178
пени. Значит, и многочлен f± = f — фх есть форма ш-й степени. Про- Продолжая это рассуждение, убеждаемся, что в искомом представлении / = Ф1 + Ф2+ "¦ +<Vs Фъ Ф2» •••» Ф*— формы той же степени т, что и форма /. Пример 10.6. Найти сумму кубов корней многочлена Ф (х) = х* + 2х3— Зх2 + х + 5 над полем рациональных чисел. Решение. Пусть ci, с2, сз, С4— корни многочлена <p(x). Нас интересует число с\-\-с\-\- с\-\- С4' котоРое есть значение симметрического многочлена / => = х\ + х\ + хз " *4 от корней ф (л:). Найдем сначала выражение многочлена / (х±, х2, хз, х^) через элементарные симметрические многочлены аь а2, аз, 04: ^2, ^з, ^4)=^(аь а2, а3, а4). Заметим, что члены фь ф2, •••, ф.у искомого многочлена g = Ф1 + ф2 + ••• Ф,у определяются через высшие члены симметрических многочленов /, Д, /2, ••-, _p причем эти высшие члены не выше высшего члена многочлена /, т. е. не выше х\. Каждый такой высший член ах1 Х2 Х3 Х4 должен отвечать следующим трем условиям: 1) быть не выше члена х\\ 2) удовлет- удовлетворять неравенствам tx^h^h^t^ так как мы имеем дело с высшим членом симметрического многочлена; 3) иметь степень по совокупности переменных, рав- равную 4. Выпишем все возможные комбинации показателей tlt t2, t3, /4, при которых выполняются указанные три условия, а справа от каждой такой комбинации — соответствующее произведение ^1-^2-^3-^4 а1 а2 °3 °4 элементарных симметрических многочленов ах, а2, аз, а4: 3 0 0 0 <jZ-0<j02-°o03-0o04 = oI 2 10 0 а?-Ц-°(т!|-оа2 = аха2, 1110 а11-Ц-Ц-°а5 = а3. Таким образом, / = oj + Ааха2 + Во3 при некоторых рациональных Л и В. На самом деле Л и В должны быть целыми числами, так как f?Z\xi, x2, х3, Хэ]. Коэффициент при aj совпадает с коэффи- коэффициентом при высшем члене х\ многочлена / и, следовательно, должен быть равен 1. Коэффициенты А и В можно найти методом неопределенных коэффициентовг придавая xlt x2, х3, х4 подходящие значения и записывая соответствующие значе- значения о±, о2, аз и / с помощью таблицы: Х1 | Х2 1 1 1 1 хз 0 1 Х4 0 0 сг2 2 | 1 3 3 сгз 0 1 f 2 3 17!)
В результате получаем два уравнения для определения А и В: 2 = 23+ Л-2- i + 5-O, 3 = 33 + Л-3.3 + ?.1, откуда Л => —3, В = 3. Итак, / = о\ — За{а2 + За3. A2) Согласно формулам Виета, <*i(ci, с2, сз, с4) = —2, a2(ci, с2, с3, с4) = —3, а3 (сь с2, сз, с4) =» — !• Отсюда, используя представление A2), получаем искомое число: / (съ с., с8, а) = (-2K - 3 (-2) (-3) + 3 (-1) - -29. Пример ЮЛ, Решить систему уравнений х* + if - 35, над полем рациональных чисел Q. Решение. Воспользуемся тем обстоятельством, что левые части уравнений системы A3) есть симметрические многочлены от переменных х и у. Введем новые неизвестные: o"i = х -г у, а2 = ху. Выразим многочлен х3 + у3 через o~i и а2. Фактически такое выражение уже было получено (см. формулу A2)). Надо положить лишь х3 = х± = 0, так что аз =* «= 0. В результате найдем Для новых неизвестных получаем следующую систему уравнений: 0^ — 30^2= 35, oL = 5, откуда Oi = 5, a2 = 6. В результате для переменных х и у получаем более простую систему уравне» ний, чем система A3): которая легко решается: у = 5 — л:, х E — а:) = 6 или [х2 — Ъх -f- 6 = 0. Отсюда Л*1 = ^, i/j = О, Л^2 === *Э, У2 ~== ^" Итак, система уравнений A3) имеет два решения: B, 3) и C, 2). Так как приведенные рассуждения остаются справедливыми при переходе к любому расши- расширению Q поля Q, то других решений, кроме найденных, в поле Q система A3) не имеет. 11. ЭЛЕМЕНТЫ ТЕОРИИ ПОЛЕЙ Данная глава целиком посвящена изучению корней многочленов над полями. Многие изложенные ранее понятия и конструкции на- находят здесь естественные и важные применения. 11.1*. Теорема существования корня Пусть дан многочлен f(x) над произвольным полем Р. Естест- Естественно возникает вопрос: если многочлен f(x) не имеет корней в по- 180
ле Р, то нельзя ли построить такое расширение Р поля Р, в кото- котором для f(x) найдется хотя бы один корень. Напомним, что поле комплексных чисел С было построено нами при решении частного случая этой задачи (когда Р = R, f(x) = = х*+1). Будем считать, что степень многочлена f (х) больше единицы, так как всякий многочлен первой степени имеет корень в самом по- поле Р. Кроме того, можно ограничиться случаем, когда f{x) непри- неприводим над полем Р. В самом деле, если f(x) приводим над Р, то задача сводится к аналогичной для любого неприводимого множите- множителя этого многочлена. Итак, пусть указан произвольный неприводимый над Р многочлен / (х) = аохп + а\хп~х + ... + Я/х-1* + яя A) степени п ^2. Ясно, что многочлен A) не имеет корней в поле Р. Предположим, что искомое расширение Р поля Р существует и а — корень f(x) в Р, так что /(а) = 0. Обозначим через Р(а) минимальное подполе поля Р, содержа- содержащее одновременно поле Р и элемент а. Существование Р (а) очевид- очевидно. Что можно сказать об этом подполе? Если g(x) — произвольный многочлен из Р[х], то ясно, что g(aNP(a). Обозначим через Р[а] множество всех элементов подполя Р(а)» которые можно представить в виде g(a), g(x)?P[x]. Известно (см. теорему 9.2), что если для многочленов ft (я), ft(*)» ф(*)> *!>(*)€ ? Р [х] имеют место равенства Ф (х) = ft (х) + ft (*), * (*) = ft (*) ?2 (*), то Ф («) = ft (а) + ?2 (а), * (а) = ft (а) §2 (а). Отсюда, согласно критерию подкольца (§ 5.4), можно заключить, что Я [а] есть подкольцо поля Р(а). Если #(а)?Р(а) и g(a)#0, то g(x) не может делиться на f(x). Но тогда из неприводимости f(x) следует, что /(х) и g(x) взаимно просты (см. § 9.3), и, значит, существуют многочлены и(х), v(x)?P[x], такие, что f(x)u(x) + g(x)u(x) = l B) {см. теорему 9.6). Равенство B) не изменится, если вместо перемен- переменного х подставить элемент а: f(a)u(a)+g(a)v(a)=l. А так как /(а) = 0, то g(a)v(a) = 1. Это означает, что элемент v(a)?P [а] является обратным элементу g(a), и, следовательно, всякий ненулевой элемент кольца Р[а] обратим. Таким образом, подкольцо Р[а] поля Р(а) является подполем поля Р, содержащим одновременно поле Р и элемент а. Но Р(а) есть минимальное подполе Р с таким условием, поэтому Р(а) = Р[а]. 181
Как видно, всякий элемент поля Р(а) можно представить в виде g (а), где g (х) — некоторый многочлен над полем Р. Разделим g (x) на f (х) с остатком: 8 (*) = f(x)q (х) + г (х), deg г (х) < deg / (х) = п. Тогда g (a) = f (a) q (а) + г (а), откуда g (а) = г (а), так как / (а) = = 0. Следовательно, всякий элемент р поля Р (а) можно записать в виде Р = К + М + ha? + ... + &я_1а«-», C) где bi?P, i = 1, 2, ..., /г—1. Если бы Р можно было записать в таком виде еще одним способом: Р = Со + Ci<z + *ааа + ... +<?я-1а«-1, D) где хотя бы при одном & скФЪк, то, вычитая из равенства C) ра- равенство D), мы получили бы, что т. е. а является корнем ненулевого многочлена степени ниже п. Следующая лемма показывает, что это невозможно. Лемма 11.1. Пусть f\x) — неприводимый многочлен над полем Р; Р — произвольное расширение Р и элемент а?Р — корень мно- многочлена f(x). Если а является корнем многочлена fi{x)?P[x], то fx(x) делится на fjx). > Над полем Р многочлены f(x) и fi(x) обладают общим де- делителем х — а и поэтому не являются взаимно простыми. Так как понятие взаимной простоты двух многочленов не зависит от выбора поля, то утверждение леммы следует теперь из свойств неприводи- неприводимых многочленов (см. § 9.3). ^ Тем самым доказана однозначность представления каждого эле- элемента Р?Р(а) в виде C). Рассуждения, которые мы провели, изучая подполе P(a)t натал- наталкивают на мысль о существовании тесной связи между Р(а) и коль- кольцом многочленов Р[х]. Если сопоставить каждому многочлену g (х) ? Р [х] элементу (а) ? ?Р(а), то получится гомоморфизм <р: Р[х]-*Р(а) кольца Р[х] на поле Р(а), которое можно рассматривать как кольцо. Обозначим через / ядро этого гомоморфизма: /-= Кегср. Тогда по теореме о го- гомоморфизмах колец поле Р (а) изоморфно фактор-кольцу Р[х]/1 коль- кольца Р[х] по идеалу /. Этот идеал состоит из многочленов g(x), для которых g(a)=0. Другими словами, / состоит из всех многочле- многочленов кольца Р[л'], для которых а является корнем. Согласно лемме 11.1, каждый такой многочлен должен делиться на f(x). Очевидно, верно и обратное. Таким образом, 182
Мы видим, что идеал / полностью определяется многочленом f(x) и не зависит от выбора поля Р. Это означает, что если Рг — еще одно расширение поля Р, содержащее некоторый корень а' много- многочлена /(#), и если Р(а')—минимальное подполе поля Р7, содержа- содержащее Р и а', то поля Р(а) и Р(а') изоморфны. __ Теперь ясно, как можно построить расширение Р поля Р, со- содержащее хотя бы один корень неприводимого многочлена / (х) ? €РМ- Рассмотрим главный идеал / кольца Р[х], порожденный эле- элементом f(x): Через Р обозначим фактор-кольцо Р[х]11. Напомним, как оно стро- строится. Элементами кольца Р являются смежные классы A (x) +/. Два многочлена лежат в одном смежном классе, если их разность при- принадлежит /, т. е. делится на f(x). Пусть h(x) — произвольный мно- многочлен из Р[х]. Разделив его на f(x) с остатком, получим А (*) = / (x) q (x) + г (*), deg г (х) < deg / (*). Тогда h{x)— r(x) = f(x)q(x), и, значит, h(x) + I = r(x) + I. Мы видим, что из каждого смежного класса можно выбрать в качестве представителя многочлен г(х), степень которого меньше n = d(tgf(x) (либо г(х)--=0). Так как разность двух таких многочленов не мо- может делиться на f(x), то все они лежат в разных классах. Поэтому имеется взаимно однозначное соответствие между смежными класса- классами фактор-кольца Р и многочленами кольца Р]х], степень которых меньше степени многочлена f(x). Смежные классы складываются и умножаются следующим образом: (Ai (*) -f Л + № (х) + I) = (Ах (х) + h2 (x)) + /, (Ах (х) + I) (A2 (x) 4 /) = К (х) А2 (х) + I. Относительно указанных алгебраических операций ~Р образует комму- коммутативное кольцо с единицей. Роль нуля играет идеал / = 0 + /, а единицей является смежный класс 1 +1- Проверим, будет ли фактор-кольцо Р полем. Пусть h(x) + I — ненулевой смежный класс Р, т. е. h(x) не делится на f(x). Так как f(x) неприводим, то h(x) и f(x) должны быть взаимно простыми многочленами, и, значит, существуют такие и(х), v(x)?P[x], что h (x) u(x) + f (x) v (х) =^ 1, откуда А (х) и (х) — 1 = / (х) v (x). Это озна- означает, что h(x)u(x) и 1 лежат в одном смежном классе, поэтому (h(x)+I)(u(x) + I) = h(x)u(x) + / - 1 + Л т. е. А (х) + 1 — обратимый элемент кольца Р. Так как каждый нену- ненулевой элемент кольца Р обратим, то Р — поле. Если а и b — различные элементы поля Р, то а-\- 1фЬ +1. 183
Поскольку (atl) + (b + l) = (a + b) + /, (a каждый элементна поля Р можно отождествлять со смежным клас- классом а + / поля Р, т. е. Р можно рассматривать как подполе поля Р. Остается указать какой-нибудь корень а многочлена / (х) из поля Р. Пусть /(*) = аохп + аххп-1 -+ ... + Я/1-i* + яЛ, ^6 Р. Поскольку мы теперь рассматриваем Р как подполе поля Р, то /(х) - (ао +/) ** 4- (а! + /)*"-i + ... + (ая_! + /) х + (аЛ + /). В качестве а возьмем смежный класс а = л; + /. Тогда /( ( ( (( ) ( ) ( + /) + (ап + I) - (ао^ + а,*"-* + ... + an-lX + аа) + I = f(x) + I - = 0 + /. Итак, /(а) есть нулевой элемент поля Р, т. е. а = х-\-1 — иско- искомый корень. Нами доказана принципиально важная Теорема 11.1 (теорема существования корня)- Для любого поля Р и любого неприводимого над Р многочлена f(x)9 cleg/(я) > > 0, существует расширение этого поля, содержащее хотя бы один корень этого многочлена. Все минимальные поля, содержащие поле Р и какой-либо корень многочлена f (х), изоморфны между собой. Замечание. Читателю будет полезно повторить доказательство теоремы су- существования корня для случая Р — R и / (х) = х2 -j- 1. Тем самым будет получек еще один способ построения поля комплексных чисел. Следствие 11.1. Для всякого многочлена f(x)?P[x] степени п > 0 существует хотя бы одно поле разложения. ^ Предположим, что f (х) не разлагается над полем Р на ли- линейные множители, и пусть <р (х) — один из его нелинейных непри- неприводимых множителей над Р. По теореме о существовании корня найдется расширение Р поля Р, содержащее корень <р (х). Если над Р многочлен f (х) все еще не разлагается на линейные множители, то снова перейдем к более широкому полю, содержащему корень од- одного из оставшихся нелинейных неприЕОдимых множителей. Очевид- Очевидно, понадобится не более чем п шагов, чтобы найти искомое поле разложения. ^ 11.2. Доказательство основной теоремы алгебры комплексных чисел Докажем, что гсякий многочлен степени /1^1 с комплексными (а следовательно, и с действительными) коэффициентами имеет в по- поле комплексных чисел хотя бы один корень. Для многочленов первой степени это утверждение тривиально. Рассмотрим произвольный квадратный многочлен f (х) с комплексны- 184
ми коэффициентами. Можно считать, что его старший коэффициент равен единице: / (л:) = х2 + рх + q. Выделяя полный квадрат, перепишем f(x) в виде Если / (л:) = 0, то Полученная формула совпадает с формулой для корней квадратного уравнения, известной читателю из курса средней школы. Так как из любого комплексного числа можно извлечь корни любой степени, то f(x) всегда имеет хотя бы один комплексный корень. Естественно было бы искать аналогичные формулы для корней многочленов более высоких степеней. Такие формулы для многочле- многочленов третьей и четвертой степеней были найдены математиками еще в XVI в. Затем начались долгие и безуспешные поиски формул, ко- которые выражали бы корни многочленов пятой и более высоких степе- степеней через коэффициенты этих многочленов при помощи операций сложения, вычитания, умножения, деления, возведения в степень и извлечения корня. Лишь в XIX в. было строго доказано, что таких формул не существует. Это обстоятельство не снимает, конечно, вопрос о существовании корней многочленов с действительными и комплексными коэффициентами. Впервые исчерпывающий ответ на этот вопрос дал Гаусс в 1799 г. Приведем доказательство основной теоремы, в котором исполь- используется теория симметрических многочленов и теорема 11.1. Покажем сначала, что доказательство основной теоремы сводится к доказа- доказательству существования комплексного корня для произвольного много- многочлена с действительными коэффициентами. Пусть f(x)eC[x), f (x) = аох" + агх»-1 + ... + ап. Рассмотрим многочлен ]{х) = аохп + а{хп-1 + ... + ап, который получается из f (х) заменой всех его коэффициентов сопря- сопряженными комплексными числами. Произведение I = UqX -f- u\X -f~ ... -f- &2/г есть многочлен с действительными коэффициентами. В самом деле, bk — У1п1а]> & — 0? 1» •• » 2я, 185
откуда h = Если мы сможем доказать, что g (x) имеет хотя бы один комп- комплексный корень а, то ?(«) =/(«)/(«)== О, и, следовательно, либо /(а) = 0, либо /(a) = Q В периом случае a есть искомый корень f(x). Если же /(а) = 0, то корнем многочле- многочлена f(x) должно быть комплексное число а. Действительно, из ао<хп l 0 после замены всех чисел, входящих в это равенство, на сопряжен- сопряженные числа следует равенство аоап + а{ап-1 + ... + ап - 0. Итак, мы можем ограничиться рассмотрением многочленов с дей- действительными коэффициентами. Лемма 11.2. Многочлен нечетной степени с действительными коэффициентами имеет хотя бы один действительный корень. '> Пусть / (х) 6 R [х] — произвольный многочлен степени п ;> I. Можно считать, что его старший коэффициент равен единице: Обозначим через А наибольшее из чисел \аг\, |я2|, ..., \ап\ и прове- проверим, что при | х\ > A -f- 1 + a2x"-2+ ... +ая\. A) Используя известные свойства модуля действительного числа: | а 4- &|^|a! + |6|, \ab\ = \a\\b\y получаем < ||||II+ ... 4 < + ... + 1) = Л(|*|" <ЛМ«/(|х|—1). Так как |л:|>Л+1, то \х\—1>Л, следовательно, Л|х|я/(|л:| — — 1)< А | х \п1А = | л: \п, что и доказывает неравенство A). Если f(x) — многочлен нечетной степени, то из неравенства A) следует, что при х > А + 1 / (л:) > 0, а при х < — (А + 1) /(,г) < 0. Так как всякий многочлен из R [л:] является непрерывной функцией, то найдется число а?[—(А 4 1), 4 + 1], такое, что /(а) = 0. ^ Доказательство основной теоремы комплексных чисел завершает Теорема 11-2» Всякий многочлен степени п^\ с действитель- действительными коэффициентами имеет хотя бы один комплексный корень. ^ Пусть / (х) — произвольный многочлен с действительными коэффициентами, имеющий степень n = 2kqt где q — нечетное число. Если k = 0, то по лемме 11.2 f(x) имеет комплексный (даже действи- действительный) корень. Применяя индукцию по k, будем считать теорему 186
доказанной для всех многочленов с действительными коэффициента- коэффициентами, степень которых делится на 2k~\ но не делится на 2k. Обозначим через Р поле разложения многочлена f(x), содержа- содержащее поле комплексных чисел С. Тогда Зафиксируем действительное число с и рассмотрим элементы по- поля Р вида Р/у = apj + c(at + аД i < /. B) Число элементов р/у-, очевидно, равно п(п— 1)/2 = 2kq{2kq — 1)/2 = 2^qBkq — 1) = 2*-у, где qr —q Bkq — 1) — нечетное число. Рассмотрим многочлен g(x) = П(х-$и) *</ из кольца Р[х]. Элементы р/7 являются его корнями и degg(#) = = 2*-у. Коэффициенты g"(#) являются элементарными симметрическими многочленами от piy-. Но, согласно представлению B), р/у- сами есть многочлены от аъ а2, ..., ап над полем действительных чисел. По- Поэтому коэффициенты g(x) есть многочлены над полем R от аъ а2 ..., ат причем даже симметрические многочлены. В самом деле, если поменять местами любые два элемента из аъ а2, ..., аЛ, то это при- приведет лишь к перестановке элементов р^, а коэффициенты многочле- многочлена g(x) не могут измениться при перестановке его корней. Итак, коэффициенты g(x) являются симметрическими многочле- многочленами над полем R от корней многочлена / (x)?R[x]. Поэтому они должны быть действительными числами (см. теорему 10.5), т. е. на самом деле S"(a:NRM. А так как степень g(x) делится на 2k~l, но не делится на 2k, то мы можем применить к g(x) предположение индукции и утверждать, что хотя бы один из корней р/у- многочлена g(x) должен быть комплексным числом. Таким образом, для любого действительного числа с можно ука- указать такую пару индексов t, /, где 1 ^i</^n, что элемент о^ау + + с (&i + а,-) является комплексным числом. Так как действительные числа образуют бесконечное множество, а для выбора пары *, j су- существует лишь конечное число возможностей, то найдутся два раз- различных действительных числа с± и с2, которым соответствует одна и та же пара индексов i, /, т. е. элементы а = aLaj + a {aL + ау), Ъ = а?ау + с2 (az + «у) C) являются комплексными числами. Из равенств C) вытекает, что сумма at + а,- и произведение есть комплексные числа: ai + aj == (а — b)Kci — С2)> aiaj = {сФ — с2а)/(с{ — с2). 187
Но тогда элементы at и ау. должны быть корнями квадратного уравнения с комплексными коэффициентами и, следовательно, сами должны быть комплексными числами. Мы нашли, таким образом, среди корней многочлена f(x) два комплексных корня, что и доказывает теорему. ^ 11.3. Многочлены с рациональными коэффициентами После детального изучения вопросов, связанных с существованием корней и неприводимостью многочленов над полями действительных и комплексных чисел, обратимся к самому малому числовому полю — полю рациональных чисел Q. Нас будут интересовать рациональные корни и неприводимость над Q многочленов из кольца Q[x]. Отметим, что если многочлен /M6QM имеет хотя бы один рациональный корень, то он приво- приводим над Q. Обратное, конечно, неверно, поскольку многочлен я4 + + 2л:2 + 1 = (х2 + IJ приводим над Q, но не имеет рациональных корней. Начнем с более простого вопроса о рациональных корнях много- многочленов с рациональными коэффициентами. Прежде всего заметим, что если коэффициенты многочлена / (л:) — рациональные числа, но не все целые, то, приводя их к общему знаменателю q и умножая / (х) на этот знаменатель, получим многочлен qf (x) с целыми коэффициен- коэффициентами. Ясно, что f(x) и qf(x) имеют одни и те же корни, поэтому можно ограничиться рассмотрением лишь многочленов с целыми коэффициентами. Будем называть такие многочлены целочисленными. Предложение 11-1- Если целое число а является корнем мно- многочлена f (x) с целыми коэффициентами, то а должно быть делите- делителем свободного члена этого многочлена. ^ Пусть /(*) = аохп + аххп~1 + ... л ап-\х + аП9 at 6 Z. По условию В этом равенстве Есе слагаемые, за исключением, быть может, аПУ делятся на а. Значит, и ап должно делиться на а. «4 Таким образом, если целочисленный многочлен f(x) имеет целые корни, то они содержатся среди делителей его свободного члена. А так как таких делителей (положительных и отрицательных) лишь конечное число, то Еопрос о нахождении целых корней многочлена / (х) решается за конечное число шагов, например, с помощью схемы Горнера. 188
Испытание всех делителей свободного члена может оказаться весьма громоздким. Следующее замечание позволит несколько сократить эти вычисления. Замечание. Так как 1 и —1 всегда являются делителями свободного чле» на, то несложные вычисления /A) и /(—1) неизбежны. Пусть теперь а — произвольный целый корень /(*), т. е. f(x) = (x-a)q(x). Так как коэффициенты частного q (х) можно найти по схеме Горнера, то ясно, что q (х) — целочисленный многочлен и, значит, #A) и q(—1) — целые числа. Но тог- тогда / A) = —(а— 1) q A), /(— 1) = — (а+ 1) q (— 1), и, следовательно, а — 1 и а + 1 соответственно делят /A) и /(—1). Это означает, что из делителей свободного члена / (х) следует выбирать для проверки лишь те делители а (а ^ ±1), Для которых каждое из частных / A)/(ос — — 1)> /(—0/(а + 0 является целым числом. Пример 11.1. Найти целые корни многочлена / (х)—6х* + 19*3—7л;2—26х+12. Решение. Делителями свободного члена 12 служат числа +1, +2, +3, Н~4, ±6, +12. Так как / A) = 4, /(—1) = 18, то 1 и —1 не являются корнями f(x). Составим таблицу: О О —6 12 —12 4/1 4/—3 | 4/2 | 4/—4 4/3 4/—5 4/5 f 4/—7 4/11 4/—13 18/3 18/4 18/—2 В третьей строчке этой таблицы достаточно заполнять клетки, соответствующие числам а, для которых /A)/(а—1) — целое число. Таким образом, подлежат проверке лишь числа 2 и —3. Применим схему Горнера: 19 -7 —26 12 19 —7 —26 12 31 55 84 180 —3 1 | —10 Отсюда / B) = 180, / (—3) = 0, т. е. многочлен / (х) имеет единственный целый корень —3. Вопрос о рациональных корнях целочисленных многочленов сво- сводится к уже решенной задаче нахождения целых корней таких мно- многочленов. Предложение 11*2* Если целочисленный многочлен, старший ко- коэффициент которого равен единице, имеет рациональный корень, то этот корень является целым числом. > Если многочлен n~i л. а2х*-2 + ... + ап с целыми коэффициентами имеет корнем несократимую дробь plqy то pn/qn + aipn-4qn-l+a2pn-4qn-2+ ... + ап = 0, откуда pnlq = — — a2pn~~2q — ... — 189
Это означает, что q делит рп и, следовательно, q делит р, т. е. при- приходим к противоречию. <4 Пусть теперь есть произвольный целочисленный многочлен. Умножив его на получим 7 + ах (аох)»-1 + а2а0(а0х)п~2 + ... + a^ar 1 Многочлены f{x) и ао lf(x) имеют одни и те же корни. Если а — рациональный корень многочлена f(x), то, очевидно, Р = аоа является рациональным корнем целочисленного многочлена S(У) = Уп + а\Уп~1 4 ci2a0yn-2 + ... + an-\al~2y + ando~~\ старший коэффициент которого равен единице. Рациональные корни такого многочлена, согласно предложению 11.2, должны быть целы- целыми и, значит, могут быть найдены указанным методом. Если р — лю- любой из целых корней многочлена g(y), то а = р/#0 будет рациональ- рациональным корнем многочлена a%~lf(x), а следовательно, и f(x): ао I ' 1 [ ° ао ) 2 Vflo п- а0 Тем самым доказано Предложение 11-3- Множество всех рациональных корней мно- многочлена f(x) совпадает с множеством всех целых корней многочле- на ё{у)> деленных на старший коэффициент f{x). Пример 11.2. Найти рациональные корни многочлена f (х) = 4х* — 7х2—Ьх—\. Решение. Выпишем многочлен g(y), соответствующий f (х): 43/ (Х) = D*х4) — 7-4 D2х2) — 5 • 42 D*) — 43 = DхL — 28 (АхJ — 80 D*) — 64. Отсюда g (у) = г/4 — 28f/2 — SOy — 64. Определим целые корни многочлена g(y). Делителями свободного члена —64 = —26 являются целые числа +1, +2, +4, ±8, ±16, ±32, ±64. Поскольку ?A)=»—171, g (— 1) =» —11, то числа 1 и —1 не являются корнями g(y). SO) (a-1) sr(-i) (a+1) 2 — 171 1 —11 3 —2 — 171 -3 — И — 1 4 — 171 3 — 11 5 —4 —171 —5 8 — 171 7 —8 — 171 —9 — 11 Y 16 — 171 15 -16 — 171 — 17 32 — 171 31 -32 —171 —33 64 —171 63 —64 — 171 —65 Как и в примере 11.1, в третьей строке данной таблицы заполнены лишь те клет- клетки, которые соответствуют чяслш а с целым числом g(l)/(a— 1). 190
Как видно, лишь для —2 каждое из частных g(l)/(a— 1) и ?(—1)/(«+ О является целым числом. Проверим, будет ли —2 корнем многочлена g (у): I 1 о —28 —80 —64 -2 | 1 | —2 | —24 ! —32 | 0 Итак, g (—2) = 0, следовательно, —2 — единственный целый корень g(y). Поэтому —2/4 = —1/2 — единственный рациональный корень / (х). Перейдем к Еопросу о приводимости многочленов над полем Q. Если f(x)?Q[x] умножить на общий знаменатель q всех его ко- коэффициентов, то получится многочлен qf(x)?Z[x]. Многочлены f(x} nqf(x) одновременно приводимы или неприводимы над полем Q. Следует ли отсюда, что при изучении неприводимости многочленов с рациональными коэффициентами можно ограничиться рассмотрением многочленов с целыми коэффициентами? Покажем, что если многочлен / (л*) ? Z [х] есть произведение двух многочленов меньшей степени над полем Q, то f(x) можно предста- представить в виде произведения двух целочисленных многочленов той же степени. Другими словами, многочлен с целыми коэффициентами, неприводимый над кольцом целых чисел, будет неприводимым и над полем рациональных чисел. Определение 11.1. Многочлен с целыми коэффициентами на- называется примитивным, если наибольший общий делитель всех его коэффициентов равен единице. Всякий многочлен <р (х) с рациональными коэффициентами можно представить в виде произведения несократимой дроби на некоторый примитивный многочлен f(x), т. е. q>(x) = (a/b)f(x), причем такое представление определено однозначно, с точностью до знака. Для этого следует вынести за скобки общий знаменатель всех коэффи- коэффициентов многочлена ф(#), а затем — наибольший общий делитель оставшихся целочисленных коэффициентов. Если где /х (х) — тоже примитивный многочлен, то Обе части равенства A) есть целочисленный многочлен. Из прими- примитивности / (х) и /i (x) вытекает, что ab± и Ьаг совпадают (с точностью до знака) с наибольшим общим делителем коэффициентов этого мно- многочлена. Значит, abx— ±baly alb = ±a1/blin9 следовательно, f(x)=±fi(x). Для примитивных многочленов справедлива Лемма 11.3 (лемма Гаусса). Произведение двух примитивных многочленов есть примитивный многочлен. ^ Пусть даны примитивные многочлены /(х) = а&ь + a{xk~l + ... +ak9 g(x) = bGxs + bxx^ + ... + bS9 191
и пусть / (х) g (х) = coxk+s + dxk+s~l + ... + ck+8. Если произведение f(x)g(x) не примитивно, то найдется простое число р, которое служит общим делителем для всех коэффициентов с0, съ ..., Ck+s- В силу примитивности многочлена f(x) все его коэф- коэффициенты не могут делиться на р. Пусть коэффициент щ будет пер- первым, не делящимся на р. Аналогично через bj обозначим первый коэффициент многочлена g(x), не делящийся на р: По условию Ci+j> fl/_i, a/_2, ..., b/-u bj-2y ••• делятся нар. Но тогда и произведение afy должно делиться на р, а так как р простое, то на р должен делиться хотя бы один из коэффициентов alt bJy что противоречит выбору этих коэффициентов. <4 Рассмотрим теперь произвольный многочлен g(x) с целыми коэф- коэффициентами, приводимый над полем Q, и покажем, что он приводим над кольцом Z. Пусть где Фх(х), Ф2(х)—-многочлены с рациональными коэффициентами, степени которых меньше степени g(x). Представим каждый из q>L(x) в виде произведения несократимой дроби ajbt и примитивного мно- многочлена ft (x): <Pi (х) = ((hlbi) h (х), Ф2 (х) - (а2/6а) h (х)\ тогда Предположим, что дробь а1а2/F162) не является целым числом. Тогда ее можно записать в виде несократимой дроби plq, (p, q) =]1, ^ ^= + ]. Так как g (x) — целочисленный многочлен, то каждый коэф- коэффициент произведения fi(x)f2(x) должен делиться на q. Но это про- противоречит тому, что по лемме Гаусса /х (х) /2 (х) — примитивный много- многочлен. Следовательно, а1а2/F162) = а — целое число и g (х) = [af^x)] X X /2 (х) — разложение многочлена g (x) на множители меньшей степени с целыми коэффициентами. Теперь можно решать вопрос о приводимости целочисленных мно- многочленов, не выходя за пределы кольца Z [х]. Теорема 11-3 (критерий Эйзенштейна)- Пусть дан многочлен f (х) = аохп + а{хп-1 + ... +an-ix + an с целыми коэффициентами. Если существует простое число р, для которого: 1) старший коэффициент aQ не делится на р, 2) все остальные коэффициенты делятся на р, 3) свободный член ап не делится на р2, то многочлен f (x) неприводим над полем рациональ- рациональных чисел. 192
> Пусть искомое простое р существует, и предположим, что многочлен f(x) приводим над полем Q. Тогда он должен быть при- приводим и над кольцом Z, разлагаясь на два множителя меньшей сте- степени с целыми коэффициентами: / (х) = (boxk + b{xk~l + ... + bk-ix + bk) (coxs + c{xs-i + ... + cs-ix+ + cs)9 k<n, 5 < /г, k + s = n. B) Так как ап = bkcs и ап делится на p, но не делится на р2, то один из множителей bk, cs делится на р, а второй взаимно прост с р. Пусть, например, Ьк делится на р, a cs на р не делится. Покажем, что в этом случае все коэффициенты 60, Ьъ ..., bk первого сомножи- сомножителя делятся на р. Действительно, сравнивая коэффициенты при одинаковых степе- степенях неизвестного в обеих частях равенства B), записываем ап-\ = bk-\cs + bkCs-u CLn-2 = bk-2Cs + bk-lCs-l + bkCs-2, an~k = bocs + b{Cs-i + b2cs-2 + . В последнем равенстве выписаны лишь те слагаемые, которые су- существенны для дальнейших рассуждений. Рассмотрим первое из ра- равенств C). Так как ая_i и bk делятся на р, то на р должно де- делиться и произведение bk—\Cs. Так как, однако, cs не делится на р, то на р будет делиться bk~\. Переходя ко второму равенству, заме- замечаем, что аЛ_2, bk-\ и Ък делятся на р, и, следовательно, на р долж- должно делиться произведение bk~2Cs. Это означает, что р делит 6^_2 и т. д. Наконец, из последнего равенства получаем, что р делит Ьо. Но если Ьо делится на р, то на р должно делиться и произведение bocQ = а0, а это противоречит условию теоремы. ^ Вопреки сЕоему названию, критерий Эйзенштейна является лишь достаточным условием неприводимости над полем Q, но отнюдь не необходимым. Тем не менее он позволяет легко написать для любо- любого п целочисленные многочлены /г-й степени, удовлетворяющие усло- условиям критерия и, следовательно, неприводимые над полем рациональ- рациональных чисел. Таков, например, многочлен хп + 2, удовлетворяющий критерию Эйзенштейна при р ~ 2. То обстоятельство, что в отличие от полей R и С над полем Q существуют неприводимые многочлены сколь угодно большой степе- степени, приводит к весьма глубокой и далекой от завершения теории алгебраических чисел, играющей важную роль в математике. 11.4. Алгебраические числа Нам уже известно, что всякий многочлен с рациональными коэф- коэффициентами степени п ^ 1 имеет в поле комплексных чисел хотя бы один корень. Однако не всякое комплексное (действительное) число служит корнем какого-либо многочлена над полем Q. Определение 11.2. Комплексное число а называется алгеб- алгебраическим, если существует многочлен f(x)^Q [x], для которого а 7 Зак. 3670 193
является корнем. Если такого многочлена не существует, то чис- число а называют трансцендентным. Всякое рациональное число а служит корнем многочлена х — а и, значит, есть число алгебраическое. Алгебраическими числами бу- будут и все корни п-й степени из любого рационального числа а, так как они являются корнями многочлена хп— а. Если а — корень многочлена / (х) ? Q [x] uf(x) = U(x)f2(x) • • • fs(x) есть его разложение на неприводимые над Q многочлены, то ясно, что а будет корнем одного из таких сомножителей. Этот неприводи- неприводимый над Q многочлен определяется числом а однозначно с точностью до числового множителя. Действительно, если а служит корнем двух неприводимых мно- многочленов <р(х) и ij)(x), то наибольший общий делитель этих много- многочленов отличается от единицы. Это означает ввиду их неприводи- неприводимости, что ф(х) и ^(х) могут отличаться друг от друга лишь чис- числовым множителем. Теорема 11.4.. Множество всех алгебраических чисел является подполем поля комплексных чисел. > Покажем, что сумма, разность, произведение и частное алгеб- алгебраических чисел сами будут алгебраическими числами. Пусть а и р— произвольные алгебраические числа, которые слу- служат корнями некоторых многочленов/(х), g(x)?Q[x] соответственно. Рассмотрим произведение ф (х) = / (х) g (х)у ф (х) ? Q [x], deg ф(д:) = п. Многочлен (р(х) разлагается над полем С в произведение линей- линейных множителей: <р(х) = а(х — ах)(х — а2) ... (х — ап). Можно считать, что а = аъ р = а2. Выпишем многочлен i, ji Kj корнями которого служат всевозможные суммы щ + а;-, i < /. Коэф- Коэффициенты этого многочлена есть элементарные симметрические мно- многочлены от щ + ocj и, следовательно, многочлены над полем Q от а1у а2, ..., ап. Если поменять местами какие-либо два корня аь и а;-, то, очевидно, многочлен ty(x) не изменится. Следовательно, коэффи- коэффициенты ty(x) являются симметрическими многочленами над полем Q от корней <хь а2, ..., ап многочлена ф(д:) с рациональными коэффи- коэффициентами. Поэтому ty(x) — многочлен над полем Q, а его корни — в том числе и аг-{- а2 = а -{- ^ — алгебраические числа. Аналогично доказывается алгебраичность числа сф. Надо лишь вместо aL + О/ рассматривать числа аре,;. Для доказательства алгебраичности разности а— |3 и частного а/($ достаточно показать, что —13 и (З-1 есть числа алгебраические. Пусть g(P) - 0 и g (x) - boxk + bxxk-1 + ... + bk-ix + bkt bt e CL Если 194 g2 (x) - bkxk + bk-ixk~l + ... + bxx + b0,
то ^_ Из теоремы 11.4 следует, например, что числа У 3 +1^2 и 3 —— 5 г - V 2 • у 3 являются алгебраическими. Однако мы не можем пока утверждать алгебраичность чисел вида //3 +V % • Теорема 11.5. Множество всех алгебраических чисел является алгебраически замкнутым полем, т. е. корень многочлена, коэффи- коэффициенты которого — алгебраические числа, есть число алгебраическое. > Пусть многочлен / (х) = aoxk + axxk~l + ... + ak-\X + ak имеет своими коэффициентами алгебраические числа. И пусть р— произвольный комплексный корень f(x). Покажем, что тогда р являет- является корнем некоторого многочлена с рациональными коэффициентами. Так как а0, аъ ..., ak — алгебраические числа, то существуют та- такие многочлены cpo(#), cpi(#)> •••> Ф*М с рациональными коэффи- коэффициентами, что Ф/(аг) = 0, 1 = 0, 1, ..., k. Многочлен <р (х) = фо(х)X Хфх(л:) ... фЛх) тоже имеет рациональные коэффициенты, и числа а0) аъ ..., ап содержатся среди его корней. Пусть clegф(х) = п и ф(л:) = а(х — «!)(# — а2) ### (Jf — aJ>af?C. Можно считать, что «! = а0, а2 = ах, ..., a^+i = a^. Пусть теперь t, /, ..., s, f — произвольный набор из k+ 1 индек- индексов без повторений, принимающих значения 1, 2, ..., п. Всякому та- такому набору можно поставить в соответствие многочлен ///... st (x) = atxk + ajxk-1 + ... +оус + a/f так что f\2 ...kk+i(x) == f(x)- Рассмотрим произведение всех таких многочленов: F(x)= П U,...*{x). ?, /, .... s, t Коэффициенты F(x) есть многочлены с рациональными коэффициен- коэффициентами от а1э а2> ..., ап и, очевидно, не зависят от перестановки этих чисел, т. е. являются симметрическими многочленами над полем Q от корней многочлена ф(хNС1М- Поэтому коэффициенты F(x) — рациональные числа, и в то же время F(p) = 0, так как fa ... k k+\{$) = /(Р) о з _ 5_ Теперь уже без труда проверяется, что число р = }/]/ +)/2 является алгебраическим. В самом деле, алгебраичность числа а = = У 3 + V"^ Уже установлена, так что р есть корень многочлена х3 — а с алгебраическими коэффициентами. Вообще, всякое число, записываемое в радикалах над полем ра- рациональных чисел, будет алгебраическим числом. Мы оставили пока без ответа вопрос о существовании трансцен- трансцендентных чисел. Первым числом, трансцендентность которого была строго доказана, оказалось число Лиувилля: a = 1/10 + 1/Ю2! + 1/Ю3! + 1/104! + .., 7* 195
названное так по имени французского математика Ж- Лиувилля, су- сумевшего указать это число и доказать его трансцендентность. Лиувилль опирался на следующую доказанную им теорему. Теорема US (теорема Лиувилля*) Если а — корень непри- неприводимого многочлена с рациональными коэффициентами степени /г^2, то существует положительная постоянная у3 зависящая только от а, и такая, что для всех целых р, q ^ Можно считать, что а — корень неприводимого над Q многочлена / (х) = аохп + а{хп~1 + ... +ап с целыми коэффициентами, а0ф0. Будем смотреть на f(x) как на непрерывно дифференцируемую функцию действительного перемен- переменного. Можно ограничиться рассмотрением лишь тех рациональных чисел p/q9 которые лежат в интервале между а— 1 и <х + 1. Произ- Производная f'(x) на отрезке [а—1, а+ 1] ограничена, т. е. существует такое число М, что | /' (х) |<М при х 6 [а — 1, а + 1]. Далее, qn яп поскольку f (p/q)=?0 и \a0pn + axpn~xq + ... +anqn\ — целое число. Согласно теореме о среднем из курса математического анализа, между а и p/q найдется такое число х0, что = (a-p/q)f'(x0). Так как / (а) = 0, a x0 g [а — 1, -а + 1 j, то откуда Таким образом, можно взять у ~ l/M. ^ Нетрудно проверить, что если а — число Лиувилля, то 0 < а — — A/10+ 1/Ю2!+ ... +1/Ю*!)<2/10(^1)!. Если положить 1/10 + /! /!У*! то О < а _ Если бы а было числом алгебраическим, то по теореме 11.6 на- нашлись бы положительная постоянная у и такое фиксированное на- натуральное /г, что 0<а — 196 .
Отсюда следовало бы, что при всех k или а это невозможно, если k достаточно велико. Тем самым доказана трансцендентность числа Лиувилля. Отметим также трансцендентность числа е — основания системы натуральных логарифмов — и известного из школьного курса гео- геометрии числа п.
Раздел 2 ЭЛЕМЕНТАРНАЯ АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ 12. ВЕКТОРЫ И КООРДИНАТЫ Координаты составляют основу метода аналитической геометрии. При изучении прямых и плоскостей большую роль играют векто- векторы. В данной главе рассматриваются основные положения вектор- векторной алгебры и метода координат. 12.1. Понятие вектора Отрезок прямой, для которого указано, какая из двух ограни- ограничивающих его точек является началом и какая концом, называется направленным отрезком. Направленный отрезок, началом которого является точка Л, а концом — точка В, обозначается символом АВ. На рисунке направленный отрезок изображается стрелкой, идущей от начала к концу. Для задания направленного отрезка достаточно указать его начальную и конечную точки, т. е. упорядоченную па- пару точек. Не исключается из рассмотрения и тот случай, когда точки упорядоченной пары совпадают (А = В). Таким образом воз- возникает понятие нулевого отрезка АА. В дальнгйлзм, рассматривая направленные отрезки, слово «направленный') часто будем опускать. Два отрезка АВ и CD будем назызать равными и записывать АВ = CD в том и только в том случаэ, когда А = С и В =: D. Выберем масштабную единицу для измерэния длины. Длину от- отрезка АВ, измеренную этой единицей, обозначим символом |Л5|. Длина нулевого отрезка равна нулю, длина ненулевого отрезка — положительное число. Пусть заданы два ненулевых направленных отрезка АВ и CDy лежащих на двух различных параллельных прямых. Проведем че- через точки А и С плоскость П, не проходящую через точки В и D. Плоскость П разделит множество всех точек пространства, не при- принадлежащих этой плоскости, на два полупространства. Если точки В и D лежат в одном и том же полупространстве, то говорят, что отрезки АВ и CD одинаково направлены. В противном случае назо- назовем отрезки АВ и CD противоположно направленными. Пусть те- теперь отрезки АВ и EF лежат на одной прямой. Будем говорить, что эти отрезки одинаково направлены, если существует третий от- отрезок CD, который одинаково направлен с каждым из отрезков АВ и EF. В противном случае отрезки АВ и EF называют противопо- противоположно направленными. Наконец, будем считать, что нулевой отре- отрезок одинаково направлен с любым отрезком. Два отрезка АВ и CD будем называть эквивалентными и запи- записывать АВ ~ CD, если они имэют одну и ту же длину и одинако- 198
во направлены. Легко видеть, что эквивалентность направленных отрезков обладает свойствами рефлексивности, симметричности и транзитивности и поэтому является отношением эквивалентности на множестве всех направленных отрезков (см. § 3.2). Множество всех направленных отрезков разбивается на непересекающиеся классы эквивалентных друг другу отрезков. Определение 12.1 Вектором называется класс эквивалент- них направленных отрезков. Для задания такого класса, т. е. вектора, достаточно указать какой-либо один отрезок из этого класса. С другой стороны, любой на- направленный отрезок АВ задает вполне определенный вектор, а имен- именно: класс отрезков, эквивалентных отрезку АВ. Вектор, определя- определяемый отрезком АВ, обозначается символом АВ. Тот же самый век- вектор определяется любым отрезком CD ~ АВ. Равенство векторов —>¦ —>• АВ = CD по определению равносильно условию АВ ~ CD, т. е. век- векторы АВ и CD называются равными, если они составлены из одних и тех же направленных отрезков. Для обозначения векторов будем пользоваться также малыми латинскими буквами, выделенными жир- жирным шрифтом, — а, Ь. Нулевой вектор, т. е. класс всех нулевых отрезков, будем обозначать символом 0. Для изображения вектора а на рисунке используют какой-либо из направленных отрезков, пред- представляющих этот вектор. Пусть заданы вектор а и точка А. Очевидно, существует един- единственная точка В, такая, что АВ = а. A) Операцию построения направленного отрезка АВ, для которого имеет место равенство A), будем называть откладыванием вектора а от точки А. Длиной вектора а называется длина любого из направленных отрезков, образующих вектор а. Длина вектора а будет обозна- обозначаться символом |а|. Пусть заданы два вектора а и Ь. Отложим оба этих вектора от какой-либо одной точки О, т. е. построим такие отрезки О А и ОВ, что О А = а и ОБ = Ъ. Тогда углом между векторами а и b назо- назовем величину угла между отрезками ОА и ОВ. Очевидно, угол меж- между векторами аи b не зависит от выбора точки О. Направленный отрезок АВ называется параллельным прямой А (плоскости П), если прямая, на которой он расположен, параллель- параллельна прямой А (плоскости П). Нулевой отрезок по определению па- параллелен любой прямой (плоскости). Векторы аь а2, ..., а& называ- называются коляинеарными (компланарными), если образующие их на- направленные отрезки параллельны некоторой прямой (плоскости). Дадим векторам еще одно истолкование. Пусть задан вектор АВ, т. е. класс отрезков, эквивалентных направленному отрезку АВ. Рассмотрим преобразование пространства, переводящее произвольную 199
его точку С в такую точку Д что CD ~ AB. Такое преобразование называется параллельным переносом. Таким образом устанавливается взаимно однозначное соответствие (биекция) между множеством всех векторов и множеством всех параллельных переносов. В силу этого параллельные переносы также называют векторами. Если в пространстве фиксирована некоторая плоскость П и рас- рассматриваются только те точки, которые принадлежат этой плоско- плоскости, то под вектором будем понимать класс эквивалентных отрез- отрезков, принадлежащих плоскости П. Аналогично вводятся векторы на прямой. Замечание. Во многих книгах направленные отрезки называют связанны* ми векторами или просто векторами. В этом случае вектор в нашем смысле на- зывается свободным вектором. Упражнения 1. Введите понятия одинаково направленных и противоположно направленных отрезков с помощью лучей. 12.2. Сложение векторов Пусть заданы два вектора а и Ь. Возьмем какую-либо точку О и отложим от нее вектор а, т. е. построим такой отрезок ОА, что ОА = а. Далее, от точки А отложим Ь, т. е. построим такой отре- отрезок АВ, чтоАВ = Ъ (рис. 32.1). Определение 12.2. Вектор, определяемый отрезком ОВ, на - зывается суммой векторов а и b и обозначается а -+~ Ь. Очевидно, сумма а + Ь не зависит от выЗора точки О. Указанный способ построения вектора a +¦ Ь назызаэтся прлзи- лом замыкающей. Пусть а и b — неколлинеарные векторы. Огложим оба этих век- вектора от одной точки О (рис. 12.2), т. е. найдем такие точки А и В, что ОЛ = а и ОВ = Ь. В плоскости, определяемой точками О, Л и Ву построим параллелограмм ОАСВ на сторонах ОА и OS. Так как ЛС = b и fiC = а, то ОС = а + Ь==Ь + а. A) 200
Итак, мы получили новое правило построения суммы двух не- коллинеарных векторов — правило параллелограмма: чтобы найти сумму двух неколлинеарных векторов а и Ь, надо отложить эти век- векторы от одной точки О и построить на полученных направленных отрезках, как на сторонах, параллелограмм; направленный отрезок, совпадающий с диагональю этого параллелограмма и выходящий из точки О, определит сумму а -(- Ь. Равенство A) показывает, что сумма двух неколлинеарных век- векторов не зависит от порядка слагаемых. Справедливость этого свой- свойства для коллинеарных векторов легко получается из правила за- -—— a a+b a —' i i № 1 „ Рис. b 12.3 a i B+b ! h+a ж! b l/la+bhc^\ ® a+(b+cj Рис. 12.4 8 \ t* | & С мыкающей как в случае соиаправленных (рис. 12.3, а), так и в слу- случае противоположно направленных векторов (рис. 12.3, б). Таким образом, операция сложения векторов подобно операции сложения чисел коммутативна. Пусть даны три вектора а, Ь, с. Отложим от произвольной точ- точки О (рис. 12.4) вектор а, т. е. построим такую точку Л, что ОА = а. Далее построим точку Б, такую, что АВ = Ь. По определе- определению суммы векторов ОВ = а + Ь. Прибавим теперь к этому вектору вектор с. Для этого построим точку С, такую, что ВС = с. Имеем ОС - (а + Ь) + с. B) С другой стороны, АС — b -j- с и, следовательно, ОС = а + (Ь + с). C) Сопоставляя равенства B) и C), получаем (а + Ь) + с = а + (Ь + с). Итак, сложение векторов ассоциативно. Отметим, что нулевой вектор 0, т. е. класс всех нулевых отрез- отрезков, играет роль нейтрального элемента для операции сложения векторов: для любого вектора а а + 0 = 0 + а = а. Пусть а — произвольный вектор. Построим какой-либо направ- направленный отрезок АВ, определяющий вектор а. Вектор, определяемый направленным отрезком В А, называется противоположным вектору а и обозначается —а. Очевидно, вектор —а является противопо- 201
ложным элементом для а относительно операции сложения векто- векторов, т. е. а + (—а) = 0. Таким образом, множество всех векторов есть абелева группа от- относительно операции сложения (см. § 5.2). Как и во всякой абелевой группе, можно определить разность а — Ь = а + (—Ь) векторов а и Ь. Если отложить векторы а и b от одной точки О, т. е. найти такие точки Л и В, что ОА = а и О?=Ь (рис. 12.5), то a— b= BA. Упражнения 1. Введите понятие суммы п векторов. 12.3. Умножение вектора на число Определение 12.3. Произведением век- вектора а на действительное число X называет- называется вектор, который обозначается Яа и опреде- Рис. 12.5 ляется следующими условиями: а) длина векто- вектора Яа равна | Я| • |а|, т. е. произведению моду- модуля числа X и длины вектора а; б) векторы а и Яа имеют одно и то же направление, если X > 0, и противоположные направления, если Я < 0. Отметим основные свойства произведения вектора на число: 1) 1а = а; Эти два свойства произведения непосредственно вытекают из оп- определения 12.3; з) \. . ;.. Длина вектора, стоящего в левой части C), равна |Я|||ла| = j Я| |fi||a|. Этому же числу равна и длина вектора, стоя- стоящего в правой части этого равенства. Если I Я| • | fi| • |а| =^= 0, то направления векторов, стоящих в обеих частях рассматриваемого ра- равенства, также одинаковы. Эти векторы имеют направление, одина- одинаковое с направлением вектора а, если числа Я и \i одного знака, и направление, противоположное направлению вектора а, если Я|л < 0; 4) Я (а + Ь) - Яа + ЯЬ. Равенство очевидно в следующих случаях: а) Я = 0; б) а = —Ь; в) по крайней мере, один из векторов а и Ь-нулевой. Исключим эти случаи из дальнейшего рассмотрения. Пусть Я > 0 и векторы а и b не коллинеарны. Возьмем произ- произвольную точку О и построим точки А и В так, чтобы ОА = а, АВ = b и, следовательно, ОВ = а + b (рис. 12.6). Далее найдем точки Аг и В', такие, что OAf = Яа, ОВГ = Я (а 4- Ь). A) 202
Треугольники ОАВ и ОА'ВГ подобны, так как они имеют общий угол, и стороны, заключающие этот угол, пропорциональны. Отсю- Отсюда следует, что 1 А'В'\ = | А, \ • j АВ |. Но так как векторы АВ и А'В' имеют, кроме того, одно и то же направление, то А'В' = ЯЬ. B) Четвертое сеойстео Еытекает из сопоставления равенств A) и B). Пусть % }> 0, а Еекторы а и b коллинеарны. Возьмем произволь- произвольную точку О (рис. 12.7) и построим точки А и В так, чтобы ОА = а, АВ = Ь. В О Выделим какую-либо точку S, не лежащую на прямой ОАВ, и построим лучи «SO, SA и SB. Найдем на луче SO такую точку О', что |50/(= X{SO{y и проведем через нее прямую Л, параллельную прямой ОВ. Пусть прямая А пересекает луч 5Л в точке А\ а луч SB в точке В'. Мы получили три пары подобных треугольников: /\OAS™/\O'AFS, AABS^AA'B'S, AO'B'S.i Отсюда Теперь четвертое свойство очевидно. При % < 0 доказательство про- проводится аналогично и предоставляется читателю; 5) (Я + \л) а = Ха + [га. Равенство очевидно, если: а = 0; б) Л, + [г = 0; в) по крайней мере, одно из чисел Я, \х равно нулю. Исключим эти случаи из дальнейшего рассмотрения. Пусть X и \i имеют одинаковые знаки. Очевидно, что векторы, стояшие в левой и правой частях раЕенстЕа пятого свойства, имеют одно и то же направление. Покажем, что длины этих векторов так- также одинаковы: Если X и [г имеют разные знаки и, например, |А,|>||г|, то чис- числа Я + [г и —[г одного знака, и на основании уже доказанного 203
(X + ii) a + (—jx) a = (X + [x — fx) a = A,a, что равносильно пятому свойству. С помощью метода математической индукции можно распростра- распространить четвертое и пятое свойства на любое конечное число слагае- слагаемых, т. е. доказать равенства: Докажем, например, первое из этих равенств. Оно уже доказано для k = 2. Предположим, что оно справедливо для k—1 слагае- слагаемых (k > 1), и докажем его для k слагаемых: Второе равенство доказывается аналогично. Упражнения 1. Для того чтобы двз вектора а и b / 0 были коллинеарны, необходимо и достаточно, чтобы существовало такое число X, что а =» ХЪ. Докажите. 12.4. Проекции Ось. Возьмем произвольную прямую. Назовем одно из двух на- направлений этой прямой положительным и отметим его на рисунке стрелкой. Противоположное направленна назовем отрицательным. Прямая, на которой выбрано положительное направление, называ- называется осью. Выберем на оси А какой-либо ненулевой отрезок в качестве масштабной единицы для измерения длины. Назовем величиной на- направленного отрезка АВ оси А и обозначим символом (АВ) число, равное \АВ\, т. е. длине отрезка АВ, если отрезок АВ и ось А имеют одно и то же направление, и равноэ — \АВ\, если отрезок АВ и ось А имеют противоположные направления. Очевидно, что величина нулевого отрезка равна нулю и (ВА) =—(АВ). Теорема 12-Ь Для любых трех точек А, В, С оси, на кото- которой выбрана масштабная единица, имеет место следующее соот- соотношение > Если все три точки А, В, С различны, то их взаимноэ располо- расположение может быть таким, как указано на рис. 12.8. Кроме того, возможны случаи, когда две из точек А, В, С или все три совпа- совпадают. В первом случае (см. рис. 12.8), согласно равенству A), дли- длина отрезка равна сумме длин его частей, и, следовательно, оно спра- справедливо. Во втором случае (СА) + (АВ) = (СВ)=^(АВ) — (СВ) = = — {СА) => {АВ) + (ВС) = (АС). Пусть теперь точки А и В совпадают. Тогда (АВ) + (ВС) = = (АА) + (АС) = 0 + (АС) = (АС), т. е. равенство A) верно. Про- Проверка остальных случаев предоставляется читателю. 4 204
Проекция на ось в пространстве. Пусть А — некоторая ось и П — плоскость, не параллельная А (рис. 12.9). Через произвольную точ- точку А проведем плоскость Пь параллельную плоскости П. Плоскость Пх пересечет ось А в некоторой точке А'. Точка А' называется про- екцией тонки А на ось А параллельно плоскости П. Если плоскость П перпендикулярна к оси А, то проекция называется прямоуголь- прямоугольной или ортогональной; в этом случае точка Аг является основа- основанием перпендикуляра, опущенного из точки А на ось А. А С А С В в в А 0 В А С С В В А G А п Рис. 12.8 Рис. 12.9 Возьмем произвольный направленный отрезок АВ. Проектируя точки Л и Л на ось А параллельно плоскости П, получаем на этой оси направленный отрезок А'В'', который назовем проекцией отрез- отрезка АВ на ось А параллельно плоскости П. Пусть на оси А выбран масштабный отрезок. Тогда наряду с проекцией А'В' отрезка АВ на ось А параллельно плоскости П мы будем рассматривать также величину этой проекции, которую обозначим прдЛВ(ЦП). Очевид- Очевидно, проекции эквивалентных отрезков эквивалентны, а величины этих проекций равны. Рис. 12.10 Рис. 12.11 Пусть теперь задан вектор а, т. е. класс эквивалентных друг другу направленных отрезков. Проекции этих отрезков на ось А (|| П) образуют на оси класс эквивалентных друг другу направленных от- отрезков, т. е. вектор на оси Д. Этот вектор назовем проекцией бек- тора а на ось А (ЦП), а величину этой проекции обозначим прда(ЦП). Проекция фигур, расположенных в плоскости. Если все точки фигуры, проектируемой на ось А, находятся в плоскости П, в кото- 205
Рис 12 12 рой лежит ось Д, то введенное понятие проекции можно заменить следующим. Пусть Ах — некоторая прямая плоскости П, не парал- параллельная оси А. Проведем через произвольную точку Л плоскости П прямую, параллельную прямой Дъ и найдем точку А' ее пересече- пересечения с осью А (рис. 12.10). Точка Af называется проекцией точки А на ось А параллельно прямой Д1# Понятия проекции и величины проекции вектора вводятся анало- аналогично понятию проекции вектора на ось в пространстве. Проекция на плоскость. Пусть П— некоторая плоскость и А — прямая, не параллельная ей. Проведем через произвольную точку А пространства прямую Ах, параллельную прямой А, и найдем точку Аг пересечения пря- мой Ах с плоскостью П (рис. 12.11). Точка Аг называется проекцией точ- точки А на плоскость П параллельно прямой Д. Если прямая А пер- перпендикулярна к плоскости П, то проекция называется прямоуголь- прямоугольной или ортогональной. Проекция суммы векторов. Пусть на ось А проектируются два вектора а и Ь. Проектирование производится параллельно некоторой плоскости П или некоторой прямой Дг, если векторы а и b и ось А находятся в одной плоскости. Возьмем произвольную точку О (рис. 12.12) и построим точки А и В так, чтобы О А = а, АВ = Ъ и, следовательно, ОВ = а + Ь. Если О', Л', В' — проекции точек О, Л, В на ось Д, то векторы О'А', А'В' и О'В' являются соответственно проекциями векторов a, b и а + Ь. Отсюда получаем: проекция суммы векторов равна сумме проекций слагаемых векторов. Доказательство этого утверж- утверждения, проведенное для двух слагаемых, очевидным образом рас- распространяется на произвольное конечное число слагаемых. В силу равенства A) (О'В') = {О'А') + (А'В') или прд (а + Ь) = прд а + прд Ь, B) т. е. величина проекции суммы векторов на ось равна сумме вели- величин проекций слагаемых. Проекция произведения вектора на число. Покажем, что при ум- умножении вектора а на число Я проекция этого вектора на какую- либо ось А и величина этой проекции умножаются на то же число. Пусть а Ф 0 и ХфО (в противном случае утверждение очевидно). Отложим от некоторой точки О оси Д векторы а и Яа, сонаправ- ленные (рис. 12.13, а) и противоположно направленные (рис. 12.13,6), т. е. найдем такие точки Л и Б, что О А = а, ОВ = Яа. Спроекти- Спроектировав точки Л и Б на ось А в точки А' и В', получим два подоб- 206
ных треугольника ОАА' и 055'. Теперь сформулированное утверж- утверждение очевидно. Итак, прА (А,а) = Алрд а. C) Проекция линейной комбинации векторов. Пусть аь а2, ..., а& есть произвольная, конечная система векторов (среди этих векторов а А1 В ./ А А1 А Рис. 12.13 могут быть и равные), а Хъ А,2, ..., Л* есть произвольная система действительных чисел. Вектор Mi + КЧ + ... + А*а* называется линейной комбинацией приведенных векторов. Из равенств B) и C) вытекает следующее равенство: т. е. величина проекции линейной комбинации векторов на ось рав- равна такой же (с теми же коэффициентами) линейной комбинации ве- величин проекций этих векторов. 12.5. Линейная зависимость векторов Определение 12.4. Векторы аь а2, ..., а* A) называются линейно зависимыми, если существуют числа ^Ъ ^2» •••» kfa B) не равные одновременно нулю, такие, что Mi + &A+ - +**а* = о. C) В противном случае векторы A) называются линейно независимыми. Такие векторы характеризуются тем, что из равенства C) сле- следуют равенства A»i = Л2 — ... == Л^ = 0. Говорят также, что векторы A) образуют линейно зависимую или линейно независимую систему. Если какой-либо вектор а можно представить в виде а = НА + ИЛ + •• +№ь то говорят, что вектор а линейно выражается через векторы A). 207
Теорема 12 2. Для того чтобы векторы A) (k > 1) были ли- линейно зависимы, необходимо и достаточно, чтобы по крайней мере один из них линейно выражался через остальные. ^ Пусть векторы A) удовлетворяют равенству C), причем сре- среди чисел B) есть отличные от нуля, например, Я& Ф 0. Тогда из равенства C) следует т. е. вектор а& линейно выражается через векторы ах, а2, ..., &k—\- Обратно, пусть один из векторов A) линейно выражается через остальные, например Переносим все слагаемые в левую часть равенства и получаем —Mi — М2 — ••• — P*-ia*-i + la = 0, т. е. равенство вида C). <4 Следствие 12.1. ?сла векторы A) линейно независимы, то ни один из них нельзя выразить линейно через остальные; в част- частности, ни один из этих векторов не может быть нулевым. Выясним геометрический смысл линейной зависимости и незави- независимости векторов A) при k= 1, 2, 3. Система, состоящая из одного вектора а, очевидно, линейно за- зависима тогда и только тогда, когда этот вектор нулевой. Теорема 12-3- Для того чтобы два вектора были линейно за- зависимы, необходимо и достаточно, чтобы они были коллинеарны. ^ Пусть векторы ах и а2 линейно зависимы. В силу теоремы 12.2, по крайней мере, один из них, например а2, линейно выража- выражается через второй, т. е. а2 = Яах, поэтому векторы ах и а2 коллине- коллинеарны. Обратно, пусть векторы ах и а2 коллинеарны. Если, по крайней мере, один из них нулевой, например а2 = 0, то 0ах + 1а2 — 0, т. е. векторы ах и а2 линейно зависимы. Предположим теперь, что векто- векторы ах и а2 ненулевые. Отложим оба этих вектора от одной точки О, т. е. построим такие направленные отрезки ОА± и ОЛ2, что ОА± = ах, ОА2 = а2. В силу коллинеарности векторов ах и а2 точки О, Лх, А2 будут принадлежать одной прямой А. Если точки Ах и А2 совпадают, то ОА2 = О Ах => а2 = ах. Пусть теперь точки Ах и А2 не совпадают. Обозначим буквой Я длину отрезка ОЛ2, измеренного масштабной единицей ОЛХ. Если отрезки ОАх и ОА2 одинаково направлены, то а2 = Яах. Если же отрезки ОАх и ОА2 противоположно направлены, то а2 = —Яах. ^ Следствие 12.2. Два вектора линейно независимы тогда и только тогда, когда они неколлинеарны. 208
Докажем еще одну теорему, которая будет играть в дальнейшем важную роль. Теорема 12.4. Если в некоторой плоскости П заданы два не- коллинеарных вектора ех и е2, то любой вектор а этой плоскости можно разложить по векторам eXj e2, т. е. представить в виде а = хех + уе2. D) Коэффициенты разложения х, у определяются однозначно. > Будем считать, что плоскость П совпа- совпадает с плоскостью, приведенной на рис. 12.14. Отложим векторы еь е2 и а от одной точки О, т. е. построим точки Ех, Е2, М, такие, что 2 2 Спроектировав точку М на прямую ОЕХ па- параллельно прямой 0Е2, получим точку Мх. Пусть, далее, точка М2 является проекцией точки М на прямую 0Е2 параллельно прямой 0Ех. Так как векторы 0Ех и 0Мх коллине- арны и 0Ех — ненулевой вектор, то 0Мх = Рис- 1214 = х ()ЕХ, Аналогично 0М2 = у~ОЕ2. Так как ОМ = 0Мх + 0М2, то равен- равенство D) верно. Докажем единственность разложения D). Пусть наряду с пред- представлением D) имеется еще разложение [а = х'ех + у'е2. E) Вычитая из равенства D) равенство E), получаем (х —x')ei + (y —у')еа = 0. F) Так как векторы ех и е2 неколлинеарны, то они линейно независи- независимы, и из равенства F) следует х — хг = 0, у — у' = 0=>х = х\ у = у'< <4 Рассмотрим вопрос о линейной зависимости трех векторов. Напомним, что компланарными называются такие векторы, кото- которые параллельны одной плоскости. Если компланарные векторы от- отложить от одной точки, т. е. построить соответствующие направ- направленные отрезки, то эти отрезки будут лежать в одной плоскости. Теорема 12-5- Для того чтобы три вектора были линейно за- зависимы, необходимо и достаточно, чтобы они были компланарны. ^ Пусть векторы аь а2, а3 G) линейно зависимы. Тогда, по крайней мере, один из них линейно вы- выражается через остальные, например а3 - Ла + Я2а2. (8) Отложим векторы G) от одной точки О, т. е. построим такие на- 209
правленные отрезки 0Mit 0М,2 и 0М3у что ОМХ = аг, ОМ2 = а2, ОМ3 = а3. Если векторы ОМХ и ОМ2 неколлинеарны, то точки О, Мь М2 определяют плоскость П. В силу равенства (8) отрезок ОМ3 также лежит в плоскости П и, следовательно, векторы G) компланарны. Если векторы ОМХ и ОМ2 коллинеарны, т. е. отрезки ОМХ и ОМ2 лежат на одной прямой, то в силу равенства (8) отрезок ОМ3 так- также лежит на этой прямой. Следовательно, в этом случае векторы G) не только компланарны, но даже и коллинеарны. Обратно, пусть векторы G) компланарны. Предположим сначала, что два из заданных векторов, например ах и а2, неколлинеарны. Тогда по теореме 12.4 вектор а3 можно представить в виде а3 = = ^iai + ^2а2» и> следовательно, векторы (8) линейно зависимы. Пусть теперь все три вектора G) коллинеарны, т. е. параллель- параллельны одной прямой. Из теоремы 12.3 следует, например, ах = А,а2. Пе- Переписывая это равенство в виде ai = Яа2 -j- 0a3, получаем, что век- векторы G) линейно зависимы. ^ Таким образом, в пространстве существуют тройки линейно не- независимых векторов. Теорема 12.6. Если векторы еь е2, е3 (9) линейно независимы, то любой вектор а может быть разложен по этим векторам, т. е. может быть представлен в виде а =-хе1 + уе2 + ze3. A0) Это разложение единственно. ^ Отложим векторы (9) и а от одной точки О, т. е. построим такие направленные отрезки ОЕЪ ОЕЪ ОЕ3 и ОМ, что ОЕХ = еь О?2=_е2, О?3 = е3, ОМ = а (рис. 12.15). Пусть Мъ М2у М3 — проекции точки М на прямые ОЕЪ OE2f OE3 параллельно плоскостям ОЕ2Е3, ОЕХЕ3, ОЕХЕ2 соответственно. На от- отрезках ОМХ, ОМ2у ОМ3у как на ребрах, построим параллелепипед. Тогда Ш= Шх+ ОМ2+ Ш3. A1) Так как векторы 0Е± и ОМХ коллинеарны и 0Ех ^= 0, то ОМХ = = х ОЕг. Аналогично ОМ2 = у ОЕ2у ОМ3 = z OE3. Теперь равенство A0) следует из разложения A1). Единствен- Единственность разложения A0) доказывается так же, как и в теореме 12.4. ^ Теорема 12.7. Любые четыре вектора линейно зависимы. ^ Пусть среди векторов аь а2, >а3, а A2) 210
есть тройка линейно независимых, например аь а2, а3. A3) Тогда по теореме 12.6 имеет место разложение а = Xi&i + Я2а2 + ^заз, и, следовательно, векторы A2) линейно зависимы. Теперь рассмот- рассмотрим случай, когда векторы A3) линейно зависимы, т. е. имеет место равенство + НА + НА = 0, A4) причем среди чисел \iXi \л2, H-з есть чис- числа, отличные от нуля. Переписывая ра- равенство A4) в виде H'lai + MA + МЛ + Оа = О, получаем, что векторы A2) линейно зависимы. <4 Упражнения 1. Докажите следующие утверждения: 1) если векторы аь а2, ..., аЛ линейно независимы, то векторы аь а2, ...,аЛ9> b также линейно зависимы; 2) если векторы ai, а2, ..., а& линейно независимы, то и векторы а2, аз, ..., а^—1 линейно независимы. 12.6. Координаты на прямой Пусть А — некоторая прямая. Возьмем на ней какой-либо нену- ненулевой вектор е, который будем называть единичным вектором или ортом. Пусть теперь а — произвольный вектор на прямой А. Оче- Очевидно, существует единственное число х, такое, что а = хе. Число х называется координатой вектора а на прямой А, снабженной ор- ортом е. Выберем на прямой А, снабженной ортом е, какую-либо точку О, которую назовем началом координат. Прямую А будем [называть теперь координатной осью. Вектор ОМ, где М — любая точка пря- прямой А, называется радиус-вектором этой точки. Координатой точ- точки М на координатной оси А называется координата ее радиус- вектора ОМ. Отложим вектор е от точки О, т. е. возьмем на пря- прямой А такую точку Е, что ОЕ = е. Выберем отрезок ОЕ за масш- масштабный отрезок. Очевидно, координата точки М есть величина на- направленного отрезка ОМ. Чтобы отметить, что х есть координата точки М, пишут М(х). В результате введения координат каждой точке М координатной оси А поставлено в соответствие вполне определенное действитель- действительное число —ее координата х. Обратно, для каждого действитель- действительного числа х найдется единственная точка М оси А, координата ко- которой равна х. Таким образом, положение любой точки координат- 211
ной оси вполне определяется заданием координаты этой точки. С другой стороны, научившись изображать действительные числа точками координатной оси, мы получаем возможность формулировать в геометрических терминах арифметические соотношения. Например, все числа, удовлетворяющие неравенствам 1 ^. х <; 2, изображаются точками отрезка АВ, где А(—1) и 5B) (рис. 12.16). Обозначим символом р(Мъ М2) расстоя- расстояние между точками Мх и М2, т. е. длину от- J f о %- резка MlM*- * *~ Теорема 128. Для любых точек Мх(хх) р. то 16 и ^2(^2) координатной оси имеют место ис* j ' равенства (МгМ2) = х2-хь A) Р(ЛГЬ М2) = \х2-хг\. B) ^ На основании теоремы 12.1 (ОМ,) + {МХМ2) = (ОМ2) =>¦ (МгМ2) = (ОМ2) - (ОЛ1Х). Используя понятие координаты, получаем равенство A). Формула B) очевидным образом следует из равенства A). ^ Пример 12.1. Истолковать геометрически неравенство I х - 1 | > 3. C) Решение. Левая часть неравенства выражает расстояние между точками М (х) и А A) координатной оси. Поэтому неравенству C) удовлетворяют коорди- координаты всех точек оси, лежащих вне отрезка [—2; 4], и только этих точек (рис. 12.17). ' ВЫ) О АН) СМ Рис. 12.17 Упражнения 1. Используя формулу B), найдите все решения уравнений: 1) |* + 2| + |*-1| = 5; 2) |* —2| —|* + 2| = 4; 3) |*+3| + |*-_1| = 4. 12.7. Координаты на плоскости Аффинные координаты. Будем рассматривать точки и векторы, принадлежащие некоторой фиксированной плоскости П. Определение 12.5. Пусть О — некоторая точка и еь е2 — два линейно независимых (неколлинеарных) вектора плоскости П. Тройка (О, ех, е2) называется аффинным репером или аффинной сис- системой координат на плоскости П. Отложим векторы еь е2 от точки О, т. е. построим такие на- направленные отрезки ОЕХ и ОЕ2) что ОЕг = еь ОЕ2 = е2. Эти отрезки определяют две координатные оси Ох и Оц (рис. 12.18). Точка О 212
называется началом координат, а векторы еь е2 — базисными век- векторами. Пусть а — произвольный вектор плоскости П. По теореме 12.4 вектор а можно единственным образом представить в виде SL = xex + ye2. A) Определение 12.6. Коэффициен- Коэффициенты х, у в разложении A) называются координатами вектора а в системе ко- координат (О, еь е2). Как показано в § 12.4, х, у являют- являются величинами проекций вектора а на координатные оси Ох, Оу параллельно осям Оу и Ох соответственно. Чтобы отметить, что X \\ Y есть координаты р 12. вектора а, пишут а(Х, Y). Пусть теперь М — произвольная точка плоскости П, на которой выбрана аффинная система координат (О, еь е2). Вектор ОМ назы- называется радиус-вектором точки М. Определение 12.7. Координаты х, у вектора ОМ называ- называются аффинными координатами точки М в репере (О, еъ е2), при- причем х называется абсциссой, а у — ординатой, Аффинная система координат (О, еь е2) обозначается также Оху. Если х, у — координаты точки М, то пишут М (х, у). Введение координат для векторов позволяет сводить различные соотношения между векторами к числовым соотношениям между их координатами. Имеет место Теорема 12-9. Координаты линейной комбинации векторов рав- равны таким же линейным комбинациям соответствующих координат этих векторов. Так как координаты векторов являются величинами проекций этих векторов на соответствующие координатные оси, то теорема непосредственно следует из свойств проекций (см. § 12.4). Пример 12,2. Рассмотрим соотношение а3 = Mi + ^a2, B) где ai(*b ух), а2 (х2, У*), а3 (*з, Уз). Согласно теореме 12.9, вгкторное равенство B) равносильно следу.ощим двум числовым равенствам: х3 = Яа*1 + ^2*2, Уз = Следствие 12.3. Если А (хъ ух) и В(х2, у.2) —двесточки, то ( у у) т. е. чтобы получить координаты вектора, определяемого направ- направленным отрезком АВ, надо из координат конечной точки вычесть координаты начальной точки. 213
Доказательство следует из предыдущей теоремы и равенства АВ = ОВ—'ОА. Следствие 12.4. Для того чтобы два вектора а(х1, уг) и Ь(*2» Уг) были коллинеарны, необходимо и достаточно, чтобы их координаты были пропорциональны. >> Как показано в § 12.5, коллинеарность векторов а и b рав- равносильна тому, что, по крайней мере, один из них выражается ли- линейно через второй, например Ь = А,а. C) По теореме 12.9 векторное равенство C) равносильно двум число- числовым равенствам *2 = tai, У2 = ЬУи D) что и доказывает наше утверждение. Равенства D) можно предста- представить также в виде х2/хх = у21уъ если ни один из знаменателей не равен нулю. ^ Следствие 12.5. Координаты середины А прямолинейного отрезка, соединяющего течки Ах (хх, уг) и А2 (х2, у2), задаются формулами * = (*i + х2)/2, у = (ух + у2)/2. Доказательство следует из соотношения О А = — [0Ах + OA2J (рис. 12.19). Прямоугольные координаты. Пусть на плоскости П выбрана еди- единица масштаба для измерения длины. Рассмотрим некоторую точку О и два взаимно перпендикулярных вектора i, j, каждый из кото- которых имеет длину, равную 1. В этом случае аффинная система ко- координат (О, i, j) называется (декартовой) прямоугольной системой координат. В прямоугольной системе координат, конечно, справед- справедливы все формулы, имеющие место в произвольной аффинной систе- системе координат. Часто эти формулы в прямоугольной системе коорди- координат имеют более простой вид, чем в общем случае аффинной систе- системы координат. Полярные координаты. Выделим на плоскости какую-либо точ- точку О, которую назовем полюсом, и луч О А, который назовем поляр- полярной осью. Выберем масштаб для измерения длины. Наконец, усло- условимся, какие повороты Еокруг точки О считать положительными. Обычно положительными считают повороты против часовой стрелки. Величины углов будем Еыражать в радианной мере. Пусть теперь М — произвольная точка плоскости. Обозначим буквой р расстояние точки М от полюса О и буквой ф — величину угла, на который надо повернуть луч О А вокруг точки О в данной плоскости, чтобы соЕместить его с лучом ОМ. Величины р и ср на- 214
Рис. 12.19 зываются полярными координатами точки М, р — полярным радиу- радиусом, а ф — полярным углом. Каждой точке плоскости соответствует вполне определенное значение р^О. Значение ф для точек, отлич- отличных от полюса, определено с точностью до слагаемого 2&я, где k — любое целое число; в полюсе значение ф не определено. Для того чтобы каждая точка плоскости, отличная от полюса О, получила вполне определенные значения поляр- полярных координат, достаточно считать, что —л;<Ф^я. Эти значения ф назовем главными. Теперь будем говорить, что на плоскости введена полярная систе- система координат. Рассмотрим одновременно прямо- прямоугольную и полярную системы коор- координат, причем полюс полярной системы совместим с началом координат прямо- прямоугольной системы, а полярную ось на- направим в положительном направлении оси Ох. Наконец, положительным будем считать то направление полярного угла, в котором надо вращать положительную полуось Ох, чтобы кратчайшим • путем совместить ее с положительной полу- полуосью Оу. Пусть М — произвольная точка плос- плоскости, х, у — ее прямоугольные, а р, Ф — полярные координаты (рис. 12.20). Очевидно, Формулы E) выражают прямоугольные координаты точки М че- через ее полярные координаты. Для выражения полярных координат точки М, отличной от начала координат, через ее прямоугольные координаты можно воспользоваться формулами Рис. 12.20 р = cos(p= sinq> которые легко получить из формул E). Упражнения 1. Пусть на плоскости заданы аффинная система координат и три точки Mi(*b */i)> M2(#2, 1/2), M (х, у), принадлежащие некоторой оси А. Выразите ко- координаты точки М через координаты точек Ми М2 и число X=>(MiM\l(MM2). 12.8. Координаты в пространстве Аффинные и прямоугольные координаты. Пусть О —некоторая точка и еь е2, е3 —три линейно независимых (некомпланарных) вектора. Определение 12.8. Четверка (О, еь е2, е3) называется аф- аффинным репером или аффинной системой координат в простран- 215
стве, причем точка О называется началом координат, а векторы *ь е2' ез — базисными векторами. Определение 12.9. Координатами вектора а называются коэффициенты х, у, z в разложении а = хег + уе2 + ze3. Аффинными координатами точки Ad в системе координат (О, еъ е2, е3) называются координаты х, у, z ее радиус-вектора ОМ, причем х называется абсциссой, у — ординатой и г—аппликатой. Аффинную систему координат (О, еь е2, е3) обозначают также Oxyz. Отложим векторы еь е2, е3 от точки О (рис. 12.21), т. е. построим такие направленные отрезки ОЕЪ ОЕ2, ОЕ3, что ОЕХ = еъ ОЕ2 = е2, ОЕ3 = е3. A) Построенные отрезки задают три коорди- Рис 12 21 натные оси Оху Оу\ Oz. Три плоскости» определяемые попарно координатными ося- осями, называются координатными плоскостями. Эти плоскости делят пространство на восемь частей, которые называются координатными октантами. Различают правые и левые аффинные системы координат. Рас- Рассмотрим упорядоченную тройку некомпланарных векторов (еь е2, е3). Отложим эти векторы от некоторой точки О, т. е. построим направленные отрезки ОЕЪ ОЕ2, ОЕ3, удовлетворяющие равенст- равенствам A). Будем вращать отрезок ОЕХ в плоскости OEiE2 вокруг точ- точки О по кратчайшему пути до совмещения его направления с на- направлением отрезка ОЕ2 и будем наблюдать за этим вращением с конца отрезка 0Е3. Если это вращение совершается против часовой стрелки, то упорядоченную тройку векторов (еь е2, е3) называют правой, в противном случае — левой. Название «левая тройка» (еь е2, е3) происходит от того, что векторы еь е2, е3, взятые в указан- указанном порядке, ориентированы относительно друг друга так, как боль- большой, указательный и средний пальцы левой руки (рис. 12.22, а). Аналогично векторы правой тройки (еъ е2, е3) ориентированы, как соответствующие пальцы правой руки (рис. 12.22, б). Аффинная система координат (О, еь е2, е3) называется правой или левой в зависимости от того, какую тройку образуют базисные векторы (еь е2, е3) — правую или левую. В дальнейшем, если не оговорено противное, используются правые системы координат. Простейшей из аффинных систем координат в пространстве яв- является (декартова) "прямоугольная система координат. Пусть выбра- выбрана единица масштаба для измерения длины. Тогда прямоугольная система координат определяется выбором некоторой точки О и трех взаимно перпендикулярных векторов i, j, k, каждый из которых имеет длину 1. 216
Теорема 12.9 и следствия 12.3—12.5, полученные из нее для случая плоскости, имеют силу и для пространства: к формулам, за- записанным для первых двух координат, добавляется аналогичная формула для третьей координаты. Цилиндрические координаты. Выберем единицу масштаба для из- измерения длины отрезков. Возьмем какую-либо плоскость П, на ко- которой зафиксируем некоторую точку О и выходящий из нее луч Ох. Условимся, какие повороти луча Ох вокруг точки О в плоскости П будем считать положительными. Тогда в плоскости П определит- определится полярная система координат с полюсом О и полярной осью Ох Рис. 12.22 М1 Рис. 12 23 Наконец, возьмем ось Ог, перпендикулярную плоскости П и направ- направленную так, чтобы положительное вращение в плоскости П, наблю- наблюдаемое с положительной полуоси Ох, происходило против часовой стрелки (рис. 12.23). Пусть теперь М — произвольная точка прост- пространства, Мх — ее ортогональная проекция на плоскость П и Mz — ортогональная проекция точки М на ось Ог. Цилиндрическими координатами точки М называются три числа р, ф, z, где р, ф — полярные координаты точки Мх в плоскости П, а г = (OMZ). Название «цилиндрические координаты» связано с тем, что поверхность, все точки которой имеют одно и то же значение координаты р, является цилиндром, изображенным на рис. 12.23. Каждой точке пространства соответствуют вполне определенные зна- значения р и г, причем р^О. Значение ф для точек, не лежащих на оси Ог, определено с точностью до слагаемого 2kn, где k — любое целое число; в точках оси Ог значение ф не определено. Пусть теперь наряду с цилиндрической системой координат взя- взята прямоугольная система координат Охуг так, как указано на рис. 12.23. Тогда прямоугольные координаты х, у, г точки М свя- связаны с ее цилиндрическими координатами р, ф, г соотношениями х = р cos ф, у = р sin ф, г = г. Сферические координаты. Для введения сферических координат необходимо так же, как и в случае цилиндрических координат, выбрать единицу масштаба, плоскость П с точкой О и полуосью Ох и ось Ог (рис. 12.24). Пусть М — произвольная точка прост- пространства, а Мх — ее ортогональная проекция на плоскость П. Пусть, 217
далее, р —расстояние точки М от О; 0 —угол между осью Ог и направленным отрезком ОМ и, наконец, ф — угол, на который надо повернуть ось Ох до совмещения с лучом ОМХ. Числа р, ф, 0 на- называются сферическими координатами точки Му причем ф называ- называется долготой, а 0 — широтой. Название «сферические координаты» связано с тем, что поверхность, все точ- точки которой имеют одно и то же значение координаты р, является сферой, изобра- изображенной на рис. 12.24. Каждой точке про- пространства, отличной от О, соответствуют вполне определенные значения р и 0, при- причем р>0, 0^0^я; в точке О значение 0 не определено. Значение ф для точек, не лежащих на оси Oz, определено с точ- точностью до слагаемого 2&я; в точках оси Ог значение ф не определено. Рис. 12.24 Пусть наряду со сферической систе- системой координат взята прямоугольная сис- система координат Охуг (см. рис. 12.24). Тогда легко видеть, что пря- прямоугольные координаты х, у, z точки М связаны с ее сферическими координатами р, ф, 6 соотношениями х = р sin0cos <p, # = psin0x X sin ф, z = р cos 0. 12.9. Преобразование координат Аффинные координаты. Рассмотрим на плоскости две аффинные системы координат (О, еь е2) и (О', е|, е2) (рис. 12.25). Первую из них будем называть старой, а вторую — новой. Пусть заданы коор- координаты точки О' и векторов е| и е2 в старой системе координат: О(аи <х2), е[(ап, <х21), е2(а12, а22). Пусть, далее, М — произвольная точка плоскости, х, у — ее старые, а х\ у' — новые координаты. Тогда е! == а11е1 ~Т~ а21е2> е2 = а12е1 ~Ь а22е2» 00' = ахех + а2е2, ОМ = хех + уе2, О'М = х'е[ Имеем ОМ = 00' + О?М. Из этого равенства, используя формулы A), получаем хег + уе2 = ахех -!- а2е2 + х' (ах1ех + а21е2) + + У' (^12^1 4 а22е2) = (апх' + аХ2у' i~ \ 2Х —1— Cwoot/ j **2/ 2' В силу теоремы 12.4 х = апх' + а12у' Рис. 12.25 У = а^л:' + 218
Это и есть искомые формулы преобразования аффинных координат, выражающие старые координаты х, у точки М через ее новые ко- координаты х', у'. Если в приведенном рассуждении поменять ролями старую и но- новую системы координат, то получатся формулы х' = выражающие новые координаты точки М через старые. Коэффици- Коэффициенты, входящие в формулы C), имеют следующее геометрическое истолкование: °(Pb Р2), МРш P2l), Mpl2, Р22>» причем координаты берутся в новой системе координат. Рассмотрим наряду с точкой М еще одну точку N. Обозначив через хъ ух и x'v y\ соответственно старые и новые координаты точ- точки N, запишем для них формулы B): хх = а1Хх[ + а12у[ + ахЛ Как известно из § 12.7, старые и новые координаты вектора выражаются следующим образом: ^Х = х1 — х, Y = ух — у, Вычитая из равенств D) соответствующие равенства B), полу- получаем формулы преобразования координат вектора: X = аХ1Х' + а1яК', у = а21Х' + а22^. Аналогично можно найти формулы преобразования аффинных координат в пространстве. Пусть (О, еь е2, е3) и (О', е'р е2, е3) — две аффинные системы координат, из которых первую будем назы- называть старой, а вторую — новой. Пусть, далее, заданы старые коор- координаты точки О' и векторов ej, e^ и е3: О'(аь а2, а3), е| (аи, а2Х, а31), е2(а12, а22, а32), е3(а13, а23, а33). Тогда старые координаты х, у, г произвольной точки выражаются через ее новые координаты х\ у'у zf по формулам: х = апх' + а12у' + al3z' + <хь у = а21х' + а22у' + a23z' + <х2, z = аз^' + a32yr + a33z' + а3. Аналогичными формулами выражаются и новые координаты точки через старые. Как и в случае плоскости, легко получить формулы преобразования координат вектора: 219
X = п 2 Y = a2lX' + а22Г + a23Z', Z = <x31X' + a32r/ + a33Z'. Прямоугольные координаты на плоскости. Рассмотрим тот част- частный случай преобразования координат на плоскости, когда обе си- системы координат — старая и новая — прямоугольные. Будем обозна- обозначать старую систему координат (О, i, j), а новую систему — (О', Г, Г)- О L Рис. 12.26 Следует различать два случая, когда кратчайшие повороты от I к j и от V к у совершаются: а) в одном направлении (либо оба по часовой стрелке, либо оба против часовой стрелки); б) в противопо- противоположных направлениях. В обоих случаях будем обозначать буквой ф угол между базисными векторами i и Г, отсчитываемый в направлении, отвечающем кратчайшему повороту от i к j. Если обозначить бук- буквой -ф угол между векторами i и j', то в первом случае *ф = ф + _j_ JL _[. 2kn (рис. 12.26, а), а во втором случае г|з = ф — + 2Ы (рис. 12.26, б). В обоих случаях, очевидно, имеем следующие выра- выражения для координат векторов V и j': au = cos ф, a2l = sin ф, al2 = cos г|), a22 = sin i|}. В первом из рассматриваемых случаев формулы B) принимают вид х = xr cos ф — yr sin ф + <*ъ у = xr sin ф + у' cos ф + <*2> а во втором случае вид х = х' cos ф + У' sin ф -)- ах, г/ — л:' sin ф — у' cos ф -\- а2. Рассмотрим два частных случая формул E). 1. Пусть V = i и jv = j (рис. 12.27). Тогда формулы E) прини- принимают вид х — х' -f a: j/ = //' + a2 E) 220
и называются формулами преобразования координат при парал- параллельном сдвиге координатных осей на вектор а(аь а2). 2. Если О' = О (рис. 12.28), то формулы E) принимают вид х = xr cos ф — yr sin ф, у = xr sin ф 4 Уг cos ф и называются формулами преобразования координат при повороте системы вокруг начала на угол ср. 6 Л Рис. 12.27 12.10. Уравнения фигуры Пусть А — некоторое подмножество множества R3 упорядоченных троек чисел и / : А -»¦ R — отображение, ставящее в соответствие каж- каждой упорядоченной тройке вещественных чисел (х, yf г), принадле- принадлежащей Л, действительное число f(x, yf г). Определение 12.10. Соотношение называется уравнением с тремя неизвестными х, у, г. Упорядочен- Упорядоченная тройка действительных чисел (а, $, у) называется решением уравнения (I), если /(а, |3, у) = 0 есть верное числовое равенство. Аналогично можно рассматривать уравнение с двумя неизвестны- неизвестными g (x, y) = 0 B) C) и уравнение с одним неизвестным Фигурой назовем произвольное множество точек. Фигура называ- называется плоской, если все ее точки лежат в некоторой плоскости. По- Покажем, что любые фигуры можно задавать с помощью уравнений. Пусть задано уравнение A). Фиксируем некоторую аффинную систему координат Oxyz. Будем говорить, что точка М(а, р, у) удовлетворяет уравнению A), если упорядоченная тройка чисел (а, р, 7) есть решение этого уравнения. Определение 12.11. Если Ф есть фигура, состоящая из всех точек плоскости, удовлетворяющих уравнению (I), то даннсе урав- 221
пение называется уравнением фигуры Ф. В этом случае говорят также, что уравнение A) задает фигуру Ф. Итак, при фиксированной системе координат каждое уравнение A) задает вполне определенную фигуру Ф. Пусть теперь задана произвольная фигура Ф и фиксирована не- некоторая аффинная система координат Oxyz. Покажем, что сущест- существует уравнение вида A), задающее фигуру Ф. В самом деле, опре- определим функцию трех переменных /:R3->R следующим образом. Пусть (а, |3, у) — произвольная упорядоченная тройка действитель- действительных чисел. Если точка М(а, р, у) принадлежит фигуре Ф, то по- положим /(а, р, y) = 0. Если же точка М(а, р, у) не принадлежит фигуре Ф, то положим /(а, {}, у) = 1. Итак f(a в у) = \°> если М(а' Р' УNФ' D) П * Р' У) \1, если М(а, |3, уI<Ь. ( } Очевидно, уравнение A), в котором слева стоит функция D), задает фигуру Ф. Из построения видно, что каждой фигуре можно сопо- сопоставить много задающих ее уравнений. В самом деле, в формуле D), определяющей функцию /, вместо единицы можно поставить любое число, отличное от нуля, причем это число может меняться при пе- переходе от одной точки к другой. Пусть фиксирована аффинная система координат Oxyz и задано уравнение B). Будем говорить, что точка М(а, р, у) удовлетворяет этому уравнению, если пара чисел (а, р) есть решение уравнения B). Тогда мы получим возможность рассматривать фигуры, которые задаются с помощью уравнений вида B) Аналогично можно изу- изучать фигуры, которые задаются уравнениями вида C). Иногда фигуру удобно задавать не одним уравнением, а с по- помощью системы уравнений. Рассмотрим несколько простых примеров фигур, заданных уравнениями A), B) или C) относительно прямо- прямоугольной системы координат Oxyz. Пример 12.3. 2 = 0. Это уравнение плоскости Оху. Пример 12.4. х2 + у2 = 0. Это уравнение оси Ог\ его можно заменить равно- равносильной ему системой уравнений л = 0,\ У = 0.1 Пример 12.5. х2 -f у2 + 22 = 0. Это уравнение точки О@, 0, 0). Пример 12.6. х2-\- z/2_j_22_j_ \ -.д. Это уравнение задает пустое множество точек. Пример 12.7. Рассмотрим сферу 5 радиуса г с центром в точке С (а, Ь, с). Выражая в координатах тот факт, что произвольная точка М (х, у, z) сферы 5 удалена от ее центра на расстояние г, получаем уравнение сферы Пусть уравнение A) фигуры Ф задано в аффинной системе коорди- координат Oxyz, и мы хотим найти уравнение этой фигуры в новой аффин- аффинной системе координат O'x'y'z'. Подставляя выражения старых координат х, у, г произвольной 222
точки М пространства через новые координаты х'9 у\ гг этой же точки (см. § 12.9) в левую часть уравнения A), получаем / (х, У, z) = f (anxf + al2yr + alszr -4- a1# a21xr + a22yf + a23zf + a2, «3i^ + <%#' + азз2' + a3). Это равенство имеет место для любой точки пространства, т. е. оно удовлетворяется, если в нем в качестве х, у, z взять координаты какой-либо точки, а в качестве х\ у\ zr — новые координаты этой точки. Отсюда следует, что уравнению f{anx' + a12yr + alszf + alf a21xf + a22y' + а23г' + a2, aslx' + a32yf + + Щ^ + a8) = 0 E) удовлетворяют все точки фигуры Ф и только они, т. е. E) есть уравнение фигуры Ф в системе координат O'x'y'z'. Пусть в пространстве фиксирована некоторая плоскость П. Будем рассматривать только точки, принадлежащие этой плоскости. Если в плоскости П выбрана какая-либо аффинная система координат Оху, то любое уравнение вида B) или C) задает некоторую фугуру, при- принадлежащую этой плоскости. Обратно, любая фигура плоскости П может быть задана уравнением B). Пример 12.8. Уравнение х2 + у2— 1 ~0 задает окружность радиуса 1 с цент- центром в начале координат. Пример 12.9. Уравнение х2 — у2 = 0 задает фигуру, состоящую из двух вза- взаимно перпендикулярных прямых, содержащих биссектрисы координатных углов (рис. 12.29). х и Пример 12.10. ¦—'——¦ = 0. Точки, удовлетворяющие этому уравнению, за- 1*1 I У I полняют первую и третью координатные четверти (рис. 12.30). Пример 12.11. х2—1 =0. Уравнение задает фигуру, состоящую из двух пря- .мых, параллельных оси Оу (рис. 12.31). Рис. 12.29 Рис. 12.30 12.11. Скалярное произведение векторов Рис. 12.31 Определение и основные свойства. Определение 12.12. Ска- Скалярным произведением векторов а и b называется число, которое обозначается а • b и равно произведению длин этих векторов и ко- 223
синуса угла между ними, т. е. а • b = |a||b|cosq>, A) где ф — угол между векторами а и Ъ. Возьмем в пространстве какую-либо точку О и построим такой отрезок О А, что ОЛ=а/|а|. Обозначим буквой Д ось, определяемую отрезком О А. Тогда при <р<я/2 (рис. 12.32, а) и при ср > я/2 (рис. 12.32, б) получаем | b | cos ф = прд Ь, где проекция ортогональная. Формулу A) можно переписать теперь в виде а.Ь=[а|прдЬ. B) О а А 0 а Рис. 12.32 Название «скалярное произведение» употребляется потому, что эта величина является скаляром (числом) и обладает некоторыми алгебраическими свойствами произведения чисел. Рассмотрим эти свойства: 1) коммутативность а . b - b . а C) непосредственно следует из определения скалярного произведения; 2) (Ла)-Ь= Ча-Ь), D) а- (ЫЬ) = Я(а.Ь). E) Докажем сначала равенство E), используя формулу B), а также свойства проекций (см. § 12.4): а . (Щ = | а | прА (Щ = Я | а | прА b = X (а . Ь). Равенство D) следует из равенств C) и E); 3) дистрибутивность а . (b-4-c) -а- Ь + а • с, F) (Ь + с) • а = b • а + с • а. G) Поскольку а • (Ь 4- с) = | а \ прА (Ь + с) = | а | прд b + | а | прд с = = а • b = a • с, то равенство F) доказано, а равенство G) следует из формул C) и F). Из этих трех свойств вытекает, что скалярное умножение двух линейных комбинаций векторов можно производить ^почленно. На- Например, Bа + ЗЬ) • (с — 5d) = 2а . с — 10а • d + ЗЬ • с — 15b . d. 224
Отметим некоторые геометрические свойства скалярного произве- произведения; 4) необходимым и достаточным условием перпендикулярности (ортогональности) двух векторов аи b является равенство нулю их скалярного произведения: а . b = 0. (8) Перепишем равенство (8) в виде | а 11 b | cos ф = 0. (9) Если векторы аи b перпендикулярны, то ф = я/2, и равенство (9) справедливо. Обратно, пусть векторы аи b удовлетворяют равенст- равенству (9). Если хотя бы один из них нулевой, то он не имеет опреде- определенного направления, и его можно считать перпендикулярным ко второму вектору. Если же оба вектора а и b ненулевые и, следова- следовательно, \а\~Ф0у \Ъ\Ф0, то из равенства (9) следует, что соэф^О и, значит, ф = я/2. Четвертое свойство показывает, что скалярное произведение от- отличается от произведения чисел, где из равенства нулю произведе- произведения двух чисел следует, что, по крайней мере, один из сомножите- сомножителей равен нулю; 5) скалярное произведение вектора на себя, которое обознача- обозначается а2, равно квадрату длины этого вектора: а . а = а2 = I а |2. A0) Доказательство непосредственно следует из формулы A), так как в этом случае ф = 0. Выражение скалярного произведения векторов через координаты перемножаемых векторов. Пусть в пространстве выбрана прямо- прямоугольная система координат с началом координат в точке О. Составим таблицу скалярных произведений векторов i, j, k: р=1, i. j = 0, i.k = 0,l i-i = o, p=i, j.k = o, (ii) k • i = 0, k.j = O, ka=lJ Пусть теперь заданы координаты двух векторов а и Ь, т. е. из- известны разложения: а - XI + Yj + 2k, b = Х'\ + Y'\ + Z'k. С помощью соотношений A1) найдем скалярное произведение век- векторов а и Ь: а . b - (XI + Y\ + Zk) • (X'i + Y'\ + Z'k) = XX'P + XY'i • j + + XZ'\ • k + YX'\ • i + YY''f + YZ'\ • k + ZX'k . i + ZY"k . j + + ZZ'k2 - XX' + YY' + ZZ'. Таким образом, скалярное произведение двух векторов, заданных своими координатами в прямоугольной системе координат Oxyz, вы- выражается формулой а • b = XX' + YY' +ZZ'. A2) 8 Зак. 3670 225
Равенство (8), выражающее необходимое и достаточное условие перпендикулярности двух векторов, теперь может быть записано в виде XX' + YY' + ZZ' = 0. A3) Пользуясь формулами A0) и A2), получаем формулу для вы- вычисления длины вектора | а | = YX* + У2 + Z2 . A4) Пусть заданы координаты двух точек М(х, у, г) и Mr (x\ y\ zf). Так как расстояние р (М, М') между ними равно длине вектора ММ'(х' — х, у' — у, г' — г), то имеет место формула Р (М, М') = У(х' — xf + (у* — yf -f (г' — zf . Пользуясь формулами A), A2) и A4), получаем следующее вы- выражение для косинуса угла ср между векторами а(Х, У, Z) и b(X', У, Z'Y XX' + YY' + ZZ' COS ф = ^ ^ Упражнения 1. Рассмотрим множество G, являющееся объединением множества всех дейст- действительных чисел и множества всех векторов. Введем на множестве G алгебраичес- алгебраическую операцию умножения следующим образом: произведение двух чисел понима- понимается в обычном смысле, произведение числа на вектор Ха. — а • X понимается в смысле § 12.3, и под произведением двух векторов понимается их скалярное про- произведение. Будет ли множество G с такой операцией умножения группой? 12.12. Векторное произведение векторов Определение и основные свойства. Будем предполагать, что в пространстве выбрана правая система прямоугольных координат (О, i, J\ k)- Определение 12.13. Векторным произведением вектора а на вектор Ъ называется вектор, который обозначается символом а X b и определяется следующими тремя условиями: 1) длина вектора а х b равна |a||b|sin<p, где ф—угол между векторами а и Ь; 2) вектор а х b перпендикулярен к каждому из векторов а и Ъ; 3) тройка векторов (а, Ь, а X Ь) правая, если эти векторы не- некомпланарны. Рассмотрим основные свойства векторного произведения: 1) равенство axb = 0 A) является необходимым и достаточным условием линейной зависи- зависимости (коллинеарности) векторов а и Ь. Равенство A) равносильно равенству |а X bl= |a||b|sinq> = 0. B) 226
Если векторы аи b коллинеарны, то ср = 0 или ср = п, и равенство B), а следовательно, и равенство A) верны. Обратно, пусть векто- векторы а и b удовлетворяют равенству A) и, следовательно, равенству B). Если хотя бы один из этих векторов нулевой, его можно счи- считать коллинеарным со вторым Еектором. Если же оба вектора а и b ненулевые, то из равенства B) следует sin ср = 0, а значит, векторы аи b коллинеарны; 2) если векторы а й b неколлинеарны, то длина вектора а х b равна площади параллелограмма, построенного на отрезках ¦*- —¦»- О А и ОВ, где О — произвольная точка и О А = а, ОВ = Ь. Доказательство следует из определения A2.13) (первое условие) и формулы нахождения площади параллелограмма; 3) антикоммутативность: axb = —b х а. C) Доказательство следует из определения 2.13; 4) (Яа) хЬ-Я(ахЬ), D) а х(ЯЬ) = Я(а Xb). E) Докажем равенство D). Если Я = 0 или Еекторы а и b колли- коллинеарны, то, очевидно, это равенство имеет место. Пусть ХфО и векторы а и b неколлинеарны. Длина Еектора Я (а X Ь) равна | Я 11 а 11 b | sin ф, где ф — угол между векторами а и Ь. Если Я > 0, то | (Яа) X b | = | Яа 11 b | sin ф = | X 11 а 11 b | sin ф. Если Я<0, то | (Яа) X b | = ! Яа 11 b | sin (я — ф) = 1Я11 а 11 b | sin ф. Итак, векторы, стоящие в обеих частях равенства D) имеют оди- одинаковые длины. Эти векторы коллинеарны, так как каждый из них перпендикулярен векторам а и Ь. Осталось показать, что векторы (Яа) xb, Я (а х Ь) F) имеют одно и то же направление. Если Я > 0, то векторы F) на- направлены так же, как и вектор а х Ь. Если же Я < 0, то каждый из векторов F) направлен противоположно вектору а х Ь, и, сле- следовательно, векторы F) имеют одно и то же направление. Равенст- Равенство D) доказано. Равенство E) легко выводится из равенств C) и D), что предоставляется проверить читателю; 5) дистрибутивность: (а + Ь) X с = а х с 4- b X с, G) с X (а + Ь) = с X а + с х Ь. (8) Докажем равенство G). Когда среди векторов a, b есть нулевой, равенство очевидно. Будем считать эти Еекторы ненулевыми и до- докажем сначала равенство (а. + Ь) X с0 = а х с0 + b x с0, (9) где с0 — с/1 с | — вектор единичной длины. &* 227
Укажем один способ построения векторного произведения какого- либо вектора а на вектор единичной длины с0. Отложим векторы а и с0 от некоторой точки О, т. е. построим направленные отрезки ОА и ОС, такие, что ОА = а, ОС = с0 (рис. 12.33, а). Проведем теперь через точку О плоскость П, перпендикулярную к отрезку ОС, и спроектируем на нее ортогонально отрезок О А. Отрезок О А', являющийся проекцией отрезка О А, повернем в плоскости П вокруг Рис. 12.33 точки О на угол я/2 по часовой стрелке, если смотреть из точки С. Полученный в результате поворота отрезок ОА" будет определять векторное произведение векторов а и с0. В самом деле, если обозна- обозначить буквой ф угол между векторами а и с0, то можно записать | ОА"\ = | ОЛ' | = I 04 | соз (я/2 — ср) = | а| |с01 sin ср. Кроме того, направления векторов О А" и а х с0, очевидно, совпа- совпадают. Докажем теперь равенство (9). Для этого фиксируем произволь- произвольную точку О (рис. 12.33, б) и построим векторы ОС = с0, ОА = а, АВ = Ь, ОВ = а + Ь. Построим, далее, плоскость я, проходящую через точку О и перпендикулярную к отрезку ОС. Пусть А' и В' — ортогональные проекции точек Л и Б на плоскость П. Повернем треугольник OAfBf в плоскости П вокруг точки О на угол я/2 по часовой стрелке, если смотреть с конца отрезка ОС. В результате получим треугольник ОА'ГВ". Имеем ОВ" = ОА + Jf7B\ A0) ОВ" = (а + Ь) X с0, О4" = ахс0, Af7B" - b х с0. Таким образом, из равенства A0) следует равенство (9). Умно- Умножая обе части равенства (9) на |с|, получаем равенство G). Докажем равенство (8): с X (а + Ь) = — (а + Ь) X с = —а хс cxb. Из доказанных свойств векторного произведения вытекает сле- следующее правило: для получения векторного произведения двух линейных комбинаций векторов достаточно каждый член первой 22S
комбинации умножить векторно на каждый член второй комбина- комбинации и результаты сложить Пример 12.12. Bа + ЗЬ) х Eс — За) = 10а х с + 15Ь X с + 9а X Ь. Выражение векторного произведения через координаты перемно- перемножаемых векторов. Составим сначала таблицу векторных произведе- произведений базисных векторов i, j, k правой декартовой прямоугольной си- системы координат (О, i, j, k): i X i - 0, i X j = k, i X k = — j, j X i - —k, j x j - 0, jxk = i, k x i - j, k X j = —i, k X k - 0. Найдем теперь векторное произведение двух произвольных век- векторов а - Х\ + Yj + Zk, b = Xf\ + Yf\ + Z'k. Имеем a x b - (Xi + Y] + Zk) x (X'i -| Y'\ + Z'k) = (YZr —ZYf) i + + (ZXf — X'Z) j + {XYf — YXf) k. A1) По аналогии с правилом разложения определителя по строке (см. § 4.4) можно записать формулу A1) в виде 1 i к X Y Z Xf Y' Z' Двойное векторное произведение. Пусть заданы три произволь- произвольных вектора а, Ь, с. Векторное произведение векторов а х b и с, т. е. вектор (а х Ь) X с, называется двойным векторным произведе- произведением. Покажем, что справедлива формула (a xb) xc-(a»c)b —(Ь.с)а, A2) имеющая приложения в механике. Выберем прямоугольную систему координат (О, i, j, k) следующим образом. Точку О выбираем про- произвольно, вектор i возьмем кол линеарным с вектором а, и, наконец, вектор j выберем так, чтобы векторы i, j, b были компланарны. Тогда векторы а, Ь, с будут иметь следующие координаты: а(Х, 0, 0), Ъ(Х', Y', 0), c(X"t Y", Z"). Применяя дважды формулу A1), получаем а х Ь@, 0, XY') и (а х Ь) X с(—XY'Y", XY'X", 0). A3) С другой стороны, используя формулу A2), находим а • с = XX", b . с = Х'Х" + Y'Y". Поэтому (XX'X", XY'X", 0) A4) есть координаты вектора (а • с) b и (XX'X" + XY'Y", 0, 0) A5) 229
есть координаты вектора (Ь-с)а. Теперь формула A2) вытекает из сопоставления координат векторов A3)—A5). Тождество Якоби. Векторное умножение не обладает свойством ассоциативности. В самом деле, например, т. e. (i X j)X j^ix(jx j). Векторное умножение удовлетворяет условию (а X b) X с + (b X с) X а + (с X а) X b - О, A6) которое называется тождеством Якоби. Докажем справедливость тождества Якоби для любых трех векторов. Применяя формулу A2), находим (bxc) Xa = (b.a)c — (с-а)ЬЛ (сха) xb = (c-b)a —(a.b)c.J Складывая равенства A2) и A7), получаем тождество Якоби A6). Упражнения 1. Пусть равенство а X х => b x x имеет место при любом векторе х. Следует ли отсюда, что а = Ь? 2. Докажите, что для трех неколлинеарных векторов а, Ь, с из равенств axb=bxc=cxa следует равенство а + b + с = 0. 12.13. Смешанное произведение векторов Определение 12.14. Пусть заданы какие-либо три вектора а, Ь, с. Найдем векторное произведение а х b и затем перемно- перемножим скалярно векторы, а х b и „с. Число (а X Ь) • с называется смешанным произведением векторов а, Ь, с и обозначается abc. Следующие две теоремы помогают выяснить геометрический смысл смешанного произведения трех вектороз. Теорема 12*10. Пусть а, Ъ, с— три некомчланарных вектора. Отложим их от одной точки О, т. е. построим такие отрезки О А, ОБ, ОС, что Смешанное произведение abc равно объему параллелепипеда, по- построенного на отрезках О А, ОБ, ОС, взя- взятому со знаком плюс, если тройка (а, Ь, с) правая, и со знаком минус, если эта тройка левая. > Обозначим буквой V объем па- параллелепипеда, построенного на отрезках О А, ОБ, ОС, буквой S — площадь па- параллелограмма, построенного на отрез- 230
ках О А, ОВ, и буквой h — соответствующую высоту параллелепипеда (рис. 12.34). Тогда V = Sh. Отложим теперь от точки О единичный отрезок ОЕ, перпенди- перпендикулярный к отрезкам О А и ОВ и направленный так, чтобы тройка векторов ОЛ, 0J3, е = ОЕ была правой. Очевидно, а х b = Se. Да- Далее, (а х Ь) • с = S (е . с) = S пре с = ± Sh = ±V, причем знак + ставится здесь в том случае, если тройка а, Ь, с правая, и знак —, если эта тройка левая. <4 Теорема 12-11- Для того чтобы три вектора а, Ь, с были компланарны (линейно зависимы), необходимо и достаточно, что- чтобы их смешанное произведение было равно нулю: abc = 0. A) >> Если векторы а, Ь, с компланарны, то вектор а X b или ра- равен нулю, или перпендикулярен вектору с и, следовательно, (а X Ь) • с = 0, т. е. равенство A) имеет место. Обратно, пусть век- векторы а, Ь, с удовлетворяют равенству A). Если бы эти векторы были некомпланарны, то можно было бы отложить их от одной точки и построить параллелепипед объемом что противоречит равенству A). Ц Найдем выражение смешанного произведения через координаты перемножаемых Еекторов. Пусть в некоторой правой прямоугольной системе координат Oxyz заданы координаты трех векторов: a(Xi, rlf Zi), b(X2, Y2, Z2), c(X3, YS9 Z3). B) По формулам A2) § 12.11 и (И) § 12.12 находим abc = (а X Ь) • с - (ВД - Y2ZX) X3 + (X2Z± - ВД) Y3 + (X,Y2 - — XoY\) Z3 = X1Y2Z3 + X2Y3Z1 + X3Y±Z2 — XXY3Z2 — X3Y2Z± — — X2YiZ3. Используя понятие определителя третьего порядка (см. § 4.1), по- получаем abc = X2 Х3 Y2 Z2 Y3 Z3 C) Так как при перестановке двух строк определитель заменяется на противоположное число, то abc = —bac = —acb = —cba. Необходимое и достаточное условие A) компланарности (линей- (линейной зависимости) трех векторов B) можно записать в виде Y, Zx Х2 Y2 Z2 =0. D) 231
Условие D) получено нами в прямоугольной системе координат. Покажем, что оно имеет место и в аффинной системе координат. Пусть наряду с указанной прямоугольной системой координат Oxyz задана некоторая аффинная система координат (О', е|, е2, е3), причем векторы а, Ь, с имеют в новой системе координат следу- следующие координаты: а(Хр Y'v Z\)y Ъ(Х2, Y2, Z'2), с(Х3, F3, Z3). Как известно из § 12.9, старые и новые координаты произвольного век- вектора связаны формулами: X = аиХ' + а12Г' + a13Z', Y - сх21Х' + а.22Г' + a23Z', ^^^ (Xg^-Л -у- С&з2 У ~\~ 0^33^ • Заметим, что имеет место неравенство d = а #0, E) «11 а21 «31 12 а22 а32 а23 аЗЗ так как в силу теоремы 12.10 и формулы C) d есть объем парал- параллелепипеда, определяемого тремя некомпланарными векторами е|, е2, е3, отложенными от одной точки. Используя теорему 4.8, получаем Х\ Y\ Z\ У V 7' 2 2 2 X' V 7' о •* о "о Л12 Х22 а23 «31 а32 «33 Отсюда в силу неравенства E) условие D) будет равносильно ра- равенству У2 -0. Упражнения 1. Докажите, что из компланарности векторов а X b,"b х с, с х а следует их коллинеарность. 2. При каком взаимном расположении векторов а, Ь, с имеет место равенство (а X Ь) х с = а X (Ь X с)? 13. ПРЯМАЯ НА ПЛОСКОСТИ Эта глава относится к планиметрии. В ней рассматриваются толь- только те точки и составленные из них фигуры, которые расположены в некоторой фиксированной плоскости. Обсуждаются вопросы, свя- связанные с одной из простейших плоских фигур — прямой. 13.1. Уравнение прямой с угловым коэффициентом Пусть А — некоторая прямая. Направляющим вектором прямой А называется любой ненулевой вектор, который состоит из отрезков, 232
параллельных этой прямой. Очевидно, для данной прямой сущест- существует бесконечное множество направляющих векторов, коллинеарных друг другу. Предположим, что выбрана некоторая аффинная система коорди- координат Оху. Составим уравнение прямой Д. Пусть сначала прямая Д параллельна оси Оу и пересекает ось Ох в точке Р(а, 0) (рис. 13.1). Очевидно, для любой точки М (х, у) прямой Д и только для точек этой прямой имеем х = а. A) Итак, A) есть уравнение прямой, параллельной оси Оу и пересека- пересекающей ось Ох в точке Р(а, 0). Заметим, что любой направляющий вектор такой прямой имеет координаты @, т). Пусть теперь прямая Д не параллельна оси Оу. Тогда для всех направляющих векторов а(/, т) этой прямой отношение т:1 имеет одно и то же постоянное значение /г, называемое угловым коэффици- коэффициентом прямой Д относительно выбранной системы координат (см. следствие 12.4). Если, в частности, рассматривается прямоугольная система коор- координат (О, i, j), то для углового коэффициента прямой Д, очевидно, имеем ? = tg а, где а — угол между вектором i и любым направляющим вектором прямой Д (рис. 13.2). Угол а называется углом наклона прямой Д к оси Ох. Рис. 13.1 Рис. 13.2 Пусть заданы угловой коэффициент k прямой Д и точка Р (а, Ь), через которую эта прямая проходит. Составим уравнение прямой Д. Пусть М (х, у) — произвольная точка этой прямой, отличная от точ- точки Р. Тогда вектор РМ (х — а; у — Ь) есть направляющий вектор прямой Д, поэтому — к. \б) х — а Отсюда y — b = k(x — a\ C) 233
Этому уравнению удовлетворяет любая точка прямой А (в том чис- числе и точка Р). Предположим теперь, что некоторая точка Мх (хъ ух), отличная от точки Р, удовлетворяет уравнению C), т. е. y1 — b==k(x1 — a). D) Так как МХФР, то хх — афО. Поэтому из B) и D) получаем У — Ь _^ yi — b х — а х± — а Итак, направляющие векторы прямых Д и РМХ коллинеарны. Так как обе эти прямые проходят через точку Р, то они совпадают и, следовательно, точка Мх лежит на прямой Д. Таким образом, уравнение C) задает прямую, имеющую угловой коэффициент k и проходящую через точку Р(а, Ь). Если, в частности, точка Р лежит на оси Оу, т. е. Р@, Ь) (см. рис. 13.2), то уравнение C) принимает вид у = kx + Ъ Если прямая параллельна оси Ох и проходит через точку Р@, Ь), то ее уравнение у = Ь. 13.2. Общее уравнение прямой. Уравнение прямой в отрезках Определение 13.1. Уравнением первой степени или линей- линейным уравнением относительно неизвестных х и у называется урав- уравнение вида Ах + Ву + С = 0% A) где А, В, C^R; коэффициенты А и В не равны нулю одновременно. Теорема 13-1- Пусть на плоскости фиксирована некоторая аффинная система координат Оху. Тогда любая прямая может быть задана линейным уравнением A). Обратно, любое уравнение вида A) задает прямую. > Пусть задана прямая А, не параллельная оси Оу. Как пока- показано в § 13.1, прямая А может быть задана линейным уравнением y — kx — b = 0. B) Если прямая А параллельна оси Оу, она снова задается линейным уравнением х — а = 0. C) Рассмотрим теперь произвольное линейное уравнение A). Если В Ф 0, то, разделив обе части этого уравнения на В и введя обозна- обозначения k = —А/В, Ь = —С/В, придем к уравнению B). Но уравне- уравнение B) задает прямую, имеющую угловой коэффициент k и прохо- проходящую через точку Р@, Ь). Если в уравнении A) В = 0, то это уравнение приводится к виду C) и, следовательно, задает прямую, параллельную оси Оу. ^ 234
Замечание. В теореме 13.1 существенно то, что под х и у понимаются аффинные, в частности прямоугольные, координаты. Так, уравнение р— 1 =0, ли- линейное относительно полярных координат риф, выражает окружность, а не пря- прямую. Уравнение A) называется общим уравнением прямой. Отметим некоторые частные случаи этого уравнения, а именно: выясним, к че- чему приводит равенство нулю некоторых его коэффициентов. 1. С = 0, т. е. уравнение A) имеет вид Ах + By = 0. D) Прямая проходит через начало координат, так как уравнение D) удовлетворяется значениями х = 0, у = 0. Обратно, пусть прямая проходит через начало координат. Тогда, подставляя в уравнение A) значения х = 0, у = 0, получаем С = 0. Итак, для того чтобы пря- прямая проходила через начало координат, необходимо и достаточно, чтобы свободный член С ее уравнения A) был равен нулю. 2. 5 = 0, СфО, т. е. уравнение A) имеет вид Ах-?С = 0. E) Это, очевидно, уравнение прямой, параллельной оси Оу и не совпа- совпадающей с этой осью. Обратно, любая такая прямая задается уравне- уравнением вида E). 3. В = 0, С = 0, т. е. уравнение A) имеет вид и задает ось Оу. 4. Л = 0, Сф0\ 5. А - 0, С - 0. Случаи 3 и 4 истолковываются аналогично предыдущим. Подчеркнем следующее: пусть прямая А задана уравнением A) относительно прямоугольной системы координат. Тогда вектор п (А, В) перпендикулярен прямой А, а вектор а (—В, А) является ее направляющим вектором. В самом деле, возьмем на прямой А две различные точки Мх (*ь уг) и М2 (х29 у2) Имеем Ахг + Вуг + С = 0, Ах2 + Ву2 -} С = 0. Отсюда Это равенство означает, что вектор п (Л, В) перпендикулярен век- вектору М1М2(х1 — х2, ух — у2)» а значит, перпендикулярен и прямой А. Так как векторы п(Л, В) и а(—В, Л), очевидно, перпендикулярны, то а есть направляющий вектор прямой Д. Пусть в уравнении A) все три коэффициента Л, В} С отличны от нуля. Разделив обе части этого уравнения на —С и введя обозна- обозначения а = —С/A, b = —С/В, представим его в виде X а 235
Очевидно, а и Ъ являются величинами отрезков, которые прямая от- отсекает на координатных осях Ох и Оу, считая от начала координаг. Уравнение F) называется уравнением прямой в отрезках. Упражнения 1. Покажите на примере, что в аффинной системе координат вектор т(Л, В) может быть не перпендикулярным прямой, заданной уравнением A). 13.3. Векторная и параметрическая формы уравнения прямой. Уравнение прямой, проходящей через две заданные точки Пусть на плоскости фиксирована некоторая точка О. Тогда про- произвольная точка М плоскости определяется заданием своего радиус- вектора ОМ. Предположим, что А — некоторая прямая на плоскости; г0 — радиус-вектор какой-то фиксирован- фиксированной точки этой прямой; а — направля- направляющий вектор прямой. Обозначим буквой г радиус-вектор произвольной точки М плоскости. Если точка М принадлежит прямой А, то, очевидно (рис. 13.3), г —го = й, A) где t — некоторое действительное число. Обратно, если t — произвольное действи- действительное число, то точка М с радиус- Рис. 13.3 вектором г, определяемым из равенства A), принадлежит прямой А. Равенство 1) или равносильное ему равенство г - г0 4- ta B) называется векторным параметрическим уравнением прямой А. Предположим теперь, что на плоскости выбрана аффинная систе- система координат с началом в точке О. Пусть а(/, т), го(хо, #0), г(х, у). Тогда в силу теоремы 12.9 равенство B) равносильно сле- следующей системе равенств: mt. C) Система уравнений C) называется системой параметрических уравнений прямой А. Если прямая А не параллельна ни одной из координатных осей, то /=7^=0, тфО, и система уравнений C) равносильна одному урав- уравнению X — ^у — Уо I m которое называется каноническим уравнением прямой на плоскости. 236
Пусть заданы две точки М0(х0, у0) и М1(хъ уг) прямой А, не параллельной ни одной из координатных осей. Тогда М0Мг (хг — х0, ух — у0) — направляющий вектор этой прямой и X Л"о У ~~~ Xq XI ~Х0 У!~ Уо есть уравнение прямой А. Упражнения 1. Покажите, что вектор а(—Ву А) является направляющим вектором прямой, заданной в аффинной системе координат уравнением Ах + By + С = 0. 13.4. Совместное исследование уравнений двух прямых Рассмотрим систему двух линейных уравнений с двумя неизвест- неизвестными х и у: Л* + fitf + Q = о,1 m А В С 0 К ' Исследуем вопрос о существовании и количестве действительных решений системы A). Возьмем на плоскости аффинную систему координат Оху. Тогда каждое из уравнений системы A) будет определять некоторую пря- прямую. Любое действительное решение системы A), т. е. два дейст- действительных числа х и у, удовлетворяющие этой системе, будет да- давать координаты точки М(ху у), принадлежащей обеим прямым A). Обратно, координаты любой точки М(х, у), принадлежащей данным прямым A), —решение системы A). Таким образом, вопрос о существовании и количестве действительных решений системы A) равносилен вопросу о существовании и количестве общих точек у прямых A). Очевидно, возможны три случая: 1) прямые A) пересекаются, т. е. имеют единственную общую точку; система A) имеет единственное решение; 2) прямые A) совпадают, т. е. оба уравнения системы A) опре- определяют одну и ту же прямую; система A) имеет бесконечное мно- множество решений; 3) прямые A) различны и параллельны; система A) не имеет решений. Теорема 13.2. Необходимыми и достаточными условиями того, чтобы имел место один из трех указанных случаев, являются со- соответственно следующие условия: 1) не существует такого действительного числа X, что Аг = ХА2, Bi = №» 2) существует такое действительное число X, что Ai == ХА2, Bi = лВ2' ?*i ~ XL>2* 3) существует такое действительное число X, что Аг = ХАг, Вх - А,Ва, Сг ф ХС2. 237
^ Для доказательства потребуется Лемма 13.1. Для того чтобы коэффициенты уравнений A) удов- удовлетворяли равенствам Аг - АД, Вх = ХВ2, B) необходимо и достаточно, чтобы угловые коэффициенты прямых A) либо были равны, либо оба не существовали. > Пусть у прямых A) угловые коэффициенты равны, т. е. -А1/В1 = —AJB2. C) Если А2Ф0у то равенство C) можно переписать в виде Аг/А2 = Вг/В2. Обозначив общую величину этих дробей буквой Я, получим равен- равенства B). Если же Л2 = 0 и, следовательно, Ах = 0, то равенства B) снова верны. Пусть теперь у прямых A) угловые коэффициенты не сущест- существуют. Это означает, что В± = В2 = 0, и равенства B) снова будут иметь место. Обратно, пусть равенства B) справедливы. Если Вгф0, то и В2^=0. Тогда, разделив первое из равенств B) на второе, получим А11В1 - Л2/?2, что приводит к равенству угловых коэффициентов прямых A). Если же В± = 0 и, следовательно, В2 = 0, то угловые коэффициенты пря- прямых A) не существуют. <4 На основании леммы 13.1 первое условие теоремы необходимо и достаточно для того, чтобы угловые коэффициенты прямых A) не были равны или один из них не существовал, а другой существовал. Но это в свою очередь равносильно тому, что прямые A) пересе- пересекаются в одной точке. Предположим теперь, что имеет место второе условие теоремы. Тогда первое уравнение системы A) можно представить в виде С2) - О, и, следовательно, оно определяет ту же прямую, что и второе урав- уравнение этой системы. Обратно, пусть оба уравнения системы A) за- задают одну и ту же прямую. Тогда на основании леммы имеют мес- место равенства B). Если в системе A) под х и у понимать координа- координаты какой-либо фиксированной точки, лежащей на прямой, задавае- задаваемой каждым из уравнений системы, то эти уравнения станут вер- верными равенствами. Первое из них в силу равенств B) можно пред- представить в виде ЦЛ2х + В2у) + Сх = 0. D) Умножая обе части второго равенства системы A) на Я и вычитая из полученного равенства равенство D), получаем = А,С2. 238
Следовательно, второе условие теоремы имеет место, если оба урав- уравнения системы A) выражают одну и ту же прямую. Необходимость и достаточность третьего условия теоремы 13.2 легко выводится рассуждением от противного. ^ Замечание. Условия теоремы 13.2 можно переписать следующим образом: 1') Аг1Аг * Bt/Bt, 2') А1/А2 = Вг1В2 = Сх/Са, 3') AJA* - Вг/В2 *- С^Са, если ни один из знаменателей выписанных дробей не равен нулю. Уп ражи ен ия 1. Сформулируйте и докажите условие параллельности двух прямых, заданных уравнениями системы A) в прямоугольной системе координат. 13.5. Пучок прямых Определение 13.2. Пучком прямых будем называть совокуп- совокупность всех прямых плоскости, проходящих через некоторую точку S — центр пучка. Для задания пучка достаточно задать его центр или любые две прямые пучка. Пусть на плоскости выбрана аффинная система координат и за- заданы уравнения двух различных прямых C^O, A) С2 = 0у B) пересекающихся в точке S(xOi yQ). Рассмотрим уравнение а (Агх 4 Вгу + Сг)л р (А2х + В2у + С2) - 0, C) где а, р — произвольные действительные числа, не равные одновре- одновременно нулю. Покажем, что это уравнение определяет прямую, про- проходящую через точку S. Перепишем его в виде (аА1 + рЛ2) х + (аВ1 + рВ2) у + аСг + рСа = 0. D) Здесь коэффициенты при неизвестных не могут одновременно рав- равняться нулю. В самом деле, пусть аАх + рЛ2 - 0, aBlt+ рв2 = 0, E) и, например, а=?0. Тогда и А2=?0, так как из А2=~0 следует Ах = 0, что противоречит условию пересечения прямых A) и B). Аналогично В2ф0, и равенства E) можно представить в^виде AJA2 =\— р/а, BJB2 = —р/а =>¦ AJA2 = B±/B2, что невозможно, так как прямые A) и B) пересекаются. Итак, ко- коэффициенты при неизвестных в уравнении D) не могут одновременно равняться нулю, и это уравнение при любых а и |3, не равных од- одновременно нулю, задает прямую. Утверждение о том, что прямая C) проходит через точку S(x0, y0) пересечения прямых A) и B), очевидно, так как 239
С = О, А2х0 + В2у0 ±С = О=>а(Агх0 + Р (Л2х0 + В2у0 + С2) - 0. Покажем теперь, что числа аир можно подобрать так, чтобы уравнение C) выражало любую наперед заданную прямую пучка с центром в точке S. Пусть М1(х1У у±) — произвольная точка плоско- плоскости, отличная от S. Достаточно показать, что числа аир можно подобрать так, чтобы прямая C) проходила через точку Мг. Это условие записывается в виде a (Axxx + В1У1 + С,) + р (А2х2 + В2у2 + С2) - 0. F) Так как точка Мг отлична от точки S, то, по крайней мере, одно из чисел, заключенных в скобки в равенстве F), отлично от нуля. Если то равенство F) можно переписать в виде d Придавая р произвольное, отличное от нуля значение, получим соот- соответствующее значение а. Итак, уравнение C) при любых а и р, не равных одновременно нулю, выражает прямую пучка, определяемого прямыми A) и B), и, обратно, любая прямая этого пучка может быть задана уравне- уравнением C). Уравнение C) называется уравнением пучка прямых, опре- определяемого прямыми A) и B). Отметим, что уравнение прямой A) получается из уравнения C) при Р = 0 и произвольном а ф 0, а урав- уравнение B) — при а = 0 и любом р Ф 0. Разделив обе части уравнения C) на а и введя обозначение р/а = А,, перепишем полученное уравнение в виде Агх + В1у + С1 + 1 (А2х + В2у + С2) = 0. G) Это уравнение при любом К выражает некоторую прямую пучка, определяемого прямыми A) и B). Обратно, любая прямая этого пуч- пучка, отличная от прямой B), может быть задана уравнением G) при некотором К. Если заданы координаты центра пучка S(xOj #0), то уравнение пучка, очевидно, имеет вид Упражнения 1. Что будет задавать уравнение C), если прямые A) и B) параллельны? 13.6. Расстояние от точки до прямой Пусть Д — некоторая прямая на плоскости. Определение 13.3. Расстоянием от точки Мо до прямой Д называется длина перпендикуляра, опущенного из точки Мо на пря- прямую Д. 240
Возьмем некоторую прямоугольную систему координат (О, i, j) (рис. 13.4). Рассмотрим орт е, перпендикулярный прямой А. Если прямая А проходит через начало координат, то в качестве е выбе- выберем любой из двух взаимно противоположных ортов, перпендикуляр- перпендикулярных этой прямой. Если же прямая А не проходит через начало координат, то в качестве е возьмем тот орт, который направлен от начала коор- координат к прямой. Обозначим буквой а угол между векторами i и е. Тогда e(cosa, sin а). Обозначим буквой N точку пере- пересечения прямой А с перпендикуляром Аъ проведенным из начала координат к этой прямой, а буквой р — расстояние от нача- начала координат до прямой А, т. е. длину отрезка ON. Точка М (х, у) принадлежит прямой А тогда и только тогда, когда ортогона- ортогональная проекция точки М на прямую Аг совпадает с точкой N. Это условие равно- равносильно следующему: Рис. 13.4 ОМ • е — р. Выражая скалярное произведение через координаты перемножаемых векторов, получаем х cos а + У sin а — р = 0. A) Это уравнение называется нормальным уравнением прямой А. Прямая А разбивает множество всех точек плоскости, не при- принадлежащих этой прямой, на два подмножества, называемых полу- плоскостями. Полуплоскость, в которую направлен орт е, отложен- отложенный от точки N, назовем положительной, а вторую полуплоскость — отрицательной. Заметим, что начало координат всегда находится в отрицательной полуплоскости или лежит на прямой А. Определение 13.4. Пусть d — расстояние от точки Мо до прямой А. Отклонением точки Мо от прямой А называется чис- число б, которое задается следующим образом: 1) б = d, если точка Мо лежит в положительной полуплоскости; 2) б = —d, если точ- точка MQ лежит в отрицательной полуплоскости; 3) б = d = 0, если моед. Теорема 13 3- Пусть в плоскости, снабженной прямоугольной системой координат, задана прямая А нормальным уравнением A). Тогда отклонение б произвольной точки М0(х0, у0) от прямой А и расстояние d от точки Мо до прямой А задаются формула- формулами: б = х0 cos а -)-- Уо sin а — Р> d = | х0 cos а + у0 sin a — р\ 9 ?ак. 3670 B) C) 241
^ Пусть Л^о — основание перпендикуляра, опущенного из точки Мо на прямую А (см. рис. 13.4). Используя теорему 12.1, получаем б = (NN0) = (ON0) — (ON) = ОМ • е — р = х0 cos а + Уо sin а — р. Формула C) следует из B), так как d = |8|. ^ Формула B) приводит к следующему правилу: чтобы найти откло- отклонение какой-либо точки Мо от прямой, достаточно в левую часть нормального уравнения этой прямой вместо х и у подставить ко- координаты точки Мо. Полученное число и есть искомое отклонение. Пусть теперь дано общее уравнение прямой Ах + Ву + С = О, D) и мы хотим найти нормальное уравнение A) этой прямой. Так как уравнения A) и D) задают одну и ту же прямую, то их коэффи- коэффициенты пропорциональны: cos а = Ы, sin а = ЯВ, —р = КС. E) Из первых двух соотношений E) получаем У А2 + В2 Согласно третьему равенству E), знак Я надо брать противополож- противоположным знаку свободного члена С в уравнении D), если СфО. При С = О для К можно брать любой знак: изменение знака приводит к тому, что положительная и отрицательная полуплоскости меняются местами. Число X называется нормирующим множителем для урав- уравнения D), так как после умножения на % это уравнение становится нормальным. На основании изложенного можно записать формулы для откло- отклонения и расстояния от точки М0(х0> у0) до прямой D): Я Ахр + Вуо + С , | Ахр + Ву0 + С \ , О == ¦¦ —• • С1 === ' . (DI _ i т/ /J2 _|_ /32 1/ Л2 _1 Й2 Пусть задано уравнение D). Обозначим величину Ах0 + Ву0 + С буквой б7- &'(х0, Уо). Теорема 13 4- Для всех точек одной и той же полуплоскости, определяемой прямой D), б7 принимает численные значения, оди- одинаковые по знаку; для всех точек второй полуплоскости б' имеет противоположный знак. >> Утверждение этой теоремы для нормального уравнения = {Ах + By + С) = О или, другими словами, для величины б (х09 Уо) = г б' (х0, следует из теоремы 13.3. Но так как б(х0, у0) и 6'(;с0, у0) отли- отличаются только постоянным множителем, не зависящим от точки 242
М0(х0, у0), то это утверждение справедливо и для 8'(л;0, у0). <4 Теорема 13.4 позволяет выяснить геометрический смысл нера- неравенств Ах + Ву + С>0, G) Ах + Ву + С<0, (8) связывающих две переменные х и у. Выберем на плоскости прямо- прямоугольную систему координат Оху и будем считать величины х и у координатами точки. Тогда неравенству G) удовлетворяют коорди- координаты тех и только тех точек, которые лежат в одной из двух полу- полуплоскостей, определяемых прямой Ах + By + С = 0. Неравенству (8) удовлетворяют точки второй полуплоскости, и толь- только они. Далее, каждое из неравенств Ах + By + С > 0, Ах + By + С < 0 задает полуплоскость вместе с ограничивающей ее прямой. Пусть теперь х и у обозначают координаты произвольной точки плоскости в некоторой аффинной системе координат Оху. Рассмотрим прямую А, которая задается в системе координат Оху уравнением Ах + By + С = 0. (9) Возьмем какую-либо прямоугольную систему ко9рдинат Ох'уг. Под- Подставляя выражения старых координат х и у некоторой точки через новые координаты х и у этой же точки (см. § 12.9) в левую часть уравнения (9), получаем Ах + By + С - (апА + апВ) xf + (а12Л + а22В) у' + осхА + агВ. A0) Поэтому (аиЛ + а22В) х' + (а12Л + а22В) у' + ахА + а2В = 0 ¦ есть уравнение прямой А в системе координат Ох/у/'. Из равенства A0) вытекает, что указанный геометрический смысл неравенств G) и (8) имеет силу и в аффинной системе координат. Пример 13.1. Относительно прямоугольной системы координат заданы уравне- уравнения двух прямых: х — 2у+\=09 Ах + 2у — 7 = 0. (И) Составить уравнение прямой, которая проходит через точку пересечения прямых (И) и делит пополам угол между этими прямыми, содержащий точку МоA; 3). Решение. Пусть М (х, у) — произвольная точка искомой прямой, лежащая внутри того угла между данными прямыми, в котором находится точка Мо. Так как расстояния от точки М до данных прямых равны, то, согласно второй фор- формуле F), УТ " К20 ¦ A2) Так как точки М и Мо лежат по одну сторону от первой из данных прямых, то результаты подстановок координат этих точек в левую часть первого уравнения A1), т. е. числа х — 2у-\-1 и —4, имеют одинаковые знаки, следовательно, 9* 243
х — 2у + 1 <0. Аналогично имеют одинаковые знаки числа Ах-\-2у— 7 и 3, следовательно, Ах + 2у — 7 > 0. Теперь равенство A2) можно переписать в виде х — 2у + 1 4х + 2у — 7 KIT ~~ К0 или 6л: — 2г/ — 5 = 0. A3) Этому уравнению удовлетворяют координаты всех точек искомой прямой, ко- которые лежат внутри того же угла, что и точка Mq. Очевидно, ему удовлетворяют координаты и остальных точек прямой. Итак, A3) — уравнение искомой прямой. Упражнения 1. Пусть прямая А задана в аффинной системе координат уравнением D), а Mi (х1у у%), А42 (х2, у2)—две точки, принадлежащие прямой А. Прямую А можно задать уравнениями х = хг + (х2 — хг) t, у = ух + (у2 — Ут) t. Тогда б' (х, у) = (A(x2-Xl) + В ist — yi)) t + AXl + ВУ1 + С . A4 Докажите теорему 13.4, используя формулу A4). 13.7. Угол между двумя прямыми Пусть на плоскости заданы две прямые Дх и А3 своими уравне- уравнениями относительно прямоугольной системы координат: c1==o, (О С2 = 0. B) Как указывалось в§ 13.2, в качестве направляющих векторов этих прямых можно взять векторы al(—Ви Ах), а2(—-В,, А,). Поэтому (см. § 12.11) cos ф = -— . C) ~\ /~ о 2 1 /~ 2 2 Здесь буквой ф обозначен один из двух углов, образуемых прямы- прямыми Ах и А2 при их пересечении. Если эти прямые не пересекаются, т. е. параллельны, то угол между ними по определению считается равным нулю. Из формулы C) следует необходимое и достаточное условие пер- перпендикулярных прямых A) и B): АХА2 + BXB2 = 0. D) Пусть теперь прямые Ах и А2 заданы в прямоугольной системе координат уравнениями y = klX + bb E) у = к,гх + Ь.2. F) 244
Обозначим буквой <р угол, на который надо повернуть прямую Д! вокруг точки пересечения этих прямых, чтобы совместить ее с пря- прямой Д2. Если прямые Аг и Д2 параллельны, то считаем ф = 0. Пусть ах и а2 — углы наклона прямых Ах и Д2 к оси Ох, т. е. kx = tgax, (рис. 13.5). Тогда ср = а2 — ах и tg <*i Итак, tgq> = G) ХЛ Л, /74 РИС« 13'5 Из формулы G) легко получить условие перпендикулярности прямых E), F). Оно отвечает случаю, когда тан- тангенс угла ф не существует, т. е. случаю обращения в нуль знаменателя в формуле G). 1 + kxk2 = 0. Итак, необходимое и достаточное условие перпендикулярности прямых E), F) имеет вид k2 = — \lkx. 14. ПЛОСКОСТИ И ПРЯМЫЕ Плоскость и прямая являются единственными фигурами первого порядка, т. е. фигурами, которые задаются в аффинной системе ко- координат уравнениями первой степени. В этой главе рассматриваются основные задачи, связанные с фигурами первого порядка в прост- пространстве. Если не огоЕорено противное, будем считать фиксирован- фиксированной аффинную систему координат. 14.1. Общее уравнение плоскости Определение 14.1. Линейным уравнением относительно не- неизвестных х, у> z называется уравнение вида Ax + By + Cz + D=fi A) где А, В, С, Z)^R и хотя бы один из коэффициентов А, В, С от- отличен от нуля. Докажем, что всякое линейное уравнение есть уравнение неко- некоторой плоскости и всякая плоскость может быть задана в аффинной системе координат линейным уравнением. Лемма 14.1. Пусть фигура П в некоторой аффинной системе координат задается уравнением A). Тогда и в произвольной аффин- 245
ной системе координат фигура П может быть задана линейным уравнением. > Пусть Orx'yrzr — новая аффинная система координат. Чтобы получить уравнение, задающее фигуру П в новых координатах, подставим в левую часть уравнения A) выражения х, у, z через но- новые координаты х\ у\ г' (см. § 12.9) и приведем подобные члены. В результате получим У А*' + Bty' + Cxzr + Dx = 0. B) М(х,у,г) Легко видеть, что среди чисел Аъ Въ Сг есть отличные от нуля. В самом де- 0А ь~ ле, если Ах = Вх = Сг = 0, C) то при ОхФ0 соотношению B) не удов- Рис 14 1 летворяет ни одна из точек пространст- пространства, а при D± = 0 это соотношение не накладывает никаких ограничений на координаты точек. С другой стороны, уравнению A) удовлетворяет, очевидно, хотя бы одна из точек, но не каждая точка пространства. Следовательно, равенства C) невозможны одновременно. -^ Теорема 14.1. Если в пространстве выбрана некоторая аффин- аффинная система координат Охуг, то всякая плоскость может быть задана линейным уравнением A) и> обратно, всякое уравнение вида A) есть уравнение плоскости. ^ Пусть сначала Охуг — прямоугольная система координат, а П — некоторая плоскость (рис. 14.1). Отметим в этой плоскости ка- какую-либо точку Mo(xOt у0, z0) и отложим от нее вектор М0М (Л, J5, С), перпендикулярный плоскости П. Для того чтобы точка М (х, у, z) лежала на плоскости П, необходимо и достаточно, чтобы вектор М0М был перпендикулярен вектору M0N. Записывая условие пер- перпендикулярности этих векторов (см. § 12.11), получаем уравнение плоскости П: A(x-xo) + B(y-yo) + C(z-Zo) = O. D) Полагая — Ах0 — By 0 — Cz0 = D, приводим уравнение D) к виду A). Таким образом, уравнение A) задает плоскость П. Докажем вторую часть теоремы 14.1. Пусть дано произвольное линейное уравнение A). Рассмотрим множество всех точек, коорди- координаты которых удовлетворяют этому уравнению. Пусть Мо (х0, у0, z0) — одна из этих точек. Тогда Ах0 + Byo + Czo + D = O есть верное равенство. Вычитая его почленно из уравнения A), по- получаем уравнение D), эквивалентное уравнению A). Известно, что 246
уравнение D) задает плоскость, проходящую через точку Мо и пер- перпендикулярную вектору M0N(A, В, С). Значит, и уравнение A) яв- является уравнением этой плоскости. Теорема доказана для случая прямоугольной системы координат. Справедливость теоремы в случае общих аффинных координат вытекает из леммы 14.1. ^ Замечание. В теореме 14.1 существенно то, что под х, у, z понимаются аффинные, в частности прямоугольные, координаты. Так, уравнение р — 1=0, линейное относительно сферических координат р, ф, 0, выражает сферу, а не плоскость. Уравнение A) называется общим уравнением плоскости. Подчерк- Подчеркнем еще раз, что в случае прямоугольной системы координат век- вектор п(Л, В, С) перпендикулярен плоскости A). Отметим некоторые частные случаи уравнения A). есть уравнение плоскости, проходящей через начало координат. 2. By + Cz + D==0 E) есть уравнение плоскости, параллельной оси Ох. При этом плоскость не имеет с осью Ох общих точек, если D=^=0, и проходит через эту ось, если D = 0. Заметим, что мы называем плоскость парал- параллельной прямой, если эта плоскость не имеет с прямой общих точек или проходит через нее. В самом деле, пусть ОфО. Предположим, что плоскость E) имеет с осью Ох общую точку М0(х0, 0, 0). Подставляя координа- координаты этой точки в уравнение E), получаем D = 0, что противоречит условию. Пусть теперь D = 0. Тогда любая точка М (х, 0, 0) оси Ох удовлетворяет уравнению E) и, следовательно, плоскость E) про- проходит через ось Ох. 3. Cz + D = 0 F) есть уравнение плоскости, параллельной плоскости Оху. При этом плоскости F) и Оху не имеют общих точек, если D^0 и совпада- совпадают, если D = 0 (доказательство оставляем читателю). Заметим, что мы называем две плоскости параллельными, если они не имеют общих точек или совпадают. 4. г = 0 есть уравнение плоскости Оху. Аналогично рассматриваются и другие случаи равенства нулю некоторых коэффициентов уравнения A). Пусть теперь в уравнении A) все коэффициенты отличны от ну- нуля. Тогда» введя обозначения а=—D/A, Ь = —DIB, с = —D/C, можно представить уравнение A) в виде a b с 247
Нетрудно показать, что а, Ь, с есть величины отрезков, которые плоскость G) отсекает на осях Ох, Оу, 0zy считая от точки О. Уравнение G) называется уравнением плоскости в отрезках. 14.2. Совместное исследование уравнений двух плоскостей Пусть выбрана аффинная система координат Охуг и заданы урав- уравнения двух плоскостей Dx = 0, A) D2^0. B) Будем различать следующие случаи взаимного расположения двух плоскостей: 1) пересекаются по прямой; 2) параллельны, но не совпадают; 3) совпадают. Найдем условия, которым удовлетворяют коэффициенты уравне- уравнений A) и B) в каждом из перечисленных случаев. Следом плоскости A) на плоскости Оху называется прямая пе- пересечения этих плоскостей. Очевидно, этот след в системе коорди- координат Оху имеет уравнение Ахх + Вху + ?>i = 0. Аналогично определяются следы какой-либо плоскости на коорди- координатных плоскостях Oxz и Оуг. Плоскости A) и B) совпадают тогда и только тогда, когда их следы на координатных плоскостях сов- совпадают. Используя второе условие теоремы 13.4, получаем: для того чтобы плоскости, выражаемые уравнениями A) и B), совпа- совпадали, необходимо и достаточно, чтобы коэффициенты этих урав- уравнений были пропорциональны, т. е. чтобы существовало такое действительное число ХфО, что Ах = %А2У Вх = Щ>, Сх = ЯС2, Dx = %D2. C) Если ни одно из чисел Л2, 52, С2, D2 не равно нулю, то соотноше- соотношения C) можно переписать в виде АХ1А2 = Вх/В2 = Сх/С2 - DXID2. Аналогично получаются необходимые и достаточные условия па- параллельности плоскостей A) и B) в случае их несовпадения: Ах - Ы2, Вх - %В21 Сх - ЯС2, Dx Ф KD, или Ах/А2 = ВХ1В2 = Сх/С2 ф Dx/D2, Теперь очевидно следующее утверждение: для того чтобы пло- плоскости A) и B) пересекались, необходимо и достаточно, чтобы коэффициенты Аъ Вх, Сх не были пропорциональны коэффициентам Afy ?>2, С2. Упражнения 1. Сформулируйте и докажите условие параллельности плоскостей (i) и B) в прямоугольной системе координат. 248
14.3. Пучок и связка плоскостей Определение 14.2. Пучком плоскостей называется мно- множество всех плоскостей, проходящих через некоторую прямую, на- называемую осью пучка. Пусть выбрана аффинная система координат Oxyz и заданы урав- уравнения двух пересекающихся плоскостей: Аух + Вху + Cxz + Dx = 0, A) А2х + В2у + C2z]+[D2 = 0. B) Теорема 14-2- Если а и р — два действительных числа, не равных одновременно нулю, то уравнение а (Ахх + Вгу + Сгг + А) + р (А2х + В2у + C2z + D2) - 0 C) задает некоторую плоскость пучка, определяемого плоскостями A) и B). Обратно, любая плоскость этого пучка может быть задана уравнением C) при некоторых а и р. Доказательство этой теоремы проводится так же, как и в случае пучка прямых на плоскости (см. § 13.5), и предоставляется читателю. Определение 14.3. Связкой плоскостей называется множес- множество всех плоскостей, проходящих через некоторую точку, называ- называемую центром связки. Если выбрана аффинная система координат Oxyz и задан центр связки S (хОу уОу z0), to, очевидно, любая плоскость связки может быть задана уравнением А (х-х0) +[В(У — Уо) + C(z-z0) - 0, D) где Д В, С — числа, не равные одновременно нулю. Обратно, при любых Л, В, С, не равных одновременно нулю, уравнение D) зада- задает плоскость связки с центром в точке S(x0, yOy z0). Можно дать также уравнение связки плоскостей в форме, аналогичной уравне- уравнению C), т. е. имеет ?лесто Теорема 14 3. Пусть Ахх + Вгу + Cxz + DX = 0,1 А3х + В3у + C3z + D3 = 0 J есть уравнения трех плоскостей, проходящих через точку S (xQ, y0, z0), таких, что выполняется условие Л Вх Сх А2 В2 С2 ф 0. F) Л3 Jlj3 C3 Тогда для любых действительных чисел а, р, у, не равных одновре- одновременно нулю, уравнение а (Ахх + Вху + Cxz + Dx) + р (А2х + В2у + C2z + D2) + y (A3x + В3у+ >а) = 0 G) 249
задает некоторую плоскость связки с центром в точке S. Обрат- Обратно, любая плоскость этой связки может быть задана уравнением G) при подходящем выборе а, р, у. ^ Перепишем уравнение G) в виде (Ага + ЛР + Л3у) х + (Вха + Я2р + В3у) у + (Сха + С2р + С3у) г + + Dxa + D2p + D3y = 0. (8) Предположим, что коэффициенты при ху у, z в этом уравнении равны нулю, т. е. Аха + Л2р + А3у = 0,) Вха + В$ + В3у = 0,\ (9) Сха + С2р + Csy = 0.J В силу условия F) система уравнений (9) относительно неизвест- неизвестных а, р, у имеет единственное решение: а = р = у = 0, что про- противоречит выбору а, р, у. Итак, уравнения (8), а поэтому и урав- уравнение G) линейные относительно ху у, z> и, следовательно, задают плоскости. Так как точка S удовлетворяет каждому из уравнений E), то она удовлетворяет и уравнению G), т. е. плоскость G) при- принадлежит связке. Пусть теперь задано уравнение произвольной плоскости связки Ax + By + Cz + D = 0. A0) Рассмотрим систему уравнений Аха + А2р + А3у = А, Вха + Вф + В3у = В, A1) Сха + С2р + С3у - С относительно неизвестных а, р, у. В силу условия F) система A1) имеет единственное решение. Так как каждая из плоскостей E), а также плоскость A0) проходят через точку S(x0} y0} z0), то ?>i = — Ахх0 — Вху0 — CxzOi 2 2q 2Уо 2o D3 = — A3x0 — B3y0 — C3z0, D = — Ax0 — By0 — Cz0. Отсюда в силу равенств A1) получаем Dxa + D2p + D3y = D. Таким образом, при выбранных нами а, р, у уравнения G) и A0) совпадают. М Пример 14.1. Составить уравнение плоскости П, проходящей через прямую пере сечения плоскостей 2x-y + z-3 = 0, A2) x + f/ + z+l=0 A3) и параллельной оси Ох. Решение. Плоскость П принадлежит пучку, определяемому плоскостями A2) и A3), и, следовательно, задается уравнением aBx-y + z-3) + P(x + y + z+l)=0. A4) 250
Так как плоскость П параллельна оси Ох, то после приведения подобных членов коэффициент при х в уравнении A4) должен быть равен нулю: 2а + р = 0 => р — 2а. Подставляя это значение р в уравнение A4) и сокращая уравнение на —а, по- получаем Зу + г + 5 — 0. Упражнения 1. Что задает уравнение G), если строки определителя F) попарно пропор- пропорциональны? 14.4. Расстояние от точки до плоскости Пусть Охуг — прямоугольная система координат и П — некото- некоторая плоскость (рис. 14.2). Проведем через точку О прямую А, пер- перпендикулярную к плоскости П, и пусть N — точка пересечения Д и П. Введем на прямой А положительное направление, совпадающее с направлением вектора ON, и пусть п — единичный вектор, направ- направление которого совпадает с направлением вектора ON. Если плос- плоскость П проходит через начало координат, то в качестве положи- положительного направления на прямой А можно выбрать любое из двух возможных направлений. Обозначим буквами а, C, у углы, образуемые вектором п соот- соответственно с осями Ох, О у и Ог. Величины cos a, cos p, cosy назы- называются направляющими косинусами вектора п. Так как Еектор п единичный и п (cos a, cos C, cos 7), то cos2 а + cos2 p + cos2 y = 1. A) Наконец обозначим буквой р длину вектора ON, т. е. расстояние от начала координат О до плоскости П. Пусть теперь М (х, у, г) — произвольная точка плоскости П. Тогда (ON) = р = пр„ ОМ = ОМ • п — х cos a + У cos p + z cos у, следовательно, х cos а \- у cos р 4- z cos y — р ~ 0. B) Этому равенству удовлетворяет любая точка М(х, у, г) плоскости П и не удовлетво- удовлетворяет никакая точка, не лежащая на этой плоскости. Равенство B) называется нор- нормальным уравнением плоскости П. Введем еще некоторые понятия. Плос- Плоскость П разбивает множество всех точек пространства, не принадлежащих плоскости П, на два подмножества, называемых полу- полупространствами. Назовем положительным Рис. 14.2 251
то полупространство, в которое направлен вектор п; второе полу- полупространство назовем отрицательным. Заметим, что начало коорди- координат всегда расположено в отрицательном полупространстве или в плоскости П. Определение 14.4. Расстоянием d от точки Mo(xOj yOj z0) до плоскости П называется длина перпендикуляра, опущенного из точки Мо на плоскость П. Отклонением точки Мо от плоскости П называется число б, которое задается следующим образом: 1) б = d, если точка Мо лежит в положительном полупространстве; 2) б = = — d, если точка Мо лежит в отрицательном полупространстве; 3) b = d = O, если Мо 6 П. Теорема 14*4* Имеют место формулы d = \х0 cos a + у0 cos Р + z0 cos у — р\. D) > Пусть Л/о — ортогональная проекция точки Мо на прямую ON. Тогда б = (NN0) = (ON0) — (ON)=n • ОМ0—р=х0 cos а+у0 cos р+г0 cos y~p. Формула C) доказана. Формула D) непосредственно следует из фор- формулы C), так как по определению d = |6|. ^ Пусть теперь задано общее уравнение плоскости Ах + By + Cz + D = 0, E) и мы хотим привести его к нормальному виду B). Так как уравне- уравнения B) и E) задают одну и ту же плоскость, то их коэффициенты пропорциональны: ХА = cos a, KB = cos p, КС = cos у, KD = — p. F) Из первых трех соотношений F), используя формулу A), получаем а, = + ,. z • G) \ А2 + Я2 + С2 Согласно последней формуле F), знак в выражении G) надо вы- выбирать противоположным знаку свободного члена D уравнения E) (если D = 0, знак в формуле G) может быть любым). Величина К называется нормирующим множителем уравнения E) в соответствии с тем, что после умножения на К это уравнение становится нор- нормальным. Теперь легко получить формулы для отклонения б и расстоя- расстояния d от точки Mo(xOj y0, z0) до плоскости E): Ахр + By о +Czq + D б = г =—, + у л2 + в2 + с2 \Ах0 + Ву0 + Czp + D\ У А2 + В2 + С2 Теорема 14-5- Результаты подстановок координат двух точек в левую часть уравнения E) являются числами одного знака, если 252
эти точки лежат по одну сторону от плоскости; эти числа имеют разные знаки, если точки лежат по разные стороны от плоскости. Доказательство этой теоремы аналогично доказательству теоре- теоремы 13.4 и предоставляется читателю. Используя теорему 14.5, можно дать геометрическое истолкование неравенствам Ax+By + Cz + D> О, (8) Ах + By + Cz + D < 0. (9) Выберем некоторую аффинную систему координат и будем по- понимать под х, у, z координаты точки в этой системе координат. Тогда неравенству (8) удовлетворяют координаты тех и только тех точек, которые лежат в одном из двух полупространств, определя- определяемых плоскостью Ах + By + Cz + D = 0. Неравенству (9) удовлетворяют точки второго полупространства, и только они. Далее, каждое из неравенств задает полупространство вместе с ограничивающей его плоскостью. 14.5 Различные виды уравнений прямой Прямая как пересечение двух плоскостей. Прямую в пространст- пространстве можно представить как пересечение любых двух различных плос- плоскостей, проходящих через эту прямую. Следовательно, в аффинной системе координат ее можно задать системой двух линейных урав- уравнений Агх + Вху + C±z A C DX = 0,1 D2 = 0.j Так как плоскости, определяющие прямую, не параллельны, то ко- коэффициенты при неизвестных в уравнениях A) не пропорциональны. Уравнения системы A), выражающей заданную прямую, опреде- определяются неоднозначно: каждое из них может быть заменено уравне- уравнением вида а (Агх + В1У + C±z + D,) + р (А2х + В2у + C2z + D2) = 0, где а, р — произвольные действительные числа, не равные одновре- одновременно нулю. Очевидно, любая система вида A) с непропорциональными коэффициентами при неизвестных определяет в пространстве неко- некоторую прямую. Параметрические уравнения прямой. Пусть А — прямая. Ненуле- Ненулевой вектор а назовем направляющим вектором прямой А, если любой направленный отрезок из класса а параллелен А. Фиксируем аффинную систему координат. Если а (/, т, п) — направляющий вектор прямой А, а М0(х0, у0, z0) — некоторая точка этой прямой, 253
то произвольная точка М (х, у, z) пространства принадлежит пря- прямой А тогда и только тогда, когда вектор М0М (х — х0, у —yQ, z — z0) коллинеарен вектору а. Записав условие коллинеарности этих век- векторов, получим параметрические уравнения прямой, проходящей через точку М0(х0, у0, z0) параллельно вектору а(/, т, п): х — хо = tt, у —у0 = mt, z — z0 = nt \ или x = xo + lt, у = у0 + mt, z = zo + nt. B) Обозначим через г и г0 векторы ОМ и ОМ0 (рис. 14.3). Тогда система B) равно- равносильна одному векторному уравнению г = r0 + ta, которое будем называть векторным пара- параметрическим уравнением прямой, проходя- проходящей через точку Мо (г0) параллельно вектору а. Канонические уравнения прямой. Если каждое из чисел Z, т, п отлично от нуля, то соотношения B) равносильны трем уравнениям: У — У о У — Уо = Z—Zo х — *0 т п Рис. 14.3 х — х0 I m которые запишем в виде х — Хр __ у — Уо __ z I C) т D) Равенства D) будем называть каноническими уравнениями прямой? проходящей через точку Мо(хОу у0, z0) параллельно вектору а(/, т, п). Каждое из уравнений C) есть следствие двух остальных. Поэто- Поэтому вместо системы C) можно написать, например, систему уравнений X X — — Хо Хо У Z — т — Уо Zo Тем самым представим прямую как пересечение двух плоскостей, одна из которых параллельна оси Ог, а другая — оси Оу. Упражнения 1. Можно ли задать прямую в пространстве одним уравнением? 2. Пусть прямая А задана в аффинной системе координат системой уравнений Покажите, что вектор Из ;1). направляющим вектором прямой Д. 254
14.6. Некоторые задачи Уравнения прямой, проходящей через две данные точки. Пусть заданы две различные точки М1(хъ уъ z±) и М2(х2, уг, z2) прямой А. Тогда вектор М1М2(х2 — х1у у2— й,га — 2i) является направляющим вектором этой прямой, и мы можем записать параметрические урав- уравнения прямой А (см. § 14.5): Х = Х1 + (х2 — хг) t, | y = yi + (y2 — yi)t>\ 0) z = гг + {z2 — гг) t. ) Если прямая А не параллельна ни одной из координатных плоскос- плоскостей, то х2фхъ У2Т=Уъ ^гФгъ и вместо A) можно записать кано- канонические уравнения прямой А: Уравнение плоскости, проходящей через данную точку и парал- параллельной двум данным векторам. Пусть заданы точка принадлежащая плоскости П, и два неколлинеарных вектора а(/, /и, п), Ь(/ь тъ яз.), C) параллельных этой плоскости. Пусть, далее, М (х, уу z) — произволь- произвольная точка пространства и г = ОМ> г0 = ОМ0 (рис. 14.4). Для того чтобы точка М принадлежала плоскости П, необходимо и достаточ- достаточно, чтобы векторы a, b и г — г0 были компланарны. Как известно из §12.13, это равносильно равенству нулю смешанного произведения указанных век- векторов: (r-ro)ab = O D) n 0. E) или X Xq I m k mx По теореме 12.4 вектор г — г0 можно разложить по неколлинеарным векторам аи Ь, т. е. представить в виде Рис. 14.4 г0 = аа Отсюда г = г0 + аа + F) Когда а и р принимают все действительные значения, точка М про- пробегает всю плоскость П. Равенство F) называется векторным пара- параметрическим уравнением плоскости П 255
В силу теоремы 12.9 всякое векторное равенство можно заменить тремя равенствами, в которых участвуют координаты этих векторов. Сделав такую замену для уравнения F), получим параметрические уравнения плоскости П в координатах: У = Уо + am + $ml9\ G) z~zo-\-an-\- рях. ) Итак, плоскость П, проходящую через точку B) параллельно векторам C), можно задать уравнениями одного из видов D) — G). Уравнение плоскости, проходящей через три данные точки. Если заданы три точки Мх(х^ уъ г±)9 М2(х^ у29 z2), M3(x3> y3> z8), не ле- лежащие на одной прямой, то уравнение Плоскости, проходящей через эти точки, легко получить из уравнения ,E): х — Хх у —Ух z — Zi г xi У 2— Уг г 2— zx 5 Xi у з— Ух Z з— ' Взаимное расположение прямой и плоскости. Пусть задано об- общее уравнение плоскости П Ах + By + Cz + D = 0 (9) и параметрические уравнения прямой А Требуется определить взаимное расположение П и А. Будем различать следующие случаи взаимного расположения прямой и плоскости: 1) прямая пересекает плоскость в одной точке; 2) прямая параллельна плоскости и не лежит в ней; 3) прямая принадлежит плоскости. Найдем для каждого из этих случаев усло- условия, которым должны удовлетворять коэффициенты уравнений пря- прямой А и плоскости П. Подставляя выражения для х9 у, z из уравнений прямой А в уравнение плоскости П, получаем (А1 + Вт + Сп) t + Ах0 + ByQ + Bz0 + D — 0. Значения параметра t9 удовлетворяющие этому равенству, соответст- соответствуют тем точкам прямой А, которые лежат в плоскости П. Теперь легко получить необходимые и достаточные условия для каждого из перечисленных случаев взаимного расположения прямой А и плоскости П, а именно: А1 + Вт + Сп ф 0 есть условие того, что прямая пересекает плоскость в одной точке; А1 + Вт + Сп = 0, Ах0 + Ву0 + Cz0 + D Ф 0 есть условия того, что прямая параллельна плоскости и не лежит в ней; А1 + Вт + Сп = 0, Ах0 + Ву0 - есть условия того, что прямая принадлежит плоскости. 256
Взаимное расположение двух прямых в пространстве. Пусть за- заданы уравнения двух прямых: х = хо + It, y = yo + mty z = zo + nt, (8) х == хх + lxt, у = yx + mxt, z = zx + nxt, (9) и требуется определить их взаимное расположение. При этом мы будем различать следующие случаи взаимного расположения двух прямых в пространстве, т. е. прямые: 1) пересекаются в одной точ- точке; 2) совпадают; в) параллельны, но не совпадают; 4) являются скрещивающимися. Найдем для каждого из этих случаев условия, которым ц^лжны удовлетворять коэффициенты уравнений (8) и (9). Рассмотрим направляющие векторы данных прямых: а(/, т, я), ai(/b тъ пх). Пусть эти векторы коллинеарны, т. е. / = %1Ъ т = Хтъ п = Хпх. A0) Тогда прямые параллельны, т. е. совпадают или лежат в. одной плоскости и не имеют общих точек. При этом прямые совпадают тогда и только тогда, когда вектор МОМЬ где М0(х0, у0, г0), М±(хХ9 уъ Zi), коллинеарен векторам а и at и, следовательно, хх — х0 = \il, ух — у0 = (а/и, гх — г0 = \т. A1) Итак, равенства A0) и A1) дают необходимые и достаточные ус- условия для совпадения прямых (8) и (9). Для того чтобы эти пря- прямые были параллельны и не совпадали, необходимо и достаточно, чтобы условия A0) выполнялись, а условия A1) — нет. Пусть теперь векторы а и ах неколлинеарны, т. е. условия A0) не выполняются. Тогда прямые (8) и (9) пересекаются в одной точ- точке или являются скрещивающимися. Если они пересекаются и, сле- следовательно, лежат в одной плоскости П, то векторы а, ах и MQMX компланарны. Поэтому * уг — у о гх — z0 I т тх п пх A2) At о N а Рис. 14.5 Рис. 14.6 Обратно, пусть векторы а и ах неколлинеарны и имеет место равен- равенство A2). Найдем точки А и Аъ такие, что М0А = а, МхАг = а! (рис. 14.5). Тогда отрезки М0Ми М0А и М1Л1 определяют плос- 257
кость, в которой лежат прямые (8) и (9). Так как векторы а и ах неколлинеарны, то прямые пересекаются. Итак, прямые (8) и (9) пе- пересекаются в одной точке тогда и только тогда, когда их направляющие векторы неколлинеарны и имеет место равенство A2). Заметим, что это равенство имеет место не только при пересечении прямых (8) и (9) в одной точке, но и при их параллельности, так как в этом случае вторая и третья строки определителя пропорциональны. Отсюда по- получаем необходимое и достаточное условие того, что прямые (8) и (9) являются скрещивающимися: I Xq Ух У о Zx Zo I m n ^=0. lx тх пх Будем в дальнейшем предполагать, что в пространстве фиксиро- фиксирована прямоугольная система координат Oxyz. Расстояние от точки до прямой в пространстве. Найдем форму- формулу, выражающую расстояние d от точки Мх с радиус-вектором гх до прямой Д, заданной уравнением г = г0 + /а. Отложим вектор а от точки Мо, т. е. найдем такую точку М3 на прямой Д, что = * (рис. 14.6). Построим параллелограмм на отрезках М0М3 и МоМг, как на сто- сторонах. Тогда искомое расстояние d равно длине перпендикуляра MXN, проведенного из вершины Мх к противоположной стороне паралле- параллелограмма. Так как площадь параллелограмма равна |(г0 — гх) xa| = |a|d, то формула d== Кгр — гр ха| |al задает расстояние от точки Мх с радиус-вектором Гх до прямой Д. Угол между двумя плоскостями. Пусть требуется найти величи- величину угла ф, который образуют две плоскости, заданные уравнениями Ахх + Вгу + Cxz + Dx = 0, A B C D 0 Очевидно, Ееличина угла между этими плоскостями равна углу меж- между Еекторами пх(Ах, Вх, Сх) и п2(Л2, Б2, С2), перпендикулярными этим плоскостям. Поэтому СОЗф- АгАъ + ВгВъ + С&ъ A3) Из формулы A3) следует необходимое и достаточное условие перпендикулярности заданных плоскостей: АХА2 + ВХВ2 + СХС2 - 0. Угол между двумя прямыми. Так как величина угла ф между двумя прямыми (8) и (9) равна углу между направляющими векто- векторами этих прямых, то эту величину можно выразить по формуле 258
cos cp = lh + тпц Из этой формулы вытекает необходимое и достаточное условие перпендикулярности прямых (8) и (9): Пг + ттх + nrti = 0. Угол между прямой и плоскостью. Пусть заданы прямая х = хо + It, y = yo + mt,z = zo-{-nt A4) и плоскость Ах + By + Cz + D = 0. A5) Рис 14 7 Обозначим буквой ф величину угла, образо- образованного прямой A4) с ортогональной проекцией этой прямой на плос- плоскость A5) (рис. 14.7). Если прямая перпендикулярна к плоскости, то положим ф = я/2. Будем считать, что О^Сф^я/2. Так как век- вектор п(Л, В, С) перпендикулярен к плоскости A5), то направляющий вектор а(/, т, п) прямой A4) образует с вектором п угол ty = я/2 — — Ф или 'ф = я/2 + ф. Поэтому \А1 + Вт ' — sin ф — (cos я|)| = V 15. ПЛОСКИЕ ФИГУРЫ ВТОРОГО ПОРЯДКА Эта глава посвящена плоским фигурам второго порядка, т. е. таким плоским фигурам, которые в прямоугольной системе коорди- координат задаются уравнениями второй степени. Подробно изучаются три «главные» фигуры второго порядка — эллипс, гипербола и парабола и описываются все плоские фигуры второго порядка. 15.1. Эллипс Определение и вывод канонического уравнения. Пусть на плос- плоскости заданы две точки F± и F2, расстояние между которыми равно 2с, и дано число а, удовлетворяющее неравенству с<а. A) Определение 15.1. Эллипсом называется фигура, состоящая из всех точек плоскости, для каждой из которых сумма расстоя- расстояний до точек F± и F2 равна 2а, а фокусами эллипса — точки Fxu F2. Если условие A) не выполнено, то рассматриваемое множество либо является отрезком прямой, заключенным между фокусами, либо не содержит ни одной точки. Из определения 15.1 вытекает следующий способ построения эллипса: если концы нерастяжимой нити длины 2а закрепить в точ- точках Fi и F2 и натянуть нить острием карандаша, то при движении ост- 259
рия будет вычерчиваться эллипс с фокусами Fb F2 и с суммой рас- расстояний произвольной точки эллипса от фокусов, равной 2а (рис. 15.1). Составим уравнение эллипса. Для этого выберем декартову прямо- прямоугольную систему координат так, чтобы ось Ох проходила через фокусы Fx и F2 и имела положительное направление от Fx и F2. Начало координат возьмем в середи- середине отрезка FtF2. Тогда Ft (— с, 0), F2(c, 0). Пусть М(х, у) — произвольная точка эллипса. Тогда -cf+f B) Рис- 15Л По определению 15.1 \FM\ + \F2M\ = 2а. C) Подставляя сюда значения \FXM\ и \F2M\ из формулы B), получаем V (х + сJ + у2 + V(х — сJ + у2 = 2а. D) Это и есть уравнение эллипса, так как ему удовлетворяют коорди- координаты всех точек эллипса и только этих точек. Преобразуем уравнение D). Перенесем второй радикал левой части уравнения в правую часть и возведем обе части полученного урав- уравнения в квадрат. После приведения подобных членов получим Возведя обе части этого равенства в квадрат и приводя подобные члены, найдем (а2 — с2) х2 + а2у2 = а2 (а2 — с2)у F а2 " а2 —с2 Введем в рассмотрение новую величину 1. E) Ь = У а2 —с2; в силу неравенства A) она вещественна. Тогда &2 = а2 —с2, F) и уравнение E) примет вид ^+^- = 1. G) а2 Ь2 V ; Мы показали, что любая точка эллипса удовлетворяет уравне- уравнению G). Покажем теперь обратное: любая точка М(х, у)у удовле- удовлетворяющая уравнению G), принадлежит эллипсу, т. е. удовлетворяет соотношению C). Из уравнения G) получаем у2\ 260
Используя это соотношение и равенство F), находим г —————————— =У(х + с? + у* = ]/ ; 2сх /С — Y^ I / p У ¦ I fT" I Так как в силу равенства G) \х\ а а и, кроме того, — x. а уЧ __ то Аналогично можно получить формулу \F2M\ = a c-x. а (8) (9) Складывая последние два равенства, получаем равенство C). Итак, соотношение G) является уравнением эллипса. Оно назы- называется каноническим уравнением эллипса. Исследование формы. Исходя из уравнения G), исследуем форму эллипса. Координаты точек эллипса ограничены неравенствами \х\ ^ ^ а> \у\ ^ Ь. Это означает, что эллипс есть ограниченная фигура, не выходящая за пределы прямоугольника, изображенного на рис. 15.2. а У га Рис. 15.2 Рис. 15.3 Далее заметим, что в уравнение G) входят только четные степени координат. Поэтому эллипс наряду с каждой точкой М(ху у) содер- содержит также точки М1(—х, у), М2(х, —у), М3(—х9 —у). А это означает, что эллипс есть фигура, симметричная относительно осей Ох и Оу и начала координат. Поэтому для исследования формы эл- эллипса достаточно рассмотреть его в первой координатной четверти, в остальных четвертях его строение определяется по симметрии. Для первой четверти из уравнения G) получаем у=±.у а? — х2 . A0) а При увеличении х от нуля до а у монотонно убывает от Ь до 0. График функции A0) изображен на рис. 15.3, а. Достроив остальные три четверти эллипса по симметрии, получим весь эллипс (рис. 15.3, б). Оси симметрии эллипса (оси Ох и Оу) называют просто его ося- осями, а центр его симметрии—точку О — центром эллипса. Точки А\, 261
А2, В\ и В2 пересечения эллипса с его осями называют вершинами эллипса. Полуосями эллипса называют отрезки 0Ах и 0А2, а также их длины а и Ь. При наших предположениях, когда фокусы эллипса рас- расположены на оси Ох, из соотношения F) следует, что а>Ь. В этом случае а называется большой полуосью, a b — малой. Однако урав- уравнение G) можно рассматривать и при условии а<6; это будет ура- уравнение эллипса, фокусы которого расположены на оси Оу и большая полуось равна Ь. Наконец, рассмотрим уравнение G) при а = Ь. Тогда его можно переписать в виде х* + у* = а\ A1) Это уравнение окружности радиуса а с центром в начале координат. В дальнейшем будем рассматривать окружность как эллипс с равны- равными полуосями, фокусы в этом случае совпадают с центром окружно- окружности. Эллипс G) можно получить из окружности A1) следующим об- образом. Пусть на плоскости выбрана прямоугольная система коорди- координат Оху. Рассмотрим преобразование плоскости, переводящее произ- произвольную точку М(х, у) в точку М' (х\ у'), координаты которой за- задаются формулами Это преобразование называется сжатием плоскости к оси Ох. Чтобы получить уравнение образа окружности A1) при этом сжатии, дос- достаточно подставить в уравнение A1) выражения х= х\ у= -%-у'9 полученные из A2). В результате подстановки найдем т. е. уравнение эллипса с полуосями а и b (рис. 15.4). Эксцентриситет. Эксцентриситетом эллипса называется число е = с/а. A3) Так как ?<а, то е<1. У окружности оба фокуса совпадают, по- поэтому с = 0 и 8 = 0. Перепишем равенство A3) в виде е = V 1 — {blaf . Отсюда видно, что эксцентриситет 8 характеризует форму эллипса: чем ближе е к нулю, тем больше эллипс похож на окружность; при увеличении 8 эллипс становится более вытянутым. На рис. 15.5 изображены эллипсы с различными значениями е. 262
Фокальные радиусы. Фокальными радиусами точки М эллипса на- называются отрезки прямых, соединяющие эту точку с фокусами Fx и F2. Их длины г\ и г2 задаются формулами (8) и (9), которые мы пере- перепишем в виде Г\ = а + е#, г2 = а — ex. Фокальный параметр. Проведем через фокус эллипса G) прямую Л, перпендикулярную оси Ох (см. рис. 15.3, б). Длина отрезка /^М Рис. 15.4 Рис. 15.5 Рис. 15.6 называется фокальным параметром эллипса и обозначается буквой р. Решая уравнение х = с прямой А совместно с уравнением G) эллип- эллипса, получаем A4) Параметрические уравнения. Пусть задан эллипс G), причем а>Ь (рис. 15.6). Опишем вокруг центра эллипса две окружности: одну радиуса а, другую радиуса Ь. Проведем из центра эллипса произволь- произвольный луч и обозначим буквой t угол, который образует этот луч с осью Ох. Пусть проведенный луч пересекает меньшую окружность в точке Р, а большую — в точке Q. Проведем через точку Р прямую, параллельную оси Оху и через точку Q — прямую, параллельную оси Оу. Покажем, что точка М(хч у) пересечения этих прямых принад- принадлежит данному эллипсу. Обозначив буквами Pi и Q{ проекции точек Р и Q на ось Ох, получим у = = \OQ\cost = a cos t, = (P±P) - | OP | sin/ - bsin/. Итак, x^acost, y = bsint. A5) Подставив выражения A5) в уравнение G), убедимся, что оно удовлетворяется при любом значении /. Следовательно, A5) являют- являются параметрическими уравнениями эллипса G). Вместе с тем получен способ построения эллипса по заданным полуосям, а именно: прове- проведя рассмотренное построение для ряда лучей, исходящих из начала координат и образующих между собой достаточно малые углы, мы 263
найдем ряд точек эллипса. Соединив эти точки плавной линией, по- получим рисунок эллипса. Пересечение с прямой. Выясним вопрос о количестве точек пере- пересечения эллипса G) с какой-либо прямой. Рассмотрим сначала пря- прямую, не параллельную оси Оу. Ее уравнение y = kx + m. A6) Чтобы найти точки пересечения этой прямой с эллипсом G), подста- подставим выражение у из формулы A6) в уравнение G). Получим х^ __ (kx + mJ __ 1 ИЛИ (a2k2 + б2) х2 + 2а2 kmx + а2 (т2 — Ь2) = 0. Это уравнение дает абсциссы искомых точек пересечения. Поскольку оно квадратное, то в зависимости от характера его корней возможны следующие случаи: 1) прямая пересекает эллипс в двух различных точках, 2) прямая имеет с эллипсом одну общую точку и называет- называется касательной к эллипсу, 3) прямая не имеете эллипсом общих точек. Легко показать, что для прямой, параллельной оси Оу, имеют место такие же случаи. Упражнения 1. Покажите, что при афЬ эллипс G) имеет только две оси симметрии. 15.2. Гипербола Определение и вывод канонического уравнения. Пусть на плоско- плоскости заданы две точки Fx и F2, расстояние между которыми равно 2с. Пусть, далее, выбрано число а, удовлетворяющее неравенствам 0<а<с. A) Определение 15.2. Гиперболой называется фигура, состоя- состоящая из всех точек плоскости, для каждой из которых абсолютная величина разности расстояний до точек Fx и F2 равна 2а, а фоку- фокусами гиперболы — точки Fx и F%. Указанное множество при а-=0 есть прямая, при а = с — два луча, а при а>с это множество не содержит ни одной точки. Составим уравнение гиперболы. Для этого выберем декартову прямоугольную систему координат так, чтобы ось Ох проходила че- через фокусы FX9 F2 и имела положительное направление от Fx к F2; начало координат О Бозьмем в середине отрезка FXF2. Тогда Fx (—с, 0), F2(c, 0). Пусть М(х, у) — произвольная точка гиперболы. По опре- определению 15.2 или 264
I F±M \ — \F2M\ = ±2a. B) Вставляя в равенство B) выражения I FXM | = V (x + c)* + y\ \F2M\ = Y(x-c)* + tf9 получаем cf + y* - ±2a. C) Это и есть уравнение гиперболы. Упростим его. Для этого перенесем второй радикал левой части равенства C) вправо и возведем обе ча- части полученного равенства в квадрат. Приведя подобные члены, по- получим Возводя обе части этого равенства в квадрат и приводя подобные члены, придем к равенству (с2 — а2) х2 — а2 у2 = а2 (с2 — а2) или а2 с2 —a2 v ' Введем в рассмотрение новую величину В силу неравенств A) она вещественна. Тогда и уравнение D) принимает вид х2 ф * «2 = 1 F) Мы показали, что из равенства C) следует равенство F), т. е. что любая точка гиперболы удовлетворяет уравнению F). Покажем обратное. Пусть точка М(ху у) удовлетворяет уравнение F). Тогда V2 Используя зто соотношение и равенство E), находим \FXM\ = 1 (х + сJ + у2 - у х2 н- 2сх + с2 + ^х2 - б2 Аналогично можно получить \F9M\ = ¦ х — а а G) (8) Так как из равенства F) следует, что \х \ ^ а, а в силу неравенства A) с>а, то для х^а формулы G) и (8) дают 265
= — x — a. а (9) Следовательно, = 2a. Для х^—а \F1M\= — — х — a,\FaM\ = — — х-т-а. а а A0) Следовательно, \F1M\-\F2M -2а. Итак, любая точка, удовлетворяющая уравнению F), удовлетворяет также уравнению B) и, значит, уравнению C). Мы показали, что уравнения C) и F) равносильны, и, следовательно, уравнение F) за- задает гиперболу. Оно называется каноническим уравнением гиперболы. Исследование формы гиперболы. Асимптоты. Из уравнения F) видно, что \х\^а. Это означает, что вся гипербола располагается вне полосы, ограниченной прямыми х = —а и х = а. Так как в ура- уравнение F) входят только четные степени координат, то гипербола симметрична относительно каждой из координатных осей и начала координат. Поэтому достаточно узнать форму гиперболы в одной из координатных четвертей, например в первой; в остальных четвертях гипербола строится по симметрии. Из уравнения F) для первой чет- четверти получаем -v A1) График этой функции, начиная от точки Л (а, 0), уходит неограни- неограниченно вправо и вверх (рис. 15.7, а). Покажем, что при этом он как угодно близко подходит к прямой A2) у ___ ¦X. а Рис. 15.7 Проведем из произвольной точки М графика функции A1) прямую, параллельную оси О у и пересекающую прямую A2) в точке N. Кро- Кроме того, опустим из точки М перпендикуляр МР на прямую A2). Тогда 266
аЬ ' lim \MN\= 0. x + у Х2 _ a2 *_,+«> • Так как \MP\<\MN\, то lim IMP I- 0. Итак, когда переменная точка М уходит в бесконечность по той части гиперболы F), которая расположена в первой четверти, рас- расстояние этой точки от прямой A2) стремится к нулю. В соответствии с этим говорят, что гипербола асимптотически приближается к пря- прямой A2), и эту прямую называют асимптотой гиперболы. Очевидно, у гиперболы F) две асимптоты: Ь Ь у =—ху у = -х. Сделаем рисунок гиперболы F). Сначала строим так называемый основной прямоугольник гиперболы, центр которого совпадает с началом координат, а хтороны равны 2а и 2Ъ и параллельны осям Ох и Оу. Прямые, на которых расположены диагонали этого прямоугольника, являются асимптотами гиперболы. После этого делаем рисунок са- самой гиперболы (рис. 15.7, б.) Подчеркнем, что гипербола — это фигура, состоящая из двух от- отдельных ветвей; знак -(- в правой части равенства B) соответствует правой ветви, а знак — левой ветви. Центр симметрии гиперболы называется ее центром. Оси симметрии называются осями гиперболы, причем ось, пересекающая гиперболу в двух точках, называется действительной, а вторая — мнимой. Точки Ах и А2 пересечения гиперболы с действительной осью называются вершинами гиперболы. Величины а и Ъ называются полуосями гиперболы. Если а = Ь> то гипербола называется равносторонней. Наряду с уравнением F) рассмотрим уравнение __^_ + —-1. A3) Очевидно, оно также задает гиперболу, фокусы которой располага- располагаются на оси Оу, а основной прямоугольник и асимптоты те же, что н у гиперболы F) (рис. 15.8). Гиперболы F) и A3) называются со- сопряжениями друг с другом. Эксцентриситет. Эксцентриситетом гиперболы называется число e = c/a = V I + (b/af . Для любой гиперболы е>1. Эксцентриситет характеризует фор- форму основного прямоугольника и, следовательно, форму самой гипер- гиперролы: чем меньше е, тем больше вытягивается основной прямоуголь- прямоугольник, а вслед за ним и сама гипербола вдоль действительной оси. На рис. 15.9 изображены гиперболы с различными значениями г. 267
Фокальные радиусы. Фокальными радиусами точки М гиперболы называются отрезки прямых, соединяющие эту точку с фокусами F± и Fo. Их длины гг и /*2 задаются формулами (9) и A0), которые мы перепишем еще раз: для правой ветви t\ ~ гх -\~ а, г2 = гх — а; для левой ветви Г\ = — {sx + а), г2 = — (гх — а). Рис. 15.8 Рис. 15.9 Фокальный параметр. Фокальным параметром гиперболы назы- называется длина отрезка перпендикуляра к действительной оси, восста- восставленного в одном из фокусов до пересечения с гиперболой. На рис. 15.7, б указанный перпендикуляр изображен в виде отрезка F2M. Пусть его длина равна р. Тогда М(с3 р) и с2/а2 — рУЬ2 = 1. Используя формулу E), получаем р = ЬУа. Пересечение с прямой. Рассмотрим вопрос о пересечении гипер- гиперболы F) с различными прямыми. Пусть прямая не параллельна оси Оу и имеет уравнение y = kx + m. A4) Подставляя выражение у из формулы A4) в уравнение F), получаем уравнение для абсцисс искомых точек пересечения: ф2 _ а2?2) Х2 __ 2a2kmx — а2 ф2 + т2) = 0. A5) Если Ь2 — а2к2ф0у то уравнение A5) квадратное, и в зависимости от характера его корней возможны следующие случаи (рис. 15.10): 1) пря- прямая пересекает гиперболу в двух раз- различных точках (прямая Д^; 2) прямая имеет с гиперболой одну общую точ- точку и называется касательной к гипер- гиперболе (прямая Д2); 3) прямая не имеет с гиперболой общих точек (прямая Д3). Пусть теперь Ъ2 — a2k2 =0, т. е. k~± Ыа и т = 0. Прямая совпадает с одной из асимптот и не имеет с гиперболой F) общих точек, так как ра- Рис 15.10 венстЕО A5) в этом случае неверно. 268
Пусть, наконец, b2— a2k2 = 0, тф 0. В этом случае прямая парал- параллельна одной из асимптот и имеет с гиперболой одну общую точку. Легко проверить, что для прямой, параллельной оси Оу, также могут иметь место только указанные три случая. Упражнения 1. Докажите, что произведение расстояний любой точки гиперболы до двух асимптот есть величина постоянная. 15.3. Директрисы эллипса и гиперболы Директрисами эллипса, заданного каноническим уравнением (см. § 15.1), называются две прямые х = —а/г, х~а!г, A) где 8 — эксцентриситет эллипса. Так как е<1, то директрисы па- параллельны малой оси эллипса и не имеют с ним общих точек (рис. 15.11). А2 Рис. 15.11 Рис. 15.12 Директрисами гиперболы, заданной каноническим уравнением (см. § 15.2), называются две прямые A). Так как для гиперболы е> 1, то директрисы параллельны мнимой оси и не имеют с гиперболой общих точек (рис. 15.12). Основное свойство директрис эллипса и гиперболы выражают сле- следующие теоремы. Теорема 15.1. Отношение расстояния г любой точки эллипса (гиперболы) от фокуса к ее расстоянию d от соответствующей директрисы есть постоянная величина, равная эксцентриситету эл- эллипса (гиперболы), т. е. rid = 8 B) (фокус и директриса считаются соответствующими, если они рас- расположены по одну сторону от центра). > Рассмотрим, например, правый фокус и правую директрису ги- гиперболы. Уравнение х — а/8-0 C) правой директрисы имеет нормальный вид (см. § 13.6). Пусть М(х, у) — произвольная точка правой ветви гиперболы. Так как вся 269
правая ветвь гиперболы лежит в положительной полуплоскости от- относительно прямой C), то d^x — а/г. D) Используя выражение для фокального радиуса (см. § 15.2) г = = гх— а и формулу D), получаем г гх — а -т-—— ^8> т. е. равенство B) верно. Если точка М(х, у) лежит на левой ветви гиперболы, которая находится в отрицательной полуплоскости отно- относительно прямой C), то d = — х + а!г. E) В этом случае г = а — гх. Из этой формулы и равенства E) снова следует B). Проверка соотношения B) для левого фокуса Fx и левой директ- директрисы Аг гиперболы, а также для эллипса предоставляется читателю. ^ Теорема 15.2. Пусть в плоскости заданы точка F и прямая А, не проходящая через F. Множество Л всех точек плоскости, отно- отношение расстояний которых от точки F и от прямой А есть от- отличная от единицы постоянная величина г, является эллипсом, если е < 1, либо гиперболой, если г > 1. Точка F является фокусом это- этого эллипса (гиперболы), прямая А — его (ее) соответствующей ди- директрисой, а г — эксцентриситетом. > Выберем прямоугольную систему координат следующим обра- образом. В качестве оси О у возьмем прямую А, определив на ней поло- положительное направление, а ось Ох проведем через точку F. Тогда F(k, 0), где \k\ — расстояние точки F от прямой А. Произвольная точка М (х, у) множества Л характеризуется равенством \х\ Возведя обе части равенства F) в квадрат, получим х2 — 2kx + k2 + у2 = 82jc2, и, далее, A — е2) х2 — 2kx + у2 + k2 - 0, ^_ е. F) х++ 1-е2 1-е2 1-е2 Х- -А-)* ' у2 = гЧ2 G) 1 -е2/ П 1 — е9- A-е2J. V Очевидно, уравнения F) и G) равносильны. Введем обозначение а2 = &Ч2 (8) A-е2J 270
и совершим параллельный сдвиг координатных осей, согласно фор- формулам: k Тогда уравнение G) примет вид -4^+ „ У'* 2 =1- (Ю) CL A — 8 ) п Это уравнение при 8 < 1 задает эллипс, а при е > 1 — гиперболу. Так как уравнению F), а следовательно, и уравнению A0) удовлет- удовлетворяют координаты тех и только тех точек плоскости, которые при- принадлежат множеству Л, то первое утверждение теоремы доказано. Эксцентриситет эллипса (гиперболы) A0) равен (д2—A—е2)а* __ а а Одна из директрис эллипса (гиперболы) A0) имеет уравнение х' + а/г = 0 или, согласно формулам (8) и (9), и, следовательно, совпадает с прямой А. Согласно формуле (8), расстояние точки F от директрисы равно \k\ = \a/e — ае | = |а/е — с\. Отсюда следует, что F есть фокус эллипса (гиперболы) A0), со- соответствующий директрисе Л. А Теоремы 15.1 и 15.2 позволяют дать новое определение отлично- отличного от окружности эллипса и гиперболы, равносильное определениям, приведенным в § 15.1, 15.2. Эллипсом (гиперболой) называется мно- множество всех точек плоскости, для которых отношение расстояния от заданной точки, называемой фокусом, к расстоянию от заданной пря- прямой, называемой директрисой, есть постоянная величина 8< 1 (8 > 1). Упражнения 1. Докажите, что расстояние от любой точки гиперболы до фокуса F равно длине отрезка прямой (проходящей через эту точку параллельно асимптоте), заклю- заключенного между точкой М и директрисой, соответствующей фокусу F, 15.4. Парабола Определение и вывод канонического уравнения. Пусть на плос- плоскости заданы точка F и прямая Л, не проходящая через эту точку. Определение 15.3. Параболой называется фигура, состоя- состоящая из всех тех точек плоскости, каждая из которых равноудале- равноудалена от точки F и прямой Л. Точка F называется фокусом параболы, а прямая Л — директрисой параболы. 271
Парабола, как эллипс и гипербола, определяется теоремой 15.1 при 8=1, т. е. r = d, A) где г и d — расстояния произвольной точки параболы соответственно от фокуса и директрисы. Составим уравнение параболы. Систему прямоугольных коорди- координат выберем следующим образом (рис. 15.13). Проведем ось Ох че- л у j N К О Рис. 15.13 Рис. 15.14 рез фокус F перпендикулярно директрисе Д в направлении от ди- директрисы к фокусу; начало координат возьмем в середине отрезка между фокусом F и точкой К пересечения оси Ох с директрисой Д. Если обозначить буквой р расстояние фокуса от директрисы, то F(p/2, 0), и уравнение директрисы будет иметь вид х - —р/2. Пусть М (х, у) — произвольная точка параболы. Проведем через эту точку прямую, параллельную оси Оху и обозначим буквами L и N точки пересечения этой прямой с осью Оу и директрисой Д. Имеем г = у (х — р/2J + у\ d= (NM) - (NL) + (LM) = р/2 + х. Вставляя эти значения г и d в равенство A), получаем + if =x + р/2. B) Это и есть уравнение параболы. Чтобы упростить это уравнение, возведем обе его части в квадрат: (х — р/2? + у2 = (х + р12)\ Отсюда t - 2рх. C) Легко видеть, что уравнения B) и C) равносильны. Уравнение C) называется каноническим уравнением параболы. Исследование формы. Из уравнения C) видно, что х может при- принимать только неотрицательные значения. Следовательно, на рисун- 979
ке вся парабола располагается по одну сторону от оси Оу (справа, если положительное направление оси Ох идет слева направо). Так как уравнение C) содержит координату у только в четной степени, то парабола симметрична относительно оси Ох, и для выяснения ее формы достаточно рассмотреть только первую координатную четверть. В этой четверти у = }^2рх. При неограниченном возрастании х неограниченно растет и у. Парабола, выходя из начала координат, уходит неограниченно вправо и вверх. В четвертой четверти парабола строится по симметрии с первой четвертью. Парабола C) изображена на рис. 15.14. Ось симметрии параболы называется ее осью. Точка пересечения параболы с ее осью называется вершиной параболы. Фокальный параметр. Величина р, фигу- фигурирующая в каноническом уравнении C), называется фокальным параметром или просто параметром параболы. Кроме ука- указанного, фокальный параметр р имеет еще следующее геометрическое истолкование. Через фокус проведем прямую, перпендикулярную оси параболы (см. рис. 15.14). Ее уравнение х = р/2. D) Найдем точки Мг и М2 пересечения этой прямой с параболой. Ре- Решая для этого совместно уравнения C) и D), получаем у = ± р. Следовательно, p = \FM1\. Итак, параметр р параболы C) равен длине перпендикуляра к ©си параболы, восставленного из фокуса до точки пересечения с парабо- параболой. Параметр характеризует форму и размеры параболы. На рис. 15.15 изображены параболы, соответствующие различным значениям пара- параметра р. Рис. 15.15 Рис. 15.16 Наряду с уравнением C) часто приходится рассматривать урав- уравнения: У2 *= —2рх, х2 = 2ру, х2 = — 2ру. 10 Зак. 3670 273
Они также задают параболы, которые изображены на рис. 15.16, а, б, е соответственно. Пересечение с прямой. Исследуем вопрос о количестве точек пе- пересечения параболы с различными прямыми. Пусть парабола и пря- прямая имеют соответственно уравнения: х2 = 2ру, E) у = kx + b. F) Подставив значение у из формулы F) в уравнение E), получим уравнение для абсцисс искомых точек пересечения x2 — 2kpx — 2bp = 0. В зависимости от характера корней этого квадратного уравнения возможны три случая (см. рис. 15.16, б): 1) прямая пересекает па- параболу в двух различных точках (прямая MN); 2) прямая имеет с параболой одну общую точку (например, ось Ох) и называется каса- касательной к параболе; 3) прямая не имеет с параболой общих точек (прямая А). Если прямая параллельна оси Оу или совпадает с ней, она зада- задается уравнением х = а и, очевидно, имеет с параболой одну общую точку (прямая Ах). Упражнения 1. Докажите, что все параболы подобны между собой. 15.5. Уравнение параболы, эллипса и гиперболы при вершине При выводе канонического уравнения параболы система коорди- координат Оху выбрана так, что начало координат находилось в вершине параболы, а ось Ох совпадала с осью параболы. Покажем, что для эллипса и гиперболы в соответствующей системе координат уравне- уравнение может быть записано в аналогичном виде. Рис. 15.17 Рис. 15.18 Рассмотрим каноническое уравнение эллипса. Возьмем новую си- систему координат Ofxfyf (рис.. 15.17), полученную из старой системы Оху параллельным сдвигом координатных осей на вектор с(—а, 0). Точка О' находится в левой вершине эллипса, а ось О'х' проходит 274
через фокусы. Как известно из § 12.9, старые координаты произволь- произвольной точки выражаются через новые координаты этой точки по фор- формулам х === х а у у ¦—- у Подставляя эти выражения в каноническое уравнение эллипса (см. § 15.1), получаем уравнение эллипса в новых координатах или после очевидных преобразований /^ п Ь2 . Ь2 ,2 /1 \ у — ?* л л . i 1) а а2 Подставляя из § 15.1 значение фокального параметра эллипса р в уравнение A), учитывая равенство Ь2/а2 = 1—s2, записываем у'2 = 2рх' + (е2— \)х'2. B) Рассмотрим теперь каноническое уравнение гиперболы (см. § 15.2) (рис. 15.18). Возьмем новую систему координат О'х'у', полученную из старой системы Оху параллельным сдвигом координатных осей на вектор d(a, 0). Точка О' находится в правой вершине гиперболы, а ось О'х' совпадает с действительной осью гиперболы (рис. 15.18). Подставляя выражения х = х' + а, у = у' старых координат произвольной точки через новые координаты этой точки в каноническое уравнение гиперболы, получаем уравнение ги- гиперболы в новых координатах или после простых преобразований у'2 - BWd)xf + {ЬЧа*)х'2. C) Учитывая, что Ь2/а = р а Ь2/а2 = ъ2— 1, из уравнения C) полу- получаем уравнение гиперболы вида B). Рис. 15.19 275
Итак, в надлежащим образом выбранной системе координат эл- эллипс, гипербола и парабола имеют уравнение одного и того же вида, а именно: На рис. 15.19 изображены эллипс, гипербола и парабола, выра- выражаемые уравнением G) при одном и том же значении параметра. 15.6. Полярное уравнение эллипса, гиперболы и параболы Выведем уравнение эллипса, параболы и гиперболы (точнее, одной ее ветви) в полярных координатах. Пусть Л — любая из этих фигур, F — ее фокус, А — односторон- односторонняя с ним директриса (рис. 15. 20). Пусть, далее, г — эксцентриситет, р — фокальный параметр, б — расстояние фокуса от дирек- директрисы. В силу основного свойства директ- директрисы р/8 = е или б = р/е. Введем теперь полярную систему коор- координат. За полюс примем точку F, а поляр- полярную ось FA направим перпендикулярно Рис. 15.20 директрисе в сторону от директрисы к F. Пусть теперь М — произвольная точка плоскости, лежащая от директрисы по ту же сторону, что и фо- фокус F (в правой полуплоскости), р, ф — ее полярные координаты, ad — ее расстояние от директрисы. Если L — точка пересечения прямой FA с директрисой Л и N — ортогональная проекция точки М на прямую FA, то d = (LN) = (LF) + (FN) = 8 + р cos <р = р/е + р cos <p. A) Фигура Л есть множество всех точек правой полуплоскости, для каждой из которых отношение ее расстояния от фокуса F к рассто- расстоянию от директрисы Л равно ?, т. е. точек, удовлетворяющих соот- соотношению p/d = e. Подставляя сюда d из формулы A), получаем рA —cos ф) = р или р — р/A — 8СО5ф). B) Равенство B) называется полярным уравнением эллипса, пара- параболы или одной ветви гиперболы. Упражнения 1. Найдите каноническое уравнение эллипса, заданного уравнением в полярных координатах р = 9/E — 4 cos ф). 276
15.7. Плоские фигуры второго порядка Рассмотрим уравнение Ах2 + 2Вху + Су2 + 2Dx + 2?у + F - О, (I) где среди коэффициентов Д 5, С есть отличные от нуля, т. е. A) есть уравнение второй степени относительно х и у. Возьмем на плос- плоскости П прямоугольную систему координат Оху. Определение 15.4. Фигуры плоскости П, которые могут зада- задаваться уравнениями вида (\), будем называть плоскими фигурами второго порядка. К числу таких фигур относятся эллипс, гипербола и парабола. Например, уравнение A) задает эллипс, если А= \1а\ В-О, С- \lb\ D = E = 0, F- —1. Найдем все плоские фигуры второго порядка. Наряду с системой координат Оху, которую будем называть ста- старой, введем еще одну (новую) прямоугольную систему координат О'х'у'. Старые координаты ху выражаются через новые координаты х'', у' по формулам (см. § 12.9): х = х' cos а — yr sin а + аЛ B) у = х' sin а + yr cos а + Ь.) Подставив эти выражения для х и у в левую часть уравнения A), получим уравнение вида А'х'2 + 2В'х'у' + Су2 + 2D'x' + 2Е'у' + F - 0. C) Это уравнение задает в системе О'х'у' ту же фигуру, что и уравне- уравнение A) в системе Оху (см. § 12.10). Постараемся теперь за счет подходящего выбора ноеой системы координат упростить уравнение A). Пусть в этом уравнении ВфО. Покажем, что преобразование координат B) можно подобрать таким образом, чтобы в уравнении C) было В' = 0. В самом деле, А' = A cos2 а + 25 sin а cos а — С sin2 а, В' = (С — A) sin а cos а + В (cos2 а — sin2 а), С = A sin2 a — 2B sin а cos а + С cos2 а. Условие В' = 0 запишется в виде 1 /2 (С — A) sin 2а + В cos 2а = 0 или ctg2a = (i4 — C)/2B. D) Достаточно повернуть координатные оси на угол а, удовлетворяю- удовлетворяющий условию D), и в уравнении C) будет отсутствовать произведе- произведение координат. Итак, исследуем далее уравнение А'х'Ч С'у'2+ 2D'x' + 2Е'у' + F=0. E) 277
Пусть А' Ф О, С Ф 0. Преобразуем уравнение E): А' (хг~ + 2 -? х') + С (г/'2 + 2 -^ r/'J + F = О, Г) F ) ( ?) +5-^.-^=0. F) Введем обозначение F = — F + ?>'7Л' + ?'2/С и совершим параллельный сдвиг координатных осей согласно фор- формулам: X - х' + D'/A\ Y^y' + ЕЧС. В координатах X, F уравнение примет вид А'Х2 + C'Y2 - F'. G) Пусть Аг > 0, С4 > 0, Fr > 0. Тогда можно ввести обозначения F4A' = a2, F'lC = б2 и записать уравнение G) в виде j*. л. X2 — 1 ' а2 ' б2 ~ Как мы уже знаем, это есть уравнение эллипса (см. § 15.1). Если в уравнении G) А > 0, С > 0, F1' < 0, то, обозначив — F4A' = а2, — F7C' = б2, мы придем к уравнению JL2 -L — — — 1 а2 б2 " Этому уравнению не удовлетворяет ни одна пара действительных чисел, следовательно, уравнение A) в рассматриваемом случае зада- задает пустое множество. Пусть в уравнении G) А > 0, С < 0, Ff > 0. Вводя обозначе- обозначения F'lA* = а2, — F4C' = б2, приведем его к виду JC* Y2 __ а2 б2" ~ Это уравнение, как известно, задает гиперболу. Случаи Л'<0, С'<0, ±F'>0; Л'<0, С>0, ±Р>0; Л' < 0, С < 0, F' < 0 новых результатов не дадут. Пусть теперь в уравнении G) А' > 0, С' < 0, Ff = 0. Тогда это уравнение можно привести к виду Уравнение (8) задает пару прямых —--г = о, - а о а пересекающихся в начале координат. 278
Если в уравнении G) А > 0, С > 0, F' = 0, то оно принимает вид V2 V2 Jl + — =: 0. а2 ^ 62 Этому уравнению удовлетворяют координаты только одной точки плоскости — О@, 0). Случай Л'<0, С'ФО, Fr = 0 приводит к тем же результатам. Возвратимся к уравнению E) и предположим, что А Ф0, С = 0, Ef фО. Представим это уравнение в виде А V +2Цх') + 2ЕГ (V + —) = 0 \ А' I \ 2Е'] и, далее, А' (Л" + T'f+ 2Е' (у' + й'~~ Ш7)= °- (9) Совершим параллельный сдвиг координатных осей согласно формулам: Х = х' + D'IA\ Y = yf + FI2E' — D'2/2AE'. Уравнение (9) примет вид Лг Y2 _]_ О /7'V П (\С\\ у\ -j- LE* I — U. ^ 1 \J) Если А'Е' < 0, то, полагая — Е'/А' = р, получаем X2 = 2pY9 т. е. уравнение параболы. Если же А'Е' > 0, то уравнение A0) прини- принимает вид X2 = — 2pY и снова задает параболу. Пусть теперь в уравнении E) А ФО, С = 0, Е' = 0. Тогда его можно переписать в виде A' {xr + D'lA'f + F —D'2IA = 0. A1) Совершая параллельный сдвиг координатных осей, согласно формулам X = xr + D'/A', Y = у\ приведем уравнение A1) к виду X2 + F' -0, A2) где Fr - FIA — D'2IA'. Если F' < 0, уравнение A2) принимает вид X2 — а2-0 и задает фигуру , состоящую из пары параллельных прямых. Если в уравнении A2) Fr > 0, то этому уравнению не удовлетворяют ко- координаты никакой точки плоскости, и мы получаем снова пустое множество. Пусть теперь в уравнении A2) F' = 0, т. е. уравнение имеет вид X2 = 0. Это уравнение задает прямую — ось O'Y. Осталось рассмотреть случай, когда в уравнении E) А = С = 0. Однако этот случай невозможен. В самом деле, предположим, что в уравнении C) А = В' = С = 0, т. е. 279
A cos2 a + В sin 2a -f С sin2 а = О, — A sin 2а + В cos 2а + — С sin 2а - О, A3) Л sin2 а — В sin 2а + С cos2 а = 0. Рассмотрим систему трех линейных уравнений A3) относительно не- неизвестных Л, В, С. Легко подсчитать, что определитель этой систе- системы равен 1. Поэтому система имеет единственное решение: А = В = = С = 0, что невозможно. Сформулируем полученные результаты в виде следующей теоремы. Теорема 15-1. Любая плоская фигура второго порядка являет- является эллипсом, гиперболой, параболой, парой пересекающихся прямых, парой параллельных прямых, прямой, точкой или пустым множес- множеством. Метод доказательства теоремы 15.1 может быть использован и для практического решения вопроса о виде плоской фигуры второго порядка, заданной уравнением A) с конкретными числовыми коэффи- коэффициентами. Пример 15.1. Выяснить, какую фигуру задает уравнение х* + ху + у* + х~-у=0 A4) в прямоугольной системе координат Оху, и сделать рисунок. Решение. Повернем координатные оси на угол, определяемый формулой D). Получим а = я/4, и формулы преобразования координат примут вид х = ¦ х —У =г~, у = ¦У У 2 У 2 Подставляя эти выражения для х и у в уравнение A4) и приводя подобные члены, получаем 3x'* +.{y'-V 2 )''=2. Совершая параллельный сдвиг координатных осей, согласно формулам Х=х', Y = y'-VT, приводим уравнение A5) к виду JL з A5) A6) Таким образом, уравнение A4) задает эллипс с полуосямиа=у 2/3 и Ъ ~У 2. Для того чтобы сделать чертеж этого эллипса, необходимо последовательно по- построить координатные системы Оху, Ох'у', Рис. 15.21 O'XY n затем нарисовать эллипс, вы- выражаемый в системе О''XY уравнением A6) (рис. 15.21). 16. ФИГУРЫ ВТОРОГО ПОРЯДКА Фигурами второго порядка называем фигуры в пространстве, ко- которые в прямоугольной системе координат Oxyz задаются уравнением 280
второй степени. В этой главе рассматриваются лишь основные фигу- фигуры второго порядка. 16.1. Понятие фигуры второго порядка Рассмотрим уравнение второй степени относительно х, у, г: апх2 + а.12у2 + a33z2 + 2а12ху + 2a13xz + 2a23yz + 2а±х + 2а2у + 2a3z + + а = 0. A) Предполагаем, что среди коэффициентов а1Ъ а22, а33, а12, а13у а23 есть отличные от нуля. Возьмем какую-либо прямоугольную систему ко- координат Охуг. Определение 16.1. Фигурой второго порядка будем называть фигуру, которая мооюет быть задана уравнением вида A). Рассмотрим некоторые общие свойства фигур второго порядка и изучим наиболее часто встречающиеся из этих фигур. Теорема 16-1. Пусть Ф — фигура второго порядка, П — плос- плоскость и Фг = Ф П П. Тогда возможны только следующие случаи: 1) Пс=Ф; 2) Фг — плоская фигура второго порядка] 3) Фх — пря- прямая; 4) Фг = 0. > Пусть фигура Ф задается в прямоугольной системе координат Охуг уравнением A). Выберем новую прямоугольную систему коор- координат О'х'у'г' так, чтобы координатная плоскость О'х'у' совпала с плоскостью П. Плоскость П имеет в этой системе координат урав- уравнение г' = 0. B) Чтобы получить уравнение фигуры Ф в системе координат О'х'у'г*\ подставим в левую часть уравнения A) выражения старых коорди- координат ху у, г через новые координаты х\ у\ г1 (см. § 12.9). В резуль- результате подстановки имеем bnx'2 + b22y'2 + b33zr?' +2612*У + 2bl3xfzf + 2b23yrzf + 2Ь±х' + 2Ь2у' + + 2632' + b - 0. C) iMbi получим уравнение фигуры Фх = Ф fl П в системе координат О'х'у', если подставим B) в C): Ьпх'2 + Ъ22г/ + 2Ьшх'у' + 2М' + 262г/' + Ь - 0. D) Если Ьп = Ь2% = Ь12 = Ьх = Ь2 = Ь = 0, то Фх = П. Если Ьп = Ь22 = Ь12 = ^ ^ Ь2 = 0, ЬфО, то уравнение D) задает 0. Если Ьп = Ь22 = = Ь12 = 0, но из чисел Ьъ Ь2 хотя бы одно отлично от нуля, то уравнение D) задает прямую. Наконец, если среди чисел Ь1Ъ 622, Ь^ есть отличные от нуля, уравнение D) задает плоскую фигуру вто- второго порядка. ^ Обозначим для краткости левую часть уравнения A) символом F(x, у, г) и запишем это уравнение в виде F{xt у, z) = 0. E) 281
Пусть плоскость П задается уравнением Ах + By + Cz + D = 0. F) Так как А, В, С не равны нулю одновременно, то можно предполо- предположить, например, что СфО. Тогда уравнение F) можно записать в виде z = Px + Qy + R. G) Фигура Oj = Ф П П задается системой уравнений F(x, у, г) = 0, z - Рх + Qy + R. (8) Подставляя выражение z из второго уравнения в первое, получаем F(x9 у, Px + Qy + R)=^0. (9) Рассмотрим в плоскости Оху фигуру Ф2, которая в системе коор- координат Оху задается уравнением (9). Если числа х0, yOt z0 удовлет- удовлетворяют уравнениям (8), то х0, у0 удовлетворяют уравнению (9). Обратно, если х0, у0 удовлетворяют уравнению (9), то х0, у0, z0 = = Рх0 + Qy0 + R удовлетворяют уравнениям (8). Но точка М±(х0, у0) плоскости Оху есть ортогональная проекция точки М(х0, у0, z0) на плоскость Оху. Отсюда следует, что уравнению (9) удовлетворяют координаты тех и только тех точек плоскости Оху, которые явля- являются ортогональными проекциями на эту плоскость точек фигуры Фъ т. е. фигура Ф2 есть ортогональная проекция фигуры Фх на плоскость Оху. Рассмотрим, в частности, тот случай, когда уравнение G) имеет вид z = Л, т. е. плоскость П параллельна плоскости Оху. В этом случае фигуры Фх и Ф2 конгруэнтны, т. е. отличаются друг от дру- друга лишь положением в пространстве. Фигура Ф2 может быть полу- получена из фигуры Фх параллельным переносом вдоль оси Oz. Рассматривая вид фигуры Ф2 при различных значениях h, можно получить некоторое представление о форме и размерах исходной фи- фигуры Ф. Обычно поступают следующим образом. Придают параметру h ряд значений йь /?2, й3» • • •> следующих друг за другом через одинаковые достаточно малые промежутки, и рассматривают сечения фигуры E) плоскостями г = къ z = h2, z = h3, ... Ортогональные проекции сечений на плоскость Оху задаются в этой плоскости уравнениями: F (х, у, fh) =* 0, F (х, у, h2) - 0, F (х, у, h3) - 0, ... Строя эти проекции, получают в плоскости Оху так называемую карту фигуры E) в горизон- горизонталях, или карту сечений. Эта карта дает неко- некоторое представление о форме и размерах фигуры E). Например, сгущение проекций на карте указывает на возрастание крутизны фигуры Ф на соответствующем участке. На рис. 16.1 изо- изображена карта сечений сферы х2 + у2 + г2 = 1 Рис. 16.1 на плоскости Оху. 282
Аналогично можно построить карты сечений фигуры E) на двух других координатных плоскостях. Если мы хотим построить карту сечений фигуры E) плоскостями, параллельными произвольно задан- заданной плоскости П, можно перейти к ноеой системе прямоугольных координат O'x'y'z' так, чтобы плоскость О'х'у' стала параллельной плоскости П. В ноеой системе координат задача сведется к рассмот- рассмотренному выше случаю. 16.2. Эллипсоид Определение 16.2. Эллипсоидом называется фигура, которая в прямоугольной системе координат Охуг задается уравнением у'2 1,2 уЪ Л ! J/ ! _ — J / J \ а2 Ь2 с2 где а, Ь, с — произвольные положительные числа. Исследуем форму эллипсоида. Так как х> у, г входят в уравне- уравнение A) только в четных степенях, то этому уравнению наряду с точкой М (х, у, г) удовлетворяют также точки: Мг(—х, у, z)t М2(х, —У, г), М3(х, у, —г), М^х, —у, —г), Мь(—ху у, —г), М6(—х, —у у г), Мт(—х, —у, —г). Это означает, что эллипсоид симметричен относительно каждой из трех координатных плоскостей, каждой из координатных осей и начала координат. Из уравнения A) следуют неравенства |х|^а, i#|<!6, И^?. Это означает, что эллипсоид — ограниченное множество, не выходя- выходящее за пределы прямоугольного параллелепипеда, изображенного на рис. 16.2. Рассмотрим сечение эллипсоида плоскостью Оху или параллель- параллельной ей плоскостью. Уравнение такой плоскости имеет вид 2= А. B) Ортогональная проекция на плоскость Оху фигуры Фъ получающейся в сечении эллипсоида A) плоскостью B), задается в системе координат Оху урав- нением h2 C) Пусть h ~ 0, т. е. рассматривается сечение эллипсоида A) плоскостью Оху. Это сечение есть эллипс с полуосями а и Ъ\ если а — 6, он является окруж- окружностью. Рассмотрим теперь произволь- произвольное значение Л, удовлетворяющее нера- неравенству |А| < с. Уравнение C) перепи- перепишем в виде Рис. 16.2 283
x \ У где ax = a Kl — AVc8, b1^bY\— h2/c2. Таким образом, фигура Фг есть эллипс с полуосями а± и 6Х. Ес- Если Л возрастает от нуля до с, полуоси аг и 6Х убывают, эллипс уменьшается и при h = с сжимается в точку С @, 0, с), расположен- расположенную на оси Ог. Плоскость z = с, имеющая с эллипсоидом лишь од- одну общую точку С, называется касательной плоскостью эллипсоида в точке С. Симметричная картина получается при убывании h от нуля до —с; плоскость г = —с касается эллипсоида в точке Сх@, О, — с), расположенной на оси Ог. Плоскость B) при \h\ > с не име- имеет с эллипсоидом общих точек. Карта сечений эллипсоида A) плос- плоскостями вида B) изображена на рис. 16.3. Аналогичные результаты получаются при пересечении эллипсоида A) с плоскостями х = / или у = т. Нетрудно показать, что любая плоскость, имеющая с эллипсои- эллипсоидом более одной общей точки, пересекает его по эллипсу. Это сле- следует из теоремы 16.1 и из того, что эллипсоид есть ограниченная фигура. Теперь можно сделать рисунок эллипсоида (рис. 16.4). У , Рис. 16.3 Рис. 16.4 Величины а, 6, с называются полуосями эллипсоида A). Если все они различны, эллипсоид называется трехосным. Если какие-ли- какие-либо две из полуосей равны, например а = Ьфс, эллипсы C) являются окружностями, а сам эллипсоид может быть получен вращением эллипса X2 Z2 расположенного в плоскости Охг, вокруг оси Ог. В этом случае эл- эллипсоид A) называется эллипсоидом вращения. Наконец, при а = = Ъ = с эллипсоид является сферой радиуса а. Упражнения 1. Докажите, что существуют плоскости, пересекающие трехосный эллипсоид по окружностям. 234
16.3. Конус второго порядка Определение 16.3. Конусом второго порядка называется фигура, которая в прямоугольной системе координат Охуг зада- задается уравнением —+ — —— =0, A) а2 б2 с2 к ' где а, Ъ, с — произвольные положительные числа. Покажем, что конус A) состоит из прямых, проходящих через начало координат. Пусть Мо (х0, у0, г0) — произвольная точка кону- конуса A), отличная от начала координат. Тогда х2 и2 г2 • ~~~" ¦ —- W. а2 Ь2 с2 Точка М Aх(„ ly0, iz0), где i — любое число, также удовлетворяет уравнению A): [а2 Ь2 с2 ) Но точки М (txOy tyOy tz0) заполняют прямую ОМ0, что и требовалось доказать. Конус симметричен относительно каждой из координатных плос- плоскостей, каждой координатной оси и начала координат. Плоскость z=h B) пересекает конус A) по фигуре Фь ортогональная проекция которой Ф9 на плоскость Оху задается в системе координат Оху уравнением _il + — = — • C) При h = 0 уравнению C) удовлетворяет лишь одна точка плоскости Оху — начало координат 6@, 0, 0). В этой точке плоскость Оху пересекается с конусом. При кфО уравнение C) задает эллипс с полуосями: В этом случае и фигура Фх является эллипсом. Конус A) можно рассматривать как множество всех прямых (об- (образующих конуса), которые проходят через вершину конуса О@, 0, 0) и точки эллипса Фг. Конус A) изображен на рис. 16.5. Конус со- состоит из двух полостей, расположенных по обе стороны от вершины и простирающихся неограниченно. Если а = 6, конус называется ко- конусом вращения. Рассмотрим произвольную плоскость П, проходящую через вер- вершину конуса A) и не параллельную плоскости эллипса Ф1# Пусть А— прямая, по которой пересекаются плоскости П и B) (рис. 16.6). 285
Как известно из § 15.1, прямая А может иметь с эллипсом две, од- одну или ни одной общей точки. В соответствии с этим мы разделим все плоскости, проходящие через вершину конуса, на три категории: 1) плоскости, пересекающие эллипс Фх в двух различных точках Каждая из этих плоскостей пересекает конус по двум прямым (об- (образующим); v 2) плоскости, не пересекающие эллипс Ф1# Каждая из них имеет с конусом только одну общую точку (вершину). К этой же катего- категории относится и плоскость, параллельная плоскости эллипса Фх; Рис. 16.5 Рис. 16.6 3) плоскости, имеющие с эллипсом Фх только одну общую точ- точку. Каждая из них имеет с конусом одну общую прямую. Рассмотрим теперь пересечение конуса A) с плоскостями не проходящими через вершину. Пусть П — одна из таких плоскостей П3 — плоскость, проходящая через вершину конуса и параллельная плоскости П, Фг = Ф п П. Если плоскость IIi принадлежит ко второй категории, то плоскость П пересекает только одну полость конуса Рис. 16.7 и имеет общую точку с каждой из образующих. Фигура Фх являет- является ограниченно плоской фигурой второго порядка, т. е. эллипсом. Если плоскость Пх принадлежит к третьей категории, то плоскость 286
П, встречаясь лишь с одной полостью конуса, пересекает все обра- образующие, кроме одной, лежащей в плоскости Пх. Следовательно, Фх является неограниченной плоской фигурой второго порядка, состоя- состоящей из одной ветви, очевидно, отличной от прямой, т. е. параболой. Наконец, если плоскость Пх принадлежит к первой категории, Фг является плоской фигурой второго порядка, состоящей из двух вет- ветвей, причем каждая из этих ветвей, очевидно, не является прямой. Следовательно, в рассматриваемом случае Фх — гипербола. Таким образом, эллипс, гипербола и парабола могут рассматри- рассматриваться как сечения конуса второго порядка плоскостями. Поэтому эллипс, гиперболу и параболу часто называют коническими сечения- ми (рис. 16.7, а, б, в). 16,4. Однополостный гиперболоид Определение 16.4. Однополостным гиперболоидом называет- называется фигура, которая в прямоугольной системе координат Oxyz за- задается уравнением у2 1/2 -у2 — 4—— — =1, A) а2 б2 с2 где а, Ъ, с — произвольные положительные числа. Однополостный гиперболоид A) симметричен относительно каждой из координатных плоскостей, каждой из координатных осей и начала координат. Рассмотрим пересечение гиперболоида A) с плоскостью z=ft. B) Ортогональная проекция на плоскость Оху множества Фг точек, принадлежащих одновременно гиперболоиду A) и плоскости B), за- задается в системе координат Оху уравнением —+ -?=1, C) где a1 = aVl + h2/c\ Ъх - hV\ + h2/c2. При любом h C) есть уравнение эллипса. При h = 0, т. е. в пересечении гиперболоида A) с плоскостью Оху, получается эллипс который называется горловым эллип- эллипсом гиперболоида A). При возрас- возрастании \h\ полуоси ах и Ьг неограни- неограниченно увеличиваются вместе с эллип- эллипсом C). Карта сечений гиперболоида A) плоскостями B) изображена на рис. 16.8. Рис. 16.8 287
Чтобы получить ясное представление о форме гиперболоида (I) в удаленных точках, рассмотрим одновременно с ним конус Л + И_Л = 0. D) а2 ^ Ь2 с2 V ' Как видно из § 16.3, конус D) пересекается с плоскостью B) по эллипсу с полуосями: а2 — a\h\lc, b2 = b\h\/c. Так как а2 < аь Ь2<^ЬЪ то этот эллипс целиком находится внутри эллипса, получающегося в пересечении плоскости B) с гиперболои- гиперболоидом A). Значит, конус D) целиком заключен внутри гиперболоида A). Покажем теперь, что при неограниченном возрастании \h\ разнос- разности аг — а2 и Ьх — Ь% стремятся к нулю. В самом деле, a -a = [алГ \ +-?.—"MY-!—_l_?l__?. 1 2 ^« / If I a I/ 1 + — + — *x - Oj) - 0. ]/ 1 + 4 +— ^ С2 С Аналогично Из сказанного следует, что эллипсы пересечения плоскости B) с гиперболоидом A) и конусом D) при неограниченном возрастании \h\ стремятся слиться. При этом гиперболоид сколь угодно близко подходит к конусу. Конус D) называется асимптотическим кону- конусом гиперболоида A). Рассмотрим теперь пересечение гиперболоида A) с плоскостью * = /. E) Проекция на плоскость Oyz множества Фх точек, получающихся в пересечении гиперболоида A) с плоскостью E), задается в системе координат Oyz уравнением //2 ?2 /2 У — — 1 — (&\ b2 с2 а2 При различных |/]< а в плоскости Oyz получается семейство соасимп- тотических (имеющих одни и те же асимптоты) гипербол, действи- действительной осью которых является ось Оу. При |/| = а получаются асимптоты этих гипербол. Если же |/| > а, уравнение F) задает в плоскости Oyz семейство соасимптотических гипербол, у которых действительная ось совпадает с осью Oz. Карта сечений гиперболои- гиперболоида A) плоскостями вида E) изображена на рис. 16.9. Аналогичная картина получается при пересечении гиперболоида A) с плоскостя- плоскостями у = т. 288
Мы видели, что при пересечении гиперболоида A) с различными плоскостями могут получиться следующие фигуры: эллипс, гипербо- гипербола, пара пересекающихся прямых. Покажем теперь, что существуют плоскости, пересекающие гиперболоид по параболе или по паре парал- параллельных прямых. Для этого преобразуем систему координат Охуг, повернув ее вокруг оси Оу на угол а, пока еще не определенный. Формулы преобразования координат имеют вид х = xr cos a У = У', z = xr sin а zf sin а, г'cos а, G) где х, у, z — координаты точки М в системе координат Oxyz\ х', у\ г! — координаты той же точки в повернутой системе координат Ох'у**г'\ Вставляя выражения для ху уу z из формул G) в уравнение A) и приводя подобные члены, получаем уравнение гиперболоида (I) в системе координат Ох'у'г': cos2 а — а2 sin2 а ,* . с2 sin2 а — а2 cos2 а + , У1 1. Выберем а так, чтобы имело место равенство с2 cos2 а — a2 sin2 а = О, что, очевидно, возможно. Уравнение (8) примет вид у'2 с2 sin2 a — a2 cos2 a ,* Ь2 а2с2 (8) (9) Рис. 16.9 Рис. 16.10 Пересекая гиперболоид (9) плоскостью Ох'у\ уравнение которой zf = 0, получаем в этой плоскости фигуру, выражаемую уравнением. уг = б2, т. е. пару параллельных прямых. Пересечем теперь гиперболоид (9) плоскостью zr = А, кфО. В 289
сечении получится фигура, проекция которой на плоскость Охгуг в системе координат Охгу' имеет уравнение y'2/b2 — x'hsin2a(Va2+ l/c2) = Р, A0) где Р — постоянная. Уравнение A0), очевидно, задает параболу. Однополостный гиперболоид изображен на рис. 16.10. Величины а, 6, с называются полуосями гиперболоида A). Если а = Ь, фигура A) называется однополостным гиперболоидом враще- вращения. Она может быть получена вращением гиперболы расположенной в плоскости Oxz, вокруг оси Ог. Как установлено, через точку М0(а, 0, 0) однополостного гипер- гиперболоида A) проходят две принадлежащие ему прямые. Покажем те- теперь, что через каждую точку однополостного гиперболоида проходят две принадлежащие ему прямые. Перепишем уравнение A) в виде а2 с2 ™ 62# Рассмотрим систему двух линейных уравнений где Я, \i — два произвольных действительных числа, не равных одно- одновременно нулю. Легко видеть, что система A2) задает прямую, при- принадлежащую однополостному гиперболоиду A1), и через каждую точку гиперболоида проходит одна такая прямая. Аналогично система уравнений •(i- A3) также задает прямые, принадлежащие однополостному гиперболо- гиперболоиду A1). Прямые A2) и A3) называются прямолинейными образующими однополостного гиперболоида A). 16.5. Двуполостный гиперболоид Определение 16.5. Двуполостным гиперболоидом называется фигура, которая в прямоугольной системе координат Oxyz зада- задается уравнением г2 /у2 у2 а1 о2 с2 где а, 6, с — произвольные положительные числа. 290
Гиперболоид A) симметричен относительно каждой из координат- координатных плоскостей, каждой из координатных осей и начала координат. Рассмотрим пересечение гиперболоида A) с плоскостью z = А. B) Ортогональная проекция на плоскость Оху множества- Фх точек, по- получающихся в пересечении гиперболоида A) с плоскостью B), зада- задается в системе координат Оху уравнением ¦1-2 «.2 /j'2 а2 б2 с2 При /г = 0 плоскость B), т. е. плоскость Оху, не имеет с гипербо- гиперболоидом A) общих точек. То же будет для любой плоскости B), если \h\ < с. При \h\ = с уравнение C) принимает вид г2 и2 а2 Ь2 Ему удовлетворяют только нулевые значения х и у, т. е. плоскость z = c D) имеет с гиперболоидом A) лишь одну общую точку Л @, 0, с). Плос- Плоскость D) называется касательной плоскостью к двуполостному ги- гиперболоиду A) в точке А. Аналогично плоскость г = —с касается гиперболоида A) в точке Лх@, 0, —с). При \h\ > с уравнение C) задает эллипс с полуосями Пл — а i/ht/r2 1 ft, — h ~\/h2/c2 1. Если А растет-, полуоси аг и &х увеличиваются и сам эллипс неогра- неограниченно расширяется. Как и в § 16.4, можно показать, что при этом гиперболоид A) неограниченно приближается к конусу (см. опреде- определение 16.3), находясь внутри одной из полостей этого конуса. Симметричная картина получится при А< — с. Таким образом, гиперболоид A) со- состоит из двух полостей, чем и объясняется на- название — двуполостный гиперболоид. Если а = Ь> фигура A) называется двуполостным гиперболои- гиперболоидом вращения. Она может быть получена враще- вращением гиперболы расположенной в плоскости Oxz, вокруг оси Oz. Двуполостный гиперболоид A) изображен на рис. 16.11. Аналогично тому, как это делалось в § 16.3, можно показать, что существуют плоскости, пере- пересекающие двуполостный гиперболоид по гиперболам и параболам. Рис. 16.11 Упражнения 1. Докажите, что двуполостный гиперболоид не содержит прямых. 29{
16.6. Эллиптический параболоид Определение 16.6. Эллиптическим параболоидом называется фигура, которая в прямоугольной системе координат задается уравнением у 2 /,2 JL + JL = 2?, A) р я где р > 0, q > 0. Параболоид A) симметричен относительно координатных плоскос- плоскостей Oxz, Оуг и оси Ог. Так как из уравнения A) следует, что z>0, то весь параболоид расположен по одну сторону от плоскости Оху. Рассмотрим пересечение параболоида A) с плоскостью 2 = Л. B) Проекция на плоскость Оху множества Ф3 точек, получающихся в пересечении параболоида A) с плоскостью B), задается уравнением Г2 //2 — + — - 2А. C) р я Если h = 0, уравнению C) удовлетворяет лишь одна точка О @, 0, 0); множество Фх в этом случае содержит лишь эту точку. При h > 0 множество Фх есть эллипс с полуосями а = ]/2hpt Ь = Yhq. Если h растет, то полуоси а и b увеличиваются, и эллипс, получающийся в сечении, неограниченно расширяется. Исследуем множество Фх точек, получающихся в пересечении па- параболоида A) с плоскостью х = 1. D) Проекция этого множества на плоскость Оуг задается в системе координат Оуг уравнением y* = 2qz—qP/p. E) При любом / уравнение E) задает параболу с параметром q. Карта сечений параболоида A) плоскостями D) изображена на рис. 16.12, а. Аналогичная картина получается при пересечении параболоида A) с плоскостью У - т. F) Проекция соответствующего сечения на плоскость Охг имеет в сис- системе координат Охг уравнение х2 = 2рг — pm2/q. При различных т сечения являются параболами одинаковых разме- размеров (с параметром р). Карта сечений параболоида A) плоскостями F) изображена на рис. 16.12, б. Таким образом, можно получить следующий способ построения эллиптического параболоида: если взять две параболы, плоскости ко- которых взаимно перпендикулярны, а оси имеют одинаковое направле- 292
ние, и одну из этих парабол (образующую) передвигать поступательно так, чтобы ее вершина скользила по другой параболе (направляю- (направляющей), то образующая парабола опишет эллиптический параболоид. Если поменять ролями образующую и направляющую параболы, то получится тот же параболоид. Величины р и q эллиптического параболоида A) (рис. 16.13) на- называются параметрами параболоида, а начало координат — его вер- вершиной. Если p^q, фигура A) называется параболоидом вращения. Она может быть получена вращением параболы х2 = 2рг, располо- расположенной в плоскости Oxz, вокруг оси Ог. Упражнения 1. Пусть заданы плоскость II и не принадлежащая ей точка F. Какую фигуру образуют все точки, каждая из которых равноудалена от точки F и плоскости 11? Рис. 16.12 Рис. 16.13 16.7. Гиперболический параболоид Определение 16.7. Гиперболическим параболоидом называ- называется фигура, которая в прямоугольной системе координат Охуг задается уравнением у 2 «у 2 где р>, q>0. Параболоид A) симметричен относительно координатных плоскос- плоскостей OxZy Oyz и оси Ог. Исследуем множество Фг точек, получающихся в пересечении па- параболоида A) с плоскостью = А. B) Проекция этого множества на плоскость Оху задается в системе координат Оху уравнением Р Я ( ' 293
Если h = 0, уравнение C) распадается на два уравнения: *У_ -о х i у -О У D) Y р У q V р У q которые задают две прямые. Итак, плоскость Оху пересекает пара- параболоид A) по двум прямым D). При h > 0 уравнение C) задает семейство соасимптотических гипербол, имеющих вершины на оси Ох. При h < О получается семейство гипербол, им сопряженных. Карта а Рис. 16.14 сечений параболоида A) плоскостями B) изображена на рис. 16.14, а. В сечении параболоида A) плоскостями х - / E) получаются параболы, проекции которых на плоскость Oyz задаются в системе координат Oyz уравнением у2 - — 2qz + qlVp. Эти параболы имеют одинаковые размеры. Карта сечений параболои- параболоида A) плоскостями E) изображена на рис. 16.14, б. Аналогично получается и карта сечений параболоида A) плоско- плоскостями у = т (рис. 16.14, в): она состоит из конгруэнтных парабол x2==2pz + pm2/q. Гиперболический параболоид можно образовать аналогично эллип- эллиптическому параболоиду (см. § 16.5) с той лишь разницей, что оси направляющей и образующей парабол в случае гиперболического параболоида имеют противоположные направления. Гиперболический параболоид A) изобра- изображен на рис. 16.15. Упражнения 1. Докажите, что через каждую точку ги- гиперболического параболоида проходят две принад- Рис. 16.15 лежащие ему прямые. 294
16.8. Цилиндрические фигуры Определение 16.8. Цилиндрической фигурой будем называть фигуру, состоящую из произвольного множества прямых, параллель- параллельных друг другу. Сами эти прямые называются {прямолинейными) образующими цилиндрической фигуры. Примерами цилиндрических фигур являются: 1) прямая, 2) пло- плоскость (рис. 16.16, а); 3) круглая цилиндрическая поверхность (рис. 16.16, б); 4) круглое цилиндрическое тело (рис. 16.16, б). Плоская фигура, получающаяся в пересечении цилиндрической фигуры с плоскостью, перпендикулярной к образующим, называется направляющей цилиндрической фи- фигуры. Так, для указанных цилинд- а. fif—^ рических фигур направляющими яв- являются точка, прямая, окружность и круг. Теорема 16 2. Уравнение F(x, у) = A) Рис. 16.16 задает в прямоугольной системе координат Охуг цилиндрическую фигуру Ф, образующие которой па- параллельны оси Ог. Направляющая Фг фигуры Ф, лежащая в плоскос- плоскости Оху, задается в системе координат Оху уравнением A). ^ Пусть Мо (х0, Уо, г0) — произвольная точка фигуры Ф. Тогда F(x0, уо) = О. Очевидно, любая точка М(х0, у0, г), где z — произвольное дейс- действительное число, удовлетворяет уравнению A). Но указанные точ- точки М заполняют прямую, проходящую через точку Мо параллельно оси Ог. Итак, первая часть теоремы доказана. Пусть теперь М1(х1 уъ 0) — произвольная точка плоскости Оху. Ее координаты в систе- системе координат Оху есть хг и ух. Точка М1(хъ уъ 0) принадлежит фигуре Ф± тогда и только тогда, когда она принадлежит фигуре Ф. Отсюда вытекает вторая часть теоремы. -4 Упражнения 1. Докажите, что любая цилиндрическая фигура может быть задана уравне- уравнением вида A). 16.9. Цилиндрические фигуры второго порядка Эллиптический цилиндр. Определение 16.9. Эллиптическим цилиндром называется фигура (рис. 16.17), которая в прямоуголь- прямоугольной системе координат Охуг задается уравнением х2 и2 —+ -?-=1. A) а2 Ъ2 W За направляющую эллиптического цилиндра A) может быть при- принят эллипс, лежащий в плоскости Оху и имеющий в системе коор- 295
динат Оху уравнение A). Эллиптический цилиндр A) симметричен относительно: 1) каждой из координатных плоскостей; 2) каждой плоскости, параллельной плоскости Оху\ 3) каждой координатной оси; 4) каждой прямой, параллельной оси Ох или оси Оу и пересекающей ось Ог; 5) каждой точки, лежащей на оси Ог. Ось Ог называется осью цилиндра. Если а = Ь, цилиндр A) называется цилиндром вращения. Исследуем пересечения цилиндра A) с различными плоскостями. Пусть плоскость П параллельна оси Ог. Обозначим буквой А пря- прямую, по которой плоскость П пересекается с плоскостью Оху. Как известно из §15.1, пря- прямая А по отношению к эллипсу, заданному в системе координат Оху уравнением A), может занимать следующие положения: 1) пересе- пересекать эллипс в двух различных точках; 2) ка- касаться в одной точке; 3) не иметь с ним об- общих точек. В соответствии с этим плоскость II, параллельная оси Ог, может пересекать цилиндр A) по двум прямолинейным образу- образующим, касаться цилиндра вдоль одной пря- прямолинейной образующей и, наконец, не иметь с цилиндром общих точек. Любая плоскость, не параллельная оси Ог, пересекает цилиндр A) по эллипсу. В самом деле, такая плос- плоскость пересекает все прямолинейные образу- образующие цилиндра. В результате получается ограниченная плоская фигура второго порядка, т. е. эллипс. Параболический цилиндр. Определение 16.10. Параболичес- Параболическим цилиндром называется фигура (рис. 16.18), которая в прямо- прямоугольной системе координат Oxyz задается уравнением х2 = 2ру. B) За направляющую параболического цилиндра B) может быть принята парабола, лежащая в плоскости Оху и выражаемая в систе- системе координат Оху уравнением B). Из уравнения B) видно, что ко- координата у точек параболического цилиндра принимает только неот- неотрицательные значения. Поэтому весь цилиндр B) располагается по одну сторону от плоскости Охг, а именно: по ту сторону, в которую идет положительная полуось Оу. Цилиндр B) симметричен относи- относительно: 1) плоскости Оуг; 2) плоскости Оху и любой плоскости, ей параллельной; 3) оси О у и любой прямой, ей па4 аллельной и пере- пересекающей ось Ог. Исследуем пересечение параболического цилиндра B) с различ- различными плоскостями. Рассмотрим сначала плоскость П, параллельную оси Ог. Пусть она пересекается с плоскостью Оху по прямой А. Как известно из § 15.4, прямая А по отношению к параболе B) может занимать следующие положения: 1) пересекать ее в двух различных точках; 2) пересекать в одной точке (если параллельна оси О у); 3) касаться в одной точке; 4) не иметь общих точек. В соответствии Рис. 16.17 296
с этим плоскость П, параллельная оси Ох, может пересекать парабо- параболический цилиндр B) по двум прямолинейным образующим, по одной образующей (если она параллельна плоскости О ух), может касаться цилиндра вдоль одной прямолинейной образующей и, наконец, может не иметь с цилиндром общих точек. Любая плоскость, не параллель- параллельная оси Ог, пересекает параболический цилиндр B) по параболе. В самом деле, такая плоскость пересекает все прямолинейные образую- образующие цилиндра. В результате получается неограниченная плоская фигура второго порядка, состоящая из одной ветви и отличная от прямой, т. е. парабола. Рис. 16.18 Рис. 16.19 Гиперболический цилиндр. Определение 16.11. Гиперболи- Гиперболическим цилиндром называется фигура (рис. 16.19), которая в пря- прямоугольной системе координат Охуг задается уравнением X2 а2 ¦-?¦=1 б2 C) За направляющую гиперболического цилиндра C) может быть принята гипербола, лежащая в плоскости Оху и выражаемая в систе- системе координат Оху уравнением C). Отметим, что гиперболический цилиндр состоит из двух полостей. Цилиндр C) симметричен относи- относительно: 1) каждой из координатных плоскостей; 2) каждой плоскос- плоскости, параллельной плоскости Оху; 3) каждой из координатных осей; 4) каждой прямой, параллельной оси Ох или оси Оу и пересекающей ось Ог\ 5) каждой точки, лежащей на оси Ох. Ось Ох называется осью гиперболического цилиндра. Исследуем пересечение гиперболического цилиндра C) с различ- различными плоскостями. Пусть плоскость П параллельна оси Ох. Обозна- Обозначим буквой Д прямую, по которой плоскость II пересекается с пло- плоскостью Оху. Как известно из § 15.2, прямая Д по отношению к гиперболе C) может занимать следующие положения: 1) пересекать в двух различных точках; 2) пересекать в одной точке (если она па- параллельна одной из асимптот гиперболы, но не совпадает с этой асим- асимптотой); 3) касаться в одной точке; 4) не иметь общих точек. В со- 297
ответствии с этим плоскость П, параллельная оси Ог, может пересекать гиперболический цилиндр C) по двум прямолинейным образующим, по одной образующей, может касаться цилиндра вдоль прямолиней- прямолинейной образующей и, наконец, может не иметь с цилиндром общих точек. Рассмотрим теперь пересечение гиперболического цилиндра C) с плоскостью, не параллельной оси Ог. Такая плоскость пересекает все прямолинейные образующие цилиндра C). В результате получа- получается плоская фигура второго порядка, состоящая из двух ветвей, отличных от прямых, т. е. гипербола. Итак, любая плоскость, не параллельная оси гиперболического цилиндра, пересекает его по гиперболе. Упражнения 1. В каких пределах меняются большая и малая полуоси эллипса, полученного в пересечении эллиптического цилиндра с любыми плоскостями, не параллельными оси Ог. 2. Докажите, что существует плоскость, пересекающая фиксированный пара- параболический цилиндр B) по параболе любых наперед заданных размеров. 3. Перечислите все цилиндрические фигуры второго порядка (см. § 15.7; 16.8).
ЛИТЕРАТУРА Александров П. С. Курс аналитической геометрии и линейной алгеб- алгебры.—М: Наука, 1979.—512 с. Бурдун А. А., Мурашко Е. А., Феденко А. С. Сборник задач по алгеб- алгебре и геометрии.— Мн.: Изд-во БГУ, 1979.— 200 с. Ильин В. А., Позняк Э. Г. Аналитическая геометрия.— М.: Наука, 1982.—232 с. Кострикин А. И. Введение в алгебру.— М.: Наука, 1977.— 496с. Моденов 77. С, Пархоменко А. С. Сборник задач по аналитической геометрии.— М.: Наука, 1976.— 384 с. Постников М. М. Аналитическая геометрия.— М.: Наука, 1979.— 336 с. Фаддеев Д. /С, Соминский Н. С. Сборник задач по высшей алгебре.— М.: Наука, 1977.—288 с.
ОГЛАВЛЕНИЕ Предисловие 3 Раздел 1 ОСНОВЫ АЛГЕБРЫ 1. Арифметика целых чисел 5 1.1. Основные понятия 5 1.2. Наибольший общий делитель. Алгоритм Евклида 6 1.3. Наименьшее общее кратное 8 1.4. Простые числа. Основная теорема арифметики 9 2. Системы линейных уравнений. Матрицы 11 2.1. Матрицы 12 2.2. Элементарные преобразования матрицы 12 2.3. Системы линейных уравнений. Метод Гаусса 15 2.4. Операция над матрицами 19 3. Множества и отображения 26 3.1. Понятие множества. Операции над множествами 26 3.2. Отношение эквивалентности 29 3.3. Отображения 30 3.4. Умножение отображений 33 3.5. Обратное отображение 36 3.6. Перестановки и подстановки 37 4. Определители 43 4.1. Определители второго и третьего порядков 43 4.2. Определители п-го порядка 46 4.3. Свойства определителей 49 4.4. Миноры и их алгебраические дополнения 53 4.5. Определитель произведения квадратных матриц 59 4.6. Обратная матрица 60 4.7. Правило Крамера 63 4.8. Вычисление обратной матрицы элементарными преобразованиями 66 5. Основные алгебраические структуры (группы, кольца, поля) 68 5.1. Алгебраическая операция 68 5.2. Группы 72 5.3. Подгруппы 76 5.4. Кольца 78 5.5. Поля 81 6. Комплексные числа S3 6.1. Построение поля комплексных чисел 84 6.2. Комплексная плоскость. Геометрическое истолкование действий с ком- комплексными числами 87 300
6.3. Извлечение корней из комплексных чисел 92 6.4. Основная теорема алгебры комплексных чисел 96 7. Группы 98 7.1. Изоморфизмы групп 98 7.2. Циклические группы 102 7.3. Смежные классы по подгруппе 105 7.4.* Нормальная подгруппа. Фактор-группа 108 7.5.* Гомоморфизмы групп 111 7.6.* Прямое произведение групп 114 7.7. * Конечные абелевы группы 117 8. Кольца 126 8.1. Сравнения 126 8.2. Функция Эйлера 128 8.3.* Мультипликативная группа кольца Zm 130 8.4. Изоморфизмы и гомоморфизмы колец 133 8.5. Идеал. Фактор-кольцо 135 8.6.* Теорема о гомоморфизмах колец 136 9. Многочлены от одной переменной 138 9.1. Кольцо многочленов от одной переменной 13S 9.2. Деление с остатком в кольце многочленов. Наибольший общий делитель 142 9.3. Неприводимые многочлены 151 9.4. Корни многочленов 156 9.5. Рациональные дроби 162 10. Многочлены от нескольких переменных 167 10.1. Кольцо многочленов от нескольких переменных 167 10.2. Симметрические многочлены 174 11. Элементы теории полей 180 П.1.* Теорема существования корня 180 11.2. Доказательство основной теоремы алгебры комплексных чисел 184 11.3. Многочлены с рациональными коэффициентами 188 11.4. Алгебраические числа 193 Раздел 2 ЭЛЕМЕНТАРНАЯ АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ 12. Векторы и координаты 198 12.1. Понятие вектора 198 12.2. Сложение векторов 200 12.3. Умножение вектора на число 202 12.4. Проекции 204 12.5. Линейная зависимость векторов 207 12.6. Координаты на прямой 211 12.7. Координаты на плоскости 212 12.8. Координаты в пространстве 215 12.9. Преобразование координат 218 12.10. Уравнения фигуры 221 12.11. Скалярное произведение векторов 223 12.12. Векторное произведение векторов t 226 12.13. Смешанное произведение векторов ' 230 301
13. Прямая на плоскости 232 13.1. Уравнение прямой с угловым коэффициентом 232 13.2. Общее уравнение прямой. Уравнение прямой в отрезках 234 13.3 Векторная и параметрическая формы уравнения прямой. Уравнение прямой, проходящей через две заданные точки 236 13.4. Совместное исследование уравнений двух прямых 237 13.5. Пучок прямых 239 13.6. Расстояние от точки до прямой 240 13.7. Угол между двумя прямыми 244 14. Плоскости и прямые 245 14.1. Общее уравнение плоскости 245 14.2. Совместное исследование уравнений двух плоскостей 248 14.3. Пучок и связка плоскостей 249 14.4. Расстояние от точки до плоскости 251 14.5. Различные виды уравнений прямой 253 14.6. Некоторые задачи 255 15. Плоские фигуры второго порядка 259 15.1. Эллипс 259 15.2. Гипербола 264 15.3. Директрисы эллипса и гиперболы 269 15.4. Парабола 271 15.5. Уравнение параболы, эллипса и гиперболы при вершине 274 15.6. Полярное уравнение эллипса, гиперболы и параболы 276 15.7. Плоские фигуры второго порядка 277 16. Фигуры второго порядка 280 16.1. Понятие фигуры второго порядка 281 16.2. Эллипсоид 283 16.3. Конус второго порядка 285 16.4. Однополостный гиперболоид 287 16.5. Двуполостный гиперболоид 290 16.6. Эллиптический параболоид 292 16.7. Гиперболический параболоид 293 16.8. Цилиндрические фигуры 295 16.9. Цилиндрические фигуры второго порядка 295 Литература 299
Михаил Васильевич Милованов, Регина Иосифовна Тышкевич, Анатолий Семенович Феденко АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ Часть 1 Зав. редакцией Л. Д. Духвалов Редактор П. М. Латышева Мл. редакторы В. М. Кушилевич, Р. А. Масловская Переплет Е. Ф. Ясногородского Худож. редактор Ю. С. Сергачев Техн. редактор М. Н. Кислякова Корректор Л. А. Шлыкович ИБ № 1790 Сдано в набор 24.05.83. Подписано в печать 23.04.84. Формат 60Х907з2- Бумага тип. № 2. Гарнитура литературная. Высокая печать. Усл. печ. л. 19. Усл. кр.-отт. 19. Уч.-изд. л. 19,88. Тираж 5500 экз. Зак. 3670. Цена 1 р. 10 к. Издательство «Вышэйшая школа» Государственного комитета БССР по делам издательств, полиграфии и книжной торговли. 220048, Минск, проспект Машерова, 11. Минский ордена Трудового Красного Знамени полиграфкомбпнат МППО им. Я. Коласа. 220005, Минск, Красная, 23.
Милованов М. В. и др. М 60 Алгебра и аналитическая геометрия: [Учеб. пособие для мат. спец. ун-тов и пед. ин-тов]/М. В. Милованов, Р. И. Тыш- Тышкевич, А. С. Феденко.— Мн.: Выш. шк., 1984.—302 с, ил. В пер.: 1 р. 10 к. В пособии излагается объединенный курс алгебры и аналитической геометрии, который читается авторами в течение ряда лет на механико-математическом факуль- факультете Белорусского государственного университета им. В. И. Ленина. В настоящую (первую) часть включены основы алгебры и элементарная ана- аналитическая геометрия. Приводятся примеры и упражнения, дополняющие и углуб- углубляющие основной текст. 1702010000—076 М il04@5)-84 13~84 ББК 221515 3