Text
                    Л. Я. Куликов
wwww WW шШШЩшШгШш ШшШУшТшГ


Л. Я. Куликов АЛГЕБРА И ТЕОРИЯ ЧИСЕЛ Допущено Министерством просвещения СССР в качестве учебного пособия для студентов педагогических институтов по специальностям «Математика», «Математика и физика» и «Физика и математика» Москва «Высшая школа» 1979
ББК22.143 УДК512(075) Рецензенты: кафедра алгебры, теории чисел и методики математики Куйбышевского государственного педагогического института им. В. В. Куйбышева (зав. кафедрой — проф. Б. М. Бредихин) и докт. физ.-мат. наук, проф. М. М. Глухов К Куликов Л. Я. К90 Алгебра и теория чисел: Учеб. пособие для педагогических институтов. — М.: Высш. школа, 1979. —559 с, ил. В пер.: 1 р. Ю к. В книге систематически изложены элементы логики, мно* ксества и отношения, алгебры и алгебраические системы, основные числовые системы, основы линейной алгебры, включающие системы линейных неравенств, группы, теоретико-числовые темы, кольца и кольца полиномов, полиномы над основными числовыми полями и элементы теории полей. Предназначается для студентов физико-математических факультетов педагогических институтов. 60602—348 5171 34-79 4306020400 517Л 002(01)-79 ББК 22.143 © ИЗДАТЕЛЬСТВО «ВЫСШАЯ ШКОЛА», 1979
ПРЕДИСЛОВИЕ В последние годы в педагогических институтах введена новая программа единого курса алгебры и теории чисел. Главная цель этого курса — изучение основных алгебраических систем и воспитание алгебраической культуры, необходимой будущему учителю для глубокого понимания целей и задач как основного школьного курса математики, так и школьных факультативных курсов. Предлагаемое учебное пособие написано в соответствии с новыми программами. Условно можно считать, что книга состоит из трех частей, тесно связанных между собой. К первой части относятся элементы логики, множества и отношения, начальные сведения об алгебрах и алгебраических системах и основные числовые системы. Элементы логики и теории множеств даются на содержательном уровне и в дальнейшем существенным образом используются как в курсе алгебры, так и в других математических дисциплинах. Начальные сведения об алгебрах и алгебраических системах, о группах и кольцах даны в третьей главе. На этой основе изучаются основные числовые системы: система натуральных чисел, кольцо целых чисел, поле рациональных чисел, система действительных чисел и поле комплексных чисел. Система действительных чисед вводится как полное архимедовски упорядоченное поле. Во второй части (главы 5 — 9) излагается линейная алгебра. Сначала рассматриваются арифметические векторные пространства и системы линейных уравнений вне связи с определителями. Лишь в шестой главе дано приложение определителей к решению систем линейных уравнений. Такой подход имеет преимущества перед традиционным, так как вычислительная сторона основных задач темы становится менее трудной, теория систем линейных уравнений Органически включается в теорию арифметических векторных пространств. В девятой главе изложены з
системы линейных неравенств и элементы линейного программирования (стандартные и канонические задачи, теорема двойственности и симплекс-метод). Третья часть книги (главы 10 — 17) посвящена группам, теоретико-числовым темам, кольцам и кольцам полиномов. В последних двух главах изучаются кольца полиномов над основными числовыми полями и элементы теории полей. Многие главы тесно связаны с новой школьной программой и могут служить основой для школьных факультативных курсов. Все главы делятся на параграфы. В ссылках на параграф той же главы указывается номер параграфа, в ссылках же на параграф другой главы номер главы предшествует номеру параграфа. Теоремы, предложения и следствия нумеруются последовательно в пределах параграфа. При ссылке на теорему или предложение той же главы указывается номер параграфа и теоремы, а при ссылке на теорему или предложение другой главы указываются последовательно номера главы, параграфа и теоремы. Например, ссылка «теорема 4.2» обозначает теорему 2 четвертого параграфа той же главы, «теорема 4.2.6»— теорему 6 параграфа 2 главы 4. Автор благодарит рецензентов, проф. Б. М. Бредихина и проф. М. М. Глухова, за ряд критических замечаний, способствующих улучшению рукописи книги. Автор
Глава первая ЭЛЕМЕНТЫ ЛОГИКИ § 1. ЛОГИКА ВЫСКАЗЫВАНИЙ Высказывания. Понятие «высказывание» первично. Под высказыванием в логике понимают повествовательное предложение, о котором можно говорить, что оно истинно или ложно. Любое высказывание либо истинно, либо ложно, и никакое высказывание не является одновременно истинным и ложным. Примеры высказываний: «О < 1», «2 • 3 = 6», «5 есть четное число», «1 есть простое число». Истинностное значение первых двух высказываний —«истина», истинностное значение последних двух —«ложь». Вопросительные и восклицательные предложения не являются высказываниями. Определения не являются высказываниями. Например, определение «целое число называется четным, если оно делится на 2» не является высказыванием. Однако повествовательное предложение «если целое число делится на 2, то оно четное» есть высказывание, и притом истинное. В логике высказываний отвлекаются от смыслового содержания высказывания, ограничиваясь рассмотрением его с той позиции, что оно либо истинно, либо ложно. В дальнейшем будем понимать под значением высказывания его истинностное значение («истина» или «ложь»). Высказывания будем обозначать прописными латинскими буквами, а их значения, т. е. «истина» или «ложь» —соответственно буквами И и Л. Логика высказываний изучает связи, которые полностью определяются тем, каким образом одни высказывания строятся из других, называемых элементарными. Элементарные высказывания при этом рассматриваются как целые, не разложимые на части, внутренняя структура которых нас не будет интересовать. Логические операции над высказываниями. Из элементарных высказываний с помощью логических опера- 5
ц и й можно получать новые, более сложные высказывания. Истинностное значение сложного высказывания зависит от истинностных значений высказываний, составляющих сложное высказывание. Эта зависимость устанавливается в данных ниже определениях и отражается в истинностных таблицах. В левых столбцах этих таблиц размещаются всевозможные распределения истинностных значений для высказываний, непосредственно составляющих рассматриваемое сложное высказывание. В правом столбце пишут истинностные значения сложного высказывания соответственно распределениям в каждой строке. Пусть Л и В — произвольные высказывания, относительно которых мы не предполагаем, что известны их истинностные значения. Отрицанием высказывания А называется новое высказывание, истинное тогда и только тогда, когда А ложно. Отрицание А обозначается через ~|Л и читается «не А» или «неверно, что Л». Операция отрицания полностью определяется истинностной таблицей Л и л 1Л л и Пример. Высказывание «неверно, что 5 — четное число», имеющее значение И, есть отрицание ложного высказывания «5 —четное число». С помощью операции конъюнкции из двух высказываний получается одно сложное высказывание, обозначаемое А /\В. По определению, высказывание А Д В истинно тогда и только тогда, когда оба высказывания истинны. Высказывания А и Б называются соответственно первым и вторым членами конъюнкции А Д В. Запись «Л Д В» читается как «Л и В». Истинностная таблица для конъюнкции имеет вид А И И Л Л В И Л и л ЛАВ и л л л Пример. Высказывание «7 — простое число и б — нечетное число» ложно, как конъюнкция двух высказываний, одно из которых ложно. Дизъюнкцией двух высказываний Л и В называется высказывание, обозначаемое А\] В, истинное в том и только в том случае, когда хотя бы одно из высказываний 6
А и В истинно. Соответственно этому высказывание A\J В ложно в том и только том случае, когда и А и В оба ложны. Высказывания А и В называются соответственно первым и вторым членами дизъюнкции А У В. Читается запись А У В как «Л или 5». Союз «или» в данном случае носит неразделительный смысл, поскольку высказывание А у В истинно и при истинности обоих членов. Дизъюнкция имеет следующую истинностную таблицу: А И И Л Л в и л и л А у В И И и л Пример. Высказывание «3 < 8 или 5 <. 2», являющееся дизъюнкцией двух высказываний, одно из которых истинно, имеет значение И. Высказывание, обозначаемое Л->5, ложное в том и только в том случае, когда А истинно, а В ложно, называется импликацией с посылкой А и заключением В. Высказывание А-*-В читается как «если Л, то 5», или «Л влечет б», или «из Л следует 5». Истинностная таблица для импликации такова: А И И Л Л в и л и л л-^в И л и и Отметим, что между посылкой и заключением могут отсутствовать причинно-следственные связи, но это не может повлиять на истинность или ложность импликации. Например, высказывание «если 5—-простое число, то биссектриса равностороннего треугольника является медианой» будет истинным, хотя в обычном понимании второе не следует из первого. Истинным также будет высказывание «если 2 + 2 = 5, то 6 + 3 = 9», поскольку истинно его заключение. При данном определении, если заключение истинно, импликация будет истинной независимо от истинностного значения посылки. В том случае, когда ложна посылка, импликация будет истинна независимо от истинностного значения заключения. Эти обстоятельства кратко формулируют так: «истина следует из чего угодно», «из ложного следует все, что угодно». 7
Высказывание, обозначаемое через А «-> В, истинное в том и только в том случае, когда А и В имеют одно и то же истинностное значение, называется эквиваленцией. Высказывание А <+ В читается как «А тогда и только тогда, когда 5», или «А эквивалентно 5», или «А необходимо и достаточно для В». Истинностная таблица для эквиваленции имеет вид ?_ И И Л Л Б И Л И Л А~В И Л Л И Пример. Высказывание «2>5 тогда и только тогда, когда 3 + 0 = 4» истинно, как эквиваленция двух ложных высказываний. Формулы логики высказываний.Основной задачей логики высказываний является изучение логических форм сложных высказываний с помощью логических операций. Понятие логической формы сложного высказывания уточняется с помощью вводимого ниже понятия формулы логики высказываний. Для обозначения высказываний будем использовать малые буквы конца латинского алфавита (возможно, с индексами). При этом, какое высказывание (истинное или ложное) будет обозначать та или иная буква, предполагаем неизвестным. Фактически буквы (1) р, q, r, ..., ft, qlf rl9 ... будут играть роль переменных, принимающих в качестве значений истинностные значения «истина» и «ложь». Обычно эти переменные называются пропозициональными переменными; будем также называть их элементарными формулами или атомами. Для построения формул логики высказываний кроме символов (1) используются знаки логических операций 1> Л» \Л -*t **» а также символы, обеспечивающие возможность однозначного прочтения формул, — левая и правая скобки: (,). Понятие формулы логики высказываний определим следующим образом: 1) элементарные формулы (атомы) суть формулы логики высказываний; 8
2) если А и В — формулы, то (~]А), (А/\В), (А\/В), (А-+В), (А++В) тоже являются формулами логики высказываний; 3) только те выражения являются формулами логики высказываний, для которых это следует из 1) и 2). Определение формулы содержит перечисление правил образования формул. Согласно определению, всякая формула логики высказываний либо есть атом, либо образуется из атомов в результате последовательного применения правила 2). Например, выражения р.Од), ((rVs)->¦<), ((pV(1P))~(P-><7)) являются формулами логики высказываний. Обозначать произвольные формулы логики высказываний будем большими буквами латинского алфавита (возможно, с индексами): А, В, С, ... , Аг В19 С19 ... При этом не исключено, что одна и та же формула может быть обозначена различными буквами. Заметим, что никакой атом не имеет вида С~\А), (Л ДБ), (A\JB)9 (Л->¦?), (А *+В). Такой вид имеют сложные формулы. В первой главе вместо «формула логики высказываний» часто будем говорить просто «формула» там, где это не может вызвать недоразумений. Число скобок в формулах можно уменьшить, введя соглашения: 1) в сложной формуле будем опускать внешнюю пару скобок. 2) упорядочим знаки логических операций по «старшинству»: <->, ->-, V, Д, ~|. В этом списке знак <-> имеет самую большую область действия, а знак "1 — самую маленькую. Под областью действия знака операции понимаются те части формулы, к которым «применяется» (на которые «действует») рассматриваемое вхождение этого знака. Договоримся опускать во всякой формуле те пары скобок, которые можно восстановить, учитывая «порядок старшинства». При восстановлении скобок сначала расставляются все скобки, относящиеся ко всем вхождениям знака ~| (при этом мы продвигаемся слева направо), затем ко всем вхождениям знака Д и т. д. Пример. В формуле В<->~\C\/D/\А скобки восстанавливаются следующими шагами: B«*OC)\JD/\A, B++(C\C)\/(D№))> B«*(1C)\/(D/\A), (B+>((-]C)V(Df\A))). 9
Не всякая формула может быть записана без скобок. Например, в формулах Л->(В—>-С), ~](Л->В) дальнейшее исключение скобок невозможно. Законы логики. Существуют формулы, которые принимают значение И независимо от того, какие значения принимают входящие в них атомы. Например, А\/-]А, А-+А, (А-+В)У(В-+А), А-»(В-+А). Такие формулы играют особую роль в логике. ОПРЕДЕЛЕНИЕ. Формула логики высказываний, которая принимает значение «истина» при любом распределении значений входящих в эту формулу атомов, называется тождественно истинной формулой, тавтологией или законом логики. Существуют формулы, которые принимают значение «ложь» независимо от того, какие значения принимают входящие в них атомы. Например, А/\~]А, (АУЧА)-+{АМА). ОПРЕДЕЛЕНИЕ. Формула логики высказываний, принимающая значение «ложь» при любом распределении значений входящих в эту формулу атомов, называется тождественно ложной формулой или противоречием. Легко убедиться, что если А—противоречие, то ~]А будет тавтологией, и наоборот. Например, формула р Д 1р тождественно ложна, а "1(р Д Пр) —тавтология. Существуют формулы, которые принимают как значение И, так и значение Л в зависимости от того, какие значения принимают входящие в них атомы. Например, А у А, А-+В, А 1\В-+В /\С. Запись |= А означает, что формула А есть тавтология; например, |= А V "1 А. Этот закон носит название закона исключенного третьего. ТЕОРЕМА 1.1. Если А и (А-* В)—тавтологии, то В — тавтология. Доказательство. Пусть А и (Л-^В)—тавтологии. Допустим, что для какого-либо распределения истинностных значений атомов, входящих в Л и 5, формула В принимает значение «ложь». Так как Л— тавтология, то при том же распределении истинностных значений атомов формула Л принимает значение И. Следовательно, формула (Л->5) получит значение Л, что противоречит предположению о том, что (Л->В) есть тавтология. Значит, фор- 10
мула В принимает значение И при любом распределении истинностных значений ее атомов. ?** ТЕОРЕМА 1.2. Пусть А —формула, содержащая атомы Ри ...» Рп> а В —формула, получающаяся из А одновременной подстановкой формул А19 ..., Ап вместор19 ...9 рп соответственно. Если А—тавтология, то и В—тавтология. Доказательство. Пусть задано произвольное распределение истинностных значений атомов, входящих в В. Для этого распределения значений атомов формулы А19..., Ап примут соответственно истинностные значения а19 ..., ап. Если атомам р19 ..., рп придать соответственно значения а19 ..., аП9 то в результате истинностное значение формулы А совпадет со значением формулы В при заданном распределении значений атомов, входящих в В. Так как, по условию, Л—тавтология, то В при заданном распределении значений атомов принимает значение «истина», т. е. В тоже тавтология. ? Эта теорема показывает, что любая подстановка в тавтологию приводит к тавтологии. Ниже (в теореме 1.3) приведены часто встречающиеся законы логики. ТЕОРЕМА 1.3. Следующие формулы являются тавтологиями: Тавтологическ р Мр-+я)-+ р /\я-+р\ Р АЯ-+Я) р-+р\1 я\ я-+рУ я) ие импликации: Я (р\/я)Мя-+-р Р-+ПР 11Р-+Р (р-*я)А(я-*р)-+ '(Р«*Я) —закон заключения; — законы удаления конъюнкции; — законы введения дизъюнкции; — закон удаления дизъюнкции; — закон введения двойного отрицания — закон удаления двойного отрицания; — закон введения экеива- ленции; *} D — знак, означающий, что доказательство теоремы или предложения закончено. 11
(р <-> q) -> (р -»¦ ^) 1 _ законы удаления экви- (р ^ ?) _». (? _». р) j валенции; (р -> <7) -^ О <7 --^ ~1 р) — за/соя контрапозиции; Пр-><7)ДОр->~|<7)->р — закоя доказательства от противного; (р -> 9) Д (<7 ->¦ /") ->• (Р -*¦ О — за/соя силлогизма; (р —> г) Д (<7 ->¦ г) ->¦ (р V Я -*¦ 0 — за/соя сложения посылок; (Р -*¦ 0) Л (Р "¦*"г) "^ (Р ""*" 9 Л г) — за/соя умножения за- ключений; (Р«-*9) Л (Я** г)~*~(Р*¦*г) ""закоятранзитивности эквиваленции. Тавтологические эквиваленции: р**р —закон тождества; р д р «^ р — за/соя идемпотентности конъюнкции; рУ р+>р — за/соя идемпотентности дизъюнкции; Р А Я** Я Л Р ~~за/соя коммутативности конъюнкции; рУ Я***ЯУ Р "~за/соя коммутативности дизъюнкции; Р А (Я А г) ** (Р Ая) А г ~~закон ассоциативности конъюнкции; Р У (Я У г)** (Р V 9) V г —закон ассоциативности дизъюнкции; Р А (Я У г) ** (Р Л Я) У (Р Л г) ~~ зодеоя дистрибутивности конъюнкции относительно дизъюнкции; Р У {Я А г) *"* (Р V Я) А (Р V г) — закон дистрибутивности дизъюнкции относительно конъюнкции; "1~]р<->р —закон двойного отрицания; (р «_» q) <-> (q «^ р) — за/Соя коммутативности эквиваленции; (р _> <у) «^ (-] ^ -> -| р) — за/соя контрапозиции; КрУ Я)<->С\Р А ~\Я) ~~ з^^соя отрицания дизъюнкции; 12
"1 (Р Л Я) *** О Р V "\я) -" зяяоя отрицания конъюнкции; (Р *"* 9) *"* П Р ** "19) — зшсоя противоположности; р ->¦ (д ->¦ г) <-> 9 -> (р ->¦ г) — за/со« перестановки посылок. Тавтологии, выражающие одни операции через другие: p-+q+*~\p\l q; p-+q<-*l(p Alq); р V q <* 1 р -*?; р\/9^ЮрЛ1?);: рЛ^^Кр-^1?); рЛ<7~1Пр\П<?); (р«*<7)^(р-^)Л(<7-^р)- Чтобы доказать, что каждая из приведенных формул является тавтологией, надо применить метод истинностных таблиц, т. е. составить для каждой формулы истинностную таблицу и убедиться, что в каждой строке крайнего правого столбца стоит буква И. Рассмотрим, к примеру, закон силлогизма: р и и и и л л л л я и и л л и и л л г и л и л и л и л Р-+Я и и л л и и и и q-+r И л и и и л и и р-+г и л и л и и и и (р-+я) А(я-*г)-+ -+(р-+г) и и и и и и и и Заметим, что на основании законов ассоциативности можно опускать скобки, посредством которых осуществляется группировка членов многочленных конъюнкций и дизъюнкций. Из закона двойного отрицания следует, что при желании всегда можно избежать двух подряд стоящих знаков «"]» и более. 13
Упражнения 1. Составьте таблицу истинности для каждой из формул (а)р-><7—~]р V Я\ (с)/-->(/--М); СОР-*"! (? Л г); ((1) (р Д <?) + (* Д -\s-+p V s). 2. Что можно сказать об истинностном значении высказывания "] Л Д В ^- Л V 5, если значение высказывания А-^В есть Л? 3. Докажите, что формулы теоремы 1.3 являются тавтологиями. 4. Пусть С — формула, в которой выделено некоторое вхождение формулы А, а С— формула, полученная из С заменой этого вхождения формулы А на формулу В. Докажите, что если А -* В — тавтология, то С «-* С — тоже тавтология. 5. Сколько строк имеет истинностная таблица для формулы логики высказываний, имеющей п различных атомов? 6. Пусть формула А построена из атомов рь ..., рп только с помощью знаков ""], Д, V» а формула А* получена из А заменой каждого вхождения символа Д символом V и наоборот и заменой каждого вхождения pt вхождением ~| р/ и наоборот. Докажите, что формула "| Л «-* Л* — тавтология. 7. Докажите, что следующие формулы являются тавтологиями: (а) (Л Д В)-+С~ А-+(В-+С); (Ь)(ЛДЯ)->С~(ЛЛ1С)~>-1В; (сП(Л->В)~ЛД-]В; (d)(A-+B)A-]B-+-\A; <еМ->ПЛ-*В); <f) Л-*(*-* Л); (ЙПЛ^Л)^Л; (h)(A-+B)->(A/\C->BAQ; (i) (Л->В) Д (C->D)-*(A Д С-+В A D); (к)(Л-*Я) Д (C-+D)-*(A V С-^В V D); (1)-1(Л^Б)^П(Л^Б)У1(В-^Л)). 8. Докажите, что никакая формула логики высказываний, при построении которой используются только знаки логических операций Д, V» не является ни тавтологией, ни противоречием. § 2. ЛОГИЧЕСКОЕ СЛЕДСТВИЕ Основные определения. Пусть Alf ..., Ат, В —формулы логики высказываний. ОПРЕДЕЛЕНИЕ. Формула В называется логическим следствием формул Аи ..., Ат, если при любом выборе истинностных значений атомов, входящих в формулы А19... ..., Ат, В, формула В получает значение «истина» всякий раз, когда каждая из формул А19 ..., Ат получает значение «истина». Запись А19 ..., Ат\=В 14
означает, что формула В —логическое следствие формул А19 ..., Ат (формулы А19 ..., Ат логически влекут формулу В). Используя таблицы истинности, можно сказать, что формула В есть логическое следствие формул Al9 ..., А„и если в таблицах, построенных по перечню атомов р19 ... ..., рп, входящих в Аи ..., Ату В, формула В имеет значение И во всех тех строках, в которых Al9 ..., Ат одновременно имеют значение И. Другими словами, совокупность тех наборов значений атомов, для которых истинны все формулы Al9 ..., Ат9 содержится в совокупности тех наборов значений атомов, для которых истинна формула В. Очевидно, порядок атомов р19 ..., рП9 входящих в формулы А19 ..., Ат9 В9 безразличен. Пример. А-*~В9 А->1В|="1Л, что видно из таблицы: А И И Л Л В и л и л А -*в и л и и А-*~\В л и и и "М л л и и Из определения логического следствия вытекает, что тавтология логически следует из любой формулы логики высказываний, а противоречие логически влечет любую формулу. ОПРЕДЕЛЕНИЕ. Формулы А и В называются равносильными (логически эквивалентными), если при любом выборе истинностных значений атомов, входящих в А и В9 формулы А и В принимают одинаковые истинностные значения. Запись А =? означает, что формулы А и В равносильны. Из определения логической эквивалентности формул следует, что любые две тавтологии логически эквивалентны, так же как и любые два противоречия. Формула А равносильна В тогда и только тогда, когда А\=В и В\=А. ТЕОРЕМА 2.1. Формулы А и В равносильны тогда и только тогда, когда формула А <-> В является тавтологией. Доказательство теоремы предлагается читателю в качестве упражнения. 15
ТЕОРЕМА 2.2. (а) А \= В тогда и только тогда, когда |= Л->-В; (b) Al9 ..., Ат\=В тогда и только тогда, когда )=A1h...hAa-+B. Доказательство, (а) Пусть А\=В. Импликация А-+В имеет истинностное значение Л, когда А получает значение И и одновременно В получает значение Л. Однако в силу условия А \= В такого распределения истинностных значений атомов, входящих в Л и В, не существует. Следовательно, формула А-+В всегда получает значение И, т. е. |=Л-^В. Предположим теперь, что \=А-*В. Рассмотрим произвольное распределение истинностных значений атомов, входящих в Л и В, при котором Л имеет значение И. Так как Л -> В по предположению получает значение И при этом распределении, то и В получает значение И при этом распределении. Таким образом, А\=В. (Ь) Из определения конъюнкции следует, что А1$ ... ..., Ат\=В тогда и только тогда, когда А± Д ... Д Ат\= В. Кроме того, в силу (а) Ai/\---f\Am\=B тогда и только тогда, когда |= Аг Д... .../\Ат-+В. Следовательно, А19 ..., Ат\=В тогда и только тогда, когда |=Л1Д...ДЛш->-В. П Пример. (А-+В), (В-^С)|=(Л->С), так как формула (Л ->¦ В) Д (В ->¦ С) ->- (Л -> С) является тавтологией. ТЕОРЕМА 2.3. А19 ..., Ат, В\=С тогда и только тогда, когда Al9 ..., Ат\=В-+-С. Доказательство. Предположим, что Al9 ..., Ат9 В|=С, и докажем, что тогда А19 ..., Ат\=В-*С. Допустим, что существует такое распределение истинностных значений атомов, входящих в формулы Alf ..., Ат, В, С, при котором формулы Alf ..., Ат принимают значение И, а формула В-+С принимает значение Л. Для этого же распределения значений атомов формулы А19 ..., Ат, В приняли бы одновременно значение И, а формула С--значение Л. Следовательно, такого распределения истинностных значений атомов не существует. Таким образом, если А19 ..., Ат, В\=С9 то А19 ..., Ат\=В-+С. Предположим теперь, что А19 ..., Ат\=В-+-С9 и докажем, что А19 ..., Ат9 В\=С. Допустим, что существует такое распределение истинностных значений атомов, входящих в формулы А19 ..., Ат9 В, С, при котором фор- 16
мулы Al9 ..., Ат9 В принимают значение И, а формулы С —значение Л. При этом же распределении истинностных значений атомов формулы А19 ..., Ат приняли бы значение И, а формула В ->- С — значение Л, что противоречило бы предположению. Следовательно, такого распределения истинностных значений атомов не существует. Таким образом, если А19..., Ат\=В-*~С9 то А19..., Ат9 В\=С. П СЛЕДСТВИЕ 2.4. Л, В\=С тогда и только тогда, когда |=Л-^(5-^С). В более общем виде: А19 Л2, ... ..., Ат\=В тогда и только тогда, когда (=Л1-^(Л2-^ -+(...(Ат + В)...)). Для доказательства достаточно несколько раз применить теорему 2.3. Из теоремы 2.3 следует, что тавтологическим экви- валенциям, приведенным в теореме 1.3, отвечают следующие равносильности (логические эквивалентности): АштА; А^АштА; A\JAeaAi А!\В = В/\А; A\JB = B\/A; A/\(B/\C)MAf\B)/\C; A\/(B\/C) = (A\JB)\/C; АМВУС)^(А/\В)\/(А/\СУ, AV(BAC)-(AVB)MA\/C)l Т\А = А\ (А«+В) = (В«*А); (А-+В) = ОВ-+1А); -\(А\/В)^-\А/\1В; -\(А/\В)^1А\/1В; (А**В)шт(-]А**1В); Л^(В-^С) = Я->(Л-*С); A-+Bm*-\A\JB; Л^В = 1(ЛЛ"15); А\/Вшв-\А-+В; АУ В ^Ю A MB); А/\В^1(А^1В); А/\В = ЮА\/1Ву, (A*+B)sa(A-+B)MB-**A). 17
Схемы доказательств. Доказательства тех или иных утверждений в математике строятся на основании определенных правил, сущность которых выражают тавтологические импликации логики высказываний. Они схематично отражают шаги построения доказательств, поэтому их называют схемами или правилами доказательств (см., например, ниже правило заключения, правило контра- позиции и т. д.). Приведем правила, которые соответствуют первым 15 тавтологическим импликациям теоремы 1.3: А, А-*~В\=В —правило заключения; Л, В|=ЛД5 —правило введения конъюнкции; А/\В±=А\ } — правила удаления конъ- ^ А В1= В ) юнкции; A\=A\JB\ ' > — правила введения дизъ- В\=А\/В) юнкции; AM В, -|?|=Д —правило удаления дизъюнкции; А |= 11А — правило введения двойного отрицания; ЦЛ|=Л —правило удаления двои* ного отрицания; Л-^5, В-+А\= А*+В — правило введения экви- валенции; А**В\=А А<^В^В Л->-В)=1Б->1Л —правило контрапозиции; 1Л-^5, 1Л-^15|=Л — правило доказательства от противного; Л->5, 23-^С|=Л-*-С —правило силлогизма; А-+С, 5->С|=Л\/5->С —доказательство разбором случаев. Часто при записи этих правил помещают посылки над горизонтальной линией, а заключение —под ней. При такой 18 '*} — правила удаления эквиваленте;
записи приведенные выше схемы доказательств принимает вид: А->В —я— —правило отделения; А в •правило введения конъюнкции; лдв —-^—; —^ правила удаления конъюнкции; А В АУВ ; АуВ —правила введения дизъюнкции; А у в ~±т- — правило удаления дизъюнкции; А п ; —правило введения двойного отрицания; I Iл —1г— —правило удаления двойного отрицания; — правило введения эквиваленции; — правила удаления эквиваленции; — правило контрапозиции; — правило доказательства от противного; — правило силлогизма; АХ/в'-Хс —доказательство разбором случаев. Косвенное доказательство (доказательство от противного). Совокупность формул Аъ ..., Ат логики высказываний называется противоречивой, если при любом распределении истинностных значений входящих в них атомов хотя бы одна из формул Alt ..., Ат получает значение Л. Легко видеть, что совокупность формул Alt ..., Ат про- А-+В В-+А А~В А^В А~ А-+В> ?-* А-+В ~\В-+-]А -]А-+В -}А-+-]В А А-+В В^С А-+С А-+С В-+С В А 19
тиворечива тогда и только тогда, когда формула Ai Л • • • Л Am есть противоречие, т. е. является тождественно ложной формулой. ТЕОРЕМА 2.5. Если из совокупности формул Аг, ... ..., Ат логически следует противоречие, то эта совокупность формул противоречива. Доказательство. Предположим,что Аъ ..., Am\=F9 где F — тождественно ложная формула. Тогда по теореме 2.3 В силу таблицы истинности для импликации отсюда следует, что формула Аг Д ... Д Ат тождественно ложна. Следовательно, совокупность формул А19 ..., Ат противоречива. ? Тождественно ложные формулы (противоречия) играют существенную роль в методе косвенного доказательства, называемого также методом доказательства от противного. Основой такого рода доказательств является следующая теорема. ТЕОРЕМА 2.6. Если из формул Аъ ..., Ат9 ~|В логически следует противоречие, то Al9 ..., Ат\= В. Доказательство. Предположим, что Аъ ..., Ату ~\B\==F9 где F — противоречие. Тогда по теореме 2.5 совокупность формул Al9 ...,Ли, 1В противоречива. Поэтому если для какого-либо распределения истинностных значений атомов, входящих в формулы Al9 ..., Ат9 ~\В9 все формулы Al9 ..., Ат получают значение И, то формула П В получает значение Л, а значит, В получает значение И. Следовательно, А19 ..., Ат\=В. ? Таким образом, если нужно доказать, что некоторое высказывание В логически следует из данных посылок, мы присоединяем к этим посылкам "1В и показываем, что из посылок следует противоречие (обычно оно имеет вид С Д "1 С). После этого можно заключить, что высказывание В есть логическое следствие исходных посылок. Частным является случай, когда т = 09 т. е. не задаются никакие посылки. Если, допустив истинность ~]jB, выведем противоречие (СД~]С), то можем утверждать истинность В. Это рассуждение основывается на правиле доказательства, от противного: 1В-^С, 1Б->-~1С|==Б. Очень распространенным является способ доказательства разбором случаев, который заключается в следующем. Пусть требуется доказать истинность высказывания С. 20
Строим высказывания А и В такие, что A\f В, А-+С, В -> С — истинные высказывания (часто в качестве В берут отрицание Л). Тогда на основании соответствующей схемы доказательства можно утверждать истинность С. На основании правила силлогизма можно утверждать истинность высказывания А-+В, если можно построить такую цепочку импликаций A-*-Al9 A-L—>-Л2,..., Л,2_1—>ЛЛ, Лл->?5, каждая из которых истинна. Упражнения 1. Обоснуйте следующие схемы доказательств: (.)^?; (О А-В'А-С- (Ь) ±?±; (j) (С) (В^С)-+(А-+С) ' (к) (d) А~С ; (1) (е) лус~дус; (т) т А ** В, С ~ D . ч (f) ЛДС^БД^; (П) fe) ^/^ дх/п ; (°) (h) л Ar_^R л п ; (р) А-+В/\С ' А-+(В-*С) (А-+В)-+(А-+С)' А-+С А /\В-+С ' А->(В-+С) А Д В-+С ' Л-^Б ' Л->?, "] Д (ЛЛП^)^(СЛПС), Л-^? A/\C-*B/\D' v^ В-^(Л-^С)' •(Д-*С) (q) Л-^(-|С»1В)- 2. Докажите, что для любой формулы логики высказываний существует логически эквивалентная формула, построенная только с помощью одной из следующих пар связок: (а) П, -+; (Ь) 1, V; (с) 1, Л- 3. Докажите, что (a) ~]А\/В, С->1В|=Л->1<7; (b) Л\/5, Л->С, Д-^Б|=С\/0; (c) Л->(?-> С), П^уЛ, B[=D-^C; (d) A\JB-*C\/D, D\/E-*F$=A-*F. 21
§ 3. ПРЕДИКАТЫ Средства, предоставляемые логикой высказываний, оказываются недостаточными для анализа многих математических рассуждений. Например, средствами логики высказываний нельзя установить правильность такого рассуждения: «Всякое целое число является рациональным числом; 25 —целое число, следовательно, 25 —рациональное число». Это объясняется тем, что в логике высказываний простые высказывания, из которых с помощью логических операций строятся сложные, рассматриваются как нерасчленяе- мые. Они не подвергаются анализу структуры в смысле связей объектов и их свойств. Поэтому возникает необходимость в построении такой логической системы, средствами которой можно исследовать строение тех высказываний, которые в логике высказываний рассматриваются как элементарные. Такой логической системой является логика предикатов, содержащая как часть логику высказываний. Свободные переменные. В математике широко используются буквенные обозначения. Некоторые буквы, выделяемые в тексте, обозначают произвольные объекты определенного вида. Обычно каждая такая буква сохраняет свою индивидуальность, т. е. обозначает один и тот же объект на всем протяжении некоторого текста. Различные буквы могут обозначать как один и тот же объект, так и различные объекты. Используемые таким образом буквы называются свободными переменными. Допустимыми значениями свободной переменной называются те объекты определенного вида, для обозначения которых употребляется эта переменная. Так, допустимыми значениями свободной переменной могут быть высказывания. Такая свободная переменная называется пропозициональной. Допустимыми значениями свободной переменной могут быть натуральные, или целые, числа. Такая свободная переменная называется соответственно натуральной или целочисленной. Если допустимыми значениями свободной переменной являются действительные или комплексные числа, то такая переменная называется соответственно действительной или комплексной. Предикаты. Рассмотрим предложение (1) х+у = 3, содержащее натуральные переменные х я у. Это предло- 22
жение не является высказыванием, так как о нем нельзя сказать, истинно оно или ложно. Оно называется предикатом или условием (на х и у). Приведем другие примеры предложений с переменными: (2) х есть простое число; (3) х есть четное число; (4) х меньше у\ (5) х есть общий делитель у, г. Будем считать, что допустимыми значениями переменных х, у и z являются натуральные числа. Если в предложениях (1)—(5) заменить переменные их допустимыми значениями, то получатся высказывания, которые могут быть как истинными, так и ложными. Например, 0+1=3; 2 есть простое число; 3 есть четное число; 5 меньше 7; 3 есть общий делитель 6 и 12. ОПРЕДЕЛЕНИЕ. Предложения с переменными, дающие высказывания в результате замены свободных переменных их допустимыми значениями, называются предикатами. Предложения (1)—(5) могут служить примерами предикатов. По числу входящих свободных переменных различают предикаты одноместные, двухместные, трехместные и т. д. Предикаты (2) и (3) — одноместные, предикаты (1) и (4) — двухместные, предикат (5) —трехместный. Высказывания будем считать нульместными предикатами. Заменяя в одноместном предикате {2) переменную натуральными числами, будем получать высказывания: 0 есть простое число; 1 есть простое число; 2 есть простое число; 3 есть простое число и т. д. Некоторые из них являются истинными. Таким образом, данный одноместный предикат выделяет среди натуральных чисел те, при подстановке которых вместо переменной получается истинное высказывание, и его можно рассматривать как условие на значения свободной переменной, входящей в предикат. В данном случае числа, удовлетворяющие этому условию, — простые. 23
Одноместный предикат можно рассматривать как условие на объекты данного вида; двухместный — как условие на пары объектов данного вида и т. д. Предикаты можно задавать различными способами. В алгебре часто рассматривают предикаты, заданные с помощью уравнений, неравенств, а также систем уравнений или неравенств. Например, неравенство х + х'1щ>0 задает одноместный предикат, уравнение х2+у = 0 — двухместный, а система уравнений x-\-y = 0, х — y-\-z = 0 — трехместный (х9 у, z — рациональные переменные). Обозначать предикаты будем большими буквами латинского алфавита (возможно, с нижними индексами) с указанием в скобках всех свободных переменных, входящих в этот предикат. Например, А(х, #) —обозначение двухместного предиката, R (х, у, z) — трехместного и Q (%,..., хп) — обозначение n-местного предиката. В дальнейшем мы будем говорить об истинностном значении произвольного предиката на том или ином наборе входящих в него свободных переменных, понимая под этим истинностное значение высказывания, которое получается в результате замены свободных переменных соответствующими им значениями из рассматриваемого набора. Высказывание, которое получается при подстановке в предикат R(xly ..., хп) набора допустимых значений (alf ..., ап) вместо его переменных, будем обозначать R(aly ..., ап). Если это высказывание истинное (ложное), говорят, что набор значений (%, ..., ап) удовлетворяет (не удовлетворяет) предикату R(xl9 ..., хп). Отметим, что следует различать предикаты, выражающие одно и то же условие, но имеющие переменные с различными допустимыми значениями. Например, предикат, заданный уравнением 2х — 3 = 0, где х — целочисленная переменная, следует отличать от предиката, заданного тем же уравнением, если при этом х рассматривается как рациональная переменная. Первый предикат не принимает значений И ни при каких допустимых значениях х, а второй принимает значение И при допустимом значении переменной х = 3/2> Таким образом, при задании предиката нужно указывать область допустимых значений переменных этого предиката. Операции над предикатами. Предикаты, как и высказывания, принимают значения И и Л, поэтому над ними можно производить логические операции, аналогичные операциям логики высказываний. 24
Начнем с простого частного случая — одноместных предикатов, у которых области допустимых значений переменных совпадают. Образуем из двух предикатов Р (х) и Q (у) новый предикат Р(х) /\Q(y). Это предикат от двух свободных переменных х и у, и истинностное значение его на любом наборе (а, Ь) допустимых значений переменных определяется как истинностное значение высказывания Р(р)/\ /\Р(Ь). Аналогично определяются предикаты P(x)VQ(y), 1Р(х)9 P(x)-*Q(y), P(x)**Q(y). Следует различать предикаты: двухместный P(x)/\Q(y) и одноместный P(x)/\Q(x); в первый допустимые значения подставляют вместо свободных переменных х и у независимо друг от друга, а во второй — вместо единственной свободной переменной х. Над многоместными предикатами аналогично определяются операции: конъюнкция, дизъюнкция, отрицание, импликация и эквиваленция. Рассмотрим, например, случай двухместных предикатов. Пусть Р(х9 у), Q(r/, 2) — два предиката, у которых совпадают области допустимых значений переменных. Тогда Р(х, y)l\Q(y> z) есть трехместный предикат от х, у, z, истинностное значение которого на любом наборе (а, &, с) допустимых значений свободных переменных определяется как значение высказывания Р(а, b)/\Q(b, с). Заметим, что при рассмотрении операций над предикатами нужно следить, какие переменные обозначены различными буквами, а какие —одинаковыми. Рассмотрим еще несколько примеров: 1) A(x)\JB(x, у) —предикат от свободных переменных х и у\ 2) ~\A(y)/\D (z, x) — предикат от свободных переменных х, у, z\ 3) Е(х, у, z)-+F(г) —предикат от свободных переменных х, у, z. Предикат A(x)\JB(x, у) принимает значение И на наборе значений (а, &), если хотя бы одно из высказываний А (а) и В (а, Ь) будет истинно, и принимает значение Л, если оба эти высказывания ложны. Аналогично можно установить истинностные значения остальных предикатов на том или ином наборе значений свободных переменных. Логическое следствие. Равносильные предикаты. ОПРЕДЕЛЕНИЕ. Предикат А(х19 ..., хп) называется тождественно истинным, если для любого набора допу- 25
стимых значений входящих в него свободных переменных его истинностным значением является И. Примером тождественно истинного предиката может служить трехместный предикат, заданный неравенством (x+y)2 + z2^09 где х9 у9 z — рациональные переменные. Пусть А (х19..., хт) и В (yi9..., уп) — предикаты, имеющие одинаковые области допустимых значений свободных переменных. ОПРЕДЕЛЕНИЕ. Предикат В(у19 ..., уп) называется логическим следствием предиката А (х19 ..., хт)9 если предикат A(xlt ..., хт)->В(у19..., уп) является тождественно истинным. Запись А(х19 ,.., хт)\=B(yl9 ..., уп) означает, что предикат В(у19 ..., уп) есть логическое следствие предиката А(х19 ..., хт). Например, если х — целочисленная переменная, R (х) — обозначение предиката «я —четное число», Р (х) — обозначение предиката «х кратно 4», то R(x) логически следует из Р(х), т. е. Р (х) f= R (х). Здесь предикат Р (х) не следует логически из предиката R(x). Рассмотрим два я-меетных предиката А(х19 ..., хп) и В(х19 ..., хп) от одних и тех же свободных переменных. Предикат В(х19 ..., хп) будет логическим следствием предиката А (х19 ..., хп) тогда и только тогда, когда любой набор значений переменных хъ ..., хп> удовлетворяющий предикату A (х19 ..., хп)9 удовлетворяет также предикату В (Xij ..., хп). Доказательство этого утверждения предоставляется читателю. ОПРЕДЕЛЕНИЕ. Предикат B(zl9 ..., zn) называется логическим следствием предикатов Ах(х19 ..., хт), ... ..., Ak(ylt ..., yi)9 если предикат А(х19 ..., xm)/\.../\Ak(yl9 ..., yi)-+B(zl9 ..., zn) является тождественно истинным. (При этом предполагается, что все свободные переменные рассматриваемых предикатов имеют одни и те же допустимые значения.) Пример. Пусть Р(х) -— предикат «л;— четное число», Q (х) — предикат «х кратно трем», R (х) — предикат «х кратно шести». Тогда Р(х)9 Q(x)\=R(x). ОПРЕДЕЛЕНИЕ. Предикаты А(х19 ..., хт) и B(yl9 ..., уп) называются равносильными {логически эквивалентными), если предикат A (xl9 ..., хт) <-> В (у19..., уп) является тождественно истинным. Запись А (х19 ..., хт) = 26
= 5(*/i> ..., Уп) означает, что предикаты А{хъ ..., хт) и В(у±, ¦.., уп) равносильны. Легко видеть, что предикаты А{хг> ..., хт) и В(уц ..., Уп) равносильны тогда и только тогда, когда А(хг, ..., хт)Ь=В(у±, ..., Уп) и В(г/х, ..., уп)^= Нетрудно доказать, что предикаты A(xL, ..., д:т) и ?(*lf ..., хп) равносильны тогда и только тогда, когда их истинностные значения совпадают на любом наборе допустимых значений переменных х19 ..., хп. Примером равносильных предикатов могут служить предикаты, заданные уравнениями хъ — у3 == 0 и 2 (х — у) (х2+ху+у2) = 0, где х, у—рациональные переменные. ОПРЕДЕЛЕНИЕ. Предикат A(xv ..., хп) называется тождественно ложным, если его истинностным значением является Л для любого набора допустимых значений входящих в него свободных переменных. Например, тождественно ложным является предикат х-\-\=х, где л;— целочисленная переменная. ОПРЕДЕЛЕНИЕ. Предикат Л(лгх, ..., хп) называется выполнимым у если существует хотя бы один набор допустимых значений входящих в него свободных переменных, на котором его истинностным значением является И. Например, выполнимыми являются предикаты <а —простое число», «х делится на у», «х2 — 5x4-6 = 0», где х — целочисленная переменная. Из данных определений вытекает, что тождественно истинный предикат логически следует из любого предиката, а из тождественно ложного предиката логически следует любой предикат. Любой предикат либо тождественно истинен, либо выполним, либо тождественно ложен. Упражнения 1. Приведите пример таких предикатов Р (х, у, г) и R (х, у, г) где х7 yt z—натуральные переменные, чтобы один из них был логическим следствием другого. 2. Приведите примеры одно-, двух-и трехместных тождественно ложных, тождественно истинных и выполнимых (но не тождественно истинных) предикатов. 3. Постройте предикаты А (х) и В (х)У где я—целочисленная переменная, такие, что: (а) предикаты А (х) и В (х) — нетождественно истинны, a A (x)\J VВ (л;)—тождественно истинный предикат; (б) А(х) и В (х)—-выполнимые предикаты, а А (х)/\В (х)-— невыполнимый предикат. 27
§ 4. КВАНТОРЫ Рассмотрим новые операции, которые применяются к предикатам или высказываниям и дают в результате их применения предикаты или высказывания. Эти операции выражают утверждения общности или существования. Квантор общности. Пусть А (х) — предикат от одной свободной переменной х. Под выражением \/хА (х) будем подразумевать высказывание, истинное, если А (х) принимает значение И для всех допустимых значений переменной х, т. е. если предикат А (х) тождественно истинен, и ложное в противном случае. Высказывание УхА (х) уже не зависит от х. Символ Vx, приписываемый слева к предикату А (х), называется квантором общности по переменной х. Если же А есть высказывание, то УхА есть высказывание, истинное тогда и только тогда, когда А истинно. Рассмотрим теперь предикат от нескольких свободных переменных, например предикат А (х, у, z) от трех переменных. Этот предикат при произвольной замене всех свободных переменных, кроме х, их значениями b n с представляет собой предикат, зависящий только от свободной переменной х, а выражение VxA(x, 6, с) есть высказывание. Предикат УхА (х, у, z) становится высказыванием в результате задания значений всех входящих в него свободных переменных, кроме х, значит, от х не зависит. Таким образом, УхА (х, у, z) зависит от всех свободных переменных, входящих в А (х, уу г), кроме х, т. е. это двухместный предикат от у и z. Этот предикат на данном наборе значений свободных переменных Ь, с принимает значение И тогда и только тогда, когда предикат А (х, Ьу с), зависящий только от одной свободной переменной х9 является тождественно истинным. Символ \fx можно читать так: «для всякого х» или «для всех я», а запись Ух А (х, у, z) читается так: «для всякого х имеет место А (х, у, z)» или, короче, «для каждого х А (х, у, z)». Переменная ху от которой предикат VxA(x, y,,z) не зависит, называется связанной переменной (в отличие от переменных у, z, которые являются свободными). Квантор существования. Для квантора существования употребляется символ 3xt приписываемый слева к предикату или высказыванию. Пусть А (х) — предикат от одной свободной переменной х. Под выражением ЗхА(х) будем 28
подразумевать высказывание, истинное, если А (х) принимает значение И хотя бы для одного из допустимых значений переменной х, т. е. предикат А (х) является выполнимым, и ложное в противном случае. Если же Л —высказывание, то ЗхА есть высказывание, истинное тогда и только тогда, когда А истинно. Пусть теперь А(х, у, z) есть трехместный предикат. Если в этом предикате заменить все свободные переменные, кроме ху их значениями, например значениями Ь, с, то получится предикат А(х, Ь, с), зависящий только от одной свободной переменной х, а выражение ЗхА(х, 6, с) будет высказыванием. Значит, выражение ЗхА (х, у, г) есть предикат, становящийся высказыванием в результате задания значений всех свободных переменных, кроме х, и, значит, от х не зависит. Таким образом, выражение ЗхА(х, у у z) есть предикат, зависящий только от у и z, значит, применение квантора к трехместному предикату привело к двухместному предикату. Переменная х, от которой предикат ЗхА(х, у, г) не зависит, называется связанной переменной. Предикат ЗхА (х, у, z) принимает значение И на данном наборе Ь, с допустимых значений тогда и только тогда, когда одноместный предикат А (х, Ь> с) выполним. Символ Зх называется квантором существования по переменной х и читается так: «существует х такое, что». Выражение ЗхА (х, у, z) читается так: «хотя бы при одном х имеет место А(х, у, z) или «существует такое х, что А{х, у, г)». Совершенно аналогично применяются кванторы к любому предикату с большим числом переменных. В результате применения квантора к ^-местному предикату (при /г>0) получается (я — 1)-местный предикат. К одному и тому же предикату можно применять кванторы несколько раз. Например, применив к предикату А(х, у) квантор существования по х, мы получим одноместный предикат ЗхА (х, у), к которому опять можем применить квантор существования или квантор общности по переменной у. В результате получим высказывание Зу(ЗхА(х, у)) или Уу(ЗхА(х, у)). Скобки обычно опускают, получая при этом выражения ЗуЗхА (х, у) или УуЗхА (х, у). 29
Отметим, что одинаковые кванторы можно переставлять, получая при этом эквивалентные высказывания, т. е. истинные эквиваленции: ЧхУу (х, у) <+ VyVxA (х, у); ЗхЗуА(х, у)*+ЗуЗхА(х, у). В самом деле, высказывания V#V# А (х, у) и УуЧхА (х, у) оба истинны тогда и только тогда, когда предикат А (х, у) тождественно истинен. Высказывания ЗхЗу(х} у) и ЗуЗхА (х, у) оба истинны тогда и только тогда, когда А (ху У) — выполнимый предикат. Однако если к предикату применять последовательно разные кванторы, то порядок их следования существен. Например, высказывания УуЗхА(ху у) и ЗхУуА(х, у), вообще говоря, не эквивалентны, т. е. могут иметь разные истинностные значения. Применение к предикату одного или нескольких кванторов (общности, существования) называется квантифика- цией. Рассмотрим применение кванторов на примере. Пусть *+У > 0 — двухместный предикат, где х и у — целочисленные переменные. Этот предикат выражает положительность суммы двух целых чисел и представляет собой некоторое высказывание всякий раз, когда переменным х и у придаются конкретные значения. Если к этому предикату применить квантор существования по переменной у, то получится одноместный предикат 3у(х+у>0). Когда переменной х этого предиката придается какое-либо значение, то получается высказывание. Предикат Зу (х + + У > 0) истинен для тех значений переменной х, для которых существует целое число у, дающее в сумме с х положительное число. Легко убедиться, что этот предикат тождественно истинен, поэтому если применить к нему квантор общности по переменной х> то получится истинное высказывание Чх3у(х+у>0), утверждающее, что для всякого целого числа х существует некоторое целое число у такое, что их сумма положительна. Это высказывание надо отличать от высказывания 3yVx(x+y>0), 30
утверждающего, что существует целое число, сумма которого со всяким целым числом положительна. Это последнее высказывание ложно. Запись высказываний на языке логики предикатов. Рассмотрим четыре основных типа высказываний, часто встречающихся в математике. В символической записи этих высказываний (записи на языке логики предикатов) используются кванторы. Пусть А (х) — обозначение предиката «х — нечетное число», а В (х) — обозначение предиката «х — простое число», где х — целочисленная переменная. 1. Высказывание «Всякое нечетное число является простым числом» можно переформулировать следующим образом: «Для всякого х, если х — нечетное, то х — простое число». Теперь ясно, что это высказывание на языке предикатов запишется так: Vx{A(x)-+B(x)). 2. Высказывание «Никакое нечетное число не является простым числом», или «Для всякого х9 если я —нечетное, то х не является простым», в символической форме запишется так: Vx(A(x)->-\B(x)). Заметим, что истинностное значение высказывания в наших рассуждениях не играет роли. 3. Следующий тип высказывания: «Некоторые нечетные числа — простые». Суть его в том, что существует такое х, которое одновременно является и нечетным числом, и простым. Поэтому высказывание третьего типа на языке логики предикатов запишется в виде Зх(А(х)/\В(х)). Эта последняя запись не эквивалентна записи Зх(А(х)-+В(х)), которая выражает совсем не тот смысл, что исходное высказывание. 4. К четвертому типу относится высказывание «Некоторые нечетные числа не являются простыми». Это высказывание записывается так: Зх(А(х)/\1В(х)). 31
Рассмотренные примеры показывают, как любое высказывание, относящееся к одному из четырех основных типов, можно записать в символической форме. В дальнейшем иногда для высказывания «Существует положительное х такое, что А (х)» вместо символической записи 3х(х>0 /\А(х)) будет употребляться более короткая запись (Эл; > 0) А (х). Аналогично, для высказывания «Для всякого положительного х имеет место А (х)» вместо записи Чх(х>0-+А(х)) будет употребляться запись (Va:>0) А (х). Упражнения 1. Запишите на языке логики предикатов следующие высказывания: (a) Некоторые действительные числа являются рациональными, (b) Ни одно простое число не является точным квадратом. (c) Некоторые четные числа не делятся на 8. (d) Всякое число, кратное 6, делится на 3. 2. Пусть Р (х) обозначает «х—простое число», Q(x)—«х—четное число», R(x)— «х—целое число», D (х, у) —«х делит у». Сформулируйте словами следующие высказывания, записанные на языке логики предикатов. Отметьте, какие из них истинные и какие ложные: (a) VxP (х) -> 1Q (х); (b) VxClP(x)-+Vy(P{y)-»-\D(x, у))); (c) V* (Q (*) -> Vy (D (x, y)-+Q (у))); (d) Vx3y(R(x)/\R(y)-»D(x, у)); (e)VyVx(R(x)/\R(y)^D(x, у)); (I) 3xVy (R (x) /\R(y)-+D (x, y)). 3. Используя логические символы, запишите следующие высказывания: (a) Числа 5 и 12 не имеют общих делителей, отличных от + * и —1. (b) Натуральное число, делящееся на 6, делится на 2 и на 3. (c) Для любого целого числа х существует такое целое число у, что х = 2у или * = 2#+1. (d) Для любого натурального числа существует натуральное число, которое больше его. (e) Существует наименьшее натуральное число. (f) Система уравнений я+#=<), я+*/=1 не имеет решений (несовместна). (g) Не существует такого рационального числа х, что х2—2=0. (h) Для всяких целых х и г существует целое число у такое, что x+y=z. (i) Для любых двух рациональных чисел хну существует ра-- циональное число z такое, что х<г и z<y* 32
4. Выясните, имеют ли место следующие равносильности для любых предикатов Р (х, у), Q(x)> R(x). Если нет, то приведите примеры предикатов, подтверждающие это: (a) Vx3yP(x, y)=ElyVxP(x, у); (b) VxVyP(x, y)=EVyVxP(x, у); (c) Vx (R (x) V Q W) = VxR (x) V VatQ (*); (d) 3x (R (x) Д Q (x)) = 3xR (x) Д 3xQ (x); (e) VxVy (R (x) V Q 00) = VxR (x) V V*Q (x); (f) V*Q (*)->¦ 3*Я (*) == 3x (Q (x) -+ R (x)); (g) 3xR (x) V VxQ (x) == 3x (R (x) -> Q (x)); (h) Vx (R (x) ~+ Q (x)) == VxR (x) ->- VxQ (x). § 5. ПРЕДИКАТНЫЕ ФОРМУЛЫ. ЗАКОНЫ ЛОГИКИ Элементарные формулы. Пусть в нашем распоряжении имеется список переменных х, у, г, и, w, ..., х19 уъ zlt ul9 wlf ..., которые часто называют предметными переменными, так как вместо них подставляются имена определенных предметов a, by cf al9 bl9 cl9 ... Кроме того, будем считать, что для каждого натурального п имеется некоторая совокупность выражений Р (х19 х2у ..., хп)у Q(x> у у ..., t), R(yl9 ..., уп)у называемых n-местными предикатными символами. Например, Р(х)у Q (у) — одноместные предикатные символы, Р(х, У), Q(xi, *2) — двухместные, Р(ху у9 г), R(xlt x29 х3) — трехместные, Л, Ву ..., Р, Q —нульместные. Исходя из этой совокупности предикатных символов, образуем выражения, которые будем называть элементарными формулами или атомами логики предикатов. ОПРЕДЕЛЕНИЕ. Элементарной формулой называется выражение, которое получается из предикатного символа подстановкой вместо входящих в него переменных (х, у,...) каких-либо не обязательно различных предметных переменных. Например, исходя из одноместного предикатного символа Р (х)у получаем элементарные формулы (атомы), Р (х), Р (у), Р(и) и т. д.; исходя из двухместного предикатного символа Q(Xy y)y — элементарные формулы Q{xyy)y Q(yt z), Q(Uy v), Q(x, x) и т. д. Исходя из предикатного символа 33
R (лг, у у z) — элементарные формулы R (х, у, г), R (у, г, х), R(uy v, w), R(x, x, x)y R(x, у у х) и т. д. Исходные нуль- местные предикатные символы также попадают в совокупность элементарных формул. Элементарные формулы образуют более обширную совокупность, чем исходная совокупность предикатных символов, так как предметные переменные, входящие в элементарные формулы, не обязаны быть различными. Предикатные формулы. Предикатные формулы (формулы логики предикатов) вводятся следующим образом: (a) всякая элементарная формула есть предикатная формула: (b) если А и /? — предикатные формулы, то (~| А), (А/\В), (А\/В)у (А-+В) и (А<->В) суть предикатные формулы. Если А — предикатная формула и х — предметная переменная, то (УхА) и (ЗхА) суть предикатные формулы; (c) выражение есть предикатная формула в том случае, если оно есть элементарная формула или построено из элементарных формул последовательным применением правил а) и Ь). Предикатные формулы, не являющиеся элементарными формулами, называются составными предикатными формулами. Для обозначения формул логики предикатов будем употреблять большие буквы латинского алфавита, напечатанные жирным шрифтом: Л, В9 С, ...,/?, Р, Q и т. д. В формулах (УхА) и (ЗхА) формула А называется об- ластью действия кванторов У/х и Зх соответственно. Обычно принимают соглашения об опускании скобок. Кроме того, считают, что кванторы связывают сильнее остальных операций. Поэтому формулу (\fxP(x))-*R(Xy у) можно записать так: VxP(x)-+R(Xy у). ОПРЕДЕЛЕНИЕ. Предикатная формула называется общезначимой у если после замены входящих в нее элементарных формул любыми предикатами получается тождественно истинный предикат. ОПРЕДЕЛЕНИЕ. Предикатные формулы называются равносильными у если после замены входящих в них элементарных формул любыми предикатами получаются равносильные предикаты. Записывать равносильность формул А и В будем так: А = В. Легко доказать, что предикатная формула А<^> В общезначима тогда и только тогда, когда А и В— равносильные предикатные формулы. 34
Целый ряд равносильностей логики предикатов можно получить из равносильностей логики высказываний. Например, равносильностям логики высказываний А[\В=гВ\А\ НА —А; 1(АУВ)^-]А/\1В; соответствуют равносильности логики предикатов А1\В = В[\А\ ЦА*=А; 1(А\/В)шм-]А/\-\В; Ч(АЛВ)ш*1АУ1В. Аналогично, тождественно истинные формулы логики высказываний служат источником для получения общезначимых формул логики предикатов. Например, тавтологии А V "1А соответствует общезначимая формула логики предикатов А V "1 А. Действительно, подставив в любую конкретную формулу А вместо входящих в нее предикатных символов произвольные предикаты, получим некоторый предикат Р(хъ ..., хп). При этом формула А V "1 А превратится в предикат Р (х19 ..., хп) V 1Р (*i» • • • > *«)» который принимает значение И при любых допустимых значениях переменных (в силу закона исключенного третьего в логике высказываний). Рассуждая так же, можно обосновать остальные общезначимые формулы и равносильности логики предикатов, перенесенные из логики высказываний. Кроме общезначимых формул и равносильностей логики предикатов, получаемых таким образом, существуют специфические общезначимые формулы и равносильности, связанные с применением кванторов. Некоторые из них мы рассмотрим. Законы логики предикатов. Рассмотрим ряд равносильностей, играющих большую роль в логике предикатов. Строгое их доказательство проводинь не будем. Равносильность (1) -\(УхА(х))втЗхС[А(х)) соответствует обычному пониманию смысла кванторов. Высказывания «Неверно, что всякий объект х удовлетворяет 35
условию Л (л:)» и «Существует объект х, не удовлетворяющий условию А(х)» имеют одинаковый смысл, что и отражает равносильность (1). Равносильность (2) 1(ЭхА(х))=*ЧхС]А(х)) соответствует тому, что высказывание «Неверно, что существует объект х удовлетворяющий условию А(х)» обычно понимают в том же смысле, что и высказывание «Ни один объект х не удовлетворяет условию А(х)». Применяя отрицание к обеим частям (1) и (2) и учитывая закон двойного отрицания, получаем еще две равносильности: (3) )txA(x)sa-\(3x-}A(x))\ (4) 3xA(x) = -](Vx-\A(x))\ они показывают, что квантор существования можно выразить через квантор общности и наоборот. Следующие две равносильности выражают свойства дистрибутивности квантора общности относительно конъюнкции и квантора существования относительно дизъюнкции: (5) ЗхА (х) V ЗхВ (х) S3 Зх (А (х) V В (*)); (6) ЧхА (х) Д ЧхВ (х) = Ух (А (х) Д В (*)). С истинностью этих равносильностей находятся в соответствии следующие содержательные рассуждения. Левая часть (5) принимает значение И в том и только в том случае, когда или А(х)9 или В(х) принимает значение И хотя бы для одного допустимого значения х, т. е. когда по крайней мере один из предикатов А(х) и В (х) выполним. Но как раз в этом и только в этом случае будет выполним предикат А{х)\1 В (х), т. е. будет истинным высказывание Зх(А (х) \/ В \х)). Аналогичные рассуждения можно провести относительно равносильности (6). Квантор существования не дистрибутивен относительно конъюнкции, т. е. формулы Зх(А (х) Д В(х)) и ЗхА(х) /\ Д ЗхВ (х) не равносильны. Нетрудно подобрать пример двух выполнимых предикатов, конъюнкция которых невыполнима. Для таких предикатов первая формула принимает значение Л, а вторая —И. Также не равносильны формулы Ух (А (х) V В(х)) и У/хА (х) V ЧхВ(х), т. е. квантор общности не дистрибутивен относительно дизъюнкции. 36
Каждой равносильности логики предикатов соответствует общезначимая формула. Например, общезначимыми будут следующие формулы (их часто называют законами логики): (1) -]С/хА(х))«+ЗхС1А(х)); (2) 1 (ЗхА (х)) <+Чх(-]А (*)); (3) ЧхА(х)++-\(Зх1А(х)); (4) ЗхА(х)+>-](\/х^А(х)); (5) ЗхА (х) V ЗхВ (х) <-> Зх (А (х) V В(х)); (6) ЧхА (х) Д Vx# (л;) <-> V* (А (х) Д Я (*)). В логике высказываний существует общий метод, позволяющий за конечное число шагов выяснить для любой пропозициональной формулы, является ли она тождественно истинной (метод истинностных таблиц). В логике предикатов не существует такого общего метода, по которому за конечное число шагов для любой предикатной формулы можно решить, общезначима она или нет. Для некоторых видов формул такие методы существуют. Упражнения 1. Выясните, являются ли общезначимыми следующие формулы (если нет, то подтвердите это примерами): (a) 3xP(x)-+VxP(x); (b) VxP(x)^P(y); (c) P(y)-+VxP(x); (d) 3xQ(x)-+Q(y); (e) Vx3yQ (x, y) -> lyVxQ (x, y)\ (f) VxVyVz (P (x, У) hP (У> z)^P (x, z)); (g) VxP (x)\JVxQ (x) ~ Зх (Р (x) Д Q (*)); (h) Ух (P (x) — Q (x)) -> (3xP (x) ~ 3xQ (x); (i) 3xP (x) Д 3xQ (x) -> 3x (P (x) Д Q (x)); (j) Vx (P (x) V Q (x)) ->• VxP (x) V VxQ (x). 2. Обоснуйте общезначимость следующих формул: (a) VxP (x) V VxQ (x) -+ Vx (P (x) V Q (x)); (b) 3x (P (x) Л Q (x)) ->• 3xP (x) Д 3xQ (x); (c) Vx(P(x)-+Q(x))-+(VxP(x)^VxQ(x));} (d) V* (P (x) ~ Q (x)) -> (VxP (x) ~ VxQ (x)); (e) V* (P (x) -+ Q (x)) -+ (3xP (x) -> 3xQ (x)); 37
(f) V*Q(x)-*-3a;Q(*); (g) V*P (*)-*!> fo); (h) Q(iO->3xQ(x); (i) 11 VxP (x, y) -v VxP (At, y); (j) VxVyP(x, y)~VyVxP(x, y); (k) 3*3(//J(*, г/) —Э«/За:Л(л;, у); (1) 3*P (*) Л 3*Q (*) - ЭхЭу (P (x) Л Q Ш (m) Va;/? (*) V V*Q (*) - V*Vy (P (a:) V 0 to)); (n) Va;Q(a;, z)~VyQ(y, г); (о) ЗхР(х, z)~3yP(y, z); (p) Va; "1P (x) V VxQ (x)— ЗхР (ж) -v VxQ (л:); (r) 3*(P(a;)-?-Q(a:)).~Va;P(a:)-*.3a:Q(a:).
Глава вторая МНОЖЕСТВА И ОТНОШЕНИЯ § 1. МНОЖЕСТВА Понятие множества. Понятие множества — одно из основных понятий математики. Под множеством понимают совокупность объектов (предметов или понятий), которая рассматривается как одно целое. Например, можно говорить о множестве всех натуральных чисел, о множестве букв на данной странице, о множестве корней данного уравнения и т. п. Объекты, входящие в состав множества, называются его элементами. Понятие множества принимается как исходное, первичное, т.е. не сводимое к другим понятиям. Утверждения «Объект а есть элемент множества Л», «Объект а принадлежит множеству Л», которые имеют один и тот же смысл, сокращенно записывают в виде Если элемент а не принадлежит множеству Л, то пишут аф А. Символ е называется знаком принадлежности. ОПРЕДЕЛЕНИЕ. Два множества А и В называют разными и пишут Л = В, если Л и В содержат одни и те же элементы. Таким образом, множества Ли В равны, если для любого х х^А тогда и только тогда, когда хеВ. В связи с этим доказательство равенства двух данных множеств Л и В обычно состоит из доказательства двух утверждений: 1) для любого х, если х^ Л, то xgB; 2) для любого х, если х^В, то яе Л. Часто множество обозначается его элементами, заключенными в фигурные скобки. Так, например, множество, состоящее из элементов а, Ь, с, обозначается {а, й, с]. Множество, состоящее из элементов аъ а2> ..., ап, обозначается {ах, а2, ..., ап]. Множества {1, 2, 3,} и {3,1, 2, 1} равны, так как каждый элемент первого множества принадлежит второму множе- 39
ству и наоборот. Они оба состоят из трех элементов. Обычно используют запись {1, 2; 3}. Множество может состоять из одного элемента. Необходимо различать элемент а и множество {а}, содержащее только один элемент а, хотя бы потому, что допускаются множества, элементы которых сами суть множества. Например, множество а = {2, 1} состоит из двух элементов 2 и 1; множество {а} состоит из одного элемента а, который сам является двухэлементным множеством. Подмножества. ОПРЕДЕЛЕНИЕ. Множество А называется подмножеством множества В, если каждый элемент множества А принадлежит множеству В. Если А есть подмножество множества В, то говорят также, что А содержится в Б, и пишут AczB. Символ cz называется знаком включения. Согласно определению, А cz В <-> (для каждого х, xg^->xeB). Множество А называется собственным подмножеством множества J3, если AczB и АФВ. Запись АфВ означает, что А является собственным подмножеством множества В. Отметим свойства отношения включения, легко следующие из определения: (a) отношение включения рефлексивно, т.е. А си А для каждого множества А; (b) отношение включения транзитивно, т. е. для любых множеств Л, Б, С из А а В и В cz С следует А cz С; (c) отношение включения антисимметрично, т. е. для любых множеств А, В, С из ЛсВиВсЛ следует А =В. Из свойства (с) следует, что для доказательства равенства множеств А и В достаточно доказать, что A cz В и В а А, т.е. (А = В)+*(Ас=:В /\BczA). В теории множеств принимается следующий принцип выделения подмножеств данного множества с помощью одноместных предикатов: для любого множества А и одноместного предиката Р(х), имеющего смысл для всех элементов множества А (т.е. такого, что для любого х из А Р(х) либо истинно, либо ложно), существует множество, состоящее в точности из тех элементов множества А, для которых Р (х) истинно. 40
Это множество обозначают так: {х е А | Р (х) истинно}, или, короче, \х е А \ Р (х)}. Последняя запись читается так: «множествотаких х из Л, что Р(х) истинно» или «множество таких х кз Л, что верно P(x)». Иногда для обозначения этого же множества используется и такая запись: {х\х<е=А /\Р(х)}. Если два одноместных предиката Р(х) и Q(x) равносильны, то согласно определению равенства множеств они определяют одно и то же подмножество множества Л, т. е. из равносильности Р(x) = Q(x) следует равенство {х е= Л | Р (х)} = {х <= Л | Q (*)}. Пустое множество. Введем новое важное понятие. ОПРЕДЕЛЕНИЕ. Множество, не содержащее ни одного элемента, называется пустым множествам. Таким образом, множество Л называют пустым, если для любого х хфА. Такое множество единственно. В самом деле, если С и D —пустые множества, то для каждого х верна эквивалентность х^С^jcgD, так как оба ее члена ложны. Согласно определению равенства множеств отсюда следует, что C = D. Единственное пустое множество обозначается символом ф. Таким образом, для каждого х хф ф. ПРЕДЛОЖЕНИЕ. 1.1. Пустое множество является подмножеством любого множества. Доказательство. В самом деле, пусть Л —любое множество. Для каждого х верна импликация х^ф -+¦ ->х^. Л, так как импликация с ложной посылкой истинна. Следовательно, фсЛ. D Операции над множествами. Рассмотрим операции над множествами, с помощью которых можно получать из любых двух множеств новые множества. ОПРЕДЕЛЕНИЕ. Объединением множеств А и В называется множество, состоящее из тех и только тех элементов, которые принадлежат хотя бы одному из множеств Л и В. Такое множество всегда существует. Из определения равенства двух множеств следует, что для любых множеств Л и В существует единственное множество, являющееся их объединением. В самом деле, если бы существовали два таких множества С и D, то они со- 41
держали бы одни и те же элементы и поэтому совпадали. Это единственное множество, объединение множеств А к В, обозначается Ли В. Таким образом, по определению, A U В = {х | х <= Л V * е В}. Следовательно, для произвольного х верна эквивалентность х е A U В <-> х еЛ V* ^ В. Из определения объединения множеств следует также, что Л с: Л U В и В с: Л U В. Пример. Если Л = {1, 9, 18} и ? = {1, 5, 9}, то ЛиЯ = {1, 5, 9, 18}. ОПРЕДЕЛЕНИЕ. Пересечением множеств А м В называется множество, состоящее из тех и только тех элементов, которые принадлежат как множеству Л, так и множеству В. Такое множество всегда существует. Для любых двух множеств Л и В существует единственное множество, являющееся их пересечением. В самом деле, если бы существовали два таких множества С и D, то они содержали бы одни и те же элементы и поэтому совпадали. Пересечение множеств Л и В обозначается А (] В. Таким образом, по определению, А()В = {х\хе=А/\хеЕВ}. Следовательно, для произвольного х верна эквивалентность х^А(]В<^х^А/\х^В. Из определения пересечения множеств следует, что Af\BczA и А [\BczB. Пример. Если Л = {1/2, 2/3, 5/6}, В = {1, 3/2, 1/2}, тоЛГ)В = {1/2}. ОПРЕДЕЛЕНИЕ. Разностью множеств А и В называется множество, элементами которого являются элементы множества Л, не принадлежащие множеству В, и только они. Для любых множеств Л и В всегда существует такое множество, и притом единственное. Разность множеств Л и В обозначается А\В. Таким образом, по определению, А\В = {х\хе=А/\х<=? в]. Следовательно, для любого х верна эквивалентность х ^ А\В <+ х ^ А /\х <=? В. 42
Пример. Если Л = {6, 9, 12, 13}, В = {6, 9, 10}, то А\В = {12, 13}. ТЕОРЕМА 1.2. Для любых множеств An В эквивалентны следующие три соотношения: (a) AczB; (b) А\]В = В; (с) А(]В = А. Доказательство. (а)~>(Ь). Каждый элемент множества A U В принадлежит А или В и в силу (а) является элементом множества В, т. е. A[)BczB. Кроме того, В cz A U В; следовательно, A (J В = В; (а)-^(с). В силу (а) каждый элемент множества А есть общий элемент А и В, т. е. АаА[\В. Кроме того, А П В а А; следовательно, А П В = А; (Ь)->-(с). Имеем Л си Л US и в силу (b) A\JBczB, поэтому AczB. Поскольку (а)-^(с), то следует равенство (с); (с)-> (а). В силу (с) Л с: Л П S. Кроме того, A(]BczB; следовательно, AczB. ? Основные свойства операций над множествами. Операции объединения и пересечения над множествами обладают рядом свойств. Мы рассмотрим основные, наиболее важные свойства этих операций. ТЕОРЕМА 1.3. Для любых множеств А, В и С имеем: (1) Л11Л=Л —идемпотентность объединения; (2) Л П Л = Л — идемпотентность пере- сечения; (3) А[)В = В[]А — коммутативность объединения; (4) А[\В = В{\А — коммутативность пересечения; (5) A U (В U Q = (Л U В) (J С — ассоциативность объединения; (6) Л П 03 П С) = (Л П 5) П С — ассоциативность пересечения; (7) Л (J (5 П С) = (Л U 5) П (A U С) — дистрибутивность объединения относительно пересечения; (8) Л П (5 U С) = (Л П 5) U (Л П С) — дистрибутивность пересечения относительно объединения. 43
Доказательство. Первые четыре свойства, свойства идемпотентности и коммутативности, легко следуют из определения операций объединения и пересечения. Для того чтобы доказать свойство ассоциативности (5), достаточно заметить, что Л U (В [] С) есть множество элементов, принадлежащих множеству Л, или множеству В, или множеству С, и множество (Л [} В) U С состоит из тех же элементов. Аналогично доказывается свойство (6). Докажем свойство (7). Пусть D = A\J(B[\C), E = (A[)B)(](A[jC). Надо доказать, что множества D и Е равны, т. е. (а) если xgD, то хеЕ\ (Ь) если х^Е, то ^gD. Пусть х е A U (В П С). Тогда возможны два случая: (ах) х <= А и (а2) * е В П С. В случае (ах) д;еЛиб и х <= Л U С; следовательно, хеВ. В случае (аа) ^gB hxgC, так что я е Л U 5 и * е Л (J С; следовательно, х^Е. Предположим теперь, что х^Е, т. е. х<=(ЛиВ)П П (Л U С), тогда При этом если л: <=? Л, то л; ^ В hxgC, так чтб л: е В П С; следовательно, я е Л U (В П С). Если же^еЛ, то х <= Л U LKBflQf т- е- x^D. Из (а) и (Ь) следует равенство (5). Свойство дистрибутивности (8) доказывается аналогично. ? Универсальное множество. Дополнение множества. Во многих приложениях теории множеств рассматриваются только такие множества, которые содержатся в некотором фиксированном множестве. Например, в геометрии мы имеем дело с множествами точек данного пространства, в элементарной арифметике —с подмножествами множества всех целых чисел. Всюду ниже буквы Л, В, ... обозначают множества, содержащиеся в некотором фиксированном множестве, которое назовем универсальным и будем обозначать через U. Таким образом, мы считаем, что для каждого рассматриваемого множества Л имеем AaU, Следовательно, для каждого множества Л (1) A[)U = U, A(]U = A. 44
ОПРЕДЕЛЕНИЕ. Множество U\A называется дополнением множества А и обозначается через А' (или через Л). Дополнение U\A' множества А' обозначается через А" (или А). Нетрудно видеть, что (2) А{)А' = и,А()А' = ф. ПРЕДЛОЖЕНИЕ 1.4. Для любого множества А (3) А" = А (закон инволюции). Доказательство предоставляется провести читателю. ПРЕДЛОЖЕНИЕ 1.5. Если А а В, то В' а А'. Доказательство. Пусть А а В. Надо доказать, что для всякого х из U, если #е6', то х^А'. Действительно, если х е В', то х ф В. Учитывая условие А а В, мы заключаем, что хфА и xg/1'. D ТЕОРЕМА 1.6. Имеют место следующие тождества: (4) (А\]Ву = А'[\В'\ - ЛЛ rv А' д/( (законы де Моргана для множеств). Доказательство. Покажем, что для всякого х (6) х€Е{А[}В)'++хе=А'Г\В'. В самом деле, х ^ (Л [} В)' тогда и только тогда, когда хфА[)В. Но л; ^ Л Q ? в том и только в том случае, когда хф А и хфВ, т. е. когда х^ А' и х^В' и, значит, х е= Л' П 5'. Тождество (5) можно доказать следующим образомс Используя тождество (4) и закон инволюции, получим (А'[)В')' = А"(\ВГ = А(\В. Следовательно, (А{)ВУ=(А'[)ВУ = А'[)В'9 т. е. справедливо тождество (5). П Диаграммы Эйлера — Венна. Для графического изображения множеств и их свойств используются так называемые диаграммы Эйлера, которые называются 1акже диаграммами Венна. Множество изображается кругом (или другой связной фигурой) на плоскости и мыслится как множество точек круга. Если изобразить кругами множества Л и Б, то множества А{\В и А\]В изобра- 45
зятся заштрихованными областями (рис. 1 и 2). Множества А\В и В\А изобразятся соответственно на диаграммах (рис. 3 и 4). Отношение A cz В изображено на рис. 5, Af\B ДиВ А\В Рис. 1 Рис. 2 Рис. 3 Рис. 4 Рис. 5 Универсальное множество U изображается множеством точек некоторого прямоугольника. Дополнение А1 множества А до U изображается на рис. 6 той (заштрихованной) Рис. 6 Рис. 7 частью прямоугольника, которая находится за пределами круга, изображающего множество Л. Равенство Л\Б= =А П В' иллюстрируется на рис. 7. 46
Упражнения 1. Докажите следующие тождества: (a) А\В = Л п В'; (d) Б П (Л\В) = ф; (b) Л\(Л\Б) = Л П В; (е) Л\(Б U С) = (Л\Б) П (А\С); (c) Б U (Л\Б) = Л U В; (/) Л\(В П С) = (Л \В) U (А\С). Изобразите их с помощью диаграмм Эйлера —Венна. 2. Покажите на примерах, что не всегда верны следующие формулы: (а) (ЛиВ)\В = Л; (Ь) (Л\Б)1|В = Л. 3. Докажите следующие утверждения: (a) ВаА-+(А\В){)В = А; (b) ЛсБ = ЛПВ = Л; (c) Лс=Б = ЛиВ = Л; (d) А()В = ф->(А{)В)\В = А; (е)ЛсВч. А\С с В\С; (f) A czB-+A{\CczB(\C; (g) AczB-^A\jCczB[)C; (h) 5сЛДС = Л\В->Л = ВиС; (i) AgLB/\B(]C = 0-^A{]CgLB[jC; (k) С = Л\В->ВПС=©; (1) Л <? 5 -> Л\В ф ф; (m) ВПС=фЛ^ПС^0->Л\5^ф; (п) ЛсС->Ли(ВПС) = (Л11?)ПС. Проиллюстрируйте их с помощью диаграмм Эйлера —Венна. 4. Докажите следующие равносильности: (а) ЛиВ = ф = Л = (МВ = 0; -<b) A\B = A=sB\A = B; (c) А\}В = А\В=В = ф; (d) Л\Б = ЛПВ = Л = ф; (e) ЛиВ с С == Л сгСДВсС; (f) Cc ЛПВ=Сс ЛДСсБ; (g) ЛсВиС = Л\Вс:С; (h) ЛпВ = ЛиВ = Л = В; <i) ЛсВсС = ЛиВ = ВПС. 5. Пусть Л и Б—конечные множества. Докажите, что п(А{\В) = = п (Л) + л (В) —-л (Л П Б), где л (М)—число элементов множества М. 6. Докажите, что множество, состоящее из п элементов, имеет 2п различных подмножеств). 7. Покажите, что при т<:п множество, состоящее из п элемен- п\ . тов, имеет у——гг-—гг различных /я-элементных подмножеств (где т! = Ь2 ... /п), 47
8. Пусть А (х) и В (л:)—одноместные предикаты и (/—область допустимых значений переменной х. Докажите, что тогда {х\А(х)\/В(х)} = {х\А(х)}\}{х\В(х)}; {х\А(х)/\В(х)} = {х\А(х)}(){х\В{х)}; {х\-\А (х)} = U\{x | А (х)\ = {х\А (*)}'; {х\А(х)^В(х)} = {х\А(х)}'[){х\В(х)}; {х\А{х)~В(х)} = ({х\А(х)}'[){х\В(х)У){)({х\А{х)}[){х\В(х)}). § 2. БИНАРНЫЕ ОТНОШЕНИЯ Прямое произведение множеств. Пусть даны какие- нибудь объекты а и Ъ. Если афЪ, то множество {а, Ь} называется неупорядоченной парой объектов а и Ъ. Отметим, что всегда {a, b} = {b, a}. Введем новое исходное понятие — понятие упорядоченной пары. Любым двум объектам а и Ь поставим в соответствие новый объект —их упорядоченную пару (а, Ь). ОПРЕДЕЛЕНИЕ. Упорядоченные пары (а, Ь) и (с, d) называют равными и пишут (а, Ь) = (с, d) в том и только в том случае, когда а = с и b = d. В частности, (a, b) = (b, а) в том и только в том случае, когда а = Ь. В дальнейшем часто будем говорить «пара (а, Ь>» вместо «упорядоченная пара <а, &)». Элемент а называется первым элементом пары (а, 6), а Ь —вторым элементом пары. ОПРЕДЕЛЕНИЕ. Прямым произведением множеств А и В называется множество всех упорядоченных пар (я, у) таких, что х^А и у^В. Это множество обозначается Ах В. Таким образом, А х В = {(х, у)\х(=А/\уеЕ В}. Пример. Пусть Л = {0, 1, 2} и В = {3, 5}. Тогда имеем: ЛхВ = {<0, 3>, <0, 5>, <1, 3>, <1, 5>, (2, 3>, <2, 5>}; ВхЛ = {<3, 0>, <5, 0), <3, 1), <5, 1>, <3, 2>, <5, 3>}. ЛхЛ = {<0, 0>, <0, 1), <0, 2>, <1, 1>, <1, 0>, <1, 2>, <2, 0>, <2, 1>, <2, 2»; J5x5 = {<3, 3>, <3, 5>, <5, 5>, <5, 3>}. 48
Обобщением понятия упорядоченной пары является понятие кортежа (упорядоченного набора) п объектов. Кортеж п объектов я1э..., ап обозначается через (al9..., ал>. ОПРЕДЕЛЕНИЕ. Два кортежа (а19..., ап) и фъ ..., Ьп) называют равными и пишут (а19 ..., an) = (bl9 ..., bn) в том и только в том случае, когда аг = Ь19 ..., ап = Ьп. Кортежи трех объектов называют также упорядоченными тройками. Прямым произведением трех множеств А, В и С называется множество всех таких упорядоченных троек (х9 уj z), что х еА, у ^В и z ^ С. Это множество обозначается через АхВхС; таким образом, АхВхС = {(х9 у, z)\x^A, y^B, 3GC}. Пусть А —непустое множество и п — целое положительное число. Через Ап обозначается множество всех кортежей (х19 ..., хп) элементов из А, т. е. Ап = {(х19 ..., *„>|*ie A, ..., л:л^А}. При этом будем считать, что А1 = А. Множество Ап называется /г-кратным прямым произведением множества А или п-й степенью множества А. В частности, А2 = АхА и Л3= Ах А х А. ОПРЕДЕЛЕНИЕ. Прямым произведением п множеств А19 ..., А„ называется множество всех кортежей длины п (х19 ..., *„> таких, что ^G^-.^e An. Прямое произведение множеств А19...9Ап обозначается символом А1X А2 X... X Ап\ таким образом, А1 X... X Ап = \\#i> ...» а:л) I #! ее А1? ..., хл е= Ап). Бинарные отношения. Одним из основных является понятие бинарного отношения. ОПРЕДЕЛЕНИЕ. Бинарным отношением называется любое множество упорядоченных пар. Из определения следует, что бинарным отношением является любое подмножество прямого произведения двух множеств. Если R — бинарное отношение и (х9 у) е/?, то говорят, что х и у связаны отношением R, или что элемент х находится в отношении R к у9 или что для х и у выполняется отношение R. Вместо записи (х9 y)^R часто используют более простую xRy9 49
которая также является записью утверждения «элементы х и у связаны отношением R». ОПРЕДЕЛЕНИЕ. Множество всех первых элементов пар из R называется областью определения отношения R и обозначается DomR: DomR = {x\3y((x, y)<=R)}. Множество всех вторых элементов пар из R называется областью значений отношения R и обозначается ImR: ImR = {y\3x((x, y)z=R)}. ОПРЕДЕЛЕНИЕ. Множество DomR\J ImR называется областью отношения R. Легко видеть, что RczDomRxJmR. Если R а АхВ, то говорят, что R есть отношение между элементами множеств А и В или что R определено на паре множеств А и В. Если АаС и В aD, то RaCxD, т. е. R есть также отношение между элементами множеств С и D. Если RczAxB, то Dom RczAn ImR а В. Таким образом, каждое отношение R является отношением между элементами множеств DomR и ImR. ОПРЕДЕЛЕНИЕ. Если RczAxA, то говорят, что R есть бинарное отношение на множестве А. Ясно, что каждое бинарное отношение R является отношением на области отношения R. ОПРЕДЕЛЕНИЕ. Бинарные отношения R u S называются равными, если для любых х9 у (х, у) ^R тогда и только тогда, когда (х, у) е S, т. е. если R и 5 равны как множества. ОПРЕДЕЛЕНИЕ. Пусть R и S — бинарные отношения. Множество всех пар (х, у) таких, что для некоторого z (х, z)gS и (z, у) е/?, называется композицией (или суперпозицией) отношений S и R и обозначается через R-S. По определению, имеем R-S = {(x, y)\3z(xSz/\zRy)}. Пример. EcotS = {<1,2>, <2, 4), <3, 6>}, /? = {<1, 3), <2, 6>, <3, 9>, <4, 12>}, то R*S = {(1, 6>, <2,12>}. ОПРЕДЕЛЕНИЕ. Инверсией бинарного отношения R называется множество всех упорядоченных пар (х, у) таких, что (у 9 х) е R. 50
Инверсия отношения R обозначается через R^. Таким образом, по определению, *" = {<*. У>|<У.*> е= Я}. Пример. Если R = {(29 5>, <8, 15>, <4, 1>}, то#^ = = {<5, 2>, <15, 8>, <1, 4>). ПРЕДЛОЖЕНИЕ 2.1. Если R —любое бинарное отношение, то (a) Dom (R^) = lmR, (b) Im (R^) = Dom R, (c) (Ru)^ = R, т. е. если R^ — инверсия R, то R — инверсия R^. Это предложение непосредственно следует из определения инверсии ЯУ отношения R. ОПРЕДЕЛЕНИЕ. Отношение R называется ограничением отношения S, a S — расширением R, если RczS, ОПРЕДЕЛЕНИЕ. Бинарное отношение R называется ограничением отношения S множеством Л, если R= = {AxA)(}S. Если бинарное отношение R является ограничением отношения S множеством А, то R — ограничение S и DomRczA. ТЕОРЕМА 2.2. Композиция отношений обладает свойством ассоциативности, т. е. для любых бинарных отношений R, S, Т (1) (R'S)*T = R*(S-T). Доказательство. Для любых х и у имеем х (R . S) * Ту <-> 3 z (xTz/\zR - Sy) <+3z3t (xTzfrzSt/\tRy) <+3t3z (xTz/\zSt/\tRy) «-> 3 / [3 z (xTz/\zSt)/\tRy] <+3t[xS-Tt/\tRy] *+xR'(S*T)y. Следовательно, равенство (1) верно для любых бинарных отношений R, S и Т. ? ТЕОРЕМА 2.3. Для любых бинарных отношений R и 5 Доказательство. Для любых х и у имеем xiR-S^y^yR-Sx +*3z(ySz/\zRx) ^3z(xRKjz/\zSKJy) «*xS^-R^y. 51
Следовательно, (R°S)^ = SK~J'*R^ для любых бинарных отношений R и S. ? я-местные отношения. Обобщением понятия бинарного отношения является понятие п-местного отношения. ОПРЕДЕЛЕНИЕ, п-местным отношением (п^1) называется любое множество кортежей длины п (т. е. любое множество упорядоченных наборов п объектов). Таким образом, я-местным отношением является всякое подмножество прямого произведения п множеств. Двухместное отношение называют также бинарным отношением, а трехместное — тернарным отношением. Тернарное отношение — это любое множество упорядоченных троек, т. е. всякое подмножество прямого произведения трех множеств. ОПРЕДЕЛЕНИЕ. Пусть Ап есть п-я степень непустого множества А, п Ss= 1. Любое подмножество множества Ап называется п-местным отношением на множестве А, а число п —рангом отношения. В частности, одноместным отношением на А является любое подмножество множества Л; трехместным (тернарным) отношением на А будет всякое подмножество множества Л3, т. е. любое множество упорядоченных троек элементов множества Л. Пусть А(хъ ..., ^ — произвольный n-местный предикат со свободными переменными xlf ..., хп. С ним можно связать я-местное отношение # = {<*!> • ••> Xn)\A(xlt ...xn)}. Отношение R называется графиком предиката А (хъ ... ..., хп). Представление бинарных отношений графами. Графом называется фигура на плоскости, состоящая из конечного числа точек —вершин графа —и линий, соединяющих некоторые из вершин. Линия, соединяющая какие-либо две вершины графа, называется ребром графа. Линии могут быть прямыми или кривыми. Точки пересечения некоторых ребер графа могут не являться вершинами графа. Граф, на котором указаны стрелками направления всех его ребер, называется ориентированным. Существует простой способ представления бинарных отношений на конечных множествах ориентированными графами. Пусть Л —непустое конечное множество я R — бинарное отношение на Л, т. е. RaAxA. Представим элементы множества Л точками на плоскости. Каждой паре 52
{a, b) из R при афЬ поставим в соответствие ориентированное ребро (рис. 8), идущее от точки а к точке Ъ. Паре <а, а) из R поставим в соответствие петлю (рис. 9) с фиксированным направлением обхода (например, всегда против часовой стрелки). О Рис. 8 Рис. 9 Таким образом, бинарному отношению R ставится в соответствие следующая геометрическая фигура: точки плоскости, представляющие элементы множества Dom R U Ulm#, и ориентированные ребра — каждой паре (а, Ъ) из R ставится в соответствие ориентированное ребро, идущее от точки а к точке Ь, или петля, если а = Ь. Такая геометрическая фигура называется ориентированным графом отношения R или просто графом отношения R. Если в отношение R входит как пара (а, Ъ), так и пара (Ь, а), то в графе отношения R есть два ребра, с вершинами а и Ь, ориентированные в противоположные стороны. В этом случае два ребра заменяются одним ребром с двумя стрелками (рис. 10). Ребро с двумя стрелками называется неориентированным. Qd а Рис. 10 Рис. 11 Каждое бинарное отношение на конечном множеств? можно представить ориентированным графом. С другой стороны, каждый ориентированный граф представляет бинарное отношение на множестве его вершин. Пример. На рис. 11 изображен граф отношения R = {(a, b), (b, c>, <d, d>, (e, a>, (e, e)}. Упражнения 1. Покажите, что для любых элементов а, 6, с, d (не обязательно различных) {а, Ь} = {с, d} тогда и только тогда, когда а=с и b = d или a=d и Ь=с. 53
2. Покажите, что для любых элементов а, Ь, с, d {{a}, {а, Ь}} = {{с}, {с, d}} тогда и только тогда, когда а=с и b = d. Замечание. В силу этого упорядоченную пару (а, Ь) часто определяют в теоретико-множественных терминах как множество {{а\, {а, Ь}}. 3. Покажите, что {{а, 6), c) = ((d, e), f) тогда и только тогда, когда a = d, b = е, c—f. 4. Докажите, что для любых множеств А, В, С, D: (a) Dom (Л х В) = А; (b) 1т(АхВ) = В; (c) (At)B)x(C(]D) = (AxC)()(BxD); (d) (АПВ)хС = (ЛхС)П(ВхС); (e) Ах(В(]С) = (АхВ)[)(АхС); (f) (БиС)хЛ = (БхЛ)и(СхЛ); (g) (ЛХВ = 0) = (Л = фуВ=Ф); (h) (Л\В)хС = (ЛхС)\(БхС). 5. Покажите на примерах, что приведенные ниже равенства верны не для любых множеств Л, В и С: (a) АхВ = ВхА; (b) Ах(ВхС) = (АхВ)хС. 6. Докажите, что для любых бинарных отношений Rt S, Г: (a) (Dom (R) = ф) == (R « 0) = (Im («) = 0); (b) Dom(/^) = Im(#); (c) Im(#^) = Dom(/^); (d) (fiv^=R; (e) (Ro5)^=5^o^; (f) Dom (RoS)c DomS; (g) Im (# о S) cz Im ?. 7. Покажите на примере, что композиция бинарных отношений не коммутативна. 8. Найдите Dom (R), Im (tf), R^, R*R, R*R^, R^*R для следующих отношений: (a) Я= {<*, у) | х, у <= N и * делит #}; (b) ?=={<*, #> | х, у <= N и г/ делит х}\ (c) Я = {(лг, r/)|*, i/?Q и я+г/^О}, где Q—множество всех рациональных чисел; (d) ? = {<*, y)\x, i/sQ и 2x^3*/}. § 3. ФУНКЦИИ Понятие функции (отображения). Одним из основных понятий математики является понятие функции. ОПРЕДЕЛЕНИЕ. Бинарное отношение f называется функцией {отображением), если для любых х, у, г из того, что (#, у) е / и (х, z) <= /, следует, что у = г. 54
Другими словами, отношение f называется функцией, если для любого х из области определения отношения f существует единственное у такое, что (х, у) е /. Этот единственный элемент у обозначается через f(x) и называется значением функции f для аргумента х. Если (х> у) е ^f, то используется общепринятая запись y = f(x), а также запись f:x*-*y. Областью определения функции f называется множество Dom/={*|3*/«*, y)ef)}. Областью значений функции f называется множество lmf = {y\3x((x, y)<=f). Две функции fug называют равными (пишут f = g), если fug равны как множества, т. е. для любых х, у (х, у) <= е f тогда и только тогда, когда (х, у) е g. Следовательно, функции fug равны тогда и только тогда, когда Dom/ = = Doing и f(x) = g(x) для каждого х из Domf. Функции называются также отображениями. Если функция / задана на паре множеств А и В, т. е. f а А хВ, то говорят, что / есть отображение из Л в В. Если при этом A=Domf и ImfczB, то говорят, что f есть отображение множества А в В, и записывают в виде f:A-+B или A-j+B. Если A=Domf и B = Im/, то говорят, что / есть отображение множества А на В. Множество всех отображений Л в В обозначается символом ВА. Образом множества С при отображении / называется множество f(C) = {f(x)\xt=C}. Легко показать, что для любого множества С и всякого отображения / f(C) = f(Cf\Domf). Прообразом множества М при отображении / называется множество f (M) = {* e= Dom/|/(x) e= M}, 55
т. е. множество всех тех элементов х из области определения функции /, для которых f(x)^M. Нетрудно проверить, что для любого множества М и любого отображения f имеем f^(M)=r(M()lmf). Мы видели, что бинарное отношение может быть задано как график некоторого двухместного условия (предиката). Функция также может быть задана при помощи двухместного условия. Пусть А(х, у) — двухместное условие на х и у такое, что нет удовлетворяющих этому условию двух упорядоченных пар, которые имели бы одинаковые первые элементы и различные вторые элементы. Тогда график условия А (х, у), т. е. множество {(х, у) | А (х, у)}, является функцией. Так, например, функция, определяемая условием х2 — — у = 1 на множестве Z целых чисел, может быть задана как множество / = {<*> У)\х> У^г и х2-у=1}, или в виде / = {<*> У)\х* ?^Zh у = х2 — 1}, или следующим образом: / = {<*¦ *2-1>1*> #^Z}. Функция, область определения которой состоит из упорядоченных пар, называется функцией двух переменных. Функция, область определения которой состоит из упорядоченных троек, называется функцией трех переменных. Если f — функция двух переменных, то обычно вместо f((x> У)) пишут f(x, у). Если f — функция трех переменных, то вместо f((x, у у z)) пишут f(x, у, г). В общем случае функция, область определения которой состоит из кортежей длины п, называется функцией п переменных. Если f — функция п переменных, то вместо f ((х±,... ..., хп)) пишут f(xl9 ..., хп). Композиция функций. Рассмотрим свойства композиции функций. При этом композиция функций понимается как композиция отношений. 56
ТЕОРЕМА 3.1. Пусть f и g —функции. Тогда их композиция f'g также есть функция такая, что (1) Domf°g = {x\g(x)<=Domf}\ (2) (f9g)(x) = f(g(x)) для каждого хeDom(/-g); (3) f-g = {(x9 f{g(x)))\g(x)eDom f]. Доказательство. По определению композиции бинарных отношений f*g есть множество всех пар (х9 у) таких, что для некоторого z выполняется одновременно (х, z)z=g и <г, ?/>*=/, т. е. /-? = {<*> У)\1 *((*, z)<=g/\(z, y)<=f)}. Так какg — функция, то (х, z) Eg означает, что х <= Domg и z = g(x). Поскольку / — функция, вхождение (г, y)^f означает, что z = g(x)eEDom f и y = f(z)=f(g(x)). Следовательно, (х, y)^f°g<+y = f(g) A(g{x)e=Domf); f-g = {<*> f(g(x))\g(x) (= Dom f}. Следовательно, f°g есть функция, для которой выполняются равенства (1), (2), (3). ? Следствие 3.2. Пусть /, g — произвольные функции; тогда (a) Dom (f*g)c Dom gt Im (f -g) a Im /; (b) если ImgczDom/, то Dom (f*g) = Dom g; (c) если Im g=Dom/, то Dpm (f • g)=Domgи Im (/ • g) = Im/. Теорема 3.3. ?а/ш g- — отображение множества А в В и f — отображение множества В в С, то f*g является отображением множества А в С. Доказательство. По условию, Imgcz Dom/ = 5. По следствию 3.2, отсюда вытекает, что Dom f*g = Dom g = Л, Im f°ga Im /czC. Следовательно, /«g является отображением множества А в С. ? ТЕОРЕМА 3.4. Если g — отображение множества А на В и f — отображение множества В на С, то f*g является отображением множества А на С. Зта теорема непосредственно вытекает из теоремы 3.3 и следствия 3.2. 57
ТЕОРЕМА 3.5. Композиция функций обладает свойством ассоциативности, т. e.f*(g*h) = (f»g)*h для любых функций f, g и h. Теорема 3.5 непосредственно следует из теоремы 2.2. ОПРЕДЕЛЕНИЕ. Отображение iA множества А на себя такое, что 1а(х) = х для каждого хизА9 называется тождественным или единичным отображением множества А на себя. ТЕОРЕМА 3.6. Пусть /— отображение множества А на В. Тогда f.f"=*iB. Доказательство. Инверсия /^ функции / есть бинарное отношение такое, что Г = \(У, х)\(х, y)<=f\. По определению композиции отношений (1) /-^ = {<У. г)\Зх((у,х)ЕЕГ/\(х, z)<=f}. Из (у, х) е fu и (х, z) e / следует (2) <*, */>€=/ и (х, z>e/. Так как / — функция, то из (2) следует равенство y=z. Поэтому (1) можно записать в виде f-r={(y> </>!3*«*, у>е=/)}. Отсюда, поскольку / есть отображение А на В, получаем f-r = {<!/.y)\y = B}. Следовательно, fe/^ = tB- ? ТЕОРЕМА 3.7. Пусть /, g, h —функции, удовлетворяющие условию (1) Dom g- = Dom halm f. Тогда если g*f = h*f, то g = h. Доказательство. Предположим, что (2)ff-/ = A«/. В силу (1) для любого у из Dom g найдется элемент х такой, что y = f(x). Отсюда в силу (2) следует, что g{y) = g<f(x)) = h(f(x)) = h(y), т. е. g(y) = h(y) для любого у из Dom g. Кроме того, в силу (1) Dom g = Dom h. Следовательно, g = A.Q 58
Инъективные функции. Среди функций, рассматриваемых в математике, большую роль играют инъективные функции. ОПРЕДЕЛЕНИЕ. Функция f называется инъектив- ной, если для любых х> у (из Dom f) из условия f(x) = / (у) следует, что х — у. Другими словами, функция / инъективна, если для любых х9 у, z из того, что (х, г) е/ и (у, г) е/, следует, что х = у. В силу закона коитрапозиции из определения следует, что функция f инъективна тогда и только тогда, когда для любых х, у, если хфу, то f(x)^tf (у), т. е. для различных аргументов функция / принимает различные значения. ОПРЕДЕЛЕНИЕ. Инъективное отображение непустого множества А на себя называется подстановкой множества А или преобразованием множества А. В частности, подстановкой является тождественное или единичное отображение ?д множества А на себя, т. е. такое отображение, что iA(x) = x для каждого х из Л. ПРЕДЛОЖЕНИЕ 3.8. Если f — отображение из множества А в множество 5, то f*iA = f> iBef = f- ? ТЕОРЕМА 3.9. Композиция любых двух инъективных функций является инъективной функцией. Доказательство. Пусть f и g — инъективные функции. В силу инъективности / для любых х, у, если f (g(x)) = = f(g(y))> T0 g(x) = g(y). Далее, в силу инъективности g для любых х, у, если g(x) = g(y), то х = у. Поэтому для любых х, у, если / (g (x)) = f(g (у)), тох = у. Следовательно, для любых х, у у если (f'g)(x) = (f'g)(y), то х = у. Таким образом, функция f»g инъективна. П СЛЕДСТВИЕ 3.10. Композиция любых двух подстановок множества А есть подстановка множества А. Это следствие непосредственно вытекает из теорем 3.4 и 3.9. Пусть / — функция. Инверсия ^ = {(х> у)|<у, x)^f} функции / может не быть функцией. Так, например, если дана функция f = {(x, x2)\x^Z}, где Z —множество всех целых чисел, то отношение f^ — {(л;2, х) \ х е Z} не является функцией, так как содержит пары <1,1> и (1, —Неодинаковыми первыми элементами и различными вторыми элементами. Однако для функции g = {(x9 2x)\x^N}> где N—множество всех целых неотрицательных чисел, инверсия g^ = = {(2х, х) \х <= N} является функцией. 59
ПРЕДЛОЖЕНИЕ 3.11. Если f и g-функции, то (a) Domr = Imf; (с) (П^ = П (b) Im/^Domf; (d) (f-gr-^-P. Это предложение непосредственно следует из предложения 2.1 и теоремы 2.3. СЛЕДСТВИЕ 3.12. Если f — отображение множества А на В и f^ — функция, то f^ является отображением множества В на А. ТЕОРЕМА 3.13. Инверсия /° функции f тогда и только тогда является функцией, когда функция f инъективна. Доказательство. Отношение Iй является функцией тогда и только тогда, когда для любых х, у, z, если (z, х) е /^ и (z, у) е f^, то х = у. Это условие равносильно условию инъективности функции f: для любых х, у, г, если (х, z) ^f и (г/, z) e f, то х = #. Следовательно, отношение /° является функцией тогда и только тогда, когда функция f инъективна. Ц СЛЕДСТВИЕ 3.14. ?с/ш f — инъективная функция, то f^ —тоже инъективная функция. При этом если f — инъективное отображение А на В, то f^ есть инъектив- ное отображение В на А. ТЕОРЕМА 3.15. Пусть f, g, h —функции, удовлетворяющие условиям: (1) f-g = f*h; (2) Domg- = Domft, ImgaDomf, ImftczDom/. Тогда если функция f инъективна, то g = h. Доказательство. Предположим, что функция f инъективна. В силу условий (1) и (2) f(g(x))=f(h(x)) для любого х из Domg. В силу инъективности f отсюда следует, что g(x) = h(x) для любого х из Domg. Кроме того, ввиду (2) Domg = = Dom/i. Следовательно, g = h. ? Обратимые функции. Пусть / — отображение множества Л на В. ОПРЕДЕЛЕНИЕ. Функция ср называется левой обрат- ной к функции /, если <р — отображение В на А и <р • / = 1д. Функция, обладающая левой обратной, называется обратимой слева. ОПРЕДЕЛЕНИЕ. Функция h называется правой обратной к функции /, если ^ — отображение В на А и f*h = iB. 60
Функция, обладающая правой обратной, называется обратимой справа. ОПРЕДЕЛЕНИЕ. Функция g называется обратной к функции f, если g — отображение В на A, gr./ = tA и f°g = iB- Функция, обладающая обратной, называется обратимой. Функция* обратная к функции f, обозначается символом f'1. Из определений следует: а) если ср — левая обратная к f функция, то функция f является правой обратной к ср; Ь) если Я —правая обратная к f функция, то функция f является левой обратной к ft; с) если функция g — обратная к f, то функция / является обратной к g; в этом случае функции f и g называются взаимно обратными. ТЕОРЕМА 3.16. Если f — инъективное отображение множества А на 5, то f^*f = iA9 fof^ = iB9 Доказательство. Пусть / — инъективное отображение множества А на В. Тогда, по теореме 3.13, отношение /^ является функцией и для любых х, у условие (1) Г (</) = * равносильно условию &)П*) = у. В силу (2) и (1) для любого х из А имеем Ftf(x)) = x* (J".f)(x) = x, т. е. f^»f = iA. Далее, в силу (1) и (2) для любого у из В !(Г(У)) = У и (!-П(У) = У> т. е. f-f" = iB. D СЛЕДСТВИЕ 3.17. Если f — инъективное отображение множества А на В, то f —обратимая функция, причем функция f^ является обратной к f. СЛЕДСТВИЕ 3.18. Если f — подстановка множества А, то f^*f = iA и f.f^ = iA. ТЕОРЕМА 3.19. Пусть f—отображение множества А на В, обратимое слева. Любая левая обратная к f функция совпадает с fu и является также правой обратной к f и f обратима. Доказательство. Пусть ф: В->А есть левая обратная к / функция, т. е. (1) ф./ = 1'д. По теореме 3.6 и предложению 3.8, 61
В силу (2) и (1) Ф=ф.гБ=ф.(/вп=(ф-/)-/"=^-Г=Г, следовательно, ф==/^. Кроме того, /.ф = /./^ = гв, т, е. функция ф является также правой обратной к / и, следовательно, / обратима. ? ТЕОРЕМА 3.20. Пусть f — отображение множества А на В, обратимое справа. Любая правая обратная к f функция совпадает с f^ и является также левой обратной к f и f обратима. Доказательство. Пусть h: В-^А есть правая обратная к f функция, т. е. (1) f-h = iB. По теореме 3.6 и предложению 3.8, (2) h-hy = iA, iB.hy = h^. В силу (2) и (1) По теореме 2.1, из f = hy следует ft = /4 Кроме того, h*f = fu'f = iA> т. е. функция h является также левой обратной к f и, следовательно, f обратима. ? ТЕОРЕМА 3.21. Следующие свойства функции f равносильны: (a) инверсия f~* функции f является функцией; (b) функция f инъективна; (c) функция f обратима справа:, (d) функция f обратима слева; (e) функции f обратима; (g) все функции, обратные к f {левые, правые, двусторонние), существуют и совпадают с /Ч Доказательство. По теореме 3.13 свойства (а) и (Ь) равносильны. Если f — инъективное отображение А на В, то по теореме 3.14 /^является отображением В на А и f°f^=iB —функция f обратима справа. Следовательно, из (Ь) следует (с). Если функция / обратима справа, то, по теореме 3.20, она также обратима слева. Таким образом, из (с) следует (d). Если функция f обратима слева, то, по теореме 3.19, функция f обратима. Следовательно, из (d) следует (е). Предположим, что функция / обратима. Тогда она обратима слева и справа. На основании теорем 3.19 и 3.20 все функции, обратные к f, совпадают с /Ч 62
Если выполняется условие (g), то инверсия /° функции f является функцией. Таким образом, из (g) следует (а). Следовательно, свойства (а), (Ь), (с), (d), (e), (g) равносильны. П ТЕОРЕМА 3.22. Если функции fug обратимы, то обратима также функция f*g и (fmg)~1 = g~1*f~1. Доказательство. Пусть / и g — обратимые функции. Тогда их инверсии ^и§и суть функции и (1) Г = Г, в"-*"1. По теореме 2.3, (2) (f-gr^f-F. Так как g° и /^ — функции, то их композиция gw«/^ есть функция; следовательно, в силу (2) (/eg)u является функцией. Поэтому функция fog обратима и (3) if-gr^V-gY1- На основании равенств (1), (2), (3) заключаем, что функция f>g обратима и (/-g) 1==g~le/ г. ? Ограничение функции. Частным случаем ограничения бинарного отношения является ограничение функции. ОПРЕДЕЛЕНИЕ. Функция g называется ограничением (или сужением) функции f, если g cz /. Если g а /, то говорят также, что / есть расширение (или продолжение) функции g. ОПРЕДЕЛЕНИЕ. Функция g называется ограничением функции f множеством А (или суоюением функции f на множество Л), если gaf и Domg = A. Ограничение функции / множеством А обозначается fA или f\A. ПРЕДЛОЖЕНИЕ 3.23. Если Лс=Оот/, то функция f°iA является ограничением функции f множеством А, т. е. fA = f'lA- Это предложение непосредственно следует из определения функции /А. ТЕОРЕМА 3.24. Функция g является ограничением функции f тогда и только тогда, когда DomgczDom/ и g(x) = f(x) для любого х из Doing. Доказательство. Предположим, что gczf. Тогда DomgczDom/ и для любого л: ^ Doing из (x,y)^g следует (xt y)^f, следовательно, g(x)=f(x). 63
Теперь предположим, что DomgczDomf и g(x)=f(x) для любого х е Domg. Тогда для любых х, у из (х, у) eg, т. е. из y = g(x), следует, что y = f(x) и {х, */>е/, следовательно, g с: /. ? Упражнения 1. Какие из следующих отношений являются функциями? Укажите их области определения и области значений: (a) {<*, y)\xt */e=N и у=х*\; (b) {{х, у) \xt i/gN и х<у^х+Ц; (c) {(х, у)\х, ye=Z и у=х*}; (d) {{л:, у) \ х, у е= N и л: делит у}; (e) {<*> у)\х, y<=Z и */=|*|}; (f) {<*, У)\Х, y<=Z И Х = 02}. Здесь и далее Z—множество всех целых чисел, N — множество всех целых неотрицательных чисел. 2. Пусть А = {0,1}—двухэлементное множество. Найдите все отображения множества А в себя и укажите, какие из них инъективны. 3. Наймите все отображения множества Л = {0, 1, 2} на множество Я = {0, 1}. 4. Докажите, что для каждой функции / и любого множества А f(A) = 0 тогда и только тогда, когда Af|Dom/=0. 5. Докажите, что если / есть такое отображение множества А на А, что /о/=/, то /=*д. 6. Докажите, что если f—функция и Л, В—множества, то f (A (\B) a f (Л)П f(B). Покажите на примерах, что случай равенства f (А П В) = f (А) П f (В) может не иметь места. 7. Пусть RczAxB. Докажите, что R является отображением множества А в В тогда и только тогда, когда R ° ЯУ a iB и iAc:RVoR. 8. Докажите, что каждая из следующих функций имеет обратную. Найдите область определения обратной функции: (a)/={(M>|MGN и г/=2х+1}; (b) /={</i, п*)\п<=Щ; (c) /={х, у) \х, */(= N и */ = *3}. 9. Для любых множеств А, В и С докажите, что: (a) существует инъективное отображение множества А хВ на ВхМ (b) существует инъективное отображение множества (АхВ)хС на Ах(ВхС). 10. Пусть f — отображение множества А в А. Докажите, что если fofof=iAi то / является инъективным отображением множества А на А. 11. Пусть /—отображение из множества А в В. Покажите, что если С, DczB и C(\D = 0, то /^ (А)П/^(Я) = 0, 64
12. Докажите, что для любой функции / выполняются соотношения: (а)^(ЛиВ)==/^(Л)и/^(?); (b) fv(A(\B) = f^(A)(\f^>(B); (c) ^(Л\Б)=/-(Л)\/^(Б); (d) AczB-+f^(A)czf^(B). 13. Докажите, что если A cz Dom/ и ficlm/, то (a) Лс^(/(Л)); (b) f(^(B)) = B. 14. Докажите, что / (A)\f (В) cz f (A\B) для каждой функции / и любых множеств А и В* Если /—инъективная функция, то f(A)\f(B)=f(A\B) для любых множеств А и В. 15. Пусть f—отображение множества А в В и g—отображение множества Б в С. Докажите, что: (а) если отображение go f инъективно, то и / инъективно; (Ь) если g ° f есть отображение А на С, то g есть отображение В на С. 16. Докажите, что отображение /: Л -> Б является инъективным отображением множества А на В тогда и только тогда, когда существует отображение g: В -> Л такое, что gofz=iA и fog=iB9 17. Докажите, что бинарное отношение ^с:ЛхБ является инъективным отображением множества Л на Б тогда и только тогда, когда RoR^=iB и Я^о# = ?л# 18. Докажите, что функция f удовлетворяет условию f (Л Л В) = = /(Л)Г|/(Б) для любых множеств Л и Б тогда и только тогда, когда функция / инъективна. 19. Пусть Л и Б —конечные множества, состоящие из т и п элементов соответственно, и т^п. Докажите, что существует n(/z—-1)... (п—/я + 1) инъективных отображений множества Л в Б. 20. Пусть Л и Б —конечные множества, состоящие из т и п элементов соответственно. (a) При каких тип существует инъективное отображение множества Л в Б? (b) Сколько существует отображений множества Л в Б? (c) Сколько существует бинарных отношений между элементами множеств Л и Б? § 4. ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ Некоторые виды бинарных отношений» По некоторым важным свойствам бинарные отношения делятся на виды. ОПРЕДЕЛЕНИЕ. Бинарное отношение R на множестве А называется рефлексивным на Л, если для каждого;; из A xRx. Отношение R рефлексивно на А тогда и только тогда, когда iAaR, где iA = {(x, х)\х^А}. Если отношение R рефлексивно, то каждая вершина его графа имеет петлю. Обратно: граф, каждая вершина которого имеет петлю, представляет некоторое рефлексивное отношение. В качестве примеров рефлексивных отношений можно указать отношение параллельности на множестве прямых 65
плоскости, отношение равенства на каком-либо множестве чисел и отношение делимости на какой-либо совокупности целых чисел. ОПРЕДЕЛЕНИЕ. Бинарное отношение R на множестве Л называется антирефлексивным на Л, если для каждого л; из Л (х, x)e?R, т. е. для каждого л: из Л не выполняется условие xRx. Отношение R антирефлексивно на Л тогда и только тогда, когда iA f| R = ф. Если отношение R антирефлексивно, то ни одна вершина его графа не имеет петли. Обратно: если ни одна вершина графа не имеет петли, то граф представляет антирефлексивное отношение. Например, отношение неравенства (Ф) на каком-нибудь множестве чисел и отношение перпендикулярности на множестве прямых плоскости являются антирефлексивными. ОПРЕДЕЛЕНИЕ. Бинарное отношение R (на Л) называется транзитивным (на Л), если для любых х, у, z из области отношения R (из Л) из xRynyRz следует xRz. Отношение R транзитивно тогда и только тогда, когда R*RciR. Если отношение R транзитивно, то его граф обладает свойством: для каждой пары рёбер (х, у) и (у, z) имеется замыкающее ребро (х, z), и наоборот. Например, отношение делимости на множестве целых чисел является транзитивным. Отношение неравенства (Ф) не является транзитивным. ОПРЕДЕЛЕНИЕ. Бинарное отношение R (на Л) называется симметричным (на Л), если для любых х, у из области отношения R (из Л) из xRy следует yRx. Отношение R симметрично тогда и только тогда, когда RK~' = R. Если отношение R симметрично, то каждое ребро его графа не ориентировано. Обратно: граф с неориентированными ребрами представляет некоторое симметричное бинарное отношение. Например, симметричными являются отношение параллельности прямых, отношение перпендикулярности прямых и отношение равенства. ОПРЕДЕЛЕНИЕ. Бинарное отношение R (на Л) называется антисимметричным (на Л), если для любых х, у из области отношения R (из Л) из xRy и yRx следует х = у. Отношение R антисимметрично на Л тогда и только тогда, когда R(]R^cziA. Граф антисимметричного отношения не имеет неориентированных ребер, но может иметь петли. 66
Например, отношение включения с на какой-либо совокупности множеств является антисимметричным. ОПРЕДЕЛЕНИЕ. Бинарное отношение R на множестве Л называется связанным на Л, если для любых элементов х, у множества А из хфу следует xRy\JyRx. Отношение R связанно на Л в том и только в том случае, когда AxA\iAaR[)R^. Бинарное отношение R на Л связанно на Л тогда и только тогда, когда для любых х, у из Л либо х = у, лuбoxRyy либо yRx, т. е. AxA = iAVR[jRKJ. Граф связанного отношения обладает следующим свойством: любые две (различные) вершины графа соединены ребром. Обратное также верно. Так, например, обычное отношение «меньше» (<) на какой-либо совокупности чисел является связанным. Отношение эквивалентности. Важным видом бинарного отношения является отношение эквивалентности. ОПРЕДЕЛЕНИЕ. Бинарное отношение на множестве Л называется отноишнием эквивалентности на Л, если оно рефлексивно, симметрично и транзитивно (на Л). Отношение эквивалентности часто обозначают символами ~, я^ или =. Примеры. 1. Пусть Л — непустое множество и iA = = {(х, х) |хе Л} — отношение тождества на множестве Л. Отношение iA есть отношение эквивалентности на Л. 2. Пусть Л — множество прямых на плоскости и R == [{х, у)\х, у^А и х параллельно у} — отношение параллельности. Отношение параллельности на Л есть отношение эквивалентности. 3. Пусть Z — множество всех целых чисел и т — целое число, отличное от нуля. Отношение R = {(х, у)\х, у ^ Z и х — у делится на т} называется отношением сравнения по модулю т. Это отношение является отношением эквивалентности на Z. 4» Пусть Л—множество направленных отрезков данной плоскости. Отношение Эквиполентности направленных отрезков является отношением эквивалентности на Л. 5. Отношение подобия на множестве треугольников данной плоскости есть отношение эквивалентности. 6. Два множества называются равномощными, если существует инъективное отображение одного множества на дру- 67
roe. Отношение равномощности на любой данной совокупности множеств является отношением эквивалентности. ОПРЕДЕЛЕНИЕ. Пусть R — отношение эквивалентности на множестве Л и а е Л. Классом эквивалентности, порожденным элементом а, называется множество {л: ^ А \ xRa}, т. е. множество всех таких х из А, что (х, a)^R. Класс эквивалентности, порожденный элементом а, обозначается через a/R или [a]R. Совокупность всех классов эквивалентности отношения R на множестве А обозначается через A/R или [Л]#. ОПРЕДЕЛЕНИЕ. Любой элемент класса эквивалентности называется представителем этого класса. Полной системой представителей классов эквивалентности называется множество представителей всех классов, по одному из каждого класса. В примере 1 классами эквивалентности являются одноэлементные подмножества А. В примере 2 классы эквивалентности называются пучками параллельных прямых. В примере 3 классы эквивалентности называются классами вычетов по модулю т и каждый класс состоит из всех тех чисел, которые при делении на т дают один и тот же остаток. В примере 4 классы эквивалентности называются векторами плоскости. В примере 5 классы эквивалентности суть множества попарно подобных треугольников. В примере 6 классами эквивалентности являются классы равномощ- ных множеств. Фактор-множество. Пусть А — непустое множество. ОПРЕДЕЛЕНИЕ. Фактор-множеством множества А по отношению эквивалентности R называется множество A/R всех классов эквивалентности. ОПРЕДЕЛЕНИЕ. Разбиением множества А называется такое семейство его непустых подмножеств, что каждый элемент множества А входит в точности в один член семейства. Другими словами, разбиение множества А есть семейство его непустых подмножеств, оъединение которых совпадает с множеством Л, а пересечение любых двух из них пусто. ТЕОРЕМА 4.1. Пусть R — отношение эквивалентности на (непустом) множестве Л. Тогда фактор-множество A/R является разбиением множества Л. Доказательство. Каждый элемент а множества Л принадлежит классу эквивалентности a/R. Надо доказать, что каждый элемент множества Л принадлежит в точности 68
одному члену семейства A/R. Для этого достаточно показать, что классы эквивалентности, имеющие хотя бы один общий элемент, совпадают. Пусть a/R и b/R — классы эквивалентности, имеющие общий элемент с, пусть х — любой элемент из a/R, тогда xRa, aRc, cRb и в силу транзитивности отношения R xRb. Таким образом, a/R a b/R. Аналогично доказывается, что b/R cz a/R. Следовательно, a/R = = b/R. Итак, установлено, что фактор-множество A/R является разбиением множества А. ? СЛЕДСТВИЕ 4.2. Пусть R — отношение эквивалентности на множестве А, тогда (1) a^a/R для любого а из А; (2) для любых a, b из A a/R = b/R тогда и только тогда, когда aRb; (3) a/R Ф b/R тогда и только тогда, когда a/R П b/R = ф; (4)A={Jx/R. Это следствие непосредственно вытекает из теоремы 4.1. Пусть S — разбиение непустого множества А и Rs — бинарное отношение, определяемое следующим образом: (x,y)^Rs тогда и только тогда, когда х и у принадлежат одному и тому же члену семейства S. ТЕОРЕМА 4.3. Отношение R$, соответствующее разбиению S непустого множества А, является отношением эквивалентности на А, причем фактор-множество A/R$ совпадает с разбиением S. Доказательство теоремы не представляет трудности и предлагается читателю в качестве упражнения. Отношение равнообразности отображения. Пусть / — отображение множества А в В. Рассмотрим бинарное отношение R на А такое, что xRy тогда и только тогда, когда № = f{y). ОПРЕДЕЛЕНИЕ. Пусть f — отображение множества А в В. Бинарное отношение R, R = {(*> y)\f(*) = f(y)> х, У^А}У называется отношением равнообразности отображения f. ТЕОРЕМА 4.4. Пусть f — любое отображение и А = = Dom /. Отношение равнообразности отображения f является отношением эквивалентности на множестве А. Доказательство. Пусть R — отношение равнообразности отображения /. Отношение R рефлексивно на А, так как f{x) = f{x) для любого л; из А. Отношение R транзитивно, так как для любых х, у, z из f(x)=f{y) и 69
f(y) = f(z) следует f(x) = f(z). Отношение R симметрично, так как для любых х, у из f(x) = f(y) следует f(y)=f{x). Следовательно, R является отношением эквивалентности на множестве А. О Если сеЛ = Dom/, f(a) = b и R — отношение равнооб- разности отображения Д то класс эквивалентности, порожденный элементом а, есть /^ (Ь). Множество {f^ (x) \ x e Im f\ является фактор-множеством множества А по отношению эквивалентности R, т. е. A/R = {fu(x)\x^lmf\. Любое отношение эквивалентности R± на множестве А можно рассматривать как отношение равнообразности некоторого отображения множества А. В самом деле, можно определить естественное отображение множества А на фактор-множество A/Rl9 ставя в соответствие каждому х из А единственный класс эквивалентности x/Rl9 содержащий х. Легко проверить, что отношение эквивалентности Rt совпадает с отношением равнообразности естественного отображения множества А на A/R±. Упражнения 1. С точки зрения наличия свойств рефлексивности, антирефлексивности, симметричности, антисимметричности, транзитивности рассмотрите следующие отношения: (a) {(я, у)\х, i/gZ и х^у+Ц, где Z—множество всех целых чисел; (b) {{х, у)\х, i/gZ и х*=уЦ; (c) {<*, у)\х, */e=Z и \х\ = \у\}; (d) {X, Y\X, FcZiiXnF = ©}; (e) {(х, y)\x,y^N и х делит у} (N—множество всех целых неотрицательных чисел); (О 1{х, у)\х, у<=П и х<у}; fe) i(x> y)\x, y<==N и х+у= Ц; 00 {(х, у)\х, !/gN и х^у}; (i) {<*, */> | х, у <= N и л: =И= #}; (к) {<*, у) \х, yeZ и х2+дс = ^+у}; 0) {<*. у>|*. ^eZ и *+^=1}. 2. Приведите примеры бинарных отношений: (a) рефлексивных и транзитивных, ко не антисимметричных; (b) транзитивных и симметричных, но не рефлексивных; (c) рефлексивных и транзитивных, но не симметричных; (d) рефлексивных и симметричных, но не транзитивных. 3. Пусть R cz A X Л. Докажите, что: (a) R рефлексивно на множестве А тогда и только тогда, когда iAczR; (b) R симметрично тогда и только тогда, когда jR^ с: R; (c) R транзитивно тогда и только тогда, когда R*RczR. 70
4. Докажите, что симметричное и антисимметричное бинарное отношение R является транзитивным. 5. Найдите все фактор-множества множества {1, 2, 3}. 6. Покажите, что множество {1 2, 3, 4} имеет 15 различных фактор -множеств. 7. Докажите, что если R есть транзитивное и симметричное бинарное отношение на множестве Л, где А—область отношения R, то R является эквивалентностью на А. 8. Докажите, что бинарное отношение R с областью определения Dom R = A тогда и только тогда является отношением эквивалентности на Л, когда R°Rcz R и R^=R. 9. Докажите, что если R есть отношение эквивалентности на множестве Л, то Ry также есть отношение эквивалентности на Л. 10. Докажите, что пересечение любой совокупности отношений эквивалентности на множестве Л есть отношение эквивалентности на множестве Л. 11. Докажите, что для любого непустого множества М существует инъективное отображение множества всех разбиений множества М на множество всех отношений эквивалентности на М. 12. Докажите, что фактор-множество Z/raod m множества целых чисел Z по отношению сравнения по модулю т имеет ровно т элементов. § 5. ОТНОШЕНИЯ ПОРЯДКА Отношения порядка. Пусть /? — бинарное отношение на множестве Л. ОПРЕДЕЛЕНИЕ. Бинарное отношение R на множестве Л называется отношением порядка на А или по- рядком на Л, если оно транзитивно и антисимметрично. ОПРЕДЕЛЕНИЕ. Отношение порядка R на множестве А называется нестрогим, если оно рефлексивно на Л, т. е. (х, x)^R для всякого х из А. Отношение порядка R называют строгим (на Л), если оно антирефлексивно на Л, т. е. (х, x)q?R для любого х из Л. Однако из антирефлексивности транзитивного отношения R следует его антисимметричность. Поэтому можно дать следующее эквивалентное определение. ОПРЕДЕЛЕНИЕ. Бинарное отношение R на множестве Л называется строгим порядком на Л, если оно транзитивно и антирефлексивно на Л. Примеры. 1. Пусть Р(М) — множество всех подмножеств множества М. Отношение включения с: на множестве Р(М) есть отношение нестрогого порядка. 2. Отношения < и ^ на множестве действительных чисел являются соответственно отношением строгого и нестрогого порядка. 3. Отношение делимости во множестве натуральных чисел есть отношение нестрогого порядка. 71
ОПРЕДЕЛЕНИЕ. Бинарное отношение R на множестве А называется отношением предпорядка или предпо- рядком на Л, если оно рефлексивно на Л и транзитивно. Примеры. 1. Отношение делимости во множестве целых чисел не является порядком. Однако оно рефлексивно и транзитивно, значит является предпорядком. 2. Отношение |= логического следования является предпорядком на множестве формул логики высказываний. Линейный порядок. Важным частным случаем порядка является линейный порядок. ОПРЕДЕЛЕНИЕ. Отношение порядка на множестве Л называется отношением линейного порядка или линейным порядком на Л, если оно связанно на Л, т. е. для любых х, у из А либо xRy, либо х = у, либо yRx. Отношение порядка, не являющееся линейным, обычно называют отношением частичного порядка или частичным порядком. Примеры. 1. Отношение «меньше» на множестве действительных чисел есть отношение линейного порядка. 2. Отношение порядка, принятое в словарях русского языка, называется лексикографическим. Лексикографический порядок на множестве слов русского языка есть линейный порядок. 3. Отношение включения cz на совокупности подмножеств данного множества М является частичным порядком, если М содержит не менее двух различных элементов. Одно и то же множество можно линейно упорядочить различными отношениями порядка. Так, например, на непустом конечном множестве М, состоящем из п элементов, можно ввести п\ различных линейных порядков. Упорядоченное множество. Пусть R — произвольное отношение порядка на непустом множестве Л. ОПРЕДЕЛЕНИЕ. Упорядоченным множеством называется пара (Л, /?>, где Л —непустое множество и R — отношение порядка на Л. Если порядок R на Л линейный, то пара (Л, R) называется линейно упорядоченным множеством. Если порядок R на Л частичный, то пара (Л, R) называется частично упорядоченным множеством. ОПРЕДЕЛЕНИЕ. Пусть <Л, -?) — упорядоченное множество. Элемент а из А называется наименьшим (наибольшим) в Л, если а ~$х(х -^>а) для любого элемента х из Л, отличного от а. 72
Любое упорядоченное множество имеет не более одного наименьшего и не более одного наибольшего элемента. ОПРЕДЕЛЕНИЕ. Пусть (А, -^> — упорядоченное множество. Элемент а из А называется минимальным (максимальным) в Л, если выполняется условие; для любого х из Л, если х Ч!а, то х = а (если а-^>х, то а = х). Упорядоченное множество может иметь несколько минимальных и максимальных элементов. Пример. Пусть Я —отношение делимости в множестве N\{0,1} (N —множество натуральных чисел). В упорядоченном множестве <N\{0,1}, R) любое простое число является минимальным элементом. В линейно упорядоченном множестве понятия наименьшего (наибольшего) и минимального (максимального) элементов совпадают. ОПРЕДЕЛЕНИЕ. Линейно упорядоченное множество (А, R) называется вполне упорядоченным множеством, если каждое непустое подмножество множества А имеет наименьший элемент. Примеры. 1. Если < есть обычное отношение «меньше» на множестве N натуральных чисел, то (N, <С> является вполне упорядоченным множеством. 2. Пусть < есть обычное отношение «меньше» на множестве R всех действительных чисел. Тогда линейно упорядоченное множество (R, <> не является вполне упорядоченным множеством. Упражнения 1. Докажите, чго тождественное отображение iA множества А есть отношение порядка на множестве А. 2. Покажите, что отношение R= {(х, у)\х, i/gN и (л: делиг у или х <у)\ есть линейный порядок на множестве N натуральных чисел. 3. Пусть Л = {1, 2, 3, 4, 5, 6, 7} и R = {(x> у) \xt у<=Аи (х—у):2}. Покажите, что R есть отношение порядка на Л, найдите максимальные и минимальные элементы. 4. Пусть отношения < и ^ определяются на множестве N натуральных чисел обычным образом. Докажите, что <° < Ф <; ^о <; = = <; ^o^=NxN. 5. Постройте линейный порядок на множестве NxN. 6. Покажите, что конечное множество, состоящее из п элементов, можно линейно упорядочить п\ способами. 7. Покажите, что отношение включения cz не является линейным порядком на совокупности Р (Л) всех подмножеств множества Л, если А содержит не менее двух элементов. 73
8. Докажите, что любое вполне упорядоченное множество является линейно упорядоченным. 9. Докажите, что бинарное отношение R на множестве А является отношением нестрогого порядка тогда и только тогда, когда RoR=zR и RoRv=iA9 10. Докажите, что если R есть отношение порядка (линейного порядка), то обратное отношение ЯУ также есть отношение порядка (линейного порядка). 11. Пусть ^ есть отношение нестрогого порядка на множестве А. Докажите, что отношение <С антирефлексивно и транзитивно на А. 12. Пусть <С — бинарное отношение, антирефлексивное и транзитивное на множестве л. Докажите, что отношение ^ такое, что х-^у~(х<1у)\/(х=у), есть отношение нестрогого порядка на А. 13. Докажите, что для линейно упорядоченного множества понятия наибольшего (наименьшего) и максимального (минимального) элементов совпадают. 14. Докажите, что если R есть частичный (линейный, полный) порядок на множестве А и В с А, то Rf[(BxВ) является частным (линейным, полным) порядком на множестве В. 15. Пусть Я—отношение предпорядка на множе:тве А. Положил a~b=: {{at b) e Rf\(bt dS e R). Докажите, что: (a) если a~c, b~d, (a, b) e R, то (с, d)^R; (b) ~ есть отношение эквивалентности на л; (c) Rx есть отношение порядка на А/~, где #1= {<<?/-, *MI<a, b)<=R}.
Глава третья АЛГЕБРЫ И АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ § 1. БИНАРНЫЕ ОПЕРАЦИИ Бинарные и /г-местные операции. Пусть Л —непустое множество. ОПРЕДЕЛЕНИЕ. Бинарной операцией на множестве А называется отобраоюение множества Ах А в А. Обычное сложение и умножение целых чисел суть примеры бинарных операций на множестве целых чисел. Пусть Р (М) — множество всех подмножеств множества М\ объединение U и пересечение П —примеры бинарных операций на множестве Р(М). Пусть / — произвольная бинарная операция на множестве Л. Если при отображении f элемент с соответствует паре (а, Ь>, т. е. ((а, Ь>, с)е/, то вместо записи /Ч(я> Ь))=с или /(а, 6)=с пишут также afb=c или (a, b)i—>c и элемент с называют композицией элементов а и Ь. ОПРЕДЕЛЕНИЕ. Пусть Ап есть п-я степень непустого множества Л и п^1. Отображение множества Ап в Л называется п-местной операцией на множестве Л, а число л —рангом операции. Нульместной операцией на множестве А называется выделение (фиксация) какого-нибудь элемента множества Л, число 0 называется рангом нуль- местной операции. ОПРЕДЕЛЕНИЕ. Отображение из множества Ап в Л называется частичной п-местной операцией на Л, если область определения отображения не совпадает с Ап. Операции ранга 0, 1 и 2 называют также нулъарной (нульместной), унарной и бинарной соответственно. Унарную операцию называют также оператором. 75
Примеры. 1. Отображение, ставящее в соответствие каждому множеству А из Р(М) его дополнение М\А, есть унарная операция на множестве Р(М). 2. В области натуральных чисел вычитание не всегда возможно. Поэтому вычитание на множестве натуральных чисел есть частичная бинарная операция. 3. Операция деления рациональных чисел есть частичная бинарная операция на множестве рациональных чисел. 4. Операция, ставящая в соответствие каждому кортежу п натуральных чисел наибольший общий делитель этих чисел, является я-местной операцией на множестве натуральных чисел. Для обозначения n-местной операции обычно используют ту же форму записи, что и для произвольных отображений (функций). Если / есть n-местная операция на множестве А и «01, ..., ctn), ^i)e/, то пишут ап+г = /(%,..., ап) и говорят, что ал+1, — значение операции / для набора аргументов alf ..., ап. Виды бинарных операций. Пусть Т и J_ — произвольные бинарные операции на множестве А. ОПРЕДЕЛЕНИЕ. Бинарная операция Т называется коммутативной, если для любых а, Ъ из А выполняется равенство а~Тb = b~Tа. ОПРЕДЕЛЕНИЕ. Бинарная операция Т называется ассоциативной, если для любых элементов а, Ъ, с из А выполняется равенство а~Г(b~Tc) = (a~Tb)~\~с. ОПРЕДЕЛЕНИЕ. Бинарная операция Т называется дистрибутивной относительно бинарной операции J_, если для любых а, Ъ, с из А выполняются равенства (а±Ь)Тс = (аТс) ±(ЬТс) и сТ(а±Ь) = (рТа)± ±(сТЬ). Если операция Т ассоциативна, то можно опускать скобки и писать а~\~Ь~Тс вместо аТфТс) или (a~Tb)Tc. Примеры. 1. Сложение и умножение рациональных чисел являются коммутативными и ассоциативными бинарными операциями. 2. Операция вычитания на множестве рациональных чисел не коммутативна и не ассоциативна. 3. Операции объединения и пересечения подмножеств множества М коммутативны и ассоциативны на множестве Р (М). 76
4. Композиция функций есть ассоциативная операция. Композиция функций не коммутативна: в общем случае равенство f°g = g°f не выполняется. 5. На множестве Р(М) подмножеств некоторого множества операции объединения и пересечения взаимно дистрибутивны друг относительно друга. 6. Умножение целых чисел дистрибутивно относительно сложения. Однако сложение целых чисел не дистрибутивно относительно умножения, так как в общем случае равенство a + bc = (a + b)(a + c) не выполняется. Нейтральные элементы. Пусть Т~ бинарная операция на множестве А. ОПРЕДЕЛЕНИЕ. Элемент е из А называется левым нейтральным относительно операции Т\ если для любого а из А выполняется равенство е~Га = а. Элемент е из А называется правым нейтральным относительно операции Т> если для любого а из А имеем а~\~ е — а. ОПРЕДЕЛЕНИЕ. Элемент е из А называется ней- тральным относительно операции ~Г> если для любого элемента а из А верны равенства е~[а = а = а~\~е. ТЕОРЕМА 1.1. Если нейтральный элемент относительно бинарной операции Т существует, то он единствен. Доказательство. Пусть е и е' — нейтральные элементы относительно Т- Тогда е' = е'Те = е, т. е. е' = е. ? СЛЕДСТВИЕ 1.2. Если нейтральный элемент относительно операции Т существует, то все левые и правые нейтральные элементы относительно Т с ним совпадают. Примеры. 1. Число 0 есть нейтральный элемент относительно сложения целых чисел. Число 1 есть нейтральный элемент относительно умножения целых чисел. 2. Пустое множество есть нейтральный элемент относительно операции объединения множеств. Универсальное множество является нейтральным элементом относительно операции пересечения множеств. 3. Рассмотрим множество Ф отображений непустого множества А на его непустое собственное подмножество В и операцию — композицию отображений. Множество Ф не имеет ни одного правого нейтрального элемента. Всякий элемент феФ такой, что ф(л:) = л: для любого х из В, является левым нейтральным элементом относительно рассматриваемой операции. Регулярные элементы. Пусть Т — бинарная операция на множестве А. 77
ОПРЕДЕЛЕНИЕ. Элемент а^А называется регулярным справа относительно операции Т, если для любых элементов &, с множества А из aJb — aTc следует Ь=с. Элемент agА называется регулярным слева относительно Т, если для любых элементов 6, с множества А из Ь~Та = = с~Та следует Ь = с. ОПРЕДЕЛЕНИЕ. Элемент а^А называется регулярным относительно операции Т» если он регулярен слева и справа относительно Т- Таким образом, в случае регулярности элемента а в равенствах типа а~уЬ = а~Тс и 6Т# = сТ# возможно «сокращение» на а. Примеры. 1. Всякое целое число регулярно относительно сложения. 2. Всякое целое число, отличное от нуля, регулярно относительно умножения; число нуль не регулярно относительно умножения. ТЕОРЕМА 1.3. Если элементы а и Ь регулярны относительно ассоциативной операции Т, то их композиция a~Tb также является регулярным элементом относительно Т- Доказательство. Пусть а и 6— элементы, регулярные относительно Т- Пусть с, d — элементы из Л, удовлетворяющие условию (1) (aTb)Tc = (aTb)Td. Поскольку операция Т ассоциативна, а~Т(Ь~Тс) = aT(b~Td). В силу регулярности элемента а имеем Ьус — Ь'Гй. Отсюда в силу регулярности элемента b следует равенство (2) c = d. Итак, для любых элементов с, d множества Л из (1) следует (2), следовательно, элемент a~Tb регулярен справа. Аналогично убеждаемся, что этот элемент регулярен слева. ? Симметричные элементы. Пусть Т — бинарная операция на множестве Л, обладающая нейтральным элементом е. ОПРЕДЕЛЕНИЕ. Элемент и из Л называется левым симметричным к элементу а^ А относительно операции Т> если и~Та = е. Элемент v из Л называется правым симметричным к а относительно операции Т» если a~~\'v = e. ОПРЕДЕЛЕНИЕ. Элемент а'еЛ называется симметричным к элементу а^А относительно операции Т> если 78
а~Та'=е = а'Та. В этом случае элемент а называется сим- метризуемым, а элементы а и а' —взаимно симметричными. Примеры. 1. Относительно сложения целых чисел симметричным к данному целому числу является то же число, взятое со знаком минус. 2. Относительно умножения рациональных чисел симметричным к ненулевому числу а является 1/а; число нуль не имеет симметричного относительно умножения. ТЕОРЕМА 1.4. Если операция Т ассоциативна и элемент а симметризуем, то существует, единственный элемент, симметричный к а. Доказательство. Пусть и, v — элементы, симметричные к элементу а относительно Т> т. е. а~Ти = е = иТа, aTv = e = v~Ta. Тогда в силу ассоциативности Т и = иТе = иХ (aTv) = (цТа) Tv = e~\v = v, т. е. u = v. ? СЛЕДСТВИЕ 1.5. Если элемент а имеет симметричный элемент а! относительно ассоциативной операции Т, то все левые и все правые симметричные к а элементы совпадают с элементом а'. ТЕОРЕхМА 1.6. Если элементы а, Ъ симметризуемы относительно ассоциативной операции Т> то элемент а~\Ъ также симметризуем и элемент b'~fa' является симметричным к a~yb. Доказательство. Пусть а! и &' — элементы, симметричные к а и Ь соответственно. В силу ассоциативности Т {а-\Ь)Т(Ь'Та') = ((аТЬ)Тб') Та' = (аТ ФТЪ'))Та' = == {а~Те) Та! = а~Та' = е. Также убеждаемся, что {b'Ta') Т {ctj'b) = e. Следовательно, элемент а~[Ь симметризуем и элемент b'Ta' является симметричным к а~Х~Ъ. ? ТЕОРЕМА 1.7. Элемент, симметризуемый относительно ассоциативной операции Т, является регулярным относительно Т. Доказательство. Пусть а — симметризуемый элемент и для элементов Ь, с множества А верно равенство a~Tb = a~Tc. Тогда если а'— элемент, симметричный к а, то а'Т (a~Tb) = a'~T (а~Тс). В силу ассоциативности опера- цииТ (а'То) ТЬ = (а'Та) То. Следовательно, е~\Ь = е~То 79
и Ь = с. Аналогично убеждаемся, что для любых элементов by с множества Л из равенства ЬТа = сТа следует 6 = с. Таким образом, элемент а является регулярным относительно Т- D Подмножества, замкнутые относительно операций. Пусть Т — бинарная операция на множестве А и В cz А. " ОПРЕДЕЛЕНИЕ. Подмножество В множества А называется замкнутым относительно операции Т> если для любых a, b из В элемент а~\Ь принадлежит В. Отметим, что пустое подмножество замкнуто относительно любой операции Т» Примеры. 1, Множество всех четных чисел замкнуто относительно сложения и умножения целых чисел. 2. Множество всех нечетных чисел замкнуто относительно умножения, но не замкнуто относительно сложения целых чисел. 3. Множество всех элементов (из Л), регулярных относительно ассоциативной операции Т» замкнуто относительно т. ПРЕДЛОЖЕНИЕ 1.8. Множество всех элементов, сим- метризуемых относительно ассоциативной бинарной операции Т, замкнуто относительно Т- Доказательство этого предложения непосредственно вытекает из теоремы 1.6. Пусть В — непустое множество, Вс Л, замкнутое относительно операции Т. Тогда на В можно определить бинарную операцию Т' следующим образом: a~T'b — a~Tb для любых a, b из В. Операция Т' называется ограничением операции Т множеством В, а операция Т — продолжением операции Т' на множество Л. Аддитивная и мультипликативная формы записи. Наиболее часто используются аддитивная и мультипликативная формы записи бинарной операции. При аддитивной форме записи бинарную операцию Т называют сложением и пишут а + Ь вместо a~yb, называя элемент а + b суммой а и Ь. Элемент, симметричный элементу а, обозначают (—а) и называют противоположным элементу а. Нейтральный элемент относительно сложения обозначают символом О и называют нулевым элементом относительно сложения. При аддитивной записи свойства ассоциативности и коммутативности записываются в виде a + (b + c) = (a + b) + c, a + b = b + a. 80
При мультипликативной форме записи бинарную операцию называют умножением и пишут а-Ъ (вместо аТЬ), называя элемент а-й произведением а и Ь. Элемент, симметричный а, обозначают агх и называют обратным элементу а. Нейтральный элемент относительно умножения обозначают через е или 1 и называют единичным элементом или единицей относительно умножения. При мультипликативной записи свойства ассоциативности и коммутативности записываются в виде a-(b-c) = (a-b)-c, a-b = b-a. Свойство дистрибутивности умножения относительно сложения записывается в виде (a + b)-c = a'C + b-c, c(a + b) = c-a-\-c-b. Конгруэнция. Пусть /? — отношение эквивалентности на множестве А и Т — бинарная операция на А. ОПРЕДЕЛЕНИЕ. Отношение эквивалентности R называется конгруэнцией относительно операции Т> если для любых элементов а, Ь, с, d множества А из aRc и bRd следует (aTb)R(cTd). ТЕОРЕМА 1.9. Пусть Т — бинарная операция на множестве А и R — конгруэнция относительно Т. Тогда равенство (1) (fl/R)T*{b/R) = (aTb)/R, где а, Ь^А, определяет бинарную операцию Т* на фактор-множестве A/R. Доказательство. Бинарное отношение Т* состоит из пар вида (2) {{a/R, Ь/R), {aTb)/R)> где a, b e= А. Надо доказать, что Т*—функция. Пусть «с/Я, d/R)9 (cTd)/R) e T*. Надо показать, что из равенства (3) (a/R, b/R) = {c/R, d/R) следует (aTb)/R = {cTd)/R. Из (3) следуют равенства a/R—c/R, b/R = d/R и соотношения (4) aRc, bRd. Так как R — конгруэнция относительно Т> то из (4) следует: (aTb)R(cTd) и (aTb)/R = (cTd)/R. 81
Следовательно, отношение Т* является бинарной операцией на фактор -множестве A/R. ? ОПРЕДЕЛЕНИЕ. Бинарная операция Т*» определенная на фактор-множестве A/R равенством (1), называется операцией, ассоциированной с операцией Т посредством конгруэнции R. Упражнения. 1. Пусть N*—множество всех целых положительных чисел и Т — операция на N* возведения в степень, т. е. ajb = ab для любых а, & е N*. Покажите, что операция Т не коммутативна и не ассоциативна. 2. Пусть а, Ь—фиксированные рациональные числа. Покажите, что отображение (х, у)\—>ах-\-Ьу, где х, у—любые рациональные числа, является бинарной ассоциативной операцией на множестве рациональных чисел. 3. Пусть N—-множество всех натуральных чисел и (х, /^—-наибольший общий делитель натуральных чисел х и у. Докажите, что отображение (я, у) \—>> (х, у) является коммутативной и ассоциативной бинарной операцией на множестве N. 4. Пусть [х, у] — наименьшее общее кратное натуральных чисел х vi у. Покажите, что отображение (х, у) i—> [х, у] является коммутативной и ассоциативной операцией на множестве N. 5. Пусть Р (U)— множество всех подмножеств непустого множества U. Множество ХДУ, определяемое формулой XAY = (X\Y)[)(Y\X), называется симметрической разностью множеств X и Y. Докажите, что А есть коммутативная и ассоциативная бинарная операция на множестве Р (U). Покажите, что операция fl дистрибутивна относительно операции А. 6. Приведите пример множества Л, отношения эквивалентности R на А и бинарной операции Т на Л таких, что (a) R — конгруэнция относительно Т» (b) R не является конгруэнцией относительно Т« § 2. АЛГЕБРЫ Понятие алгебры. Дадим определение основного понятия курса алгебры. ОПРЕДЕЛЕНИЕ. Алгеброй называется упорядоченная пара от? = (А, Q), где Л —непустое множество и Q — множество операций на Л. Таким образом, алгебра &? определяется двумя множествами: (a) непустым множеством Л, обозначаемым также через |<2^|; это множество называется основным множеством алгебры ©^, а его элементы — элементами алгебры о/?\ (b) множеством операций Q, определенных на Л и называемых главными операциями алгебры orf\ 82
Если (Л, Q) — алгебра, то говорят также, что множество Л есть алгебра относительно операций Q. ОПРЕДЕЛЕНИЕ. Алгебры <^ = <Л, Q) и <^=<В, Q'> называются однотипными, если существует инъективное отображение множества Q на Q', при котором любая операция fa из Q и соответствующая ей при отображении операция fa из Q' имеют один и тот же ранг. Наиболее частым является случай, когда множество Q конечно, т. е. Q = {fa ..., fa. В этом случае вместо записи <^ = (А, {fa ...,/,}> обычно употребляется запись <^ = <Л, fa ..., fs). Если среди главных операций fa..., fs алгебры есть нуль- местные, например />+1, ..., fa и аг+1, ..., as — элементы, которые они выделяют в \&?\, то употребляется также запись gt? = (A, fa ..., />, аг+1, ..., #у). При этом выделенные элементы аг+г, ..., as —- значения главнцх нульместных операций — называются выделенными или главными элементами алгебры о^. Типом алгебры gt? = (A, fa ..., /5) называется последовательность (г (fi), ..., г (fs))y где г (fi) — ранг операции fa Алгебры orf и SB = {B, f[, ..., /s> являются однотипными, если их типы совпадают, т. е. ранг операции ft совпадает с рангом соответствующей операции fi для i=l, ..., s. Примеры. 1. Пусть + и • (сложение и умножение) — арифметические операции на множестве Z целых чисел. Алгебра (Z, +, •} является алгеброй типа (2,2). 2. Пусть + и • суть арифметические операции на множестве N натуральных чисел. Алгебра <N, +, •) есть алгебра типа (2,2). 3. Пусть Р (U) — множество всех подмножеств непустого множества U и П» U» ' суть операции пересечения, объединения и дополнения над подмножествами множества U. Алгебра (P(U), f\, U > ') является алгеброй типа (2, 2, 1). ОПРЕДЕЛЕНИЕ. Алгебра <з^ = <Л, *, е) типа (2,0), где А — произвольное непустое множество, *•—ассоциативная бинарная операция на А, е — нейтральный элемент относительно *, называется моноидом. Пример. Пусть М —любое конечное непустое множество, Л —множество всех отображений М в М, * — опе- 83
рация композиции отображений М в М, ^ — тождественное отображение М в М. Тогда (А, *, /л) — моноид. Гомоморфизмы алгебр. Пусть ©^ и <$? — однотипные алгебры, /U —- произвольная главная операция алгебры &? и /^ — соответствующая ей главная операция алгебры SB. Говорят, что отображение h множества \&#\ в множество \S3\ сохраняет операцию Д* алгебры о/ё, если (1) /i(A*(%, ..., am)) = f&(h(ai), ..., h{am)) для любых al9 ..., ат из \а^\, где /я —ранг операции Д*. Отметим случай, когда Д# — нульместная операция, т. е. она выделяет какой-то элемент а алгебры о/?. Тогда соответствующая ей операция /<© тоже будет нульместной и, значит, выделит какой-то элемент Ъ алгебры SB. В этом случае условие (1) примет вид h(a) = b, т. е. выделенный элемент а алгебры orf переходит при отображении h в соответствующий ему выделенный элемент Ъ алгебры SB. ОПРЕДЕЛЕНИЕ. Гомоморфизмом алгебры &# в (на) однотипную алгебру SB называется такое отображение к множества \&?\ в (на) |g®|, которое сохраняет все главные операции алгебры &#> т. е. удовлетворяет условию (1) для любой главной операции f^ алгебры orf'. Гомоморфизм алгебры <зу? на SB называется эпиморфизмом. ОПРЕДЕЛЕНИЕ. Гомоморфизм h алгебры а^ на алгебру SB называется изоморфизмом, если h есть инъективное отображение множества |orf | на \SB\. Алгебры <з^ и SB называются изоморфными, если существует изоморфизм алгебры orf на SB. Запись orf^SB означает, что алгебры orf и SB изоморфны. ОПРЕДЕЛЕНИЕ. Гомоморфизм h алгебры orf в алгебру SB называется мономорфизмом или вложением, если h является инъективным отображением множества \&#\ в |с$?|. ОПРЕДЕЛЕНИЕ. Гомоморфизм алгебры orf в себя называется эндоморфизмом алгебры orf'. Изоморфизм алгебры orf на себя называется автоморфизмом алгебры о/?. Так, например, автоморфизмом алгебры o/Z является тождественное отображение множества \&6\ на себя. Пример. Пусть + есть операция сложения на множестве R действительных чисел и • есть операция умно- 84
жения на множестве R* положительных действительных чисел. Каждая из алгебр (R*, •, 1) и (R, + , 0) имеет тип (2, 0). Покажем, что они изоморфны. Рассмотрим отображение h: h(x) = \ogx для любого х из R*. Нетрудно видеть, что h есть отображение R* на R. Отображение /г инъективно, так как для любых х, у из R* выполняется условие: если logjc = log f/, то х = у. Кроме того, /г (1) = 0 и для любых х> у из R* имеем \og{xy)~ = \ogx-\-\ogy, т. е. h(x, y) = h(x)-{-h(y). Таким образом, отображение h сохраняет главные операции алгебры (R*, •, 1). Следовательно, h является изоморфизмом первой алгебры на вторую. ТЕОРЕМА 2.1. Пусть h — гомоморфизм алгебры os? в алгебру SB и g — гомоморфизм алгебры SB в алгебру Sf. Тогда их композиция g • h является гомоморфизмом алгебры о/? в алгебру *ё\ Доказательство. Пусть /> — произвольная главная операция алгебры o/Z (ранга т>0), /^-—соответствующая ей главная операция алгебры SB и /^ — главная операция алгебры ^, соответствующая операции /^. Надо доказать, что для любых элементов а19 ..., ат из \е??\ (1) g'h{f*(Ob ..., am)) = fo{g*h(ad, ..„g-ky. По определению композиции отображений g*h(f*(al9 ..., am)) = g(h(ft*(a1, ..., ат))). Так как, по условию, h и g — гомоморфизмы, то g(h(f^(alt ..., am)))=g(fa(h(a1), ..., Л(ат))) = = fe(fif(M«i)). ...» g(h(am)))=* = /^((g,^)(%). •••> (g*h)(am)). Следовательно, равенство (1) справедливо. Для нульмест- ных главных операций рассуждения проводятся аналогично. ? ТЕОРЕМА 2.2. Пусть h —гомоморфизм алгебры orf на алгебру SB и g — гомоморфизм алгебры SB на алгебру *ё\ Тогда их композиция g*h является гомоморфизмом алгебры от? на алгебру *ё. Эта теорема непосредственно следует из теоремы 2.1 и теоремы 2.3.4. 85
ТЕОРЕМА 2.3. Пусть h —изоморфизм алгебры &? на алгебру S3 и g —изоморфизм алгебры S3 на алгебру *ё. Тогда их композиция g*h является изоморфизмом алгебры о?? на алгебру ??. Доказательство. По теореме 2.1 из условия следует, что g"h есть гомоморфизм алгебры оЛ в алгебру ?f. Далее, по условию, h — инъективное отображение множества \&#\ на |<й?| и g — инъективное отображение множества \S3\ на |?f |. Согласно теоремам 2.3.9 и 2.3.4, отсюда следует, что g*h есть инъективное отображение множества \&?\ на |?f |. Следовательно, g*h является изоморфизмом алгебры od на алгебру If. ? ТЕОРЕМА 2.4. Пусть Ъ, —изоморфизм алгебры оЛ на алгебру S3. Тогда отображение /г1 является изоморфизмом алгебры So на алгебру <&€. Доказательство. По условию, h — инъективное отображение множества \е^\ на |в$?|. Поэтому, по следствию 2.3.14, h1 является инъективным отображением \33\ на \&?\. Пусть /^ — произвольная главная операция алгебры orf (ранга т) и /^-—соответствующая ей главная операция алгебры S3. Нам достаточно доказать, что для любых элементов bl9 ..., bm из \33\ (1) h-*(f*{bl9 ..., bm)) = U(h~1(b1), ..., h'Hbm)). Это условие равносильно следующему: (2) hdAh-Hh), ..., h-4bm)) = f^(bl9 ..., Ът). Так как, по условию, h — гомоморфизм алгебры ©^ на 33 > то =fa(h(h-1(b1)), ..., Чк-\Ьт))) = !я{Ьъ ...,Ьт)7 т. е. выполняется (2) и, значит, (1). Следовательно, /г1 является изоморфизмом алгебры S3 на алгебру &#. П ТЕОРЕМА 2.5. Отношение изоморфизма на каком-либо множестве алгебр является отношением эквивалентности. Доказательство. Тождественное отображение алгебры о/? на <з^, т. е. такое отображение Л, что h(a) = a для любого а из | <?А |, очевидно, является изоморфизмом алгебры &? на оЛ\ По теореме 2.3, отношение изоморфизма обладает свойством транзитивности. По теореме 2.4, отношение изоморфизма обладает свойством симметричности. Следовательно, отношение изоморфизма является отношением эквивалентности. ? 86
Подалгебры. Пусть / —/г-местная операция на множестве А и В —непустое подмножество множества А. В соответствии с понятием ограничения функции множеством говорят, что /г-местная операция g на В является ограничением операции / множеством В, если g(b±J ..., bn) = /(&i,..., bn) для любых Ъъ ..., Ьп из В. В частности, нульместная операция g на В является ограничением нульместной операции f на А множеством В, если g = f, т. е. если g и f выделяют в В и Л соответственно один и тот же элемент. Ограничение операции / множеством В будем обозначать символом f\B. Пусть о^ = (А, Q) и SB = <В, Q'} — однотипные алгебры. ОПРЕДЕЛЕНИЕ. Алгебра SB называется подалгеброй однотипной ей алгебры ©^, если В cz А и тождественное отображение множества В в Л является мономорфизмом алгебры <й? в алгебру ет^, т. е. для каждой главной операции fa алгебры SB fa(bv --.,bm) = fa(&!,..., Ьт) для любых &!,..., Ът из В, где /п —ранг операции fa, а /^ — главная операция алгебры SB, соответствующая fa. Напомним, что под тождественным отображением множества В в А понимается такое отображение А, что h(b) = b для любого элемента b из В. Легко показать, что данное выше определение подалгебры эквивалентно следующему. Алгебра SB называется подалгеброй однотипной ей алгебры ©^, если ВсЛ и каждая главная операция fa алгебры SB является ограничением соответствующей операции fa алгебры orf множеством В. Запись SB -? od означает, что алгебра SB есть подалгебра алгебры qs?. Пусть orf = (Л, Q) — алгебра и В cz Л. ОПРЕДЕЛЕНИЕ. Подмножество В множества \<з^\ называется замкнутым в алгебре &#, если В замкнуто относительно каждой главной операции fa алгебры от€, т. е. (1) !лфх> ..., Ьт)<=В для любых bl9 ..., bm из В, где т —ранг операции fa. Если /^ — нульместная операция, то условие (1) принимает вид f^^ S. Очевидно, если SB —2 е^, то множество | SB | замкнуто в алгебре orf\ 87
Из данных выше определений непосредственно вытекает следующая теорема. ТЕОРЕМА 2.6. Пусть от# = (А, f\, ..., fs)-алгебра и В — непустое подмножество множества А, замкнутое в алгебре &#. Тогда алгебра (2) 33 = (В, f±\B, ..., fs\B) является подалгеброй алгебры os€. Поскольку замкнутое в алгебре os? непустое подмножество В множества | &? | однозначно (указанным выше образом) определяет подалгебру 33, то вместо записи (2) для этой подалгебры употребляют запись 31 = (В, fu ..., /,>. Примеры. 1. Пусть + и • (сложенней умножение) — обычные арифметические операции на множестве Z целых чисел и N — множество натуральных чисел. Тогда алгебра <N, +> •) является подалгеброй алгебры (Z, +* •>. 2. Пусть Р ([/) —множество всех подмножеств непустого множества U, а П» U и ' суть соответственно операции пересечения, объединения и дополнения. Алгебра <{ф, U}, П, U» '} является подалгеброй алгебры (Р ((/), П> U» '}• ТЕОРЕМА 2.7. Если от€ — подалгебра алгебры 33 и 33 — подалгебра алгебры ff, то &? является подалгеброй алгебры *ё\ Доказательство. Wyziborf -^33.Тогда|<^|с:|<Й?| и (1) fa(<h> •••> <*m)=f*((h> •••> ат) Для любых ах, ..., ат из \о^\, где /^ — произвольная главная операция алгебры od \\ m — ее ранг, а Д® — соответствующая ей операция алгебры 38. Далее, если 33 -Iff, то \33\cz\ff\ и (2) f*(<h, ..., am) = f%(al9 ..., ат) для любых alf ..., am из |d®|, где f^ —главная операция алгебры Sf, соответствующая операции f&. Поэтому \&€\ci\ff\ и в силу (1), (2) f*(al9 ..., am) = f%(al9 ..., ат) для любых а±, ..., ат ИЗ |<2^|. Следовательно, <з^ является подалгеброй алгебры ff. П 88
ТЕОРЕМА 2.8. Бинарное отношение -§ {«быть подалгеброй») на множестве подалгебр алгебры о/l является отношением нестрогого порядка. Доказательство. Тождественное отображение множества 107%| на \е&\ есть мономорфизм алгебры о^ на orf. Следовательно, &? —\ orf', т. е. отношение —J рефлексивно. В силу теоремы 2.7 отношение Н транзитивно. Покажем, что отношение Н антисимметрично. Предположим, что подалгебры й и ^ алгебры я? удовлетворяют условиям (1) <ffi-^% и Г Н«5В. Тогда |^|с=|^|, |^|с:|сЖ| и, значит, (2) SB\ = \%\. Далее, в силу (1) для произвольной главной операции/^ алгебры SB (3) f&(bL9 ..., bm) = f<g(blt ..., 6m) для любых 6Х, ...,ЬШ из |<$?|, где т —ранг операции /^. В силу (2) и (3) (4) f^—f^ для любой главной операции /^ алгебры <$?. На основании (2) и (4) заключаем, что <^ = ^\ Следовательно, отношение -? антисимметрично. Итак, установлено, чю отношение Н рефлексивно, транзитивно и антисимметрично, значит оно является отношением нестрогого порядка. ? ТЕОРЕМА 2.9. Пересечение произвольной совокупности подмножеств множества \ orf \, замкнутых в алгебре о?', является множеством, замкнутым в алгебре о^. Доказательство. Пусть {Q| i е /} — произвольная совокупность подмножества Ct множества \о^\9 замкнутых в алгебре ©^, и С= [) Ct. Если С=ф, то теорема IG 1 верна, так как пустое множество замкнуто в о??. Рассмотрим случай, когда Сфф. Пусть /^ — произвольная главная операция алгебры ©т?, т — ее ранг и с19..., ст — любые элементы множества С. Тогда (1) Ufa, ...» cm)^Ci для каждого i из I, так как множество Ct замкнуто относительно операции /«*. В силу(1) U(clt ..., ст)<= П Q = C, 89
т. е. множество С замкнуто относительно всех главных операций алгебры о^. ? Пусть ©^ — алгебра, <1>{«*<1'е=1} — произвольная совокупность подалгебр o/Zi алгебры orf такая, что П I ©^ I — непустое множество. *€=1 ОПРЕДЕЛЕНИЕ. Пересечением совокупности (I) подалгебр алгебры erf называется подалгебра SB алгебры orf! такая, что \Щ = П 1^1- Корректность данного определения следует из того, что (по теореме 2.9) множество \SB\={\ \о>?1\ замкнуто в алгебре ©^, а также из того, что непустое замкнутое в алгебре &# подмножество \SB\ множества \orf\ (по теореме 2.6) однозначно определяет подалгебру алгебры os? с основным множеством \SB\. Запись SB = П &#i означает, что алгебра SB есть пере- сечение совокупности (I) подалгебр ©^ алгебры &?. Итак, если (I) — произвольная совокупность подалгебр алгебры е^ = (Л, fl9 ...,fs)такая, что П \^i\^=0» то i e i *" "*" алгебра SB> SB = (B, fx\B, ..., f,|J8>, где В = П | ©^/1» является пересечением алгебр совокуп- f el ности (I). ТЕОРЕМА 2.10. Если в алгебре orf среди главных операций есть хотя бы одна нульместнаяу то пересечение любой (непустой) совокупности подалгебр алгебры &? является подалгеброй алгебры orf. Доказательство. Действительно,если {&&i\i^l} — произвольная совокупность подалгебр алгебры о??, имеющей хотя бы одну нульместную главную операцию fa, то множество В = f| I q^i I не пусто, так как оно содержит ife I элемент, выделяемый операцией fa. Тогда множество В, замкнутое в е^ по теореме 2.9, однозначно определяет (по теореме 2.6) подалгебру алгебры &# с основным множеством В. ? Из определения подалгебры следует, что для любого непустого множества М элементов данной алгебры е^, М с: | ok |, существует наименьшая подалгебра SB> содержащая М. 90
Нетрудно видеть, что такой подалгеброй является пересечение всех подалгебр алгебры od', содержащих множество М. Эта наименьшая подалгебра В называется подалгеброй, порожденной множеством М, а М — системой образующих для алгебры Sd. Фактор-алгебра. Пусть е^ —алгебра и /?—-отношение эквивалентности на множестве \&€\. ОПРЕДЕЛЕНИЕ. Отношение R называется конгруэнцией или отношением конгруэнтности в алгебре оЛ\ если R является конгруэнцией относительно каждой главной операции /U алгебры <&?, т. е. для любых элементов аи blf ..., аш Ьт множества \<&?\ из (1) axRbly ..., amRbm следует (2) Ы(аъ ..., am)R[^(bl9 ..., Ьт), где т — ранг операции Д*. Пусть &# = (А, Q> —алгебра, R — конгруэнция в о^ и A/R — фактор-множество множества А по R. На множестве A/R определим m-местную операцию />/#, соответствующую операции /U из й, следующим образом: (3) Uir(oJR> ..., am/R)=U(al9 ..., am)/R для любых av ..., ат из А. Это определение корректно, так как в силу (2) значение правой части (3) не зависит от выбора элементов а19..., ат соответственно в классах эквивалентности ajR, ..., aJR (см. доказательство теоремы 1.9). Операция f^/R называется операцией, ассоциированной с операцией /U посредством конгруэнции R. Обозначим через Q* множество всех операций, ассоциированных с главными операциями алгебры oSl посредством конгруэнции R, &* = {/>//? I А* ^йЬ ОПРЕДЕЛЕНИЕ. Пусть е^ = <Л, Q> —алгебра и R — конгруэнция в (3^. Алгебра (A/R, Q*> называется фактор- алгеброй алгебры gt? по конгруэнции R и обозначается через Q7&IR. ТЕОРЕМА 2.11. Пусть R — конгруэнция в алгебре &?. Тогда отображение h мнооюества \orf\ в \orf\jR такое, что (П h(a) = a/R для любого а из\от€\, является гомоморфизмом алгебры &>€ нафактор-алгебру o^/R. 91
Доказательство. Из (1) следует, что h есть отображение \qp€\ на \&&\/R. Надо показать, что ft сохраняет все главные операции алгебры <&#. Пусть /U — произвольная главная операция алгебры orf и />/я — ассоциированная с ней главная операция фактор-алгебры orf[R. Тогда в силу (1) для любых а19 ... 9 ат из \&#\ h{f*(al9 ..., am)) = /U(axf ..., am)/R= = Uir\cliIR> ..., a>mlR) = = />/*(ft(tfi), ..., ft(am)), где m —ранг операции fa. Следовательно, ft является гомоморфизмом алгебры &# на фактор-алгебру &&/R. П Отметим, что гомоморфизм ft, определяемый с помощью (1), назьюается естественным гомоморфизмом алгебры о^ на фактор-алгебру &#/R. ТЕОРЕМА 2.12. Пусть h —гомоморфизм алгебры о^ в алгебру <?® и R —такое бинарное отношение на \о/?\% что для любых a, b из \ а# \ (1) aRb тогда и только тогда, когда h(a) = h(b). Тогда R является конгруэнцией в алгебре А. Доказательство. Отношение R есть отношение равнообразности отображения ft, и в силу теоремы 2.4.4 оно является отношением эквивалентности на \о/?\. Пусть /U — произвольная главная операция (ранга т) алгебры а? и f m —соответствующая ей главная операция алгебры <$?. В силу (1) для любых al9 bl9 ..., ат9 Ьт множества | &# | из (2) axRbl9 ..., amRbm следуют равенства (3) /i(a1) = A(&i), ..., h(am) = h{bm). Предположим, что элементы аъ bv ..., ami bm удовлетворяют условиям (2) и, следовательно, условиям (3). Тогда, поскольку ft — гомоморфизм orf в SB9 имеем h{fa(al9 ..., ат))=!т{Н{аг)9 ..., ft(am)) = = MW, ..., ft (&„))- = h(U(b1, ..., bm)). Таким образом, из (2) следует равенство ft(M%> ..., am)) = h(fa(bl9 ••> &«))• 92
Отсюда, по определению R, получаем (4) Ufa, ..., am)RU(bl9 ..., bm). Итак, для любых элементов аг, Ь19 ..., ат9 Ьт множества \&?\ из (2) следует (4). Следовательно, R является конгруэнцией в от?. ? Упражнения 1. Пусть +, • суть обычные операции сложения и умножения на множестве N натуральных чисел и h—отображение множества N в N такое, что h(x)=2x для всякого х из N. Докажите, что h является гомоморфизмом алгебры (N, +) в алгебру (N, •). 2. Пусть + и • суть обычные операции сложения и умножения на множестве R действительных чисел и а—фиксированное положительное действительное число. Пусть ft—отображение R в R такое, что h(x)=ax для всякого х из R. Докажите, что h является гомоморфизмом алгебры (R, +) в алгебру (R, • ). 3. Пусть й—гомоморфизм алгебры (Л, f) на алгебру (В, g)t где / и g—бинарные операции. Докажите, что: (a) если операция f коммутативна, то и операция g коммутативна; (b) если операция / ассоциативна, то и операция g ассоциативна; (c) если е—нейтральный элемент относительно операции f, то f(e) является нейтральным элементом относительно операции g; (d) если элемент х симметризуем относительно операции f, то элемент f (x) симметризуем относительно операции g; если элементы х и х' взаимно симметричны относительно операции f, то элементы / (х) и / (х') взаимно симметричны относительно операции g. 4. Пусть N—множество натуральных чисел, В = {2Х \ х е N}. Пусть h—отображение алгебры (N, +) на алгебру (В, •) такое, что для любого я из N верно равенство h(x)=2x, Покажите, что h является изоморфизмом. 5. Пусть R—множество действительных чисел, Rf—множество положительных действительных чисел, а — положительное действительное число, отличное от единицы. Пусть /i—отображение алгебры (R, +) в алгебру (RJ, •) такое, что h(x) = ax для каждого' х из R. Докажите, что h является изоморфизмом. 6. Пусть f—мономорфизм алгебры ©^ в S3 и g—мономорфизм алгебры S3 в алгебру ^. Докажите, что композиция g о f является мономорфизмом алгебры q? в алгебру W. 7. Приведите пример алгебры qjI и отношения эквивалентности R на | qj? |, которое не является конгруэнцией в алгебре &?. 8. Пусть h есть гомоморфизм алгебры qj? в алгебру S3. Докажите, что множество Im | q/? | (гомоморфный образ основного множества алгебры от?) замкнуто в алгебре S3. 9. Пусть h—гомоморфизм алгебры q^ в алгебру S3» Докажите, что алгебра <*, fi|*. ...» fsl*>. где ^ = Im | Q?g |, является подалгеброй алгебры S3^={S3t flf ..., fs). Эту алгебру называют гомоморфным образом алгебры q?? при гомоморфизме h. 10. Пусть h—гомоморфизм алгебры q^ в алгебру S3. Докажите, что гомоморфный образ алгебры &? при этом гомоморфизме изомор- 93
фен фактор-алгебре q??IR> где R—конгруэнция, порожденная гомоморфизмом h. 11. Докажите, что всякий гомоморфизм h алгебры qj? на алгебру <3$ есть композиция естественного гомоморфизма алгебры оД на свою фактор-алгебру и изоморфизма этой фактор-алгебры на алгебру <?/В. § 3. ГРУППЫ Понятие группы. Одним из частных случаев алгебр являются группы, которые играют большую роль в математике и ее приложениях. ОПРЕДЕЛЕНИЕ. Алгебра ? = <G, *, '> типа (2, 1) называется группой, если ее главные операции удовлетворяют условиям (аксиомам): (1) бинарная операция # ассоциативна, т. е. для любых элементов а, Ь, с из G а*(&*с) = (а#&)*с; (2) в G имеется правый нейтральный элемент относительно операции #, т. е. такой элемент е, что а*е = а для всякого элемента а из G; (3) для любого элемента а из G а*а'=е. Таким образом, группа — это непустое множество с двумя операциями на нем —бинарной операцией # и унарной операцией ', причем бинарная операция ассоциативна и обладает правым нейтральным элементом, а унарная операция есть операция перехода к правому симметричному элементу относительно бинарной операции и, значит, каждый элемент группы имеет правый симметричный ему элемент относительно, бинарной операции группы #. ОПРЕДЕЛЕНИЕ. Группа ? = <G, *, '> называется абелевой или коммутативной, если бинарная операция группы * коммутативна, т. е. для любых а, Ь из Ga*6 = = &*а. ОПРЕДЕЛЕНИЕ. Порядком группы $ = (G, #fc '> называется число элементов основного множества G группы, если G конечно. Если G — бесконечное множество, то группу Э называют группой бесконечного порядка. При изучении групп обычно используется мультипликативная или аддитивная форма записи главных операций группы. При мультипликативной записи бинарную операцию группы называют умножением и пишут а-Ь (или аЬ) вместо а * Ь, называя элемент а • Ь произведением элементов а и Ь. Элемент, симметричный а, обозначают а1 и называют обратным элементу а. Нейтральный элемент относительно умножения обозначают через е, 1 или 1у и назы- 94
вают единичным элементом или единицей группы. При мультипликативной записи приведенное выше определение группы формулируется следующим образом. Алгебра & = (G, •, ~х> типа (2,1) называется группой, если ее главные операции удовлетворяют условиям: (1) бинарная операция • ассоциативна, т. е. для любых элементов а, Ь, р из G верно равенство a-(b-c) = (a-b)-c\ (2) в G имеется правая единица, т. е. такой элемент е, что а-е~а для всякого элемента а из G; (3) для любого элемента а из G выполняется равенство а-а Л=е. Понятие натуральной степени ап элемента а мультипликативной группы <G, •, -1) определяется следующим образом: а° = е, ап = а-а ... а для /jgN\{0}. При аддитивной записи бинарную операцию группы называют сложением и пишут а + & вместо а $6, называя элемент а + b суммой элементов а и Ь. Элемент, симметричный элементу а, обозначают (—а) и называют противоположным элементу а. Нейтральный элемент относительно сложения обозначают символом 0 или 03 и называют нулевым элементом или нулем группы. При аддитивной записи определение группы формулируется следующим образом. Алгебра & = (G, +> —) типа (2,1) называется группой, если ее главные операции удовлетворяют условиям: (1) бинарная операция -J- ассоциативна, т. е. для любых элементов а, Ь9 с из G имеем a + (b+c) = (a + b)+c; (2) в G имеется правый нуль, т. е. такой элемент О, что а+0 = а для всякого элемента а из G; (3) для любого элемента а из G # + (—а) = 0. Примеры групп. 1. Пусть Q —множество всех рациональных чисел с обычным сложением и унарной операцией —, операцией перехода от числа а к противоположному числу (—а). Алгебра $ = (Q, +t —> типа (2, 1) является группой. Она называется аддитивной группой рациональных чисел, 2. Пусть Q* —множество всех отличных от нуля рациональных чисел с обычным умножением и унарной операцией "^ — операцией перехода от числа а к обратному числу а1. Алгебра (2* = (Q*, •, _1> является группой. Эта группа называется мультипликативной группой рациональных чисел. 95
3. Пусть R —множество всех действительных чисел с обычным сложением и унарной операцией —, ставящей в соответствие каждому действительному числу г противоположное число —г. Алгебра <s^+ = <R, -)-> —) является группой. Она называется аддитивной группой действительных чисел. 4. Пусть R*—-множество всех отличных от нуля действительных чисел с обьиным умножением и унарной операцией -1, ставящей в соответствие каждому отличному от нуля числу г обратное число г1. Алгебра e%J*==(R*, ., -1) является группой. Эта группа называется мультипликативной группой действительных чисел. 5. Пусть Sn — совокупность всех подстановок множества М = {1, ..., п}, т. е. совокупность ииъективных отображений этого множества на себя. Пусть Sn = (Sn9 •, ~1> — алгебра с бинарной операцией « — композицией отображений, и унарной операцией -1, ставящей в соответствие функции / из Sn обратную ей функцию /Л Эта алгебра является группой. В самом деле, по теореме 2.3.10, композиция любых двух подстановок множества М есть подстановка этого множества. По теореме 2.3.5, композиция подстановок ассоциативна. Тождественная подстановка iM есть нейтральный элемент относительно композиции подстановок. Для любой подстановки f множества М f»f-1 = = iM. Эта группа называется симметрической группой подстановок степени п\ она имеет порядок /г! и не коммутативна при п>2. 6. Пусть G — множество всех векторов данной плоскости с обычной операцией + сложения векторов и унарной операцией —, ставящей в соответствие каждому вектору v противоположный вектор (—v). Алгебра (G, -f~> ~~) является группой. Эта группа называется аддитивной группой векторов плоскости. 7. Пусть G — множество всех вращений плоскости вокруг данной точки О. Вращение плоскости рассматривается как преобразование плоскости, т. е. инъективное отображение плоскости на себя. Два вращения на углы аир рассматриваются как совпадающие, если а — (5 = 2шт, где /г —целое число. Композиция ф • яр двух вращений г|э и ф соответственно на углы аир есть вращение на угол а + р. Если г|) — вращение на угол а, то ар-1 —вращение на угол (—а). Алгебра (G, -, -1> является группой. Она называется группой вращений плоскости вокруг данной точки. 96
8. Пусть Нп — множество, состоящее из п вращений данной плоскости на углы 2/гл/п, & = О, 1, ..., я — 1, вокруг данной точки О, отображающих правильный /г-угольник с центром в точке О на себя. Алгебра (НПУ •, -1) является группой. Она называется группой вращений правильного п-угольника. 9. Пусть G — множество всех вращений пространства вокруг точки О, отображающих данное правильное тело (тетраэдр, куб, икосаэдр, додекаэдр) с центром в точке О на себя. Алгебра <G, •, -1) является группой. Она называется группой вращений {самосовмещений) данного правильного тела. Простейшие свойства группы. Ниже используется мультипликативная форма записи операций группы. СВОЙСТВО 3.1. Для любого элемента а группы ала = е, т. е. правый обратный к а элелЬент является также левым обратным. Доказательство. Из второй и третьей аксиом группы следует, что аг1 = а-ге = яг1 (аа-1) = (а^а) агх. В силу аксиом группы отсюда вытекают равенства а~1а = (а~1а) е = (а-га) (а-1 (а-1)-1) = ((агЧ) а'1) (а~1)-1 = = а~г (а-1)-1 = е, т. е. аг1а = е. ? СВОЙСТВО 3.2. Для каждого элемента а группы элемент а~г является единственным обратным элементом. Каждый элемент а группы имеет единственный правый и единственный левый обратный элемент, причем оба они совпадают с а1. Это свойство непосредственно вытекает из определения обратного элемента, свойства 3.1, теоремы 1.4 и следствия 1.5 из нее. СВОЙСТВО 3.3. Для любого элемента а группы еа = а, т. е. правая единица является также и левой единицей. Доказательство. Из аксиом группы и свойства 3.1 следует, что еа — (аа-1)а = а(а-1а) = ае = а, т. е. еа = а. ? СВОЙСТВО 3.4. Элемент е группы является единственным единичным элементом группы. Он оюе является 97
единственным левым и единственным правым единичным элементом группы. Это свойство непосредственно следует из определения единичных элементов, свойства 3.3, теоремы 1.1 и следствия 1.2 из нее. СВОЙСТВО 3.5. Для любых элементов а, Ь группы каждое из уравнений ах = Ь и уа = Ь относительно переменных х и у имеет в группе единственное решение. Доказательство. Элемент а~хЬ есть решение уравнения ах = Ь, так как a(a-1b) = (aa-l)b = eb = b. С другой стороны, если с — произвольное решение уравнения ах = Ь, то с = ес = (а-1а)с = а1(ас) = а'1Ь. Следовательно, элемент а~гЬ является единственным решением первого уравнения. Аналогично доказывается, что элемент Ьа~г является единственным решением второго уравнения. ? СВОЙСТВО 3.6 (закон сокращения). Для любых элементов а, Ь, с группы из ас = Ьс следует а — Ь и из са = = cb следует а = Ь. Доказательство. Если ас — Ьсу то а и b являются решениями уравнения ус = Ьс. По свойству 3.3 отсюда следует, что а = Ь. Аналогично доказывается, что из са = — cb следует а = 6. ? СВОЙСТВО 3.7. Для любых элементов а, Ь, с группы из ab = a следует Ь = е и из са = а следует с —е. Доказательство, Если ab = a, то ab = ae. По закону сокращения, из ab = ae следует Ь = е. Аналогично, из са = а следует са = еа и с = е. ? СВОЙСТВО 3.8. В группе элемент а есть обратный к а~19 т. е. (а-1)~1=а. Доказательство. По третьей аксиоме группы, (а'1) (а~1)-1 = е. По свойству 3.1, а-га = е. Таким образом, а1 (а~гу1 = а га. По закону сокращения, отсюда следует равенство (а 1) г=а. ? СВОЙСТВО 3.9. Для любых элементов а, Ъ группы из ab=e следует, что Ь = аг и а = Ь~1. Это свойство непосредственно вытекает из определения обратного элемента и свойства 3.2. Гомоморфизмы групп, В соответствии с определением гомоморфизма алгебр и с тем, что группы — частный случай алгебр, дадим следующие определения. Пусть ^ = <G, ¦, -1) и еЯГ = -<Я, °, -^ — мультипликативные группы. Говорят, что отображение h множества G в Н сохраняет главные операции группы <^, если выполняются 98
условия: (1) h{ab) = h{a)°h{b) для любых а, Ь из G; (2) h (а-1) = (h (а))-1 для любого а из G. ОПРЕДЕЛЕНИЕ. Гомоморфизмом группы & в (на) группу з%" называется отображение множества G в (на) Я, сохраняющее главные операции группы &. Гомоморфизм группы & на d?T называется эпиморфизмом. ОПРЕДЕЛЕНИЕ. Гомоморфизм К группы & на группу <Ж называется изоморфизмом, если h является инъектив- ным отображением множества G на Н. Группы & и <Ж называются изоморфными, если существует изоморфизм группы & на вйГ. Запись 3"^<Ж означает, что группы <# и ©%" изоморфны. ОПРЕДЕЛЕНИЕ. Гомоморфизм h группы & в группу ©%" называется мономорфизмом или вложением, если /г является инъективным отображением множества G в Н. ОПРЕДЕЛЕНИЕ. Гомоморфизм группы & в себя называется эндоморфизмом группы &. Изоморфизм группы & на себя называется автоморфизмом группы &. Так, например, автоморфизмом является тождественное отображение группы на себя. ТЕОРЕМА 3.1. Если отображение /г группы &-=. = <G, •, -1) в группу ©%" = <#, °, -1) сохраняет бинарную операцию группы <&, т. е. (1) h(ab) = h(a)ofi(b) для любых a, b из G, то h переводит единицу группы & в единицу группы <Ж и является гомоморфизмом. Доказательство. Пусть е — единица группы & и ё=!г(е). В силу (1) h(e-e) = h(e)°h(e) = h(e), т. е. ё°ё = = е\ Отсюда, по свойству 3.7, следует, чтоб' является единицей группы <а%". Пусть а —любой элемент группы &. В силу (1) из а-а-1 = е следует h(a)^h{a1) = e. По свойству 3.9, отсюда вытекает, что (2) h (a"1) = (h (а))"1 для любого а из G. На основании (1) и (2) заключаем, что h является гомоморфизмом группы & в ©%". ? ТЕОРЕМА 3.2. Отношение изоморфизма на каком- нибудь множестве групп рефлексивно, транзитивно и симметрично, т. е. является отношением эквивалентности. 99
Эта теорема непосредственно следует из теоремы 2.5. Примеры. 1. Пусть Q* — множество всех рациональных чисел, отличных от нуля, и <2* = (Q*, •, -^ — мультипликативная группа рациональных чисел. Пусть Q+ — множество всех положительных рациональных чисел и $+ = (Q+, ., -^ — мультипликативная группа положительных рациональных чисел. Отображение h множества Q* на Q+, определяемое формулой h (а) = \ а | для каждого а из Q*, где | а | — абсолютное значение числа а, сохраняет главные операции группы $*. В самом деле, для любых а, Ъ из Q* верны равенства | аЬ | = | а \ \ Ь | и | сг1 | = | а |-1. Следовательно, отображение h является гомоморфизмом группы $* на Й+. 2. Пусть R+ —множество всех положительных действительных чисел и e^+ = (R+> •, -^ — мультипликативная группа положительных действительных чисел. Пусть R — множество всех действительных чисел и e^ = (R, +» —> — аддитивная группа действительных чисел. Рассмотрим отображение f: R+->R, определяемое формулой f (х)) = log x. Функция / есть инъективное отображение множества R+ на R, сохраняющее главные операции группы е^+. В самом деле, для любых х9 у из R+ log (*У) = log л: + log у, log (х-1) = — log x. Следовательно, / является изоморфизмом группы g#+ на группу ей*. 3. Пусть g —отображение множества R на R+, определяемое формулой g(x) = 2x. Отображение g есть инъективное отображение R на R+ и сохраняет главные операции аддитивной группы e^ = (R, +, —>, так как г*** = 2*2* и 2~х = (2х) Л Следовательно, g является изоморфизмом аддитивной группы <М на мультипликативную группу <^+ = <R, ., -1). Подгруппы. Пусть ^ = <G, •, -^ — группа. ОПРЕДЕЛЕНИЕ. Подгруппой группы & называется любая подалгебра этой группы. Более подробно в соответствии с определением подалгебры определение подгруппы можно сформулировать следующим образом. Алгебра о%" = (Н, ©, -1) типа (2, 1) называется подгруппой группы & = (G, •, -1), если HczG и тождественное отображение множества Н в G является моно- 100
морфизмом алгебры <?%* в ^, т. е. выполняются условия: (1) aQb=a-b для любых а, Ъ из Я; (2) а-1 = а-1 для любого а из Я. Запись ©%" —> <^ означает, что алгебра <Ж* является подгруппой группы «?. Если <а%"-^, то из определения подгруппы следует, что множество Я замкнуто в группе &, значит применение любой главной операции группы & к элементам из Я приводит снова к элементу из Я. Кроме того, в силу условий (1) и (2) каждая главная операция алгебры <?%' является ограничением соответствующей главной операции группы & множеством Я. ТЕОРЕМА 3.3. Любая подгруппа группы является группой. Нейтральный элемент группы является нейтральным элементом любой ее подгруппы* Доказательство. Пусть о%^ = (Я, 0, -^ — подгруппа мультипликативной группы <^ = (G, •, -1) и е — нейтральный элемент группы ^. Бинарная операция 0 алгебры <Ж ассоциативна, так как в силу (1) для любых а, Ь, с из Я имеем а 0 (6 0 с) = а • (Ь • с) = (а • Ъ) • с = (а 0 Ь) © с. Элемент е принадлежит Я, так как в силу (1) и (2) для любого а из Я имеем е = а- а1 = а 0 а -1 еЯ. В силу (1) для любого а из Я верны равенства а©? = а-е = а, т. е. б является правым нейтральным элементом относительно операции 0. В силу (2) для любого а из Я получаем а 0 а~г=а • а-1 = г, т. е. а0ал = ^. Следовательно, алгебра о5Г является группой и в —ее нейтральный элемент. П Пусть & = (Gt •, _1> — мультипликативная группа и Л —непустое подмножество множества G, замкнутое относительно главных операций группы ^. Пусть © и -1 — ограничения главных операций группы & множеством Л, т. е. aQb = a-b для любых a, b из Л; а-1=а~1 для любого а из Л. Тогда, по теоремам 2.6 и 3.3, алгебра (3) ^ = <Л, ©, -1) 10!
является подгруппой группы &. Таким образом, подгруппа &6 группы & однозначно определяется непустым подмножеством А, замкнутым в &. Поэтому вместо записи (3) пишут: «подгруппа &# = (А, •, _1>» или говорят: «множество А является подгруппой группы & относительно операций • и -1». ТЕОРЕМА 3.4. Бинарное отношение -3 («быть подгруппой») на множестве подгрупп данной группы рефлексивно, транзитивно и антисимметрично и, следовательно, является отношением нестрогого порядка. Эта теорема есть частный случай теоремы 2.8. ТЕОРЕМА 3.5. Пересечение произвольной (непустой) совокупности подгрупп группы & является подгруппой группы &. Эта теорема непосредственно следует из теоремы 3.3. Из теоремы 3.6 следует, что для любого множества М элементов группы & существует наименьшая подгруппа «ЯГ, содержащая М. Нетрудно видеть, что Ж' является пересечением всех подгрупп группы &, содержащих М. Эта наименьшая подгруппа <Ж называется подгруппой, порожденной множеством М, а М—множеством образующих или системой образующих группы <Ж\ ОПРЕДЕЛЕНИЕ. Группа называется циклической, если она порождается одним элементом (одноэлементным множеством). Примеры. 1. Пусть g^+ = (R > + > —) — аддитивная группа действительных чисел. Множество Q рациональных чиеел есть подмножество множества R, замкнутое относительно главных операций группы g%V. Следовательно, алгебра $ = (Q, +, —), аддитивная группа рациональных чисел, является подгруппой группы е^+. 2. Пусть <2%>* = <R*, •, -^ — мультипликативная группа действительных чисел. Множество Q* отличных от нуля рациональных чисел есть подмножество множества R*, замкнутое относительно главных операций группы е%**. Следовательно, алгебра $* = (Q*, ., -1), мультипликативная группа рациональных чисел, является подгруппой группы 3. Пусть ^ = <G, % -^ — группа вращений плоскости вокруг данной точки О и Нп — множество, состоящее из п вращений плоскости вокруг точки О, отображающих правильный п-угольник с центром в точке О на себя. Множество Нп замкнуто относительно главных операций группы <&. Следовательно, алгебра «ЙГЯ = (#Я, о, -*), группа 102
вращений правильного n-угольника, является подгруппой группы ^. Упражнения 1. Выяснить, являются ли следующие множества рациональных чисел замкнутыми относительно главных операций аддитивной группы рациональных чисел: (a) множество всех целых чисел; (b) множество всех натуральных чисел; (c) множество всех четных целых чисел; (d) множество всех целых чисел, кратных данному целому п; (e) множество всех нечетных целых чисел; (f) множество всех рациональных чисел с нечетными знаменателями; (g) множество всех рациональных чисел с четными знаменателями. 2. Выяснить, являются ли следующие множества рациональных чисел замкнутыми относительно главных операций мультипликативной группы рациональных чисел: (a) множество {1, —1}; (b) множество всех отличных от нуля чисел с четными знаменателями; (c) множество всех отличных от нуля рациональных чисел с нечетными знаменателями; (d) множество всех целочисленных степеней числа 2; (e) множество {рп\п—целое число}, где р — простое число. 3. Составьте таблицу умножения для элементов следующих групп; (a) группа вращений правильного треугольника; (b) группа вращений квадрата; (c) группа вращений правильного пятиугольника; (d) аддитивная группа классов вычетов по модулю 5; (e) мультипликативная группа классов вычетов по модулю 5, взаимно простых с числом 5; (f) группа всех симметрии ромба; (g) группа всех симметрии правильного треугольника; (h) симметрическая группа подстановок третьей степени; (i) группа симметрии прямоугольника, не являющегося квадратом; (j) группа всех симметрии квадрата. 4. Докажите с помощью индукции, что порядок симметрической группы подстановок степени п равен п\ 5. Докажите, что если а2=е (е-— единичный элемент группы) для любого элемента а мультипликативной группы, то группа абелева. 6. Пусть g и h—элементы мультипликативной группы ^. Определим степень с отрицательным показателем: а~л=(а_1)л. Докажите, что для любых чисел т и п: (a) fcri)* = <g*)-i; (Ы Ртап = ртп+п» (С) (gm^n^gmn; (d) {g-h)m—gm-hm, если ^—-абелева группа* 7. Докажите, что всякая группа с четырьмя или меньшим числом элементов абелева. 8. Покажите, что всякая группа с тремя элементами является циклической. Докажите, что любые две группы, имеющие по три элемента каждая, изоморфны. 103
9. Пусть ^ — аддитивная абелева группа и « — целое число. Покажите, что отображение х i—>¦ пх является эндоморфизмом группы ^. 10. Покажите, что отображение х i—>¦ 3* является изоморфизмОхМ аддитивной группы действительных чисел на мультипликативную группу положительных действительных чисел. 11. Докажите, что симметрическая группа подстановок третьей степени изоморфна группе симметрии правильного треугольника. 12. Докажите, что группа вращений квадрата не изоморфна группе симметрии ромба. 13. Пусть ^—мультипликативная абелева группа. Покажите, что отображение х \—>¦ лг1 является автоморфизмом группы ^. 14. Докажите, что группа симметрии правильного тетраэдра изоморфна симметрической группе подстановок четвертой степени. 15. Докажите, что алгебра, изоморфная группе, является группой. § 4. КОЛЬЦА Понятие кольца. Кольца, как и группы, являются очень важным частным случаем алгебр. ОПРЕДЕЛЕНИЕ. Кольцом называется алгебра Ж = — (К, +, —, •, 1> типа (2, 1, 2, 0), главные операции которой удовлетворяют следующим условиям: (1) алгебра (/(, +» —> есть абелева группа; (2) алгебра (К, •, 1> есть моноид; (3) умножение дистрибутивно относительно сложения, т. е. для любых элементов а, Ь9 с из К (a + b)-c = a-c + b-c, с-(а + Ь) = с-а-\-с-Ь. Основное множество К кольца Ж обозначается также через | Ж |. Элементы множества К называются элементами кольца Ж. ОПРЕДЕЛЕНИЕ. Группа <#, +, —> называется ад- дативной группой кольца Ж'. Нуль этой группы, т. е. нейтральный элемент относительно сложения, называется нулем тльца и обозначается через 0 или 0^. ОПРЕДЕЛЕНИЕ. Моноид (К, ¦, 1) называется мультипликативным моноидом кольца Ж. Элемент 1, обозначаемый также через 1^, являющийся нейтральным относительно умножения, называется единицей кольца Ж. Кольцо Ж называется коммутативным, если a-b = b-a для любых элементов a, b кольца. Кольцо Ж называется нулевым, если \Ж\ = Ю^\ ОПРЕДЕЛЕНИЕ. Кольцо Ж называется областью целостности, если оно коммутативно, 0^=^=1^; и для любых а,Ь?К из а-Ь = 0 следует а = 0 или & = 0. ОПРЕДЕЛЕНИЕ. Элементы а и b кольца Ж назы- 104
ваются делителями нуля, если афО, ЬфО и а6-=0 или Ьа = 0. Отметим, что любая область целостности не имеет делителей нуля. Примеры. 1. Пусть Q—множество всех рациональных чисел и QlY2\ = {a + bY2\a, 6eQ}. Алгебра 6[K2] = <Q[l/"2], +,-,., 1> типа (2, 1, 2, 0), где + » • суть обычные операции сложения и умножения действительных чисел и — есть унарная операция перехода от данного числа к противоположному, является коммутативным кольцом. 2. Пусть К — множество всех действительных функций, определенных на множестве R действительных чисел. Сумма f+gy произведение f-g, функция (—f) и единичная функция 1 определяются как обычно, а именно: tf+g)(x)=Hx)+g(x); (f-gHx)=H*)-g(x); (- f)(x) = -f(x); Непосредственная проверка показывает, что алгебра (/С, +, —, •, 1) является коммутативным кольцом. 3. Пусть Ж = (/(, -f-> —, ., 1) — произвольное кольцо. Таблица вида [с d{ где а, Ь, с, d — элементы из /С, называется квадратной матрицей второго порядка над SfC или 2 х 2-матрицей над Ж. Множество всех 2х2-матриц над Ж обозначим через /С2х2. На этом множестве введем отношение равенства. Матрицы называют равными и пишут [с dl^lghl если а = е, &=/, c = g, d = h. 105
Матрицы /==[о?]и[оо] называются единичной и нулевой соответственно. На множестве 2х2-матриц над &? операции сложения, умножения и унарная операция — определяются следующим образом: Га 61 Га3 ЬЛ[а+а1 Ь + ЬЛ \_с dP'Vd dj 1с+сг d + dj; га bl[— a —b~\ Ic d] L—с —d\\ [а Ь~\ fa 6Х"1 Гаа1 + Ьс1 ab1 + bd{\ с d] id d1j^[cal + dc1 cbi + dd^A. Непосредственно проверяется, что алгебра (/С2*2, +, —) есть абелева группа, алгебра </(2*2, •, /> — моноид и умножение матриц дистрибутивно относительно сложения. Следовательно, алгебра (К2х2> +, —, •, /> является кольцом, причем некоммутативным. Это кольцо называется кольцом 2 х 2-матриц над SfC и обозначается символом с/?2х2. Простейшие свойства кольца. Пусть &? — кольцо. Так как алгебра (К, +, —> есть абелева группа, то в силу свойства 3.5 для любых элементов a, b из К уравнение Ь+х = а имеет единственное решение а + (—Ь), которое обозначается также через а — Ь. ТЕОРЕМА 4.1. Пусть Ж = (К, +, —, •, I) —кольцо. Тогда для любых элементов а, Ь, с кольца: (1) если а + Ь = а, то & = 0; (2) если а + Ь = 0, то Ь = — а; (3) _(_а) = а; (4) 0.а = а.0 = 0; (5) <— а) Ь = а (— Ь) = — (ab); (6)(-а)(-6) = а-Ь; (7) (a — b)c = ac — bc и c(a — b) = ca — cb. Доказательство. (1) Если a-j-b = a, то b = 0 + b = (— a+a) + b = — а + (а + Ь) = — а+а = 0. (2) Если а + Ь = 0> то ft = 0 + b = (—а + а) + 6=-а + (а + Ь) = —а+0 = —а. (3) В аддитивной группе кольца (— а) + (— (— а)) = = — а+а. Отсюда, по закону сокращения, следует равенство — (—а) — а. 106
(4) В силу дистрибутивности умножения относительно сложенияО-а + 0-а = (0 + 0)*а = 0-а, т. е. 0-а + 0-а = 0-а. В силу (1) из последнего равенства следует 0-а = 0. (5) В силу (4) и дистрибутивности умножения относительно сложения ab + (—а)Ь = (а+(—а))Ь = 0-6 = 0, т. е. ab + (— а) Ь = 0. Отсюда в силу (2) следует (— а) Ъ = — (аЪ). Аналогично доказывается, что а(—&) = — (ab). (6) В силу (5) и (3) (_а).(—ft) = —((—а)-6) = = _(—(а6)) = а-6. (7) В силу (5) и дистрибутивности умножения относительно сложения (а — Ь)• с = (а + (— 6))• с = а• с + (— Ь)-с = = а • с+(— b'C) = a-c — b-c. Аналогично доказывается, что c-(a—b) = c-a — c-b. ? Гомоморфизмы колец. В соответствии с определением гомоморфизма алгебр и с тем, что кольца —< частный случай алгебр, дадим следующие определения. Пусть Ж = <#,+,-, о, 1) и ЯГ'= <*',+,—, •, 1'> — кольца. Говорят, что отображение h множества К в К' сохраняет главные операции кольца Ж, если выполнены условия: (1) h{a + b) = h(a)-{-h(b) для любых a, b из К] (2) h(—а) = — /г (а) для любого а из /С; (3) h(ci'b)=h(a)°h(b) для любых а, Ь из К\ (4) /i(l)= 1'. ОПРЕДЕЛЕНИЕ. Гомоморфизмом кольца Ж в (на) кольцо Ж' называется отображение множества К в (на) К', сохраняющее все главные операции кольца Ж. Гомоморфизм кольца Ж на Ж1 называется эпиморфизмом. ОПРЕДЕЛЕНИЕ. Гомоморфизм h кольца Ж на кольцо Ж' называется изоморфизмом, если h является инъективным отображением множества К на К'< Кольца Ж и Ж1 называются изоморфными, если существуют изоморфизм кольца Ж на Ж1. Запись Ж^Ж' означает, что кольца Ж и Ж' изоморфны. ОПРЕДЕЛЕНИЕ. Гомоморфизм h кольца Ж в кольцо Ж' называется мономорфизмом или вложением, если h является инъективным отображением множества /С в /С'. ОПРЕДЕЛЕНИЕ. Гомоморфизм кольца Ж в себя называется эндоморфизмом кольца Ж. Изоморфизм кольца Ж на себя называется автоморфизмом кольца Ж. Так, например, автоморфизмом кольца является тождественное отображение кольца на себя. 107
ТЕОРЕМА 4.2. Если отображение h кольца Ж в кольцо Ж' переводит единицу кольца Ж в единицу кольца Ж' и сохраняет операции сложения и умножения^ т. е. h(x+y) = h(x)~\~h(y) для любых х, у из К, h(xy) = h(x)<h(y) для любых х, у из К, то h переводит нуль кольца Ж в нуль кольца Ж' и является гомоморфизмом. Доказательство. Рассмотрим аддитивные группы (К, +, -> и <*', +, -> колец Ж и Ж'. По условию, h сохраняет операцию сложения. Отсюда, согласно теореме 3.1, следует, что h переводит нуль кольца Ж- в нуль кольца Ж' и является гомоморфизмом группы (К, +, —) в группу (К', +, —>. В частности, h(—х) = — h(x) для любого х из К- Следовательно, отображение h сохраняет все главные операции кольца Ж и является гомоморфизмом. ? ТЕОРЕМА 4.3. Отношение изоморфизма на каком-нибудь множестве колец рефлексивно, транзитивно и симметрично и, значит, является отношением эквивалентности. Эта теорема непосредственно следует из теоремы 2.5. Примеры. 1. Пусть Q — множество рациональных чисел, Q[V2] = {a + bV2\a9 b<=Q}. Алгебра & [V2] = = \Q[|/j>], +, —, •, 1) является кольцом. Отображение /: Q []/l>]-> Q tycA> определяемое формулой f(a + b У 2) = = а —6]/"2, есть инъективное отображение множества Q[]/r2] на себя. Отображение f сохраняет главные операции кольца Q["|/r2]. Действительно, для любых х = а + + Ь]/"2 и у=*с+йУ2 f(xy) = f(ac + 2bd + (ad + bc)V2) = (ac + 2bd)- -(ad + bc)Vl = (a-bV^)(c-dV2)j=f(x)f(y); f(x+y) = f{a + bV2+c + dV2) = a-bV2 + b- -dV2=f(x)+f(yY> f(lfl)=1=slfi[/2]- Следовательно, отображение / является автоморфизмом кольца & []/2]. 2. Пусть К — множество всех матриц вида 9< с рациональными а и b и Ж = (Ку +, —, •, 1> — кольцо таких 108
матриц. Отображение h: Q []А2] -> К, определяемое формулой есть инъективное отображение множества Q["K2] на /С. Нетрудно проверить, что отображение h сохраняет главные операции кольца fi[l/"2]. Следовательно, h является изоморфизмом кольца й["|/^2] на кольцо <Ж\ 3. Пусть L —множество всех матриц вида L А называемых диагональными, с рациональными а и ft. Алгебра i? = (L, +» —, •, />, где / = L - является кольцом. Отображение f :L->-Q, определяемое формулой не а = а для любых а, 6 из Q, есть отображение, сохраняющее главные операции кольца X. Следовательно, / является гомоморфизмом кольца 35 на кольцо & рациональных чисел. Подкольца. Пусть & = (К, -f> —> •» 1) — кольцо. ОПРЕДЕЛЕНИЕ. Подкольцом кольца Ж называется любая аодалгебра этого кольца. Более подробно в соответствии с определением подалгебры определение подкольца можно сформулировать следующим образом. Алгебра <2? = <L, ©, 0, 0, 1#) типа (2, 1, 2, 0) называется подкольцом кольца &?\ если L cz К и тождественное отображение множества L в К является мономорфизмом алгебры с5? в УС, т. е. выполняются условия: (1) а06 = а + & для любых а, Ь из L; (2) © а = — а для любого а из L; (3) а © b = a-b для любых а, & из L; (4) 1€г=1ЙГ- Запись 35 -^ofC означает, что алгебра X является подкольцом кольца &?\ Если <% Ч> 3%, то из определения подкольца следует, что множество L замкнуто относительно каждой главной операции кольца &СУ т. е. применение любой главной операции кольца &? к элементам из L приводит снова к элементам множества L. Кроме того, в силу условий (1)—(4) 109
каждая главная операция алгебры X является ограничением соответствующей главной операции кольца SK множеством L. ТЕОРЕМА 4.4. Любое подкольцо кольца является коль- цом. Нуль и единица кольца являются нулем и единицей любого его подкольца. Доказательство. Пусть c3? = <L, 0, ©, 0, Ijs) — подкольцо кольца $% = (!(, +> —, ., 1) и 0 —нуль кольца ?%. В силу условий (1) и (2) алгебра (L, ©, ©) есть подгруппа аддитивной группы (К, +> —> кольца &С. Поэтому алгебра <L, ©, ©> является абелевой группой и 0 —ее нулевой элемент. Умножение в X ассоциативно. В самом деле, в силу (3) имеем а © (Ь 0 с) = а • (Ь • с) = (а • Ь) • с = (а 0 Ъ) 0 с для любых а, Ьу с из L. В силу (3) и (4) 1^ = 1 и а 0 \% — = а © 1 = а-1 =а для любого а из L. Следовательно, алгебра (L, 0, 1^) является моноидом. Умножение в X дистрибутивно относительно сложения. В самом деле, в силу (1) и (3) для любых а, ft, с из L (а®Ь)0с = (а+6)^ = а-с + 6'б' = а0 6©ft Qc и, аналогично, с©(а@6) = с©а©с©&. Следовательно, алгебра X является кольцом. ? Пусть с/? = (/(, +,—, •, 1) —кольцо и Л —произвольное непустое подмножество множества К, замкнутое относительно главных операций кольца Ж. Пусть ф, ©, © — ограничение главных операций кольца &С множеством Л, т. е. афЬ = а + & для любых а, Ь из Л; ©а = — а для любого а из Л; aQb = ab для любых а, Ь из Л. Тогда, по теоремам 2.6 и 4.4, алгебра <з^, (5) ^ = <Л, ©, ©, 0, 1>, является подкольцом кольца $%. Таким образом, подкольцо о? кольца &С однозначно определяется непустым подмножеством Л множества /С, замкнутым в оК. Поэтому вместо (5) пишут: «подкольцо е^ = (Л, +, —, •, 1)» и говорят: «множество Л является подкольцом кольца &С относительно операций +, —, •, 1». ТЕОРЕМА 4.5. Бинарное on мощение -$(«быть подкольцом») на множестве подколец данного кольца рефлексивно, по
транзитивно и антисимметрично, т. е. является отношением нестрогого порядка. Эта теорема является частным случаем теоремы 2.8. ТЕОРЕМА 4.6. Пересечение произвольной (непустой) совокупности подколец кольца Ж является подкольцом кольца Ж. Эта теорема является частным случаем теоремы 2.10. Из теоремы 4.4 следует, что для любого множества М элементов кольца Ж существует наименьшее подкольцо X, содержащее множество М. Нетрудно видеть, что <5? является пересечением всех подколец кольца Ж, содержащих множество М. Это наименьшее подкольцо X называется подкольцом, порожденным множеством М, а М —системой образующих для кольца X. Примеры. 1. Пусть D —множество всех диагональных 2x2-матриц вида L А над кольцом Ж. Множество D замкнуто относительно главных операций кольца всех 2х2-матриц над кольцом К, Ж2х2 = (К2х2> +, —, •, />. Следовательно, алгебра (D, +, —, •, 1) является подкольцом кольца Ж2х2. 2. Матрицы вида 0 называются верхнетреугольными. Пусть L — множество всех верхнетреугольных матриц над данным кольцом Ж = (К, +, —, •, 1). Множество L замкнуто относительно главных операций кольца Ж2х2 = = <К2х2> +t —. •> /> 2 х2-матриц над Ж. Следовательно, алгебра (L, +, —, •, /> является подкольцом кольца &С2х2. 3. Пусть ^ — произвольное ненулевое кольцо и S — множество всех матриц вида | , .с элементами a, b из К. Непосредственная проверка показывает, что множество S замкнуто относительно главных операций кольца Ж2х2 = <К2х2, +,—,-,/>. Следовательно, алгебра <5, +, —, •, /> является подкольцом кольца Ж2х2. 4. Пусть Ж = (К, +, —, •, 1>~-кольцо всех действительных функций, определенных и непрерывных на множестве R действительных чисел. Пусть D — множество всех действительных функций, определенных и дифференцируемых на множестве R. Множество D замкнуто относительно главных операций кольца Ж. Следовательно, алгебра (D, +> —> •> 1) является подкольцом кольца Ж. Ш
Упражнения 1. Выяснить, являются ли следующие множества рациональных чисел замкнутыми относительно главных операций кольца рациональных чисел: (a) множество всех четных целых чисел; (b) множество всех натуральных чисел; (c) множество всех рациональных чисел, знаменатели которых суть единица или четные числа; (d) множество всех рациональных чисел с нечетными знаменателями. 2. Выяснить, являются ли следующие множества действительных чисел замкнутыми относительно главных операций кольца всех действительных чисел: (a) множество всех чисел вида а + b j/2 с целыми а и Ь\ (b) множество всех чисел вида а + Ь^З с целыми а и Ь\ (c) множество всех чисел вида а + Ь^Б с рациональными а и Ь. 3. Пусть Ж—ненулевое кольцо. Докажите, что кольцо 2 х2-матриц над Ж является некоммутативным кольцом с делителями нуля. 4. Докажите, что в кольце, состоящем из п элементов, для каждого элемента а кольца па=0. 5. Докажите, что если элемент а кольца перестановочен с элементом Ь, т. е. ab = ba, то он перестановочен также с элементами (—Ь), Ь'1 и nb, где п—целое число; если элемент а перестановочен с элементами b и с, то он перестановочен также с элементами Ь+с и be. 6. Пусть а2=а для каждого элемента а кольца Ж. Покажите, что кольцо Ж коммутативно. 7. Пусть /—гомоморфизм кольца Ж в кольцо Ж'— {К1, +, —, ',1). Покажите, что алгебра (Im/, +; —, •, 1) является под- кольцом кольца Ж'. 8. Докажите, что для любых элементов х, у коммугативного кольца и любых целых положительных тип (а) хт-хп=хт+п; (Ь) (хт)п = хтп\ (с) (ху)п = хпуп. 9. Докажите, что алгебра, изоморфная кольцу, сама является кольцом. 10. Для произвольного кольца докажите индукцией по п биномиальную теорему (a+bf=an + Clnan-1b+Chan~%2+ ... +Ъп, где л— целое положительное и С^ = ,f , _, . § 5. АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ Понятие алгебраической системы. Пусть А — любое непустое множество. ОПРЕДЕЛЕНИЕ. Алгебраической системой называется упорядоченная тройка 112
где Л — непустое множество, Q —- множество операции на Л и Q0 —множество отношений на Л. Таким образом, алгебраическая система ©^ определяется тремя множествами; (a) непустым множеством Л, обозначаемым также через о^\\ это множество называется основным множеством системы &?, а его элементы — элементами системы orf\ (b) множеством операций Q, определенных на Л и называемых главными операциями системы о?-\ (c) множеством отношений Q0, заданных на Л и называемых главными отношениями системы &?. Если (Л, ?2, Q0> — алгебраическая система, то говорят также, что множество Л есть алгебраическая система относительно операций Q и отношений Q0. Иногда под алгебраической системой понимают пару (А, Й*), где Q* = Q U Q0> Q —множество операций на Л, Q0 —множество отношений на Л. Тогда если Qo = 0, то система (Л, Й*) = (Л, Q) является алгеброй. Таким образом, алгебру можно рассматривать как частный случай алгебраической системы. ОПРЕДЕЛЕНИЕ. Алгебраические системы о^ = (Л, Q, Q0) и <?/В~{В, Q', йо> называются однотипными, если однотипны алгебры (Л, Q) и (В, Q'} и существует инъек- тивное отображение множества Q0 на Qq, при котором любое отношение R^ из Q0 и соответствующее ему при отображении отношение R& из Q'Q имеют один и тот же ранг. Наиболее частым является случай, когда множества Q и QQ конечны: Q = {f1, ..., fs}, Q() = {R1, ..., Rt}. В этом случае вместо записи ^ = <Л, {h,...,fs}, {/?i,..., /?/}> обычно употребляется запись ©^ = (Л, Д, ..., /,у, /?х, ... , /?^). При этом последовательность (г^), ..., r(fs)\ r(i?i), ... ..., г (/?/)), где г (ft) — ранг операции Д-, г (Я*) — ранг отношения Rk, называется типом системы о?'. Алгебраические системы &# и SB, SB = {B, /J, ..., /J, R\, ..., Д,'> являются однотипными, если их типы совпадают, т. е. г(//) = г(Я) для i=l, ..., s, г(#!) = г(#л)для А=1,..., *. При этом операция fi системы SB называется соответст- 113
вующей операции ft системы е^, а отношение R'k системы SB — соответствующим отношению Rk системы orf. Пример. Множество натуральных чисел N с обычными операциями сложения +, умножения • и отношением порядка ^ является алгебраической системой (N, +, •, <> типа (2,2; 2). Изоморфизмы алгебраических систем. Пусть ©^ и <^? — однотипные алгебраические системы, R^ — произвольное главное отношение системы о^ и ^ — соответствующее ему главное отношение системы SB. Говорят, что отображение h множества \&&\ в \SB\ сохраняет отношение Ал> если (а1э ..., ая)Е^«(А(а1), ..., h(an))<=R<% для любых аъ ..., ап из | &? |, где /г —ранг отношения R^. ОПРЕДЕЛЕНИЕ. Изоморфизмом алгебраической си- стемы orf на однотипную ей систему SB называется инъектив- ное отображение множества \®6\ на |d®|, сохраняющее все главные операции и отношения системы &#'. Системы ©^ и SB называются изоморфными, если существует изоморфизм системы Q7& на SB. Запись o^^SB означает, что системы &€ и SB изоморфны. ОПРЕДЕЛЕНИЕ. Мономорфизмом или вложением алгебраической системы &? в однотипную ей систему SB называется инъективное отображение множества \&?\в\&\9 сохраняющее все главные операции и отношения системы о#. ОПРЕДЕЛЕНИЕ. Гомоморфизмом алгебраической системы о?? в однотипную ей систему SB называется отображение h множества \о?\ в \SB\, сохраняющее все главные операции системы os? и удовлетворяющее условию (%, ..., ая)е#«*-*(/&(а,), ..., h(an))Rm для любых аъ ..., ап из \о?|, где R,# — любое главное отношение системы ©^, я —его ранг, a R& — главное отношение системы SB* соответствующее отношению Rrf. Подсистемы. Пусть &? и в® — однотипные алгебраические системы, /^--главная операция системы о^ и f& — соответствующая ей главная операция системы SB, кл — главное отношение системы od и R& — соответствующее ему главное отношение системы SB. 114
ОПРЕДЕЛЕНИЕ. Система <&€ называется подсистемой системы SB, если | &t \ cz \ SB | и для каждой главной операции 1л и каждого главного отношения Кл выполняются условия: (1) M^i» ...» Я/я) = МЯ1> •••> Ят) для любых а19 ..., ат из | orf |, (2) (%, ..., a«)e/?^«(alf ..., an)^Rm для любых alf ..., a„ из j<s^|, где т — ранг операции Де и п — ранг отношения #^. Другими словами, система &? называется подсистемой системы SB, если \&#\а\<?&\ и тождественное отображение \&4\ в \SB\ является мономорфизмом системы &?€ в систему SB. Запись оу1 -3 <^& означает, что система orf является подсистемой системы SB. Из определения следует, что если &# -<SB, то множество \orf\ замкнуто в системе SB, значит применение любой главной операции Д© к элементам множества | ©^ | приводит снова к элементам множества \o/Z\. В силу (1) каждая главная операция Де алгебры &? является ограничением соответствующей операции f& множеством |е^|, т. е. Д* = Д»||е^|. Пусть R — отношение ранга п на множестве В и А а В. ОПРЕДЕЛЕНИЕ. Отношение 5 ранга п на множестве А называется ограничением отношения R множеством А> если S = R(]An, что эквивалентно условию для любых а19 ..., ап из А. Из этого определения следует в силу (2), что каждое главное отношение подалгебры является ограничением соответствующего ему отношения самой алгебры. Пусть SB = {B, Д, ..., Д, /?i,..., Rt) — алгебраическая система и С — произвольное непустое подмножество множества \SB\, замкнутое относительно главных операций системы SB. Обозначим через Д \С и Rk\C ограничения множеством С соответственно операции Д и отношения Rk (i=l, ..., s; A = l, ..., t). Система (3)Sf = <C, Д|С, ..., Д|С, ^IC, ..., Rt\C) является подсистемой системы SB. Таким образом, подсистема ^ системы SB однозначно определяется непустым 115
подмножестом С, замкнутым в системе SB. Поэтому вместо (3) пишут: «подсистема ^ = <С$ fit ..., fs; Rlt ..., Rt)» или «множество С является подсистемой относительно операций fl9 ..., fs и отношений Rlt ..., Rt». Упражнения 1. Пусть Я—изоморфизм алгебраической системы (At R) на алгебраическую систему {В, S), где R и S—-бинарные отношения. Докажите, что тогда: (a) если R рефлексивно (на Л), то и S рефлексивно (на В); (b) если R антирефлексивно (на Л), то и 5 антирефлексивно (на В); (c) если отношение R симметрично, то и S симметрично; (d) если R транзитивно, то и S транзитивно; (e) если R антисимметрично, то и 5 антисимметрично; (f) если R связанно, то и 5 связанно; (g) если R—отношение строгого (нестрогого) порядка (на Л), то и 5 —отношение строгого (нестрогого) порядка (на В); (h) если # —отношение линейного порядка (на Л), то и S —отношение линейного порядка (на В). 2. Покажите на примере систем (N, а) и (N, >>), где а — пустое бинарное отношение на N, а N — множество натуральных чисел, что не каждый взаимно однозначный гомоморфизм есть изоморфизм. 3. Приведите примеры изоморфизмов и гомоморфизмов алгебраических систем.
Глава четвертая ОСНОВНЫЕ ЧИСЛОВЫЕ СИСТЕМЫ § 1. СИСТЕМА НАТУРАЛЬНЫХ ЧИСЕЛ Алфавит и слова. Алфавитом называется произвольный набор символов, называемых буквами. При этом предполагается, что буквы можно воспроизводить в неограниченном количестве, подобно печатным буквам. Набор букв алфавита может быть задан в виде списка конкретных букв, заключенных в фигурные скобки. Можно считать, что в таком списке отсутствуют повторения,-—любые две буквы, встречающиеся в алфавите, различны. Будем считать, что каждый алфавит содержит по крайней мере одну букву. Буквы, входящие в алфавит 31, называются буквами алфавита 31. О буквах алфавита 31 говорят также, что они принадлежат 31. Всякую конечную последовательность букв называют словом. Словом в данном алфавите 31 называется слово, каждая буква которого принадлежит этому алфавиту. Например, слова а, Ьа, baab, baaacb являются словами в алфавите {а, Ь, с}. Слова 0, 00, 0|, j, 0|0|, | j00 можно рассматривать как слова в алфавите {0, |}. Так как любая последовательность написанных друг за другом букв алфавита есть слово, то в любом данном алфавите есть сколь угодно длинные слова. Удобно ввести в рассмотрение слово, не содержащее никаких букв; такое слово называется пустым словом. Два слова называют равными (графически равными), если они совпадают по написанию, т. е. состоят из одинаковых букв, одинаково расположенных. Пусть символы А и В обозначают слова в каком-либо алфавите. Поставим в соответствие паре Л, В слово Л В, которое получается, если сначала написать слово Л, а затем справа приписать к нему слово В. Слово А В называется композицией или сочленением слов Л и В. Например, если 117
Л обозначает слова Ьас, а В — слово aba, то АВ есть слово bacaba. Композиция любого слова Л с пустым словом считается, по определению, равной слову А. Легко убедиться, что композиция слов обладает свойством ассоциативности,—для любых трех слов А, В, С композиция слов АВ и С равна композиции, слов А и ВС. Поэтому и ту, и другую композицию будем записывать одинаково: ABC. Слово В называется обращением (зеркальным образом) слова А, если В состоит из тех вхождений букв, что и Л, но записанных в обратном порядке. Например, слово Ьас есть обращение слова cab, и наоборот. Слово называется симметричным, если оно совпадает со своим обращением; например, слова шалаш, bab, 010 суть симметричные слова. Слово Л называется подсловом слова В, если найдутся такие слова С и Е (возможно пустые), что В = САЕ. Если Л — подслово слова В, то говорят, что Л входит в В. Для данных слов А и В слово Л может иметь несколько вхождений в слово J5. Ясно, что пустое слово является подсловом любого слова. Слова в однобуквенном алфавите. Пусть г = {|} — алфавит, состоящий из одной буквы «|», называемой вертикальной палочкой. Обозначим через N* множество всех слов в однобуквенном алфавите г. Множеству N* принадлежат пустое слово, обозначаемое символом 0*, слова |, ||, |||, | j 11 и т. д. Если п — слово в алфавите г, то и п | — тоже слово в этом алфавите. Два элемента т и п из N* называют равными и пишут т = п, если они равны как слова (равны графически). Если слова т и п не равны, то пишут тФп. ОПРЕДЕЛЕНИЕ. Пусть т и п — произвольные слова в алфавите г. Композиция слов тип называется суммой т и п и обозначается т 0 п. Операция 0 называется операцией сложения. Например, композицией слов || и ||| является слово 11111. Следовательно, 11 0 11 \ = 11111.' Композиция любого слова п из N* и пустого слова О* есть, по определению, слово п. Следовательно, п 0 0* = п, 0*+я = я. Выше отмечалось, что композиция слов обладает свойством ассоциативности. В частности, для любых элементов т и п из N* верно равенство т 0 (п 0 |) = (т 0 п) 01 или, поскольку я0| = /г|, т®п\ = (т©п)\. Свойство 118
ассоциативности композиции слов позволяет определить сумму трех слагаемых и более: k®m®n = (k@m)@n, /г©га0я0/ = = (k®m®n)®l и т. д. ОПРЕДЕЛЕНИЕ. Произведением двух слов тип (пфО) называется слово, равное сумме п слагаемых, каждое из которых равно га. Кроме того, полагаем га 00*= 0*. Произведение слов тип обозначим га © п. Операция © называется умножением слов. Таким образом, га © л = га0га ©... 0 га. п раз Например, для любого га из N* имеем: га©| = га, га©|| = га0га, га © Ц|=га0га0гаит. д. Система натуральных чисел. Рассмотрим аксиоматический подход введения натуральных чисел. ОПРЕДЕЛЕНИЕ. Системой натуральных чисел называется алгебра (N, +, •, 0, 1), состоящая из некоторого множества N, выделенных в N элементов 0 и 1, бинарных операций + и • (называемых сложением и умножением соответственно), удовлетворяющих следующим условиям (аксиомам): I. Для любого п из N п+1ф0. II. Для любых га и п из N, если га+1=я+1» то т = п. III. Для любого га из N ra-f0=ra. IV. Для любых тип га + (я+1) = (га + п)+1. V. Для любого га из N га-0 = 0. VI. Для любых га и п из N т*(п+1) = т-п-\-т. VII. Если А — подмножество множества N такое, что (а) ОеЛ, (Ь) для любого п, если п^ А9то п+1^А9 тогда /l = N. Приведенную систему аксиом называют системой аксиом Пеано, так как она представляет собой несущественное изменение аксиоматики, предложенной итальянским математиком Пеано. Условие I означает, что элемент 0 нельзя представить в виде суммы какого-нибудь элемента из N и элемента 1. Условие II означает, что элемент 1 является регулярным слева относительно сложения. Условие III означает, что 0 есть правый нейтральный элемент относительно сложения. Условие IV есть слабая форма ассоциативности сложения. 119
Условие VI есть слабая форма дистрибутивности умножения относительно сложения. Условие VII называется аксиомой математической индукции. Из этой аксиомы вытекает, что любое подмножество множества N, содержащее О, 1 и замкнутое относительно сложения, совпадает с множеством N. Таким образом, из аксиомы математической индукции следует, что единственной подалгеброй алгебры ©^ = <(N, +, •, 0, 1) является сама алгебра &У. Элементы множества N называются натуральными числами. Элементы 0 и 1 называются соответственно нулем и единицей системы ®4^. Для записи чисел 1 + 1, (1 + 1)+1, ((1-f 1)+1)+1, (((1 + 1) + 1) + 1) + 1, ... используется обычная десятичная символика: 2, 3, 4, 5, ... Возникает вопрос: существует ли хотя бы одна система натуральных чисел, т. е. алгебра типа (2, 2, 0, 0), удовлетворяющая аксиомам I—VII? Следующий пример дает положительный ответ на поставленный вопрос. Рассмотрим множество N* в однобуквенном алфавите г. Раньше уже были определены операции 0 и 0 над словами алфавита г. Пустое слово 0* и слово | играют роль нуля и единицы соответственно в алгебре: <^r* = <N*, 0, 0, 0*, |>. Эта алгебра удовлетворяет системе аксиом I—VII. В самом деле, для любого п из N* слово п\ не является пустым; следовательно, п@\Ф0*9 значит выполнено условие I. Поскольку для любых га, /г^Ы* из графического равенства слов т\ и п\ следует графическое равенство слов т и п, то выполнено и условие II. Композиция любого слова т из N* и пустого слова 0* есть слово га, т © 0* = га, т. е. выполнено условие III. Из свойства ассоциативности композиции слов следует выполнение условия IV. Выполнение условия V непосредственно следует из определения операции умножения слов. Из графического равенства слов mm ...т и mm... mm п+1 раз ""р3"3 следует равенство т © (п © |) = (т 0 п) 0 га, т. е. условие VI также выполняется. Наконец, интуитивно ясно, что в алгебре ®4^* выполняется аксиома индукции: если множество А си N* такое, что (а) 0*еД и (Ь) для каждого п, если /igA, то и п\^А, тогда A = N*. В самом деле, 120
обозначим через А (п) предикат т е А»; запишем цепочку верных в силу (Ь) для любого п импликаций: Л(0*)->Л(1), Л(|)-*Л(||), .... А(п)-+А(п\). Так как Л (0*) истинно, то из первой импликации следует истинность А (|); из истинности Л (|) и второй импликации следует истинность А(\\) и т. д. Через п-\-\ шагов мы получим истинность А(п\) для любого « из N*. Принцип математической индукции. Аксиома математической индукции является основой метода доказательства по индукции. Доказательство по индукции применимо, когда хотят доказать, что какой-нибудь одноместный предикат с натуральной свободной переменной (одноместное условие) истинен для всех натуральных чисел. ТЕОРЕМА 1.1. Пусть А (п) — любой одноместный предикат на множестве N натуральных чисел, удовлетворяющий условиям: (а) А (0) истинно (0 удовлетворяет предикату А (п)); ($) для каждого п из N, если А (п) истинно, то истинно А(п-\-\). Тогда А(п) истинно для любого натурального п. Доказательство. Пусть Л = {пе N | А (п)}. В силу (а) и (($) выполняются условия: (а) ОеЛ, (Ь) для любого п из N, если /iG Л, то п+\ ei По аксиоме VII отсюда следует, что Л = N. Последнее равенство означает, что любое натуральное число п удовлетворяет условию Л (п). ? Теорема 1.1 есть, в сущности, другая формулировка аксиомы математической индукции, и ее будем называть принципом математической индукции. Принцип математической индукции можно записать в виде А (0) Д Чп(Л (п)-+А(п+1))-+ ЧпА (п) или в виде А{0)/\уп(А(п)-+А(п+\) упА (л) Основные этапы доказательства по индукции: 1) доказывается, что 0 удовлетворяет условию Л; 2) доказывается, что для всякого п из А(п) следует Л (д+1). Переменную п называют переменной, по которой производится индукция. Часть доказательства «верно, что Л (0)» называется началом индукции или базисом индукции. Вторая часть доказательства «для любого п из Л (п) следует Л (п +1)» называется индукционным шагом. Посылка «Л (п)у> называется индуктивным предположением. 121
Для доказательства утверждения Чп(А(п)-+А(п+\)) берут произвольное натуральное число, обозначают его какой-нибудь буквой, например k, и доказывают импликацию A (k) -> A (k +1) обычным путем: предполагают, что A (k) истинно (индуктивное предположение), и показывают, что тогда истинно A(k+l). Упражнения 1. Докажите индукцией по п, что 1+2 + ...+л = /г(л+1)/2. 2. Докажите индукцией по /г, что множество из п элементов имеет 2п подмножеств. 3. Пусть А и В—конечные множества, состоящие из т и п элементов соответственно. Докажите индукцией по п, что: (a) число инъективных отображений множества А в В равно п (я— 1)...(/г — /тг+1), (b) число всевозможных отображений множества А в В равно пт. 4. Докажите, что если А—подмножество множества натуральных чисел и для некоторого щ из А выполняется условие: если для каждого натурального числа п при п^п0 из п е А следует /г+1 е Л, то каждое натуральное число п^п0 принадлежит множеству А. 5. Докажите индукцией по /г, что композиция инъективных функций fn0fn-io"-°fi является инъективной функцией. 6. Докажите следующее утверждение (принцип Дирихле): если требуется разложить более чем п предметов по п местам, то по крайней мере на одно место придется положить более чем один предмет. 7. Запишите аксиомы I —VII системы натуральных чисел на языке логики предикатов (заменив аксиому VII эквивалентным ей принципом индукции). 8. Приведите пример алгебры типа (2, 2, 0, 0), которая: (a) удовлетворяет аксиомам II, VII и не удовлетворяет аксиоме I (системы ®/Г)\ (b) удовлетворяет аксиомам I, VII и не удовлетворяет аксиоме II (системы ©/И9)', (c) удовлетворяет аксиомам I, II и не удовлетворяет аксиоме VII (системы ©^*). § 2. СВОЙСТВА СЛОЖЕНИЯ И УМНОЖЕНИЯ НАТУРАЛЬНЫХ ЧИСЕЛ Свойства сложения. Сложение натуральных чисел удовлетворяет следующим условиям (аксиомам): IV. Для каждого т из N m + 0 = m. V. Для любых т и п из N т + (п+1) = (т+п)+\. Эти условия дают возможность для любого фиксированного натурального числа т вычислить значение суммы т + п последовательно для значений /г, равных 0, 1, 2, ... Следовательно, эти условия позволяют найти значение суммы т + п для любых натуральных чисел тип. 122
Например, пусть m = 5 и я = 3. Используя условия III, IV и V, можно выписать следующую цепочку равенств: 5+0=5; 5+1=6; 5+2=5+(1 + 1)=(5+1)+1=6+1 =7; 5+-3 = 5 + (2 + 1) = (5 + 2) + 1=7+1=8; таким образом, 5 + 3 = 8. ТЕОРЕМА 2.1. Сложение натуральных чисел ассоциативно, т. е. для любых натуральных а, Ь, с (1) a+(b+c) = (a + b)+c. Доказательство. Зафиксируем произвольные натуральные числа а и Ь. Тогда формула (1) определяет предикат от одной свободной переменной с, обозначим его А (с). Доказательство проводится индукцией по натуральной переменной с. Базис индукции: А (0) истинно, поскольку верно равенство a + (6 + 0) = (a + fr) + 0. Индукционный шаг. Предположим, что для некоторого натурального п истинно А (п), т. е. верна формула а + (Ь + п) = (а + Ь) + п, и докажем, что тогда истинно Л(/г+1), т. е. верна формула а + ф + {п + 1)) = (а + Ь) + (п+1). В самом деле, а+(Ь+(п+1))=а + ((Ь + п)+1) (по аксиоме IV); =(а + (й + я))+-1 (по аксиоме IV); =((а + Ь) + п) +1 (по индуктивному предположению); =(а + 6) + (л+-1) (по аксиоме IV). Согласно принципу индукции, предикат А (с) истинен для любого натурального с. Поскольку при доказательстве фиксировались произвольные а и Ь, то формула (1) верна для любых натуральных а и Ь. ? ОПРЕДЕЛЕНИЕ. Алгебра <N, +, 0> называется аддитивным моноидом натуральных чисел. ЛЕММА 2.2. Для любых натуральных а и Ъ (1)(а+1) + 6 = а + (& + 1). Доказательство. Проведем доказательство индукцией по Ь. Зафиксируем произвольное натуральное число а. 123
Обозначим через В (Ь) предикат, определяемый формулой (1). Условимся в этой лемме и в дальнейшем в аналогичных случаях говорить, что В (Ь) является и обозначением соответствующей формулы. Легко видеть, что верна формула 5(0): (а+1)+0 = а + (0 + 1). Предположим, что для некоторого натурального числа п верна формула В(п): (а+1)+л = а + (я+1), и покажем, что верна формула В(п+1). В самом деле, (а+1)-\-(п+1)=((а+1) + п) + \ (по аксиоме IV); =(а + (/г+1))+1 (по индуктивному предположению); =а + ((п +1)+1) (по аксиоме IV). Согласно принципу индукции, формула В ф) верна для любого натурального Ь. Так как при доказательстве фиксировалось произвольное значение а, то формула (1) верна для любых натуральных а и Ь. ? ТЕОРЕМА 2.3. Сложение натуральных чисел коммутативно, т. е. для любых натуральных а, Ь (1) a + b = b+a. Доказательство проводится индукцией по Ь. Докажем сначала, что верна формула Л(0): а + 0 = 0 + а. Проведем индукцию по о,. Очевидно, формула верна при а = 0. Далее, если для некоторого натурального числа п /г + 0 = 0 + л, то (п+1)+0 = п + (0 + 1) (по лемме 2.2); = (/г+0)+1 (по аксиоме IV); = (0 + п) + 1 (по индуктивному предположению); = 0 + (я + 1) (по аксиоме IV). Следовательно, по принципу индукции, формула Л(0) Берна для любого а. 124
Зафиксируем произвольное а. Обозначим через А (Ь) предикат, определяемый формулой (1). Предположим, что для некоторого натурального числа п верна формула А(п): а-\-п = п + а; тогда а + (п+1) = (а + п)+1 (по аксиоме IV); = (д + а)+1 (по индуктивному лредположе- нию); = п + (а + 1) (по аксиоме IV); = {п+1) + а (по лемме 2.2), т. е. верна формула А (п +1). Согласно принципу индукции, формула А(Ь) верна для любого Ь. Поскольку фиксировалось произвольное значение а, то формула (1) верна для любых натуральных а и Ь. ? ТЕОРЕМА 2.4 (ЗАКОН СОКРАЩЕНИЯ ДЛЯ СЛОЖЕНИЯ). Для любых натуральных а, 6, с (1) если a-\-c = b + Cj то а — Ъ. Доказательство (проводится индукцией по с; при этом фиксируются произвольные значения а и Ь). Рассмотрим формулу А(с): (a + c=b + c)-*(a = b). Так как а-\-0 = а и Ь + 0 = 6, то верно, что (a + 0 = b + 0)-+(a = b), т. е. верна формула А (0). Предположим, что для некоторого натурального числа п А (п): (а + п = b + п) ->- (а = 6), и покажем, что тогда верна формула Л (п-\-1). По аксиоме IV, (2) а + (д+1) = (а+м) + 1, & + („.+1) = (&+>г)+1. Далее, по аксиоме И, (3) ((a+n) + l=(b + n)+l)-±(a + n = b + n). Из того, что А (п) и (3) — верные формулы, следует, что верна формула (4) ((a + n)+l=(b + n)+l)-+(a = b). 125
На основании (2) и (4) заключаем, что верна формула А(п+1): (a + (/i+I) = 6 + (/t+l))^(a = 6). Согласно принципу индукции, формула А (с) верна для любого натурального с. Так как а и Ь фиксировались произвольно, утверждение (1) верно для любых натуральных а, 6, с. П СЛЕДСТВИЕ 2.5. Для любых натуральных а и Ь, если ЬфО, то афа + Ь. ТЕОРЕМА 2.6. Для любого натурального числа а либо а = 0, либо существует такое натуральное число Ь, что а = 6+1. Доказательство. Рассмотрим формулу А(а): (a = 0)V36(a = fc + l). Доказательство этой формулы проводится индукцией по а. Очевидно, формула верна при а = 0. Предположим, что для некоторого натурального числа п верна формула Л (л): (/i = 0)V3 6(/i = 6 + l). Надо показать, что верна формула А(п+1): (д+1=0)\/36(/г+1=6+1). Эта формула действительно верна, так как второй член дизъюнкции —истинная формула (при Ь = п, /1+1 = 6+1). Согласно принципу индукции, формула А (а) верна для любого натурального а. ? СЛЕДСТВИЕ 2.7. Для любых натуральных а и Ь, если афО или ЬфО, то а + ЬфО. Доказательство. Предположим, что ЬфО. Тогда, по теореме 2.6, существует такое натуральное с, что 6 = 1+1. В силу аксиомы IV a + 6 = a + (c+l) = (a+c) + l. По аксиоме I, (а + с)+1ф0\ следовательно, а-\-ЬфО. ? СЛЕДСТВИЕ 2.8. Для любых натуральных а и Ь9 если а + 6 = 0, то а = 0 и 6 = 0. ТЕОРЕМА 2.9. Для любых натуральных aub выполняется одно и только одно из трех условий: (а) а = 6; ((J) a\-k — b {для некоторого AeN\{0}); (у) а = Ь + т (для некоторого /neN\{0}). Доказательство. Из следствия 2.5 вытекает, что не может выполняться более чем одно из трех условий. 126
В самом деле, если бы выполнялись условия (а) и (Р), то a = a-\-k и кфО, что невозможно по следствию 2.5. Если бы выполнялись условия (а) и (y), то 6 = 6 + т и тфО, что невозможно. Если бы выполнялись условия (р) и (y), to a = a + (k+m) и &+га=^0, что также противоречит следствию 2.5. Теперь покажем, что выполняется хотя бы одно из условий (а), (р), (7). Фиксируем произвольное натуральное число а и обозначим через А (6) дизъюнкцию условий (а), (Р), (у). Докажем индукцией по 6 верность формулы А (6). Верна формула Л(0). В самом деле, если 6 = 0, то либо а = 0, либо аф0. Если афО, то а = 0+т, где т = аф0. Следовательно, при 6 = 0 выполняется условие (а) или условие (v). Предположим, что для некоторого числа п верна формула А (п): (a = n)\/(a + k = n для некоторого feGN\{0}V(^ = = п + т для некоторого m e N\{0}), и покажем, что тогда верна формула А(п+\). В самом деле,еслиа = л,тоа+1=6-М>— выполняется условие (Р). Если а+& = я> а + (^+1) = ^+1» выполняется условие (Р). Если же а = /г + т, то а+\=(п+1)+т и /n?N\)0}. В этом случае если т=1, то а+1 = =(п + 1) + 1 и, по аксиоме II, а =/г +1, —выполняется условие (а). Так как тфО, то, по теореме 2.6, существует 1гф0 такое, что га = &+1. Если т^=1, то кфО, и из равенства а+1 =(п+1) + (^+1) = ((^+1) + ^)+1 по аксиоме II получаем a = (n+l) + k, fe=^=0, — выполняется условие (y). Итак, в любом случае верна формула А(п+1). Согласно принципу индукции, формула А(6) верна для любого натурального 6. Поскольку а фиксировалось произвольно, то утверждение теоремы верно для любых натуральных а и 6. П ОПРЕДЕЛЕНИЕ. Разностью двух натуральных чисел а и b называется такое натуральное число k, что b+k = a. Из теоремы 2.9 следует, что разность двух натуральных чисел а и 6 существует в том случае, когда выполнено условие (а) (при этом k = 0) или (y). В случае выполнения условия (Р) разность чисел а и 6 не существует. Легко показать, что если разность чисел а и 6 существует, то она единственна. В самом деле, если 6 + & = а и 6 + га = а, то 6 + & = 6+га, откуда, по закону сокращения для сложения, следует, что & = т. 127
Единственное натуральное число, являющееся разностью чисел а и Ь, обозначают а — Ъ. Свойства умножения. Пусть N—множество всех натуральных чисел. Умножение натуральных чисел определяется следующими условиями (аксиомами): V. /п-0 = 0 для каждого т из N. VI. т(п+1) = т-п + т для любых ш, п из N. Из зтих условий следует, что т-1 =т, m-2 = m(l + l) = m + m, m • 3=/n (2+ l)=m • 2+m=(m+m)+m=m+/n+/n и т. д. Таким образом, умножение является повторным сложением числа с самим собой. ТЕОРЕМА 2.10 (ПРАВЫЙ ЗАКОН ДИСТРИБУТИВНОСТИ УМНОЖЕНИЯ ОТНОСИТЕЛЬНО СЛОЖЕНИЯ). Для любых натуральных a, b и с (1) (a + b)-c = a-c + b-c. Доказательство. Зафиксируем произвольные значения а и Ь. Определяемый при этом формулой (1) предикат обозначим через А (с). Доказательство проводится индукцией по натуральной переменной с. По аксиоме V справедлива формула Л(0): (а + Ь)-0 = а-0 + &.0. Предположим, что для какого-нибудь натурального числа п верна формула А (п): (a + b)-n = a-n + b-n. Тогда имеем: (# + Щ • {п +1) = (а + Ь) • п + (а + Ь) (по аксиоме VI); = (а • п + Ъ • п) + (а + Ь) (по индуктивному предположению); = (a-n + a) + (b-n + b) (в силу ассоциативности и коммутативности сложения); = a(n-\-l) + b(n + l) (по аксиоме VI), т. е. верна формула Л(/г+1). Согласно принципу индукции А (с) верно для любого натурального с. Поскольку 128
фиксировались произвольные значения а и 6, то формула (1) верна для любых натуральных а, Ь и с. ? ЛЕММА 2.11. Для любого натурального числа а 1 • а=а. Доказательство (проводится индукцией по а). По аксиоме V, имеем 1-0 = 0. Предположим, что Ь/г = я для какого-нибудь натурального числа п. Тогда 1-(п+1) = = 1 -/г-И=/г+1, т. е. 1-(/г+1) = д+1. Согласно принципу индукции, формула 1 • а = а верна для любого натурального числа а. П ТЕОРЕМА 2.12. Умножение натуральных чисел коммутативно, т. е. для любых натуральных а и b (1) a-b = b-a. Доказательство. Используя индукцию по а, покажем, что для любого а верна формула А(0): а- 0 = 0- а. Зафиксируем в формуле (1) произвольное значение а. Обозначим через А (Ь) предикат, определяемый равенством (1). Предположим, что для какого-нибудь натурального числа п верна формула А {п): а-п = п-а. Тогда имеем: а-(п+1) = а-п+а (по аксиоме VI); = п-а + а (по предположению индукции); = /2-а+1-а (по лемме 2.11); = (л +1) • а (по дистр ибутивности умноже- ния относительно сложения), т. е. выполняется формула А(п+1). Согласно принципу индукции, А (Ь) верно для любого натурального Ь. Поскольку фиксировалось произвольное значение а, то формула (1) верна для любых натуральных а и Ь. ? Из теорем 2.10 и 2.12 вытекает следующая теорема. ТЕОРЕМА 2.13 (ЛЕВЫЙ ЗАКОН ДИСТРИБУТИВНОСТИ УМНОЖЕНИЯ ОТНОСИТЕЛЬНО СЛОЖЕНИЯ). Для любых натуральных а, &, и с выполняется равенство c(a + b) = c-a + c-b. ТЕОРЕМА 2.14. Умножение натуральных чисел ассоциативно, т. е. для любых натуральных а, Ь и с (1) a(bc) = (ab)c. 129
Доказательство (проводится индукцией по с). Пусть А (с) обозначает предикат, определяемый формулой (1) при фиксированных значениях аиЬ. По аксиоме V, имеем: 6-0 = 0 и (а-Ь)-0 = 0. Следовательно, верна формула А(0): а(6-0) = (а.6)-0. Предположим, что для какого-нибудь натурального числа п верна формула А (п): a(b-n) = (a-b)-n. Тогда имеем: # • Ф • (п +1)) = а • (Ь • п 4- Ъ) (по аксиоме VI); = a-(b-n)-{-a-b (по теореме 2.13); = (a-b)-n+a-b (по предположению индукции); = (а-6)-я+ (#•&)• 1 (по аксиоме V); = (а-6)(п+1) (по теореме 2.13), т. е. верна формула А(п+1). Согласно принципу индукции, формула А (с) верна при любом натуральном с. Поскольку фиксировались произвольные значения а и 6, то формула (1) верна для любых натуральных a, b и с. ? ОПРЕДЕЛЕНИЕ. Ллгебра <N, •, 1) называется мультипликативным моноидом натуральных чисел. ТЕОРЕМА 2.15. Для любых натуральных чисел а и Ь, если афЬ и ЬфО, то аЬфО. Доказательство. Предположим, что аФ0 и bФ0. По теореме 2.6, существуют такие натуральные числа т и п, что а = т+1 и b = n+l. В силу аксиом VI и IV имеем а-Ь=--а-(п + 1) = а-п+а=а-п + (т + 1)=(а-п+т)+1. По аксиоме I (а-п + т) + 1ф0. Следовательно, а-ЬфО. ? ТЕОРЕМА 2.16 (ЗАКОН СОКРАЩЕНИЯ ДЛЯ УМНОЖЕНИЯ). Для любых натуральных а, 6, с, если ас = Ьс и сфО, то а = Ь. Доказательство. По условию, (1) ас = Ьс, сфО. Допустим, что афЬ. По теореме 2.8, либо существует такое k, что a+k = b и кфО, либо существует такое /п, что а = Ь + т и тфО. В первом случае bc = ac-\-kc и в силу (1), bc — bc + kc, что (по следствию 2.5) невозможно, 130
так как &#0, сфО и (по теореме 2.15) ИсфО. Во втором случае аналогичные рассуждения показывают, что допущение афЬ ведет к противоречию. Q Упражнения 1. Докажите формулы: (a) 1+3+5 + .. . + (2я + 1) = (/г+1)2; (b) 12+22+...+п2==Л^+1)(2д+1)/б; (c) Ь2+2.3+... + (л—1)/г==(л —1)л(п + 1)/3 для л> 1; (d) (1+2 + ...+/г)2=1з + 2з + ...+пЗ; (e) 12+32+... + (2п— 1)2 = /г(2/г— 1)(2п + 1)/3. 2. Докажите, что число Скп подмножеств из k элементов множества из п элементов (l^k^n) выражается формулой к n(ti-\)...(n-k + \) п~~ 1-2...Л 3. Докажите, что CknjtX = Ckn+Ckn~'x для /г^?>Ь 4. Докажите, что для любого натурального п > 1 (а;+1)^=д:л+С^-1 + ^У~2+... + С^ 5. Докажите, что \+С1п+С2п + ... + С« = 2п. п 6. Докажите, что 2 (Сп)2===С2/г- А = о 7. Докажите, что для любых натуральных чисел а, 6, с и d сумма a + 6+c+d не зависит от порядка слагаемых. § 3. ОТНОШЕНИЕ ПОРЯДКА НА МНОЖЕСТВЕ НАТУРАЛЬНЫХ ЧИСЕЛ Отношение порядка. Рассмотрим отношения порядка на множестве натуральных" чисел. ОПРЕДЕЛЕНИЕ. Если для натуральных чисел а и Ь существует такое натуральное число k, что a + k = b и }гфО, то говорят, что «а меньше 6», и пишут a<ib. Говорят, что «а меньше или равно й», и пишут а^Ь, если а<.Ь или а = Ь. Отношение, инверсное к отношению <С, обозначают символом >. Таким образом, а>Ь тогда и только тогда, когда b < а. Есла а > b или а = Ь, то говорят, что «а больше или равно й», и пишут а^Ь. Отношение ^ является инверсией к отношению ^. ТЕОРЕМА 3.1. Для любых натуральных чисел а и Ь: (1) если а<Ь, то a-fl^b; 131
(2) О^а; (3) если аф09 то 0<а; (4) а ^ b тогда и только тогда, когда существует такое натуральное число k, что a + k = b. Доказательство теоремы легко следует из определений отношений < и ^ и предоставляется читателю. ОПРЕДЕЛЕНИЕ. Алгебраическая система <N, +, •, <> называется упорядоченной системой натуральных чисел. ТЕОРЕМА 3.2 (ЗАКОН ТРИХОТОМИИ ДЛЯ <). Для любых натуральных чисел аиЬ выполняется одно и только одно из трех условий: a<cb, a = b, a>b. Эта теорема непосредственно следует из определения отношения < и теоремы 2.9. СЛЕДСТВИЕ 3.3. Для любых натуральных чисел аиЬ выполняются: (1) а^а (закон рефлексивности для <;); (2) либо а^Ь, либо Ь^а (закон связанности для <;); (3) если а<,Ь и b*^a, moa = b (законантисимметричности для ^). ТЕОРЕМА 3.4. Бинарное отношение < на множестве натуральных чисел транзитивно, т. е. для любых натуральных чисел a, b и с, если а<.Ь и Ь<.с, то а<с. Доказательство. Предположим, чтоа<& и Ь<с. Тогда существуют натуральные числа k и т„ удовлетворяющие условиям: (1) a + k = b, b + m = c\ (2) /гфО, тфО. В силу (1) a + (k-\-m) = c9 причем в силу (2) и следствия 2.7 k + тфб; следовательно, а<с. ? СЛЕДСТВИЕ 3.5. Отношение < на множестве натуральных чисел является отношением строгого линейного порядка. Система (N, <> является линейно упорядоченным множеством. СЛЕДСТВИЕ 3.6. Для любых натуральных чисел а,Ь и а (1) если а^Ь и Ь<Сс, то a<ic; (2) если а<Ь и Ь^с, то а<с\ (3) если а^Ь и Ь^с, то а^с. СЛЕДСТВИЕ 3.7. Бинарное отноьиение ^ на множестве натуральных чисел является отношением нестрогого линейного порядка. 132
ТЕОРЕМА 3.8. Отношение < монотонно относительно сложения и умножения, т. е. для любых натуральных чисел а, b и с: (1) а<.Ь тогда и только тогда, когда а + с<.Ь+с; (2) если a<zb и сфО, то ac<Cbc. Доказательство. Условие а+с < b -\-c равносильно условию a+c + k = b-\-c и кфО для некоторого натурального k, которое, по закону сокращения, равносильно условию a-\-k = b и 1гф0 для некоторого натурального k, т. е. условию а<Ь. Предположим, что а<Ь и сфО. Существует такое натуральное число k, что a-\-k = b, кфО. Умножив обе части равенства на с, получим ac + kc = be. По теореме 2.15, /гсфО, поскольку ИфО и сфО; следовательно, ac<Cbc. ? СЛЕДСТВИЕ 3.9. Отношение ^ монотонно относительно сложения и умножения, т. е. для любых натуральных a, b и с: (1) а^Ь тогда и только тогда, когда а+с^Ь + с; (2) если а^Ь, то ас^Ьс. ТЕОРЕМА ЗЛО. Для любых натуральных чисел а, Ьис из ac<Cbc следует a<Lb. Доказательство. Согласно следствию 3.9, для любых натуральных а, Ь, с если Ь^а, то Ьс^ас. Отсюда по закону контрапози- ции вытекает утверждение: если ас<Ьс, то а<6. ? Полная упорядоченность множества натуральных чисел. ТЕОРЕМА 3.11. Система (N, <) является вполне упорядоченным множеством. Доказательство. По следствию 3.7, система (N, <> есть линейно упорядоченное множество. Надо доказать, что любое непустое подмножество множества N натуральных чисел имеет наименьший элемент. Предположим, что существует непустое подмножество А множества N, которое не имеет наименьшего элемента. Докажем индукцией по натуральной переменной Ь, что для всякого b верна формула А (Ь): а^А-^Ь^а. Очевидно, формула верна при 6 = 0, т. е. Л(0): aG=A->0<a. 133
Предположим, что для любого а и некоторого натурального числа п верна формула А (п): а<=А-+п^а. Тогда пф А у ибо в противном случае п было бы наименьшим элементом множества А; поэтому а е А -> п < а. Так как, по теореме 3.1, из п<.а следует д+1^а, то А(п+\): а?А->п + 1<а. Значит, для всякого натурального п верна импликация А (п)-+А (п-\-1). Следовательно, доказано, что формула А (Ь) верна для любого натурального Ь. По предположению, множество А не пусто, следовательно, существует элемент те А. Полагая в формуле А (Ь) а = т и Ь = т + 1, имеем/n6i4->/n+l</n. Отсюда, поскольку /п?^, получаемт+1 <т, т.е. получено противоречие. П ТЕОРЕМА 3.12. Пусть А — подмножество множества N всех натуральных чисел. Если для каждого натурального п выполняется условие (1) (Vm</i)(/neA)->ft?^, то A = N. Доказательство. Предположим, что A=?N. Тогда множество N\A не пусто и (по теореме 3.11) имеет наименьший элемент; следовательно, существует натуральное число &, удовлетворяющее условиям: (2)AgNM; (3) (Vm<k)(me=A). В силу условия (1) верна импликация (4) (V/n<i)(m?i)->^?i По правилу отделения из (3) и (4) следует &<=Л, что в силу (2) невозможно. ? ТЕОРЕМА 3.13. Пусть А (х) — любой одноместный предикат на множестве N натуральных чисел. Если для вся- кого натурального числа п (\/т<п) Л(га)-> А(п), то А(х) для любого натурального х. Доказательство теоремы 3.13 легко следует из теоремы 3.12 и предоставляется читателю. Упражнения 1. Покажите, что для любых натуральных чисел а, Ь, с и d: /а) если а<Ь и с < d, то a + c<:b-\-d; (b) если а < Ь и c<d, то ас < bd* 134
2. Докажите, что для любь*х натуральных чисел а/, 6/, если о>\ < bl9 a2<:b2l ..., ап < 6Д, то а^г ... ап<С Ьф, ... Ьп. 3. Докажите, что для любых натуральных чисел с/, Ь/, если 0<a!^b!, 0<a2=sc62, ..., 0<ал^6л, то (1) ОД8... an^bLb2 ... bn, причем знак равенства в (1) имеет место тогда и только тогда, когда аг=Ьъ ..., ап=Ьп. 4. Покажите, что для любых натуральных чисел a, b и с выполняется неравенство ab-\-bc-\-ca^a2-{"b2+c2. 5. Докажите, что для любых натуральных чисел a, b и п > i верно неравенство (а+Ь)я^2л~1(ал + &л). 6. Докажите неравенства: (a) п2<2л для любого натурального п^4; (b) 2я < п\ для любого натурального п ^ 4; /д 4-1 \п (c) я! < (—^—) для любого натурального п > 1. 7. Докажите индукцией по я неравенство Бернулли (\+а)п^ ^1+/ш, где а—любое действительное число, большее (—1). § 4. КОЛЬЦО ЦЕЛЫХ ЧИСЕЛ Аддитивная группа целых чисел. Пусть @^ = (N, +, •, 0, 1) —система натуральных чисел. Операция вычитания в ©^ не всегда выполнима, т. е. для данных натуральных чисел тип уравнение т+х = п относительно х не всегда имеет решение в N. Только в том случае, когда т^п, уравнение имеет решение в N, и притом единственное (по теореме 4.2.9); это решение называется разностью чисел п и т и обозначается через п — т. Наша задача состоит в том, чтобы доказать существование такой аддитивной абелевой группы 2, которая удовлетворяет условиям: (1) множество N содержится в | % | и сложение в группе % продолжает сложение в ©4^\ (2) операция вычитания в % всегда выполнима и всякий элемент группы % можно представить в виде разности натуральных чисел. Такую группу мы назовем аддитивной группой целых чисел. ТЕОРЕМА 4.1. Пусть @^ = <N, +> •, 0, 1>- система натуральных чисел. Существует абелева группа % = = <[Z, +> —>, удовлетворяющая условиям'. (a) NcZu сумма любых двух натуральных чисел тип в группе % совпадает с суммой этих элементов в @^% т. е. т-\-п = т-\-п; (j3) для любого элемента а из Ъ существуют такие натуральные числа п и т, что п+а = т. 135
Доказательство. Рассмотрим множество NхN пар натуральных чисел. На нем определим бинарное отношение г^у следующим образом: (1) <m, ri)~(r, s) тогда и только тогда, когда m-j-s = = г-\-п. Непосредственная проверка показывает, что отношение ~ является отношением эквивалентности на множестве N х N. На множестве N х N определим бинарную операцию ф (сложение) и унарную операцию 0 формулами (2) <т, п>ф<р, <7> = <т + р, n + q); (3) G {т, п) = (п, т). Сложение пар коммутативно и ассоциативно. Это непосредственно следует из коммутативности и ассоциативности сложения натуральных чисел. Непосредственная проверка показывает, что эквивалентность гч-г является конгруэнцией относительно операций ф и 0, т. е. из <m, ri)~{k, I) и <р, 9>~<г, s) следует </л, п>ф<р, q)~{k, l)®{r, s) и из (m, n)r^(ky l) следует © <т, л> ~ © (k, I). Обозначим через [т, п] класс эквивалентности, содержащий пару </п, /г}. По теореме 3.1, операции ф, © (см. формулы (2) и (3)) индуцируют на фактор-множестве Zx = NxN^ операции +, —: (4) {т, n] + [p, q] = [m + pt n + q]\ (5) —[m, я] = [/г, m]. В силу (1) (6) [m, n] = [r, s] тогда и только тогда, когда m-\-s — r-\-n. Алгебра I1 = (Z1, +, —> есть абелева группа. В самом деле, непосредственная проверка с помощью формул (4*)—(6) показывает, что сложение в ZL коммутативно и ассоциативно. Элемент [0, 0] является нейтральным относительно сложения в %х> так как ввиду (4) [/п, п] + [0, 0] = [т, п]. 136
Элемент —[m, п] противоположен элементу [т, я], так- как в силу (4)—(6) [m, n]+(— [m, п]) = [/п, л] + [л. т] = = [т + л, т + ^] = [0, 0]. Это и означает, что алгебра %Y является абелевой группой. Рассмотрим множество N* = {[0, ?]|&e=N\|0}} Объединение множеств N и N* обозначим через Z: Z = N(JN*. Определим отображение h множества Zx на Z следующим образом: h([mdbkt m]) = k для любого k из N; h ([/г, ai±&]) = [/z, n±k] для любого & из N\{0}. Легко видеть, что h является инъективным отображением множества Z3 на Z. Следовательно, существует обратное отображение /г1, инъективное отображение множества Z на Zl9 удовлетворяющее условиям где ii и izt — тождественные отображения Z и Z± соответственно. Сложение в Z определим для любых а, Ь из Z формулой (I) a + 6 = /i(/i-1(«)+^1(&))> а унарную операцию — определим формулой (II) — a = /i(— ft-1 (в)). Из формул (I) и (II) следуют формулы (III) /г1(я + &)==Л-1(а) + /г1(&), (IV) /rx(— a) = — h'^a). Рассмотрим алгебру 2 = <Z, +, —}¦ В силу (III) и (IV) алгебра % изоморфна абелевой группе 2Х. Отсюда следует, что алгебра % есть абелева группа. В самом деле, сложение в % коммутативно, так как в силу (I) и коммутативности сложения в %х имеем 137
Сложение в % ассоциативно, так как в силу (I) и (II) получаем a + (b+c)=h(hr1(a)+fr1(b+c)) = h(h-1(a) + +h-1(b) + fr1(c)) = h(h-1(a + b)+h-1(c)) = (a + b)+c. Натуральное число 0 является нейтральным элементом относительно сложения в %, так как для любого а из Z имеем a + 0 = /i(/i-1(^)+^-1(0)) = ft(/i-1(^) + [0, 0]) = = к(к*(а)) = а. Для любого а из Z верно равенство а + (—а) = 0, поскольку а + (—а) = h (/г1 (а)+Ьгг (— а)) = = /i(/ri(a)-K— /г1(а)) = А ([0, 0]) = 0. Следовательно, алгебра 2 является абелевой группой. Покажем, что выполняется условие (а). В самом деле, в силу (I) для любых m, n из N т+л=Л (/гЧ/п)+/гЧ/0) =&(["*, 0] + [л, 0]) = = ft([m+/z, 0])=т-Ь^5 т. е. сложение в % продолжает сложение в ®4^. Покажем, что выполняется условие (Р). Пусть а — любой элемент из Z и ft"1(a) = [m, n]; тогда n+a = ft(/i-1(^)+^-1(a)) = A([Az, 0] + [m, n]) = = h([n + m, n]) = m, т. е. я+# = я?. Следовательно, всякий элемент из Z можно представить в виде разности натуральных чисел: а = т — п. Итак, установлено, что алгебра ? = (Z, +, —) является абелевой группой, удовлетворяющей условиям (а) и ф). ? ОПРЕДЕЛЕНИЕ. Аддитивной группой целых чисел называется абелева группа 2 = <Z, +» —), удовлетворяющая условиям (а) и (Р) теоремы 4.1. Естественное умножение в аддитивной группе целых чисел. Пусть 2+ = <Z, +* —> —аддитивная группа целых чисел. По теореме 4.1, NczZ и всякий элемент из Z можно представить как разность натуральных чисел; следовательно, Z = {m — n\m, ftGN}. В группе 2+ определим умножение следующим образом: для любых элементов m-д и р~? из Z полагаем (1) (m-n)-(p-q) = (mp+nq)-(mq+np), 138
где m, я, p, ?gN и mp, n?, m<7, np — произведения натуральных чисел в системе ©^\ Любой элемент из Z представим в виде разности натуральных чисел неоднозначно. Поэтому нам надо проверить, что произведение целых чисел, определяемое формулой (1), не зависит от способа представления их в виде разности натуральных чисел. Покажем, что для любого элемента р — q множества Z из равенства (2) т — п = т' — п' (т, п, т', и' е#) следует равенство (3) (т'-д').(р-^) = (т-л).(р-^). В самом деле, согласно определению (1), (т' - п!) (p-q) = (m'p+n'q) - (m'q+n'p). Ввиду (1) и (4) достаточно проверить, что (4) (тр + nq) + (m'q+п'р) = (т'р + n'q) + (mq + /хр), или (5) (m + n')p + (n+m')q = (mf +ri)p + (n' +m)q. Ввиду (2) т + п' =т' +п. Следовательно, верны равенства (5), (4) и (3). Столь же простая непосредственная проверка показывает, что для любых элементов /п — п и р — q множества Z из равенств т — п = т'—п' и p — q — p' — q' следует равенство (т! — п') • (р' — q') = (т — п) (р — q). Итак, установлено, что умножение в группе 2+, определяемое формулой (1), не зависит от способа представления множителей в виде разности натуральных чисел. ОПРЕДЕЛЕНИЕ. Умножение в аддитивной группе целых чисел 2+, определяемое формулой (1), называется естественным умножением. Кольцо целых чисел. Сначала дадим определение. ОПРЕДЕЛЕНИЕ. Кольцо &? называется кольцом целых чисел, если аддитивная группа кольца Ж является аддитивной группой целых чисел и умножение в кольце &? коммутативно и продолжает умножение натуральных чисел (в системе &Г натуральных чисел). 139
ТЕОРЕМА 4.2. Пусть {Z, +, —)— аддитивная группа целых чисел, • есть естественное умножение в ней и 1 — единица системы N натуральных чисел. Тогда алгебра 2 = <Z, +, —, •, 1) является кольцом целых чисел. Доказательство. Покажем, что алгебра % есть коммутативное кольцо. По условию, алгебра (Z, +> —) — аддитивная группа кольца —есть абелева группа, как аддитивная группа целых чисел. Пусть а, &, с — произвольные элементы множества Z. По теореме 4.1, их можно представить в виде разности натуральных чисел. Пусть (1) а = т —/г, 6 = р — q, c = r — s (m, n, р, q, r, s&N). Естественное умножение в Z определяется формулой (2) а • Ъ = (т — п) • (р — q) = {mp+nq) — (mq+np). Естественное умножение коммутативно, так как b-a = (p — q)-(m — n) = (рт -f qn) — (ря + qtn), и коммутативно сложение и умножение натуральных чисел. Естественное умножение ассоциативно. В самом деле, в силу (1) и (2) имеем: a-(6-?0 = (m-n)[(p-?)(r-s)] = = (т - /г) [(pr + ?s) - (ps + qr)]» == (mpr + ATZ^s+nps+nqr) — — (mps + mgr+npr+ft^s); (a.6).c = [(m-n)(p-(7)](r-s) = «[(mp + n?)-(m?+/ip)](r-s) = = (mpr+/z^r + mqs + nps) — — (mps + nqs + mqr + npr). Следовательно, в силу коммутативности сложения натуральных чисел a-(b-c) = (a-b)-c. Элемент 1 является нейтральным относительно естественного умножения. В самом деле, для любого а из Z имеем a-l=(m — n)(l—0) = т-1—/г-1=т —л = а. Следовательно, алгебра <Z, •, 1> является коммутативным, моноидом. 140
Естественное умножение дистрибутивно относительно сложения. Действительно, {a + b).c = [(m + p)-(n + q)](r-s) = = (mr + pr + ns + qs) — (ms+ps+nr + qs); ac+bc = [(mr + ns) ~-(ms + nr)] + [(pr + qs) — (ps + qr)] = = (mr+ns + pr + qs) — (ms+nr + ps + qr). Следовательно, (a + b)-c = a-c + b-c. Поскольку естественное умножение коммутативно, то имеет место также равенство c(a + b) = ca+cb. Итак, установлено, что алгебра % является коммутативным кольцом. Естественное умножение продолжает умножение натуральных чисел в системе ®4^ = (N, +, •, 0, 1). В самом деле, для т и п из N т • п = (т — 0) (п — 0) = (т • п+О • 0)—(m • 0+п • 0)=m • п. Кроме того, по условию, аддитивная группа кольца % является аддитивной группой целых чисел. Следовательно, кольцо % является кольцом целых чисел. ? ОПРЕДЕЛЕНИЕ. Если для целых чисел а и b существует такое натуральное число к, что a+k = b и кфО, то говорят, что «а меньше Ь», и пишут a<Cb. Говорят, что «а меньше или равно 6», и пишут а^Ь, если а<Ь или а = й. Отношение, обратное к отношению <, обозначают символом >. Таким образом, а>Ь тогда и только тогда, когда Ь<а. ТЕОРЕМА 4.3. Пусть 2 = <Z, +, —, ¦, 1> кольцо целых чисел. Тогда (1) для любых целых чисел а и b выполняегпся одно и только одно из трех условий: а<6, а = &, Ь<а; (2) для любого целого числа а выполняется одно и только одно из трех условий: а<0, а = 0, 0<а; (3) отношение < монотонно относительно сложения, т. е. для любых целых а, Ь и с а<Ь тогда и только тогда, когда а-\-с<.Ь+с; (4) отношение < монотонно относительно умнооюения, т. е. для любых целых a, b и с если а<Ь и с>0, то ас<.Ьс. Доказательство теоремы предоставляется читателю. Теорема о делении с остатком. Пусть а —целое число и b — натуральное число, отличное от нуля. Разделить 141
число а на b с остатком — значит представить его в виде a = bq + r> где 0^r<6, q и г —целые числа. При этом q называется неполным частным, а число г — остатком от деления а на Ь. Деление с остатком всегда выполнимо, а неполное частное и остаток однозначно определяются делимым и делителем, как показывает следующая теорема. ТЕОРЕМА 4.4. Для любых целых чисел a, b при &>0 существует единственная пара целых чисел q и г, удовлетворяющая условиям4. (1) a = bq + r и 0<г<&. Доказательство. Докажем, что существует хотя бы одна пара чисел q, r, удовлетворяющая условиям (1). Вначале рассмотрим случай, когда а — натуральное число. Фиксируем b и индукцией по а докажем, что (2) существует пара целых чисел q, r, удовлетворяющая (1). Для a =f0 утверждение (2) верно, так как 0 = 6-0 + 0. Предположим, что (2) верно для а = /г, т. е. существуют целые q, r такие, что (3) n = bq + r и 0<г<&, и докажем, что оно верно для а = п + \. Из (3) следует я+1=Ь<7 + (г+1) и 0<г+1^&. Если г+1<&, то пара чисел q, r+1 является искомой. Если же г+1=&, то/г+1=Ь(<7 + 1)и пара чисел q+l, 0 является искомой. Рассмотрим теперь случай, когда а<0; в этом случае — а>0. По доказанному выше, для пары чисел —a, b существуют такие целые числа q',r'9 что—а = bq' + f и 0^ ^/*'<&. Если г' = 0, то а = &(— q') + Q. Если же г'>0, то a = b(— <7'-l) + (&-r') и 0<&-г'<Ь. Полагая # = — q' — I и r — b — r', получаем a = bq + r и 0<г<Ь. Итак, доказано, что для любых целых чисел a, b при &>0 существует хотя бы одна пара целых чисел q, r, удовлетворяющая условиям (1). Осталось доказать, что существует единственная пара целых чисел, удовлетворяющая условиям (1). Допустим, что для целого числа а существует два представления: (4) a = bq + r, 0<г<Ь; (5) a = bqx + rl9 0<гх<&, 142
Допустим, что г Ф rv Тогда г > г1 или гг > г. Если г > г19 то в силу (4) и (5) (6) 0<г-гг<Ь; (7) r-/i = 6(<7i-?). Из (6) и (7) следует, что <7i-~<7>0 и> значит, qi — q^l. Отсюда в силу (7) вытекает неравенство г — гг^Ь, которое противоречит (6). Аналогично убеждаемся, что невозможен случай г±>г. Следовательно, г = гг и в силу (4), (5) b(q — <7i) = 0. Так как ЬфО, то q — q1 = 0 и 9 = ?i- П Отношение делимости в кольце целых чисел. Рассмотрим простейшие свойства делимости в кольце целых чисел. Определение. Пусть а и b — целые числа. Говорят, что b делит а, если a = bq для некоторого целого 9- Вместо «ft делит а» говорят также, что а делится на ft, или что а кратно ft, и пишут b \ а или а \ Ь. В противном случае говорят, что а «в делится на ft, а не кратно ft, b не делит а, Ь не является делителем а, и пишут b \ а. Теорема 4.5. Пусть а, ft, с> d, mt п —любые целые числа. Тогда (1) а\а; (2) а! 0; (3) если 0! а, то а = 0; (4) ±1|а;' (5) ес/ш а \ b и b \ с, то а \ с, т. е. отношение делимости транзитивно; (6) если с\а> то c\ab; (7) если с\а и с\Ь, то с\(а±Ь)\ (8) если Ь\а9 то Ьс\ас\ (9) если сфО, то из be \ ас следует Ъ \ а; (10) если а\с и b\d, то ab\cd; (11) если а\Ь и а\с, то a\(mb+nc). Свойства (1) — (11) отношения делимости легко следуют из определения делимости и свойств кольца %. Их доказательство предоставляется читателю. Лемма 4.6. Если произведение ab натуральных чисел равно единице, то а = b = 1. Доказательство. Из условия ab = l следует, что а и ft отличны от нуля. По теореме 2.6, их можно представить в виде a=c+l, ft = d + l. Следовательно, ab = =zcd+c-\-d+l = l и cd-{-c+d = Q. Если сумма натураль- 143
ных чисел равна нулю, то в силу следствия 2.8 каждое слагаемое равно нулю. В частности, c = tf = 0; следовательно, а = # = 1. ? Теорема 4.7. Если целое число а делит единицу, то а = ±1. Доказательство. Предположим, что а делит единицу, т. е. ab=l для некоторого целого Ь. Тогда а2 b2=l. Так как а2 и Ъ2 — натуральные числа, то, по лемме 4.6, а2=1. Следовательно, по теореме 4.1, (1)(-а)(-а) = 1. Поскольку а или —а является натуральным числом, то, по лемме 4.6, из а2=1 и равенства (1) следует, что а=1 или —а = 1. ? Теорема 4.8. Если целые числа а и Ъ ассоциированы (т. е. а\Ъ и Ь\а), то а = ±Ь. Доказательство. По условию а делит Ъ и Ъ делит а, т. е. Ь = ас и a = bd для некоторых целых с и d, поэтому (1) a = acd. Если а = 0, то & = 0-с = 0 и теорема верна. Если же афО, то из (1) следует cd=*l. По теореме 4.7, из равенства cd=l следует, что d = ±l. Кроме того, a = bd; следовательно, а = ±Ь. ? Упражнения 1. Пусть mZ={m*|*<= Z}, где т—натуральное число. Покажите, что при тфО существует инъективное отображение множества Z на /nZ. 2. Пусть g' = (Z,+ , — }-—аддитивная группа целых чисел. Покажите, что множество wZ, где /п—-целое число, замкнуто в группе g, т. е. замкнуто относительно операций + и — . 3. Покажите, что непустое множество целых чисел, замкнутое относительно сложения, не обязательно состоит из кратных фиксированного целого числа. 4. Покажите, что непустое множество целых чисел, замкнутое в группе % (замкнутое относительно операций + и —), состоит из кратных некоторого фиксированного целого числа. 5. Выясните, являются ли подгруппами относительно операций +, — в аддитивной группе целых чисел следующие множества целых чисел: (a) множество всех четных чисел; (b) множество натуральных чисел; (c) множество нечетных чисел. 6. Пусть g = (Z, +,— ) и т—фиксированное целое число. Покажите, что алгебра mg = (/nZ, + , — ) является подгруппой группы g. Покажите, что любая подгруппа группы % совпадает с группой т% для некоторого натурального т. 144
7. Докажите, что аддитивная группа целых чисел % изоморфна подгруппе т%. при любом целом т, отличном от нуля. 8. Покажите, что кольцо % целых чисел не имеет автоморфизмов, отличных от тождественного. 9. Докажите, что кольцо % целых чисел не имеет подколец, отличных от %. 10. Пусть ^ — произвольное кольцо. Докажите, что существует единственный гомоморфизм кольца % целых чисел в кольцо Ж* 11. Пусть Z[Y%]~{fn+ 11)^2 \т, neZ}. Докажите, что алгебра % [Уг2 ] = < Z[/2 ],+,_,., 1) типа (2, 1, 2, 0,), где + , - ,. суть обычные операции над действительными числами, является ком- мутативным кольцом. Укажите нетривиальный автоморфизм этого кольца. 12. Докажите, что не существует гомоморфизмов кольца % [)/2 ] в кольцо % [Yd ] и эти кольца не изоморфны. 13. Пусть К={(а, b)\a, feeZ} и операции + ,—,-, е на множестве К определяются следующим образом: (a, b) + (c, d) = (a + c9 Ъ + d); — (а, &> = < — я, — Ь); {a, b)-(ct d) = (ac, bd)\ e=<t, 1>. Покажите, что алгебра </С, +,—>•, е) является коммутативным кольцом с делителями нуля. 14. Докажите, что для любого натурального п: (a) 52л —1 делится на 24; (b) 4Л + бп — 1 делится на 9; (c) №п —-1 делится на З3; (d) 32/г + 5 не делится на 8. 15. Докажите, что произведение любых трех последовательных целых чисел делится на 6. 16. Докажите, что для любого целого п: (a) м3 — п делится на 3; (b) л5 — п делится на 5; (c) п1 — п делится на 7; (d) n (п2 + 5) делится на 6; (e) л5 — п делится на 30. 17. Покажите, что если целое число п не делится на 7, то /г3 — 1 или /г3 + 1 делится на 7. 18. Докажите, что для любых целых а и Ь: (1) если а | b и ЪфЪ, то j а | ^ | Ъ |, (2) если а\Ь и | Ь| <| а |, то 6 = 0. 19. Докажите, что для любых целых а и Ь \ab\ = \a\-\b\,\a + b\^\a\ + \b\. 20. Докажите индукцией по /г, что для любых целых alt ... , ап выполняется неравенство а\ + ... + аД>0, за исключением случая, когда а1=в... = ал = 0. 145
21. Докажите, что любое непустое множество целых чисел, ограниченное снизу (сверху), имеет наименьший (наибольший) элемент. 22. Докажите, что для любого целого а и любого целого положительного Ь существует единственное целое число п такое, что nb^a<(n + \)b. 23. Докажите следующее обобщение теоремы о делении с остатком: для любых целых а и b пуп ЬфО существует единственная пара целых чисел q, г такая, что a=bq + г и 0 ^г < | Ь |, § 5. ПОЛЯ. ПОЛЕ РАЦИОНАЛЬНЫХ ЧИСЕЛ Понятие поля. Дадим основные определения. ОПРЕДЕЛЕНИЕ. Элемент а кольца &С называется обратимым элементом кольца, если в кольце существует такой элемент Ь, что а& = Ьа= 1^. При этом элементы а и 6 называются взаимно обратными. ОПРЕДЕЛЕНИЕ. Полем называется коммутативное кольцо, в котором нуль отличен от единицы, §дсф\$?> и всякий ненулевой элемент является обратимым элементом кольца. ОПРЕДЕЛЕНИЕ. Пусть of = <Л +, -, -, 1>-поле. Группа (F, +> — > называется аддитивной групп ой поля. Ее нейтральный элемент называется нулем поля и обозначается символом 0 или Ojr. Элемент 1, нейтральный относительно умножения, называется единицей поля и обозначается также символом ljr. ОПРЕДЕЛЕНИЕ. Подполем поля <sF называется под- кольцо поля gF, в котором всякий ненулевой элемент обратим. Подполе поля of, отличное от eF, называется собственным подполем. Ясно, что всякое подполе является полем. ОПРЕДЕЛЕНИЕ. Поле называется простым, если оно не имеет собственных подполей. Простейшие свойства поля. Пусть а, Ь—-элементы поля sF и ЬфО. Уравнение Ьх = а имеет в поле решение ab~x\ легко проверить, что аЬ~л является единственным решением уравнения. Элемент аЬ~г обозначается символом ~ или а/Ъ. ТЕОРЕМА 5.1. Пусть <F = (F, +, -, ., 1> — поле. Тогда для любых элементов а> Ь, с поля: (1) если ab=l, то афО и Ь — а'х\ (2) если ас = Ьс и сфО, то а = Ь\ (3) если а6 = 0, то а = 0 или 6 = 0; (4) если афО и ЬфО, то аЬфО\ 146
(5) -?- = 2 тогда и только тогда, когда ad = bc, ЬфО и йфО\ (р.\ & _i_ с ad + bc W ~b—d~~ bd ; к } b d~~ bd' (8) |+Ц^=0 и -(f) = ^; (9) если афО и ЬфО, то (у J =-; Доказательство. (1) Если ab = l, то a=#0, так как при а = 0 0-& = 1 и 0 = 1, что в поле невозможно. Поскольку афО, существует элемент яг1, обратный а, и b==(cr1a)b = cr1(ab)==cr1l==ar1. (2) Если ас = Ьс и сфО, то в поле существует элемент с1 и а = (ас)с~1 = (&^)с-1 = &, т. е. а = Ь. (3) Из а& = 0 следует а = 0 или Ь = 0. В самом деле, если а Ф 0, то существует элемент а-1 и Ь = (а_1а)Ь = = а-1(а&) = а-10 = 0. (4) По закону контрапозиции, из (3) следует, что l(a = 0Vb = 0)->-](a&=:0), т. е. (афО /\Ьф0)->~ ~+(аЬфО). (5) Пусть a/b = c/d, т. е. ab^^cdr1. Тогда 6^=0, d=#=0 и ad = (ab-1)(bd) = cd-1-bd = cb, т. е. ad = cb. Обратно: из равенства ad = cb при ЬфО, dфQ следуют равенства adb-1d-1 = cbb~1d~1 и alr^^cdr1. (6) Так как а/Ь = аЬ~г и c/d = cd~1i то^±^=аЬ-г± ±cd-1 = add-4-1±cbb-4~l = {ad ± be)№)-*== ± = (ad±bc)/bd. (7) При 6^=0 и dф0 ^=ab-icd-i = ac{bdyi = ^ (8) При &:#=() 147
следовательно, — {alb) =— a/b. (9) Если а^Ои^О, то (a/byг = (ab- г)~1 ^Ьаг1^ Ь/а. (10) При ЬфО й сфО ac/bc = ac(bcy1 = acc'ib^1=^ab"1 = a/b. П Поле рациональных чисел. Введем понятие поля частных области целостности. ОПРЕДЕЛЕНИЕ. Поле <& называется полем частных области целостности &С, если выполнены условия: (а) &С есть подкольцо поля oF; (Р) для любого х из F существуют такие элементы a, b кольца 9&, что x-=ab~x. ТЕОРЕМА 5.2. Для любой области целостности SfC существует поле частных. Если <У и 8* — поля частных кольца &С\ то существует изоморфизм поля еГ на поле &, переводящий каждый элемент кольца SfC в себя. Доказательство этой теоремы дано в гл. 13 (см. теоремы 13.21 и 13.22). Кольцо % целых чисел есть область целостности. Следовательно, по теореме 5.2, для кольца % существует поле частных и любые два поля частных кольца % изоморфны. ОПРЕДЕЛЕНИЕ. Полем рациональных чисел называется поле частных кольца целых чисел. Элементы поля рациональных чисел называются рациональными числами. Из определения следует, что любое рациональное число можно представить в виде частного целых чисел. Отметим, что любое поле, изоморфное полю рациональных чисел, также является полем рациональных чисел. Отношение порядка на множестве Q рациональных чисел вводится с помощью отношения порядка < на множестве Z целых чисел. ОПРЕДЕЛЕНИЕ. Отношение < на множестве Q рациональных чисел определяется следующим образом: для любых двух рациональных чисел p/q и r/s, где р, tgZ и q, s е М\{0}, - < - тогда и только тогда, когда ps <Cqr. Я s Нетрудно проверить, что < на множестве Q рациональных чисел является отношением строгого порядка, продолжающим отношение порядка на множестве Z целых чисел. ТЕОРЕМА 5.3. Бинарное отношение < на множестве Q рациональных чисел обладает следующими свойствами: 148
(1) для любых а, Ьу с из Q, если а<.Ь и 6<с, то а<с; (2) для любых a, b из Q имеет место одно и только одно из трех соотношений: а<Ь, а = Ь, &<#; (3) для любых а, Ь, с из Q, если a<b, moa+c<b+c; (4) для любых a, by с из Q, если а<Ь и 0<с, то ас<Ьс. Доказательство теоремы предоставляется читателю. Упражнения 1. Выясните, какие из следующих множеств действительных чисел являются полями относительно обычных операций +, —, . над ними: (a) все натуральные числа; (b) все рациональные числа^ с нечетными знаменателями; (c) все числа вида a + bV2_c рациональными а и 6; (d) все числа вида а+ЬУб' с рациональными а и Ь; (e) все числа вида a+b^/Y с рациональными а и Ь; (f) все числа вида a+&f/~2~+cy 4 с рациональными а, Ь и с. 2. Пусть К—множество всех матриц вида , с рациональными а и Ь. Докажите, что алгебра (К, +, —» •, е), где +. —» • суть операции над матрицами и е = , является полем. Покажите, что это поле содержит такой элемент х, что х2— —е. 3. Пусть F—множество всех матриц вида с рациональными а и Ь. Докажите, что алгебра 5r=(F, +, —, •, е), где е\о * является полем. Покажите, что отображение 9, и—*- н-*-a+bV2 является изоморфизмом поля & на поле ^(^2). 4. Какие из колец %ъ %Zi g4, %ь и 2в являются полями? 5. Докажите, что поле не имеет делителей нуля. 6. Покажите, что каждое подкольцо поля является областью целостности. 7. Пусть а —ненулевой элемент поля. Докажите, что для любых целых чисел тип выполняются равенства ат+п = атап и (ат)п = атп. 8. Пусть a, b и с — любые элементы поля &. Докажите, что из равенства ab = ac следует Ь=с тогда и только тогда, когда афО. 9. Докажите* что пересечение любой совокупности подполей поля & есть подполе поля У. 10. Докажите, что любая конечная область целостности является полем. 11. Покажите, что поле $ рациональных чисел не имеет лодпо- лей, отличных от $. _ 12. Докажите, что любое подполе поля ®, (V2) есть либо (?, либо a(V2). 13. Опишите все подкольца поля $ рациональных чисел. 14. Пусть ф : & -+ §:' есть кольцевой гомоморфизм поля & в поле У. Покажите, что образ поля & при отображении ср является под- лолем поля &'. 149
15. Докажите, что кольцевой гомоморфизм поля & есть либо нулевое отображение, либо изоморфизм поля 3F на его образ. 16. Пусть ф : & ->• 3:' есть кольцевой гомоморфизм. Если & — поле, а, 6 g F и ^ 0, то ф (а/6) = ср (а)/ф (Ь); докажите. 17. Докажите, что тождественное отображение является единственным автоморфизмом поля $ рациональных чисел. 18. Покажите, что любое поле, состоящее из двух элементов, изоморфно полю g2. 19. Докажите, что кольцо, изоморфное полю, само является полем. 20. Покажите, что не существует гомоморфизмов кольца gf4 в поле 21. Докажите, что алгебра, изоморфная полю, сама является полем. 22. Покажите, что поле частных поля $р изоморфно У. 23. Докажите, что поле частных кольца g[]/~3 ] изоморфно полю й (Кз). 24. Пусть &С и Ж' — изоморфные области целостности. Докажите, что изоморфны поля частных этих колец. § 6. СИСТЕМА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ Упорядоченные поля. Алгебраическая система (F, <) называется линейно упорядоченным множеством, если выполнены следующие условия: (а) для любых а, &, с из F, если а<Ь и Ъ<с, то а<с; ((3) для любой пары элементов а, Ь из F выполняется одно и только одно из трех соотношений: а<Ь, а = Ь, &<а. ОПРЕДЕЛЕНИЕ. Упорядоченным полем называется алгебраическая система (F, +> —, •, 1, <>, удовлетворяющая условиям: (1) алгебра (F, +> —, •, 1> есть поле; (2) система <F, <> есть линейно упорядоченное множество; (3) для любых а, Ь, с из F, если а<&, то а-\-с<Ь-\-с (монотонность сложения); (4) для любых а, &, с из F, если а<Ь и 0<?, то ас<С.Ьс (монотонность умножения). Элемент а упорядоченного поля называется положительным, если 0<а. По определению, Ь>а тогда и только тогда, когда а<6. Далее, по определению, а^Ь тогда и только тогда, когда а<.Ъ или а = Ь. Пример, Пусть <Q, +, —, •, 1> — поле рациональных чисел и < —• обычное отношение порядка на множестве Q. В силу теоремы 5.3 условия (1) —(4) приведенного выше определения выполняются. Следовательно, система (Q, +> —, •, 1) есть упорядоченное поле. Эта система называется упорядоченным полем рациональных чисел. 150
ТЕОРЕМА 6.1. Пусть Jr = <F, +, —, -, 1, <)-упо- рядоченное поле и а, Ь, с, d — любые его элементы. Тогда (1) а<С.Ь в том и только в том случае, когда Ь — а>0; (2) для любого а из F выполняется одно и только одно из трех условий: а<0, а = 0, 0<а; (3) еслиа>0 и 6>0, то # + &>0 и ab>Orm. е. множество положительных элементов упорядоченного поля замкнуто относительно сложения и умножения9, (4) если а<.Ь и c<d, то a+c<zb + d; (5) если а<С.Ь и с<0, то ас>Ьс\ (6) если афО, то а2>0; (7) 1 > 0 и п • 1 >0 для всякюго натурального п Ф 0; (8) поле (F, -К —, -, 1) есть область целостности. Доказательство. (1) В силу монотонности сложения а < Ь в том и только в том случае, когда а + (— а) <. <& + (—а). Следовательно, а<Ь тогда и только тогда, когда Ь — я>0. (2) Утверждение (2) справедливо в силу того, что (F, <) — линейно упорядоченное множество (см. условие ((5)). (3) Ввиду монотонности сложения из #>>0 и Ь>0 следует a + b>b u a + b>0. В силу монотонности умножения из а>0 и 6>0 следует а&>0-6 и a&>ft. (4) В силу монотонности сложения если а < b и с < d, то а+?<&-|-с и b+c<.b + d. Следовательно, а+с< <fc + d. (5) В силу (1) если а<.Ь и ?<0, то Ь — а>0 и — с>0. В силу монотонности умножения отсюда получаем (Ь — а)(—с)>0 и ас — Ьс^О. Следовательно, aobc. (6) В силу монотонности умножения если а>0, то а2>0. Если же — а>0, то (— а)(— а)>0 и a2>0„ (7) В поле 1ф0. В силу (6) 12=1>0.Так как множество положительных элементов упорядоченного поля замкнуто относительно сложения, из 1>0 следует, что п • 1 > 0 для всякого отличного от нуля натурального п. (8) В силу теоремы 5.1 для любых элементов a, b поля, если аФ0 и й#0, то аЬфО. Следовательно, по закону контрапозиции, если ab = 0, то а = 0 или 6 = 0. Таким образом, поле (F, +, —, •, 1) является областью целостности. ? ОПРЕДЕЛЕНИЕ. Абсолютное значение элемента а упорядоченного поля обозначается через | а \ и определяется 151
следующим образом: ( а, если а^О, ' '~"\ —а, если (—а)>0. ТЕОРЕМА 6.2. Пусть а и b — произвольные элементы упорядоченного поля; тогда (1) |а|Н-а|; (2) \а\±а^0; (3) \a + b\^\a\ + \b\; (4) |а&Ыа|.|Н (5) 161 <; а в том и только в том случае, когда — а ^ Доказательство. (1) Равенство (1) непосредственно следует из определения абсолютного значения элемента. (2) Если а^О, то \а\ = а, \а\+а^0 и |а| — а = 0. Если же (—а)>0, то \а\ =— а, |а|—а = |а| + (—а)>0 и |а|+я = 0. (3) Если \a + b\=a + b, то в силу неравенства (2) \а\ + \Ь\-\а + Ь\=(\а\-а) + (\Ь\-Ь)^0. Если же \а + Ь\ =— {а + b), то также в силу (2) \a\ + \b\-\a + b\ = (\a\+a) + (\b\ + b)^0. Следовательно, в любом случае верно неравенство (3). (4) Равенство (4) верно, если а или Ь равно нулю. Если элементы а и b положительны, то|я6| = о& = |а|-|&|. Если а < О и b < 0, то ab = (— а) (— Ь) > 0 и | а& | = а& = ==(— а)(— fc) = |a|-|6|. Еслиа>0 и Ь<0, то (— а6)>0 и |а&| =— аЬ = а-(—6) = |а1-|&|. Наконец, если а<0 и й>0, то (—а&)>0 и |a6| = —a& = (—a)b = |a|.|6|. (5) Неравенство 161 ^ а имеет место тогда и только тогда, когда (—Ь)^а и Ь^а. Поэтому \Ь\^а тогда и только тогда, когда —а^Ь и Ь^а, т. е. при —а^ ^Ь^а. ? Система действительных чисел. ОПРЕДЕЛЕНИЕ. Упорядоченное поле of называется архимедовски упорядоченным, если для любых положительных элементов а и Ъ поля существует такое натуральное число п, что па>Ь. Пусть <а0, ах, а2, ...> —бесконечная последовательность элементов упорядоченного поля of. Ее обозначают также через (ak)k(=N или (ak). ОПРЕДЕЛЕНИЕ. Элемент а упорядоченного поля еГ называется пределом последовательности (ak) элементов 152
поля, если для каждого положительного элемента е поля существует (зависящее от е) натуральное число п0 такое, что \ак — а\<г для любого натурального k^nQ. Последовательность (аЛ), имеющая предел в поле of, называется сходящейся в этом поле. ОПРЕДЕЛЕНИЕ. Последовательность (ak) элементов упорядоченного поля аГ называется фундаментальной над оГ, если для каждого положительного элемента s поля существует (зависящее от е) натуральное число п0 такое, что \ak — ал|<е для любых натуральных кип, больших, чем п0. ОПРЕДЕЛЕНИЕ. Упорядоченное поле называется пол- ным, если всякая фундаментальная последовательность элементов поля сходится в этом поле. ОПРЕДЕЛЕНИЕ. Системой действительных чисел называется полное архимедовски упорядоченное поле. Пусть <R, +, —, •, 1, <> — система действительных чисел. Тогда алгебра <R, +» —» •> 1> есть поле, называемое полем действительных чисел. Множество R называется множеством действительных чисел. Можно доказать, что любые две системы действительных чисел изоморфны. Следовательно, изоморфны любые два поля действительных чисел. ТЕОРЕМА 6.3. Для любых действительных чисел а и Ъ при Ь>0 существует целое число т и действительное число г такие, что a = mb + r, 0^r<b. Доказательство. 1°. Если а = 0, то полагаем т = = г = 0. Предположим, что а>0. Множество M = {nGN|(/i+l)b>a} натуральных чисел не пусто, поскольку система действительных чисел архимедовски упорядочена. Так как множество натуральных чисел вполне упорядочено и М — непустое подмножество множества N, то в М существует наименьший элемент. Пусть т — наименьший элемент множества М9 тогда mb^a<i(m+l)b9 0^a — mb<ib. Полагая a — mb = r, получим a = mb + ry 0^г<й. 2°. Предположим, что а<0. Тогда, по доказанному в п. 1°, для положительных чисел (—а) и Ь существуют 153
натуральное число k и действительное число s гакие, что — a = kb-\-s, 0<;s<ft. Следовательно, а = (— k) Ъ + (— s). Если 5 = 0, то мы имеем искомое представление. Если же s>0, то а = (— Л—1)-Ь + (& —s). Полагая т = — й— 1 иг = 6 —s, имеем a = mb + r,0^r<b. ? Пусть я — натуральное число, отличное от нуля. Введем понятие арифметического корня л-й степени из положительного действительного числа. Предварительно докажем следующую теорему. ТЕОРЕМА 6.4. Для любого положительного числа а существует единственное положительное действительное число с такое, что сп = а. Доказательство. Рассмотрим функцию f = xn — a, определенную на замкнутом интервале [0, 6], гдеЬ = а+1- Функция / непрерывна на этом интервале и на его концах принимает значения разных знаков, так как/(0)<0 </(&). Применим теорему о промежуточном значении к функции f на интервале [0, Ь]. По этой теореме, существует действительное число cg[0,6], для которогосп~а=0и,значит, (1) c" = a. Очевидно, с>0. Предположим, что dn = a для какого- нибудь положительного числа d. Если при этом c<.d, то cn<dn = a, что противоречит (1). Если же Od, то cn>dn = a, что также противоречит (1). Следовательно, d = c. ? ОПРЕДЕЛЕНИЕ. Пусть а — положительное действительное число и п — натуральное число, отличное от нуля. Единственное положительное действительное число с такое, что сп = а, называется арифметическим или главным корнем п-й степени из а и обозначается символом с]/п или Ус- Построение системы действительных чисел. Последовательность ( а0, а19 а2, ... > рациональных чисел будем обозначать через (ak)k(=N или (ak). На множестве QN всех последовательностей рациональных чисел определим бцнар- ные операции 0, ©, унарную операцию © и нульмест- ную операцию I: (ak)®(bk) = (ak + bk); Q{ak) = {—ak)\ (ak)0(bk) = (ak.bk); 154
\z=:(ak)f где ak — l для всякого натурального k. Обозначим через F(Q) множество всех фундаментальных последовательностей над полем & рациональных чисел. Если (ak) и (bk) — произвольные элементы множества F (Q), то последовательности (ak)®(bk), © <а;,), (ак) 0 (bk) также принадлежат множеству F(Q). Следовательно, множество F(Q) замкнуто относительно операций 0,0,0. Нетрудно проверить, что алгебра (F(Q), ©, 0, 0, Г) является коммутативным кольцом. На множестве F(Q) введем бинарное отношение =: (ak) = (bk) тогда и только тогда, когда последовательность (ak — bk) сходится к нулю. Отношение = рефлексивно, транзитивно и симметрично, т. е. является отношением эквивалентности на множестве F(Q). Условимся обозначать символом [<а*>] класс эквивалентности, которому принадлежит последовательность (ak). Множество всех классов эквивалентности обозначим через F, F = F/шт. Нетрудно показать, что отношение = является отношением конгруэнтности в кольце <F(Q), 0, ©,_©, 1>. Это дает возможность определить на множестве F операции +, —, •, 1 следующим образом: [<М+[<М=[<^+М; [(ak)]-[(bk)] = [(a^bk)]; Алгебра (F, +, —, •, 1> есть фактор-алгебра кольца (F(Q)> Ф» ©> 0» О п0 отношению конгруэнтности = . Можно доказать, что алгебра (F, +» —» •» 1) является полем. На множестве F(Q) введем отношение порядка: для любых (ak) и (bk) из F(Q) полагаем (ak) < фк), если существуют натуральное число п0 и положительное рациональное число 8 такие, что bk—ak^& для всякого k^n0. Бинарное отношение = является отношением конгруэнтности относительно <, т. е. для любых (ak), <6ft>, (ck) и (dk) из F(Q), если ФкХФк), (ak) = (ck) и <&Л> = <4>, то (ck)<(dk). 155
Это дает возможность ввести на множестве F отношение порядка: для любых [<а*>] и [(bk)] из F полагаем [<**>]<[<**>]. если <а*>«6*>. Можно доказать, что система F = </\ +, —, •, 1, <> есть архимедовски упорядоченное поле и всякая фундаментальная последовательность над полем qF сходится к элементу этого поля. Таким образом, поле «Т является полем действительных чисел. Упражнения 1. Пусть ^^{F, +» —» •» Ь <} — упорядоченное поле и a, bt с, deF. Докажите, что тогда: (a) если а-\-с<:Ь+с<, то a<zb; (b) если а — Ъ <са—с, то 6>г; (c) если 0 < с и ас < Ьс% то а < 6; (d) 0 < — — а > 0; (e) если 0 < а < 6, то 0 < -=- < —; у а 7 (f) если а < Ь < 0, ю 0 > - - > т-; (g) если хотя бы одно из чисел а, &, с отлично от нуля, то а2 + ^2 + с2>0. 2* Пусть а, &-—элементы упорядоченного поля У и а<6. Докажите, что в ^ существует такой элемент с, что a<.c<ib. 3. Докажите, что уравнение я2=2 не имеет решений в поле рациональных чисел. 4. Докажите, что для любого положительного действительного числа а уравнение х2=а имеет решение в поле действительных чисел. 5. Покажите, что уравнение aj2+1=0 не имеет решений в поле действительных чисел. 6. Пусть R+ —множество всех положительных действительных чисел. Докажите, что алгебра (R+, •, _1) является группой; она называется мультипликативной группой положительных действительных чисел. 7. Пусть a, bt с и d — положительные действительные числа. Докажите, что a/b = c/d тогда и только тогда, когда для любых целых положительных чисел тип nw>mb-+nomd и na<mb->*nc<:md. 8. Докажите, что тождественное отображение является единственным изоморфизмом поля действительных чисел в себя. 9. Докажите, что алгебраическая система, изоморфная системе действительных чисел, является системой действительных чисел. 10. Пусть QN —множество всех последовательностей рациональных чисел. Покажите, что алгебра $N = (QN, 0, ©, 0, I), где <«*>©<**>=<«*+**>; \ = (ak) где ak = \ для всякого натурального k, является коммутативным кольцом. 156
11. П>сть F (Q) —-множество всех фундаментальных последовательностей над полем $ = (Q, +,—, •, 1). Покажите, что F (Q) замкнуто в кольце (?N всех последовательностей рациональных чисел и алгебра & (Q) = (F (Q), ф, ©, 0, I) является коммутативным кольцом. 12. Пусть {ak)~{bk) означает, что последовательность (ak—bk) сходится к нулю. Докажите, что: (a) отношение = на множестве F (Q) есть отношение эквивалентности; (b) отношение = является отношением конгруэнтности в кольце 13. Покажите, что если (ak) gF (Q), а^Ф^ для всех k <= N и последовательность (а^) не сходится к нулю, то (\/ak)e=F(Q) и {ak)Q(\/ak) = \. 14. Докажите, что фактор-алгебра кольца ,r (Q) по отношению конгруэнтности_= является полем. 15. Пусть F— фактор -множество F (Q)/=. Докажите, что система (^» +. —. • f 1» <) есть архимедовски упорядоченное поле. 16. Докажите, что в системе (F, -{-» —, •, 1, < ) всякая фундаментальная последовательность элементов множества F сходится к элементу из F. § 7. ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ Комплексное расширение поля. Пусть 3r = (F, +, —, ¦, 1> — поле и ? —элемент (символ), не принадлежащий полю &'. Выражение вида а + Ы, где а и ft —произвольные элементы поля У, назовем линейным многочленом от t над полем & (или формой). Элементы а и Ь называются коэффициентами многочлена а + Ы. Два линейных многочлена от t называются равными, если они имеют одни и те же слагаемые (одни и те же коэффициенты), с точностью до слагаемых с нулевыми коэффициентами, которые могут быть удалены из выражения (для формы). В частности, для любых элементов а и b поля OF (I) a + 0-t = a, 0 + bt = bL Обозначим через К множество всех линейных многочленов от i над полем &\ K = {a + bt\a, b(=F}. На множестве К определим операции +, —, • следующими формулами: (II) {a + bt) + {c+dt) = {a + c) + {b + d)t; (1П) -(a + bt) = (-a) + (-b)t; (IV) (а + Ы) • (с+dt) = {ас - bd) + {ad + be) U 157
Алгебру Ж = (Ку + , —, •, 1), где 1 —единица поля F, назовем алгеброй линейных многочленов. ТЕОРЕМА 7.1. Пусть F = (F, +• — > •> \) — поле. Алгебра Ж = (К, +, —, .,1) линейных многочленов над полем & есть коммутативное кольцо, и поле & является его подкольцом. Доказательство. Главные операции алгебры &S являются продолжениями соответствующих главных операций поля У. Действительно, в силу формул (I) —(IV) для любых а, Ь из F a + b = (a + 0't) + (b + 0-t) = (a + b) + 0-t = a + b; _а = — (а + 0 •/) = (— fl)+ 0.* = — а\ а.& = (а + 0- t)-(b + 0-t) = a-b+0-t = a-b. Кроме того, элемент 1 алгебры $% есть единица поля ^. Следовательно, поле F является подалгеброй алгебры &С\ (1) ^ -$Ж. Алгебра (К, +> —) есть абелева группа. Действительно, сложение в алгебре Ж (по формуле (II)) коммутативно и ассоциативно, так как коммутативно и ассоциативно сложение в поле У. Нуль поля & является нейтральным элементом относительно сложения в алгебре <Ж\ поскольку в силу формул (I), (II) для всякого элемента a + bt из К (a + b-t) + 0 = (a + b-t) + (0 + 0>t) = (a + bt). Всякий элемент a + b-t из К обладает противоположным, так как (a + b-t) + ((— а) + (— &H) = 0 + 0.* = 0. Таким образом, установлено, что алгебра (К, + , —> является абелевой группой. Алгебра (/(, •, 1) есть коммутативный моноид. В самом деле, умножение в алгебре &? (по формуле (IV)) коммутативно в силу коммутативности умножения в поле У. Про верим ассоциативность умножения в алгебре &С\ (a + b-t).[(c+dt)-(e+ft)] = (a + bt)[(ce-df) + + (cf+de)t] = = (асе — adf — bcf — bde) + + (auf + ade + bce — bdf)t; [(a+bt) • (c+ dt)] • (e +ft) = [(ac - bd) + + (ad + bc)t](e + ft) = = (ace — bde — adf — bcf) + 4- (acf — bdf + ade + bee) t. 158
Следовательно, (a + bt)-[(c + dt).(e+ft)] = [(a + bt)(c + dt)](e+ft). Единица поля У есть нейтральный элемент относительно умножения в алгебре Ж, так как (а+Ы)-1 = (a + bt)(l+0-t) = a + bt. Таким образом, установлено, что алгебра </С, •, 1) является коммутативным моноидом. Умножение в алгебре &? дистрибутивно относительно сложения. В самом деле, [(a + bt) + (c+dt)]-(e+ft) = [(a + c) + (b + d)t](e+ft)= = (ae + ce-bf-df) + + (af+cf + be + de)t; {a + bt).(e+ft) + (c + dt).(e+ft) = [(ae-bf) + (af + be)t] + + [(ce-df) + (cf + de)t] = = (ae — bf + ce — df) + + (af + be+cf + de)t. Следовательно, [(a + bt) + (c + dl)].(e+ft) = (a + bt).(e+ft) + + (c+dt).(e+ft). Итак, доказано, что алгебра Oft является коммутативным кольцом. В силу (1) поле & является подкольцом кольца SfC. ? ОПРЕДЕЛЕНИЕ. Пусть F = (F, +, —, •, 1>-поле, в котором квадрат каждого элемента отличен от —1. Поле &С называется комплексным расширением поля F, если выполняются следующие условия: (1) & есть подполе поля $%\ (2) в &С имеется такой элемент иу что и2 = —1; (3) каждый элемент г поля <%С можно представить в виде z = a + bu, где a, b^F. ПРЕДЛОЖЕНИЕ 7.2. Пусть У —поле, в котором квадрат каждого элемента отличен от —1. Пусть Ж— комплексное расширение поля У и и —элемент поля &?, удовлетворяющий условиям (2) и (3) предыдущего определения. Тогда любой элемент z поля Ж можно единственным образом представить в виде z = a-{-bu, где a, b^F. Доказательство. Пусть г —любой элемент поля <Х. Рассмотрим два произвольных представления z в виде (4) z = a + bu, z = c + du, 159
где а, &, с, d<=F. Если Ьфй, то a + bu = c + du и и = = 533"- Следовательно, u = -^2^F и и2 = — 1. Однако это противоречит условию, согласно которому квадрат каждого элемента поля Т7 отличен от —1. Таким образом, случай, когда ЬФ&, невозможен. Следовательно, b = d и в силу (4) а = с. ? ТЕОРЕМА 7.3. Пусть F = (F, +, —, •, \)-поле, в котором квадрат всякого элемента отличен от —1. Тогда существует комплексное расширение поля &. Доказательство. Пусть К — множество всех линейных многочленов над полем У от переменной t: (1) K = {a + bt\a, be=F} (t<=?F). На множестве К отношение равенства и операции +, —, • определяются с помощью формул (I) — (V). По теореме 7.1, алгебра Ж ЯГ = </С, +, —, -, 1> есть коммутативное кольцо, и поле У является подколь- цом кольца Ж\ (2) У -$Ж. Докажем, что кольцо Ж является полем. В силу (2) нуль и единица поля У являются нулем и единицей кольца $%\ поэтому 0^^=1^. Нам остается показать, что для всякого ненулевого элемента из К существует в Ж обратный ему. Пусть а + ЫфО, где a, b^F. Тогда афО или ЬфО. Поэтому а2 + Ь2=т^0, ибо в противном случае а2 + Ь2 = 0 И (а/Ь)2 = — 1 (при ЬфО) или (6/а)2 =—1, что по условию теоремы невозможно. В силу формул (II) и (V) имеем т. е. элемент а + Ы обратим в X. Следовательно, кольцо X является полем. Элемент t из К удовлетворяет условию t2 = —1. В самом деле, в силу формул (V) и (II) имеем f.fe(0+l.*)(0 + l./) = — 1+(Ы = — 1. Наконец, в силу (2) поле аГ является подполем поля X. Следовательно, поле &С является комплексным расширением поля ©F. ? 160
ТЕОРЕМА 7.4. Пусть Jr = <F, +, — , ., \) — пом, в котором квадрат любого элемента отличен от —1. Пусть &С и &С1 — комплексные расширения поля JF. Тогда существует изоморфизм поля &? на поле &?\ оставляющий неизменными все элементы поля <&. Доказательство. В Ж существует элемент и такой, что и2 = —1, и всякий элемент поля &? единственным образом представим в виде а-{-Ьи, где a, b^F. Аналогично, в $%' имеется элемент t такой, что i2 ——1, и каждый элемент поля SfC* единственным образом представим в виде a + bt, где a, b^F. Обозначим через ty отображение К на /С', ставящее в соответствие элементу а-\-Ьи из К элемент а-\-Ы из /С'. Это отображение является инъективным отображением К на К'. Кроме того, а|) сохраняет главные операции поля Ж. Действительно, так как (а + Ьи) + {с + du) = (a + c) + (b + d)u, — (а + Ьи) = (— а) + (— Ь) и\ (a + bu) (c + du) = (ac — bd) + {ad + be) и, то ty((a + bu) + (c + du)) = (a + c) + (b + d)t = (a + bt) + ^(c + dt) = ^(a + bu) + ^(c + du)9 ^(-(a + bu)) = (-a) + (-b)t = -(a + bt) = = —^(a + bu)9 г|) ((a + bu) (с + du)) = (ас - bd) + (ad + bc)t = = (a + bt) * (c + dt) = ty(a + bu)-ty(c + du). Кроме того, я])(1) = 1 и a|)(a) = a для любого элемента а поля of. Таким образом, я|) есть изоморфное отображение поля &С на поле $С' > оставляющее неизменными все элементы поля of. ? Поле комплексных чисел. В упорядоченном поле квадрат любого ненулевого элемента положителен. Следовательно, в поле действительных чисел квадрат любого действительного числа отличен от —1. В силу теоремы 7.3 существует комплексное расширение поля действительных •чисел <М. По теореме 7.4, изоморфны любые два комплексных расширения поля <М действительных чисел. ОПРЕДЕЛЕНИЕ. Полем комплексных чисел называется комплексное расширение поля действительных чисел. Пусть g^ = (R, + 9 —» •» 1) — поле действительных чисел. Пусть ^ —поле комплексных чисел, комплексное расширение поля <М. Основное множество поля ^ обозна- 161
чим через С. Элементы множества С называются комплексными числами. Обозначим через i такое комплексное число, что ?2 =—1 и любое комплексное число z из С можно представить в виде z = a + bi, где a, 6gR. Это представление называется алгебраической формой числа z. Число i называется мнимой единицей поля комплексных чисел. ТЕОРЕМА 7.5. Пусть % = (С, +, -, ., \)-поле комплексных чисел, комплексное расширение поля <М действительных чисел, и а, 6, с, d — любые действительные числа. Тогда (1) a + bi = c + di тогда и только тогда, когда д = си b = d\ (2) (a + bi) + (c + di) = (a + c) + (b + d)i; (3) _ (fl+ M) = (_ a)+<-!>)*; (4) (а + Ы) (с + di) = (ас - bd) + (ad + be) i; (5) если а + ЫфО, то (а + 60"1 = 5в^ + ^гр-'- Доказательство. Пусть a-f bi = c-\-di. ЕслиЬ = ^, то а = с. Если же b=?dy то i = —^^ R и (g^j) = — 1, что невозможно. Следовательно, случай, когда bфdt невозможен. Поскольку W — поле, то имеют место равенства (2), (3) и (4). Пусть а + ЫфО. В силу (1) афО или ЬфОка — Ыф ФО. Так как произведение любых двух ненулевых элементов поля 8f отлично от нуля, то (а + Ы) (а — 6i) = = а2 + Ь2 Ф 0. Следовательно, у . - .. j а — 6t а , (— Ь) . ОПРЕДЕЛЕНИЕ. Числовым полем называется любое подполе поля комплексных чисел. Любое числовое поле содержит подполе рациональных чисел. В самом деле, пусть Jr = (F, + , —, •, 1) —любое числовое поле. Так как 0, 1 е F и множество F замкнуто относительно операций +» —, to/z=1+...+ 1^F и —n^F. Следовательно, F содержит все целые числа. Множество F замкнуто относительно деления и, значит, содержит все элементы вида тп~г, обозначаемые символом т/п. Следовательно, F содержит множество Q всех рациональных чисел. Множество Q замкнуто относительно главных операций поля ^ и всякий ненулевой элемент из Q обратим в Q. Значит, алгебра й9 $ = (Q, + >—,-, 1), 162
является подполем поля qF . Следовательно, числовое поле of содержит подполе & рациональных чисел. ОПРЕДЕЛЕНИЕ. Числовым кольцом называется любое подкольцо поля комплексных чисел. Так, например, кольца %, &, & являются числовыми. Подкольцо поля ^, порожденное элементом i и обозначаемое % [i], есть числовое поле. Сопряженные комплексные числа. Если z = a + W, где a, 6eR, то число а — Ы обозначается через г. ОПРЕДЕЛЕНИЕ. Комплексные числа г = а + Ы и 2 = а — Ы называются сопряженными. Напомним, что изоморфное отображение поля на себя называется автоморфизмом поля. ТЕОРЕМА 7.6. Если z и z' —любые комплексные числа, то (1)7+? = Z + z'; (2) Pz) = -z; (3) zz' = z-z'; <4)(Z) = *; (5) z = г тогда и только тогда, когда z ^ R, (6) если z = a + bi, то z*z = a2 + b2. Доказательство теоремы предоставляется читателю. СЛЕДСТВИЕ 7.7. Отображение поля комплексных чисел *? в себя, ставящее в соответствие любому комплексному числу z сопряженное число z, является автоморфизмом поля ?f, оставляющим неизменными действительные числа. Модуль комплексного числа. Введем понятие модуля комплексного числа. ОПРЕДЕЛЕНИЕ. Модулем комплексного числа а + Ы (a, 6eR) называется арифметический квадратный корень из числа а2 + 62, т. е. число (a2 + b2)1/z. Модуль комплексного числа z = a + bi обозначается через |г| или \a + bi\. Таким образом, согласно определению, |z|2 = a2+62. ТЕОРЕМА 7.8. Для любых комплексных чисел z и и (1) (2)1 (3) (4) (5) (6) (7) г|2 = г-|; z | = 0 тогда и только тогда, когда г === 0; zu | = | г | • | и |; zr1\ = \z\-1 при гфО; z + u\^\z\ + \u\; z| — |a|^|z + «|; |г|-|"Н<|2 + "|. 163
Доказательство. (1) Если z = a + 6i, то 2 = a—bi и z-z = a2 + b2 = \z\2. (2) Если |2| = |a + W|=0f то |з|2 = а2 + Ь2 = 0. Так как а и Ъ — действительные числа, то из а2 + Ь2 = 0 следует а = & = 0, т. е. 2 = 0. (3) В силу (1) \zu\2 = (zu)(M) = (zu) (m) = (z2)(ua) = \z\2\\u\2 = (\z\-\u\)2. Из равенства \ги |2 = (|z |-| а|)2 следует формула (3). (4) Согласно (3), при г^О Следовательно, | г-"11 = | гт |""х- (5) На основании (1) имеем \z+l\* = (z+\).(z + \) = \z\2 + z + Z+l. Кроме того, если z = a + bi, то 2 + 2 = 2а^2(а2 + Ь2)1/2 = = 21 г |. Поэтому 12 +112 ^ (| 21 +1 )2; следовательно, |2+1|^|2| + 1. На основании формулы (3) и последнего неравенства заключаем, что при и^О |2 + a| = |a(2W-1+l)| = |^||^-1+l|<|w|(|2a-1|+l) = = \и\(\г\\и\-*+1). Следовательно, |г + и|^|г| + |я|. (6) Так как 2 = — и + (г+и) и | — и\ = \и\, то в силу (5) |г|^| —и| + |г + и| = |и| + |г + и|. Следовательно, |г|-|а|^|г + а|. (7) Поскольку число 11 z \ — | и 11 равно | z | — | и | или |и| —|z|, то неравенство (7) следует из неравенства (6). ? Геометрическое представление комплексных чисел. Каждому комплексному числу z = a + bi поставим в соответствие точку М(а, Ь) плоскости (с прямоугольной системой координат) с абсциссой а и ординатой Ь. Точка М(а, Ь) называется точкой, изобраоюающей число а + Ы. Для любых двух комплексных чисел а + Ы и c-\-di равенство a-{-bi = c + di имеет место тогда и только тогда, когда а = си b = d. Поэтому отображение, ставящее в соответствие каждому комплексному числу а + Ы точку М (а, Ь) координатной плоскости, является инъективным отображением множества С комплексных чисел на множество всех точек координатной плоскости. Координатная плоскость, точки которой изображают комплексные числа, называется комплексной плоскостью. 164
Пусть г и ср —полярные координаты точки М (точка О —начало, Ох — полярная ось). Тогда r = (a2 + ft2)vs т. е. г —модуль комплексного числа а + Ы. Действительные числа изображаются точками оси абсцисс; поэтому ось абсцисс называется действительной осью. Точки оси ординат изображают чисто мнимые числа, т. е. числа вида Ы, где 6gR, поэтому ось ординат называется мнимой осью. Сопряженные комплексные числа z и 2 изображаются точками, симметричными относительно действительной оси. Взаимно противоположные числа z и —z изображаются точками, симметричными относительно начала координат. Точки, изображающие комплексные числа с одним и тем же модулем г, г>0, расположены на окружности радиуса г с центром в начале координат. Изобразим на комплексной плоскости комплексные числа Ч = «1 + hi, z2 = a2 + b2i и их сумму z3 = (аг + а2) + {Ьг + b2) i соответственно точками М19 М2 и Ms. Геометрически направленный отрезок ОМ3 получается из направленных отрезков OMt и 0М2 по «правилу параллелограмма». Упражнения 1. Найдите на плоскости точки, изображающие комплексные числа 1, /, 1 + f, 1—t, — 1 — U 1+*КЗ, 1/3 — *. 2. Пусть даны положительное действительное число а и комплексное число с. Найдите множество точек плоскости, которые изображают комплексные числа 2, удовлетворяющие условиям: z| = a; (b) I 2—с\=а; z\ <a; (d) j 2—с | <a; Й|^+1|=2. <0|.-i-'l<^ 3. Решите уравнения: (a) (1 — i) z — 3i2 = 2—i; (b) 2-z —22 = 3 — i; (c) 2-z + 3(2—z) = 4+3i; (d)2.5 + 3(2 + z) = 7; (e) z-z + 3(z + z) = 3i. 4. Покажите, что для любых комплексных чисел zx и z2 выполняется равенство | 2i+22 |2 + | 2i — 2212=2 (| zx |2+| 22|2)» Выясните геометрический смысл этого равенства* 5. Решите систему уравнений: (a) u: + (l+Qt/ = 3-*; (1—t) л:—(6 — 0 ^=4; (b) (2+0*-(3+о </=*; (3—ojb+(2+oj=~«- (а) (с) (е) fe) 165
6. Решите уравнения (в поле комплексных чисел): (a) z2—(4+30 2+1 +5i=0; (b) г2+5г+9=0; (c) 22+г + 1 + *=0; (d) гз+1=0; (e) г4+1=0. 7. Докажите, что в поле комплексных чисел имеется только один отличный от тождественного автоморфизм, переводящий действительные числа снова в действительные. 8. Докажите, что каждое числовое кольцо содержит подкольцо целых чисел. 9. Пусть Ci—множество всех квадратных матриц второго порядка вида , с действительными а и 6. Докажите, что алгебра <СХ, +, —, •, е) типа (2, 1, 2, 0), где +, —, • суть обычные операции над матрицами ие= . , есть поле, изоморфное полю комплексных чисел. 10. Пусть К—множество всех комплексных чисел вида m-\-ni с целыми тип. Покажите, что алгебра (К, +,—,-, 1) является областью целостности (целостным кольцом). Это кольцо называется кольцом целых гауссовых чисел. 11. Опишите подполе поля комплексных чисел, порожденное числом i и рациональными числами. § 8. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА. ИЗВЛЕЧЕНИЕ КОРНЕЙ ИЗ КОМПЛЕКСНЫХ ЧИСЕЛ Тригонометрическая форма комплексного числа. Наряду с алгебраической формой комплексного числа широко применяется тригонометрическая форма. ПРЕДЛОЖЕНИЕ 8.1. Для любых действительных чисел х и у, удовлетворяющих условию (1) х2+у2=1, существует единственное действительное- число <р такое, что (2) # = cosq), # = sincp, 0^ср<2зт. Доказательство. Предположим, что действительные числа х и у удовлетворяют условию (1), тогда (3) |*|<1. Любое действительное число, удовлетворяющее условию (3), принадлежит области значений функции cos в замкнутом 166
интервале [0, я]. Следовательно, существует такое действительное число i|), что (4) # = cosoj), О^ф^я. В силу (1) и (4) #2 = sin2iJ) и r/ = ±sina|?. Если y = sinfty, то положим ф==г|). Если же у —— sini|), то положим ф = = 2я — г|). В любом случае действительное число ф удовлетворяет условиям (2). Предположим, что 0 — произвольное действительное число, удовлетворяющее условиям (5) х = cos б, у = sin 8, 0^б<2я. Допустим, что б^ф, тогда sin (ф — б) = sin ф cos б — cos ф sin б = ух — ху — 0. Но О^ф — б<2я, поэтому равенство sin^ — 6) = 0 возможно лишь в случае ф — б = 0 или ф — б = я. Если ф — б = я, то cos ф = — cos б = — х = — cos ф, sin ф = — sin 0 = — у — =—8Шф; из равенств созф = — со8ф, вшф=—8Шф следует со8ф = 8Шф = 0, что невозможно. Таким образом, случай, когда ф — 6 = я, невозможен. Следовательно, ф — 6=0 и ф = б. ? ТЕОРЕМА 8.2. Для любого комплексного числа г, отличного от нуля, существует единственная пара действительных чисел г и ф такая, что (1) z = r(coscp-\-isinq)), 0</*, 0^ф<2я. Доказательство. Если г удовлетворяет условиям (1), то | 212 = г2 (cos2 ф + sin2 ф) = г2 и г = | z |. Следовательно, существует не более одного действительного числа г, удовлетворяющего условиям (1). Пусть г = а + ЫфО, где а, Ь — действительные числа. Положим r = (a2 + b2)1/s г>0. Тогда (a/rf + (b/r)2= 1. В силу предложения 8.1 существует единственное действительное число ф, удовлетворяющее условиям (2) а/г = cosф, b/r = sin у, 0^ф<2я. Так как г>0 и г==г[у + уч> то из (2) следует (3) г = г(со8ф + 18Шф), 0^ф<2я. С другой стороны, из (3) следуют равенства а + Ы = = гсо8ф + г8тф-г\ а = гсо8ф, Ь = r sin ф. Поэтому из условий (3) следуют условия (2). Таким образом, условия (2) и (3) при г>0 равносильны. Следовательно, сущест- 167
вует единственная пара действительных чисел, удовлетворяющих условиям (1). ? ОПРЕДЕЛЕНИЕ. Тригонометрической формой комплексного числа z называется его представление в виде z = r(coscp + t sinqp), где г и ф — действительные числа и rS^O. ТЕОРЕМА 8.3. Пусть (1) 2 = г(со8ф + ^тф), г>0, (2) z = /i(cosi|) + tsini|)), /*!>(), — два представления комплексного числа z в тригонометрической форме. Тогда r = r1 = \z\ и существует такое целое число k, что ф — г|э = 2я&. Доказательство. В теореме 8.2 установлено, что из (1) и (2) следуют соответственно равенства r = |z| и гг = \г\у или r = r1 = |z|. По теореме 6.3, для пары чисел Ф и 2я существуют действительное число а и целое число т такие, что (3) ф = 2ят + а, 0^а<2я. Диалогично, для чисел г|) и 2я существуют действительно число р и целое число п такие, что (4) я|) = 2яп + р, 0^р<2я. На основании формул (1), (3) имеем г = |г| и (5) z = |z|(cosa + *sina). В силу формул (2), (4) получаем /i = |z| и (6) z = |z|(cosp + *sinp). Поскольку | z | Ф О, из (5) и (6) следует, что (7) cosa + tsina = cos p + tsin р. Так как О^а, р<2я, то, по теореме 8.2, из (7) получаем (8) а = р. На основании (3), (4) и (8) заключаем, что ф — 1|) = 2я&, где k = m — n. D ТЕОРЕМА 8.4. Пусть z = |z|(COS(P + *sin(P)» zi = =ь IZiKcosty + tsinij)), где ф и я|э — действительные числа; 168
тогда (1) ггг = | г 11 г± | [cos (ф + г|>) + * sin (ф + ф)]; (2) ^ = |^| [cos (ф — г1))Н-? sin (ф — -ф)] при г±фО; (3) zn = | z\n (cos mp-|-t sin /гф) для любого натурального п\ (4) (cos ф + * sin ф)я = cos «ф +1 sin тр. Доказательство. В силу дистрибутивности умножения комплексных чисел относительно сложения имеем г. гг = | г | • | гх | [(cos ф cos -ф — sin ф sin я|)) + (cos ф sin ф + + cos ф sin ф)^]. Отсюда следует формула (1), поскольку cos ф cos ф — sin ф sin ф = cos (ф + ф); cos ф sin -ф + cos ф sin ф = sin (ф + ф). В силу формулы (1) получаем (cos г|) + i sin ф) (cos (— ф) + i sin (— Щ = = cosO-ftsinO = l, поэтому . . = cos (— ib) 4-1 sin (— \b) COSl|) + l SHll|) \ Y/ I \ Y/ И ПрИ 2!=^ О ^=Hb(cos (— ^+isin (— *We Следовательно, по формуле (1), Формула (3) доказывается индукцией по п на основании формулы (1). Формула (4) получается из формулы (3) при |z| = 1. ? Формулы (3) и (4) называются формулами Муавра. Корни я-й степени из единицы. Пусть п — любое натуральное число, отличное от нуля. ОПРЕДЕЛЕНИЕ. Комплексное число wt удовлетворяющее условию доя=1э называется корнем п-и степени из единицы. 169
ТЕОРЕМА 8.5. Существует точно п различных корней п-й степени из единицы и все они получаются по фор- муле 2я& . . . 2я/г * п * t wk = zo% \-ism— при я = 0, l, ..., п— 1. Доказательство. Каждое из чисел wk есть корень п-й степени из единицы, так как согласно формуле Муавра к- = fcos f-t sin — j = zos2m + ism2nk = 1. „ „ 2n-0 2я-1 2я(я —1) Действительные числа —^—, ——, ..., —- неотрицательны, меньше числа 2я и попарно различны. Следовательно, по теореме 8.2, комплексные числа w0, wl9 ... ..., wn-x попарно различны. Нам остается показать, что произвольный корень п-й степени из единицы принадлежит множеству {w09 wl9 ... ..., wn-t}. По теореме 8.2, число w можно представить в виде w = | w | (cos ф -Н sin ф), причем действительное число Ф удовлетворяет условиям (1) 0^ф<2я. Так как wn= 1, то \w \п= 1 и, по теореме 6.4, |ш| = 1. Следовательно, w = cos ф + i sin ф. По формуле Муавра wn = = cos п ф + i sin дф. Поэтому равенство wn = 1 можно записать в виде (2) cosmp + isinmp = cosO + ?sinO. По теореме 8.3, из (2) следует, что nq> — G = 2nk для неко- п ¦и торого целого числа &, поэтому ф = —'—. Кроме того, в силу (1) О <; ф = -i— < 2я и, значит, 0 ^ k < д. Следовательно, л 2nk . ¦ . 2я& ( , „ ^ = cos—+ tsin—==ayfte={ay0, a>j> ..., wn^}. П СЛЕДСТВИЕ 8.6. Точки комплексной плоскости, изображающие корни п-й степени из единицы, являются вершинами правильного п-угольника, вписанного в окружность единичного радиуса с центром в начале координат, причем одна из вершин находится в точке (О, 1). ОПРЕДЕЛЕНИЕ. Комплексное *щсло w называется первообразным корнем п-й степени из единицы (п^1), если 170
множество чисел {w°, w1, ..., юп~г} является множеством всех решений уравнения zn—l. Так, например, при любом натуральном п^\ число ^ = cos |- i sin— в силу теоремы 8,5 является первообразным корнем п-й степени из единицы. Корни п-й степени из произвольного комплексного числа. Тригонометрическая форма комплексного числа позволяет полностью решить вопрос об извлечении корней из комплексных чисел* ТЕОРЕМА 8.7. Пусть с = | с | (cos ф + i sin ф) — отличное от нуля комплексное число и п — ненулевое натуральное число. Существует п различных корней п-й степени из числа с и все они получаются по формуле e.H*r(cosJ^ + *ein.S^), ft-0,1 Я-1. Доказательство. Покажем, что (1) uk = u0wkt k = 0, 1, ..., п— 1, где w0, ..., дол_х — корни п-й степени из единицы и Щ = | с I1/" (cos -J- + i sin -$-). В самом деле, в силу формулы Муавра «fc = |Cr(cosf + isin-2-)(cos2f + tsin^:) = «0t^. Каждое из чисел uk есть корень п-й степени из числа с, так как в силу (1) ип = unQW,i = unQ = (| с I*/*)* (cos -J + i sin -2-)" = = | с I (cos ф + i sin ф) = с. Если «— произвольный корень п-й степени из числа с, то (гш~ * Y* = ип (и%у 1=сс~1 = 1. Поэтому и в силу (1) u^{uQwQ9 ..., м0шл..1} = {и0, ..., ип-х}. Следовательно, множество {и0,..., «„-х} является множеством всех корней п-й степени из числа с. Это множество содер- 171
жит в точности п различных элементов, поскольку {и0, ..., un-1} = {u0w0, ..., и0шп-г}9 и0 Ф 0 и числа wQ, ..., wn-x попарно различны (по теореме 8.2). ? Упражнения 1. Представьте в тригонометрической форме комплексные числа: 1, U -1, -i, 1+t, 1-t, _± + t J^L, V3 + i. 2. Найдите множество точек плоскости, изображающих комплексные числа г, для которых: (a) argz=0; (b) arg2=-| ; (с) argz = jt; (d) argz = y. 3. При каких условиях модуль суммы двух комплексных чисел равен сумме модулей слагаемых? 4. При каких условиях модуль суммы двух комплексных чисел равен разности модулей слагаемых? 5. Опишите следующие отображения (С->С): (2)z^z\(Ъ)z+->-{zфЪ)\ (с) z*->iz\ (d) zt-*iz; (e) 21—> rz, где г—положительное число; (f) 21—>¦ (cos ф + i sin ф); (g) z н—*- — z; {h) 2 н-¦>• r (cos ф + i sin ф); (i) z н—** z~K ~ rr 2я . . . 2я „ 6. Пусть oj=cos-«—p-t sin-^- ил—натуральное число. Вычислите: (а) (1+ш)Л; (b) wn + wn. 7. Вычислите сумму у + cos я+cos 2*+ ... +cosn*. . п+\ . пх sin ' х • sin y 8. Покажите, что sin *+sin 2*+ ... + sin>i* =— . sin| 9. Выразите через cos* и sin*: (a) cos Ьх; (b) sin 5*; (с) cos 6*; (d) sin 6*; (е) cos 8*. 10. Найдите формулы, выражающие cos пх и sin пх через стх и sin*. И. Выразите в виде многочлена первой степени от косинусов и синусов углов, кратных х: (a) sin3*; (b) cos5*; (с) sin5*; (d) cos6*. 12. Найдите все корни из единицы степени: (а) 2; (Ь) 3; (с) 6; (d) 8; (е) 12; (f) 24. 13. Найдите все комплексные корни уравнений: (a) 23 + f = 0; (b) 23 + 2 + 2t = 0; (с) г4+у + i ^ =0; (d)26 + t = 0; (e) 25—1=0. 14. Найдите сумму и произведение всех корней n-й степени из 1. 172
15. Пусть 8 = cos \-i sin , где n —целое положительное J n n ' число. Покажите, что комплексное число z является первообразным корнем п-й степени из единицы тогда и только тогда, когда г = &т для некоторого натурального числа т, взаимно простого с /г, 16. Найдите первообразные корни степени: (а) 2; (Ь) 3; (с) 4; (d) 5; (е) 6; (!) 8; (g) 12; (h) 24. 17. Найдите все комплексные числа, удовлетворяющие условию z = zn~\ где п—целое положительное число и z—сопряженное с г. 18. Докажите следующие утверждения: (a) произведение корня степени т из 1 на корень степени п из 1 есть корень степени тп из 1; (b) если тип взаимно простые, то существует только одно комплексное число z, удовлетворяющее условиям zm=\ и zn=\; (c) если числа тип взаимно простые, то все корни степени тп из 1 получаются умножением корней степени т из 1 на корни степени л из 1; (d) если тип взаимно простые, то произведение первообразного корня степени т из 1 на первообразный корень степени п из 1 есть первообразный корень степени тп из 1 и обратно.
Глава пятая АРИФМЕТИЧЕСКИЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ § 1. АРИФМЕТИЧЕСКИЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА Арифметическое я-мерное векторное пространство. Пусть У — произвольное фиксированное поле, У = (F, +, —, •, 1), и F — его основное множество. Элементы множества F назовем скалярами, F — множеством скаляров, a J5" —полем скаляров. Пусть п — фиксированное натуральное число, отличное от нуля. ОПРЕДЕЛЕНИЕ, n-мерным вектором над полем У называется любой кортеж из п элементов поля У. Множество всех /г-мерных векторов над полем У обозначается символом Fn. Вектор обычно записывается в виде строки или столбца. В этом параграфе n-мерный вектор записывается в виде строки (Oi, a2, ..., ал), где а19 а2, ..., a„eF, На множестве n-мерных векторов над полем У введем отношение равенства, операцию сложения векторов и операцию умножения вектора на скаляр. ОПРЕДЕЛЕНИЕ. Векторы (а19 ..., ап) и (рх, ..., ря) называются равными, если ах = р!, ..., ал = ря. ОПРЕДЕЛЕНИЕ. Суммой векторов (о^, ..., ап) и (Pi> ...» Рл) называется вектор (ai + Pi» ..., ал + рл), т.е. (ах, ...,ая) + (р1, ..., Pn) = (a1 + Pi, ..., ая + Рл). ОПРЕДЕЛЕНИЕ. Произведением скаляра К на вектор (ах, ..., аЛ) называется вектор (Яа1э ..., faxn), т. е. Я(а1э ..., ал) = (Яа1, ..., Ып). Операцию умножения на скаляр Я обозначим символом сол, т. е. сол(а1э ..., ал) = Х(ос1, ...^ ап). 174
Для каждого X из F щ есть унарная операция на множестве Fn л-мерных векторов. Вектор (0, ..., 0) называется нулевым вектором и обозначается символом 0. Нулевой вектор является нейтральным элементом относительно сложения. Вектор (—1) • (а19 ..., ап) называется вектором, противоположным вектору а = (а±, ..., ап), и обозначается символом—а. Очевидно, а + (— а) = 0. ОПРЕДЕЛЕНИЕ. Арифметическим n-мерным векторным пространством над полем OF называется множество Fn с заданными на нем бинарной операцией сложения и унарными операциями щ, т. е. алгебра (Fn, +, {(ok\X^F}). Арифметическое ^-мерное векторное пространство над полем У обозначается символом &п. Операция сложения векторов и унарные операции щ являются главными операциями векторного пространства Jrn. ТЕОРЕМА 1.1. Главные операции векторного пространства &* обладают следующими свойствами: (1) алгебра (Fn, +, —>, где — а = со_х(а) для любого а из Fn, есть абелева группа; (2) умножение на скаляры ассоциативно, т. е. (оф) а = = а(ра) для любых а, $ из F и любого а из Fn\ (3) умножение на скаляр дистрибутивно относительно сложения, т. е. a(a + b) = aa+ab для любого а из F и любых a, b из Fn\ (4) умножение на вектор дистрибутивно относительно сложения скаляров, т. е. (а + Р)# = аа + Р# для любых а, $ из F и любого а из Fn; (5) 1 • а = а для любого а из Fn. Доказательство. Докажем, что алгебра (Fn, -f, —) есть коммутативная группа. Коммутативность сложения векторов непосредственно следует из определения сложения и того, что F — поле. Ассоциативность сложения следует из ассоциативности сложения скаляров: (а+Ь) + с = ((а1У ..., a„) + (plf ..., p»)) + (Yi. .... Y*) = = («i + Pi» • > a* + Pii) + (Yi> • -•» 7я) = = ((<*i + Pi) + Yi> ..- K + P*) + Y*) = = (<*i +(Pi+ Yi)> •••¦ «* + (P* + Y*)) = = (au ..., a,t)+<Pi + Yi> •..» P* + Y/*) = = a + (b + c). 175
Вектор 0 является нейтральным элементом относительно сложения, т. е. а+0=0+#=а для любого вектора а. Вектор — а = (— а±,..., — ап) является противоположным вектору а, т. е. # + (—а) = 0 = (—а) + а. Таким образом, (Fn, +, —> есть группа. Ее коммутативность следует из коммутативности сложения скаляров. Легко проверить также выполнимость свойств (2)—(5). ? Линейная зависимость и независимость системы векторов. Пусть & — поле скаляров и F — его основное множество. Пусть бТ=^'/г — л-мерное арифметическое пространство над J и ^, ..., От —• произвольная система векторов пространства *J/°. ОПРЕДЕЛЕНИЕ. Линейной комбинацией системы векторов аг, ..., ат называется сумма вида ^i+--- + ^m^mi где %г, ..., Km^F. Скаляры 7^, ..., Хт называются коэффициентами линейной комбинации. Линейная комбинация называется нетривиальной, если хотя бы один ее коэффициент отличен от нуля. Линейная комбинация называется тривиальной, если все ее коэффициенты равны нулю. ОПРЕДЕЛЕНИЕ. Множество всех линейных комбинаций векторов системы аг, ..., ат называется линейной оболочкой этой системы и обозначается через Ь(аг,..., ат). Линейной оболочкой пустой системы считается множество, состоящее из нулевого вектора. Итак, по определению, L (#!,..., ат) = {Mi+M2 + - • -+Kdm I ^i»... Лт е F}. Легко видеть, что линейная оболочка данной системы векторов замкнута относительно операций сложения векторов, вычитания векторов и умножений векторов на скаляры. ОПРЕДЕЛЕНИЕ. Система векторов аъ ..., ат называется линейно независимой, если для любых скаляров %х, ..., %т из равенства 'k1a1 + ... + Xmam = 0 следуют равенства ^ = 0, ..., %т = 0. Пустая система векторов считается линейно независимой. Другими словами, конечная система векторов линейно независима в том и только в том случае, когда всякая нетривиальная линейная комбинация векторов системы не равна нулевому вектору. ОПРЕДЕЛЕНИЕ. Система векторов аъ ..., ат называется линейно зависимой, если существуют скаляры Лх, ..., Ят, не все равные нулю, такие, что 176
Другими словами, конечная система векторов называется линейно зависимой, если существует нетривиальная линейная комбинация векторов системы, равная нулевому вектору. Система векторов *1==(1, 0, ..., 0), *2 = (0, 1, 0, ...,0), ..., *Л = (0, 0, ..., 0, 1) называется системой единичных векторов векторного пространства 3:1г. Эта система векторов линейно независима. В самом деле, для любых скаляров Ях, ..., Кп из равенства Х1е1+... + К^п = 0 следует равенство (kl9 ..., ЯЛ) = 0 и, значит, равенства ^ = 0, ..., %п = 0. Рассмотрим свойства линейной зависимости и независимости ^системы векторов. СВОЙСТВО 1.1. Система, векторов, содержащая нулевой вектор, линейно зависима. Доказательство. Если в системе векторов аг, ... ..., аи, ..., dm один из векторов, например вектор ak, нулевой, то линейная комбинация векторов системы, все коэффициенты которой нулевые, за исключением коэффициента при ak, равна нулевому вектору. Следовательно, такая система векторов линейно зависима. ? СВОЙСТВО 1.2. Система векторов линейно зависима, если какая-нибудь ее подсистема линейно зависима. Доказательство. Пусть аг, ..., ak — линейно зависимая подсистема системы аг, ..., ат, т. е. Я1а1+... ...+^#? = 0, причем хотя бы один из коэффициентов Хх, Я2, ..., Xk отличен от нуля. Тогда Я^ + ... + K^k + + 0 ak+i + ... + 0 • ат = 0. Следовательно, система векторов аъ ..., ат линейно зависима. ? СЛЕДСТВИЕ. Любая подсистема линейно независимой системы линейно независима. СВОЙСТВО 1.3. Система векторов (1) иъ о» ..., ит, в которой игФ0, линейно зависима тогда и только тогда, когда хотя бы один из векторов и2, ..., ит является линейной комбинацией предшествующих векторов. Доказательство. Пусть система (1) линейно зависима и игФ0. Тогда существуют скаляры XL, ..., %т, не все равные нулю, такие, что (2) Mi+...+^w = 0. 177
Обозначим через k наибольшее из чисел 1, 2,..., т, удовлетворяющее условию КфО. Тогда равенство (2) можно записать в виде (3) Mi+..-+Mft = 0. Отметим, что &>1, ибо в противном случае ^2 = 0, ..¦ ..., А,т = 0, %1и1 = 0; следовательно, ^ = 0, поскольку и±Ф Ф0. Из (3) следует равенство Предположим теперь, что вектор us, l<s^:m, есть линейная комбинация предшествующих ему векторов, т. е. us = Mi + ... + Vi»m- Тогда Я^ + ... + Vi»m + + (—1)^ = 0, т. е. подсистема я1э ..., #5 системы (1) линейно зависима. Следовательно, по свойству 1.2, линейно зависима и исходная система (1). ? СВОЙСТВО 1.4. Если система векторов ии ..., ит линейно независима, а система векторов (2) иъ #2, ..., ит, v линейно зависима, то вектор v линейно выражается через векторы (1) иг, ..., #,„, и притом единственным образом. Доказательство. По условию система (2) линейно зависима, т. е. существуют скаляры ^, ..., Кт, К, не все равные нулю, такие, что (3) Киг+ ... +%mttm+to = 0. При этом %Ф0, так как при Я = 0 %гих+ ... + Ят#т = 0, что противоречит линейной независимости системы (1). Из (3) следует равенство * = (— ЪггК) %+...+(— ЪггЮ пт. Если v = 'k[u1+ ... +Ктит и © = |х1й1+... +|хтйт, то В силу линейной независимости системы (1) отсюда следует, что М —fXi = 0, ..., \'т — |xm = 0 и Xi = |х1э ..., Я^ = |хт. П СВОЙСТВО 1.5. Если ue=L{vu v2, ..., vm) и г>х, ..., vme?L{wv ..., то,), mo де[(% ..., ws). in
Доказательство. Условие #<=L(t>x, ..., ^означает, что найдутся такие скаляры alt ..., ат, что 1) и^а^х+ ... +amvm. Условие Vi&L {wv ..., ws) означает, что существуют такие скаляры %ik, что 2) vi = Kilw1+...+KuWs (* = 1» .... m). В силу (1) и (2) получаем и = ах (Яп^-Ь.. . + ^«1,) + . * . + am(Xmlw1-f.. • т. e. u^L(wl9 ..., tt^). ? ТЕОРЕМА 1.2. ?аш (1) «!, ..м feiElfe, ..., ©m)f mo система векторов иг, ..., #m+1 линейно зависима. Доказательство (проводится индукцией по т). Будем считать, что векторы ulf ..., irm+i — ненулевые, так как в противном случае теорема очевидна. Предположим, что га=1 и иг> u2^L(v1)1 т. е. u1 = av1 и и2*=$юг. Тогда а Ф О, Р =И= 0 и or1**! + (— Р-1) аа = 0. Следовательно, система векторов и19 и2 линейно зависима. Предположим, что теорема верна при т = л—1, и докажем, что тогда она верна при m = /i. Пусть я1э ... ..., йдце!^, ..., t>„), т. е. д1=х11^1+...+А1^п; (2) ип = %nlv± +... + А,яяяя; Если в правых частях равенств (2) все коэффициенты при vn равны нулю, то и19 ..., ип <= L (%, ..., s^) и, по индуктивному предположению, система векторов ult..., ип линейно зависима, а значит, линейно зависима и система и±> ..., ип, #л4-1- Если же хотя бы один из коэффициентов при vn, например А,Л+1,Л, отличен от нуля, то исключим вектор vn из первых п равенств. В результате получим Un — Рл#л+1 =* ^Л1^1 + ... + К, n-lVn-l- 179
По индуктивному предположению, из (3) следует, что система векторов и^—^ип\\>..., йл — РЛ#Л-и линейно зависима. Следовательно, существуют скаляры Х19 ..., Ял, не все равные нулю, такие, что К («1 - М/г+i) + • • • + К (Un - M/H-l) = О или ^i#i + • • •+^пип+ЯЛ+1»л+1 = О, где Яя+1= — (^iPi+...+^лРл)' Следовательно, система векторов иъ ..., #Л+1 линейно зависима. П СЛЕДСТВИЕ 1.3. Если я1э ..., uk^L(vl9 ..., vm) и k>m, то система векторов и19 ..., щ линейно зависима. СЛЕДСТВИЕ 1.4. Если и±> ..., uk<=L(vv ..., tfm) и система векторов uv ..., я* линейно независима, mok<,m. СЛЕДСТВИЕ 1.5. В n-мерном арифметическом векторном пространстве линейно зависима любая система векторов, состоящая из п+1 или большего числа векторов. Следствие 1.5 вытекает из теоремы 1.2, так как любой л-мерный вектор (ах, ..., ап) является линейной комбинацией единичных векторов е19 ..., еп: («1, ..., ал) = аА+...+аАеМ^ ...> еп). Эквивалентные системы векторов. На множестве конечных систем векторов данного векторного пространства V введем бинарное отношение <~. ОПРЕДЕЛЕНИЕ. Пусть S и Т —системы векторов; S~T, если каждый ненулевой вектор любой из этих систем можно представить в виде линейной комбинации векторов другой системы. Легко проверить, что бинарное отношение ~ рефлексивно, транзитивно и симметрично, а значит, является отношением эквивалентности. В связи с этим системы векторов S и Т называются эквивалентными, если S~T. Отметим, что пустая система векторов эквивалентна как пустой системе векторов, так и системе, состоящей из нулевых векторов. Рассмотрим некоторые свойства эквивалентных систем векторов. ТЕОРЕМА 1.6. Две системы векторов эквивалентны тогда и только тогда, когда равны их линейные оболочки. Доказательство. Пусть S~ Т. Тогда каждый вектор системы 5 принадлежит множеству L(T), а каждый вектор системы Т принадлежит множеству L(S). Поэтому 180
в силу свойства 1.5 L(S)czL{T) и L(T)aL(S), т. е. L(S) = L(T). Обратно: если L(S) = L(T), то, очевидно, S~T. ? ТЕОРЕМА 1.7. Если две конечные системы векторов эквивалентны и каждая из них линейно независима, то эти системы состоят из одинакового числа векторов. Доказательство. Теорема, очевидно, верна, если обе системы векторов пустые. Пусть и19 ..., иг и vl9 ... ..., vs — две непустые эквивалентные системы векторов, каждая из которых линейно независима. Тогда в силу следствия 1.4 r^s ns<r. Следовательно, r = s. ? ОПРЕДЕЛЕНИЕ. Элементарными преобразованиями конечной системы векторов называются следующие преобразования: (а) умножение какого-нибудь вектора системы на отличный от нуля скаляр; (Р) прибавление (вычитание) к одному из векторов системы другого вектора системы, умноженного на скаляр; (у) исключение из системы или введение в систему нулевого вектора. Элементарные преобразования (а) и ф) называются неособенными, преобразование (7) называется особенным. ТЕОРЕМА 1.8. Если одна конечная система векторов получается из другой системы векторов в результате цепочки элементарных преобразований, то эти две системы эквивалентны. Доказательство. Пусть (1) 01, а2, ..., ат — исходная система векторов. Если умножить один из векторов системы, например первый, на отличный от нуля скаляр %, то получим систему Яах, а2, ..., ат, эквивалентную исходной системе. Если прибавить к одному из векторов системы другой вектор, умноженный на скаляр, например прибавить к первому вектору k-u вектор, умноженный на К, то получим систему аг+Ык, аг, ..., ат, эквивалентную исходной системе. Применение к исходной системе векторов преобразования (у), очевидно, приводит к системе векторов, эквивалентной исходной системе. Следовательно, в силу транзитивности отношения эквивалентности система векторов, получающаяся из системы (1) в результате цепочки эле- 181
ментарных преобразований, эквивалентна исходной системе векторов (1). ? Базис конечной системы векторов. Введем одно из основных понятий теории векторных пространств. ОПРЕДЕЛЕНИЕ. Базисом конечной системы векторов называется непустая линейно независимая ее подсистема, эквивалентная всей системе. Другими словами, базис системы векторов —это непустая линейно независимая ее подсистема, через векторы которой линейно выражается каждый вектор данной системы. ТЕОРЕМА 1.9. Конечная система векторов, содержащая хотя бы один ненулевой вектор, обладает базисом. Любые два базиса данной конечной системы векторов состоят из одинакового числа векторов. Доказательство. Пусть задана система векторов (1) %, ..., ufc, ..., ит, содержащая ненулевой вектор. Нулевые векторы можно исключить из системы (1), так как получающаяся при этом система эквивалентна исходной. Поэтому будем считать, что иг^Ф0. Если система (1) линейно независима, то она есть базис этой системы. Если система (1) линейно зависима, то, по свойству 1.3, существует вектор, например вектор uk, равный линейной комбинации предшествующих ему векторов. Следовательно, подсистема (2) и19 ..., Uk-ъ ttfc+1t ..., ит эквивалентна исходной системе и содержит ненулевой вектор. Если система (2) линейно независима, то она ^сть базис системы (1). Если же система (2) линейно зависима, то из нее можно вычеркнуть вектор, являющийся линейной комбинацией предшествующих ему векторов, и т. д. После конечного числа вычеркиваний получается подсистема векторов, ни один вектор которой не выражается линейно через предшествующие векторы; эта подсистема является базисом системы (1), так как она линейно независима и не пуста (содержит вектор #х). Пусть vl9 ..., vr и wl9 ..., ws — два базиса системы векторов (1). Эти базисы эквивалентны, так как каждый из них эквивалентен системе (1). Следовательно, по теореме 1.7, эти базисы состоят из одинакового числа векторов, т. е. r = s. П 182
Ранг конечной системы векторов. Теперь введем понятие ранга системы векторов. ОПРЕДЕЛЕНИЕ. Рангом конечной системы векторов называется число векторов, входящих в какой-нибудь базис системы. Ранг системы нулевых векторов и ранг пустой системы векторов считаются равными нулю. Рассмотрим некоторые свойства ранга системы векторов. ТЕОРЕМА. 1.10. Если и19 ..., uk^L{vl9 ..., vm)9 то ранг системы векторов и19 ..., uk меньше или равен рангу системы векторов vl9 v29 ..., vm. Доказательство. Если первая система иг> ..., Uk состоит из нулевых векторов, то ее ранг равен нулю и поэтому не превосходит ранга второй системы vl9 ..., vm. Предположим, что первая система векторов содержит хотя бы один ненулевой вектор. Тогда из условия теоремы следует, что и вторая система имеет ненулевые векторы. Следовательно, по теореме 1.9, эти системы обладают базисами. Предположим, что и19..., иГ — базис первой системы, a vl9 ..., vs — базис второй системы. Тогда система vl9 ... ..., vs эквивалентна системе vl9..., vm и, по теореме 1.6, L(vl9 ..., vm) = L(vl9 ..., vs). Кроме того, по условию теоремы, %,..., uk^L (vl9 ... ..., ют)9 поэтому uv ..., ur^L(vl9 ..., vs). По следствию 1.4, в силу линейной независимости системы векторов и19 ..., иг отсюда следует, что r^s. Следовательно, ранг первой системы векторов не больше ранга второй системы. ? ПРЕДЛОЖЕНИЕ 1.11. Ранг любой подсистемы конечной системы векторов не больше ранга всей системы. Доказательство. Это утверждение, очевидно, верно, если подсистема пуста. Если же подсистема не пуста, то предложение 1.11 непосредственно следует из теоремы 1.10. D ПРЕДЛОЖЕНИЕ 1.12. Эквивалентные конечные системы векторов имеют один и тот же ранг. Это предложение следует из теоремы 1.10. ПРЕДЛОЖЕНИЕ 1.13. Ранг любой конечной системы векторов n-мерного арифметического векторного пространства не больше п. Доказательство. Пусть е19 ..., еп — единичные векторы арифметического векторного пространства &п. Любая система а19 .,., ат векторов этого пространства содержится в линейной оболочке единичных векторов, аъ ..., ат^ 183
^L(el9 ..., en) = Fn. Следовательно, в силу теоремы 1.10 ранг системы векторов а19 ..., ат не больше п. ПРЕДЛОЖЕНИЕ 1.14. Если конечная система векторов имеет ранг г9 то любая ее подсистема из k векторов при k>r линейно зависима. Доказательство. Это утверждение, очевидно, верно, если система состоит из нулевых векторов. Предположим, что vl9 ..., vm — данная система векторов, vl9 ..., vr — ee базис, ul9 ..., uk — подсистема данной системы; тогда и19 ..., uks=L(vl9 ..., vr) = L(vl9 ..., vm). По следствию 1.3, при k>r отсюда следует, что система векторов ul9 ..., uk линейно зависима. ? ПРЕДЛОЖЕНИЕ 1.15. Пусть ранг системы векторов (1) а19 ..., ат равен рангу системы векторов (2) а19 ..., ат9 Ь. Тогда вектор Ь можно представить в виде линейной комбинации векторов системы (1). Доказательство. Предложение, очевидно, верно, если ранги систем (1) и (2) равны нулю. Предположим, что ранг г системы (1) отличен от нуля и а19 ..., аг — базис системы (1). Так как, по условию, ранг системы (2) также равен г, то ее подсистема а19 ..., аГ9 b линейно зависима. По свойству 1.4, отсюда следует, что &е ^L(al9 ..., аг). Следовательно, b^L(al9 ..., ат)9 т. е. существуют такие скаляры %19 ..., Хт9 что b = Kla1 + ... + %mfim. ? Упражнения 1. Пусть (а, Р) и (у, б)—векторы пространства ^2. Покажите, что эти векторы тогда и только тогда линейно зависимы, когда аб — Py = 0- 2. Покажите, что арифметические n-мерные векторы а, Ь линейно зависимы тогда и только тогда, когда а и Ь пропорциональны, т. е. для некоторого скаляра К а = 'КЬ или & = Ла. 3. Каким условиям должны удовлетворять скаляры (5 и у, чтобы векторы (а, р) и (а, у) были линейно зависимыми? 4. Докажите, что если к линейно независимой системе векторов #ъ •••! ат приписать слева или справа какой-нибудь вектор Ь, то не более чем один вектор полученной системы будет линейно выражаться через предыдущие. 5. Пусть #i, ..., ат и bit ..., bm—две системы линейно независимых векторов. Докажите, что если а1э ..,, am^,L{pX9 ..., bm)9 то &i, ..., bm<z=:L{al9 ..., ат). 184
6. Пусть Q^=g2 —поле вычетов по модулю 2 и V=^n. Покажите, что а + а=0 для любого вектора a^.V —Fn. 7. Пусть 3-=%з— поле классов вычетов по модулю 3 и W = 3:n. Покажите, что а+а + а—0 для любого вектора а<= V. 8. Пусть ^=Мз — поле классов вычетов по модулю 3 и п — целое положительное число. Сколько векторов содержит векторное пространство &п? 9. В каком случае система векторов обладает единственным базисом? 10. Докажите, что Есякая линейно независимая подсистема г векторов системы векторов ранга г является базисом системы. 11. Пусть а 19 ..., am—линейно независимая система векторов, Докажите, что &eL(ai, ..., ат) тогда и только тогда, когда система векторов #1, ..., ат, Ь линейно зависима. 12. Докажите, что Ь <= L (аъ ... > ат) тогда и только тогда; когда ранг системы векторов а^ ..., ат равен рангу системы векторов #1» •• » Ят» &• 13. Докажите, что две непустые эквивалентные линейно независимые системы векторов содержат одинаковое число векторов. 14. Покажите, что если две системы векторов имеют одинаковый ранг и векторы одной из этих систем линейно выражаются через векторы другой системы, то эти системы эквивалентны. § 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИИ Следствия системы линейных уравнений. Всюду ниже OF — поле, поле скаляров. ОПРЕДЕЛЕНИЕ. Системой линейных уравнений над полем У с переменными х1у ..., хп называется система вида aii*i+...+ai*** = Pi, а/иЛ 4" • • • "f* &тпХп ~ Р/я> где aik, P/ <= F. Эту систему т линейных уравнений будем кратко записывать в виде (1) а^1+... + а/лд:я = Р| (г = 1, ..., т). Система линейных уравнение (1) является предикатом (условием) с п свободными переменными хъ ..., хп. Допустимыми значениями свободных переменных всюду ниже считаются элементы поля скаляров &. Этот я-местный предикат является конъюнкцией т более простых я-мест- ных предикатов, каждый из которых определяется одним из уравнений системы (1). ОПРЕДЕЛЕНИЕ. Вектор (?х, ..., \п) из Fn называется решением системы уравнений (1), если верны равенства а^1 + ... + а//г|л = Р^ (i=l, ..., т). 185
ОПРЕДЕЛЕНИЕ. Система линейных уравнений называется совместной у если она имеет хотя бы одно решение. Система линейных уравнений называется несовместной, если она не имеет решений, т. е. множество всех ее решений пусто. Наряду с системой (1) рассмотрим систему (над F) (2) Y*i*i+.--+Y*/i** = u (*=1> ..-> s). Отметим, что система линейных уравнений может состоять из одного уравнения. ОПРЕДЕЛЕНИЕ. Система уравнений (2) называется следствием системы уравнений (1), если каждое решение системы (1) является также решением системы (2). Запись (1)=>(2) означает, что система (2) есть следствие системы (1). Любая система линейных уравнений (над &) с п переменными является следствием несовместной системы уравнений (над У) с теми же переменными. Система линейных уравнений (2) есть следствие системы уравнений (1) тогда и только тогда, когда множество всех решений системы (1) является подмножеством множества всех решений системы (2). Легко убедиться, что бинарное отношение следования на множестве систем линейных уравнений (над &) рефлексивно и транзитивно, т. е. является предпорядком. ОПРЕДЕЛЕНИЕ. Линейное уравнение = ^lPl + --- + M*m» где Ях, ..., %т — произвольные элементы поля У, называется линейной Комбинацией уравнений системы (1) с коэффициентами ^, ..., Ят. ПРЕДЛОЖЕНИЕ 2.1. Любая линейная комбинация линейных уравнений системы уравнений (1) является следствием этой системы. Доказательство этого предложения предоставляется читателю. Равносильные системы линейных уравнений и элементарные преобразования системы. Ниже рассматриваются системы линейных уравнений над полем & с п переменными хъ ..., ДООПРЕДЕЛЕНИЕ. Две системы линейных уравнений называются равносильными, если каждое решение любой из этих систем является решением другой системы. 186
Следующие предложения выражают свойства равносильности, вытекающие из определения равносильности и отмеченных выше свойств следования систем. ПРЕДЛОЖЕНИЕ 2.2. Две системы линейных уравнений равносильны тогда и только тогда, когда каждая из этих систем является следствием другой системы. ПРЕДЛОЖЕНИЕ 2.3. Две системы линейных уравнений равносильны тогда и только тогда, когда множество всех решений одной системы совпадает с множеством всех решений другой системы. ПРЕДЛОЖЕНИЕ 2.4. Две системы линейных уравнений равносильны в том и только в том случае, если равносильны предикаты, определяемые этими системами. ОПРЕДЕЛЕНИЕ. Элементарными преобразованиями системы линейных уравнений называются следующие преобразования: (а) умножение обеих частей какого-нибудь уравнения системы на отличный от нуля скаляр; (j3) прибавление (вычитание) к обеим частям какого-либо уравнения системы соответствующих частей другого уравнения системы, умноженных ца скаляр; (у) исключение из системы или присоединение к системе линейного уравнения с нулевыми коэффициентами и нулевым свободным членом. ТЕОРЕМА 2.5. Если одна система линейных уравнений получается из другой системы линейных уравнений в результате цепочки элементарных преобразований, то эти две системы равносильны. Доказательство. Пусть дана система aii*i + ...+ «!*** = Pi, (1) amA i • • • "Г &тпХп = Pm» Если умножить одно из ее уравнений, например первое, на отличный от нуля скаляр %, то получим систему k*n*l + • • • + tolnXn = ^Pl> (2) a/wl% "T" • • • ~Г &тп.Хп == Рот» Каждое решение системы (1) есть также решение системы (2). 187
Обратно: если (?1э ..., ?я) — любое решение системы (2), т. е. khili+• • •+tointn = Wi> то, умножив первое равенство на К1 и не изменяя последующих равенств, получим равенства, показывающие, что вектор (|г, ..., In) является решением системы (1). Следовательно, система (2) равносильна исходной системе (1). Так же легко проверить, что однократное применение к системе (1) элементарного преобразования (Р) или (у) приводит к системе, равносильной исходной системе (1). Так как отношение равносильности транзитивно, то многократное применение элементарных преобразований приводит к системе уравнений, равносильной исходной системе (1). ? СЛЕДСТВИЕ 2.6. Если к одному из уравнений системы линейных уравнений прибавить линейную комбинацию других уравнений системы, то получится система уравнений, равносильная исходной. СЛЕДСТВИЕ 2.7. Если исключить из системы линейных уравнений или присоединить к ней уравнение, являющееся линейной комбинацией других уравнений системы, то получится система уравнений, равносильная исходной системе. Равенство строчечного и столбцового рангов матрицы. Пусть & — поле. Таблица вида (1) Л = «11 . . . Ощ • *•••• (Х/я1 ... &тп где aik e F, называется матрицей над полем У или тхп- матрицей над У. Введем следующие обозначения для строк и столбцов матрицы: i-я строка матрицы обозначается через Л/, Ai = [ail9 ..., ain\\ &-й столбец матрицы обозначается через Ak: Ak = «ift <Zmk Строки матрицы А можно рассматривать как л-мерные 188
арифметические векторы над &. Столбцы матрицы Л можно рассматривать как га-мерные векторы над «F. ОПРЕДЕЛЕНИЕ. Строчечным рангом матрицы А называется ранг системы ее строк А19 ..., Лт, рассматриваемых как /г-мерные векторы над F. Столбцовым рангом матрицы А называется ранг системы ее столбцов Л1,..., Ап9 рассматриваемых как га-мерные векторы над &. Строчечный ранг матрицы А обозначается через г (А), столбцовый ранг матрицы А обозначим через р (А). Матрица, получающаяся из матрицы А в результате замены ее строк соответствующими столбцами, называется транспонированной к Л и обозначается 'Л, М = а11 • • • aml «1« ая Символами г(*А) и р(М) обозначаются соответственно строчечный и столбцовый ранги матрицы 'Л. Пусть (1) а»Л + ... + адаяА:я = 0 — однородная система линейных уравнений. Матрица Л "ап ... а1п Л = ат1 ... ая называется матрицей или основной матрицей системы уравнений (1). ТЕОРЕМА 2.8. Если однородная система линейных уравнений над полем OF (о aiAi+---+aiAi=o> ak A+. • • 4- ak nK = О, <*mlAl + • • • + Ытп^п = О с переменными ^, ..., Яя равносильна системе (2) а^1^1+« • -+алДя=о, 189
состоящей из первых k уравнений системы (1), то столб- цовые ранги основных матриц этих систем равны. Доказательство. Пусть Л и Л—основные матрицы систем уравнений (1) и (2) соответственно. Если матрица Л — нулевая, то всякий вектор из Fn является решением системы (2). В силу равносильности систем (1) и (2) отсюда вытекает, что всякий вектор из Fn является решением системы (1). Следовательно, матрица Л —нулевая и ее ранг равен нулю. Предположим теперь, что Л— ненулевая матрица и (3) Л1, ..., Л" — базис системы столбцов матрицы Л. Тогда в силу равносильности систем (1) и (2) система Л1, ..., АГ первых г столбцов матрицы Л линейно независима. Если r<.s^n, то система столбцов Л1, ..., Лг, As линейно зависима. В противном случае в силу равносильности (1)_и (2) была бы линейно независима система Л1, ..., Лг, As столбцов матрицы Л, что противоречило бы предположению (3). Таким образом, система Л1, ...,ЛГ есть базис системы столбцов матрицы Л. Следовательно, столбцовые ранги матриц Л и Л равны. ? ТЕОРЕМА 2.9. Строчечный ранг матрицы равен ее столбцовому рангу. Доказательство. Теорема, очевидно, верна для нулевых матриц. Предположим, что Л = ||а^|| —ненулевая матрица над полем & и первые г строк образуют базис системы строк этой матрицы. Рассмотрим однородную систему линейных уравнений над & al lAi + • • • + а1/Л/г = 0> (1) ап'к1 + ... + агп1п = 0, ЫпаК+.. . + остДд = О относительно переменных Х1У ..., %п> для которой Л является основной матрицей. Рассмотрим также однородную систему а11Х1+...+а1лЯл = 0, (2) аг1%1 + ... + агп'кГ1 = 0, состоящую из первых г уравнений системы (1); ее основную матрицу обозначим через Л. Так как первые г строк 19Q
матрицы Л образуют базис системы ее строк, то каждое уравнение системы (1) есть линейная комбинация уравнений системы (2). Следовательно, системы уравнений (1) и (2) равносильны. По теореме 2.8, из равносильности систем (1) и (2) следует равенство столбцовых рангов основных матриц этих систем, т. е. (3)Р(Л) = р(Л). Поскольку столбцы матрицы А суть _г-мерные векторы над полем &9 то, по следствию 1.6, р(А)^г = г(А\. Следовательно, в силу (3) (4)р(Л)<г(Л). Аналогичное неравенство верно также для транспонированной матрицы 'Л, т. е. (5)р(М)<г(М). Легко видеть, что р('Л) = г(Л), г('Л) = р(Л). Отсюда в силу (5) получим, что (6)г(Л)<р(Л). На основании (4) и (6) заключаем, что г(Л) = р(Л). П Критерий совместности системы линейных уравнений. Рассмотрим систему линейных уравнений над полем &\ (1) а-лхг +... + а1пхп Матрицы А = ~аи...а1Л ' _aml • • • °&/ял_ =fo (t=l , ..., т). и ? = ~ап ... а1йрх 1 &mi • • • &mnPmj называются соответственно основной и расширенной матрицами системы уравнений (1). Вектор Ь &== 'Pi Pm называется столбцом свободных членов. Рассмотрим уравнение (над полем F) (2) х1А1+...+хяАл^Ь9 где Л1, ..., Лп — вектор -столбец матрицы Л. 191
ТЕОРЕМА 2.10. Уравнение (2) равносильно системе уравнений (1). Доказательство. Пусть (glf ..., ?л) — любое решение системы (1), т. е. (3) ааБх + ... + atoSn^P* (t = l, ..., m). Учитывая, что raiiEi+-.. + aiii6* " (4) 6И1+... + ЬИя = L аШ?1 + • • • + атпЛп _ равенства (3) можно записать в виде одного равенства (2')^ + ... + ^Лл = *. Обратно: предположим, что вектор (^, ..., ?Л) есть решение уравнения (2), т. е. имеет место равенство (2'). Тогда в силу (4) из (2') вытекают равенства (3). Таким образом, любое решение уравнения (2) является решением системы (1). Следовательно, уравнение (2) равносильно системе уравнений (1). ? СЛЕДСТВИЕ 2.11. Однородная система линейных уравнений ац*1 + ... + а*|Л1 = 0 (* = 1, ..., т) равносильна уравнению где 0 — нулевой т-мерный вектор-столбец. Уравнение (2) называется векторной формой записи системы линейных уравнений (1). ТЕОРЕМА 2.12. Пусть А и В — соответственно основная и расширенная матрицы системы линейных уравнений (1). Равносильны следующие утверждения4. I. Система линейных уравнений (1) совместна. П. Уравнение (2) имеет решение (над полем &). III. Вектор Ъ есть линейная комбинация столбцов матрицы А, т. е. Ь^Ь(Аг, ..., Ап). IV. Столбцовые {строчечные) ранги матриц А и В равны, г(А)=г(В). Доказательство. В силу теоремы 2.10 утверждение I влечет утверждение II. Если уравнение (2) имеет решение, то вектор Ь можно представить в виде линейной комбинации (с коэффициен- 192
тами из поля gF) столбцов матрицы Л. Следовательно, из II следует III. Если 6gL(Л1, ..., Л"), то система столбцов Л1,..., Ап матрицы Л эквивалентна системе столбцов Л1, ..., Ап, Ъ матрицы В. По предложению 1Л2, это влечет равенство столбцовых рангов матриц А и В. Следовательно, утверждение III влечет IV. Предположим, что столбцовые ранги матриц Л и В равны. Тогда базис системы столбцов матрицы Л является также базисом системы столбцов матрицы б. Следовательно, Ь^Ь(Аг, ..., Л"), т. е. существуют такие скаляры 7^,... ..., ^gF, что %1А1 + ...-{-КАп = Ь. Последнее равенство означает, что вектор (%^9 ...» К) есть решение уравнения (2) и в силу теоремы 2.10 —решение системы уравнений (1). Таким образом, из утверждения IV следует утверждение I. Следовательно, утверждения I, II, III и IV равносильны. ? ТЕОРЕМА 2.13 (КРОНЕКЕР-КАПЕЛЛИ). Система линейных уравнений совместна тогда и только тогда, когда ранг основной матрицы системы равен рангу расширенной матрицы. Эта теорема непосредственно следует из предыдущей теоремы. СЛЕДСТВИЕ 2.14. Если ранг основной матрицы системы линейных уравнений равен числу уравнений системы, то система уравнений совместна. Доказательство. Пусть Л и В — соответственно основная и расширенная матрицы системы т линейных уравнений с п переменными. Тогда р (В)^р (Л) = т. С другой стороны, р(В)^т, так как матрица В имеет т строк. Поэтому р(5) = р(Л). Следовательно, по теореме 2.13, рассматриваемая система линейных уравнений совместна. ? Связь между решениями неоднородной линейной системы и решениями ассоциированной с ней однородной системы. Пусть дана неоднородная линейная система (1) а/1% + ... + а?лд:л=р? (* = 1, ..., т) над полем <#". Система линейных уравнений (2) ailx1 + ... + ainxn = 0 (i=l, ..., m) называется однородной системой, ассоциированной с системой (1). Пусть L — множество всех решений однородной системы (2) и ? —какое-нибудь решение системы (1). Мно- 193
жество {c + d\d^L} обозначим через c + L: c + L={c+d\dz=L}. ПРЕДЛОЖЕНИЕ 2.15. Если решение неоднородной системы (1) сложить с решением однородной системы (2), то получится реишние системы (1). Доказательство. Пусть {yv ..., уп) - решение системы (1) и (6i, ..., 6Л) —решение системы (2), т.е. а*1?1 + .-. + а/Л=Р* (i = l. •••> mV» aile1 + ... + a,A = 0 (*=1, ..., /и). Почленно складывая эти равенства, получим равенства Ofi(?i + 6i) + ... + a/lt(Yii + 6„) = Pi (t = l, ..., т)9 которые показывают, что вектор (Yi + Si> ..., Уп + ^п) является решением системы (1). П ПРЕДЛОЖЕНИЕ 2.16. Разность любых двух решений неоднородной системы линейных уравнений является решением ассоциированной с ней однородной системы. Доказательство. Пусть (у19..., уп) и (у'и ..., Y*)— решения неоднородной системы уравнений (1), т. е. алТ1 + ... + а/яУя = Р* (* = 1» ..., /и), aii7i + -.. + a/«Vi=Pi (i=1> •••> m)- Почленное вычитание приводит к равенствам a/i(Yi-?0 + --- + ai«(Yii-Y«) = O (i = l, ..., m), которые показывают, что вектор (Yi —Yi» •••> Y/г — Y«) является решением однородной системы уравнений (2). ? ТЕОРЕМА 2.17. Пусть с —решение неоднородной системы линейных уравнений (1) и L —множество всех решений однородной системы (2), ассоциированной с системой (1). Тогда c-\-L является множеством всех решений системы (1). Доказательство. Пусть М — множество всех решений системы (1) и с^М. Каждый элемент множества c + L можно представить в виде суммы с + 19 где /eL. В силу предложения 2.15 е + /еА1. Следовательно, (3) c + LczM. 194
Верно и обратное включение. В самом деле, если d— любое решение системы (1), сеМ, то в силу предложения 2.16 d — c^L. Поэтому rfec + L; следовательно, (4) Mczc + L. На основании (3) и (4) заключаем, что M = c + L. ? СЛЕДСТВИЕ 2.18. Совместная неоднородная система линейных уравнений имеет единственное решение тогда и только тогда, когда ассоциированная с нею однородная система уравнений имеет единственное решение (нулевое). СЛЕДСТВИЕ 2.19. Если две неоднородные системы линейных уравнений (над полем ^) с п переменными х±, ... ..., хп совместны и равносильны, то ассоциированные с ними однородные системы уравнений равносильны. Теоремы о следствиях системы линейных уравнений. Рассмотрим систему линейных уравнений (1) cLilx1 + ... + ainxn = $l (* = 1, ..., т) над полем of. Линейное уравнение (II) 7Л.+— + ТЛ=Р> где Yi» • ••> Уп^Ру называется следствием системы (I), если каждое решение системы (I) является решением этого уравнения. Согласно предложению 2.1, любая линейная комбинация (с коэффициентами из поля of) уравнений системы (I) является следствием этой системы. Верно ли обратное утверждение? Ответ на этот вопрос дают следующие ниже теоремы. ТЕОРЕМА 2.20. Линейное уравнение (2) Yi*i + --- + ViAi = °» являющееся следствием однородной системы уравнений (1) аад:1 + ... + агял:я = 0 (* = 1, ..., /и), есть линейная комбинация уравнений этой системы. Доказательство. По условию, уравнение (2) есть следствие системы (1). Следовательно, система «11*1+ ... + «!«*« = 0, а/иА "Г • • • "Г ЫтпХп — О, 195
равносильна системе (1). По теоремам 2.8 и 2.9, отсюда вытекает, что ранг матрицы А системы (1) равен рангу матрицы А системы (3). Поэтому если c = (Yi> ..., уп), то ранг {А19 ..., Ат, с} = ранг {А19 ..., Ат}, где Ai есть i-я строка матрицы Л. На основании этого равенства заключаем, что с есть линейная комбинация строк А19 ..., Лт матрицы Л. Следовательно, уравнение(2) является линейной комбинацией уравнений системы (1). ? ТЕОРЕМА 2.21. Две однородные системы линейных уравнений над полем JF с п переменными хг, ..., хп равносильны тогда и только тогда, когда матрицы этих систем строчешо эквивалентны. Эта теорема легко следует из теоремы 2.20. ТЕОРЕМА 2.22. Линейное уравнение, являющееся следствием совместной системы линейных уравнений, есть линейная комбинация уравнений этой системы. Доказательство. Предположим, что уравнение(II) есть следствие совместной системы (I). Тогда система уравнений an*i + ... + Oi/Ai=Pi> атЛ. Т" • • • "Г V'mnXn — Р/я> ?1*1 + ... + Тя*я=Р совместна и равносильна системе (I). По следствию 2.19, отсюда вытекает равносильность соответствующих однородных систем, т. е. система уравнений 4) ай*1 + ... + а/л*я = 0 (t = l, ..., m) равносильна системе уравнений a11x1 + ... + alnxfl = 0, У ' ат1дс1 + ... + ащЯхя = 0, у1х1+... + упхп = 0. В силу теорем 2.8 и 2.9 ранг основной матрицы Л системы (4) равен рангу основной матрицы Л системы (5). Следовательно, равны ранги основных матриц систем (1) и (3). Поскольку системы (1) и (3) совместны, то по критерию совместности отсюда вытекает, что строчечный ранг расширенной матрицы В системы (1) равен строчечному 196
рангу расширенной матрицы В системы (3). На основании равенства_ этих рангов заключаем, что последняя строка матрицы В является линейной комбинацией строк матрицы В, т. е. (Vl, ..., v«. P)eI(Blf ..., Вп). Следовательно, уравнение (II) является линейной комбинацией уравнений системы (I). ? Упражнения. 1. Пусть А — яХ/я-матркца с линейно независимыми строками. Докажите, что т^п. 2. Докажи! е, что ранг г mX/г-матрицы не больше тип, г ^ min (/я, /г). 3. Докажите, что вычеркивание одной строки (столбца) матрицы тогда и только тогда не изменяет ее ранга, когда вычеркнутая строка (столбец) линейно выражается через остальные строки (столбцы). 4. Докажите, что Приписывание к матрице одной строки (или одного столбца) либо не изменяет ранга матрицы, либо увеличивает его на единицу. 5. Докажите, что если ранг матрицы А не изменяется от приписывания к ней любого столбца матрицы В с тем же числом строк, то он не меняется от приписывания к матрице А всех столбцов матрицы В. 6. Пусть матрица В получается из матрицы А в результате цепочки неособенных строчечных линейных преобразований. Докажите, что строки матрицы А линейно независимы тогда и только тогда, когда линейно независимы строки матрицы В. 7. Пусть А и Б —матрицы с п столбцами. Докажите, что матрицы А и В строчечно эквивалентны, когда линейная оболочка строк матрицы А совпадает с линейной оболочкой строк матрицы В. 8. Пусть А—тХя-матрица и В — тX(п+&)-матрица, получающаяся из матрицы А в результате приписывания k новых столбцов. Докажите, что: (a) если строки матрицы В линейно зависимы, то строки матрицы А линейно зависимы; (b) если строки матрицы А линейно независимы, то строки матрицы В линейно независимы; (c) ранг матрицы А не превосходит ранга матрицы В. 9. Ранг основной матрицы однородной системы линейных уравнений на единицу меньше числа переменных. Докажите, что любые два решения этой системы пропорциональны (т. е. отличаются лишь скалярным множителем). 10. Найдите условия, при которых в любом решении однородной системы линейных уравнений /г-е переменное равно нулю. 11. Докажите^ что если система линейных уравнений над полем & рациональных чисел не имеет решений в S, то она не имеет решений в любом числовом поле. 12. Пусть дана однородная система линейных уравнений (1) (над полем (л рациональных чисел), имеющая ненулевые решения. Любая фундаментальная система решений системы (1) над & являегся фундаментальной системой над любым числовым полем* 197
13. Пусть (1) ал*1+...+а*л*я=0 (i = l, ..., т) — однородная система линейных уравнений (над полем &)• Докажите, что уравнение является следствием системы (1) тогда и только тогда, когда оно является линейной комбинацией уравнений (1). § 3. СТУПЕНЧАТЫЕ МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Ступенчатые матрицы. Пусть А = а11 Ъщ Lami а„ — mxft-матрица над полем gF. Ведущим элементом строки матрицы называется первый (считая слева направо) ненулевой элемент строки. Столбец матрицы называется основным, если он содержит ведущий элемент какой-либо строки матрицы. ОПРЕДЕЛЕНИЕ. Матрица А называется ступенчатой, если она удовлетворяет условиям: (1) нулевые строки матрицы (если они есть) расположены ниже всех ненулевых строк; (2) если otjjfe, a2fto, ..., arkr — ведущие элементы ненулевых строк матрицы, то k1<.k2<....<.kr- Примеры ступенчатых матриц: 1) нулевая матрица, 2) однострочная матрица, 3) единичная матрица, 4) верхнетреугольная матрица aii ai2 • • • а1л U 0С22 • • • 0&2/г .0 0 ая Над системой вектор-строк (столбцов) данной матрицы можно проводить элементарные преобразования. ОПРЕДЕЛЕНИЕ. Элементарные преобразования над системой строк (столбцов) матрицы называются элементарными преобразованиями матрицы. Две матрицы называются строчечно-эквивалентными, если одна получается из дру- 198
гой при помощи цепочки элементарных преобразований над строками. Отношение строчечной эквивалентности рефлексивно, симметрично и транзитивно, т. е. является отношением эквивалентности. ОПРЕДЕЛЕНИЕ. Строчечным рангом матрицы называется ранг системы ее строк. Столбцовым рангом матрицы называется ранг системы ее столбцов. Из этого определения в силу теоремы 1.8 следует предложение 3.1. ПРЕДЛОЖЕНИЕ 3.1. Если одна матрица получается из другой в результате цепочки элементарных преобразований над строками, то строчечные ранги этих матриц равны. ТЕОРЕМА 3.2. Любая тхп-матрица строчечно эквивалентна ступенчатой тхп-матрице. Доказательство (проводится индукцией по числу строк матрицы). Если число строк матрицы равно единице, то матрица ступенчатая. Предполагая, что теорема верна для матриц с/п-1 строками, докажем, что тогда она верна для матриц с т строками. Пусть А есть т-строч- ная матрица: гап а12 ... (Х-т П a2i OC-22 • • • а2л l_(XmI &тЧ • • • а/тш-1 Если в первом столбце матрицы есть элемент, отличный от нуля, то строку с этим ненулевым элементом можно переставить с первой строкой. Легко показать, что перестановка строк — результат цепочки элементарных преобразований над строками. Поэтому будем считать, что ап=^=0. Матрицу А можно преобразовать в матрицу В: ["1 Pl2 ••• Pi/*"] 0 р22 ... р2л L^ Р/Л2 • • • Ртп-> при помощи цепочки элементарных преобразований. Для этого первую строку матрицы А надо умножить на оси1. Затем полученную первую строку, умноженную на (—а/л), прибавить к j-й строке для i = 2> ..., т. Матрица, полу- 199
ченная из матрицы В вычеркиванием первой строки, содержит т—1 строк и, по индуктивному предположению, строчечно эквивалентна некоторой ступенчатой (т — 1)х хл-матрице С*: о р22 Р2 О Р. /712 Ртп J «с* = О Y22 Т2Л о ?7П2 Y/ял J На основании этого и строчечной эквивалентности матриц А и В заключаем, что матрица А строчечно эквивалентна ступенчатой матрице С: Г1 р12 ... $1п С = О 722 ?2Я .0 ?Ш2 Т/ял J Матрица С —ступенчатая, потому что матрица С* является ступенчатой. Если первый столбец или несколько первых столбцов матрицы Л—-нулевые, то рассмотрим матрицу, получающуюся в результате вычеркивания этих столбцов. Эта матрица содержит в первом столбце ненулевой элемент. Поэтому из первой части доказательства следует, что она строчечно эквивалентна ступенчатой матрице. Легко видеть, что, приписав слева к этой ступенчатой матрице вычеркнутые прежде нулевые столбцы, получим матрицу, строчечно эквивалентную исходной матрице А. ? ТЕОРЕМА 3.3. Строчечный ранг ступенчатой мат- рицы равен числу ее ненулевых строк. Доказательство. Теорема, очевидно, верна для нулевой матрицы. Предположим, что А — ступенчатая матрица с г ненулевыми строками. Для удобства записи будем считать, что ведущие элементы матрицы А расположены в первых г столбцах, т. е. 0 а22 . 0 0 . 0 0 . .. агг .. .. 0 .. где ааф0 для t = 1, , г. Таким образом, первые г строк Alf ..., Аг матрицы А ненулевые, а остальные (если 200
они есть) —нулевые. Покажем, что строки А1ч ...,АГ линейно независимы. Надо показать, что для любых скаляров %х, ..., Аг из равенства (l)Mi+.-.+M, = 0 следуют равенства (2) ^ = 0, ..., V = 0. Так как К&1+ • • • +КАГ*= то из (1) следуют равенства /0\ А1а12~Г^'2а22::==^> Поскольку а-ифО при i = l, ..., г, из (3) следуют равенства (2). Таким образом, система Аъ ..., Аг ненулевых строк матрицы А линейно независима. Следовательно, строчечный ранг матрицы А равен г. В общем случае доказательство проводится аналогично. ? На основании теоремы 3.3 приходим к следующему правилу вычисления ранга матрицы. Для вычисления строченного рант матрицы А надо привести ее к ступенчатому виду С при помоищ цепочки элементарных преобразований над строками. Число ненулевых строк матрицы С равно строчечному рангу матрицы А. Приведенные ступенчатые матрицы. При решении и исследовании системы линейных уравнений важную роль играют приведенные ступенчатые матрицы. ОПРЕДЕЛЕНИЕ. Ступенчатая матрица называется приведенной, если матрица, составленная из всех ее основных столбцов, является единичной матрицей. Приведенная ступенчатая матрица не имеет нулевых строк, и все ведущие элементы ее строк равны единице. ТЕОРЕМА 3.4. Любая ненулевая матрица строченно эквивалентна приведенной ступенчатой матрице. Доказательство. Пусть Л —ненулевая матрица ранга г. По теоремам 3.2 и 3.3, она строчечно эквивалентна ступенчатой матрице, например матрице В, состоящей из г ненулевых строк. Разделим каждую строку матрицы В на ее ведущий элемент. В результате получим 201
ступенчатую матрицу С, у которой все ведущие элементы строк равны единице. Далее, при помощи цепочки строчечных элементарных преобразований матрицы С обращаем в нуль все ненулевые элементы, расположенные над ведущими элементами. В результате получим матрицу D, основные столбцы которой образуют единичную матрицу. Следовательно, D есть искомая приведенная ступенчатая матрица, строчечно эквивалентная исходной матрице А. ? ТЕОРЕМА 3.5. Всякая квадратная пхп-матрица с линейно независимыми строками строчечно эквивалентна единичной пхп-матрице Е. Доказательство. Пусть А—лх/г-матрица с линейно независимыми строками. При помощи цепочки неособенных элементарных строчечных преобразований ее можно привести к некоторой ступенчатой /гхя-матрице C = \\yik\\. Пусть ylkl, Yifc.» •••» 7ллЛ —ведущие элементы матрицы С. Тогда (1) Yi*,?=0, ...,упкпфО, (2) Kkl<k2< ... <kn^n. Из неравенств (2) следует, что ^==1, k2 = 2, ...,kn = n. Поэтому матрица С имеет вид С = Yn 7i2 • • • Ут О Y22...Y2* О 0 ...упп т. е. является верхнетреугольнои матрицей с ненулевыми элементами на главной диагонали. Умножим первую строку матрицы на yFi» вторую —на y« и т. д. В результате получим строчечно эквивалентную матрицу С' = 1 yI... 0 1 .. 0 0.. • y'in •y'in . 1 Легко видеть, что матрица С строчечно эквивалентна единичной nxn-матрице Е. Таким образом, существует цепочка (неособенных) строчечных элементарных преобразований, которая переводит матрицу А в единичную матрицу Е. ? 202
Однородные системы линейных уравнений. Рассмотрим однородную систему уравнений над полем «Г aii*i+...+ai»*„ = 0, 0) - • amixi Н" • • • "f" &тпХп — О- Пусть а11 • • • а1л Л = &ml • • • &п — матрица, составленная из коэффициентов при переменных и называемая основной матрицей системы (1)9 и Л1,..., Ап — столбцы этой матрицы. Уравнение (над aF). (2)х1Л1+...+*ЛЛ* = 0, где 0 — нулевой вектор-столбец, называется векторной фор- мой записи системы уравнений (1). По следствию 2.11, однородная система уравнений (1) равносильна уравнению (2). ПРЕДЛОЖЕНИЕ 3.6. Если матрица А однородной системы уравнений (1) имеет ранг г>0 и Аг, ..., Аг — базис системы ее строк, то система (1) равносильна системе <Xii*i+... +сс1пхп = 0, (3) состоящей из первых г уравнений системы (1). Доказательство. Так как первые г строк матрицы Л образуют базис системы строк этой матрицы, то каждое уравнение системы (1) есть линейная комбинация уравнений (3). Кроме того, система (3) есть следствие системы (1). Следовательно, системы (1) и (3) равносильны. ? ПРЕДЛОЖЕНИЕ 3.7. Однородная система линейных уравнений с матрицей А имеет ненулевые решения тогда и только тогда, когда столбцы матрицы А линейно зависимы. Это предложение непосредственно вытекает из следствия 2.11. СЛЕДСТВИЕ 3.8. Однородная система линейных уравнений с п переменными имеет ненулевые решения тогда и только тогда, когда ранг матрицы системы меньше п. 203
СЛЕДСТВИЕ 3.9. Если число уравнений однородной системы линейных уравнений меньше числа переменных, то система имеет ненулевые решения. ПРЕДЛОЖЕНИЕ ЗЛО. Множество всех решений однородной системы замкнуто относительно сложения, вычитания и умножения на скаляры. Любая линейная комбинация решений однородной системы уравнений является решением этой системы. Доказательство предложения 3.10 предоставляется читателю. Фундаментальная система решений. Пусть (1) а1±хг+ ...+ainxn^0 (i = l, ..., т) — однородная система линейных уравнений над полем ©F. ОПРЕДЕЛЕНИЕ. Фундаментальной системой решений системы уравнений (1) называется непустая линейно независимая система ее решений, линейная оболочка которой совпадает с множеством всех решений системы (1). Отметим, что однородная система линейных уравнений, имеющая только нулевое решение, не имеет фундаментальной системы решений. ПРЕДЛОЖЕНИЕ 3.11. Любые две фундаментальные системы решений однородной системы линейных уравнений состоят из одинакового числа решений. Доказательство. В самом деле, любые две фундаментальные системы решений однородной системы уравнений (1) эквивалентны и линейно независимы. Поэтому в силу предложения 1.12 их ранги равны. Следовательно, число решений, входящих в одну фундаментальную систему, равно числу решений, входящих в любую другую фундаментальную систему решений. ? Если основная матрица А однородной системы уравнений (1) нулевая, то любой вектор из Fn является решением системы (1); в этом случае любая совокупность п линейно независимых векторов из Fn является фундаментальной системой решений. Если же столбцовый ранг матрицы А равен м, то система (1) имеет только одно решение — нулевое; следовательно, в этом случае система уравнений (1) не обладает фундаментальной системой решений. ТЕОРЕМА 3.12. Если ранг г основной матрицы однородной системы линейных уравнений (1) меньше числа переменных п, то система (1) обладает фундаментальной системой решений, состоящей из п — r решений. 204
Доказательство. Если ранг основной матрицы А однородной системы (1) равен нулю или п, то выше было показано, что теорема верна. Поэтому ниже предполагается, что 0<г(Л)</г. Полагая г = г(А), будем считать, что первые г столбцов матрицы А линейно независимы. В этом случае матрица А строчечно эквивалентна приведенной ступенчатой матрице, а система (1) равносильна следующей приведенной ступенчатой системе уравнений: хг — ... — 7n^/-+i — • • • — Yi. п-г%п == О» (2) х'2 — •••""" Y2i#r+i — • • • ~~ Y-2, п-г%п = 0> Хг — Yn^/+i — .. . — Yr. n-rXn =» 0. Легко проверить, что любой системе значений свободных переменных хг+1, ..., хп системы (2) соответствует одно и только одно решение системы (2) и, значит, системы (1). В частности, системе нулевых значений #m = 0, ..., хп = 0 соответствует только нулевое решение системы (2) и системы (1). Будем в системе (2) придавать одному из свободных переменных значение, равное 1, а остальным переменным — нулевые значения. В результате получим я —г решений системы уравнений (2), которые запишем в виде строк следующей матрицы С: Yii Y21 ... Y/i ! ° • • • °" Y12 Y22 • • ¦ Y/-2 0 1 • • • 0 Уы /Y2»-/-... Угл-гОО ... lj Система строк С19 ..., Сп-Г этой матрицы линейно независима. В самом деле, для любых скаляров Я^ ..., %п.г из равенства ЯА+ ... +К-гСп-г = (0, 0, ..., 0) следует равенство (..., Ь, Я2, ..., Vr) = (0, 0, ...,0) и, значит, равенства Докажем, что линейная оболочка системы строк матрицы С совпадает с множеством всех решений системы (1). 205
Пусть а = (oti, ..., ап а/+1, ..., ап) — произвольное решение системы (1). Тогда вектор d=а — (аг+1Сх+аг+2С2 + ... + аЛСЛ _г) также является решением системы (1), причем d = (Sl5 ..., 6„ 0, 0, ...,0); это решение соответствует нулевым значениям свободных переменных хг+19 ..., хп. Поэтому d является нулевым решением системы (2) и системы (1); следовательно, а = аг+1Сх + ... + UnCn-r ^ L (Clt ..., Сп-Г). Итак, доказано, что множество всех решений системы (1) совпадает с линейной оболочкой системы векторов Clf ... ..., Сп г. Следовательно, эта система п — г векторов является фундаментальной системой решений для системы уравнений (1). ? СЛЕДСТВИЕ 3.13. Пусть d—решение неоднородной системы линейных уравнений (над полем зГ) (I) ац^+...+а,я*я==Р? (i'=l, ..., т) и С19 ..., Сп г— фундаментальная система решений однородной системы уравнений ед+ ... +ainxn = 0 (i = 1, ..., т). Тогда множество {d+X1C1+ ... +кпгСп-г\К> К> •••> Vr^f} является множеством всех решений системы (I). Решение системы линейных уравнений методом последовательного исключения переменных. Пусть дана система линейных уравнений (надполем^) а11лг1+...+о1лд:л = р1, 0) Пусть л = а 1Л LPW а» 5 = am/zPmJ. 206
Матрица Л называется основной матрицей системы(I), матрица В — расширенной матрицей системы (1). Система линейных уравнений называется ступенчатой, если расширенная матрица системы есть ступенчатая матрица без нулевых строк. Система линейных уравнений называется приведенной ступенчатой, если расширенная матрица системы есть приведенная ступенчатая матрица. Если В —нулевая матрица, то любой я-мерный вектор из Fn является решением системы (1). Если же Л —нулевая матрица, а В —ненулевая, то система уравнений (1) несовместна. Предположим, что матрица Л — ненулевая. Тогда систему уравнений (1) можно при помощи элементарных преобразований привести к ступенчатой системе, а затем к приведенной ступенчатой системе, причем эти системы будут равносильны исходной системе (1). Предположим, что столбцы Л1, ..., Аг образуют базис системы столбцов матрицы Л. При помощи цепочки элементарных преобразований приведем систему уравнений (1) к ступенчатому виду без нулевых строк. Если последнее уравнение полученной ступенчатой системы имеет вид 0.*1+... + 0-*д = р, где Р=^=0, то полученная ступенчатая система уравнений несовместна и, следовательно, несовместна равносильная ей исходная система уравнений (1). Если же в левой части последнего уравнения полученной ступенчатой системы есть коэффициенты, отличные от нуля, то полученная ступенчатая система имеет вид (2) <X22*2 + • • • + 0C2rXr +. . . + alnXn = P*2, ®>rrXr~T* • '~T~&rnXn — Pr» где коэффициенты ah, afc, ..., a'rr отличны от нуля. Система (2) совместна и равносильна исходной системе (1). От ступенчатой системы (2) при помощи цепочки элементарных преобразований переходим к ступенчатой системе уравнений (3) х2 — Y2r+i*r+i--... —?2я*я = ба> xr — Угг+lXr+i —... ~ УгпХп = б/.. 207
Система (3) совместна и равносильна исходной системе уравнений (1). Если при этом г = п, то система уравнений (3) (и система (1)) имеет единственное решение (Si, б2, ..., 8п). Если же r(A) = r(B)<nf то система (3) равносильна системе xi= Yir+i#r+i+• • •+Ут^п + ^1» (4) Хъ = у2г+1хг+1 + ...+угяхя + 8%9 %г ~ Угг+1%г+1 ~Ь • • • ~Ь Угп%п ~Ь б/- Уравнения системы (4) дают явное выражение переменных хх, ..., хг, называемых главными, через переменные хг+1, ..., Хщ называемые свободными. Придавая в уравнениях (4) свободным переменным любые значения из поля скаляров, находим соответствующие значения главных переменных. Таким образом можно получить любое частное решение исходной системы уравнений (1), поскольку она равносильна системе (4). Поэтому вектор (5) (Yir+i*r+i-f-...H-Yi/^+Si> ...» Y/t+i*/4-i+... "Г *r> #r+l» • • • >Хп) называется общим решением системы уравнений (1). Вектор (5) можно записать в виде (6) хг+1Сг+1+...+хпСп + 8, где Сг+1, ..., Сп еР* и6 = (6lf ..., 6Г, 0, ..., 0) — частное решение системы (1). Вектор (6) также называется общим решением системы (1). Легко видеть, что векторы Сг+1,... ,Сл образуют фундаментальную систему решений однородной системы уравнений, ассоциированной с системой (1). Множество {xr+1C/4-1+-..+хпСп + 6\хг+1, ..., xn<=F} является множеством всех решений системы уравнений (1). Для исследования совместности данной системы линейных уравнений (1) надо расширенную матрицу В системы ори помощи цепочки элементарных преобразований над строками привести к ступенчатой матрице В'. Система линейных уравнений (Г) с расширенной матрицей В' равносильна исходной системе уравнений (1). Система уравнений (Г) несовместна тогда и только тогда, когда строчечный ранг ее основной матрицы Л' меньше строчечного ранга расширенной матрицы В\ т. е. когда в последней строке ступенчатой матрицы В' все элементы, кроме последнего, равны нулю. 208
Упражнения 1. Докажите, что ненулевая матрица строчечно эквивалентна одной и только одной приведенной ступенчатой матрице. 2. Докажите, что /гахл-матрипа А строчечно эквивалентна единичной лх«-матрице тогда и только тогда, когда ранг матрицы А равен /?. 3. Покажите, что две линейные однородные системы над полем 3* с переменными хь ..., хп равносильны тогда и только тогда, когда строчечно эквивалентны основные матрицы этих систем. 4. Пусть 3*—конечное поле, состоящее из k элементов. Покажите, что данная однородная система линейных уравнений над полем S* с п переменными имеет kn~r решений, где г — ранг основной матрицы данной системы уравнений. 5. Докажите, что совместная система линейных уравнений с ненулевой основной матрицей равносильна одной и только одной приведенной ступенчатой системе линейных уравнениГ. 6. Докажите, что если равносильны две совместные системы линейных уравнений, то равносильны ассоциированные с ними однородные системы линейных уравнений. 7. Докажите, что две совместные системы линейных уравнений над полем 3 с переменными xLt ..., хп равносильны тогда и только тогда, когда строчечно эквивалентны расширенные матрицы этих систем.
Глава шестая МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ § 1. ОПЕРАЦИИ НАД МАТРИЦАМИ И ИХ СВОЙСТВА Операции над матрицами* Всюду в этой главе аГ = = (F, +, —, •, 1> есть фиксированное поле, которое будем называть полем скаляров. Элементы множества F будем называть скалярами. Пусть т и п — целые положительные числа. Таблицу Л = OS- 11 а 12 «иГ а< '21 а2 <х 2Л .«i 'ml а, 7Я2 , • • OC,w« J с элементами из F называют матрицей над полем #" или тхп-матрицей над oF, кратко обозначают через \\aik\\ и пишут Л=||а^||. Если т = п, то матрицу Л называют квадратной матрицей порядка п. Множество всех mx/i- матриц над полем JF обозначается через FmXn. В частности, множество всех квадратных матриц над JF порядка п обозначается через FnXn. Сохраним прежние обозначения для строк и столбцов матрицы Л: 1-я строка матрицы А обозначается через At: Л* = 1ап> а/2> • • • > а/я1» k-& столбец матрицы обозначается через Ak\ Л*= Две mxn-матрицы Л=|1М и В=Н1ЫГназывают /мю- ными и пишут Л=Я, если а* = Р* для любых индексов i и &. 210
Матрица называется нулевой и обозначается через О, если все ее элементы равны нулю. Суммой двух тхп-матриц А и В называется тхп- матрица, ik-и элемент которой равен а** + Р;*> т. е. A+B = \\aik + $ik\\. Произведением скаляра К на матрицу Л = |а^|| называется тхя-матрица |Яа^||, обозначаемая через КА: Для матрицы (—\)А выполняется равенство Л + (—1) Л=0. Поэтому матрицу (—1)Л обозначают также через—Л и называют противоположной матрице Л. Пусть AeF№ и B<=Fn*P: «11 ... aln~] |~(5U ... р1р" В = ос, ml а„ Р Ш Р пр Таким образом, мы предполагаем, что число столбцов матрицы Л равно числу строк матрицы В. Произведение строки Аь на столбец Bk определяется так: "Pi/Г AiBk = [ail9 ..., ain] Jnk* Произведением матриц А и В называется mxp-матрица, ik-й элемент которой равен AtBk, т. е. АХВ1 АгВ2 ... АгВ?-[ Л2ВХ Л252 ... А2Вр Л-В = .AJ3* АтВ* АтВР] Итак, если Л есть mx/г-матрица и В есть мхр-матрица, то АВ является /пхр-матрицей. ТЕОРЕМА 1.1. Умножение матриц ассоциативно, т. е. для любых матриц А, В и С А(ВС) = (АВ)С, если произведения АВ и ВС существуют. 211
Доказательство. По условию, произведения АВ и ВС существуют. Поэтому можно считать, что AefmXfl, B^FnXp, CeFp4 Следовательно, произведения А (ВС) и (АВ)С существуют и принадлежат множеству Р*х?, Пусть Н = А(ВС), Н'= (АВ)С и hik, h'ik — ik-t элементы матриц Я и Я' соответственно. Докажем, что hik = hlk для любых индексов i и k. В самом деле, hik = At(BCY = [aiv .... а/я] 1 р р = «„2 PuYrt+.-.+а/л 23 Р«Ъ* = = 23 ai/$1sVskl s = l. ... . p ^-(ЛВ^С^И.В1, ^B'l Vi* LYpftJ = ( 2 а*/Рл) Yift + ••• + ( S ctyP/p W = = 2 ауР/Л*« /=1 » s = l P Следовательно, hik = h'ik для любых индексов i и А, т. е. Л(ВС) = (ЛВ)С. П ТЕОРЕМА 1.2. Операции над матрицами обладают следующими свойствами: (1) алгебра (Fmxn, +, — > есть абелева группа; (2) а(Л + В) = аЛ + аВ (a, p<=F, Л, Bef«»); (3) (а + р)Л = аЛ + рЛ; (4) (аР)Л = а(рЛ); (5) ЬЛ = Л; (6) умножение матриц ассоциативно; (7) умножение матриц дистрибутивно относительно сложения, т. е. А(В-\-С) = АВ-{-АС, если произведение 212
АВ и сумма В + С существуют, и (В-\-С) А = BA + CAt если произведение В А и сумма J3 + C существуют; (8) для любого скаляра К и любых матриц Л, В К(АВ) = (ХА)В = А(Щ, если произведение АВ сущестует* Доказательство. Свойства (1) —(5) доказываются аналогично доказательству соответствующих свойств сложения векторов и умножения на скаляр векторов арифметических векторных пространств. По теореме 1.1, умножение матриц ассоциативно. Докажем, что умножение матриц дистрибутивно относительно сложения. Пусть A<=F'nxn, В, C<=FnxP. Легко проверить, что АВ, AC^Fm*p, B + C^Fn*p. Отсюда следует, что А(В + С) и АВ + АС суть /пхр-матрицы. Покажем, что ik-e элементы этих матриц равны, т. е. At (В + C)k = Л/В* + AtCk. В самом деле, Л,(В+С)*= ^ «tf(P/* + Y/*): AiBk + AiC*- 2 «i;P/* + 2 <*/&*=¦ / = 1,... , п /=1,... , п = 2 <MP/*+v/ft)- /=1, ... ,л Следовательно, А(В + С) = АВ + ВС. Аналогично доказывается, что (В + С)А = ВА + СА, если произведение В А и сумма В + С существуют. Для доказательства свойства (8) найдем ik-e элементы матриц Х(АВ), (Ы)В9 А(Щ: Эти три выражения равны между собой в силу свойств сложения и умножения скаляров. Следовательно, К(АВ)= = {ХА)В = А(Щ. П Транспонирование произведения матриц. Пусть Л = = ||Щк|| есть mxn-матрица над полем еГ. Тогда пхт- матрица ||Р^| такая, что Р** = а/Л, называется матрицей, транспонированной к Л, и обозначается через М. Таким образом, транспонированная матрица получается в резуль- 213
тате замены строк данной матрицы соответствующими столбцами. В частности, (М)' = '[ац, ..., а/л] = «i« № = «1* amfc = [^lfe> • ••> amk]* ТЕОРЕМА 1.3. Если существует произведение АВ матриц А и Ву то существует произведение 1В-*А и '(Л?) = = *В-*А. Доказательство. Предположим, что А еFm*n и Bs=Fnxp. Тогда если С = Л?, то AB^Fm^p и '(ЛВ)е= е Fpx™. Кроме того, *В е F^x* hMg Fpx". Следовательно, существует произведение '?-М и ^MeF"xm. Таким образом, матрицы С = '045) и С' — *В'*А являются рхт- матрицами. Проверим, что ik-e элементы cik и с'щ этих матриц равны. В самом деле, Ст = АкВ* = [ак19 a-kn] §т = a*iPu+...+a*iiP. nU с другой стороны, a*i = aAlPl? + ..- + ^/iP/i/. Следовательно, cik=Cik для любых индексов i и А, т. е. *(АВ) = 'В.*А. П Упражнения 1. Пусть AJ?Q *]. Найдите Ап для любого положительного целого п. 2. Докажите, что если для матриц А и В произведения АВ и В А существуют и АВ = ВАг то матрицы А и 5—квадратные и имеют одинаковый порядок. 3. Пусть А, В—квадратные матрицы одинакового порядка и АВ = ВА. Докажите, что для любого целого положительного числа п справедлива формула (А + В)* = А*+ п • А**1 • В •+ п (п — 1) Л*-2. #2+ ...+ ?*, 214
4. Покажите, что операция транспонирования обладает следующими свойствами: (а) '(Л + 5) = М + '?; (Ь) '(Ы)=А,-М, где А,—скаляр; (с)/(Л~1) = (М)-1; (d) 1(АВС) = *С-1В.*А, если произведение ЛВС существует. 5. Квадратная матрица А называется симметрической, если Л = М. Покажите, что если Л—квадратная матрица, то матрица Л+'Л является симметрической. 6. Квадратная матрица Л называется кососимметрической, если Л=—М. Докажите, что любую квадратную матрицу можно представить, и притом единственным образом, в виде суммы симметрической и кососимметрической матриц. 7. Докажите, что элементарные преобразования над столбцами матрицы осуществляются посредством умножения матрицы справа на соответствующие элементарные матрицы. § 2. ОБРАТИМЫЕ МАТРИЦЫ Обратимые матрицы. Пусть Л есть п х /г-матрица над полем скаляров JF. Если ? — единичная пх/г-матрица, то (1) АЕ = А = ЕА. Квадратная матрица называется обратимой, если существует матрица В, удовлетворяющая условиям (2) АВ = Е, ВА = Е. Матрица В, удовлетворяющая этим условиям, называется обратной к А. Матрицы А и В называются взаимно об- ратными. ПРЕДЛОЖЕНИЕ 2.1. Если матрица А обратима, то существует только одна матрица, обратная к А. Доказательство. Предположим, что В и С —матрицы, обратные к А. Тогда АС = Е = ВА и В = ВЕ = = В(АС) = (ВА)С = Е-С = С, т. е. ? = С. ? Если матрица А обратима, то обратная к А матрица обозначается через Л-1. Таким образом, для любой обратимой матрицы выполняются равенства (3) АА-^Е, А-гА = Е. Множество всех обратимых гахд-матриц над полем «зГ обозначается через GL(n, оГ). ТЕОРЕМА 2.2. Алгебра (GL(n, *?), .,-*) есть группа. Доказательство. Единичная матрица Е, очевидно, обратима и ввиду (1) является нейтральным элементом. Если матрица А обратима, то в силу (2) матрица Л-1 также обратима. 215
Множество GL(nt еГ) обратимых nxn-матриц замкнуто также относительно умножения. Действительно, если Л, ?<=GL(/z, «Г), то (АВ) (В-Ы-1) = Е = (В-1 А-1) (АВ), т. е. матрица АВ обратима над еГ и поэтому принадлежит множеству GL(n, <У). Наконец, по теореме 1.1, умножение матриц ассоциативно. ? СЛЕДСТВИЕ 2.3. Произведение любого числа обрати- мых матриц есть обратимая матрица. Элементарные матрицы. Введем понятие элементарной матрицы. ОПРЕДЕЛЕНИЕ. Квадратная матрица, получающаяся из единичной матрицы в результате неособенного элементарного преобразования над строками (столбцами), называется элементарной матрицей, соответствующей этому преобразованию. Так, например, элементарными матрицами второго порядка являются матрицы П 0] П Ц ГК 0] П 0] Г1 0] |_о lj' |о ij' |о ijf [о xjf |x IT где h — любой ненулевой скаляр. Элементарная матрица получается из единичной матрицы Е в результате одного из следующих неособенных преобразований: 1) умножение строки (столбца) матрицы Е на отличный от нуля скаляр; 2) прибавление (или вычитание) к какой-либо строке (столбцу) матрицы Е другой строки (столбца), умноженной на скаляр. Обозначим через E^i) матрицу, получающуюся из матрицы Е в результате умножения i-й строки на ненулевой скаляр А,: "1 -МО 216
Обозначим через E{i)+i(k)(E(i)^^k)) матрицу, получающуюся из матрицы Е в результате прибавления (вычитания) к i-й строке &-й строки, умноженной на К; '(/)**,(*) = 1 1 X ' 1 1 ; Е{ (/)-*(*) = 1 -А, 1 1 Через ?ф будем обозначать матрицу, получающуюся из единичной матрицы Е в результате применения элементарного преобразования ср над строками; таким образом, ?ф есть матрица, соответствующая преобразованию ср. Рассмотрим некоторые свойства элементарных матриц. СВОЙСТВО 2.1. Любая элементарная матрица обратима. Матрица, обратная к элементарной, является эле- ментарной. Доказательство. Непосредственная проверка показывает, что для любого отличного от нуля скаляра % и произвольных i и k выполняются равенства Е^щЕ^-* (*)= Е ^ Еы1 a)F'7»Uh ?{i)+k(k)E(i)-Mk) = E = Ец)-х{ь)Ец)+ьщ. На основании этих равенств заключаем, что имеет место свойство 2.1. ? СВОЙСТВО 2.2. Произведение элементарных матриц является обратимой матрицей. Это свойство непосредственно следует из свойства 2.1 и следствия 2.3. СВОЙСТВО 2.3. Если неособенное строчечное элементарное преобразование ср переводит т х п-матрицу А в мат- рицу В, то В = ЕуА (E(p^Fmxm). Верно и обратное утверждение. Доказательство. Если ср есть умножение 1-й строки Л = ||а/Л|| на ненулевой скаляр Я, то аи «т ЕтА = \ Хаа ...Ыи La«i ап 217
т. е. В = ЕуА. Если же Е^Ещ+циъ то ап ... fxVl E(i)+K(k)A = c/.n + Kakl ... а*я + Ла kn О.ГПЛ • • • Ot/7 *-ml т. e. B = ?(i)+x(ft)-i4. Легко проверить, что верно также обратное утверждение. ? СВОЙСТВО 2.4. Если матрица С получается из мат- рицы А при помощи цепочки неособенных строчечных элементарных преобразований <&,..., ys> тоС — Е^ ... Е9 • А. Верно и обратное утверждение. Доказательство. По свойству 2.3, преобразование Фх переводит матрицу А в матрицу ?ф1 -Л, ф2 переводит матрицу ?ф1*Л в матрицу Др.Др, -Л и т. д. Наконец, <ps переводит матрицу ?ф ...?ф1-Л в матрицу ?ф ?ф ... , ..?ф1-Л. Следовательно, С = ?ф . ..?ф2?ф1-Л. Легко проверить, что верно и обратное утверждение. Условия обратимости матрицы. Для доказательства теоремы 2.8 необходимы следующие три леммы. ЛЕММА 2.4. Квадратная матрица с нулевой строкой (столбцом) необратима. Доказательство. Пусть Л —квадратная матрица с нулевой строкой, Б —любая матрица, Л, B&Fn*n. Пусть Л/ —нулевая строка матрицы Л; тогда (АВ)1 = [А&9 ..., Л,Я»] = [0, ..., 0], т. е. ?-я строка матрицы АВ является нулевой. Следовательно, матрица Л необратима. Q ЛЕММА 2.5. Если строки квадратной матрицы линейно зависимы, то матрица необратима. Доказательство. Пусть Л — квадратная матрица с линейно зависимыми строками. Тогда существует цепочка неособенных строчечных элементарных преобразований, переводящих Л в ступенчатую матрицу; пусть ф1э..., <ps — такая цепочка. По свойству 2.4 элементарных матриц, имеет место равенство где С— матрица с нулевой строкой. Следовательно, по 218
лемме 2.4 матрица С необратима. С другой стороны, если бы матрица А была обратимой, то произведение слева в равенстве (1) было бы обратимой матрицей, как произведение обратимых матриц (см. следствие 2.3), что невозможно. Следовательно, матрица А необратима. ? СЛЕДСТВИЕ 2.6. Если квадратная матрица обратима, то ее строки линейно независимы. ЛЕММА 2.7. Квадратную матрицу с линейно независимыми строками можно представить в виде произведения элементарных матриц. Доказательство. Пусть А — квадратная матрица с линейно независимыми строками. Существует цепочка строчечных неособенных элементарных преобразований q>lf... ..., <pJf переводящая матрицу А в единичную матрицу Е. По свойству 2.4 элементарных матриц отсюда следует, что Eys ... 2?ф • А = Е. Следовательно, А = Е^1 ... Е^9 причем, по свойству 2.1 элементарных матриц, множители ?ф/, ..., Eig являются элементарными матрицами. ? ТЕОРЕМА 2.8. Для любой квадратной матрицы А (А е Fnxn) равносильны следующие три утверждения: (a) матрица А обратима; (b) строки (столбцы) матрицы А линейно независимы; (c) матрицу А можно представить в виде произведения элементарных матриц. Доказательство. По следствию леммы 2.5, из (а) следует (Ь). Далее, по лемме 2.7, из (Ь) следует (с). Наконец, в силу свойства 2.2 элементарных матриц и следствия 2.3 из (с) следует (а). Следовательно, утверждения (а), (Ь) и (с) равносильны. ? Вычисление обратной матрицы. Теперь можно обосновать наиболее простое правило вычисления обратной матрицы. ТЕОРЕМА 2.9. Если какая-либо цепочка неособенных строчечных элементарных преобразований переводит квадратную матрицу А в единичную матрицу ?, то матрица А обратима и эта же цепочка преобразований переводит матрицу Е в матрицу Л-1. Доказательство. Предположим, что ср1э ..., ср^ есть цепочка неособенных строчечных элементарных преобразований, переводящая квадратную матрицу А в единичную матрицу Е. Тогда, по свойству 2.4 элементарных матриц, 219
В силу предложения 2.1 отсюда следует, что матрица А обратима и Л"1: : ^4>S • • * -?фХ?- По свойству 2.4 элементарных матриц, из последнего равенства следует, что цепочка строчечных элементарных преобразований Фх,..., ф5 переводит матрицу Е в матрицу А-1. ? Теорема 2.9 дает возможность сформулировать следующее правило нахождения обратной матрицы. Для нахождения матрицы, обратной к пхп-матрице А, надо прямоугольную пх2п-матрицу (А \Е) при помощи цепочки неособенных строчечных элементарных преобразований привести к виду (Е | С); получающаяся при этом матрица С является обратной к матрице А, Запись и решение системы п линейных уравнений с п переменными в матричной форме. Рассмотрим систему линейных уравнений а11д;1 + ... + а1яхл = р1, (I) над полем gF. Если ввести обозначения ат • • • апп. V & = "РГ • Jn. ., v= ' xxl L Xnj то систему (I) можно записать в виде матричного уравнения (2) АХ = Ь. Легко видеть, что уравнение (2) равносильно системе уравнений (I). Уравнение (2) называется матричной формой записи системы уравнений (I). ТЕОРЕМА 2.10. Если строки матрицы А линейно независимы, то вектор А~гЬ является единственным решением уравнения (2). Доказательство. Предположим, что какой-либо вектор-столбец ??Q есть решение уравнения (2), т. е. А«2Г0 = 6. Умножив слева обе части равенства А.%,С q = о на Л'1, получим (3) X^A-i-b. Таким образом, либо уравнение (2) имеет решение А~гЬ, либо оно не имеет решений. Однако равенство A(A~1-b)=b 220
показывает, что вектор А~г-Ь является решением уравнения (2). Следовательно, вектор А~г-Ь является единственным решением уравнения (2). ? СЛЕДСТВИЕ 2.11. Если строки основной матрицы А системы (I) линейно независимы, то система совместна и вектор А~г-Ь является ее единственным решением. Упражнения 1. Пусть Л =|| а-ц Ц-—квадратная матрица порядка п (над полем ^). Обозначим через Eik (i, k=\, ..., п) матрицу, у которой в i'-й строке и k-u столбце стоит 1, а все остальные элементы равны нулю. Покажите, что (*) AEik=auEik+...+a>niEnk* EikA — <*kiEn+• • • + UknPin- 2. На основании равенства (*) докажите, что матрица А тогда и только тогда перестановочна с каждой из матриц Ецг, когда А имеет вид %Е> где )ieF. 3. Пользуясь результатом предыдущей задачи, покажите, что матрица А тогда и только тогда перестановочна с произвольной квадратной матрицей порядка п (надполем^), когда А—ХЕУ где ^ef. 4. Пусть А—квадратная матрица порядка п. Докажите, что матрица А перестановочна с произвольной диагональной матрицей порядка п тогда и только тогда, когда матрица А сама диагональна. 5. Пусть А—диагональная матрица и все элементы ее главной диагонали различны между собой. Покажите, что любая матрица, перестановочная с Л, также диагональна. 6. Покажите, что квадратная матрица А порядка п, перестановочная со всякой симметрической матрицей того же порядка, является скалярной, т. е. Л=Я?", где К—скаляр и Е— единичная матрица порядка л. 7. Пусть Л—квадратная матрица порядка п (надполем^). Докажите, что множество всех матриц (нада^"), перестановочных с матрицей Л, замкнуто относительно сложения и умножения, § 3. ПОДСТАНОВКИ Подстановки. Группа подстановок. Рассмотрим подстановки множества М = {1,..., /г}, где п — натуральное число, отличное от нуля. Подстановкой множества М называется инъективное отображение множества М на себя. Всякое отображение <р множества М на себя удобно записать в виде таблицы J \ 2 ... п \ Ф 1,Ф(1) Ф(2) ... <р(л)/' Порядок чисел в первой строке этой таблицы несуществен, его можно как угодно изменить. Однако надо следить за тем, чтобы для всякого k число ф (k) было записано непосредственно под k. 221
Множество всех подстановок множества М обозначим через Sn; элементы этого множества называются подстановками степени п. Если <p^Sn, то:(1) ф есть инъективное отображение, т. е. для любых i, JeM из ф(г) = ф(&) следует i = k; (2) ф есть отображение М на УИ, т. е. |ф(1),..., ср(я)} = = {1, ..., п\. Так как М — конечное множество, то из условия (1) следует условие (2), и наоборот. Произведение фф двух подстановок ф и г|э множества М определяется как композиция отображений ф и я|)(ф\|)=ф-я|)). Таким образом, по определению <И>(0 = ФСФ(/)) для i=l9 ..., п. Композиция любых двух инъективных отображений множества М на себя есть инъективное отображение множества М на себя. Следовательно, для любых двух подстановок ф, г|) из Sn имеем ф1|)^5„. Обозначим через е тождественное отображение множества М на себя: s(t) = i для * = 1, ..., п, т. е. 8 = 1 I. Легко видеть, что для любой подстановки ф из Sn фе = = 8ф = ф, т. е. 8 является нейтральным элементом относительно умножения. Если ф — подстановка множества М, то qr1 —также подстановка множества М и фф~1 = & = ф-1ф. При этом /ф(1)...ф(^ / 1 ... П \ ф [ 1 ... п ) W-41)...9-W ТЕОРЕМА 3.1. Алгебра (Sn, •, -1) является группой. Доказательство. Выше мы установили, что множество Sn замкнуто относительно главных операций •, -1. По теореме 2.3, композиция функций ассоциативна. Следовательно, операция умножения подстановок ассоциативна. Тождественная подстановка 8 есть нейтральный элемент относительно умножения, и для любой подстановки ф из Sn выполняется равенство фф~1 = е = ф~1ф. Таким образом, алгебра (Sn, •, -1) является группой. ? ОПРЕДЕЛЕНИЕ. Группа (Sn, •, -1) называется симметрической группой степени п и обозначается через $п. Элемент 8 называется единичным элементом этой группы. 222
Четные и нечетные подстановки. Пусть дана подстановка множества М = {1, ..., п) { J 2 ... п \ Ф WO) Ф(2) ... ф(л)Г Рассмотрим какую-нибудь неупорядоченную пару {i, k) различных элементов множества М. Пара {i, k) назьюается правильной по отношению к подстановке ф, если разности i — k и ф(/) —ф(/г) имеют один и тот же знак. Говорят, что пара \i, k) неправильна по отношению к подстановке ф или образует в ней инверсию, если разности i — kw q(i) — ф (k) имеют разные знаки. Так, например, в тождественной под- А 2 3\ . „ /1 2 3\ становке ( нет инверсии. В подстановке I /1 2 3\ есть только одна инверсия. В подстановке _ t I имеется \3 1 2/ две инверсии. Подстановка называется четной, если она содержит четное число инверсий; подстановка называется нечетной, если она содержит нечетное число инверсий. Так, например, тождественная подстановка есть четная. Подстановка ф вида /1 ... i ... k ... п\ \1 ... k ... i ... п называется транспозицией. Другими словами, подстановка ф называется транспозицией, если существует пара {i, k] различных элементов из М, удовлетворяющих условиям (1) ф (/) = &, y(k) = i, (p(s) = s для каждого s^A4\{i, k}. ЛЕММА 3.2. Любая транспозиция есть нечетная подстановка. Доказательство. Пусть ф —транспозиция, переводящая i в k (1фк), т. е. удовлетворяющая условиям (1). Будем предполагать, что i<k. Легко видеть, что пара {s, t) d M может образовать инверсию, если хотя бы один из ее элементов есть i или к, в противном случае обе разности s — t и ф(5) — ф(/) совпадают. Если i<s или k<.s, то среди пар {s, i} и {k, s} нет инверсий, так как обе разности отрицательны. Если i<s^k, то среди пар {i, s} инверсиями являются следующие: {i, t + 1}» •••» {*» *Ь всего fe — i инверсий. 223
Если i<.s<.k, то среди пар {s, k) инверсиями являются пары {t'+l, k}, ..., {k—l, k}\ имеется всего k — i—\ инверсий. Итак, транспозиция ф содержит всего (k—i)+(k — i— 1)= = 2 (^ — i) — 1 инверсий, значит, ф есть нечетная подстановка. ? Знак подстановки. Знак любого рационального числа а определяется следующим образом: II для а>>0, О для а = 0, — 1 для а < 0. Легко видеть, что для любых рациональных чисел а и Ъ sign (ab) = sign (а) • sign (6). Это свойство знака, называемое свойством мультипликативности, будет использовано при доказательстве леммы 3.3. Обозначим через sgn отображение множества Sn в множество {1, —1}, определяемое равенством: 1, если ф — четная подстановка, sgnф—' -{ 1, если ф —нечетная подстановка. Нетрудно видеть, что знак (sgn ф) подстановки ф равен про- i — k изведению знаков всех чисел —рг ттт> соответствующих Ф(0—ф(л) J всевозможным парам {i9 k\ различных элементов множества М, т. е. sgn<p= ц *Ф1г4) {I, k}czM ЛЕММА 3.3. Знак произведения двух подстановок равен произведению знаков этих подстановок, т. е. (1) sgn (фг|>) = sgn ф • sgn я|) (ф, г|) <= Sn). Доказательство. Подстановку ф можно представить в виде \ф\|)(1) ... фф(/1)у' <P=Lu/n ™u,J; П0ЭТ0МУ ПФ(0—*(*) S1gn Й"(о^Ш; {I, *}с:М гфк 224
следовательно, имеем (2) Sgnq>.Sgni|>= IJ sign-H^l^yX {i. к] czM X 11 slgr4(o-iM*) {i, k}czM В силу свойства мультипликативности знака sign . яр (?)—ty(k) . i—k _ slgn ф* (о-фф (*) *slgn * (*>-¦ <*)~ esignf ¦<*>-*<*> Ь*_Л = sign Ь± Поэтому из (2) следует, что sgnФ.sgn г|) = Д sign ^Z^(k) = sSn(ФФ)- ? {*, /г} сЛ* ТЕОРЕМА 3.4. Зияя подстановки (функция sgnj обладает следующими свойствами: (1) функция sgn мультипликативна, т. е. sgn(q>i|)) = = sgn ф« sgn of) Эля любых ф, -ф «з S„; (2) зяа/с транспозиции равен (— 1); (3) взаимно обратные подстановки имеют один и тот же знак; (4) если % —транспозиция и ф — любая подстановка из Snf то sgn(T9) = sgn(9T) = —sgn9. Доказательство. Свойство (1) выполняется в силу леммы 3.3. Свойство (2) непосредственно следует из леммы 3.2. В силу свойства (1) Sgn (фф-1) = Sgn ф • Sgn ф"1 = Sgn 8=1 для любой подстановки ф. Следовательно, sgnф = sgnф-1. Свойство (4) непосредственно следует из свойств (1) и (2). ? СЛЕДСТВИЕ 3.5. Произведение двух (или четного числа) подстановок одинаковой четности есть четная подстановка. СЛЕДСТВИЕ 3.6. Произведение двух подстановок различной четности есть нечетная подстановка. Упражнения 1. Докажите, что существует п\ подстановок множества, состоящего из п элементов. 2. Покажите, что при п ;> 1 число четных подстановок множества {1, 2,..., п} равно числу нечетных подстановок. 225
3. Докажите, что множество всех четных подстановок из Sn замкнуто относительно умножения и операции образования обратного элемента. 4. Покажите, что каждую подстановку из Sn при п > 1 можно представить в виде произведения транспозиций вида (&, k + 1), где 1 ^ k < я. 5. Покажите, что каждую подстановку из Sn при л > 1 можно записать в виде произведения транспозиций вида (1, k), где l<.k^n, § 4. ОПРЕДЕЛИТЕЛИ Определитель квадратной матрицы. Пусть ^ — коммутативное кольцо или поле, элементы которого будем называть скалярами. Пусть Л = aii ai2 ••• ат а21 а22 • • • а2я <хп1 ап2 ... сспп — матрица над <зГ, А ^ Р1**. Пусть Sn — множество всех подстановок множества {1,..., п}. Рассмотрим множество М (А) всех произведений элементов матрицы Л, взятых по одному из каждой строки и каждого столбца. Всякий элемент множества М(А) содержит п сомножителей и может быть записан в виде (1) alh-a2i2...anin. Элементу (1) поставим в соответствие подстановку (2) а 2 Ji к п *i *2 • • • in множества {1,..., п}. Обратно: каждой подстановке т из Sn 1 2 ... п (3)т = ;г(1) т(2)...т(л), соответствует единственный элемент множества М(А), а именно (4) aiT(i)-a2f(2)*"#j»f(i»)» Таким образом, отображение, ставящее в соответствие каждой подстановке т из S„ элемент (4) множества М (Л), есть инъектиеное отображение множества Sn на М(А). 226
ОПРЕДЕЛЕНИЕ. Определителем матрацы А называется сумма 2 sgn (т) а1х{1) • а2Т(2)... anxW. xeSrt Сумма содержит п\ слагаемых, причем каждой подстановке т из Sn в этой сумме соответствует в точности одно слагаемое. Определитель матрицы А будем обозначать | А |, или det Л, или Оц. .а т |ал1.. .сслл1 Если я=1, то det [аи] = ап. Для я = 2 |а11 а12[ 1а21 а22| Если я = 3, то а11 а12 а13 0^21 ^22 ^23 а31 а32 а33 = ап а22 — &12 a2i« = ССц а22 а33 "Г а13 а21 а32 "Г а12 а23 а31 — — #13 а22 а31 — а11 а23 а32 — а12 а21 а33« ПРЕДЛОЖЕНИЕ 4.1. Определитель матрицы с ну- левой строкой (столбцом) равен нулю. Квадратная матрица называется диагональной, если равны нулю все ее элементы, расположенные вне главной диагонали. ПРЕДЛОЖЕНИЕ 4.2. Определитель диагональной матрицы равен произведению элементов ее главной диагонали. Квадратная матрица называется треугольной, если равны нулю все ее элементы, расположенные выше (ниже) главной диагонали. ПРЕДЛОЖЕНИЕ 4.3. Определитель треугольной матрицы равен произведению элементов ее главной диагонали. Доказательство предложений 4.1—4.3 предоставляется читателю. Основные свойства определителей. Сформулируем и докажем наиболее часто встречающиеся свойства. СВОЙСТВО 4.1. Определители квадратной матрицы А и транспонированной матрицы ЬА равны. 227
Доказательство. Пусть Л = ||а/Л|| —квадратная матрица порядка п и М = ||Р/Л||, где $ik = aki. Тогда имеем: |M| = 2(sgnT)Plt(1)...pwt(n); T(=Sn xe5n / 1 ... n \ , Ml)...x(n)\ Так как т= /<ч , то т~1= t , или, если \т(1)...т(я)/ \ 1 ... п I расположить в верхней строке числа в порядке возраста- ния, т*1= . В произведении at(1)1... ах(п)п ус-Ч!)... т 1(п)/ множители расположим так, чтобы первые индексы шли в порядке возрастания; в результате получим at(i)l • • • &%(n)Ti = <*пгЩ) • • • anx'l(n) и равенство (1) можно записать в виде (2) | 'Л | = 2 (sSn х'г) а1*-Ч1) • • • я<пх-\п). x-K=Sn Так как подстановка т-1 пробегает все элементы множества Sn по одному разу, когда т пробегает все элементы этого множества по одному разу, то сумма в равенстве (2) равна определителю матрицы Л. Следовательно, \*А | = = \А\. п СВОЙСТВО 4.2. При перестановке двух столбцов (строк) матрицы ее определитель меняет знак. Доказательство. Пусть Л = ||aik|| есть пхя-мат- рица й В = |! (5/fc У — матрица, полученная из матрицы Л в результате перестановки двух столбцов с индексами s и t. Пусть а — транспозиция из Sni переводящая s в t, a — (st), тогда P/* = a/a(*) Для U &<={1,..., п}9 поэтому IВ | = 2 (sen т) Р«<1> • • • Р«(я) = S(sgn т) alat(1)... ««*(„!. По теореме 3.4, sgn(ar) = —sgnt. Кроме того, когда под* становка т пробегает все элементы множества Sn по одному разу, подстановка т' = от также пробегает все элементы 228
этого множества по одному разу. Следовательно, получаем |Я| = — X(sgnxf)alxril)...anxr{n) = — |A|, т.е.|5| =-|А|. СВОЙСТВО 4.3. Определитель матрицы, имеющий два одинаковых столбца (строки), равен нулю. Доказательство. Предположим, что матрица А = = || a/ft || имеет два одинаковых столбца, например AS = A*. Обозначим транспозицию (st) через сг. Тогда равенство AS = A* влечет равенство (1) CXit(i)... СС/гг(/г) = <hor{l) • • • апах(пУ Каждой подстановке т из Sn поставим в соответствие подстановку ат. Тогда подстановке ох соответствует подстановка т, так как а(ат) = т. Назовем множество {т, ат} парой соответствующих друг другу подстановок. Множество Sn распадается на попарно непересекающиеся пары таких подстановок. Следовательно, мы получаем разбиение множества Sn: Sn=[) {т, at}, те=л/г где Л „ — множество всех четных подстановок степени п. Поэтому равенство \А I = S (s2n T) ai*<D • • • а™&) можно записать в виде (2) | А | = Ц [(sgnт) ait(1).. .апх{я) + (sgn ат)а1аг(1)...апах(я)]. те А„ п Кроме того, по теореме 3.4, (3) sgn(aT) = — sgn т. На основании (1) и (3) заключаем, что (sgn т) alt(1)... апх{п) + (sgn ат) alat(1)... аМх{п) = 0. Таким образом, каждое слагаемое в сумме (2) равно нулю; следовательно, | А | = 0. ? СВОЙСТВО 4.4. Если все элементы какой-либо строки (столбца) матрицы А умножить на скаляр %, то на скаляр % умножится определитель матрицы А. 229
Доказательство. Пусть А = Ца/Й|| — квадратная матрица порядка п и В —матрица, получающаяся из матрицы А в результате умножения ?-й строки на скаляр i,: В = <*!! • • • &\п ^«Л ... %OLt In Lai*i •••<*. пп J Тогда, по определению определителя, IВ | = 2 (s2n T) *«а> • • • (*«/т(/))... аяг(я) = СЛЕДСТВИЕ 4.4. Определитель матрицы, у которой какие-либо две строки (столбца) пропорциональны, равен нулю. СВОЙСТВО 4.5. Если каждый элемент i-й строки (столбца) квадратной матрицы А есть сумма т слагаемых, то определитель матрицы А равен сумме т определителей, причем в матрице первого определителя в i-й строке (i-м столбце) стоят первые слагаемые, в матрице второго — вторые и т. д., а остальные строки те же, что и в матрице А. Доказательство. Предположим, что каждый элемент t-й строки матрицы А есть сумма т слагаемых: (1) Щь = *%+ ... + *№ (*=1, .... т). В равенстве \А I = 2 (s§nT)°W) • • • «л(i) • • • ant(») ^Sn в каждом слагаемом суммы заменим множитель а1хщ суммой т слагаемых по формуле (1) и представим всю сумму в виде т слагаемых; \А | = S (s2n T)ait(D • • • <*?(<) • • -a«(») +• • • xeS„ • •. + E (Sgn T) «It (I)"- « Д) • • • «IK («)• 230
Заменив каждую из т сумм определителем, получим искомое равенство аи.. а(1) a«i- • «1* а0) • '«ЛЛ + • •• + аи-- <• ал1.. •ащ 1 ..«г| ¦ алл СВОЙСТВО 4.6. Если к какому-нибудь столбцу (строке) матрицы определителя прибавить другой столбец (строку) матрицы, умноженный на произвольный скаляру то определитель матрицы не изменится. Доказательство. Запишем п х /г-матрицу А в виде А=(А\ А2, ..., Ап). Предположим, что матрица В получается из матрицы А в результате прибавления к первому столбцу k-то столбца, умноженного на скаляр Я, т. е. В = {А1+Ы\ А\ ..., Ап) (кф1). По свойству 4.5, определитель матрицы В можно представить в виде суммы двух слагаемых: \В\ = \(А\ А\ ...,Л*)|+Ь|(А*, А\ ..., А*)\. В этой сумме второй определитель равен нулю, так как имеет два одинаковых столбца; следовательно, | В | =) А |. ? СЛЕДСТВИЕ 4.5. Если к какому-нибудь столбцу (строке) матрицы определителя прибавить линейную комбинацию других столбцов (строк) матрицы, то определитель матрицы не изменится. СВОЙСТВО 4.7. Если какой-нибудь столбец (строка) квадратной матрицы есть линейная комбинация других столбцов (строк) матрицы, то определитель матрицы равен нулю. Это свойство легко вытекает из следствия 4.5. Упражнения 1. Как изменится определитель квадратной матрицы порядка п, если каждый элемент матрицы заменить на противоположный? 2. Пусть Л—квадратная матрица порядка п над полем & и Я—-элемент этого поля. Докажите, что | ХА |=V* | Л \. 3. Как изменится определитель квадратной матрицы порядка п с комплексными элементами, если каждый элемент матрицы заменить комплексно-сопряженным? 231
4. Элементы квадратной, матрицы А порядка п удовлетворяют условию af-? = afc/, где а^ — комплексное число, сопряженное с щ^. Докажите, что | А | есть действительное число. 5. Докажите, что определитель треугольной матрицы равен произведению элементов, расположенных на главной диагонали матрицы. 6. Как изменится определитель квадратной матрицы порядка п, если первый столбец матрицы переставить на последнее место, а остальные столбцы передвинуть влево, сохраняя их расположение? 7. Как изменится определитель квадратной матрицы порядка л, если столбцы матрицы написать в обратном порядке? 8. Пусть в поле У выполняется равенство 1+1=0. Докажите, что определитель любой кососимметрической матрицы над & нечетного порядка равен нулю. 9. Докажите, что 1 Xl 1 х% х% 1 х3 х\ I 10. Докажите, что имеет место следующее разложение на линейные множители определителя Вандермонда я-го порядка: *л—i I = (#2 — Xi) (#3 — Х2) (Х3 — *2) • Хг %2 ч ..*? —1 = П <«- -*а). 11. Покажите, что если квадратная матрица А обратима, то И-1|НЛ|-1. 12. Пусть Л—квадратная матрица. Докажите, что |Л*| = |Л|* для каждого целого положительного числа k. Покажите, что если матрица Л—неособенная, то | Ak | = | Л \k для любого целого числа к, § 5. МИНОРЫ И АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ. ТЕОРЕМЫ ОБ ОПРЕДЕЛИТЕЛЯХ Миноры и алгебраические дополнения. Пусть аГ — поле скаляров и A =||a^|| ^Fmxn; Or и- •«1Я Lami- .a„ ОПРЕДЕЛЕНИЕ. Подматрицей матрицы А называется матрица, которая получается из Л в результате вычер- кивднця какол-либо совокупности ее строк и столбцов. Подматрица, состоящая из k строк и k столбцов, называется подматрицей k-го порядка. ОПРЕДЕЛЕНИЕ. Определитель подматрицы k-vo порядка матрицы А называется минором k-го порядка матрицы А. 232
Минорами первого порядка матрицы А являются её элементы. ОПРЕДЕЛЕНИЕ. Определитель матрицы, полученной из квадратной матрицы А вычеркиванием х-й строки и 6-го столбца, называется минором элемента щк и обозначается через Mik. Произведение (—\)iJrkMik называется алгебраическим дополнением элемента aik и обозначается через A ik. Отметим, что Mik и Aik = {—\)UkMik не зависят от элемента alkJ однако Aik зависит от четности суммы i + k. ЛЕММА 5.1. Пдсть A(=Fnxn. Если рЫвны нулю те ыементы последней строки (столбца) матрицы А, за исключением, быть может, элемента аяп, то \ А | *= айп Мйп. Доказательство. Предположим, что 0) «яа = 0 Для 6е={1, >.., п-Ц. По определению определителя, (2) |Л|= ^ (ЧЪъ)<Чх{1)---<*п-1Х(п-1)-<*ях{л)- Определим множество S'n равенством (3)S^{teSA|T(/i)=?i}. Если r^Sn\Sn, то в силу (1) алг(л) = 0. Следовательно, в сумме (2) равны нулю все слагаемые, которые соответствуют подстановкам т из Sn\S'n. Опуская в сумме (2) эти слагаемые, получаем (4) \А\ = апп 2 (sgm;)alx{1) ...а{п-1)х<п_г). Рассмотрим следующее отображение ф множества S'n на S„-x: /1 ...(*-!)* \ /1 ...(/i-l) \ , \т(1) ... т(л-1) п/Т\т(1) ... т(л-1)/ Т' Таким образом, т' есть ограничение т множеств&м {1, ..., п-1}: (5)т'(0==т(0дляге{1,...,Аг~1},т' = ( ,, '"V inV \т (1)...т(п — 1)/ Отображение ф есть инъективное отображение множества 5л на Sn-V Так как х(п) = п для teS^ то число инвер- 233
сий в подстановке т равно числу инверсии в подстановке т'; следовательно, (6) sgn т' = sgn т (т' < На основании (5) i в виде (6) равенство (4) можно записать |Л1 —а, пп 2 (Sgnx') Щх'{1У»*п-1%\п-1У В последнем равенстве сумма есть минор МЯП9 соответствующий элементу апп, т. е. \А\ = апп-Мпп. О ЛЕММА 5.2. Если равны нулю все элементы какой-либо строки (столбца) квадратной матрицы А, за исключением, быть может, одного элемента, то \ А \ равен произведению этого элемента на его алгебраическое дополнение. Доказательство. Пусть А =||а/у||е/ГлХ'г. Предположим, что равны нулю все элементы i-й строки матрицы Л, за исключением, быть может, элемента а^: (1}а/у = 0, /е{1, n}\{k}. В матрице А будем смещать i-ю строку вниз до тех пор, пока она не станет последней, переставляя ее последовательно с соседней (снизу) строкой. Затем &-й столбец полученной матрицы будем смещать вправо, последовательно переставляя его с соседним (справа) столбцом, пока он не станет последним. В результате матрица А перейдет в матрицу ? = Ввиду условия (1) равны нулю все элементы последней строки матрицы В, за исключением, быть может, элемента alk. Следовательно, по лемме 5.1, (2) \В\=*ш-Мш где Mik — минор матрицы Л, соответствующий элементу aik. Матрица В получилась из матрицы Л в результате 234
n — i перестановок строк и n — k перестановок столбцов; следовательно, по свойству 4.3 определителей, |Я| = (—1)»-'+я-*|Л| (3)|Л| = (-1)*>*|В|. Из (2) и (3) получаем \A\ = (—\)i+k-aik-Mik=**UtAik, т. е. \A\ = alkAlk. ? Разложение определителя по строке или столбцу. При вычислении определителей часто используется следующая теорема. ТЕОРЕМА 5.3. Пусть A<=Fn*n. Определитель матрицы А равен сумме произведений элементов какого-либо столбца (строки) на их алгебраические дополнения, т. е. (1) \A\ = alkAlk+... + ankAnk (2) |Л| = сс/1Л/1+... + а/лЛ/л Доказательство. Представим в виде суммы п столбцов k-й столбец Ak матрицы Л: (i, fee={l, ..., п}). \~aik~ 0 L6 . + -о - «as _6 . +•¦ •+ -о -i 0 -«nJ л*= По свойству 4.5 определителей, этому представлению соответствует представление телей: | Л | в виде суммы п определи- |Л| = а 11« «21- ««!• •«!*.. .0 .. .0 .. •«!„ •а2я •«ля + .. • + а ...0 а31...0 11 .сс1п .а2* ал1...алЛ...ал По лемме 5.2, первое слагаемое этой суммы равно <xlkAlk9 второе — <x2kA2k и т. д. Следовательно, IА | = а1/гЛ1Л + а2йЛ2Л+... + ankAnk. Аналогично доказывается формула (2). ? Формула (1) называется разложением определителя по k-му столбцу. Формула (2) называется разложением определителя по i-и строке. 235
ТЕОРЕМА 5.4. Пусть А =||а//||е/7лх«. Сумма произведений элементов какого-либо столбца (строки) матрицы А на алгебраические дополнения соответствующих элементов другого столбца (строки) равна нулю, т. е. (3) alkAls + ... + ankAns = 0 (k^s), (4) atiAmi + -.- + <*inAmn = 0 (тфг). Доказательство. Докажем формулу (3). Запишем А в виде А = {А\ ..., А\ ..., Л*, ..., А"). Заменив в матрице А s-й столбец As произвольным Еек- тором Ь = h получим матрицу В = (А\ ..., А\ ..., Ь, >.., А*). Разложим | В | по s-му столбцу: Отметим, что это равенство верно для любого набора скаляров р1э ..., рл. В частности, положив в нем (5Х = = alk, ..., $п = &пк> получим равенство О = alkAls + ... + ankAns (k Ф s), так как матрица В будет иметь два одинаковых столбца. Аналогично доказывается формула (4). ? Определитель произведения матриц. Сначала докажем две леммы. ЛЕММА 5.5. Если ?ф — элементарная матрица, имеющая тот же порядок, что и квадратная матрица В, то (1) \ЕчВ\ = \Еч\\В\ ъ |?ф|#0. Доказательство. Всякая элементарная матрица треугольна, и поэтому ее определитель равен произведению элементов главной, диагонали. Следовательно, (2) |?Ф| = Ь _ _ [I, если ?ф = ?(|)+к»); а, если Е9 = ЕН1) 0<ФО), и кроме того, (3\ \Е Bl-J*'*1, еСЛИ ?*e?w>' К) ' ф ' I |5|, если ?ф = ?(0+мл). На основании (2) и (3) заключаем, что имеет место (1). Q 23G
ЛЕММА 5.6. Если Еъ ..., Es —элементарные матрицы, имеющие тот оюе порядок, что и квадратная матрица В, то (4) \ElE2...EsB\ = \E1\\E2\...\Es\\B\. Доказательство (ведется индукцией по числу s). По лемме 5.5, лемма 5.6 верна при s=l. Предположим, что лемма верна для s — 1 элементарных сомножителей, и докажем, что тогда она верна для s сомножителей. По лемме 5.5 имеем \E1(Et...EtB)\ = \E1\\Et...EsB\. По индуктивному предположению, \Et...EtB\ = \Et\\E9\...\Es\\B\; следовательно, \Е1Е%...ЕЖВ\ = \Е1\\ЕЪ\...\ЕЛ\\В\. Таким образом, равенство (4) верно для любого $. ? СЛЕДСТВИЕ 5.7. Если Еи ..., Es —элементарною матрицы одного и того же порядка, то \E1E2...ES\ = \E1\\E2\...\ES\. ТЕОРЕМА 5.8. Определитель произведения двух квадратных матриц равен произведению определителей этих матриц, т. е. \АВ\ = \А\\В\. Доказательство. Первый случай: строки матрицы А линейно независимы. По теореме 2.8, матрицу А можно представить в виде произведения элементарных матриц, А = Еи ... , Es, поэтому АВ = Ег.. ,ESB. По лемме 5.$ имеем \АВ\ = \Ег\...\Е9\\В\. Кроме того, по следствию 5.7, \A\ = \E1...ES\ = \E1\\E2\...\ES[; следовательно, | АВ | = | А \ | В |. Второй случай: строки матрицы А линейно зависимы. В этом случае матрицу А при помощи цепочки строчечных неособенных элементарных преобразований можно привести к ступенчатой матрице, которую обозначим через С; так как строки матрицы линейно зависимы, то С имеет нулевую строку. Если 237
то, по свойству 2.4 элементарных матриц, ?ф1... ?ф • Л = С. Умножим это равенство справа на матрицу В: х2ф • • • х2ф r\.D == Lr?s* По лемме 5.6, |JEVl|...|?vJ|4fi| = |CB|. Так как С и, значит, СВ —матрицы с нулевой строкой, то |С5| = 0. Кроме того (по лемме 5.5), \Е^\Ф09...Ъ\Е^\Ф0, |?ф1|...|?ф^0; следовательно, |ЛВ| = 0. Так как строки матрицы А линейно зависимы, то одна из строк матрицы А есть линейная комбинация других строк. Поэтому (согласно свойству 4.7 определителей) | А | = 0. Следовательно, | А \ \В| = 0. Итак, \АВ\ = \А\\В\. П Необходимые и достаточные условия равенства нулю определителя. Как показывают следующие две теоремы, существуют различные эквивалентные между собой условия равенства нулю определителя. ТЕОРЕМА 5.9. Определитель квадратной матрицы равен нулю тогда и только тогда, когда строки {столбцы) матрицы линейно зависимы. Доказательство. Пусть Aef^". Докажем, что если строки матрицы А линейно независимы, то | А \ Ф0. В самом деле, если строки матрицы А линейно независимы, то, по теореме 2.8, ее можно представить в виде произведения элементарных матриц, т. е. А = Ег...Es. По следствию 5.7, | А \ = \Ег\...\Ез\. Кроме того, по лемме 5.5, определитель любой элементарной матрицы отличен от нуля. Следовательно, |Л|^=0. По закону контрапозиции, доказанное сейчас утверждение равносильно утверждению: если |Л| = 0, то строки матрицы А линейно зависимы. Докажем теперь обратное утверждение: если строки квадратной матрицы А линейно зависимы, то |Л| = 0. В самом деле, если первая строка Аг матрицы Л —ненулевая, то хотя бы одна из строк Л2, ..., Лл является линейной комбинацией других строк этой матрицы. Следовательно, по свойству 4.7 определителей, \А | = 0. ? ТЕОРЕМА 5.10. Для любой квадратной матрицы А равносильны следующие четыре утверждения: (a) | Л |=^0; (b) строки {столбцы) матрицы А линейно независимы; (c) матрица А обратима; 238
(d) матрица А представима в виде произведения элементарных матриц. Эта теорема непосредственно следует из теорем 5.9 и 2.8. 1. Пу< \А 0 \в с :ть А и С—квадратные матрицы, Докажите, что |Л|.|С|. 2. Докажите, что \а b \с а \в с с Ь а = /(G)i) /(С02)/(©3), где f=a+bx+cx2 и ©ь ©2, ©3~ различные корни третьей степени из единицы. 3. Вычислите определитель \а b с d\ d a b c\ с d a b\ b с d a\ 4. Докажите, что = (*2— %) (*8—*l) {Ч—Х2). 5. Пользуясь только определением определителя, вычислите определитель треугольной матрицы А: -ап 0 0 ... О 1 11 \*1 \xl 1 1 1 ¦&3 Xq л2 Л3 1 л= а2г #22 О #31 #32 #33 -ап1 йп2 апЗ ••• ЙЛ 6. Сколько квадратных подматриц k-ro порядка имеет m X п- матрица? § 6. ТЕОРЕМЫ О МАТРИЦАХ. ПРАВИЛО КРАМЕРА Теорема о ранге матрицы. Рассмотрим связь ранга матрицы с порядками ее ненулевых миноров. ТЕОРЕМА 6.1. Ранг ненулевой матрицы равен наибольшему из порядков ненулевых миноров матрицы. Доказательство. Пусть Л—ненулевая матрица и ЛеРхл. Тогда ее ранг г = г(А)>0. Докажем, что матрица А имеет хотя бы один ненулевой минор порядка 239
г. Так как г = г(Л)>0, то матрица Л имеет г линейно независимых строк. Пусть В — подматрица матрицы Л, состоящая из г линейно независимых строк матрицы Л, т. е. В е ^Frxn9 r(B) = r. Из равенства г(В) = г следует, что матрица В имеет г линейно независимых столбцов. Пусть С —подматрица матрицы В, состоящая из г линейно независимых столбцов матрицы fi, тогда CeFrXr, r(C) = r. По теореме 5.10, \С\Ф0, так как столбцы матрицы С линейно независимы. Таким образом, \С\ есть ненулевой минор порядка г матрицы Л. Легко проверить, что при k>r{A) равен нулю любой минор порядка k матрицы Л. В самом деле, при k>r(A) линейно зависимы любые k строк матрицы Л. Поэтому данейно зависимы строки любой квадратной k x k подматрицы матрицы Л. Следовательно, по теореме 5.9, равен нулю любой минор порядка k матрицы Л. ? Обратная матрица. Пусть ^Gf"x/I, Л = 11 а а* 12 а1я Ъп _ал1 ая2 и Л/й — алгебраическое дополнение элемента aik. Присоединенной для матрицы А называется матрица ~Л„ А <г\ ... А, л* = 11 л21 Л12 Л22 1п1 |_/11л /i2;j ... ^ял_1 В силу теорем 5.3 и 5.4 Л|(Л*)* = (0|1, ..., а,я) = Л Ал J = 0,1 Л *! + ... +Of яЛЛя = -{ ' А |, если i = k, О, если i#&, поэтому АА* А\ О ...О О \А\ ... О = | А ] ? (Я—единичная матрица); О О \А\ (1) А(\А\~1А*) = Е, если |Л]#0. 240
Аналогичные вычисления приводят к равенствам Л*Л = |Л|?, (2) (|Л|-М*)А = ?, если \А\фО. Равенства (1) и (2) показывают, что матрицы А и | А |-1 А* взаимно обратны. Таким образом доказана следующая теорема. ТЕОРЕМА 6.2. Если определитель квадратной матрицы А отличен от нуля, то матрица А обратима и Л"1 = |Л|-1Л*. Правило Крамера. Рассмотрим систему п линейных уравнений с п переменными апх1 + ... + а1пхп = §1, О) а/11*1+... + а™#я = Рл над полем sF. Обозначим через Л основную матрицу этой системы: Л=||а*л||. ТЕОРЕМА 6.3. Если \ А | =^= 0, то система линейных уравнений (1) имеет единственное решение, выражаемое формулами (2) ^ = |Л|-ЧМи+... + М^ ... Доказательство. Полагая .#* = запишем систему (1) в внде матричного уравнения (3) А& = Ь, равносильного системе (1). По теореме 5.9, из условия | Л |^=0 следует, что строки матрицы Л линейно независимы и системы (3) и (1) имеют единственное решение SC = = А-Ч. Отсюда, поскольку (по теореме 6.2) Л"*1 = | Л |_1 Л*, получаем г*г \ L*». , ъ = ГРЛ : liJ А 16 = |Л|-1 Ах- Лп\ ь "Mu+.-.+M А1 \$1А1п + ... + §пАпп 241
хг HI-MMii + .-. + Mm) J4|-4Mi*+...+M«.)J Из последнего равенства следуют формулы (2). ? Формулы (2) обычно называют формулами Крамера, а теорему 6.3 — правилом Крамера. Обозначим через A (k) матрицу, которая получается из матрицы А в результате замены &-го столбца столбцом свободных членов системы (1): Л(1) = Pi «12 ••• «In Ря а, 712 ап ., А(п) = а11 ••• а1л-1 Pi Разлагая определитель матрицы A (k) по &-му столбцу, получаем |ii(ft)HMi»+...+M«* №=1. .... л). Эти равенства позволяют переформулировать теорему 6.3 следующим образом. ТЕОРЕМА 6.4. Если \А\фО, то система линейных уравнений (1) имеет единственное решение, выражаемое формулами (2) \А{\)\ *п = \Л(п)\ \А\ Условия, при которых система п линейных однородных уравнений с п переменными имеет ненулевые решения. ТЕОРЕМА 6.5. Система п линейных однородных уравнений с п переменными имеет ненулевые решения тогда и только тогда, когда определитель матрицы системы равен нулю. Доказательство. Пусть дана система линейных однородных уравнений a11%+... + a1«^ = 0, (1) и А =||ацг\ — матрица этой системы. Система (1) имеет ненулевые решения в том и только в том случае, когда столбцы матрицы А линейно зависимы. Столбцы матрицы А линейно зависимы тогда и только тогда, когда |Л| = 0. 242
Следовательно, система (1) имеет ненулевые решения в том и только в том случае, когда |Л| = 0. ? "О СЛЕДСТВИЕ 6.6, Матричное уравнение А& = Г*1 где A<=Fn*n, SC = О , имеет ненулевые решения тогда и только тогда, когда |Л| = 0. Упражнения 1. Покажите, что ранг произведения матриц не превосходит ранга каждого сомножителя. 2. Пусть Л, Б—квадратные матрицы порядка п. Покажите, что уравнения АЗ? = В и «ЗГЛ = 5, где Э?— искомая матрица, неразрешимы, когда ранг матрицы В больше ранга матрицы Л. 3. Пусть Л, В—прямоугольные матрицы, имеющие одинаковое число строк, и С—матрица, получаемая из матрицы Л приписыванием к ней справа матрицы В. Докажите, что матричное уравнение ASV=-B, где J2T—искомая матрица, разрешимо тогда и только тогда, когда ранг матрицы Л равен рангу матрицы С. 4. Пусть Л.2Г = Б—-матричное уравнение, где .2Г—искомая матрица, и Л?о—какое-нибудь его решение. Докажите, что каждое решение матричного уравнения может быть записано в виде .ЗГо+ЗЛ где У — решение однородного уравнения Л2/ = 0, и обратно. 5. Найдите все комплексные матрицы, квадраты которых равны нулевой матрице. 6. Исследуйте уравнение «#ГЛ = 0, где Л—данная и ^—искомая матрицы второго порядка. 7. Найдите все комплексные матрицы второго порядка, квадраты которых равны единичной матрице. 8. Пусть Л и В — тхя-матрицы. Докажите, что г(А+В)^ =^г(Л) + г(Б)*>. 9. Пусть Л и Б—матрицы, имеющие одинаковое число строк, и С—матрица, получающаяся из Л приписыванием к ней всех столбцов матрицы Б. Докажите, что г (С) ^ г (Л)+г (Б). 10. Покажите, что если произведение АВ есть неособенная матрица, то матрицы Л и Б—также неособенные. 11. Пусть Л—неособенная квадратная матрица порядка п. Покажите, что для любой квадратной матрицы Б порядка п матрицы ABt В и В А имеют один и тот же ранг. 12. Пусть Л, Б—я х я-матрицы рангов г и s соответственно. Докажите, что г (АВ) ^r-\-s—n. 13. Докажите, что матрица I обратима тогда и только тогда, когда ad — ЬсфО. *} Здесь г (Л) —ранг матрицы Л# 243
14. Докажите, что если матрица Л=Н I обратима, то А 1 = 15. Докажите, что каждая треугольная матрица А (надполем^) с ненулевыми элементами на главной диагонали обратима и матрица Л~* треугольна. 16. Пусть Л, В — неособенные «х «-матрицы над полем У. Покажите, что равенства АВ = ВА, АВ~1 = В~1А, A^lB = BA-"h A~1B~l = = В^А"1 равносильны между собой. 17. Пусть Л—«г х «-матрица над полем 3:. Докажите, что: (a) существует такая п X m-матрица !%\ что 3?А = Е, где Е — единичная п х «-матрица, тогда и только тогда, когда ранг Л равен п; (b) существует «х«г-матрица такая, что Л2^ = ?, где Е —единичная т X /«-матрица, тогда и только тогда, когда ранг Л равен /п. 18. Пусть Л—треугольная /гX«-матрица (над полем ,F), у которой все элементы на главной диагонали равны единице. Пусть В = = Л-—?, где Е—единичная /г х «-матрица. Докажите, что: (a) ?"+i = 0; (b) матрица Л обратима и А~1 = (Е + В)~1 = Е-—В+В*—... ...+(—1)* В\ (c) (Е — В)-1 = ? + В + В* + ... + Дя 19. Пусть Л—треугольная матрица (над полем) с ненулевыми элементами на главной диагонали. Докажите, что матрица Л обратима. 20. Найдите условия, которым должна удовлетворять квадратная матрица с целыми элементами, чтобы все элементы обратной матрицы были целыми. 21. Пусть Л—квадратная л х «-матрица и Л*—матрица, присоединенная к Л. Докажите, что: (a) если Л —особенная матрица, то матрица А А* нулевая; (b) Л* = | Л ( Л^1, если Л—обратимая матрица; (c) Л* есть особенная матрица тогда и только тогда, когда матрица А является особенной; <d)|i4*|HA|»-i; (ё) если матрица Л симметрическая или кососимметрическая, то Л*—также симметрическая или кососимметрическая; (f) если Л—треугольная матрица, то Л*—также треугольная. 22. Пусть Л*—матрица, присоединенная к «X«-матрице Л, Докажите, что: (a) если ранг Л<«—Л, то Л* есть нулевая матрица; (b) если Л имеет ранг п—1, то ранг Л* равен 1; (c) если Л имеет ранг я, то ранг Л* равен п. 23. Пусть Л есть треугольная п X «-матрица над полем &. Докажите, что матрица Л обратима тогда и только тогда, когда отличны ог нуля все элементы матрицы Л, расположенные на главной диагонали.
Глава седьмая ВЕКТОРНЫЕ ПРОСТРАНСТВА § 1. ВЕКТОРНЫЕ ПРОСТРАНСТВА Понятие векторного пространства. Пусть eF —поле и F — его основное множество. Элементы множества F будем называть скалярами, a of— полем скаляров. Пусть V —непустое множество и FxV — прямое произведение множеств F и V. Пусть задано отображение ®:FxV-+V, ставящее в соответствие каждой паре (К а) из FxV единственный элемент множества V, который будем обозначать через Ixt и называть произведением скаляра Я и элемента а. Если фиксировать скаляр Я, то отображение со индуцирует отображение сол:{*}х1/->У, которое является ограничением ф на множество {X}xF. Отображение со^ при фиксированном % можно рассматривать также как одноместную (унарную) операцию V-*-Vt ставящую в соответствие каждому элементу а из V элемент Ка из V. Таким образом, ща = %а для любого а из V. Пример. Пусть оГ—поле, V—F" и Я —фиксированный элемент из F. Обозначим через co*, отображение V в V, ставящее в соответствие каждому вектору (а1э ..., ап) из Fn вектор (XoCi, ..., hxny из Fn, который называется произведением скаляра К и арифметического вектора (at, ..., ап). ОПРЕДЕЛЕНИЕ. Множество V с заданными на нем бинарной операцией + (называемой сложением) и операциями умножения элементов поля скаляров ff на элементы множества V называется векторным пространством над полем oF> если для любых а, Ь из V и а, ji из F выполнены следующие условия (аксиомы): 245
(1) алгебра (V, +> —)» ГДО — есть операция умножения на скаляр (—1) элементов из V, является абелевой группой; (2) (сф)а = сс(ра); (3) a(a + b) = aa + ab; (4) (а + Р)а = «а + (За; (5) Ьа = а. Векторное пространство с основным множеством V обозначается через ^Л Таким образом, векторное пространство 6VJ/° есть алгебра с основным множеством V, в котором бинарная операция + и унарные операции ш^ (умножение на скаляр к из F) суть главные операции, т. е. *F=(V, +, K|Xe=F}>; при этом главные операции удовлетворяют условиям (1)—(5), называемым аксиомами векторного пространства. Группа (V, +, —) называется аддитивной группой векторного пространства ®}Р. Нуль 0 этой группы называется нулевым вектором пространства ьх1/*. Элементы множества V назьюаются векторами векторного пространства *J/°. Векторы а и (—\) а являются взаимно противоположными. Примеры векторных пространств. 1. Пусть JFп — n-мерное арифметическое пространство над полем «f; еГл является векторным пространством над полем ef. Важные частные случаи: &т> <Мп, ^п. 2. Множество всех векторов плоскости есть векторное пространство над полем <М действительных чисел относительно операций сложения и умножения на действительные числа. 3. Пусть Fmxn — множество всех mxn-матриц над полем <У. Алгебра (Fmxn, +> {co^k^F}), где + есть операция сложения матриц и со^ —операция умножения матриц на скаляр К9 является векторным пространством над of. Его называют векторным пространством тхп- матриц над полем oF. 4. Множество всех отображений множества R в R является векторным пространством над полем <М относительно операций сложения отображений и умножения отображений на действительные числа. 5. Множество С всех комплексных чисел есть векторное пространство над полем <М относительно операций 246
сложения комплексных чисел и умножений их на действительные числа. Простейшие свойства векторных пространств. ТЕОРЕМА 7.1. Пусть *}Р'—векторное пространство над полем <У, а, Ье V и а, ре/7. Тогда (1) если а + Ь = а, то & = 0; (2) 0а = 0; (3) а-0 = 0; (4) если а + Ь = 0, то Ь = (—1)а = — а; (5) если аа = а& а афО, /по а = &; (6) если аа = 0, то а = 0 «ли а = 0; (7) если аа = ра и афО, то а = р. Доказательство. (1) Так как О — нуль аддитивной группы пространства ^ то # + 0 = #. Поэтому равенство а + Ь = а можно записать в виде а+Ь = а + 0. По закону сокращения (для групп), отсюда следует & = 0. (2) По аксиоме 4 векторного пространства имеем 0.а+0.а = (0 + 0)а = 0.а, т. е# о.а+0-а = 0-а. По свойству (1), отсюда следует, что 0а = 0. (3) По аксиоме (3) векторного пространства, аО + аО = а(0 + 0) = а-0, т. е. аО + аО = а-0. По свойству (1), отсюда следует равенство а-0 = 0. (4) Так как а + (—1)а = 0, то равенство а-\-Ь = 0 можно записать в виде а + Ь = а + (—\)а. По закону сокращения (для групп), отсюда следует Ь = {— \)-а. (5) При афО из аа = аЬ следует от1 (аа) = а~г(ab) и в силу аксиомы (2), а = Ь. (6) Так как а0 = 0, то равенство аа = 0 можно записать в виде сш = а-0. При афО, по свойству (5), отсюда следует, что # = 0. (7) Прибавив (— Ра) к обеим частям равенства аа = = ра, получим аа + (— Р)а = 0, (а — р)а = 0. При афО, по свойству (6), отсюда следует, что а — р = 0 и а = р. Линейная зависимость и независимость системы векторов. Пусть ^—векторное пространство над полем of. Система векторов аъ ..., ат пространства называется линейно зависимой, если существуют скаляры ^ ^»еЛ не все равные нулю, такие, что Я1а1+... + А,тат = 0. Система векторов а19 ..., ат пространства *)Р называется линейно независимой, если для любых скаляров 247
А!, ..., %m^F из равенства fc1o1 + ...+Xmaw = 0 следуют равенства Х1 = 0, ..., Хт = 0. Для произвольных векторных пространств остаются в силе: формулировки и доказательства свойств и теорем §5.1 о линейной зависимости и независимости систем (свойства 5.1.1 — 5.1.5, теоремы и следствия 5.1.2 — 5.1.5); определения и теоремы § 5.1 об эквивалентных системах векторов и их доказательства (теоремы 5.1.6 — 5.1.8); теоремы и предложения (и их доказательства) из § 5.1 о базисе и ранге конечной системы векторов (теорема 5.1.9, теоремы и предложения 5.1.10 — 5.1.15). Упражнения 1. Пусть У=%2—поле классов вычетов по модулю 2. Сколько векторов содержит векторное пространство ф=&п, ft-мерное арифметическое пространство над полем &"? 2. Пусть. Э:—поле скаляров и F2x2—множество всех 2х2-тлатриц над полем &. Покажите, что алгебра <F2X2, +, -. {«*l*eF}>, где + есть операция сложения матриц и ю^—операция умножения матриц на скаляр Я, есть векторное пространство над полем SF. 3. Пусть CR— множество всех отображений множества R действительных чисел в множество С комплексных чисел, Покажите, что алгебра <CR, +, -, {щ\К <=€}), Где + есть операция сложения функций, шд,—операция умножения функции на скаляр X, ((kf)(x) — if(x), ^еС) и — f=(— l)-f, является векторным пространством над полем комплексных чисел. 4. Пусть Rc есть множество всех отображений множества С комплексных чисел в множество R действительных чисел. Покажите, что алгебра <RC, +> -, {ofclbeR}), гДё + есть операция сложения функций и сод,—операция умножений на скаляр А,, является векторным пространством над пОлем ^ действительных чисел. 5. Пусть &—поле действительных чисел и $ —поле рациональных чисел. Покажите, что алгебра <R> +, -, K|^gQ}>, где + есть обычная операция сложения Действительных чисел и ©А, —обычная операция умножения на рациональное число Я,, является векторным пространством над полем $. 6. Пусть С—множество всех комплексных чисел и Q—множество всех рациональных чисел. Покажите, что алгебра <С, +, -, KUgQ}>, 248
где -f- есть обычное сложение комплексных чисел и %—операций умножения на скаляр К (на рациональное число Я), есть векторное пространство над полем $. 7. Пусть V есть множество всех дважды дифференцируемых действительных функций /:R->R, удовлетворяющих дифференциальному уравнению f'-\-f—0. Покажите, что алгебра <V, +, -. {0;J*€sR}>, где + есть операция сложения функций и ю^—операция умножения функции на скаляр (на действительное число), является векторным пространством над полем <э^. 8. Пусть V есть множество всех п раз дифференцируемых действительных функций /: R-*- R, удовлетворяющих условию (дифференциальному уравнению) fm +K-if(n-1) + .:+W+hf = 0> где f(k) есть k-я производная функции f и К0, ..., Яя_] е R. Докажите, что алгебра (V, + , —, {сод, | 1eR}>, где + есть операция сложения функций и со^—операция умножения на скаляр Л, является векторным пространством над полем е^. 9. Покажите, что система, состоящая из одного вектора, линейно независима тогда и только тогда, когда вектор ненулевой. 10. Докажите, что система двух векторов линейно зависима тогда и только тогда, когда один из векторов получается из другого умножением на скаляр. 11. Покажите, что векторы (а, Р), (у, 6) двумерного арифметического векторного пространства линейно зависимы тогда и только тогда, когда аб — Py = 0. 12,. Каким условиям должны удовлетворять скаляры а, р, у, чтобы система векторов (1, а, а2), (I, р, Р2), (1, 7» ?2) трехмерного арифметического векторного пространства над числовым полем У была линейно независимой? 13. Пусть ^—векторное пространство над числовым полем 3F. Покажите, что если векторы а, Ъу с пространства V линейно независимы, то векторы а + Ь, а + с, Ь-\-с также линейно независимы. Верно ли это, если поле скаляров SF состоит из двух элементов? 14. Пусть V/ — ^n есть n-мерное арифметическое пространство над полем &. Покажите, что система векторов а±9 ..., ат пространства V линейно независима тогда и только тогда, когда ранг тхп- матрицы со строками аь ..., ат равен т. 15. Покажите, что система ненулевых векторов аъ •••» dm век" торного пространства V линейно независима тогда и только тогда, когда а/г ф L (аь ..., dk-i) для всех k = 2, 3, ..., т. 16. Пусть &—конечное поле, состоящее из р элементов, и cffz-^:nt Сколько существует различных линейно независимых систем из k векторов (k < п) пространства V? 17. Пусть J2"—поле и А есть лхл-матрица над ^. Докажите, что при достаточно большом т система матриц Е> Л, А2, ..., Ат, где Е—единичная /i х w-матрица, линейно зависима над полем 3?. 18. Пусть ai flmeQ. Докажите, что система векторов. аъ ..., ат линейно независима в пространстве (dffin тогда и только тогда, когда она линейно независима в пространстве ®р>. 19. Пусть ^" — конечное поле, состоящее из р элементов. Сколько различных fc-мерных подпространств (k<.n) имеет векторное пространство &п? 249
§ 2. ПОДПРОСТРАНСТВА ВЕКТОРНОГО ПРОСТРАНСТВА Подпространство. Пусть 6*J/D— векторное пространство над полем qF и U d V. Множество U называется замкнутым в *)Р9 если оно замкнуто относительно главных операций *1Р, операций сложения и умножения на скаляры, т. е. для любых а, Ь из О и любого ^ из Fa + 6e(/ и ha^U. ОПРЕДЕЛЕНИЕ. Подпространством векторного пространства *)Р называется любая подалгебра пространства *J/°, рассматриваемого как алгебра. Пусть G1/D=(y, +, {со*, | X е F}) — векторное пространство над gF. Пусть # —подалгебра пространства ^/° и ?/ — его основное множество. Тогда {/ — непустое подмножество множества V, замкнутое в *1Р. Пусть 0 и оз( — ограничения главных операций « + » и со^ пространства J^ множеством ?/, т. е. а@Ь = а + Ь для любых а, Ь из С/, ш?а = <од,а == %# Для любого а из ?/; тогда (1) » = <[/, ©, К|Яе=,Р}>. Однако вместо записи (1) обычно пишут # = <[/, +, {co^esF}). Отметим следующие свойства подпространств. СВОЙСТВО 2.1. Если 612/э— векторное пространство над полем <У, то любое его подпространство является векторным пространством над ©Г. СВОЙСТВО 2.2. Если W* — подпространство векторного пространства U uU — подпространство векторного пространства ^, то УУ является подпространством пространства G4fJ. Пересечением подпространств 21 ъ ..., 21т векторного пространства *J/° называется подпространство *1Р с основным множеством U± П U2 П ». • • > П ^т- Аналогично определится пересечение бесконечного множества подпространств пространства ^ СВОЙСТВО 2.3. Пересечение любого множества подпространств векторного пространства *)Р является подпространством пространства v. Свойства 2.2 и 2.3 следуют из теорем 3.1.7 и 3.1.9 соответственно. Линейная оболочка множества векторов. Пусть {аг, ... ..., ап] — конечное множество векторов векторного про- 250
странства *i/°. Вектор ^1a1+... + ?v^^ называется линейной комбинацией векторов а19 ..., ап с коэффициентами из F. ОПРЕДЕЛЕНИЕ. Множество {Мх+... + ^^l^,... ..., Кп е F} всех линейных комбинаций векторов аъ ..., ап с коэффициентами из F называется линейной оболочкой векторов av ..., ап и обозначается через L (аъ ..., ап). Легко видеть, что лийейная оболочка векторов замкнута в ^1/°, т. е. замкнута относительно всех главных операций пространства *\Р (сложения и умножений на скаляры). ОПРЕДЕЛЕНИЕ. Подпространство векторного пространства *J/° с основным множеством L (аг, ..., ап) обозначается через ЗБ (а1у..., ап) и называется подпространством, натянутым на векторы а1у ..., ап, или подпространством, порожденным векторами аъ ..., ап. ОПРЕДЕЛЕНИЕ. Линейной оболочкой множества М, MaV, называется совокупность L(M) всех линейных комбинаций векторов из М с коэффициентами из F. Линейной оболочкой пустого множества называется множество {0}. Линейная оболочка множества М замкнута в *ЧР. ОПРЕДЕЛЕНИЕ. Подпространство пространства *J/° с основным множеством L(M) обозначается через 35(М) и называется подпространством, натянутым на множество М, или подпространством, порожденным множеством М. Сумма подпространств. Пусть 21ъ ..., ^ — подпространства векторного пространства *J/° и Ul9..., Um — их основные множества. Множество обозначается через иг + ... + ит. Легко проверить, что это множество замкнуто в пространстве *\Р. ОПРЕДЕЛЕНИЕ. Подпространство пространства *ЧР с основным множеством ?/i+... + ?/m называется суммой подпространств Ux, ..., #m и обозначается через Z^-f... Отметим следующие свойства суммы подпространств, легко вытекающие из ее определения. СВОЙСТВО 2.4. Если 35 и #•—подпространства векторного пространства *J/°, то U-\-3S = 35 + U. СВОЙСТВО 2.5. Если <5?, #, ^-подпространства векторного пространства *Т, то <#+(#+^)=(<#+#)+^. 251
СВОЙСТВО 2.6. Если ^ — подпространство пространства U, то X + U = U. Пусть 3?ъ ..., Хт — подпространства векторного пространства *№. ОПРЕДЕЛЕНИЕ. Сумма ЗБХ +... + %т называется прямой суммой подпространств 3?ХУ ..., Хт и обозначается через ^10...©^, если любой вектор а из Lx+... + Lm можно единственным образом представить в виде а = ах+...+ат, где ax(=Lx, .,., am<=Lm. Другими словами, сумма «2?!+... + 35 т называется прямой, если для любых аъЬх из Lx, ..., атуЬт из Lm равенство #1 + --- + Ят = &1+--- + &,71 влечет равенства #! = &!, ... • • • > #W == ^m» ТЕОРЕМА 2.1. Сумма подпространств 35 \\U векторного пространства является прямой тогда и только тогда, когда L{]U = {Q}. Доказательство. Предположим, что %-\-U=l s=«S?02f. Тогда для любого элемента с из L П U верно равенство с + 0 = 0 + с, из которого следует равенство ? = 0, так как сумма 35-\-U прямая. Следовательно, L(]U = {0}. Предположим теперь, что L{]U = {0}. Для любых векторов аи Ьх из L и #2, &2 из U равенство ах + а2= = &i + *2 влечет соотношения ах — bx=a2 — b2^L(] U= {0}, поэтому ах = Ьх и а2 = &2. Следовательно, сумма «3? + ^ является прямой. П ТЕОРЕМА 2.2. Сумма подпространств 35х,...,?т векторного пространства является прямой суммой, если для любых векторов ах из Lx, ..., ат из Lm равенство (1) ах+... + ат = 0 влечет равенства (2) ах = 0, ..., ат = 0. Доказательство. Предположим,чтосуммас5?1+...+^?т прямая. Тогда из равенства (1), которое можно записать в виде ах +... + ат = 0+...+ 0, следуют равенства ах=0,... .-,Ят = 0. Предположим теперь, что для любых векторов ах> ..., ат соответственно из Ll9 ..., Lm равенство (1) влечет равенства (2). Каковы бы ни были векторы bXi сх из Lx, ... ..., Ьт9 ст из Lm, равенство (3) Ь1 + ... + Ьт = сг + ...+ ст 252
влечет (b1 — cl) + ... + (bm — cm) = 0, из которого, по условию, следуют равенства Ьг —?i = 0, ..., Ът — ст = 0. Таким образом, из (3) следуют равенства Ь1 = С\, • • • > Ьт = Ст. Следовательно, сумма Зг + ... +3!т является прямой, ? Линейные многообразия. Пусть 3? — подпространство векторного пространства *V* и L —его основное множество. На множестве V определим бинарное отношение ^, считая, что а г^Ь тогда и только тогда, когда a — b^L. Назовем это бинарное отношение отношением сравнения по 3. ПРЕДЛОЖЕНИЕ 2.3. Отношение сравнения на множестве V по 3 является отношением эквивалентности на V. Доказательство. Отношение сравнения по X, очевидно, рефлексивно. Отношение по 3 симметрично, так как из a — b^L следует b — a^L. Отношение сравнения по 3 транзитивно, так как для любых a, b, c^V из a — b^L и b — c^L следует, что а — с = (а — Ь) + + (Ь — с) е L. Следовательно, отношение сравнения по 3 является отношением эквивалентности на множестве V. П Отношение эквивалентности ^ на У определяет разбиение множества V на классы эквивалентности. ОПРЕДЕЛЕНИЕ. Пусть 31 — подпространство векторного пространства "У*3. Любой класс эквивалентности отношения сравнения по 31 называется линейным многообразием пространства *!/* с направлением 3. Пример. Множество всех решений совместной системы линейных уравнений с п переменными является линейным многообразием с направлением 3 n-мерного арифметического векторного пространства, где ^ — пространство решений соответствующей однородной системы уравнений. Из приведенного выше определения вытекают свойства 2.7ии 2.8. СВОЙСТВО 2.7. Два вектора векторного пространства *\Р принадлежат одному и тому же линейному многообразию с направлением 3 тогда и только тогда, когда их разность принадлежит L. СВОЙСТВО 2.8. Любые два линейных многообразия векторного пространства *)Р с направлением 3 либо совпадают, либо не пересекаются. Объединение всех линейных 253
многообразий пространства *1Р с направлением X равно множеству V. Обозначим через а + L {а <= V) множество {а + х | х е L}. СВОЙСТВО 2.9. ?&ш Я — линейное многообразие векторного пространства *J/° с направлением X и а^Н, то H = a+L. Доказательство. Так как любой"элемент множества a+L сравним с а по X, то a + LczH. Кроме того, любой элемент с из Я сравним с а по X, т. е. с — я е L и cea+L, Поэтому Я cza+L. Следовательно, Н = а + + L. ? СЛЕДСТВИЕ 2.4. ?Ъш а и Ь —элементы одного и того же линейного многообразия пространства ^ с на- правлением X, то a + L = b + L. СЛЕДСТВИЕ 2.5. Если X Н6^ и с —любой элемент пространства ®1Р, то c + L является линейным многообразием пространства ^° с направлением 35. СВОЙСТВО 2.10. Пусть 35 и U — подпространства векторного пространства °Т и а, йеУ. Включение a+Lczb + U имеет место тогда и только тогда, когда a — b^U и LczU. Доказательство. Предположим, что a + Lczb + U. Тогда a^b + U, a — b^U и a + U =b + U, поэтому a + Lcza + U и LczU. Предположим теперь, что выполнены условия а — &е el/, LczU. Тогда a+U=b+U и a + Lcza + U\ следовательно, a + L czb + U. ? СВОЙСТВО 2.11. Пересечение линейных многообразий a + L и b+U векторного пространства не пусто тогда и только тогда, когда a — b^L + U. Доказательство. Предположим, что пересечение a + L{\b + U не пусто и с — элемент пересечения. Тогда с = #+/ = & + #, где /gL и »е?/; поэтому а — Ь — = —1 + и и a — b<=L + U. Предположим теперь, чтоa — b^L + U. Тогда а — Ь = = v + u, где tf<=L, йе[/,и а + (—v) = b + u. Следовательно, многообразия a + L и & + ?/ имеют общий элемент Ь + и. ? СВОЙСТВО 2.12. ?ош пересечение линейного многообразия с направлением X и линейного многообразия с направлением U не пусто, то оно является линейным многообразием с направлением 35 [\U. Доказательство. Предположим, что пересечение многообразий a + L и b + U не пусто и с — их общий 254
элемент; тогда a + L = c + L, b+U=c+U и a + L[]b + U = c-\-L{\c-\-U. Легко проверить, что c + L[\c+U = c + {L[\U). Следовательно, a+L(]b + U = = c(L П U), т. е. пересечение двух рассматриваемых многообразий есть линейное многообразие с направлением Х{\ (\ге. п СВОЙСТВО 2.13. Если векторное пространство °У* есть прямая сумма подпространств 56 и 21, то пересечение линейного многообразия с направлением X и линейного многообразия с направлением U содержит только один элемент. Доказательство. Пусть б*2/°=с5?0#, тогда V = = L + f/, L(\U = {0}. Пусть a + L и b + U — линейные многообразия с направлениями X и U соответственно. По свойству 2.11, их пересечение не пусто, так как «-6еУ = — L + U. Пусть с — общий элемент пересечения. По свойству 2.12, отсюда следует, что a+L f[b + U = c + (L(]U) = = * + {0} = с.П Упражнения 1. Каждое из следующих условий выделяет некоторое множество векторов (xlf ...,хп) векторного пространства V, = ^'n. Какие из этих множеств замкнуты в V относительно сложения и умножений на скаляры: (a) хг + х2 + ...+хп=0\ (b) *1+*а + ...+*я = 1 (c) Х1—х2 — ...—хЛ=Ъ (e) % = 1; (f) Xl=xn=*0; (g) *i •**=<>; (d) xn = Q; (h) A^xg = ...=*„? 2. Пусть 2? = ,^л*л~ векторное пространство всех лхл-матриц над полем. Покажите, что множество всех симметрических (кососим- метрических) матриц пространства V есть подпространство пространства V относительно сложения и умножений на скаляры. 3. Пусть v,=^'nxn над числовым полем ^, if—-подпространство всех симметрических /гхл-матриц и # — подпространство всех косо- симметрических матриц. Докажите, что V = X'©#. 4. Пусть V есть векторное пространство (над <&) всех трижды дифференцируемых функций /: R-^R, удовлетворяющих условию ////-|-// = 0. Покажите, что множество всех функций пространства, удовлетворяющих условию /"+/==0, образует подпространство пространства W- 5. Пусть W=*<&2X2—векторное пространство 2х2-матриц над полем е^ действительных чисел. Покажите, что множество всех матриц наде^5 вида образует подпространство пространства V. 6. Пусть а1У ..., а#, bi ..., bs—векторы векторного пространства V. Докажите, что L(alt ..., ak) + L(bi, ..., bs) = L(av ..., aki Ьъ ..., bs). 255
7. Докажите, что пересечение любого множества подпространств векторного пространства V является подпространством пространства V- 8. Пусть X и U—подпространства векторного пространства W. Докажите, что X+U есть пересечение всех подпространств пространства V, содержащих подпространства X и U. 9. Пусть а, Ь, с—векторы, удовлетворяющие условию а+КЬ + + ??=0, где Я., ?—ненулевые скаляры. Покажите, что L(a> Ь) — = L (Ь, с) = Цс, а). 10. Пусть векторы а, Ь линейно независимы. Покажите, что Х(а, Ь)=Х(а)®Х(Ь). 11. Пусть система векторов а, &, с линейно независима. Докажите, что X (а, &, ??)=<3? (а) ©«5? (&)©#(*). 12. Покажите, что если вектор Ь есть линейная комбинация векторов #i, ..., ат, то L^, ..., am) = L(al9 ..., ат, &). 13. Предположим, что векторное пространство j? порождается подпространством U и вектором а. Покажите, что если &еУ\(/, то V^U®X(b). 14. Пусть V есть сумма подпространств X ъ 21. Покажите, что yy=zX ® U, если хотя бы один вектор сеУ можно однозначна представить в виде с = а-\-Ь, где а е= L, 6 е= ?/. 15. Пусть 2Г есть прямая сумма подпространств j? и Z^. Покажите, что если ai, ..., ат есть линейно независимая система векторов подпространства jjf, a #i, ... , bs—линейно независимая система векторов из #, то al9 ..., а/7г, 6Х» •••> &s есть линейно независимая система векторов пространства W. 16. Пусть векторное пространство °ff есть сумма подпространств Хъ Х2> Xs. Докажите, что W*=Xi(&X2®X9 Т0ГАа и только тогда, когда ^П^2 = 0 и (^ + 12)П^з = 0. 17. Пусть ^ = ^"я, где ^—поле скаляров, состоящее из двух элементов, и &lf ..., 6/и— линейно независимая система векторов пространства V. Сколько векторов имеет линейная оболочка L(blt ... ..., bm) этих векторов? § 3. БАЗИС И РАЗМЕРНОСТЬ ВЕКТОРНОГО ПРОСТРАНСТВА Базис векторного пространства. Пусть ^—векторное пространство с основным множеством V. Если существует в V такое конечное множество {аъ ..., ат) векторов, что V = L(aly ..., ат), то говорят, что пространство *1Р порождается конечным множеством {alt ..., ат}, и это множество называется множеством (или системой) образующих пространства *)Р. ОПРЕДЕЛЕНИЕ. Векторное пространство называется конечномерным, если оно порождается конечным множеством векторов. ОПРЕДЕЛЕНИЕ. Базисом конечномерного векторного пространства называется непустая конечная линейно независимая система векторов, порождающая это пространство. 25§
Пример, Пусть 6^)=<2ГЛ —арифметическое векторное пространство над полем вГ. Система единичных векторов ^ = (1, 0, ..., 0), ..., *я = (0, 0, ..., 0, 1) линейно независима и порождает пространство *]Р, т. е. V = L{ei9 ..., еп). Следовательно, система векторов е19 ... ..., еп является базисом пространства <Уп. ТЕОРЕМА 3.1. Любое ненулевое конечномерное вектор- те пространство обладает базисом. При этом если система векторов (1) alt ..., ат порождает векторное пространство ®\Р, то базис системы векторов (1) является базисом пространства *)Р. Доказательство. Предположим, что пространство ®1Р порождается системой векторов (1), т. е. V = Ь(аг, ... ..., ат)\ мы можем считать, что векторы системы (1) ненулевые. По теореме 5.1, система (1) обладает базисом. Пусть (2) Ъ19 ..., Ъп — базис системы (1). Тогда система (2) также порождает пространство *J/°, т. е. V = L(bl9 ..., bn). Кроме того, система (2) линейно независима. Следовательно, система (2) —базис системы (1) —является базисом пространства пг. U ТЕОРЕМА 3.2. Пусть ^—конечномерное ненулевое векторное пространство. Тогда число элементов одного базиса пространства *1Р равно числу элементов любого другого базиса этого пространства. Доказательство. По теореме 3.1, пространство °Т обладает базисом. Пусть (l)*i, .... Ъп — один базис пространства *1Р и (2) C\i ..., Cs — любой другой базис этого пространства. Тогда V = = L (blf ..., bn) = L (cl9 ..., cs)' Поэтому системы векторов (1) и (2) эквивалентны. Кроме того, каждая из этих систем линейно независима. Следовательно, по теореме 5.1.2, n = s. ? СЛЕДСТВИЕ 3.3. Если базис векторного пространства ^iJ° состоит из п элементов, то при k>n любая система k векторов пространства ®iP линейно зависима. 257
Доказательство. Если bu ..., &„ —базис пространства *ЧР и av ..., ak — любые векторы из У, то аи ..., ak^L{blf ..., bn). По теореме 5.1, отсюда при k > п следует, что система векторов av ..., aft линейно зависима. П СЛЕДСТВИЕ 3.4. Если базис векторного пространства *1Р состоит из п векторов, то любая система п векторов, порождающая пространство *1Р, является базисом этого пространства. ТЕОРЕМА 3.5. Любое подпространство 21 конечно- мерного векторного пространства ")Р является конечномерным. Если *\Р обладает базисом, состоящим из п элементов, и U —ненулевое подпространство, то 21 обладает базисом и число элементов его базиса меньше или равно п. Доказательство. Пусть ^—конечномерное векторное пространство и U — его подпространство. Если # —нулевое подпространство, то оно конечномерно. Предположим, что подпространство U ненулевое. Тогда пР— ненулевое пространство и, по теореме 3.1, обладает базисом. Предположим, что базис пространства °У" состоит из п элементов. Тогда любая линейно независимая система векторов пространства *V* содержит не более п элементов. Пусть их — ненулевой элемент пространства 21. Если UфЬ(а1)у то существует вектор u2^U — L(u1), причем система векторов иъ и2 линейно независима. Если U Ф ФЬ(и19 и2), то существует вектор uz^U\L{uly я2)> причем система векторов иъ и2, и3 линейно независима. Продолжая аналогичным образом, мы получим последовательность (1) иъ я2, й3, ... линейно независимых элементов пространства 21. Эта последовательность содержит не более п элементов. Следовательно, существует такое натуральное число т^п (т>0), что t/ = L(«1, ..., ит). Таким образом, подпространство 21 конечномерно и система векторов кх, ..., ит является его базисом. ? Дополнение независимой системы векторов до базиса. Возникает вопрос о возможности включения любой линейно независимой системы векторов в какой-нибудь базис. ТЕОРЕМА 3.6. Линейно независимую систему векторов ненулевого конечномерного векторного пространства IP, 258
не являющуюся базисом пространства, можно дополнить до базиса пространства ^р. Доказательство. Пусть (1) av ..., ат — линейно независимая система, не являющаяся базисом пространства °1/J. Пусть &!,..., Ьп — базис пространства *р°. Рассмотрим систему (S)ax, ..., ат, Ь19 ..., Ьп. По следствию 3.3, эта система линейно зависима. Поэтому хотя бы один из векторов bv ..., Ьп есть линейная комбинация предшествующих ему векторов в системе (S). Вычеркнем один из таких векторов из системы (S); получим систему (S±) al9...9am &<*>, ....fttfLi. эквивалентную системе S и поэтому порождающую пространство °^J. Если Sjl содержит более п элементов, то (по следствию 3.3) она линейно зависима и, значит, один из элементов 6^, ..., ft^Li является линейной комбинацией предшествующих элементов. Вычеркнем этот элемент из Sx. Получающаяся при этом система S2 эквивалентна системе S и поэтому порождает пространство ^j/0. Продолжая этот процесс, после т вычеркиваний мы получаем систему п векторов (Sm) аъ ...,ат, ftf), ...,6<Tim, эквивалентную системе S и поэтому порождающую пространство °yj. По следствию 3.4, система Sm является базисом пространства °VJ. Так как система Sm содержит исходную систему (1), то система Sm является искомым базисом пространства ьр°. ? ТЕОРЕМА 3.7. Если % —подпространство конечномерного векторного пространства °У, то существует такое подпространство ш пространства ^J/3, что (1) *)Р=и<§)У?. Доказательство. Равенство (1) верно, если U — тривиальное подпространство, т. е. нулевое или совпадающее с 6yj. Предположим, что # —нетривиальное подпространство и (2) аъ ..., ат 259
— его базис. По теореме 3.6, систему (2) можно дополнить до базиса пространства bTJ, т. е. существуют такие векторы tf«+i» ..., ап, что система (3) CL-jj ... , Umy #m+l» • • • > &п является базисом пространства ^°. Тогда (4) V = U + W9 где W = L(am+1, ..., ап). Докажем, что (b)U(\W = {0}. Действительно, если с^U ()W, то *«=о1а1+...-\-amam<=U, c = am+1amn+...+anan<=W и поэтому а1а1+... + атат + (—ат+1)ат+1+... + (—ап)ап = 0. В силу линейной независимости системы (3) следует равенство нулю всех коэффициентов, в частности ах = 0, ... • ••> ат = 0. Следовательно, с = 0, т. е. выполняется (5). На основании (4) и (5) заключаем, что при W = = c5f(am+1, ..., ап) имеет место равенство (1). ? СЛЕДСТВИЕ 3.8. Если система (3) есть базис пространства *У*9 то ^=Х(а19 ..., ат)0«(аш+1, ..., ап). Размерность векторного пространства. Одним из самых важных инвариантов векторного пространства является его размерность. ОПРЕДЕЛЕНИЕ. Размерностью ненулевого конечномерного векторного пространства называется число векторов какого-либо базиса пространства. Размерность нулевого векторного пространства считается равной нулю. Размерность векторного пространства обозначается через dim6^/0. Пример. Пусть вГя — арифметическое векторное пространство над полем оГ. Векторы ?i = (l, 0, ..., 0), е2 = (0, 1, 0, ..., 0), ..., еп = (0, 0, ..., 0, 1) образуют базис пространства. Следовательно, dimoFn = n. Рассмотрим некоторые свойства размерности. СВОЙСТВО 3.1. Если ^ — конечномерное векторное пространство и dim^^n, то при k>n любая система k векторов пространства °1Р линейно зависима. Доказательство. Если я = 0, то ^ — нулевое пространство и свойство 3.1 выполняется. Если же 260
dim*iP = n>09 то базис пространства ®)Р состоит из п векторов. По следствию 3.3, отсюда следует, что при k > п всякая система k векторов пространства *J/° линейно зависима. ? СЛЕДСТВИЕ 3.9. Если dim <31f = n и система векторов bl9 ..., Ьт пространства *V* линейно независима, то т^п. СВОЙСТВО 3.2. Если % —подпространство конечномерного векторного пространства ^, то (1) dim^^dim6^. Доказательство. Неравенство (1), очевидно, верно, если 22 есть нулевое подпространство. Если же подпространство 21 ненулевое, то (по теореме 3.5) оно конечномерно и (по теореме 3.1) обладает базисом. Пусть bl9..., Ьт — базис пространства U. Тогда dim 22 = т. В пространстве *1Р система векторов bl9 ..., Ът линейно независима. Поэтому, поо следствию 3.9, т^п. ? СВОЙСТВО 3.3. Если % —подпространство конечномерного векторного пространства и dim 22 = dimG*2/D, то 7l = *V> Доказательство. Если подпространство 71 нулевое, то dim 22 = 0. Тогда в силу условия dirn6l2/D = 0. Поэтому <5^/э — также нулевое векторное пространство. Следовательно, 22 = 4?. Предположим, что 21 — ненулевое подпространство. Тогда оно, так же как и ^]Р9 конечномерно и, по теореме 3.1, обладает базисом. Пусть bt9 ...,&„—-его базис. Тогда dim 22 = п и, по условию, dim6Wip = /z. Поэтому система bl9..., bn является также базисом пространства ^J/0. Следовательно, # = 6У\ ? СВОЙСТВО 3.4. Если конечномерное векторное пространство *}Р есть прямая сумма подпространств 22 и X, то (1) dim°T = dim# + dimc§?. Доказательство. По условию, &1Р = 22@Х и, значит, (2){/fU = {0}, (3) V = U + L. Если 22 или X — нулевые подпространства, то равенство (1), очевидно, верно. Предположим, что 22 и X — ненулевые подпространства. Пусть (4) &!,..., Ьш (5) #m+l> . 261
— базисы пространств 21 и X соответственно. Докажем, что система (6) &!,..., bm, #m+1,..., bm+s является базисом пространства *}Р. Ввиду (2) (7) L(bl9...,bm){\L(*W..., bn*s) = {0}. Система (6>) линейно независима. Действительно, для любых скаляров %if..., Xm+s из равенства в силу (7) следуют равенства (8) ftx&! + ...+ AOT&m = 0, ^m+i&m+l + --- + ^m+5&m+5 = 0, а так как системы (4) и (5) линейно независимы, из (8) следует, что Кх = 0,... Дт = 0,..., Ят+<у = 0. Далее, в силу (3) = L (иi9... , #m, #ш+1> • • • > bm+s)> т. е. система (6) порождает пространство *J/°. Итак, доказано, что система (6) есть базис пространства бУ). Следовательно, dim ^ ==/# + $ = dim # +dim сЗ?. П Теорема ЗЛО. Если векторное пространство *1Р есть сумма конечномерных подпространств 21 и 56, то (1) dim (#+i?) + dim (и П c3?) = dim# + dimc?. Доказательство. Предположим, что (2) *V = u+X. Если U П L = {0}, то сумма (2) прямая; следовательно, по свойству 3.4, теорема верна. П Предположим, что U П ЬФф. Тогда пространство 21 П «3?, так же как и #, конечномерно. Пусть (2) &!,..., &, — базис пространства 21 [\Х. Дополним его до базисов пространств U и «5?. Пусть (3) &!,...., fttf, &5+1,..., Ьт — базис пространства 21 и (4) их,..., &*, &m+1,..., bm+k 262
— базис пространства X. Тогда (5) dim(#n^) = s, dim#=/w, dim?=s+k и (6) U = L (&х, ..., bm)t L = L (&!, ..., bS9 bmH, ..., bm±k). На основании (4) и (6) заключаем, что V = ?/ +L = L (&х, ..., 6m, 6m+i ..., bm+k)9 т. е. система (7) bl9 ... , 6m, &m+l> • • • > &m-bfc порождает пространство ^J/3. Покажем, что система (7) линейно независима. Предположим, что (8) Я1&1+.. .+Xsbs+.. .+^m&m+^m+l6m+i+.. .+?Wwfc&m+* = 0. На основании (6) и (8) заключаем, что ^W+i&m+l + • • • + ^т^Фт+к ^ ^ П ^ и, значит, ^m+i&m+i +... + km+kbm+k e L (6x, ... , 6^). В силу линейной независимостд системы (5) отсюда следует, что (9) Xm+1 — 0f ..., Xm+k = 0. Из (8) и (9) следует равенство Kbl + --- + kmbm = Q. Ввиду линейной независимости системы (3) следуют равенства ^ = 0, ...,Ят = 0. Итак, установлено, что система (7) линейно независима. Таким образом, система (7) есть базис пространства ^ и (10) dim (U + X) = m + k. Ввиду (5) и (10) dim (U +cS?)+dim (21f]«#)=m+?+s=dim #+dim Х. П Упражнения. 1. Покажите, что система векторов (а, Р), (у, б4) двумерного арифметического векторного пространства V тогда и только тогда является базисом пространства V, когда аб — fiyzjtQ. 263
2. Покажите, что система векторов (1,1, 1), (0, 1, 1), (1, 0, 1) есть базис пространства у = &'*> Найдите координатные строки единичных векторов ?i=(l, 0, 0), ?2 = (0, 1, 0), е3=(0> 0, 1) относительно этого базиса. 3. Покажите, что для любых скаляров а, р, у система векторов (1, а, Р), (0, 1, -у)» (0» 0» *) является базисом пространства 2Г = ^3. 4. Пусть У—числовое поле. Каким условиям должны удовлетворять скаляры а, р, yef, чтобы система векторов (1, а, а2), (Ь Р> Р2)> (1> V» У2) была базисом пространства ^3? 5. Каким условиям должен удовлетворять скаляр А,, чтобы система векторов (Я, 1, 0), (1, Л, 1), (0, 1, Я) была базисом пространства ^?3; пространства $3? 6. Пусть векторное пространство V есть прямая сумма конечномерных подпространств Хг и ^а» Покажите, что в результате приписывания базиса подпространства «5?2 к базису подпространства %г получается базис пространства V» 7. Пусть 3*—поле, состоящее из двух элементов. Сколько различных базисов имеет пространство З*3? 8. Пусть V есть л-мерное векторное пространство. Докажите, что система векторов аь ..., ап есть базис пространства V тогда и только тогда, когда Ф=<5б(аъ ..., ап). 9. Пусть w=yn*n —векторное пространство ягхл-матриц над полем 3:. Найдите его базис и размерность. 10. Пусть V — ненулевое конечномерное векторное пространство. Докажите, что размерность подпространства X (аь ...» ат) натянутого на данные векторы alf ..., ат пространства ^°, равна рангу матрицы, составленной из координатных строк данных векторов в каком-нибудь базисе. И. Докажите, что система аь ..., ап ненулевых векторов «-мерного векторного пространства $ тогда и только тогда является базисом пространства W, когда ak^L (аь ..., а^_х) для /г = 2, 3, ..., п. 12. Пусть ^-—конечное поле, состоящее из р элементов, и w=&'n. Сколько различных базисов имеет векторное пространство V? 13. Пусть аъ ..., ап—базис векторного пространства V и k—целое положительное число, меньшее п. Докажите, что W=3S (alt..., dk) © ®<5?(a*+i, ...,an). 14. Пусть въ ...» en—стандартный базис векторного пространства ^ = ^4 .Покажите, что система векторов а±, ..., ап пространства V тогда и только тогда является базисом пространства V, когда eL,..., en(=L(ai,..., ап). 15. Докажите, что если сумма размерностей двух подпространств л-мерного пространства больше л, то эти подпространства имеют общий ненулевой вектор. 16. Докажите, что векторное пространство V имеет только два подпространства тогда и только тогда, когда пространство V одномерное. 17. Докажите, что двумерное векторное пространство над числовым полем имеет бесконечное множество различных одномерных подпространств. 18. Пусть У = 21@36, где "^—трехмерное пространство и U, ^ — ненулевые подпространства, отличные от V- Покажите, что одно из подпространств U, 35 есть одномерное, а другое—двумерное. 19. Пусть ьб и U — различные одномерные подпространства двумерного векторного пространства V* Докажите, что 2Р—<#©#* 264
20. Пусть «5? и U—различные двумерные подпространства трехмерного векторного пространства W. Докажите, что V=^X-{-U и X(]U есть одномерное подпространство. 21. Пусть X и U—подпространства n-мерного векторного пространства W, имеющие размерности к и s соответственно. Докажите, что: (a) если Lf]V={0} и k+s = n, то <&--=%®#; (b) если W=<e + U и k+s = n, то V = jS®U. 22. Докажите, что я-мерное векторное пространство при п > 1 можно представить в виде прямой суммы п одномерных подпространств. 23. Пусть Ьи ..., Ьп—базис векторного пространства V- Покажите, что W=%(bL)@...@%(bn). 24. Пусть ^=с55\-т-с^2+сЗ$з> где %ъ X2, %з—подпространства n-мерного пространства V, имеющие размерности г, s, t соответственно. Докажите, что *&~?\®%ъ®%ъ тогда и только тогда, когда r-\-s-{-t=n. § 4. ИЗОМОРФИЗМЫ ВЕКТОРНЫХ ПРОСТРАНСТВ Координатная строка вектора относительно данного базиса. Пусть ^—векторное пространство над полем gF ТЕОРЕМА 4.1. Пусть (1) Ь19 ...,&* — базис векторного пространства 0%VJ. Для каждого вектора а из V существует в Fn единственный арифметический вектор (ах, ..., ап) такой, что (2) а = аА+...+аА. Доказательство. Так как система векторов (1) порождает пространство °У", то любой вектор а из V можно представить в виде линейной комбинации векторов системы^)—в виде (2). Такое представление единственно. В самом деле, если * = PA + ...+PiA» (P*e=F) — любое представление а в виде линейной комбинации векторов системы (1), то В силу линейной независимости системы (1) отсюда вытекают равенства <*1 —Pi = 0, ..., аЛ — рл = 0 и а1 = р1, ..., аЛ = рЛ. Следовательно, вектор а обладает единственным представлением в виде линейной комбинации векторов базиса (1). ? 265
ОПРЕДЕЛЕНИЕ. Пусть bl9 ..., ^ — фиксированный базис пространства *)Р9 agI/и а = а1&1+...+ая&л, где al9 ..., ап е F. Коэффициенты а1? ..., ап называются координатами вектора а относительно фиксированного базиса. Вектор (а1у ..., ап) е Fn называется координатной [«Л строкой, а вектор ": — координатным столбцом век- тора а относительно фиксированного базиса. Изоморфизм векторных пространств. Отображением векторного пространства U в *)Р называется отображение множества U в V. ОПРЕДЕЛЕНИЕ. Отображение векторного пространства U на векторное пространство *V* называется изоморфизмом, если оно инъективно и удовлетворяет условиям линейности: f(a+b)=f(a)+№, ПЩ = Ща) для любых a, b из U и любого % из F. Векторные пространства U и *#° называются изоморфными, если существует изоморфизм # на *J/°. Другими словами, отображение / векторного пространства U и *#° называется изоморфизмом, если оно инъективно и сохраняет главные операции пространства 219 рассматриваемого как алгебра. Запись U^V означает, что векторные пространства U и ЬУ° изоморфны. ТЕОРЕМА 4.2. Пусть ^ — n-мерное векторное пространство над полем & и п>0. Тогда пространство *JP изоморфно арифметическому векторному пространству Jrn. Доказательство. Пусть (1) Ь19...9ЬЯ — фиксированный базис пространства 9V>. Пусть f:V-+ F* — отображение, ставящее в соответствие каждому вектору а из V его координатную строку f(a) относительно фиксированного базиса. Пусть (у19 ..., уп) — произвольный вектор из Fn. Вектор vA+- • -+Y/Ai является его прообразом при отображении /. Следовательно, / есть отображение V на Fn. Кроме того, по теореме 4.1, для любых a, b из V, если /(#) = /(&), то а = Ь. Следовательно, / является 266
инъективным отображением V на Fn. Отображение f удовлетворяет условиям линейности. В самом деле, если а = а1&1+..\+а,Дг, & = РА+... + РА, то e + ft = (ai + Pi)*i + ... + (ai, + Pi.)ft» и /(e + *) = («i + Pn .... аЛ + рл) = = (ах, ..., аЛ) + (р1, ...,P») = /(e) + f(ft). Далее, если %^F, то Ла = (Яа1)&1+... + (АаЛ)&„ и /(Ха)^^, ..., tog = A,(alf ..., an) = Xf(a). Итак, / удовлетворяет условиям линейности. Следовательно, отображение f является изоморфизмом пространства ^ на пространство ofя. П ТЕОРЕМА 4.3. Пусть *V* есть n-мерное векторное пространство над полем oF с фиксированным базисом и п>0. Отображение f:V-*Fn, ставщее в соответствие каждому вектору а из V его координатную строку относительно фиксированного базиса, является изоморфизмом пространства °/Р на арифметическое векторное пространство оГЛ. Эта теорема непосредственно следует из теоремы 4.2 и ее доказательства. СЛЕДСТВИЕ 4.4. Пусть ^' — ненулевое конечномерное векторное пространство с фиксированным базисом. Система векторов пространства чР линейно зависима тогда и только тогда, когда линейно зависима система координатных строк (столбцов) этих векторов относительно фиксированного базиса. СЛЕДСТВИЕ 4.5. Пусть ^ — конечномерное векторное пространство с фиксированным базисом. Ранг системы векторов аъ ..., ат пространства °V равен рангу матрицы, составленной из координатных строк (столбцов) этих векторов относительно фиксированного базиса. Рассмотрим свойства изоморфизмов векторных пространств. СВОЙСТВО 4.1. Если / — изоморфизм векторного пространства U на *J/° и g — изоморфизм пространства °1Р на W, то их композиция является изоморфизмом U на W. Доказательство. Из условия следует, что gf есть инъективное отображение U на W. Отображение gf удовлетворяет условиям линейности. В самом деле, в силу линейности отображений g и / для любых a, ft из К и 267
любого К из F имеем: = g(f(a))+g(f(b)) = (gf)(a) + (gft(b), (gf)№ = g(f№)==g(4(a)) = bg(f(a)) = X(gf)(<*)- Следовательно, g/ является изоморфизмом U на G^p. П СВОЙСТВО 4.2. Если f' — изоморфизм векторного пространства U на векторное пространство чР, то fг является изоморфизмом ®)Р на U. Доказательство. Так как / — инъективное отображение (/на V, то f~l является инъективным отображением V на U. Кроме того, f-1 удовлетворяет условиям линейности. В самом деле, в силу линейности отображения / для любого а из V и любого % из F имеем: f{t4a) + t4b)) = f(t-l{a))+f(}-l{b)) = a+bt /(^1H)=V(/-1H)=^, откуда f-l(a+b)=f'4a)+f-4b), ГЧЬ*) = Ц~Ч*). Следовательно, f-1 является изоморфизмом *]? на U. ? СВОЙСТВО 4.3. Отношение изоморфизма на каком-либо множестве векторных пространств над полем oF является отношением эквивалентности. Доказательство. Отношение изоморфизма, очевидно, рефлексивно. В силу свойства 4.1 оно транзитивно. В силу свойства 4.2 отношение изоморфизма симметрично. Следовательно, отношение изоморфизма является отношением эквивалентности. СВОЙСТВО 4.4. Пусть (1) &!,...,&* — базис векторного пространства U и f —изоморфизм U на векторное пространство б*2/э. Тогда система векторов f{bx), ..., f(bn) является базисом пространства *У*. Доказательство. Система векторов (2)/^), ...,/(&„) линейно независима. В самом деле, в силу линейности отображения f для любых %ъ ..., Ка из F равенство ьльг)+...+ьлъя)=о', 268
где 0' — нулевой вектор пространства ^, влечет равенства /№+...+W = 0'=/(0), В силу инъективности отображения / из последнего равенства следует, что (3) ЛА-Ь...+Л,я&я = 0. Так как система (1) линейно независима, то из (3) следуют равенства Х1 = 09 ..., %п = 0. Кроме того, система (1) порождает пространство ^Р. В самом деле, если сеУ, то вектор f'l(c)^U и его можно представить в виде (4) /-1 (с) = yA+. . -+УпК (Yi, . • •, ул е F), так как система (1) есть базис пространства U. В силу линейности отображения / из (4) следуют равенства c = f(v1b1+...+ynbn) = y1f(b1)+...+ynf(bn). Следовательно, система (2) порождает пространство *J/° и является его базисом. ТЕОРЕМА 4.6. Пусть 21 и ^ — конечномерные векторные пространства над полем ^. Пространства 21 и ^ изоморфны тогда и только тогда, когда равны их раз- мерности. Доказательство. Предположим, что 21^^)Р. Если одно из этих пространств нулевое, то нулевым будет и другое, т. е. dim^ = dim<3^/3 = 0. Предположим теперь, что 21 и ^ — ненулевые пространства. Тогда, по свойству 4.4, число элементов базиса пространства 21 равно числу элементов базиса пространства *J/° (равны размерности этих пространств). Теперь предположим, что dimZ^ = dim(3^/D = M. Если п = 0, то пространства #, ^ — нулевые и поэтому изоморфны. Если же п>0, то, по теореме 4.2, 21^,^п и ^rn^9jP. в силу транзитивности изоморфизма отсюда следует, что векторные пространства 21 и *\Р изоморфны. П Упражнения 1. Пусть U и ^—конечномерные векторные пространства над полем &. Покажите, что существует мономорфизм пространства U в V тогда и только тогда, когда dim U^ dim W. 2. Пусть U и V — конечномерные векторные пространства над полем F. Докажите, что существует эпиморфизм пространства 1С на V тогда и только тогда, когда dim U ^ dim &. 269
3. Пусть U и V—n-мерные векторные пространства над конечным полем 3*. состоящим из т элементов. Сколько существует изоморфизмов пространства U на пространство V? 4. Приведите пример векторного пространства над полем SFt не являющегося конечномерным. 5. Пусть %(/—векторное пространство над полем ^", не являющееся конечномерным. Покажите, что существует мономорфизм любого конечномерного векторного пространства V над полем 3* в пространство у?. § 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА СО СКАЛЯРНЫМ УМНОЖЕНИЕМ Скалярное умножение в векторном пространстве. Пусть °xi^—векторное пространство над полем sF, V—основное множество пространства °Ти F — основное множество поля #, которое называется множеством скаляров. ОПРЕДЕЛЕНИЕ. Скалярным умножением в пространстве ЬКЬ° называется отображение V X V ->¦ F, ставящее в соответствие каждой паре элементов а, Ь из V скаляр, обозначаемый через ab, и удовлетворяющее условиям: (1) ab = ba для любых а, Ъ из V; (2) (aa-f Р&)-с = а(а-с) + Р(&-с) для любых я, Ь из V и a, p из F. Скаляр а Ь называется скалярным произведением векторов а и Ь. ОПРЕДЕЛЕНИЕ. Скалярное умножение в пространстве *)Р называется невырожденным, если а-афО для любого ненулевого вектора а из V. Скалярное умножение в пространстве ^/° называется нулевым, если а-Ь = 0 для любых а, Ь из V. ПРЕДЛОЖЕНИЕ 5.1. Если ^—векторное пространство со скалярным умножением, то а -0 = 0 для любого а из V. Доказательство. В силу условия (2) #0 = =a(Q-f-0) = aO + aO и, значит, а-О + а-0 = я0 + 0. В силу правила сокращения отсюда следует, что #0 = -О- ? Отметим, что в любом конечномерном ненулевом векторном пространстве скалярное умножение можно ввести различными способами. Пусть ^—векторное пространство со скалярным умножением (3) VxV->F, 270
удовлетворяющим условиям (1), (2) определения. Если<5?— подпространство пространства P~J, то отображение (3) индуцирует отображение L X L-+F, которое па L также удовлетворяет условиям (1), (2). Поэтому векторное пространство <5? также можно рассматривать как векторное пространство со скалярным умножением. Ортогональная система векторов. Пусть ^ — векторное пространство (над полем <&) со скалярным умножением. ОПРЕДЕЛЕНИЕ. Векторы а, Ъ из V называются ортогональными или взаимно ортогональными, если их скалярное произведение равно нулю. Запись а _\_Ь означает, что ab = 0. ОПРЕДЕЛЕНИЕ. Система Еекторов а3, ..., ат пространства *}Р называется ортогональной, если взаимно ортогональны любые два вектора системы. Система, состоящая из одного ненулевого вектора, считается ортогональной. Ортогональная система векторов, являющаяся базисом пространства бУ), называется ортогональным базисом пространства, ТЕОРЕМА 5.2. Пусть ^ — векторное пространство с невырожденным скалярным умножением. Ортогональная система ненулевых векторов пространства &}f линейно независима. Доказательство. Пусть (1) аъ ..., ат — ортогональная система ненулевых векторов пространства бТ. Покажем, что для любых скаляров Xv ..., Хт (из F) из равенства (2) Vi+... + ^A = 0 следует равенство нулю всех коэффициентов. Умножив обе части равенства (2) на вектор ak, k^{l, ..., т}, получим К ((hf*k)+-•• + ** (<**аи)+..- + К (а>т<1к) = 0. В силу ортогональности системы (1) отсюда получаем равенство (3) %k(ak-ak) = 0. Так как, по условию, акф0 и скалярное умножение в ®Т невырожденное, то акакф0. Поэтому из (3) вытекают равенства Xk = 0 для k = 1, ..., т. Следовательно, система векторов (1) линейно независима. ? 271
СЛЕДСТВИЕ 5.3. Если e1/D — ненулевое n-мерное векторное пространство с невырожденным скалярным умножением, то любая ортогональная система п ненулевых векторов пространства является ортогональным базисом пространства ®г. Процесс ортогонализации. Сущность процесса ортого- нализации дана при доказательстве теоремы. ТЕОРЕМА 5.4. Пусть ^ — конечномерное векторное пространство с невырожденным скалярным умножением. Ортогональную систему ненулевых векторов, не являющуюся базисом пространства, можно дополнить до ортогонального базиса пространства. Доказательство. Пусть dim6CJ/° = ft> 1 и (1) Ьг, ..., Ът — ортогональная система ненулевых векторов пространства *j/°, не являющаяся базисом пространства, т. е. т<Сп. По теореме 3.6, систему (1) можно дополнить до базиса. Пусть (2) Ьъ .... — базис пространства ^J/°. Положим (3) ft/Ti+i = ?m+l ~ M>1 —... ~ ктЬт и найдем, при каких значениях скаляров Ъ, ..., %т вектор bmJrl ортогонален ко всем векторам исходной системы (1), т. е. удовлетворяет условиям (4) &m+A- = 0 (i"=l, ..., т). В силу (3) и ортогональности системы (1) эти условия можно записать в виде Cm?lbi~ki(bibi) = 0. Так как &;^0 и ЪГЬЬФ^, эти условия можно записать в виде При таком выборе коэффициентов Kt в равенстве (3) вектор bm+i удовлетворяет условиям (4), т. е. ортогонален к каждому вектору системы (1). Из (3) в силу линейной независимости системы Ьъ ..., Ьт, ст+1 следует, что Ьт+1 ф 0. Следовательно, Ъх, ..., Ьт, Ьт+1 есть ортогональная система ненулевых векторов. Если т+\<.п, то аналогич- 272
ным образом находится ненулевой вектор 6т+2, ортогональный к векторам bl9 ..., bm, Ьт+г. Продолжая этот процесс, называемый процессом ортогонализации системы (2), получим ортогональную систему Ьр ..., bm9 bm+1,,..,bn ненулевых векторов пространства *1Рт По следствию 5.3, эта система есть ортогональный базис пространства Т/° и, следовательно, является искомым дополнением исходной системы (1) до ортогонального базиса пространства *1Р. ? Легко видеть, что применение процесса ортогонализации к линейно зависимой системе ненулевых векторов приведет к системе, содержащей нулевой вектор. СЛЕДСТВИЕ 5.5. Любое конечномерное ненулевое векторное пространство с невырожденным скалярным умножением обладает ортогональным базисом. Доказательство. В самом деле, по теореме 3.1, ненулевое конечномерное пространство обладает базисом. Пусть (1) Ьг, ..., Ьп — базис пространства *)Р. Считая Ъг исходной ортогональной системой и применяя к системе (1) процесс ортогонализации, получаем ортогональный базис пространства °1Р. Ортогональное дополнение к подпространству. Пусть ^—векторное пространство со скалярным умножением и М cz V. Если вектор а из V ортогонален к каждому вектору из М, то это записывается в виде а±,М. Символом M-L обозначается множество всех элементов пространства *iJ/°, ортогональных к М: M± = {az=V\a±M}. Легко проверить, что множество М±- не пусто и замкнуто в еУ)9 замкнуто относительно сложения и умножения на скаляры. ОПРЕДЕЛЕНИЕ. Подпространство пространства *J/° с основным множеством M-L называется ортогональным к множеству М. Если X — подпространство пространства *J/°, то символом <3?-L обозначается подпространство с основным множеством LX. ОПРЕДЕЛЕНИЕ. Подпространство <S?-L называется ортогональным к X в пространстве *1Р или ортогональным дополнением к X в пространстве ®\Р. Пример. Пусть *V*=ffn — арифметическое векторное пространство над полем sf со стандартным скалярным 273
умножением. Пусть М = {аъ ..., ат) с Ftl и tfi = (aii> • •> а1я), ..., 0да = (ат1> ..., атп) (a/ftEf). Рассмотрим однородную систему линейных уравнений а11х1 + ... + а1пхп = Оу (1) '• &miXl""Г • • • 4"&тпХп — ^ над полем «F. Легко видеть, что множество M-L совпадает с множеством всех решений системы (1). Пусть Х = =Х(аъ ..., От) и L = L(al9 ..., am) = L(M). Легко проверить, что каждый вектор, ортогональный к М, ортогонален к любой линейной комбинации векторов аъ ..., am, т. е. MJ-czL-U Обратно: каждый вектор из 1Л ортогонален к М, т. е. ZJ-ciM-L. Таким образом, M-L = L-l. Следовательно, пространство решений однородной системы линейных уравнений (1) совпадает с пространством ХК ТЕОРЕМА 5.6. Пусть ^"—векторное пространство со скалярным умножением и 36 —его конечномерное под- пространство, в котором скалярный квадрат любого ненулевого вектора отличен от нуля. Тогда ЬХУ°=Х@ХК Доказательство. Если сЗ? —нулевое подпространство, то, очевидно, теорема верна. Предположим, что X — ненулевое подпространство. Докажем, что (1) LfUl = {0}. В самом деле, если a^L[)H-, то а-а = 0. По условию, а-афО при афО. Поэтому для a^=L(]L^ из a-a = 0 следует, что а = 0. Далее, докажем, что (2) *1Р=Х®ХК По условию, X — ненулевое конечномерное векторное пространство с невырожденным умножением. В силу следствия 5.5 X обладает ортогональным базисом. Пусть (3) &!, ..., Ьт — ортогональный базис пространства X. Достаточно показать, что для всякого вектора а из L существуют скаляры Хх, ..., %т и вектор х такие, что (4) а = Я1&1 + ...+Ят&^+лг, л;е=1А 274
Умножив обе части равенства (4) скалярно на вектор bh получим abi = 'ki(brbi). Поскольку brbi^0, то отсюда следуют равенства (5) ^ = |1| (/ = 1, .... т). При таком выборе скаляров Л* вектор х = а — Я^ —... ...— %тЬт ортогонален к каждому вектору базиса (3), так как в силу (4) и (5) xbi = abi — 'ki(bibi) = 0 (t = l, ..., т). Поэтому вектор х ортогонален к любой линейной комбинации векторов bl9 ..., bm и, значит, ортогонален к L; следовательно, (6) д: = а-Я161-...-Ят&т^11. На основании (4) и (6) заключаем, что имеет место прямое разложение (2). ? СЛЕДСТВИЕ 5.7. Если X — конечномерное подпространство векторного пространства &]Р с невырожденным скалярным умножением, то ^ = 3! ©«3?-*-. СЛЕДСТВИЕ 5.8. Если 56 — подпространство конечномерного векторного пространства *iP с невырожденным скалярным умножением, то 6УЭ = 36 ®J?l~. ТЕОРЕМА 5.9. Если <5б — подпространство конечномерного векторного пространства ^jP с невырожденным скалярным умножением, то (<?Щ- = <%?. Доказательство теоремы 5.9 предоставляется читателю. Упражнения. 1. Пусть а—ненулевой вектор векторного пространства W=(ffl со стандартным скалярным умножением. Какова размерность подпространства пространства V, ортогонального к вектору а? 2. Пусть а, Ь—линейно независимые векторы пространства ^=(2^ со стандартным скалярным умножением. Найдите размерность подпространства, ортогонального к векторам а и Ь. 3. Пусть w=@>2—двумерное векторное пространство над полем рациональных чисел со стандартным скалярным умножением. Найдите в V ненулевое подпространство, в котором скалярный квадрат любого вектора отличен от единицы. 4. Пусть 2?—векторное пространство с невырожденным скалярным умножением. Докажите, что если ненулевой вектор Ь ортогонален к векторам а19 ..., ат пространства 2Г, то Ь ф L(alt ..., ат). 5. Пусть V—векторное пространство с невырожденным скалярным умножением. Пусть alt ..., ат—линейно независимая система векторов пространства W* Докажите, что если ненулевой вектор Ъ 275
ортогонален к векторам alt ..., ат, то система аг, ..., ат, Ь линейно независима. 6. Пусть X— ненулевое подпространство конечномерного векторного пространства V с невырожденным скалярным умножением. Пусть #!, ..., ат — ортогональный базис пространства X и Ьъ ... ..., bs—ортогональный базис пространства Х^~- Докажите, что #i> •••> ат, Ь1у ..., bs является ортогональным базисом пространства V. 7. Пусть X* U — подпространства конечномерного векторного пространства V с невырожденным скалярным умножением. Докажите, что: (a) (X±-)L=%; (b) {X+U)L = XL(\U^ (с) (X (]%)+-= X+-+U±. 8. Пусть X* # —подпространства конечномерного векторного пространства V с невырожденным скалярным умножением и размерность X меньше размерности U. Докажите, что в пространстве U есть ненулевой вектор, ортогональный к подпространству X. 9. Пусть X, U — подпространства конечномерного векторного пространства V с невырожденным скалярным умножением. Докажите, что существует в V ненулевой вектор, ортогональный к подпространствам X и #, если X + U Ф У. § 6. ЕВКЛИДОВЫ ВЕКТОРНЫЕ ПРОСТРАНСТВА Евклидово векторное пространство. Пусть ^ — векторное пространство со скалярным умножением над полем <=>% действительных чисел. Такое пространство называют также действительным векторным пространством. ОПРЕДЕЛЕНИЕ. Векторное пространство над полем (М с положительно определенным скалярным умножением (т.е. а-а^>0 для любого аеУ\{0}) называется евклидовым векторным пространством. ТЕОРЕМА 6.1. Арифметическое векторное пространство над полем <М со стандартным скалярным умножением является евклидовым. Доказательство. ПустьбЧ/э=е^/г—арифметическое векторное пространство со стандартным скалярным умножением и а = (<%!, ..., ап), b=($l9 ..., рл) —векторы этого пространства. По определению стандартного скалярного умножения, аЪ = афг+...+алрл. Следовательно, аа = = а\ +... -+- од. А так как аъ ..., ап — действительные числа, то аа>0 для любого ненулевого вектора а пространства <31f>. ? ОПРЕДЕЛЕНИЕ. Арифметическое векторное пространство <Мп со стандартным скалярным умножением называется n-мерным стандартным евклидовым пространством и обозначается через §п. 276
Пример. Рассмотрим множество V всех действительных функций одной действительной переменной х, непрерывных на отрезке [0, 1]. Множество V относительно сложения и умножений на действительные числа является (бесконечномерным) векторным пространством над &. Формула fg = ^lQf(x) g(x) dx определяет в V скалярное умножение. Таким образом, получаем евклидово векторное пространство со скалярным умножением. Норма вектора. Пусть ^ — евклидово векторное пространство. ОПРЕДЕЛЕНИЕ. Нормой вектора евклидова пространства называется арифметический квадратный корень из скалярного квадрата вектора. Норма вектора обозначается через Ца||. По определению, Ца|| = ]/а-а. Следовательно, цац2 = = а-а. ОПРЕДЕЛЕНИЕ. Вектор а называется нормированным, если || а II = 1. Следующая теорема выражает основные свойства нормы вектора. ТЕОРЕМА 6.2. Если а, Ь —векторы евклидова пространства a^eR, то: (1) II #115^0, причем На 11 = 0 тогда и только тогда, когда а = 0; (2) \\%а\\ = \Ц\\а\\\ (3) | а • Ь | ^ II а || • IIЪII (неравенство Коши — Буняковского); (4) ||а + ЬII ^11 а II+11ЬII (неравенство треугольника). Доказательство. Скалярное Умножение в евклидовом пространстве положительно определено, т. е. II а 11 = = ]/а• а>0 при а^=0. Кроме того, ||а||=0 при а = 0. Согласно определению нормы, II %а ||=У(ЩЩ = УЩаа) = \Х\УШ = \Ц-\\а\\9 + + + т. е. выполняется (2). Неравенство (3) верно, если а = 0 или & = 0. Поэтому будем предполагать, что а и Ъ — ненулевые векторы. Для любых действительных чисел аир имеем неравенство (аа-|5&)(аа-р&)^0. 277
Раскрывая скобки в левой части неравенства а2а2 — 2ара& + + Р2й2^0 и полагая а = ||6|| и р = ||а||, получаем: 2(||а||.|1&11)2-2||а||.|1&11-а&^0, lla||-|l&ll(lla||-|l&ll-a&)^0. Так как афО и Ьф09 то \\а\\-\\Ь\\Ф0, поэтому (5)ab^\\a\\-\\b\\. Заменим в этом неравенстве а на —а: — а-Ъ<>\\аыЬ\\. На основании последних двух неравенств заключаем, что имеет место неравенство (3). Для доказательства неравенства (4) достаточно показать, что lla+&|i2^(||a||+||feli)2. Легко видеть, что||# + &Ц2 = = (а + Ь)(а + Ь)=\\аI,2+IIЬ\? + 2ab; поэтому lla+&li2 = (ila||+||&||)2 + 2(a&-||a||.||&l). В силу (5) второе слагаемое в правой части последнего равенства меньше или равно нулю, следовательно, ila + &li2^(ilall+ll&li)2; отсюда вытекает неравенство (4). ? Ортонормированный базис евклидова пространства. Для евклидовых пространств одним из основных является понятие ортонормированного базиса. ОПРЕДЕЛЕНИЕ. Система векторов а19 ..., ат евклидова пространства называется ортонормированноиу если она ортогональна и каждый ее вектор нормирован. Орто- нормированная система векторов, являющаяся базисом пространства, называется ортонормированным базисом пространства. ТЕОРЕМА 6.3. Конечномерное ненулевое евклидово векторное пространство обладает ортонормированным базисом. Доказательство. Пусть 6*j/D — n-мерное евклидово пространство и п^>0. По следствию 5.5, *Jr обладает ортогональным базисом; пусть (l)bl9...9bn — такой базис. Нормируем систему (1), т. е. образуем систему ^i = il&iir1&i, ..., en^WbnW^bn. 278
Легко видеть, что {1, если i = k, О, если 1фк. Следовательно, система elf ..., еп является ортонормиро- ванным базисом пространства *V*. П Рассхмотрим некоторые свойства ортонормированного базиса. СВОЙСТВО 6.1. Если ^IP — n-мерное ненулевое евклидово пространство, то любая ортонормированная система п векторов является ортонормированным базисом пространства *У. Это свойство непосредственно вытекает из следствия 5.3. СВОЙСТВО 6.2. Ортонормированную систему векторов ненулевого конечномерного евклидова пространства, не являющуюся базисом, можно дополнить до ортонормированного базиса пространства. Доказательство. Согласно теореме 5.4, ортонормированную систему векторов bl9 ..., Ьт9 не являющуюся базисом, можно дополнить до ортогонального базиса #1» • • • > Umi #т+1> • • • > On пространства. Нормируя векторы &т+1, ..., Ьп этой системы, т. е. заменяя ht на II bt 1Г1 • bi для i = т +1, ..., я, получаем ортонормированный базис пространства. ? СВОЙСТВО 6.3. Если еъ ..., ?л — ортонормированный базис евклидова пространства и — векторы пространства, то а& = а1р1+...+алрл и ||а||2 = а?+...+сс„. Это свойство легко следует из свойства билинейности скалярного умножения. СВОЙСТВО 6.4. Если еъ ..., еп — ортонормированный базис евклидова пространства и а = а1е1-{-... -\-апеПУ то ai = aei для ?=1,...,/г, т.е. координаты вектора а являются его проекциями на базисные векторы. Доказательство. Равенство щ = аеь получается из равенства а = а1е1+... +апеп в результате умножения скалярно на вектор ?/. П СВОЙСТВО 6.5. Если 36 — подпространство конечномерного евклидова пространства °УР, то <3^/D = <5?®c5fJ- и dim *J/° = dim % + dim^i. 279
Это свойство непосредственно вытекает из следствия 5.8 и свойства 3.4, поскольку в евклидовом пространстве скалярное умножение является невырожденным. Изоморфизмы евклидовых пространств. Пусть U и *J/° — евклидовы пространства. ОПРЕДЕЛЕНИЕ. Отображение / евклидова пространства U на *)Р называется изоморфизмом, если оно инъек- тивно и удовлетворяет условиям: (I) f(a+b) = f(a)+№; (2)ПЩ = Ща); (3) ab=f{a)f{b) для любых а, Ъ из V и любого скаляра % из R. Евклидовы пространства называются изоморфными, если существует изоморфизм евклидова пространства U на °1Р. Запись U^^IP означает, что евклидовы пространства U и *J/° изоморфны. Отметим следующие свойства изоморфизмов. СВОЙСТВО 6.6. Отношение изоморфизма на каком- либо множестве евклидовых пространств является отношением эквивалентности. Доказательство. Легко видеть, что отношение изоморфизма рефлексивно. Воспользуемся свойствами 4.2 и 4.3 изоморфизмов векторных пространств. Если f — изоморфизм евклидова пространства U на СУ), то f-1 биективно и удовлетворяет условиям линейности. Далее, так как / удовлетворяет условию (3), то для любых a, b из V ab = (fn(a)(fn(b)=f(f-Ha))f(t4b))4-4a)f4bb т. е. отображение f'1 также удовлетворяет условию (3). Таким образом, f~x есть изоморфизм евклидова пространства *\Р на U. Следовательно, отношение изоморфизма евклидовых пространств симметрично. Пусть U, *)Р9 W — евклидовы пространства. Если f — изоморфизм U на *V* и g — изоморфизм ^Т на W9 то, по свойству 4.1 изоморфизмов векторных пространств, композиция gf есть инъективное отображение U на ^J/0, удовлетворяющее условиям линейности. Далее, так как ab=f(a)f(b), f(a)f{b) = g(f{a))g(f(b))> то ab = (gf)(<*)(gf)(b) 280
для любых а, Ъ из U. Поэтому gf является изоморфизмом евклидова пространства 21 на си. Следовательно, отношение изоморфизма транзитивно. ? СВОЙСТВО 6.7. Пусть 21, ^ — евклидовы пространства и f — изоморфизм U на (31Р. Если е19 ..., еп — орте- нормированный базис пространства 21, то система /(?х), ... • ••> f(en) является ортонормированным базисом пространства ПР. Доказательство. Таккак/ —изоморфизм, то ?*?* = * / (et) f (ek). Следовательно, (О, если i^=fe. Таким образом, система /(?x), ..., /(?я) является ортонор- мированной. Кроме того, по свойству 4.4 изоморфизмов векторных пространств, система f(e±), ..., f{en) является базисом пространства *3/°. П ТЕОРЕМА 6.4. Любое ненулевое евклидово пространство размерности п изоморфно стандартному n-мерному евклидову пространству. Доказательство. Пусть ^ — /г-мерное евклидово пространство и еъ ..., еп — его фиксированный ортонор- мированный базис. Пусть Шп — стандартное /г-мерное евклидово пространство. По теореме 4.3, отображение f: V-*• Rw, ставящее в соответствие каждому вектору х = %1е1+ ... ... + \rfin из V его координатную строку (glf ..., g„), является инъективным и удовлетворяет условиям линейности. Кроме того, если y = v\1e1+ ... + г]л?л, то jqy = gi4i+..-6it4ii=(5i. •••> Ы(%> •.> *U)=/(«*)fG0- Следовательно, f является изоморфизмом евклидова пространства ^Р на стандартное евклидово пространство Шп П ТЕОРЕМА 6.5. Два конечномерных евклидовых пространства изоморфны тогда и только тогда, когда равны их размерности. Доказательство. Пусть 21 и ^ — конечномерные евклидовы пространства. Если пространства 21 и *1Р изоморфны, то, по теореме 4.6, dim 21 = dim °ЧР. Предположим теперь, что &\т21 = &\т°1Р = п. Если м = 0, то пространство 21 и ^ — нулевые и поэтому изоморфны. Если же /г>0, то, по теореме 6.4, 21 ^%п и %п<^*)Р. В силу транзитивности изоморфизма отсюда следует, что евклидовы пространства 21 и чР изоморфны. ? 281
Упражнения. 1. Пусть а, Ь—взаимно ортогональные векторы евклидова пространства. Покажите, что || а + b ||2—1| я ||'2+|| Ъ ||2. 2. Покажите, что для любых векторов а, Ь евклидова пространства ||a + ^||2+||a-^ll2=2(]|ap+|i6|r-). 3. Пусть а, Ь—такие векторы евклидова пространства, что || а\ = = \Ь ||. Докажите, что векторы а—b и а-\-Ь взаимно ортогональны. 4. Докажите, что для любых векторов а, Ь евклидова пространства \\а\-\Ъ\\<к\а±Ъ\ 5. Пусть а, Ь — ненулевые векторы евклидова пространства. Найдите вектор вида а-\-ХЬ, где ^gR, имеющий наименьшую норму, и покажите, что этот вектор ортогонален к вектору а. 6. Пусть а, Ь—линейно независимые векторы трехмерного евклидова пространства W* Докажите, что в пространстве V существуют только два вектора с единичной нормой, ортогональных к векторам а и Ъ. 7. Пусть ^=^2—двумерное векторное пространство над полем рациональных чисел со стандартным скалярным умножением. Найдите в V ненулевое подпространство, в котором скалярный квадрат любого вектора отличен от единицы. 8. Пусть а, Ъ — линейно независимые векторы евклидова /г-мер- ного пространства V. Найдите размерность подпространства пространства V, ортогонального к векторам а и Ь. 9. Пусть # —подпространство n-мерного евклидова пространства V и UL—его ортогональное дополнение. Пусть at, ..., as—ортонор- мированный базис пространства U и Ьъ ...» bn_s —ортонормирован- ный базис пространства U1-. Докажите, чю alf ..., as, by ..., bn^s есть ортонормированный базис пространства W. 10. Пусть a, b—векторы евклидова векторного пространства. Докажите, что | а - b | = [| а || • || b || тогда и только тогда, когда векторы а и b линейно зависимы. 11. Пусть alf ..., ат—-ортонсрмированная система векторов евклидова пространства V. Предположим, что для каждого вектора с пространства V || ?||2=(«i?)2+ ... +(«m^)2- Докажите, что система векторов а±, ... > ат является базисом пространства V- 12. Пусть cS?, U—подпространства конечномерного евклидова векторного пространства. Докажите, что: (а) (XL)L"X; (Ь) (^+2f)J-=^1n^i; (с) (#П#)Х =
Глава восьмая ЛИНЕЙНЫЕ ОПЕРАТОРЫ § 1. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ Линейные отображения и операторы. Рассмотрим гомоморфизмы векторных пространств; они называются также линейными отображениями. ОПРЕДЕЛЕНИЕ. Пусть U и 6Т- векторные пространства над полем «F. Отображение /: U -> ^J/° называется линейным отображением или гомоморфизмом, если оно удовлетворяет условиям линейности, т. е. для любых а, JgI^ и любого XеF выполняются условия f(a + b) = f(a) + f(b), f(ka) = kf(a). Если линейное отображение U на ^ инъективно, то оно называется изоморфизмом или изоморфным отображением U на ^J/0. Множество всех линейных отображений (гомоморфизмов) пространства U в пространство °vJ/° будем обозначать Hom(#, *J/°). Линейное отображение векторного пространства *J/° в себя называется линейным оператором пространства ЧР. Множество всех линейных операторов пространства ^]Р обозначается Hom(^f *JP). Пусть ф —линейное отображение векторного пространства U на векторное пространство ^j/3. Тогда для любых векторов %,..., ап из U и любых скаляров Хи ..., ^meF (1) ф(Мх+ ••• +^вт) = Л1ф(в1)+ ... +hi4>(am). Доказательство проводится индукцией по т. Если т= 1, то ввиду линейности отображения ф имеем ф^Ях) = = ^(a!). Допустим, что предложение верно для т—1 векторов. Тогда, используя равенство Ка1 + • • • + ^т-Фт-Х + Mm = (К&1 + .. • + Хт гат х) + "Г h/nflm* 283
получаем По индуктивному предположению, Ф (Ml + • • • + V 10m l) = *ъФ (# l) + -.. + К, -1ф (<*« -i). Кроме того, Ф (АтяЯ) = А,,„ф (ат). Следовательно, выполняется равенство (1). П Примеры. 1. Пусть *J/° — векторное пространство. Отображение е: ^l/0-^^}/0, ставящее в соответствие каждому вектору х из V этот же вектор, т. е. г(х) = х, есть линейный оператор. Он называется тождественным или единичным оператором пространства. 2. Пусть ^ — векторное пространство над полем /и А-— фиксированный элемент поля. Отображение Ае: ^J/0-^6^/3, ставящее в соответствие вектору л: вектор Хх, есть линейный оператор пространства чР. Он называется оператором гомотетии с коэффициентом X. Оператор гомотетии с коэффициентом А, = 0 называется нулевым оператором. Оператор гомотетии с коэффициентом X = 1 есть тождественный оператор. 3. Пусть T = «2?®#. Любой элемент х из Т однозначно представим в виде л: = / + «, где / eL и # ^?/. Отображение ^IP-*-®]?, ставящее в соответствие вектору л: его компоненту / в прямом слагаемом #, есть линейный оператор пространства ^J/0. Он называется оператором проектирования. 4. Пусть *J/° — векторное пространство (над <М) действительных функций одной переменной х, определенных и неограниченно дифференцируемых на множестве R действительных чисел. Оператор D : *)Р -> ^J/0, ставящий в соответствие каждому элементу f е V его производную -^, есть линейный оператор, так как удовлетворяет условиям линейности D(f+fir) = D(f)+D(gr); D(Xf) = XD(f) для любых/, geV и любого A,^R. Этот оператор называется оператором дифференцирования. 5. Пусть ^ = J2"* — арифметическое пространство м-мер- ных вектор-столбцов и Л—фиксированная квадратная п х n-матрица над полем of. Отображение пространства *]Р в себя, ставящее в соответствие каждому вектору ХеР вектор АХ, есть линейный оператор пространства *1Р9 284
ТЕОРЕМА 1.1. Пусть U и ^ — векторные пространства над полем aF, el9 ..., еп — базис пространства U и Съ • • •» Сп — произвольные векторы пространства ®)Р. Тогда существует единственное линейное отображение ф прост- ранства U в пространство ^J/0, удовлетворяющее условиям (1) <р(ег) = с19 ..., <р (*«) = *«• Доказательство. Любой вектор пространства U можно представить в виде линейной комбинации базисных векторов, т. е. в виде ^i+... + ^л- Обозначим через ф отображение U в ®)Р9 определяемое равенством ф(^1+-• «+^А) = Vi+«• •+Vn Для любых Х1У ... ..., %п из F. Легко видеть, что отображение ф удовлетворяет условиям (1). Отображение ф удовлетворяет условиям линейности. Действительно, если то и Кх=='ка1е1 + ... + 7^апхп. Следовательно, в силу определения отображения ф = («л+...+апсп)+(Mi+• • •+$псп) = ф (*)+ф (у); Ф (Але) = Ыгсг+.. .+>-алсл = Я (а^!+• • • + а^л) = ^Ф (•*)• Предположим, что i|)~ линейное отображение U в ^j/0, удовлетворяющее условиям ,ф(^1) = ^1, ..., ty(en) = cn. Тогда для любого вектора х = а1е1 + ... + апеп пространства U имеем <ф (х) = ахф (^)+... + аяг|> (еп) = а^+... + апсп = ф (#), т. е. яр = ф. П СЛЕДСТВИЕ 1.2. Пусть 21 и ^ — векторные пространства над of, el9 ..., еп —базис пространства U\ ф и г|) — такие линейные отображения U в бУ\ что ф(#/г) = = г|)(^) для &=1, ..., /г. Тогда ф = г|). СЛЕДСТВИЕ 1.3. Пусть еъ ..., еп —базис векторного пространства ^ и съ ..., гл — произвольные векторы этого пространства. Тогда существует единственный линейный оператор ф пространства *]Р, удовлетворяющий условиям (1). 285
Ядро и образ линейного оператора. Пусть ф — линейный оператор векторного пространства ^j/0. Множество {х е V | ф (х) = 0} обозначается Кег ср. Другими словами, множество Кегф есть полный прообраз нулевого вектора при отображении ф, Ker<p = qr1(0). В силу линейности оператора ф это множество замкнуто относительно сложения и умножения на скаляры. Следовательно, существует подпространство пространства °^ с основным множеством Кегф. ОПРЕДЕЛЕНИЕ. Подпространство векторного пространства °^/° с основным множеством Кегф называется ядром линейного оператора ф и обозначается &?ег ф. Размерность ядра называется дефектом оператора ф, дефект ф = dim &?ег ф. Множество {<p(x)\x^V\ обозначается через 1тф или ф(1/). В силу линейности оператора ф это множество замкнуто относительно сложения и умножения на скаляры. Следовательно, существует подпространство пространства ^ с основным множеством 1тф. ОПРЕДЕЛЕНИЕ. Подпространство векторного пространства °1/° с основным множеством Im ф называется образом линейного оператора ф и обозначается <??т ф. Размерность образа оператора ф называется рангом оператора ф, ранг ф = dim (#m ф). ТЕОРЕМА 1.4. Пусть ф — линейный оператор конечномерного векторного пространства ^J/3. Тогда (1) сумма ранга и дефекта оператора ф равна dim5^. Доказательство. Первый случай: Кегф = {0}. Если ^ — нулевое пространство, то легко видеть, что заключение теоремы выполняется. Предположим, что ^ — ненулевое пространство. Пусть dim6ti/D = n и еъ ..., еп — базис пространства *]Р. Тогда система векторов ф (ег), ..., у(еп) порождает пространство (s^/nф, т. е. 1тф = 1(ф(^!), ..., ф(?л)). Эта система векторов линейно независима. Действительно, если Vp(ei)+... + ^9(e*) = 0, то ввиду линейности оператора ф 9(Vi + .-- + kA)==0. Так как Кегф = {0}, то отсюда следует, что 286
и в силу линейной независимости векторов ^ = 0, ... ..., Хп = 0. Таким образом, система ф (е^, ..., ф(еп) является базисом пространства <^тср и поэтому ранг ф равен /г. Кроме того, дефект ф равен нулю. Следовательно, имеет место утверждение (1). Второй случай: Кегф=#={0}. Пусть дефект ф равен г и еъ ..., ег — базис ядра оператора ф, базис пространства offer у. Если r = dim6tJ/D, то, очевидно, утверждение (1) выполняется. Предположим, что г<Г.п = сНтбУ\ В этом случае систему е19 ..., ег можно дополнить до базиса пространства <5У>. Пусть eLt ..., ег, ег+1, ..., еп — базис пространства %°\ тогда 1тф = 1(ф(^), ..., ф(ел)). Так как ф(^1) = 0, ..., ф(е,.) = 0, то 1тф = 1(ф(ег+1), ..., ф(*я)), т. е. система векторов ф(?г+1)> • •> ф(^«) порождает пространство ^тф. Эта система линейно независима. Действительно, если V+хФ (er+i)+.. •+Атгф (е*) = 0, то в силу линейности оператора ф ф (V+i^r+i+. -. + К*п) = 0» откуда V+i?r+i+... + Кеп е Кег ф. Так как еъ ..., в,. — базис пространства Жегф, то существуют такие скаляры ^, ..., V» что V+i^r+i+•..+Кеп = ^i^i+... + Кег и В силу линейной независимости векторов вх,..., еп отсюда следует, что равны нулю все коэффициенты в левой части равенства, в частности и V+i = 0, ..., Хп = 0. Таким образом, система векторов ф(вг+х), ..., ф(еЛ) является базисом пространства ^тф и ранг ф равен п — г. Следовательно, верно утверждение (1). ? Операции над линейными отображениями. Пусть U и ^ — векторные пространства над полем oF, ф, я|) —линейные отображения U в (*j/°. Сумма ф + г|) определяется как 287
отображение U в ®}Р9 ставящее в соответствие элементу х из U элемент q>(x) + ty(x) из °}Р, т. е. (ф+10 (*) = ф (¦*)+*(*)• Произведение скаляра J,gF и отображения ф определяется как отображение U в °J/°, ставящее в соответствие элементу x^U элемент ?лр(л:) пространства *J/°, т. е. (Хф)(л:) = Яф(Аг). ПРЕДЛОЖЕНИЕ 1.5. Пусть ф a ty —линейные отображения векторного пространства U в векторное прост- ранство *]Р и X^F. Тогда ф + 'Ф и tap являются линейными отображениями U в °^Р. Доказательство. Сумма ф + г|э удовлетворяет условиям линейности.. Действительно, для любых а, Ь <^U и любого ^eF имеем: (9 + Ша+Ь) = <р(а+Ъ) + у(а+Ъ) = <р(а) + у(Ь)+ +я|)(а) + 'ф(6) = ф(а) + я|)(а) + ф(&) + г|)(6) = =(ф+*) (в)+(ф++)(»); (ф + Ф) (to) = Ф (to*) + Ф (^л) = ^Ф (#) + Л/ф (а) = = Я (Ф (а) + Ф (а)) = М(ф + f) (а)). Таким образом, ф + г|) есть линейное отображение 71 в ^If*. Произведение Хер удовлетворяет условиям линейности. Действительно, для любых a, b е ?/ и любого ^ef имеем: (Хф)(а + &) = Я(Ф(а + &)) = Я(ф(а) + ф(&)) = = tap (a) + tap (&) = (tap) (a) + (tap) (&); (tap) (}ха) = tap (\ia) = Я (|хф (а)) = (Щ ф (а) = = |1(Аф(а)) = |г((Хф)(а)). Следовательно, Яф есть линейное отображение # в <*J/3. П СЛЕДСТВИЕ 1.6. Множество Нот(#, °^) замкнуто относительно сложения и умножения на скаляры. Упражнения 1. Пусть ф —линейный оператор одномерного векторного пространства V над полем &. Докажите, что существует такой скаляр X^F, что ф (х) = Хх для любого вектора x&V. 2. Пусть ф и -ф —линейные операторы конечномерного векторного пространства и ф\|э = 0. Будет ли г|эф = 0? 3. Пусть ф—линейное отображение векторного пространства U в пространстве V и Ь е Im ф. Докажите, что множество ф~1 (Ь) (ф-1 (b)= {х e У | ф (.*) = &}) является линейным многообразием пространства U с направлением Жегу% 288
4. Пусть ф—линейное отображение векторного пространства U в пространство V и alf ..., am<=U. Докажите, что если система ф(ах), ..., ф(ат) линейно независима в V, то система а^ ..., ат линейно независима в U. 5. Пусть ф—инъективное линейное отображение векторного пространства U в пространство V. Докажите, что если система аъ ... ..., ат линейно независима в U, то система ф (ai), ..., q>(am) линейно независима в V. 6. Докажите, что линейное отображение ф векторного пространства U в пространство V инъективно тогда и только тогда, когда 5Гегф={0}. 7. Пусть ф—линейное отображение я-мерного векторного пространства U на n-мерное пространство V* Докажите, что ф есть изоморфизм. 8. Пусть ф—линейное отображение векторного пространства U на одномерное пространс1во V и ае?/\Кегф. Докажите, что #=Ж?гФ©^(а). 9. Пусть ф, г|)—линейные операторы векторного пространства V такие, что Кег ф = Кег ^={0}. Докажите, что Кег (фг|)) = {9}. 10. Пусть ф есть линейный оператор векторного пространства V, удовлетворяющий условию ф»ф=ф. Покажите, что W=v?er ф 0 <?/т ф. 11. Пусть U и V—векторные пространства над полем ^, причем пространство U одномерное. Докажите, что всякое ненулевое отображение U в V является инъективным. 12. Пусть o%fom(U, V)—векторное пространство всех линейных отображений конечномерного векторного пространства U в конечномерное пространство V. Докажите, что (a) если dim# = l, то dim(s%Tom(U, W)) = dimW, (b) если dim ^=1, то dim (^Tom (U, 2T)) = dim#. 13. Пусть U и V—конечномерные векторные пространства, размерности которых тип. Докажите, что размерность векторного пространства o%fom(U> V) равна произведению тп. 14. Пусть ф—линейное отображение конечномерного векторного пространства U в векторное пространство V* Докажите, что dim (Жег ф) + dim ($т ф) = dim U. 15. Пусть ф—линейное отображение векторного пространства U в конечномерное векторное пространство V. Пусть а1э ..., ат—такая система векторов пространства U, что система ф (ai), ... , ф (ат) является базисом пространства e^/тгф. Докажите, что # = <2%?егф0 ®%(аъ ..., am). 16. Пусть ф—линейный оператор конечномерного векторного пространства V над полем 3*. Докажите, что для достаточно большого натурального числа т линейные операторы ф, ф2, ..., у>т линейно зависимы над полем 3** § 2. ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ МАТРИЦАМИ Матрица линейного оператора. Пусть ^ — конечномерное векторное пространство над полем oF, (1) еъ ..., еп — его базис и ф —линейный оператор пространства в1Р. 289
Представим векторы ф(вх), ..., у(еп) в виде линейных комбинаций векторов базиса (1): (2) Ф (*i) = aii^i+• • •+ащвя, Ф (<?„) = а1ле,.+...+аллел. ОПРЕДЕЛЕНИЕ. Матрица М (ф) аи • • • &т М(Ф)=' №i • • • «я &-й столбец которой есть координатный столбец вектора q>(ek) относительно базиса (1), называется матрицей линейного оператора ф относительно базиса (1). Напомним, что FnXn обозначает множество всех пхп-матриц над полем oF. ТЕОРЕМА 2.1. Пусть 'ЧР — векторное пространство над полем of с фиксированным базисом (1). Отображение Ф, ставящее в соответствие каждому линейному оператору ф пространства *!/* его матрицу М (ф) относительно базиса (1), является биективным отображением множества НотСТ, °Т) на множество F"*'1. Доказательство. Ясно, что Ф — отображение на множество Fn х п. Докажем, что отображение Ф инъ- ективно, т. е. что для любых ф и г|> из равенства М (ф) = = М (г|)) следует равенство ф = я|). Из М (ф) = М (я|)) следуют равенства M(y(ek)) = M(q>(ek)) для & = 1, ..., /г, откуда <p(*a) = i|>(*a) Для ?=1, ..., п. Согласно следствию 1.2, отсюда следует равенство ф = *ф. П Пусть Я — скаляр, X^F. Обозначим через «(унарную операцию в множестве Нот (#, *ЧР), ставящую в соответствие каждому линейному отображению феНот(#, °Т) линейное отображение tap: Со?(ф) = А,ф. Эту операцию будем называть операцией умножения на скаляр X. 290
ТЕОРЕМА 2.2. Пусть 21, <3i]/D — векторные пространства над полем <=F. Алгебра <Нот(#, 4/°), +, -, K|*eF}> является векторным пространством над полем «F. Доказательство. Согласно следствию 1.2, множество Нот (21, *J/°) замкнуто относительно сложения и унарных операций со? умножения на скаляры из поля eF. Отметим, что через «—» обозначается унарная операция в множестве Hom(#, ^)Р), ставящая в соответствие каждому оператору _ф е Нот {21, 4°) оператор — ф = = (—1)ф, и через 0 —нулевое отображение 21 в *)Р. Алгебра (Нот{21, ЧР), + ,—•} является абелевой группой. Действительно, легко проверить, что для любых ф, ф, X^Hom(#, 61Р) выполняются равенства Ф + <ф = <ф+Ф, ф + 0 = ф, Ф + (Ф + 5С) = (ф + 1|>) + Х> Ф + (— Ф) = 0. Кроме того, легко проверить, что для любых К, jagF Я (ф + а|)) = Яф + Яг|), (X\l) ф = % (|Хф), (Я + |х)ф =Яф + [Хф, 1 -ф = ф. Таким образом, выполняются все аксиомы векторного пространства. ? Векторное пространство <Нот(#, ^), +, _, {<*{]%ееF}) будем называть векторным пространством линейных отображений 21 в *)Р и обозначать через <Жот{21, Ч?). Связь между координатными столбцами векторов х и ф(лг). Пусть (1) ev ..., ?* — фиксированный базис векторного пространства °1Р и ф — линейный оператор этого пространства. Пусть, далее, * = &Л + -"+6л** и Ф^^ЛЛ + .-. + Чя^д. Обозначим через M(jc) и М(ф(лс)) координатные столбцы соответственно векторов х и ф(лг) относительно фиксиро- 291
ванного базиса (1): Af(*) = : , M(q>(*)) = : Найдем связь между этими координатными столбцами. ТЕОРЕМА 2.3. Пусть ф — линейный оператор векторного пространства *1Р и М (ф) — матрица оператора ф относительно базиса (1). Тогда для любого вектора x^V выполняется равенство М(<р(х)) = М(<р)М(х). Доказательство. Пусть "ап ... а1п М(Ф) = ссп1 ... апп J тогда выполняются равенства (2). Если JC = Ei^i+... ...+UeV, то Ф (*) = ЬФ (*i) + • • •+ЕЯФ (ея). Заменяя в этом равенстве векторы Ф^), ..., ф(еЛ) на основании (2), получаем Ф (х) = 1х (а11в1+.. .+ал1еЛ)+.. .+?„ (а1дех+.. .+аяяея), откуда ф (х) = («!&+...+ОщЪп) е±+...+(ая1$!+.. .+аЛ/г1«) е*. Следовательно, М(Ф(а:)) = Oii?i+.-- + aiiil» .a/iiii+-«-+a/i/iSw. <xu ... а1я «я! ••• «л Г1 Id т. е. М(<р(х)) = М(<р)М(х). П ТЕОРЕМА 2.4. Пусть у— линейный оператор вектор- ного пространства чР и М (ф) — матрица оператора ф относительно фиксированного базиса (1). Если для любого вектора x^V (3) М(<р(х)) = ВМ(х)9 то 5 = М(ф). 292
Доказательство. Согласно определению матрицы Л1(ф), (4) М (Ф) = (М (ф (<?,)), М (Ф (е2)), ..., М (ф (ел))). Подставив в (3) вместо х последовательно базисные векторы е1г .... еп, получим М{ч{ег)) = ВМ(ег)=В (5) М(у(е2)) = ВМ(е2) = В 1 О LoJ о 1 .6 ¦¦В1; = В2; М(ч>{еп)) = ВМ(еп) = В = ВЯ. На основании (4) и (5) заключаем, что соответствующие столбцы матриц М(ф) и В совпадают. Следовательно, М(ф) = В.П ПРЕДЛОЖЕНИЕ 2.5. Пусть ф ы ¦§ —линейные операторы векторного пространства 9]Р с фиксированным базисом elt ..., еп и A,<=.F; тогда (1) М(ф + Ч>) = М(ф) + М (ф); 2) М(Ч) = ^(Ф). (3) Доказательство. Пусть ^еУ и ^(х) = ц1е1+...+у\пеп тогда (<Р + Ц)(х) = (11+Ч1)е1+... + (Ъп + г\п)еп. 293
Следовательно, Л4((ф + *)(*)) = Hi + i Uln. = M(<p(x))+Mto(x)) и, по теореме 2.3, (4) М{(ч + Ъ)(х)) = (ММ + М№М(х). Равенство (4) верно для любого x^V. По теореме 2.4, из (4) следует равенство (1). В силу (3) (Лф)(^) = Я|1^1+...+Л^явл; следовательно» М((Щ(х)) = Ш(<р(х)) и, по теореме 2.3, для любого х (5) М((Щ(х)) = (кМ(<р))ЛЦх). Согласно теореме 2.4, из (5) следует (2). ? Ранг линейного оператора. Установим связь между рангом линейного оператора и рангом его матрицы. ТЕОРЕМА 2.6. Ранг линейного оператора конечномерного ненулевого векторного пространства равен рангу матрицы этого оператора. Доказательство. Пусть е19 ..., ^ — фиксированный базис векторного пространства °^Л Пусть М (ф (ег)),... ..., М(ф(еп)) — координатные столбцы векторов ф(^х), ... • ••> ф(^л) относительно фиксированного базиса. Они являются столбцами матрицы М (ф) оператора ф относительно фиксированного базиса, т. е. А! (ф) = (А«(ф fa)). •••> М{ч(ея))). Следовательно, (1) рангМ(ф) = ранг(М(<р(ег)), ..., М(у(еп))). В силу следствия 7.3 ранг системы векторов ф(?х), ... -••» ф(?») равен рангу системы столбцов этих векторов. Отсюда и из (1) следует, что (2) рангМ(ф) = ранг(ф(^), ..., ф(?„)). Пусть х — произвольный вектор пространства ®)Р и д: = |1^1+---+|/г^/г- В силу линейности оператора ф выполняется равенство ф (л:) = 1гц> (ег)+...+|лф (еп). Поэтому 1т(ф) = Ь(ф(^), ..., ф(^я)), 294
т. е. образ оператора ср порождается векторами ф(^х), ... ..., ц>(еп). Согласно следствию 7.3, отсюда следует, что (3) рангф = ранг(ф(^), ..., <р(*„)). На основании (2) и (3) заключаем, что ранг ф равен рангу матрицы М(ф). П Связь между координатными столбцами вектора относительно различных базисов. Пусть ^ — ненулевое n-мерное векторное пространство над полем oF. Пусть даны два базиса этого пространства: е19 ..., еп — первый базис, е'19 ..., е'п — второй базис. Векторы второго базиса представим в виде линейных комбинаций первого базиса: e'iz=t1Le1+...-{-tnlen (1) ^ (tikezF). &п = Нп&1 Т* • • • "Г tfirfin Матрицей перехода от первого базиса ко второму называется матрица Т, Г Hi Hz • • • *1я"1 гтл hi Нъ • • • Нп L-tni 1П2 .. . tnnJ &-й столбец которой является координатным столбцом вектора е& относительно первого базиса. ПРЕДЛОЖЕНИЕ 2.7. Матрица Т обратима. Доказательство. Из линейной независимости векторов е'и ..., е'п следует линейная независимость координатных столбцов этих векторов, т. е. линейная независимость столбцов матрицы Т (см. следствие 7.4). Согласно теореме 5.1, отсюда следует, что матрица Т обратима. ? Координатный столбец вектора jcgF относительно первого базиса обозначим через М(х), относительно второго—через М'(х). Найдем связь между М(х) и М' (х). ТЕОРЕМА 2.8. Пусть М(х) и М' (х) —координатные столбцы вектора х соответственно относительно первого и второго базисов и Т —матрица перехода от первого базиса пространства ко второму. Тогда выполняются равенства (2) М(х) = ТМ'(х)\ (3) М'(х) = Т-Щ(Х). 295
Доказательство. Пусть jceK и (4) x = t1e1 + ...+%nen, (5) х = 1[е[+...+&е'п; следовательно, Г*Г • Ls«_ , М'(х) = in • .i«J Подставив в (5) выражения для е[, ..., е^ из равенств (1), получим * = 11 (*u*i+• • •+'т*»)+. • •+Ъ'п {кпег+...+гЛЛеЛ), откуда (6) * = (*u6i + ... + 'i»E»)*i^^^ Из (4) и (6) следуют равенства ?1 == ^11^1 + • • • + tln&nl Ъп = *п1Ь1 4" • • • "Ь *ппЬП' Отсюда получаем равенство ГЬ1 '. Lwi- = Т Г1П Lid т. е. М(л;) = ТМ' (л:). Умножив слева обе части этого равенства на Г-1, получим (3). ? СЛЕДСТВИЕ 2.9. Если *М(х) и W (х)-координатные строки вектора х соответственно относительно первого и второго базисов, то *М (х) = Ш' (хУ Т, Ш' (х) = Ш (хУ (Т-1). Связь между матрицами линейного оператора относительно различных базисов. Пусть ^ — ненулевое конечномерное векторное пространство, е1у ..., еп — первый базис пространства ^, е[, ..., е'п — второй базис пространства пР и Т — матрица перехода от первого базиса ко второму. ТЕОРЕМА 2.10. Пусть ф — линейный оператор векторного пространства ЧР, М(ф) и М! (ф) — матрицы этого оператора соответственно относительно первого и второго базисов и Т — матрица перехода от первого базиса ко второму, тогда М' (<р) = T~XM (ф) Т. 296
Доказательство. Согласно теореме 2.8, для всякого х е V (2) М(х) = ТМ'(х); (3) Mf(x) = T-1M(x)f где М(х) и М' (х) — координатные столбцы вектора х соответственно относительно первого и второго базисов. Заменяя в (3) х на ф(л:), получаем М' (v(x)) = T-*M(<p(x)). По теореме 2.3, М((р(х)) — М(ц>)М(х), следовательно, М'(у(х)) = Т~Щ(<р)М(х). Ввиду (2) отсюда получаем М' (Ф (х)) = [Т^М (ф) Г] М' (JC). Так как это равенство верно для любого х из V, то, по теореме 2.4, М' (<р) = Г-М* (ф) Т. П ОПРЕДЕЛЕНИЕ. Матрицы Л и В из множества fnxn называются подобными над полем <Р9 если существует такая обратимая матрица T^FnXn, что Л = = Т~1ВТ. Из теоремы 2.10 вытекает следующее следствие. СЛЕДСТВИЕ 2.11. Если ф — линейный оператор конечномерного ненулевого векторного пространства <3Уй, то матрицы этого оператора относительно любых двух базисов пространства подобны. ПРЕДЛОЖЕНИЕ 2.12. Отношение подобия матриц на множестве Fnxn есть отношение эквивалентности. Доказательство. Отношение подобия рефлексивно, так как А = Е~гАЕ, где Е — единичная матрица. Отношение подобия симметрично, так как из равенства А = Т~1ВТ следует В = (Т'1)-1 AT'1. Отношение подобия транзитивно, так как из А = Т1ВТ и В = Гг1СГ1 следует А = (Т1Ту1С(Т1Т). Отношение подобия матриц над полем of определяет разбиение множества F"x/l на классы эквивалентности, которые называются классами подобных матриц. Каждому линейному оператору векторного пространства *J/° соответствует единственный класс подобных матриц. Упражнения 1. Как изменится матрица линейного оператора, если в базисе ?j, ..., еп переставить какие-нибудь два вектора, например d и е? 2. Докажите, что ранг линейного оператора конечномерного векторного пространства равен рангу матрицы этого оператора. 297
3. Покажите, что всякий линейный оператор ранга г конечномерного векторного пространства можно представить в виде суммы г линейных операторов ранга 1. 4. Пусть V—векторное пространство всех квадратных матриц второго порядка над полем -F. Покажите, что преобразование ф, состоящее в умножении матриц из V слева на матрицу L , есть линейный оператор. Найдите матрицу оператора ф в базисе Г1 01 ГО П ГО 01 ГО 01 |_о oj' Lo oj' Li oj' Lo ij' 5. Докажите, что линейный оператор ф конечномерного векторного пространства V, перестановочный с каждым линейным оператором пространства W, есть скаляр, т. е. существует такой скаляр Л, что (р(х)=Хх для любого вектора х из V. 6. Пусть ф —произвольный, г|)—-обратимый линейный оператор конечномерного векторного пространства. Докажите, что ранг (фф) =«= = ранг (г|хр) = ранг ф. 7. Пусть ф, я|)—произвольные линейные операторы конечномерного векторного пространства. Докажите, что: (a) ранг (ф+'Ф)^ ранг ф +ранг г|>; (b) ранг (фг|?) ^ ранг ф, ранг (фт|?) ^ ранг г|э; (c) деф ф^деф (фг|5)^деф ф+деф f. 8. Приведите пример линейных операторов ф, г|? двумерного векторного пространства, для которых ранг (ф, я|>) Ф ранг (1(;ф). 9. Докажите, что для любых линейных операторов ф, i|> «-мерного векторного пространства выполняется неравенство ранг (фг|?) ^ ранг ф + ранг ар — /г. 10. Пусть ф—линейный оператор векторного пространства V* Подпространство 36 пространства V называется инвариантным относительно ф, еслиф(?)с?. Пусть относительно базиса #i, ...,?л оператор ф имеет диагональную матрицу с различными диагональньши элементами. Найдите все подпространства пространства V, инвариантные относительно ф, и покажите, что число их равно 2п. § 3. ЛИНЕЙНЫЕ АЛГЕБРЫ Линейная алгебра. Пусть of — поле скаляров. ОПРЕДЕЛЕНИЕ. Алгебра (V, +, HjXgeF},.) называется линейной алгеброй, если бинарные операции +, • и унарные операции ооя удовлетворяют следующим требованиям: 1) алгебра (V,+,{®b | К ^F}) есть векторное пространство над полем gF; 2) выполняются условия билинейности, т. е. (a+b)c = ac+bc, c(a+b) = ca+cb, соя (ab) = (co^a) b « a (%&) для любых a, b, с ^ V и любого K^F, 298
Рангом линейной алгебры называется размерность векторного пространства (V, + , {со^ЛеТ7}) Примеры. 1. Пусть С — множество всех комплексных чисел. Алгебра <С, +, {cogger},.) есть линейная алгебра над полем <М действительных чисел. Ее ранг равен двум. 2. Пусть FnXn— множество всех п х д-матриц над полем. Алгебра где ©^— унарная операция умножения на скаляр Я, является линейной алгеброй над полем оГ ранга /г2. Она называется полной матричной алгеброй над полем «Г. Ее ранг равен п2. 3. Алгебра кватернионов над полем <=>%. Пусть *)Р — четырехмерное векторное пространство над полем <М и еу i, j, k — его базис. Определим умножение базисных векторов следующими равенствами: i* = p = k* = —e, ij=—ji = k, jk = — kj=i, ki = — lk=j; ae = ea для любого вектора а^{е, /, /, ft}. Произведение любых двух кватернионов определяется равенством = {<mt — PPi —VYi — Щ е + + {a$1 + $a1 + yS1-8y1)i + + (aYl + alY + 6p1-p61)/ + + (a6l + o1e + Pyi-TPi)*. Кватернионы q = ae + p/ + yj+6ft и q = ae — p/ — yj— — 6ft называются сопряженными. Действительное число tf(#) = tf.<7 = a2+P2+V2 + 62 называется нормой кватерниона. Непосредственная проверка показывает, что выполняются условия билинейности. Таким образом, алгебра (V, +, K|A,esR}f.> является линейной. Она называется алгеброй кватернионов над полем действительных чисел. Легко проверить, что 299
алгебра (V, +, —, •, е) является некоммутативным кольцом, в котором для любых a, 6eF при афО уравнение ах = Ь разрешимо. Алгебра линейных операторов векторного пространства. Пусть ^ — векторное пространство над полем ef и <р, я|) — линейные операторы этого пространства. Произведение ф-ф определяется как композиция <р и ф, т. е. как отображение пространства °1Р в себя, ставящее в соответствие элементу х из V элемент ф (чр (jc)): (фф)С*) = Ф(Ф(*))- ПРЕДЛОЖЕНИЕ 3.1. Произведение любых двух линейных операторов векторного пространства °^Р есть линей- ный оператор этого пространства. Доказательство. Пусть <р и -ф —линейные операторы пространства *iP. Произведение срг|> удовлетворяет условиям линейности. Действительно, если д:, j>gF и IgF, to (фф) (х +У) = Ф (Ф {х +у)) = ф (* {х)+ф (у)) = = Ф (Ф (*))+ф (ч> (у)) = (фФ) (х) + (фФ) (>>); (ф'Ф) (ta) = Ф (Ф (to)) = ф (taj> (а:)) = Я (Ф (ф (л:))) = = М(фф)(*)). Таким образом, произведение фгр есть линейный оператор пространства *1P. Q Пусть ®)Р — векторное пространство над полем аГ. В силу следствия 1.6 сЯГот (6^°, ^ есть векторное пространство над полем оГ: ?Гот (ЧР, 'Г)-(НотИЛ <Т), +, K|be=F}>, где оя — унарная операция умножения линейных операторов пространства *jr на скаляр X. Рассмотрим алгебру <НотПЛ Ч>°), +, K|^sF}f->, где бинарная операция «•» есть операция умножения линейных операторов пространства ®]Р\ эта алгебра называется алгеброй линейных операторов пространства *J/° и обозначается End°4P. ТЕОРЕМА 3.2. Пусть ^Р' — векторное пространство над полем eF. Алгебра End^P является линейной алгеброй над полем oF. Доказательство. Согласно теореме 2.2, алгебра <Homfn *П +, К|Яее/Ч> 300
есть Ёекторное пространство над полем of. Кроме того, выполнены условия билинейности: (1) (ф + я|>)х = Ф)С + М; (2) X (ф + if») = %ф Ч- 5СФ; (3) мФф) = (Хф)ф = ф(Ьф), где Ф, я|>, xczHom^, <Т) и ?igF. Докажем равенство (1). Если x^V, то ((Ф + Ф) X) (*) = (Ф + Ф) (X И) = ф (х (*)) + ф (х (а:)) = = (фх) И+(Фх) С*) = (фх+П) (*)> т. е. имеет место (1). Аналогично доказывается (2). Докажем первое из равенств (3). Если x^V, то (Я (Фг|))) (*) - Я ((«До) (х)) = Я (Ф (г|> (*))) = (ЯФ) (ф (л:)) = = ((ЯФ)г|))(л;), т. е. Я (ф-ф) = (Яф) г|). Аналогично доказывается равенство (Яф)я|> = ф(Яг|)). П Изоморфизм алгебры линейных операторов и полной матричной алгебры. Пусть 31 и 5Г — линейные алгебры над полем of. Отображение Ф алгебры 51 на алгебру 81' называется изоморфизмом, если оно инъективно и сохраняет главные операции алгебры 51, т. е. Ф(а + Ь) = Ф(а)+Ф(Ь), Ф(Яа) = ЯФ(а), Ф(а6) = Ф(а)Ф(&) для любых a, b^V и любого ^gF. Алгебры 51 и 51' называют изоморфными, если существует изоморфизм алгебры 51 на алгебру 51' Легко проверить, что отношение изоморфизма на какой-либо совокупности алгебр над полем of есть отношение эквивалентности. Пример. Алгебра комплексных чисел <С, + , K|Xe=R}, •> изоморфна алгебре всех матриц вида , над <М\ При этом соответствие 301
устанавливает изоморфизм рассматриваемых линейных алгебр. Обозначим через Ш(п, <гГ) полную матричную алгебру над oF: ЗИ(л, f) = (F*x*9 +, {©х|Яе^Ь • >. ТЕОРЕМА 3.3. Пусть ^ — конечномерное векторное пространство над полем of с фиксированным базисом е19 ..., ?Л. Отображение, ставящее в соответствие каждому линейному оператору ф пространства °]Р его матрицу М (ф) относительно фиксированного базиса, является изоморфизмом алгебры линейных операторов End°1P на полную матричную алгебру Ш{п, <sF). Доказательство. Соответствие фн-^М(ф) есть отображение множества End *)Р = Нот И/3, *JP) на множество ofnXn nх/г-матриц. В силу теоремы 2.1 это отображение биективно. Кроме того, оно сохраняет все главные операции алгебры End°^P9 т. е. (1) М(ф + 10 = Л1(ф) + М(ф), (2) Д4(Яф) = Ш(ф), (3) М(фф) = А!(ф)М(ф) для любых ф, я|э е Нот О3^, <3Т) и любого X^F. Равенства (1) и (2) были доказаны в предыдущем параграфе. Докажем равенство (3). Пусть jcgK. Тогда (фЧ>) (jc) = = ф(г|)(л;)) и, по теореме 2.3, М ((фф) (*)) = М (ф (* (л:))) = М (Ф) М (ф (л:)) = = [M(q>)M(ty)]M(x). Таким образом, для любого вектора леУ М ((фя|)) (х)) = [АГ (ф) Мф] М (х). Согласно теореме 2.4, отсюда следует равенство (3). Следовательно, рассматриваемое отображение является изоморфизмом алгебры End°^P на алгебру Ш(п, оГ). Упражнения 1. Докажите, что умножение кватернионов ассоциативно. 2. Докажите, что в алгебре кватернионов система уравнений ix+jy=e, kx—ey=i имеет единственное решение, а система уравнений xi+yj=e, xk—ey—l решений не имеет. 302
3. Пусть a = ae+$l+yj + 6fc —кватернион и а* = ае—-р/— —у/ — 6&. Покажите, что для любых кватернионов а, Ь (a) N(a) = aa*=a2+p2+v2+62; (b) N(ab) = N(a)N(b); (c) (a&)* = 6*a*. 4. Покажите, что существует бесконечно много кватернионов, удовлетворяющих уравнению Jt2 + ? = 0. 5. Пусть а = ае+Р*+V/ + $& ~ любой кватернион. Проверьте, что кватернионы a via* являются корнями уравнения x2—2ax+N (a)e = 0. 6. Покажите, что если кватернион а не является действительным числом, то существует только два кватерниона, удовлетворяющих уравнению х2=а. 7. Докажите, что для любых двух кватернионов а и Ь (aa*)(bb*) = (ab)(ab)*, Выведите отсюда, что если каждое из чисел т, п есть сумма квадратов четырех целых чисел, то произведение тп также есть сумма квадратов четырех целых чисел. 8. Докажите, что в алгебре кватернионов каждое из уравнений ax=b, ya = b при аФО имеет единственное решение. 9. Покажите, что множество всех отличных от нуля кватернионов образует группу относительно умножения, 10. Покажите, что восемь кватернионов ± е, ±i, ±/, ± k образуют мультипликативную группу (она называется группой кватернионов). 11. Пусть 51 —алгебра ранга п над полем ^. Покажите, что при k>n любые k элементов алгебры 51 линейно зависимы над полем 3:- 12. Пусть /, /, /, К—соответственно комплексные матрицы [О lj> [-1 0J' [i 0\> [о -ф где i=Y^\. Покажите, что /2=/2=К2=:-- 1, // = -// = /<', 13. Докажите, что алгебра матриц вида a+Р* 7 + бП с действительными а, р, у, б и i=Y"— 1 изоморфна алгебре кватернионов над полем действительных чисел, § 4. ОБРАТИМЫЕ ОПЕРАТОРЫ Обратимые операторы. Пусть ф —линейный оператор векторного пространства ®\Р и 8 — тождественный оператор этого пространства. Оператор ф называется обратимым, если существует такой линейный оператор г|э пространства ^, что (1) фг|э = е, г|)ф = 8, 303
Оператор я|э, удовлетворяющий условиям (1), существует только один. Действительно, если оператор % удовлетворяет условиям фг|)1 = 8, грхф = е, то •фх = %8 = г|)х (фг|)) = (^ф) г[) = е-ф = я|), т. е. -ф^г]). Линейный оператор г|э, удовлетворяющий условиям (1), называется обратным к оператору ф и обозначается qr1. ТЕОРЕМА 4.1. Пусть ф — линейный оператор конечномерного ненулевого векторного пространства *]Р. Тогда следующие условия равносильны: (a) оператор ср обратим; (b) ф есть инъективное отображение Ч? на б*#°; (c) КегФ = {0}; (d) дефект ф = 0; (e) раяг q> = dim*#°; (f) матрица оператора ф относительно любого базиса пространства ЧР обратима. Доказательство. Пусть ф —обратимый оператор и г|) — оператор, обратный ф. Докажем, что ф инъективно, т. е. для любых a, &gF, из ф(а) = ф(6) следует а*=&. Действительно, если ф(#) = ф(&), то я1)(ф(а)) = я|)(ф(&), (я|)ф)(а) = (г|)ф)(6), е(а) = е(&),я = &. Кроме того, ф есть отображение на V, т. е. для любого АбУ существует прообраз. Действительно, Ф (<ф (#)) = (ф\|)) а = еа = а, т. е. г|)(а) есть прообраз элемента а при отображении ф. Если ф есть инъекция, то нулевой вектор 0 имеет единственный прообраз при отображении ф, т. е. Кегф = {0}. Если Кегф = {0}, то размерность ядра оператора ф равна нулю, т. е. дефект ф = 0. Если дефект ф = 0, то по теореме 1.4, ранг ф = dimбtJ^. Предположим, что ранг ф = dim0У)=/г. Пусть еъ ... ..., еп — фиксированный базис пространства ПР. По теореме 2.6, ранг матрицы М (ф) равен рангу оператора ф и, значит, равен п. Таким образом, строки матрицы М (ф) линейно независимы. Следовательно, по теореме 5.1, матрица М(ф) обратима. Предположим, что матрица М (ф) обратима и В — обратная к ней матрица, т. е. М(у)В = Е и ВМ{<р)=Е. 304
По теореме 2.1, существует линейный оператор я|) пространства ьх1/° такой, что В есть матрица оператора г|) относительно фиксированного базиса, т. е. В = М(ф). Кроме того, М(г) = Еу следовательно, М(ф)М(я|)) = М(е) и М(г|>)М(ф) = М(8). В силу теоремы 3.3 М (ф) М (г|)) = М (фф) и М (г|)) М (ф) = = М (г|хр), поэтому М (ф-ф) = М (е), УН (я|)ф) = М (е). Согласно теореме 2.1, отсюда следуют равенства фф = е и г|хр = 8, т. е. оператор ф обратим. ? Полная линейная группа. Согласно теореме 5.1, множество всех обратимых nx/i-матриц над полем oF есть группа относительно операций умножения и образования обратного элемента. ОПРЕДЕЛЕНИЕ. Мультипликативная группа всех обратимых яхя-матриц над полем gF называется полной линейной группой степени п над полем <У и обозначается GL(/z, ef). Легко видеть, что любой обратимый оператор векторного пространства ^ есть автоморфизм этого пространства. Обратно: любой автоморфизм пространства *)Р есть обратимый оператор. Множество всех обратимых операторов векторного пространства *1Р обозначается Autb/^. Рассмотрим алгебру (Aut6^3, •, "1>, где • есть бинарная операция умножения линейных операторов пространства *VJ и -1 есть операция образования оператора, обратного к данному оператору; эту алгебру будем обозначать символом o^ut^. ТЕОРЕМА 4.2. Пусть *V*,— векторное пространство над полем JF. Тогда алгебра oS?ut *]Р есть гшппа. Доказательство. Множество Aut0/^ обратимых операторов пространства ^ замкнуто относительно операций • и ~1. Действительно, если ф —обратимый оператор, то ф"1 есть обратимый оператор, так как фф-1 = = ф-!ф = е. Кроме того, если ф и я|э — обратимые операторы, то их произведение есть обратимый линейный оператор, так как (фф) (^Ф-1) = 8 и (Ф^Ф-1) (ф^) = 8- Согласно теореме 2.3, умножение линейных операторов ассоциативно. Тождественный оператор 8 обратим и является нейтральным элементом относительно умножения, 305
т. е. ф8 = 8ф = ф для любого линейного оператора ф. Наконец, для любого обратимого оператора ф выполняются равенства фф-1 = ф-1ф = е. Таким образом, главные операции алгебры o^ut ^iP удовлетворяют всем групповым аксиомам. Следовательно, эта алгебра является группой. ? ТЕОРЕМА 4.3. Пусть *V* есть n-мерное ненулевое векторное пространство над полем of'. Тогда группа o^ut^)P изоморфна полной линейной матричной группе GL(n, f). Доказательство. Рассмотрим биективное отображение Ф: Aut^->GL(njeT)f определяемое равенством Ф (<р) = М (ф), где М (ф) — матрица линейного оператора ф относительно фиксированного базиса пространства ^. Согласно теореме 3.3, для любых Ф, a|)^Aut6T М(фг|)) = М(ф)М(г|)). Следовательно, для любых обратимых операторов ф, г|э имеем Ф(фг|)) = Ф(ф)Ф('ф). По теореме 3.3.1, отсюда следует, что Ф есть гомоморфизм. Следовательно, Ф есть изоморфизм группы orfutHf* на группу GL(n, gF). п Упражнения 1. Пусть ф, ф—обратимые линейные операторы векторного пространства. Докажите, что фф есть обратимый линейный оператор и (фф)-1==ф-1ф-1. 2. Покажите, что линейные операторы ф, ф векторного пространства обратимы тогда и только тогда, когда обратимы операторы фф и фф. 3. Пусть ф — обратимый оператор векторного пространства °ff. Покажите, что ф есть изоморфизм V на W. 4. Пусть ф, ф— линейные операторы конечномерного векторного пространства ф. Покажите, что если фф есть тождественный оператор пространства V, то ф и ф обратимы. 5. Пусть ф, ф—линейные операторы векторного пространства. Покажите, что если Кег ф = Кег ф = {0}, то Ker (фф) = {0}. 6. Пусть ф есть линейное отображение векторного пространства U в векторное пространство V и ф—линейное отображение V в векторное пространство W. Докажите, что если Кегф = {0} и Кегф = = {0'Ь тоКег(фФ)={0}. 7. Пусть ф —обратимый и ф — произвольный линейный оператор конечномерного векторного пространства. Покажите, что ранг (фф) = = ранг (фф) =г ранг ф. 8. Докажите, что линейный оператор конечномерного векторного пространства V обратим тогда и только тогда, когда он каждую линейно независимую систему векторов пространства V переводит в линейно независимую систему векторов этого пространства» 306
9. Пусть d%"o/n (2Г, V) есть векторное пространство всех линейных операторов пространства W. Пусть ф—фиксированный и if — произвольный линейный оператор пространства V» Докажите, что отображение г|э i—> фг|э является линейным оператором пространства о%Гот(ф, V)- Покажите, что множество {(pty|i|) e Нот (V, V)} совпадает с множеством всех линейных операторов векторного пространства Q%Tom(W, W), если ф—-обратимый оператор. § 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ. ХАРАКТЕРИСТИЧЕСКИЕ УРАВНЕНИЯ Собственные векторы и собственные значения. Пусть ^—векторное пространство над полем oF и ф —линейный оператор этого пространства. ОПРЕДЕЛЕНИЕ. Вектор йеУ называется собственным вектором оператора <р, если а^Ои вектор ф(а) равен произведению скаляра и вектора а. Скаляр X^F называется собственным значением оператора ф, если существует такой ненулевой вектор а, что ф(а) = Ха. Если а — собственный вектор оператора ф, то существует единственный скаляр ^gF, удовлетворяющий условию ф(а) = ^а. Действительно, если афО, то из равенства %а = %ф следует Я = Аа. Поэтому, если ф(а) = Яа, говорят, что вектор а принадлежит собственному значению К. Примеры. 1. Пусть *)Р есть ненулевое векторное пространство над полем оГ и X — фиксированный скаляр. Определим отображение ф: V->V, полагая ф(а) = Яадля любого agF. Легко видеть, что ф есть линейный оператор пространства ®)Р\ он называется оператором гомотетии с коэффициентом %. Скаляр % есть собственное значение оператора ф и притом единственное. Любой ненулевой вектор пространства ^ есть собственный вектор оператора ф, принадлежащий собственному значению %. 2. Пусть ^—-векторное пространство действительных функций одной переменной, определенных на R и неограниченно дифференцируемых; ПР есть пространство над полем действительных чисел е^. Обозначим через -^ оператор дифференцирования, ставящий в соответствие каждому элементу /gF его производную -^-. Легко видеть, что оператор дифференцирования есть линейный оператор пространства °1/°. Если XgR, то функция еи" есть собственный вектор оператора дифференцирования, 307
так как ~т?-~кекх. Таким образом, любое действительное число является собственным значением оператора дифференцирования. 3. Пусть ^ — двумерное векторное пространство над полем действительных чисел е^, (3il/D=effi!2, naeR. Обозначим через фа оператор поворота, ставящий в соответствие каждому вектору пространства СУ вектор, образующий с исходным вектором угол ос. Легко видеть, что фа есть линейный оператор пространства ^]Р, который не имеет собственных векторов, если афЫ, где k--целое число. Обозначим через 8 тождественный оператор векторного пространства *#°. Если ф —линейный оператор пространства v и X —любой скаляр, JigF, to легко видеть, что А,е —ф является линейным оператором пространства *V*m ПРЕДЛОЖЕНИЕ 5.1. Пусть ф — линейный оператор векторного пространства СУ и А, — собственное значение этого оператора. Множество всех собственных векторов оператора ф совпадает с множеством Ker (Х& — ф)\{0}. Доказательство. Согласно определению ядра, Кег (Ле - ф) = {х е V | (Хе —<р) (х) = 0}. Если а е Кег (Хе — ф)\{0}, то (Хе —ф)(а) = 0, Хг(а) — ф(а) = 0, <р(а)=%а. Таким образом, любой ненулевой вектор множества Кег(Х& — ф) является собственным вектором оператора ф. Пусть Ь — любой собственный вектор оператора ф, принадлежащий X, т. е. ф(й) = Х&, тогда М-ф(&) = 0, Я8&-ф(&) = 0, (Хе-ф)(&)=0. Следовательно, Ь^ Кег(Х8 — ф), и так как ЬфО, то &е=Кег(Х&--ф)\{0}. ? Нахождение собственных векторов линейного оператора. Пусть ^ — векторное пространство над полем of с фиксированным базисом еъ ..., еп, ф ¦— линейный оператор этого пространства и А = М (ф) — матрица оператора ф- относительно фиксированного базиса, Л=||а^|]. Для нахождения собственных векторов оператора ф, принадлежащих К, надо найти Кег(Хе — ф). Пусть х — вектор из V; в фиксированном базисе он имеет коорди- 308
натный столбец & = М(х): Pi Согласно теореме 2.3, координатным столбцом вектора (Хе-ц))(х) является (%? — A)&, т. е. М ((Яе - ф) (х)) = = (Х? — А)ЗС. Вектор х^Кег(Кг — ф) тогда и только тогда, когда (I) {кЕ-А)Ж = 0. Условие (1) можно записать в виде однородной линейной системы относительно переменных хъ ..., хп: (К - Оц) % — а12х2 —... - а1/гл:Л = 0; /1 ч #2"Л. ~Г (^ ^22) #2 — • • • &2пХп ==: Ф -Mi — яя2*2 —... + (Я--аля)я:я = 0. Вектор х ^V тогда и только тогда есть собственный вектор оператора ф, принадлежащий собственному значению X, когда координатная строка (хъ ..., хп) вектора х является ненулевым решением линейной однородной системы (1). Таким образом, доказано следующее предложение. ПРЕДЛОЖЕНИЕ 5.2. Пусть ф — линейный оператор векторного пространства ЬУ~ с фиксированным базисом и М (ф) = А — матрица оператора ф относительно фиксированного базиса. Вектор х тогда и только тогда есть собственный вектор оператора ф, принадлежащий собственному значению К, когда координатная строка вектора х является ненулевым решением системы (1). Характеристическое уравнение. Пусть ^=<У n — пространство /г-мерных арифметических векторов-столбцов над полем of. Пусть Л— фиксированная /гх/г-матрица над оГ. Рассмотрим отображение if: X-+AX для любого X е /й. Легко проверить, что я|э является линейным оператором пространства ^Л ОПРЕДЕЛЕНИЕ. Пусть А есть nx/г-матрица над полем еГ. Вектор-столбец X называется собственным вектором матрицы А, если X —ненулевой вектор и АХ можно представить в виде произведения скаляра и вектора X, т. е. в виде АХ = ХХ. При этом Я называется собственным значением матрицы Л. 309
Легко видеть, что собственные векторы и собственные значения линейного оператора г|) суть собственные векторы и собственные значения матрицы А. ТЕОРЕМА 5.3. Пусть А —квадратная пхп-матрица над полем eF. Элемент К из F есть собственное значение матрицы тогда и только тогда, когда (1) |Я?-Л| = 0. Доказательство. Элемент X, ?iEf, есть собственное значение матрицы А тогда и только тогда, когда существует такой ненулевой вектор-столбец X±^Fn9 что АХ1 = КХ1 и, следовательно, (ХЕ — А)Х1 = 0. Другими словами, X есть собственное значение матрицы А тогда и только тогда, когда уравнение (2) (А-ХЕ)Х = 0 имеет ненулевое решение. Уравнение (2) можно рассматривать, как матричную форму записи системы п линейных уравнений с п переменными с матрицей (А— ХЕ). Уравнение (2) имеет ненулевое решение тогда и только тогда, когда определитель матрицы (А — ХЕ) равен нулю.П СЛЕДСТВИЕ 5.4. Элемент X поля gF является собственным значением матрицы А тогда и только тогда, когда матрица ХЕ — А необратима. ОПРЕДЕЛЕНИЕ. Пусть А — квадратная п х я-матрица над полем «F. Уравнение \ХЕ — А\ = 0 с переменной X называется характеристическим уравнением матрицы А. СЛЕДСТВИЕ 5.5. Скаляр X^F есть собственное значение квадратной матрицы А (над <F) тогда и только тогда, когда X является корнем характеристического уравнения этой матрицы. Пример. Пусть А = — матрица над полем скаляров е%*. Тогда Уравнение = 0, или (^— I)2 —2 = 0, есть характеристическое уравнение матрицы А. Его корни %-1 —1 —2 К-1 310
Ях = 1 +1/^2, Х2 = 1 — У2 являются собственными значениями матрицы А. ПРЕДЛОЖЕНИЕ 5.6. Пусть А и В - подобные пхп- матрицы над полем скаляров оГ. Тогда | ХЕ — А | = | ХЕ — В \ и характеристические уравнения этих матриц совпадают. Доказательство. Так как А я В подобны, то существует обратимая матрица Т над ©F такая, что А = = Г"15Г, поэтому ХЕ-А = ХЕ-Т~1ВТ = Т-1(ХЕ-В)Т; следовательно, IbE-Al^lT-iWXE-BWT]. Так как IT"1! | Т | = \Т~*Т\ = | Е\ = 1, то |А,?-Л|=* = |А,? —В|. Отсюда следует, что характеристические уравнения |Ь?-Л| = 0 и \ХЕ-В\ = 0 соответственно матриц А и В совпадают. ? ОПРЕДЕЛЕНИЕ. Пусть ф —линейный оператор конечномерного ненулевого векторного пространства *J/° и М (ф) — его матрица относительно какого-либо базиса. Уравнение | ХЕ — М (ф) | = 0 называется характеристическим уравнением оператора ф. Линейные операторы с простым спектром. Изучим линейные операторы n-мерного векторного пррстранства, имеющие п различных собственных значенцй. ТЕОРЕМА 5.7. Если собственные векторы аъ ..., ат линейного оператора имеют различные собственные значения, то система аъ ..., ат линейно независима. Доказательство. Пусть ф — линейный оператор векторного пространства °У° и аъ ..., ат — его собственные векторы, принадлежащие различным собственным значениям, т. е. (1) ф (аг) = Mi» • • • > Ф (Ят) = Кат и (2) Х1фХк при 1фк. Доказательство проводится индукцией по числу т. Так как любой собственный вектор отличен от нулевого вектора, то теорема верна при т=1. Предполагая, что теорема верна для т—\ векторов, докажем, что она верна
для т векторов. Надо доказать, что для любых alf ... ..., amGF из равенства (3) a1a1-b.. + amam = 0 следуют равенства (4) а1 = 0, ..., <хт = 0. Так как ф есть линейный оператор, то из (3) следует равенство ахф (ах) +... + атф (ат)1 = 0 и в силу (1) (5) аЛя 1 + • - • + ^тКат = 0. Прибавив к обеим частям равенства (5) соответствующие части равенства (3), умноженные на (—Хт), получим (6) о^ (Лх - %т) аг+... + ат_г (A,m_x - %т) ат-г = 0. По индуктивному предположению, система собственных векторов #i, ..., ат_! линейно независима. Поэтому из (6) следуют равенства а1(Х1--Хт) = 0, ..., «„g-i^-i — ^)=0. Ввиду (2) отсюда имеем (7) ах = 0, ..., а^_! = 0. В силу (3) и (7) ашат = 0, кроме того, атФ§\ следовательно, аш = 0. Таким образом, доказано, что из (3) следует (4), т. е. система alf ..., ат линейно независима. ? ОПРЕДЕЛЕНИЕ. Линейный оператор я-мерного векторного пространства (/г>0), имеющий п различных собственных значений, называется оператором с простым спектром; набор всех собственных значений оператора называется спектром оператора. ПРЕДЛОЖЕНИЕ 5.8. Пусть у —линейный оператор n-мерного векторного пространства 6У с простым спектром {Хъ ..., Хп}. Пусть el9..., еп — собственные векторы оператора ф, принадлежащие соответственно Хг, ..., Хл. Тогда система еъ ..., еп является базисом пространства *J/°. Доказательство. По условию, спектр Xlf ..., %п оператора ф состоит из попарно различных скаляров. По теореме 5.7, отсюда следует, что система собственных векторов еъ ..., еп линейно независима. По следствию 7.3.4 отсюда вытекает, что система е19 ..., еп есть базис пространства °У. П 312
ТЕОРЕМА 5.9. Пусть ф — линейный оператор п-мер- ного векторного пространства °^Р с простым спектром %и ..., Хп и еъ ..., еп — собственные векторы оператора ф, принадлежащие соответственно собственным значениям ^i, • ••, К* Тогда диагональная матрица является матрицей оператора ф относительно базиса €l> • ••» впМ для любого вектора x = x1ei+...-\-xnen пространства °^° (2) ф (л:) = K^i+• • • + Кхпеп- Доказательство. По условию, (3) ф(в1) = Я1в1, ..., (р(еп)=Ке^ Эти равенства показывают, что диагональная матрица (1) является матрицей оператора ф относительно базиса еъ ..., еп. Далее, если x^V и х = ххех +...+хпеп, то ввиду линейности оператора ф имеем ф (х) =х±^ (е±) + ... ... + xnq>(en). В силу (3) отсюда следуют равенства (2). П Условия, при которых матрица подобна диагональной матрице. ТЕОРЕМА 5.10. Пусть А есть пхп-матрица над полем еГ, имеющая п линейно независимых собственных векторов, и Т —матрица, столбцы которой суть линейно независимые собственные векторы матрицы Л. Тогда матрица Т~гАТ диагональна и элементы ее главной диагонали являются собственными значениями матрицы А. Доказательство. Пусть Х19 ..., Хп — линейно независимые собственные векторы матрицы А, принадлежащие соответственно Klt ..., Я/г, т. е. АХ1 = Х1Х1, ..., АХп = кпХп. Обозначим через Т такую матрицу, что Т'1 = ХЬ для i= 1, ..., п, т. е. Г = [Х15 ..., Хп]. Так как столбцы матрицы Т линейно независимы, то она обратима. Из определения произведения матриц следует, 313
что AT = [AXl9 ..., АХЯ\Щ откуда ввиду (1) имеем AT=s\kiXl9 ..., ЛЯХЛ] = [Х1, Хя] ^7И = 7 Л Таким образом, получаем Г*1 К Т-*АТ = и ТЕОРЕМА 5.11. Если квадратная матрица А порядка п подобна над полем <& диагональной матрице, то матрица А имеет п линейно независимых собственных векторов. Доказательство. Предположим, что матрица А подобна над sF диагональной матрице, т. е. существует такая обратимая матрица 7\ что [К (1) Т-МГ: причем Хц ..., Яяе/\ Умножив слева обе части равенства (1) на Т, получим [К АТ = Т Следовательно, [АТ\ ..., AT*\ = [bJ*> ..., КТ»1 поэтому АТ1^=КТК ..., АТп = КТп, т. е. столбцы Т1, ..., Тп матрицы Т являются собственными векторами, принадлежащими соответственно >*х, ... ..., %п. Так как матрица Т обратима, то ее столбцы линейно независимы (по теореме 5.1). ? 314
Упражнения 1. Найдите собственные векторы и собственные значения следующих матриц над полем рациональных чисел: »п«Бз*па- 2. Пусть а—ненулевое действительное число. Покажите, что матрица п не имеет действительных собственных значений. 3. Пусть а—действительное число, отличное от нуля. Найдите собственные значения и собственные векторы над полем комплексных [cos a sinal — sin a cos a J 4. Найдите собственные векторы и собственные значения над полем комплексных чисел следующих матриц: ГО О П ГО 0 0] (а) 0 1 0 ; (Ь) 1 0 1 ;(с) I" % ;(d) Я. Ь о oj Lo 1 oj lz ~Z1 L л г J 5. Пусть Л = vl — матрица над полем F. Покажите, что скаляр X еF есть собственное значение матрицы Л, когда X2 — (a+fi)А,+ + (a6-pv) = 0. 6. Докажите, что собственными значениями действительной симметрической матрицы являются действительные числа. 7. Пусть Л —квадратная матрица. Покажите, что транспонированная матрица М имеет те же собственные значения, что и матрица Л. 8. Покажите, что собственными значениями диагональной матрицы являются ее диагональные элементы. 9. Докажите, что собственными значениями треугольной матрицы являются ее диагональные элементы. 10. Докажите, что все собственные значения квадратной матрицы Л отличны от нуля тогда и только тогда, когда матрица Л обратима. 11. Пусть Л—-квадратная матрица и k — любое целое положительное число. Докажите, что если X—собственное значение матрицы Л, то Xk является собственным значением матрицы Ak. 12. Зная собственные значения обратимой матрицы Л, найдите собственные значения матрицы Л*"1. 13. Пусть Я—собственное значение обратимой матрицы Л. Докажите, что Хп является собственным значением матрицы Ап для любого целого числа п. 14. Пусть А — квадратная матрица над полем ^: f(X)=aQ+aiX + ...+amXm, где a0, aL> ..., ат е F, f(A)—a0E-\-<XiA + ...-\-amAm (E—единичная матрица), Докажите, что если X—собственное значение матрицы Л, то f(X) является собственным значением матрицы }(А). Покажите, что любой собственный вектор матрицы А является собственным вектором матрицы f(A), 315
15. Пусть Л, Б —квадратные яхя-матрицы над полем &, причем матрица Л обратима. Докажите, что матрицы АВ и В А имеют одно и то же характеристическое уравнение. 16. Найдите диагональную хматрицу, подобную над полем рациональных чисел матрице: 17. Найдите диагональную матрицу, подобную над полем действительных чисел матрице: 18. Найдите диагональную матрицу, подобную над полем комп- Г О П лексных чисел матрице . . 19. Пусть а—действительное число, не являющееся целым крат- г, Г cos a sin al ^ ным числа я. Докажите, что матрица . не подобна деи- r [_— sma cosaj ствительной диагональной матрице. 20. Покажите, что любая действительная диагональная матрица, определитель которой отрицателен, подобна действительной диагональной матрице ¦. 21. Пусть Л = L А —матрица над полем 3? и афО. Докажите, что матрица Л не подобна диагональной. 22. Докажите, что две диагональные матрицы подобны тогда и только тогда, когда они отличаются только порядком расположения диагональных элементов. 23. Пусть Л—матрица, подобная диагональной матрице. Докажите, что матрица Ап подобно диагональной для всякого целого положительного числа. 24. Найдите все квадратные матрицы второго порядка над полем $ с собственными значениями 1 и —1,
Глава девятая СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ § 1. СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ Основные понятия. Система вида (1) ailx1+... + al„Xn<:yi (* = 1, ..., tn), где щ е R, yt e R, называется системой линейных неравенств. Положим Я/ = (аа, ..., а/я) (* = 1, ..., m). Систему (1) можно записать в векторной форме: (2) diX^yi (i = lf ..., /я), Г V где л; = -# Обозначим через Л матрицу, составленную из коэффициентов системы (1): Гaii .- «ml |_aml ... ocmnJ Систему (1) можно записать в матричной форме: (3) Ах^с9 где с = \ J LYWJ Пусть е^* есть д-мерное арифметическое пространство над полем действительных чисел е^ и Rn — его основное множество. Вектор из R* с координатами §х, ..., ?л называется решением системы (1), если «uSi + ... + a/«bi<Y< ('=1> •••» n)- 317
Система (1) называется совместной, если она имеет хотя бы одно решение. Система (1) называется несовместной, если она не имеет решений. Вектор (glf ..., In) e R* называется неотрицательным, если & 52= 0 для ? = 1, ..., п. Неотрицательный вектор (h> • ¦ • > 1я) называется положительным, если положительна хотя бы одна его координата. Неравенство (4) Рл+.-. + Рл^У называется следствием системы (1), если каждое решение системы (1) является решением неравенства (4). Неравенство вида (5) (Х1а1+...+Ьтат)х^к1у1+... + Хтут, где ^х^О, ..., Хт^0, называется неотрицательной линейной комбинацией неравенств системы (2). ПРЕДЛОЖЕНИЕ 1.1. Любая неотрицашльная линейная комбинация неравенств системы (2) является следствием этой системы. Доказательство. Пусть неравенство (5) есть неотрицательная линейная комбинация неравенств системы (2). Пусть |eR" есть любое решение системы (2), (6) 0;|<у< (f==1» •••> mY Умножив 1-е неравенство (6) на h: для i = lf ..., т и сложив все эти неравенства, получим (Ml + --- + ^m«m)|^>v1Y1 + ... + ^Ym. Таким образом, неравенство (5) является следствием системы (2). ? Однородные системы линейных неравенств и выпуклые конусы. Пусть ^ — арифметическое векторное пространство над полем действительных чисел е^, б^р = е%,л, и аъ ..., ат — векторы пространства *J/°. Система (1) diX^O (i = l, ..., т) называется однородной линейной системой неравенств. ОПРЕДЕЛЕНИЕ. Непустое множество векторов векторного пространства *J/°, замкнутое относительно сложения и умножения на неотрицательные скаляры (неотрицательные действительные числа), называется выпуклым конусом пространства ^J/0. 318
Примеры. 1. Пусть fl?R" и афО. Множество {AaJXSsO, ?ieR} есть выпуклый конус пространства <Мп. Этот конус называется полупрямой, порожденной вектором а. 2. Множество всех неотрицательных комбинаций системы векторов аг, ..., ат пространства <Мп есть выпуклый конус этого пространства; его мы будем обозначать через U(аъ ..., ат). 3. Пусть ®\Р = <=ffin, 35 — подпространство пространства *j/° и L —его основное множество. Тогда L есть выпуклый конус пространства *J/°. 4. Множество всех неотрицательных решений однородной линейной системы неравенств (1) есть выпуклый конус пространства <3УЭ. 5. Пусть aGR" и афО. Множество всех решений неравенства ах^ О есть выпуклый конус пространства бУ\ Этот конус называется полупространством пространства ®У*, определяемым вектором а. ПРЕДЛОЖЕНИЕ 1.2. Множество всех решений однородной линейной системы (1) есть выпуклый конус векторного пространства *]/*. Доказательство этого предложения предоставляется читателю. СЛЕДСТВИЕ 1.3. Если а1У..., ат — ненулевые векторы, то конус всех решений однородной линейной системы (1) является пересечением т полупространств пространства ®)Р, определяемых векторами alf ..., ат. Следствия однородной системы линейных неравенств. Для доказательства теоремы Минковского необходимы следующие две леммы. ЛЕММА 1.4. Если (3) ЬфЬ(аг, ..., ат), то неравенство (2) Ьх^О не является следствием системы (1) diX^Q (i = l, ..., m). Доказательство. Ранг системы векторов аъ ... ..., ат обозначим через г. Предположим, что выполняется условие (3), тогда (4) ранг {а19..., ат Ь} = ранг {аъ ..., ат\ +1 = г +1. 319
Пусть 0* = (a/i, • •, а/л) (t = l, ..., m); » = (Pi. ..., ря). Рассмотрим систему линейных уравнений аи*1 + .-- + О1Я*я==0, (5) ат1хг +... + атпхп = О, РЛ + ... + Р|Л*=1. На основании (4) заключаем, что ранги основной и расширенной матриц системы (5) равны г+1. Следовательно, система (5) совместна. Поэтому существует вектор | такой, что Вектор § является решением системы (1), не удовлетворяющим (2). Таким образом, неравенство (2) не является следствием системы (1). ? СЛЕДСТВИЕ 1.5. Если неравенство (2) есть следствие системы (1), то b^L(al9 ..., ат). По закону контрапозиции, это утверждение равносильно лемме 1.4. ЛЕММА 1.6. Пусть неравенство (2) сх^О есть следствие системы (1) щх^О (i" = l, ..., т) и (3) с = Хга±+...+Ki-iam-x+hmam, Тогда неравенство (2) является следствием системы (4) яус^О (t=l, ..., т—1). Доказательство. Рассмотрим систему (I) ЯхЖО, ..., а^лг^О, (—ат)л:^0. 320
Вектор с в силу (3) есть неотрицательная линейная комбинация векторов а19 ..., ат-и (— Ят)> С = %& + ... + K-lum-1 + (— К) (— CLm). В силу предложения \Л отсюда следует, что (2) является следствием системы (II): (5) (И)-*(2). Надо доказать, что любое решение % системы (4) является решением неравенства (2). Возможны два случая: flm?^0 или (—ат)|^0. Если #т?<;0, то § есть решение системы (1) и, следовательно, по условию, | является решением неравенства (2). Если же —tfml^O, то | есть решение системы (Г); следовательно, ввиду (4) является решением и неравенства (2). Итак, любое решение системы (4) является решением неравенства (2). ? Теорема Минковского. В теории линейных неравенств одной из основных является следующая теорема. ТЕОРЕМА 1.7. Пусть неравенство (2) Ьх^О есть следствие системы (1) aiX^Q (t = l, ..., т). Тогда b^L+ (al9 ..., ат). Доказательство*} (проводится индукцией по т). Теорема верна при т=1. Действительно, пусть ЬфО. По условию, неравенство Ьх^О есть следствие неравенства ахх^0. По следствию 1.5, Ь = ЫЪ где ?igR. Так как ЬфО, то КФ0, агФ0 и а1а1>0. Поэтому вектор (— ах) есть решение неравенства OiX^O и, по условию, решение неравенства (2), т. е. %а±(—а^^О. Следовательно, %>0. Теорема, очевидно, верна также при Ь==0. Предположим, что теорема верна, когда система содержит т — 1 неравенств. Так как (1)->-(2), то, по следствию 1.5, b^L(aly ..., ат). Среди представлений вектора b существует представление с наибольшим числом неотрицательных коэффициентов. Пусть (3) & = Я1а1+... + Ятат — одно из таких представлений. Пусть s есть число неот- *} Доказательство дано в работе С. Н. Черникова «Об основных теоремах теории линейных неравенств». Сибирск, матем, ж., 1964, № 5. 321
рицательных коэффициентов в (3), s^m. Надо доказать, что s = m. Допустим, что (4) s<m. Мы будем считать, что коэффициенты 7^, ..., %s неотрицательны. Рассмотрим вектор ?= 2 hai+Kami 1 < i^ s тогда (5) &-* = 2 W Пусть М — множество всех решений системы (1) и| — любой вектор из М, тогда а*?<;0 и %*(zi*|)^0, если s<.k<Cm; следовательно, (6) (&-*)!= 2 M*S3*0. s <fc <m Кроме того, по условию, #?<;0; поэтому (7) ?$ + (&-*)§«>. На основании (6) и (7) заключаем, что с|<; 0 для любого | из М, т. е. неравенство ел; ^ 0 есть следствие системы (1). По лемме 1.6, отсюда вытекает, что неравенство слг^О есть следствие системы Я/ЛГ^О (t = l, ..., m—1), состоящей из m — 1 неравенств. По индуктивному предположению, c^L+(at, ..., dm-i), т. е. с можно представить в виде (8) с = у1а1+...+Ym-itfm-i, где уъ ..., Ym-i ^ 0. Ввиду (5) и (8) &= 2 YA + 2 (ТА + ^*)«*+0-а«. l^t^s s<.k<,m В этом представлении вектора & число неотрицательных коэффициентов больше, чем s. Это противоречит предположению, что представление (3) вектора Ъ содержит наибольшее число неотрицательных коэффициентов. Мы пришли к противоречию, допустив, что s<m. Таким образом, этот случай невозможен. Следовательно, s = m, т. е. (3) есть искомое представление вектора Ь в виде неотрицательной комбинации векторов аг, ..., ат. ? 322
Критерий несовместности системы линейных неравенств. Перейдем к рассмотрению неоднородных систем линейных неравенств. ТЕОРЕМА 1.8. Система неравенств (1) до<?< С=1» •••> т) несовместна тогда и только тогда, когда существуют действительные числа Xlf..., Хт, удовлетворяющие условиям (2) %1У1+...+%тУт<0 0*2*0. ...,Ь»^Щ. Доказательство. Предположим, что система (1) несовместна, и докажем, что существуют действительные числа, удовлетворяющие условиям (2). Пусть (3) а/= (ал, ..., а/л) (t = l, ..., m). Рассмотрим однородную систему неравенств (4) апхг + ... + ainxn-yixnn^0 (t = l, ..., m) с переменными хг, ..., д:л, x„+1. Неравенство (5) 0..*!+... + 0.*я+*я+1<0 есть следствие системы (4). Действительно, если (|1э ... • ••> ?«> ?/i+i) — произвольное решение системы (4), то (6) Ьм^О, ибо при bi+1>0 вектор (Ш^-ь •••> l«?U-i» 1) был бы решением системы (4), а вектор (ЪгЪп+и ..., Li^-м) - решением исходной системы (1), что противоречило бы предположению о несовместности этой системы. Так как неравенство (5) есть следствие системы (4), то, по теореме Минковского, вектор (0, ..., 0, 1) можно представить в виде неотрицательной линейной комбинации векторов (аи, ..., а1п, — Yi), (aml> • • • > а/ял> — Ут)> 323
т. е. существуют действительные числа %ъ что ^1^11 + • • • + Ki&ml = О, ,.9Кт такие, Ла^О, ..., %т^0, К^о>.... ^^о, Kain + • • • + ктатп •= О, M-Yi)+...+M-Ym)=l. Ввиду (3) отсюда следует, что ^l7l+... +^mYm<0, т. е. выполняются условия (2). Предположим теперь, что существуют действительные числа hi, ...9Кц удовлетворяющие условиям (2), и докажем, что система (1) несовместна. Рассмотрим неравенство (7) (Mi + •¦• +Кат)х^Х1у1+ ... +КУт, являющееся неотрицательной линейной комбинацией неравенств системы (1). Согласно предложению 1.1, это неравенство есть следствие системы (1). Ввиду (2) неравенство (7) можно записать в виде o.*<o. Это неравенство не имеет решений и является следствием системы (1), поэтому система (1) несовместна. ? Пусть а/ = (а/1, ..., ain) для t=l, ..., /и, Л = «и а 1л .а. •ml ап *А = а1г а ml .а '«In а„ ТЕОРЕМА 1.9. Неравенство (2) Ьх^О является следствием неравенства (1) Ах^О тогда и только тогда, когда совместна система (3) *Ау = Ь, у^О. Теорема 1.9 непосредственно следует из предложения 1.1 и теоремы 1.8. ТЕОРЕМА 1.10. Система Ах + Ь = 0> х. 324
(где Ь —столбец), совместна тогда и только тогда, когда для всякого у *Ау^О-**Ьу^О. Заменив в теореме 1.9 Л, М, b, *Ь, х, у соответственно на — 'Л, — Л, *b, Ь, у, х, мы убедимся, что теорема 1.10 есть другая формулировка теоремы 1.9. Неотрицательные решения системы линейных уравнений и системы линейных неравенств. Систему линейных уравнений (1*) «/!*!+...+а*л-{-р/ = 0 (t = l, ..., т) можно записать в матричной форме Ах+Ь = 0, TPil где А = \\aik\\ — тхя-матрица и ft= • . LP/J При рассмотрении задач линейного программирования возникает вопрос об условиях, при которых система (1*) имеет хотя бы одно неотрицательное решение. Этот вопрос равносилен вопросу о совместности системы (1) Ах + Ь = 0, х^О. ТЕОРЕМА 1.11. Система (1) совместна тогда и только тогда, когда несовместна система (2) *Ay^0, *by>0. Доказательство. Согласно теореме 1.10, система (1) совместна тогда и только тогда, когда (3) ' Vy {Ау ^ 0 -> 'by ^ 0). Нетрудно видеть, что Чу ('Ау ^ 0 -> *Ьу ^ 0) <-> Vy (1 (My ^ ЩУЦЬу <: 0)), +>Vyl(*A(y)^0/\'by>0). Таким образом, система (1) совместна тогда и только тогда, когда для каждого у 1(*Ау^0А*Ьу>0). Следовательно, система (1) совместна тогда и только тогда, когда несовместна система (2). Q ТЕОРЕМА 1.12. Система (1) Ax + b^Q, x^zO, 325
совместна тогда и только тогда, когда несовместна система (2) MjyS^O, <by>09 у^О. Доказательство. Пусть Л — mx/г-матрица и z = \ : . Нетрудно видеть, что система (1) совместна тогда и только тогда, когда совместна система (Г) Ax+z + b = 0, лг^О, г^О. Пусть ? —единичная mxm-матрица, тогда Ах+г+Ъ = Ах + Ег + Ь = [А\Е][*~\+Ь. Поэтому систему (1) можно записать в виде Согласно теореме 1.11, система (Г) совместна тогда и только тогда, когда несовместна система т. е. несовместна система MySsO, у^О, <by>0. Следовательно, система (1) совместна тогда и только тогда, когда несовместна система (2). ? Упражнения 1. Докажите, что лгёэбая система п однородных линейных неравенств с п переменными имеет ненулевые решения. 2. Докажите, что неравенство Ах^О имеет ненулевые решения тогда и только тогда, когда ненулевые решения имеет неравенство *Ау ^ 0. 3. Докажите, что любой выпуклый многогранник является множеством всех решений некоторой системы линейных неравенств. 4. Покажите, что множество всех решений совместной системы линейных неравенств можно представить в виде суммы выпуклого многогранника и выпуклого конуса, порожденного конечным множеством векторов, 326
§ 2. СТАНДАРТНЫЕ И КАНОНИЧЕСКИЕ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ Стандартные и канонические задачи. Всюду ниже А есть mx/г-матрица над полем действительных чисел <М\ Л = а 11 Lotmi <*1/г а„ Ъ и с — соответственно /я-мерный и я-мерный векторы- столбцы над <М\ Ь = р.1" •-Гт- , с = ~у.1] -yJ ИФ = [Р!, ..., РД ^ = [?1, .. .,?,]. Линейную форму Yi#i+ ••• +7л*/л будем записывать ГуГ в виде произведения строки *с и столбца 3^ = #iJ т. е. су^УгУг+.-.+УпУп* Линейную форму рхгх + ... + Pm^m будем записывать в виде IV произведения строки Ф на столбец ?= .- Zm-J 'te = p1z1-b...+pmz/7 Основными задачами теории линейного программирования являются стандартные и канонические задачи на Минимум и максимум. Стандартная задача минимизации С. Найти решение системы 0) ацу1+...+(Х1пУп + &1^0 (t=l, ..., m); #iS*0, ..., Уп^О, которое минимизирует линейную форму Yi#i + ... +упУп- Стандартная задача максимизации С*. Найти решение системы (2) а1^1+ • • • +<X>mkZm + Ук S* О, 2x5*0, ..., zmS^0, которое максимизирует линейную форму РЛ+... +$тгт. 327
Условия (1) и (2) называются линейными ограничениями задач С и С* соответственно. Задачи С и С* называются взаимно двойственными. В матричной форме эти задачи формулируются следующим образом: С. Найти решение системы (1) Ау + Ь^О, у^О, которое минимизирует линейную форму *су. С*. Найти решение системы (2) <Az + c^0, 2^0, которое максимизирует линейную форму fbz. Каноническая задача минимизации К. Найти решение системы /тч a/i0i+... +а//г2/Л + Р/ = 0 (t = l, ..., m), которое минимизирует линейную форму Vil/i+ ••• -\-УпУп* Задача, двойственная к задаче К: К*. Найти решение системы (II) alkzx+ ... +amkzm + yk^0 (k = i, ..., л), которое максимизирует линейную форму $&+... + (5mzm. Условия (I) и (II) называются линейными ограничениями задач К и К* соответственно. Задачи К и К* называются взаимно двойственными. В матричной форме эти задачи формулируются следующим образом: К. Найти решение системы (I) Ау + Ь = 0, у^О, которое минимизирует линейную форму *су. К*. Найти решение неравенства (II) *Az + c^0, которое максимизирует линейную форму *bz. Допустимые и оптимальные векторы. Задача линейного программирования называется допустимой, если существует вектор, удовлетворяющий линейным ограничениям задачи. Если такой вектор существует, то он называется допустимым вектором задачи. Допустимый вектор называется решением задачи или оптимальным вектором задачи, если он минимизирует (в задачах 328
С и К) или максимизирует (в задачах С* и К*) линейную форму задачи. Значение этого минимума или максимума называется значением задачи линейного программирования. Обозначим через х19 ..., хп левые части неравенств системы (II), т. е. положим (3) ** = «!**!+... +*т&т + Ук (*= 1, •••> п). ПРЕДЛОЖЕНИЕ 2.1. Если вектор удовлетворяет неравенствам (!') «лУ1+.-- +ос<||уя + Р|<0 (t = l, ..., т), то Доказательство. Ввиду (3) *i#i+ • • • +**#* = (а^Ч- ... +ат1гт+у1)у1+ ... • • • + (<Wl + • • • +ОтЛгт + 7я)Уляв = (<*h#i + • • • +<*1лУп)г1+... +(ат1у±+... Отсюда в силу (Г) =*су — *Ьг. и СЛЕДСТВИЕ 2.2. Ясли у— допустимый вектор стан- дартной задачи на минимум и г —допустимый вектор двойственной задачи, то 0^ххуг+ ... +xnyn<!<cy-'bz. ПРЕДЛОЖЕНИЕ 2.3. Если вектор L#|J удовлетворяет системе уравнении (I') аа!И-...+а*ц0я + Р*==О (/=1, ...т), то *tfi+. • • +х„уя = 'су -'Ьг. Доказательство этого предложения аналогично доказательству предложения (2.1). СЛЕДСТВИЕ 2.4. Если у — допустимый вектор канонической задачи на минимум и ? —допустимый вектор двой- 329
ственной задачи, то ПРЕДЛОЖЕНИЕ 2.5. Если у —допустимый вектор задачи на минимум (С или К) и z — допуститый вектор двойственной задачи (С* или К*), то *су — *Ьг^0. Предложение 2.5 непосредственно следует из следствий 2.2 и 2.4. ПРЕДЛОЖЕНИЕ 2.6 (КРИТЕРИЙ ОПТИМАЛЬНОСТИ BEKTdPOB). Если у — допустимый вектор задачи на минимум, Z — допустимый вектор двойственной задачи и icy=tbz, то у и z являются оптимальными векторами соответствующих задач. Доказательство. Пусть у' — любой допустимый вектор задачи на минимум. Согласно предложению 2.5, 'cy'^'bz. Кроме того, по условию, №=*су, поэтому *су'^*су для любого допустимого вектора у' задачи на минимум. Следовательно, у является оптимальным вектором задачи на минимум. Аналогично доказывается, что z является оптимальным вектором задачи на максимум. ? Теорема двойственности для стандартных задач. В теории линейного программирования основными являются теоремы двойственности 2.7 и 2.8. ТЕОРЕМА 2.7. Если обе взаимно двойственные стандартные, задачи (С и С*) допустимы, то обе задачи имеют решения и значения этих задач совпадают. Если хотя бы одна из задач недопустима, то ни одна из задач не имеет решений. Доказательство. Предположим, что обе задачи допустимы. Тогда совместна система (1) Ау + b^O, у^О, (2) Мяг + оО, 2^0. Первая часть теоремы будет доказана, если мы докажем существование таких решений у и z соответственно (1) и (2) систем, что (3) '*у-'**<(). Действительно, в этом случае, по предложению 2.5, допустимые векторы у и z удовлетворяют неравенству 330
fcy — *bz^O. Поэтому если у и z удовлетворяют еще и (3), то tcy = tbz. Следовательно, в силу критерия оптимальности векторы у и z будут оптимальными векторами соответствующих задач (С и С*) и значения обеих задач будут совпадать. Таким образом, достаточно доказать совместность системы ( Ау + b^O, у^09 (4) ] — М*-с<0, 23^0, [ 'cy — 'bz^O. Запишем эту систему в матричной форме: (4) А 0 0 — М —*ь ]+hh' й По теореме 2.6, система (4) совместна тогда и только тогда, когда несовместна система (5) РЛ Lo - с! Ь_ 'и~\ V L%\ :0, *bu — fcv>0, 0. Эту систему можно записать в виде Av + bX^O, (5) — Мя — сХ^О, #5^0, v^zO, X^zO, Покажем, что система (5) несовместна. Допустим, что существуют векторы и и v и действительное число А, удовлетворяющие неравенствам (5). Тогда при Я>0 имеем: А(©Я,-1) + *<0, vX-^O, (5') — M(«A,-1)-c<0f яАг^О, Первые четыре неравенства показывают, что векторы vX'1 и яАг1 удовлетворяют соответственно условиям (1) и (2), т. е. являются допустимыми векторами соответствующих задач. Следовательно*, согласно предложению 2.5, что противоречит последнему неравенству (5'). 331
Если же ?v = 0, то система (5) несовместна. Действительно, по условию, совместна система (1), (2), т. е. система (6) |_о -Ml*] L- 11а + ' Ь~ — с <0, 0. По теореме 2.6, из совместности системы (6) следует несовместность системы О, РА 01 [0 —А] ^0, 'bu — 'cv>0, т. е. несовместна система Av^Q, — *Аи^0, #5^0, v^zO, icv — tbu< :о. Таким образом, система (5) несовместна и поэтому совместна система (4). Предположим теперь, что допустима только одна из двух взаимно двойственных стандартных задач, например допустима задача С, а задача С* недопустима. Докажем, что тогда задача С не имеет решений. Допустимость первой задачи означает, что существует решение^' системы (1), т. е. (1') Лу+ft^O, У^О. Недопустимость задачи С*, т. е. несовместность системы (2) — 'Лг-с^0, г^О, по теореме 1.12, влечет совместность системы (2*) Ax^0t toc<0, х^О. Следовательно, существует вектор х' такой, что (2') Ах' ^ 0, *сх? < 0, х' ^ 0. На основании (Г) и (2') заключаем, что для любого натурального п выполняются неравенства (7) А(у'+пх') + Ъ*?0, у'+пх'^0. 332
Значит, для любого натурального п вектор у'-\-пх' является допустимым вектором первой задачи. Однако линейная форма *су не имеет минимума. Действительно, *с {у'+пх') = *су' + п {fcx') и в сумме справа первое слагаемое есть некоторое действительное число, а второе слагаемое ввиду *сх* < 0 может быть сделано при достаточно большом п меньше любого заданного числа. Следовательно, линейная форма *су минимума не имеет, т. е. первая задача не имеет решений. ? Теорема двойственности для канонических задач. Рассмотрим канонические задачи К и К*: К. Найти решение системы Ay-\-b = 0, y^0t которое минимизирует линейную форму *су. К*. Найти решение неравенства *Az-{-c^Q, которое максимизирует линейную форму fbz. Задача К равносильна следующей стандартной задаче: Q. Найти решение системы ПМ1} ;о, у^о, которое минимизирует линейную форму *су. Двойственной к Q является следующая задача: С*. Найти решение системы i .-М|М][Д + с^0, где z' = ную форму [ 2 = ст+\ с2т J о, которое максимизирует линей- -•14 [Д. Нетрудно убедиться, что задача С* равносильна задаче К*. Действительно, [—М|М] й- (А(г°-г'), [— <Ь\'Ь] [Д-*(«--П Любой m-мерный вектор можно представить в виде разности двух неотрицательных /n-мерных векторов. Ввиду этого, если положить z = z" — z', то z пробегает множество всех m-мерных векторов из Rm, кргда z" и zf пробегают множество всех неотрицательных векторов из Rm. 333
Следовательно, задача С* равносильна следующей задаче (совпадающей с задачей К*). Найти решение неравенства fAz + c^0, которое максимизирует линейную форму fbz. Стандартные задачи Q и С* взаимно двойственны, и для них верна теорема двойственности. Задачи К и К* равносильны соответственно задачам Q и С*. Поэтому теорема двойственности имеет место также для задач К и К*, т. е. верна следующая теорема. ТЕОРЕМА 2.8. Если обе взаимно двойственные канонические задачи (К и К*) допустимы, то обе задачи имеют решения и значения этих задач совпадают. Если хотя бы одна из задач недопустима, то ни одна из задач не имеет решений. Теорема равновесия. Напомним, что мы условились обозначать через хъ ..., хп левые части неравенств системы (II), xk = alkzl + ... + amnzm (k=l, ..., п). ТЕОРЕМА 2.9. Пусть у = У1 — допустимый вектор 1Уп\ канонической задачи на минимум и z = \ • | — допустимый вектор двойственной задачи. Если (*) *i#i = 0, ..., хпуп = 0, то у и z являются оптимальными векторами соответствующих задач (К и К*). Доказательство. Предположим, что выполнены условия (*). По следствию 2.4 имеем (1) 0^x1y1+...+xnyn = tcy-tbz. На основании (*) и (1) заключаем, что *су — *Ьг = 0. Согласно критерию оптимальности, векторы у и z являются оптимальными векторами соответственно задач К и К*. ? Замечание. Условие (*) также необходимо для оптимальности допустимых векторов у и z. Действительно, по следствию 2.4, выполняется (1). Если векторы у и z оптимальны, то, по теореме 2.8, (2) *су = №. 334
Из (1) и (2) следует 0<#1*/1+...+*„#Л = 0. Поскольку у и г —допустимые векторы, то хъ ..., хп^0 и у19 ..., Уп^О- Отсюда следуют равенства (*). Упражнения 1. Покажите, что если одна из взаимно двойственных задач линейного программирования (канонических или стандартных) имеет решение, то другая задача также имеет решение. 2. Приведите пример такой стандартной (канонической) задачи на минимум с двумя переменными, чтобы ни сама задача, ни двойственная ей не были бы допустимыми. 3. Постройте пример стандартной задачи на минимум, которая имеет более одного оптимального решения. § 3. СИМПЛЕКС-МЕТОД Симплекс-метод. Симплекс-метод для задач линейного программирования был разработан Данцигом. В изложенном ниже простом методе одновременного решения двух взаимно двойственных канонических задач мы следуем Холлу [27]. Рассмотрим взаимно двойственные канонические задачи. К. Найти решение системы aiiih+.-- + ainJfo + Pi = 0> (I) */iS^0, ..., уп^0, <Х<т1У1 + - • - + <Х>тпУп + $т = 0, которое минимизирует линейную форму v: yiyi+.--+ynyn = v. К*. Найти решение системы (И) «lA. + • • • + VmnZm + Уп 3* О, которое максимизирует линейную форму и: $&+...+ $mzm = и. Симплекс-метод есть метод одновременного решения обеих взаимно двойственных канонических задач К и К*. 335
Пусть Л = Оц <Х>1п — матрица системы уравнений Laml • • • аш_ (I). Ниже мы будем предполагать, что ранг матрицы А равен т; это предположение несколько упрощает схему изложения симплекс-метода. Общий случай легко может быть сведен к этому случаю. Рассмотрим таблицу Л Л* а... р ... у ... б ... = — у* = — У = Z* =2 Эта таблица удобна для одновременного представления двух систем линейных уравнений. Она представляет линейную систему по строкам: (1) ... + от|*+... + Рл+••• = —У*. ...+YT|*+••• + &! +... = — у и по столбцам: , , + ах* +.. .+y# + - • - = 2*, (2) ... + P**+... + 6* + ... = z. Осевое преобразование таблицы с ведущим элементом а (а =7^=0) — это такое преобразование, которое заменяет исходную таблицу таблицей, соответствующей решению системы (1) относительно —rj* и решению системы (2) относительно я*. Решив уравнение системы (1), содержащее ведущий элемент а, относительно —г]*, имеем ... + a-V+-.. + a-1pri + ... = —Л*. 336
Подставив это выражение для —т]* в другие уравнения системы (1), получим: 1 ' ...-аг^*+... + (в-ог*Р7)л + ... = -у. Аналогично, решая систему (2) относительно #*, получим (2) .. .Ч-а-1** +... + (— arbf)x+... = **, ..Л*гг$г*+... + (6-а-1$у)х + ... = г. Таким образом, осевое преобразование таблицы с ведущим элементом а заменяет исходную таблицу следующей таблицей: = — г)* : X У* ...а-1 .. ... — a_1v. Л . ог»р ...1 .б-сг^у... = — У >. = х* = 2 соответствующей решению системы (1) по строкам относительно — т|* и системы (2) по столбцам относительно х*. Обе взаимно двойственные канонические задачи К и К* представляет таблица Ti *1 1 Ух •• ап .. ami-. Yi •• • #« • ai* • Ут 1 Pi Рет 0 = 0 II II CJ О • = хг =хп =и Будем искать одновременно решение обеих задач. Вначале исключим переменные гг, ..., zm, на которые не наложены ограничения. Это первый этап решения. Он осуществляется при помощи цепочки осевых преобразований, исходя из таблицы Тх. Этот процесс продолжается до тех пор, пока в таблице можно найти ненулевой эле- 337
мент с у наверху и с нулем справа в строке. В результате приходим к таблице вида О ...0 1 Ут + \ Уп т; х[ 1 Vm + l Ук 7~у[ = — Ут — Хт + \ ¦Xn = Zi, =% (4^0, у}^0) В этой таблице переменные со штрихами —это размещенные иначе переменные, входящие в исходную таблицу Тх, а строки и столбцы переставлены в соответствии с положением нулей. Последние т столбцов представляют уравнения, выражающие переменные z[, ..., z'm через переменные х[9 ..., х'т. Эти уравнения надо выписать: Z\ = Uxi^l "г • • • "г dimXm, (HI) . —t zm = dfniXi+...+4Л« Далее необходимо рассмотреть только те равенства, которые связывают переменные х[ и у) и выражаются той частью таблицы TJ, которая содержит первые п — т столбцов. Таким образом, в результате исключения переменных х} %т 1 • 9 Zm Ут+1 ст+1 приходим • • • Уп 1 ... сп Pi Pm d К Т< = — = v ЮЛ1 -Ух -Ут Хт+г •»• Х/1 и Таблицу Т называют допустимой по строкам, если выполнены условия (1) Pi^O, ..., pm^0. Эти условия означают, что вектор (—рх, ..., —рт, 0, ... ..., 0) является допустимым вектором задачи К, т. е. удовлетворяет системе (I). Предположим, что таблица Т допустима по строкам, т. е. выполнены условия (1). Цель 33§
следующего этапа решения задачи состоит в том, чтобы по таблице, полученной из Т в результате цепочки осевых преобразований, найти допустимые векторы обеих задач (К и К*), которые удовлетворяют условиям (*) *1#1 = 0, ..., хяуп = 0 (х^О, у/^0). По теореме равновесия, такие векторы будут оптимальными векторами соответствующих задач. Введем обозначения: © — неотрицательное число, 0 — неположительное число. Допустим, что мы, исходя из таблицы Т, сможем перейти к таблице вида 1©...© е ё Тогда, придавая свободным переменным хъ ..., хт и */m+i> ••> Уп значения, равные нулю, получим допустимые векторы для обеих задач (К и К*), которые являются оптимальными векторами этих задач. Рассмотрим влияние осевого преобразования с ведущим элементом ars на столбец свободных членов и на значение линейной формы v, подлежащей минимизации: ars ... рг ... a7s ... ойр/-, ais ... р* ... — arfcis • •• $i — ars$rais, ys ... б ... — ariys ... б — а^Р/р*. Мы предполагаем, что в таблице (слева) элементы р* столбца свободных членов неположительны, т. е. (1) р^О (1 = 1, ..., т). Мы хотим, чтобы новое значение линейной формы v не было больше предыдущего, т. е. б — aj?$rys^8. Это неравенство выполняется, если выполняются условия (a) ar5>0, y*<°- При выполнении этих условий новое значение линейной формы v не больше предыдущего, причем новое значение формы v при рг<0 строго меньше предыдущего. 339
Кроме того, мы хотим, чтобы новые элементы столбца свободных членов были неположительны, т. е. Р*-«riprap 0. При выполнении условий (ос) и при а^^О это неравенство выполняется. Если же а/5>0, то неравенство можно записать в виде (Р) tr^ir при всех а">0 (^г)- Таким образом, мы приходим к следующему правилу выбора ведущего элемента осевого преобразования таблицы, которая допустима по строкам. Пусть таблица допустима по строкам. В качестве ведущего элемента (при осевом преобразовании) следует выбирать элемент ars, если выполнены условия: (a) y*<0, ar<y>0; <р> fe^lrпри a<*>0 (l'^r>- Выбор ведущего элемента в соответствии с этим правилом обеспечивает допустимость новой таблицы по строкам и при рг<0 дает новое значение линейной формы v (подлежащей минимизации), строго меньшее, чем предыдущее. Исходя из таблицы допустимой по строкам, осуществляют цепочку осевых преобразований, руководствуясь правилом выбора ведущего элемента. Процесс заканчивается, если в последней строке таблицы нет отрицательных элементов; это будет означать, что таблица допустима и по строкам и по столбцам, т. е. найдены решения обеих задач К и К* (найдены оптимальные векторы). Процесс заканчивается также в том случае, когда в таблице встретится отрицательный (не последний) столбец вида I 0 I е и, значит, правило выбора ведущего элемента неприменимо. Это будет означать, что задача К* недопустима, так как нельзя удовлетворить условию xs^0. 340
Таблица Т может оказаться недопустимой и по строкам, и по столбцам. В этом случае, стремясь найти допустимое решение задачи К или установить недопустимость задачи К*, поступаем следующим образом. Строки таблицы Т переставим так, чтобы все допустимые строки были расположены вверху таблицы: Ут+1 Уп 1 хг Xk Xk+l Хщ 1 Ут+1 •• • Уп е ё + + = — Ух = — Ук = —Уk+i = — Ут Первые k+l строк этой таблицы будем рассматривать как таблицу, допустимую по строкам, и постараемся минимизировать (—Ук+i)- Если на каком-либо шаге мы достигнем неположительного значения для (—ул+i), то получим & + 1 допустимых строк или больше. Продолжаем процесс аналогичным образом, стремясь представить в допустимой форме как можно больше строк. Если при этом в таблице появится плюсовая строка, т. е. (недопустимая) строка вида е еИ- то это будет означать, что задача К недопустима, так как невозможно удовлетворить условию —yj^O. Если же окажется, что минимальное значение (—ук+±) положительно, то появляется таблица вида \ — е ё + = -#*+! В этом случае в качестве ведущего выбираем элемент, отмеченный стрелкой. Легко проверить, что такой выбор дает k+l допустимых строк или еще больше. Таким 341
образом, описан способ нахождения допустимого решения задачи К во всех возможных случаях. Задача. Найти решение системы 5yi-4y8+13y8-2y4+y5-20 = 0f (!) #1-#2 + 5#з-#4 + #5-8 = 0, z/iS^O, */2^0, у3^0, */4^0, #3^0, которое минимизирует линейную форму vt Задача, двойственная данной, формулируется так: найти решение системы x1 = 5z1 + z2+l^09 х2 = — 4гх — г2 + 6 ^ 0, (II) x3=l3z1 + 5z2-7^0, x± = — 2zl — z2+l^0, *5 = Zl + *2 + 5^0, которое максимизирует линейную форму и, — 20zx — 8z2 = и. Обе эти задачи представляет следующая таблица: Уг У* Уз У* Уь 1 5 1 1 —4 —1 6 13 5 —7 —2 —1 1 1 1 5 —20 —8 0 Х± Х2 Х$ Хд Х$ — И Будем искать одновременно решения обеих задач. Вначале исключим неизвестные zt и г2. Исключая z2 при помощи осевого преобразования с ведущим элементом 1, отмеченным жирным шрифтом, получим Уг У г Уз У* 0 1 4 1 —4 —3 —1 11 8 5 —32 —1 —1 6 —1 1 —5 —12 —8 40 Х\ Х2 Xq Х^ Z2 — И 342
Теперь исключим z2 осевым преобразованием с ведущим элементом 4 в первом столбце: = — Уг = — Уь Xl Хъ 1 0 1/4 -1/4 1 У» -3/4 -1/4 8 Ув 2 3 —24 У* -1/4 -3/4 5 0 -1/4 5/4 —6 1 —3 —5 28 х% X* = и Из первого и пятого столбцов видно, что z1 и г2 выражаются через xt и хь следующим образом: (Ш) — 1 1 _1_ь zi — "4" *1 4" *б "•" ' Исключая первый и пятый столбцы в предыдущей таблице, получим *1 *в 1 Уг -3/4 -1/4 8 № 2 3 —24 Л -1/4 -3/4 5 1 —3 1 —5 28 J = — 9i =—У* = v X, = U Эта таблица допустима по строкам. В соответствии с правилом выбора ведущего элемента выбираем элемент 2 во втором столбце и, произведя осевое преобразование, приходим к таблице = — Ув = — Уъ *3 хъ 1 Уч, —3/8 7/8 —1 У\ 1/2 —3/2 12 У* -1/8 —3/8 2 1 —3/2 -1/2] -8 | В полученной таблице выбираем элемент 7/8 в первом столбце в качестве ведущего элемента и, произведя осевое 343
преобразование, приходим к таблице Уь Уг Ул 1 3/7 8/7 8/7 -1/7 —12/7 72/7 —2/7 —3/7 11/7 —12/7 -4/7 —60/7 Xq X-± Х^ — И Эта таблица допустима как по строкам, так и по столбцам. Полагая «свободные» переменные х2> xz, yl9 */4, уь равными нулю, получим: *х = 72/7, х2 = 0, х3 = 0, *4=11/7, *б = 8/7, t/i = 0, t/2 = 4/7, f/3=12/7, */4 = 0, */5 = 0. Подставляя найденные значения хг я х5 в формулы (III), получим ^=23/7, z2= — 50/7. Следовательно, вектор (0, 4/7, 12/7, 0, 0) есть решение первой задачи, а вектор (23/7, — 50/7) — решение двойственной задачи. При этом u = v = — 60/7, т. е. минимальное значение линейной формы v и максимальное значение линейной формы и равно (—60/7). Упражнения 1. Максимизируйте линейную форму 2*i+3*2 при условиях 4*i+2*2+*3 = 4, *i+3*2=5. 2. Максимизируйте линейную форму *i+3*2+*3 при условиях 5*i + 3*2^3, *! + 2*2+4*3^4. 3. Разрешите вопрос о совместности системы линейных неравенств 5*i+4*2—7*3^1, —*i+2*2—*3^—4, — 3*!-- 2*2+4*3^3, 3*х—2*2—2*3^—7. 4. Выясните, совместна ли следующая система линейных неравенств: 4*i—5*2^3, — 2*i — 7*252:l, — 2*! + *2^: — 2? 5. Имеет ли система линейных уравнений 3*1—5*2+2*3=0, 2*i—4*2+*з = 0 неотрицательные ненулевые решения? 344
6. Докажите, что система линейных неравенств —3^+3*2 s^—5 не имеет неотрицательных решений. 7. Найдите неотрицательное решение системы линейных уравнений: бл^+*2+6*з—5*5=2; —-7«*i—#2—2^3+^4 "Ь 2^5 ==s — 5«
Глава десятая ГРУППЫ § 1. ПОЛУГРУППЫ И МОНОИДЫ Полугруппы. Пусть Л —непустое множество. Бинарная операция * на множестве Л называется ассоциативной, если а* (Ь*с) = (а*Ь)*с для любых элементов а, 6, с из Л. Бинарная операция * называется коммутативной, если для любых а, Ь из A a*b = b*a. Так, например, операции сложения и умножения целых чисел ассоциативны и коммутативны. Операция вычитания целых чисел неассоциативна и некоммутативна. ОПРЕДЕЛЕНИЕ. Полугруппой называется алгебра (А, *) типа (2) с бинарной ассоциативной операцией #. Подалгебра полугруппы называется подполугруппой. Примеры. 1. Пусть + есть операция сложения на множестве N натуральных чисел. Алгебра (N, +) есть полугруппа, так как операция сложения ассоциативна. Эта полугруппа называется аддитивной полугруппой натуральных чисел. 2. Пусть М —непустое множество и А — совокупность всех отображений множества М в себя с законом композиции отображений«в качестве бинарной операции. Алгебра (А, °> есть полугруппа, так как композиция отображений ассоциативна. Эта полугруппа называется полугруппой отображений множества М в себя. Моноиды. Пусть Л —множество с бинарной операцией #. Элемент е из А называется нейтральным относительно операции #, если а*е = е*а = а для любого а из Л. ОПРЕДЕЛЕНИЕ. Моноидом называется алгебра <Л, #, е) типа (2, 0), главные операции которой удовлетворяют условиям: (1) бинарная операция * ассоциативна: (2) элемент е является нейтральным относительно операции #. 346
Примеры. 1. Пусть + есть операция сложения на множестве N натуральных чисел. Алгебра <N, +> 0) есть моноид, так как сложение ассоциативно и 0 является нейтральным элементом относительно сложения. Этот моноид называется аддитивным моноидом натуральных чисел. 2. Пусть • есть операция умножения на множестве N натуральных чисел. Алгебра (N, •, 1> есть моноид, так как умножение ассоциативно и 1 есть нейтральный элемент относительно умножения. Этот моноид называется мультипликативным моноидом натуральных чисел. 3. Пусть п — фиксированное натуральное число, отличное от нуля, А — совокупность всех отображений множества {1, ..., п) в себя и е — тождественное отображение этого множества. Алгебра <Л, °, е), где ° есть бинарная операция — композиция отображений, является моноидом, так как композиция отображений ассоциативна и 8 есть нейтральный элемент относительно операции °. Этот моноид называется моноидом отображений множества {1, ..., п) в себя. 4. Пусть 52? = (К, +, —, .,1) —кольцо. Тогда алгебра (К, •, 1> есть моноид. Он называется мультипликативным моноидом кольца &?. Обобщенный закон ассоциативности. Пусть Л —непустое множество и * есть бинарная операция на нем. Пусть а(, а2, ..., ^ — последовательность п элементов из А. Символом а1 * #2 *... * йп обозначим композицию последовательности элементов, определяемую индуктивно следующим образом: a1*...*an~i*an = (ai*.. .*an-i)*an. Согласно этому определению, a*b*c = (a*b)*c\ a*b*c*d = (a*6*c)#<l Если закон композиции — умножение, то композиция элементов av ..., ап называется произведением и обычно п обозначается через \\асУ при аддитивной записи компо- i= 1 зиция элементов al9 ... ,ап называется суммой и обычно п обозначается через 2 а*- 347
Если бинарная операция * на множестве А ассоциативна, то легко показать, что а * Ь * с * d = (а * Ь) * (с * d) = = a*(6*c)*d = = (а * & * с) * d =. = a*(6*?*d). В случае ассоциативной бинарной операции на А при рассмотрении композиции любой последовательности элементов из А можно любым образом расставлять скобки, как показывает следующая теорема. ТЕОРЕМА 1.1. Пусть А—множество с ассоциативной бинарной операцией * и аъ ...9ап — последовательность элементов из А. Пусть 1 <%<Caz2<...<^^^> где п19 ..., Пи — натуральные числа, и b0 = a1*...*ani-.1,bl==ani*...*an2„v...,bk==ank*..,*an, тогда аг *... * ап = 60 * • • • * bk* Доказательство (проводится индукцией по п). Если л = 2, то теорема, очевидно, верна. Предположим, что теорема верна, если последовательность содержит не более п — 1 элементов. Первый случай: nk = n. В этом случае bk = an. По определению, аг*.. .ап = (аг*.. .ап-г) * ап. По индуктивному предположению, at *... *аЛ_! = Ь0 *... * Ьк-ь следовательно, а1 *... * ап = (&о * •.. * b^-i) * bk = 60 *... * bfa Второй случай: nk<n. В этом случае bk = (ank*-- -*an-i)*an = bk* an9 где &л = аЯл*...*0Л-1, и а1*...*ал-.1 = 60*«--*^ (по индуктивному предположению); 348
следовательно, ах *... * ап = (а± *,.. * ап-г) *ап = = (&о*--*^)*^л= (по индуктивному предположению) = ((60 * • • • * bk-i) * b'k) * ап = = (60 *.. .-* Ь^_!) * (6fe * ап) = = &0 *...*&?. ? Рассмотрим тот частный случай, когда бинарная ассоциативная операция на множестве А есть умножение и аг = а2= ... =ап = а> где aei Тогда, по определению, п ап = а1*а2...ап = Д а,. * = i СЛЕДСТВИЕ 1.2. Пусть А—множество с заданной на нем бинарной ассоциативной операцией, умнооюением, и а^А. Тогда для любых отличных от нуля натуральных чисел тип имеем: ат+п = атап, атп = (ат)п. Рассмотрим также случай, когда бинарная ассоциативная операция на множестве А называется сложением и ах = а2 =... = ап = а, где аеЛ. Тогда, по определению, п /10 = 0! + ...+ ая= 2 af i= l СЛЕДСТВИЕ 1.3. Пусть А—множество с заданной на нем бинарной ассоциативной операцией, сложением и а^А. Тогда (т + п)а = та + па, (тп)а = т(па) для любых отличных от нуля натуральных чисел пит. Упражнения 1. Пусть {А, •, 1)—мультипликативный моноид. Докажите, что для всякого элемента а моноида и любых натуральных т и п выполняются соотношения атап~ат+п, (ат)п=атп, 2. Пусть (Л, +, 0)—аддитивный моноид и а е А, Покажите, что для любых натуральных тип та+па = (т+п)а, п (та) = (пт) аш 349
3. Пусть (N, 4) —аддитивная полугруппа натуральных чисел. Найдите систему образующих этой полугруппы. 4. Пусть (N, +> 0) — аддитивный моноид натуральных чисел. Опишите все подмоноиды этого моноида. 5. Пусть (N*, ^ — мультипликативная полугруппа натуральных чисел, отличных от нуля. Найдите минимальную систему образующих этой полугруппы. 6. Пусть (N, •) —мультипликативная полугруппа натуральных чисел. Найдите систему образующих полугруппы, которая содержится во всякой другой системе образующих этой полугруппы, § 2. ПОДГРУППЫ И СМЕЖНЫЕ КЛАССЫ Подгруппы. Пусть М —непустое множество и SM — множество всех подстановок множества М9 т. е. совокупность всех инъективных отображений множества М на себя. Если f и g — подстановки множества М, то их композиция fog и обратное отображение /_1 суть подстановки множества М. ТЕОРЕМА 2.1. Алгебра (SM, °» ~*> является группой* Доказательство. Бинарная операция • на SMf композиция подстановок множества М, ассоциативна в силу теоремы 2.2. Тождественная подстановка iM есть нейтральный элемент относительно операции •. Для любой подстановки f множества М fof-i = iM. Следовательно, алгебра (Sm> °> _1> является группой. ? ОПРЕДЕЛЕНИЕ. Группа (SM, °, ~г) называется симметрической группой на множестве М и обозначается через $м> Если множество М конечно и состоит из п элементов, то группа $м называется симметрической группой п-й степени и обозначается также через ёп. Пусть & = (G, •, ~г) — мультипликативная группа. Каждому элементу а группы поставим в соответствие отображение ta множества G на G, определяемое формулой ta(x) = ax для всякого х из G. Отображение ta есть подстановка множества G и называется левой трансляцией G. Множество T(G) = {ta\a^G} называется множеством левых трансляций G. ПРЕДЛОЖЕНИЕ 2.2. Пусть gQ = (SG, •, -^-симметрическая группа на множестве G. Алгебра dT = (T(G), •, -1) является подгруппой группы %Q. Доказательство. Для любых элементов а, Ь группы & имеют место равенства (1) ta*tb = tab И ta'ta^^lQ^te, 350
где в —единица группы &. В самом деле, для любого х из G (ta в h) (х) = ta (tb (x)) = ta (bx) = abx = tab {x)y т. е. Полагая в последнем равенстве b = a1> имеем fa^a-1 = =te = iQ, где в —единица группы <^. Кроме того, в силу (1) ta*te = tae = ta и (2) (ta)-i = ta-^T(G). На основании (1) и (2) заключаем, что множество T(G) замкнуто относительно главных операций группы S(G). Следовательно, алгебра (Т (G), •, -1) есть подгруппа группы SQ. П ТЕОРЕМА 2.3 (КЭЛИ). Любая группа ^ = <G, •, -1) изоморфна подгруппе симметрической группы на множестве G. В частности, каждая конечная группа порядка п изоморфна подгруппе симметрической группы п-й степени. Доказательство. Пусть Т(G) — совокупность всех левых трансляций множества G. По теореме 2.2, группа dT = (T(G), •, -1) есть подгруппа группы SG. Пусть h — отображение множества G на T(G), определяемое формулой h(a) = ta для любого а из G. Отображение h сохраняет главные операции группы <&. В самом деле, в силу (1) и (2) h (ab) = tab = ta<tb =h(a)*h(b), h{a^) = ta-i = (tayi = {h{a))-\ Кроме того, h есть инъективное отображение. Действительно, для любых a, b множества G, если h(a) = h(b), то ta = tb, ta{l) = tb{e), где е —единица группы ^, ае = Ье9 и, значит, а = Ь. Следовательно, h является изоморфизмом группы & на подгруппу <?Г симметрической группы SQ на множество G. п Смежные классы. Пусть <з%Г = (Н, -, ^ — подгруппа группы J> = (G, •, _1>. На множестве G введем бинарное отношение ==: а = b (mod H) тогда и только тогда, когда ab-1 e Я; назовем его отношением сравнения по подгруппе <Ж. ПРЕДЛОЖЕНИЕ 2.4. Пусть &%' — подгруппа группы &. Отношение сравнения на G по подгруппе ъ%Г является отношением эквивалентности. 351
Доказательство. Так как аа~г^Н, то a s= a (mod Я), т. е. отношение сравнения по <Ж рефлексивно. Поскольку из ab'1 е Я следует bar1 е Я, то из а = Ъ (mod Я), следует 6 = a(mod Я), — отношение сравнения по <?%' симметрично. Далее, для любых элементов а, Ь, с из G, если аЬ~х^Н и Ьс^^Ну то (air1) (for1) = акт1 еЯ. Следовательно, если as=b и 6 si (mod Я), то a = ?(mod//),— отношение сравнения по Я транзитивно. Таким образом, отношение сравнения по <?%* является отношением эквивалентности. ? ПРИМЕР. Пусть (V, +, —> —аддитивная группа векторного пространства ^/°, «5? — подпространство пространства *J/° и <L, +» —> — его аддитивная группа. Рассмотрим на V бинарное отношение ^: аг^Ь тогда и только тогда, когда a — b^L, называемое отношением сравнения векторов из V по направлению JS. Это отношение является отношением эквивалентности на V. Классы эквивалентности называются линейными многообразиями пространства *]/* с направлением <%. ОПРЕДЕЛЕНИЕ. Классы эквивалентности отношения сравнения по подгруппе <3%* называются правыми смежными классами группы & по подгруппе <Ж. Отметим основные свойства смежных классов. СВОЙСТВО 2.1. Любые два правых смежных класса группы & по подгруппе <Ж либо совпадают, либо не пересекаются. Множество G является объединением всех правых смежных классов группы & по подгруппе <3%\ Это свойство непосредственно следует из теоремы 2.4.1 Пусть geG. Обозначим через Hg множество, определяемое равенством Hg = {hg|/igW[. СВОЙСТВО 2.2. Если g^G, то Hg является правым смежным классом группы & по подгруппе <?%\ Доказательство. Пусть А — правый смежный класс группы & по подгруппе яЖ\ содержащий g. Докажем, что A = Hg. Пусть hg — любой элемент из Hg. Тогда hgg~1^H и hg=g(mod Я). Поэтому HgczA. Обратно: если се Л, т. е. ?=g(mod Я), то cg~1 = h^H ис = = hg e Hg. Поэтому А с Hg. Следовательно, A=Hg. ? СВОЙСТВО 2.3. Пусть А—правый смежный класс группы & по подгруппе <?%' и g^A, тогда A = Hg. Доказательство. Смежные классы А и Hg имеют общий элемент g. По свойству 2.1, они совпадают, т. е. A=Hg. D 352
СВОЙСТВО 2.4. Пусть off* — конечная подгруппа группы && е &. Тогда число элементов смежного класса Hg равно числу элементов множества Н. Доказательство. Пусть т — число элементов множества Н: Н = {hlf ..., hm}. Тогда Hg = {!%?, ..., hmg} и hig^hkg при 1фк, так как из hig = hkg, по закону сокращения, следовало бы равенство hi = hk. Следовательно, число элементов множества Hg равно т. Пусть е5^ — подгруппа группы ^. На множестве G введем бинарное отношение ~ следующим образом: ar^b(mod Я) тогда и только тогда, когда Ь~га^:Н\ назовем его отношением левого сравнения по подгруппе е%". Непосредственная проверка показывает, что это отношение есть эквивалентность на множестве G. Классы эквивалентности этого отношения называются левыми смежными классами группы & по подгруппе е5Г. Нетрудно проверить, что левые смежные классы обладают свойствами, аналогичными свойствам 2.1—2.4. Теорема Лагранжа. Пусть «^ — конечная группа. Число элементов ее основного множества G называется порядком группы &. ТЕОРЕМА 2.5 (ЛАГРАНЖА). Порядок подгруппы конечной группы является делителем порядка группы. Доказательство. Пусть <Ж — подгруппа конечной группы & и Я, Hg2, ..., Hgk — множество всех различных правых смежных классов группы & по подгруппе <Ж. Тогда (1) G = H[}Hg2[)...{)Hgk, причем любые два смежных класса, входящих в это объединение, не пересекаются. Поэтому если п — число элементов множества G и т — число элементов множества Н, то, по свойству 2.4, число элементов любого смежного класса Hgt равно т и в силу (1) n = mk. ? СЛЕДСТВИЕ 2.6. Если & —конечная группа порядка п и g e G, то порядок элемента g делит п. СЛЕДСТВИЕ 2.7. Любая конечная группа простого порядка является циклической. Упражнения 1. Пусть gn=(Sn, •, _1)—симметрическая группа подстановок /г-й степени и Ап—множество всех четных подстановок из Sn. Покажите, что о^п=(Ап> ¦, _1) есть подгруппа группы %п. 353
2. Покажите, что для произвольной подгруппы мультипликативной группы элементы, обратные к элементам левого смежного класса, образуют правый смежный класс. 3. Докажите, что при ;г>1 п—1 транспозиций (12), (13), ... ..., (\п) порождают симметрическую группу 8п- 4. Покажите, что при п>2 п — 2 трехчленных циклов (123), ... ..., (12/г) порождают группу q^n четных подстановок. 5. Пусть ^ = (<j, •, ~1)—мультипликативная группа обратимых мХл-матриц над полем gF'. Пусть Я —множество всех матриц из G, определитель которых равен единице поля <?г. Покажите, что (Я, •, -1) есть подгруппа группы S?. 6. Пусть R*—множество всех действительных чисел, отличных от нуля, и g^* = (R*» •» ~х)—мультипликативная группа действительных чисел. Покажите, что для каждого натурального п^\ мультипликативная группа корней n-й степени из единицы является единственной подгруппой п-то порядка группы е^*. § 3. ЦИКЛИЧЕСКИЕ ГРУППЫ Порядок элемента группы. Пусть ^ = (G, •, -^ — мультипликативная группа, е — ее единичный элемент иаЕй ОПРЕДЕЛЕНИЕ. Порядком элемента а группы называется наименьшее отличное от нуля натуральное число т такое, что ат = е. Если же апФе для любого ненулевого натурального числа п, то а называется элементом бесконечного порядка. Порядок элемента а группы обозначается через 0(a). Пример. В мультипликативной группе комплексных чисел 0(0 = 4, 0{—1) = 2, 0(1) = 1, 0(2) = оо. Ниже будет использована следующая теорема (см. теорему 4.4.4 о делении с остатком). Для целых чисел п и т>0 существуют такие целые числа q и г, что (1) n = m-q + r, 0^r<m. ТЕОРЕМА 3.1. Пусть т —порядок (конечный) элемента а мультипликативной группы. Равенство ап = е, где п — целое число, выполняется тогда и только тогда, когда т делит п. Доказательство. Предположим, что ап = е, и докажем, что т делит п. По теореме о делении с остатком, для чисел пит существуют целые числа q и г, удовлетворяющие условиям (1). Надо показать, что /' = 0. По условию, ат = е и, по предположению, ап = е. В силу (1) отсюда следует, что an = amq . ar = {amy .ar=s.arz=e9 354
Так как 0(а) = т и 0^r<m, то из аг = е, следует г = 0, т. е. т делит п. Предположим теперь, что т делит п, и докажем, что ап = е. Так как т делит п, то n = mk для некоторого целого k. Следовательно, ап = атк = (а"1)* = eft = е, т. е. а71 = е. П ПРЕДПОЛОЖЕНИЕ 3.2. Пусть а —элемент мультипликативной группы, имеющий конечный порядок т. Равенство ar — as, где г и s —целые числа, выполняется тогда и только тогда, когда т делит r — s. Доказательство. Равенство ar = as имеет место тогда и только тогда, когда ar~s = e. По теореме 3.1, ar~s = e в том и только в том случае, когда т делит r — s. Следовательно, ar = as тогда и только тогда, когда т делит r — s. СЛЕДСТВИЕ 3.3. Пусть а —элемент мультипликативной группы, имеющий конечный порядок т. Пусть г и s —целые числа; f = r-\-mZ и s — s + mZ —классы вычетов по модулю т. Равенство ar = as выполняется тогда и только тогда, когда r = s. СЛЕДСТВИЕ 3.4. Пусть а —элемент мультипликативной группы, имеющий конечный порядок т. Тогда элементы е(=а°), а, а2, ..., ат~г различны. ПРЕДЛОЖЕНИЕ 3.5. Пусть а —элемент бесконечного порядка мультипликативной группы и г, s —целые числа. Равенство ar = as имеет место тогда и только тогда, когда r = s. Доказательство. Из равенства r = s, очевидно, следует равенство ar = as. Предположим, что ar = as. Если гфэ, например r>s, то ar~s — e и г — s=^=0. Это невозможно, так как, по условию, элемент а имеет бесконечный порядок. Следовательно, r = s. ? Циклические группы. Ниже дано описание циклических групп. ОПРЕДЕЛЕНИЕ. Мультипликативная (аддитивная) группа называется циклической, если основное множество группы состоит из степеней (кратных) какого-либо одного элемента группы; этот элемент называется образующим элементом группы. Примеры. 1. Пусть Л =^(Z, +, —> —аддитивная группа целых чисел. Каждый элемент группы является кратным 1 (или (—1)). Следовательно, % есть циклическая группа с образующим элементом 1 (или (—1)). 2. Группа самосовмещений правильного га-угольника является циклической группой порядка т. Поворот т- 355
угольника вокруг центра на угол 2п/т есть образующий элемент этой группы. 3. Пусть т — целое положительное число, k = k-\-mZ и Zm = {0, Г, ..., т — 1} — множество всех классов вычетов по модулю т. Операция сложения + и унарная операция — определяются так: k+s = k + s, — (k) = (—k) = (m-k). Операция сложения ассоциативна и коммутативна, 0 есть нейтральный элемент относительно сложения классов и ft + (—fe) = 0. Следовательно, алгебра Шт = (2т, +, — > есть коммутативная группа порядка т. Она является циклической группой с образующим элементом Г. Группа %т называется аддитивной группой классов вычетов по моду- лю т. ТЕОРЕМА 3.6. Если образующий элемент циклической группы имеет бесконечный порядок, то группа изоморфна аддитивной группе целых чисел. Если оке образующий элемент циклической группы имеет конечный порядок т, то группа изоморфна аддитивной группе классов вычетов по модулю т. Доказательство. Пусть > = (G, ^-^ — мультипликативная циклическая группа с образующим элементом а> т. е. G = {an\n^Z}. Пусть H = (Z, +, —> —аддитивная группа целых чисел и % = (Zm, +, —> —аддитивная группа классов вычетов по модулю т. Первый случай: 0(а) = оо. В этом случае в силу предложения 3.5 все целочисленные степени образующего элемента а различны. Поэтому отображение f множества G на Z такое, что f(an) = n для всякого целого п, является инъективным. Отображение / сохраняет главные операции группы ^, так как для любых целых п и s: f(anas) = f(an+s) = n + s=f(an)+f(as), f(a-n) = — n = — f(an). Следовательно, f является изоморфным отображением группы J- на группу Ш. Второй случай: 0(а) = т, элемент а имеет конечный порядок т. Покажем, что в этом случае группа $ изоморфна группе %т. Докажем, что G = {e, а, а2, ..., аш_1}. Пусть ak — любой элемент из G. По теореме о делении 356
с остатком, для чисел кит существуют такие целые числа q и г, что k = mq-\-r, О ^ г < т. Отсюда получаем ak = awar = ar ^{е, а, ..., ат-г}\ следовательно, G = {e, а, ..., а™-1}. Рассмотрим отображение ф множества О на множество Zm: ZOT = {6, Г, ..., m—1} такое, что cp(afe) = ? для & = 0, 1, ..., т— 1. В силу предложения 3.2 ср является инъективным отображением множества G на Zm. Кроме того, ф сохраняет главные операции группы &, так как Ф (akas) = ф (аш) = k + s = к+s = <р (а*) + ф (а*), Ф (сгк) = m — k = — (k). Следовательно, <р является изоморфным отображением группы ? на группу %т. ? Подгруппы циклической группы. Покажем, что всякая подгруппа циклической группы тоже циклическая. ТЕОРЕМА 3.7. Любая подгруппа циклической группы есть циклическая группа. Доказательство. Пусть $ — мультипликативная циклическая группа с образующим элементом а. Пусть ©%" —подгруппа группы ^. Теорема, очевидно, верна, если Н содержит только один элемент. Предположим, что Н содержит более одного элемента, Подгруппа <з%" содержит хотя бы одну положительную степень элемента а, ибо если a~k еЯ, то (а-*)-1 = ak еЯ, Пусть as — элемент из Н с наименьшим положительным показателем степени s. Всякий элемент из Н есть элемент вида ak. Если ak ?Я, то s делит к. В самом деле, по теореме о делении с остатком (теорема 4.4.4), для чисел к и s существуют такие целые числа q и г, что (1) k = sq + r и 0^r<s. Ввиду (l)ar=ak-^=ak (as)^ еЯ, Так как аг еЯ и O^r <s, то в силу выбора числа s r = 0; значит, k = sq. Таким образом, множество Н состоит из степеней элемента as. Следовательно, о%Г является циклической группой с образующим элементом as. ? 357
Упражнения 1. Найдите все подгруппы аддитивной группы % всех целых чисел. 2. Найдите все подгруппы циклической группы порядка 12. 3. Найдите все подгруппы циклической группы порядка 24. 4. Докажите, что конечная группа простого порядка является циклической и любой ее элемент, отличный от нейтрального, является образующим. 5. Докажите, что существуют циклические группы произвольного порядка. 6. Докажите, что порядок любого элемента конечной группы есть делитель порядка группы. 7. Пусть т и п—взаимно простые натуральные числа. Покажите, что в мультипликативной абелевой группе произведение элемента а порядка т на элемент Ь порядка п есть элемент порядка тп. 8. Покажите, что любая группа порядка 15—циклическая. 9. Пусть ^ — мультипликативная группа корней из 1 (корней п-й степени при всевозможных натуральных я>0). Покажите, что для всякого натурального числа т, отличного от нуля, группа ^ имеет только одну подгруппу порядка т и что каждая такая подгруппа циклическая. § 4. НОРМАЛЬНЫЕ ДЕЛИТЕЛИ И ФАКТОР-ГРУППЫ Нормальные делители группы. Пусть <Ж — подгруппа группы $. Естественно возникает вопрос: при каких условиях разбиения множества G на правые и левые смежные классы по подгруппе <М' совпадают? Подгруппы, обладающие этим свойством, выделяются следующим определением. Определение. Подгруппа ©%" группы $ называется нормальным делителем группы $, если g^hg^H для любого элемента g из G и любого элемента ft из Я. Запись <з%" <] $ означает, что <?%* есть нормальный делитель группы ^. Примеры. 1. Пусть ёп — симметр ическая группа подстановок n-ik степени и о/?п — ее подгруппа всех четных подстановок. Тогда <2??п<]$п. 2. Любая подгруппа абелевой группы является ее нормальным делителем. 3. Пусть ^ — мультипликативная группа обратимых п х м-матриц над полем <=F и <Ж — подгруппа матриц, определители которых равны единице. Тогда ©%"<]<?. Рассмотрим некоторые свойства нормальных делителей группы. СВОЙСТВО 4.1. Подгруппа <Ж группы $ есть нормальный делитель группы $ тогда и только тогда, когда 358
каждый правый смежный класс группы $ по подгруппе <Ж является также левым смежным классом. Доказательство. Предположим, что (1) «ДГ<|,*, и докажем, что (2) Hg — gH для любого g из G. В силу (1) g~lhg ^ Я для любого h из Я. Поэтому hg^gH и HgagH. Далее, в силу (1) (g'^hg-1 e Я. Следовательно, gH e Hg для любого h из Я, т. е. имеет место включение gH czHg. Таким образом, из (1) следует (2). Предположим теперь, что выполняется условие (2). Тогда для любого йеЯ найдется такое hxeЯ, что hg=ghx. Следовательно, g^hg^H для любого gGG и любого h^H, т. е. ©?Г <\ $. Таким образом, из (2) следует (1).П СВОЙСТВО 4.2. Пусть от? — подгруппа группы SB, SB — подгруппа группы $ и &? <\5\ тогда о/ё <\SB. Доказательство. Пусть а и Ь — произвольные элементы из | ©^ | и |SB| соответственно. Тогда Ь~гаЬ ^\о^\, так как, по условию, о?? <] <?. Следовательно, os€ <\ SB. П СВОЙСТВО 4.3. Пересечение любой совокупности нормальных делителей группы & является нормальным делителем группы &. Доказательство. Пусть orf<\$ и SB<\&. Тогда o/Z[\SB есть подгруппа группы J>. Если c^\o^\(]\SB\ HgGG, ТО g~4g^\<^\, g-xcg^\SB\, так как о^ и SB, по условию, — нормальные делители группы J>. Следовательно,g~xcg<^\Gd\{\\SB\uG7g {\SB<\&. Аналогично доказывается, что свойство 4.3 имеет место для любой совокупности нормальных делителей группы^. ? Фактор-группа. Пусть <? = (G, •, _1) — мультипликативная группа и Л, B-czG. Определим произведение А В множеств А и В формулой А-В = {х-у\х<=А, у^В}. ПРЕДЛОЖЕНИЕ 4.1. Пусть е%" — нормальный делитель группы $ и QH — множество всех смежных классов группы & по подгруппе <Ж. Произведение любых двух смеж- 359
них классов & по ©%" есть смежный класс, причем На НЬ=НаЪ. Доказательство. Пусть ha и ftxb, где ft, ^ей, — любые элементы из На и НЬ соответственно. Тогда аЬ,хагг е= Н9 поскольку о%Г <] ?. Поэтому ha-hxb-=h (ahicr1) ab е=\ ЯаЬ; следовательно, (Яа) (Я6) с: Hab. Докажем обратное включение. Пусть hab е~ ЯаЬ. Тогда ftaft = (ha) b €=Ha-Hb. Поэтому Hab с (На) • (ЯЬ); следовательно, (Ha)-(Hb) = Hab. ? На множестве G/H определим операции • и _1 формулами (Ha)-(Hb)--Hab, (На)-1 = Наг1 и рассмотрим алгебру */<2>r = (G/H, ., -1). ТЕОРЕМА 4.2. Пусть о%Г — нормальный делитель группы $-=(G, ., -1). Алгебра ?/<??'=-(G/H, •, -1) является группой. Доказательство. Пусть На, Hbe~G/H. Операции в G/H определяются равенствами (1) (Ha).(Hb) = Hab, (На)-1 = Наг1. Операция умножения смежных классов ассоциативна. В самом деле, если А=-На, В = НЬ, С--Не, то в силу (1) А • (В • С) = (На) • (НЬс) = ЯаЬс, (АВ)С = (Hab) • (/fc) = Habc. Следовательно, А (ВС) = (АВ) С для любых А, В, С из G/#. Элемент Я из G/H является единичным относительно умножения, так как А-Н-=На-Не-=На-=А,т.е. А-Н--А для любого А из G/H. В силу (1) А-А'1-=На-На-1 = = Яш-1 = Я для любого элемента Л из G/H. Следовательно, алгебра ?/сЯГ является группой. ? ОПРЕДЕЛЕНИЕ. Алгебра &/о%Г называется факторгруппой группы 9 по подгруппе еЯГ. Примеры. 1. Пусть % — аддитивная группа целых чисел, т — фиксированное натуральное число и k = k + mZ. 360
Тогда Z/mZ = {6, Г, ..., in^T}, k-\-n=-k-\-n, — (&) = (—k) = m — k. Алгебра %/m% = (Z/mZ, +, — > является фактор-группой группы % по подгруппе т%. 2. Пусть ёп — симметрическая группа подстановок степени п(п>\) и о??п — ее подгруппа четных подстановок. Тогда фактор-группа §п/е^п есть циклическая группа второго порядка, так как SjAn = {An9 Ana}, где а —какая- нибудь нечетная подстановка. Ядро гомоморфизма. Пусть ^ = (G, •, _1> и У = = (G', • ,-1) — мультипликативные группы. ОПРЕДЕЛЕНИЕ. Пусть ф — гомоморфизм группы & в группу У. Ядром гомоморфизма ф называется множество Кег ф = {л: е G | ф (х) = е'}, где в'— единица группы У. Множество Кегф не пусто, так как ф(е)=е\ Множество Кегф замкнуто в группе ?, так как для любых а, Ъ из Кегф Ф (а • Ь) = ф (а) о ф (&) = е' °е' = е'; ф (а'1) = (ф (а))-1 = т. е. элементы а • Ь и а-1 принадлежат множеству Кег ф. ОПРЕДЕЛЕНИЕ. Подгруппу группы 5 с основным множеством Кегф, где ф — гомоморфизм группы $, обозначим Sfferq: 5Гегф = <Кегф, •, -1) и назовем ядерной группой гомоморфизма ф или ядром (гомоморфизма) ф. ПРЕДЛОЖЕНИЕ 4.3. Если ф — гомоморфизм группы 5 в группу У, то Sftercp является нормальным делителем группы &. Доказательство. Выше было показано, что множество Кегф замкнуто относительно главных операций группы Э. Кроме того, для любого g из G и любого h из Кегф q>(g-1hg) = y(g-1)°e'°<p(g) = <p(g-1eg) = q>(e) = e'y т. е. g^hg s Кег ф. Следовательно, Sffer ф является нормальным делителем группы ,?. 361
ПРЕДЛОЖЕНИЕ 4.4. Пусть ср — гомоморфизм группы $ в группу У с ядром ^Г = (Н, • , _1>. Для любых а, Ъ из G, если ф(а) = ф(&), то На = НЬ. Доказательство. Так как ф — гомоморфизм и Ф(а) = ф(&), то ф(а&-1) = ф(а)оф(6-1) = ф(а)о(ф(6))-1 = ф(а)о(Ф(а))-1=^ Следовательно, с-Ней и На = НЬ. ? Теорема о гомоморфизмах. Одной из основных в теории групп является следующая теорема о гомоморфизмах. ТЕОРЕМА 4.5. Пусть f — гомоморфизм группы S на группу У с ядром сЯГ. Тогда фактор-группа $1<Ж изо- морфна группе У. Доказательство. Пусть Q%T = 3%erf и Я = Кег/. Пусть G = G/H — множество всех смежных классов группы 9 по подгруппе сЯГ. Рассмотрим отображение <p:G/H->-G', определяемое следующим образом: (1) <p(Ha)=f(a) для любого смежного класса Яа из G. Так как Кег/ = #, то значение ф(Яа) не зависит от выбора представителя а в смежном классе На. Отображение ф сохраняет операцию умножения в группе Э/з%Г, так как Ф (На • НЬ) = ф (НаЬ) = / (аЬ) = / (а). / (Ь) = Ф (Я а) ср (Я6). Следовательно, по теореме 3.3.1, ф является гомоморфизмом группы Э/оЯГ в группу <?'. По условию, / есть отображение G на G'. В силу (1) отсюда следует, что ф есть отображение G/H на G'. Отображение ф является инъективным. В самом деле, в силу (1) из равенства ф(Яа) = ф(ЯЬ) следует f(a) = /(&); согласно предложению 4.4, отсюда следует На = НЬ. Итак, установлено, что ф есть инъективное отображение G/H на G'. Следовательно, ф является гомоморфизмом факторгруппы */еЯГ на группу У. ? Упражнения 1. Докажите, что любая фактор-группа аддитивной группы % целых чисел является циклической. 2. Найдите все фактор-группы циклической группы порядка 12. 3. Докажите, что любая фактор-группа циклической группы является циклической, 3<52
4. Докажите, что фактор-группа симметрической группы $п подстановок л-й степени по подгруппе о^п всех четных подстановок есть циклическая группа второго порядка. 5. Докажите, что аддитивная группа % целых чисел изоморфна аддитивной группе 2% четных чисел. 6. Докажите, что аддитивная группа всех комплексных чисел изоморфна аддитивной группе всех векторов плоскости. 7. Пусть ^—группа подстановок. Рассмотрим отображение h группы ^ в мультипликативную группу чисел +1 и — 1, ставящее в соответствие каждой подстановке т из & ее знак sgnr. Покажите, что h есть гомоморфизм. 8. Покажите, что мультипликативная группа корней пг-и степени из 1 изоморфна аддитивной группе %т классов вычетов по модулю т. 9. Пусть &—мультипликативная группа обратимых действительных пхя-матриц и (э^*-— мультипликативная группа действительных чисел, отличных от нуля. Пусть h—отображение & в е^*> ставящее в соответствие каждому элементу g группы 2? определитель \g\. Докажите, что h есть гомоморфизм, ядром которого является подгруппа группы ^ всех /гХя-матриц с определителями, равными 1. 10. Пусть е^ — аддитивная группа действительных чисел и Ж — мультипликативная группа комплексных чисел, модуль которых равен 1. Докажите, что отображение / множества R в К, определяемое формулой /(#)=cos 2яя+? sin 2пх, есть гомоморфизм группы е^ на группу ofC с ядром Z. 11. Пусть (| —аддитивная группа рациональных чисел и % — аддитивная группа целых чисел. Покажите, что каждый элемент фактор-группы $/g имеет конечный порядок. Докажите, что для всякого натурального /г, отличного от нуля, (^1% имеет только одну подгруппу порядка п и что каждая такая подгруппа циклическая,
Глава одиннадцатая ТЕОРИЯ ДЕЛИМОСТИ В КОЛЬЦЕ ЦЕЛЫХ ЧИСЕЛ § 1. РАЗЛОЖЕНИЕ ЦЕЛЫХ ЧИСЕЛ НА ПРОСТЫЕ МНОЖИТЕЛИ Идеалы кольца целых чисел. Введем понятие идеала. ОПРЕДЕЛЕНИЕ. Непустое множество / целых чисел называется идеалом кольца % целых чисел, если оно замкнуто относительно сложения и умножения на любые целые числа, т.е. а + 6, mgZ для любых а, b^I и любого /hgZ. Из определения следует, что любой идеал / замкнут относительно вычитания и, следовательно, содержит число нуль. Пусть п — любое фиксированное целое число. Легко проверить, что множество nZ, nZ = {nx\x^Z}, является идеалом кольца %. Такой идеал называется главным идеалом, порожденным числом п. Идеал 0-Z состоит только из нуля и называется нулевым идеалом. Легко видеть, что nZ = (—n)Z. Идеал, порожденный числом п, обозначают также через (п). ТЕОРЕМА 1.1. Каждый идеал кольца целых чисел является главным. Если I —ненулевой идеал кольца % и d— наименьшее положительное число, содержащееся в I, то множество I состоит в точности из кратных числа d, т. е. I = dZ. Доказательство. Нулевой идеал, очевидно, есть главный идеал, порожденный нулем. Пусть / — ненулевой идеал, т. е. он содержит хотя бы одно отличное от нуля число а. Тогда а, —йе/ и одно из этих чисел положительно. Пусть d — наименьшее положительное число, содержащееся в /. Идеал / содержит все кратные числа d, т. е. dZ а /. Надо еще показать, что каждое число с из I есть кратное числа d. Для этого разделим с на d с остатком: c = dq + r, 0^r<<2, ?, tgZ. 364
Так как с и dq принадлежат идеалу /, то c — dq = r^I. Случай г>0 невозможен, так как d является наименьшим положительным числом, содержащимся в /. Следовательно, г = 0 и c = dq. Таким образом, идеал / состоит в точности из кратных числа d, 1 — dZ. ? Простые числа. Целое число р называется простым, если оно отлично от 0 и ± 1 и имеет делителями только ± 1 и ± р. Целое число а, отличное от 0 и ± 1 и имеющее кроме ±1 и±а еще другие делители, называется составным. Непосредственная проверка показывает, что первыми положительными простыми числами являются 2, 3, 5, 7, 11, 13, 17, 19, 23, 29; первыми отрицательными простыми числами являются —2, —3, —5, —7, —11, —13, —17, —19, —23, —29. Разложение целых чисел на простые множители. Целые числа а и Ь называются взаимно простыми, если любой их общий делитель равен +1 или —1. ПРЕДЛОЖЕНИЕ 1.2. Если целые числа а и b взаимно простые, то существуют такие целые числа и, v, что au + bv= 1. Доказательство. Рассмотрим множество I = {ax + by\x, у^1}. Легко видеть, что это множество не пусто и замкнуто относительно сложения и умножения на целые числа. Следовательно, / есть идеал кольца % целых чисел. Множество / содержит число #, а = а-1+6-0, и число Ь: Ъ = = а • 0 + Ь • 1. Множество / содержит положительные числа, так как а и Ь взаимно простые и, значит, хотя бы одно из этих чисел отлично от нуля. Обозначим через d наименьшее положительное натуральное число, принадлежащее множеству /. Тогда согласно определению множества / существуют такие целые числа и, р, что au + bv = d. По теореме 4.4.5, d есть общий делитель чисел а и Ь. Так как а и b взаимно простые и d>0, то отсюда следует, что d=l. Таким образом, au + bv=l. О ТЕОРЕМА 1.3. Если произведение двух целых чисел делится на простое число р, то по меньшей мере один из сомножителей делится на р. Доказательство. Пусть произведение ab целых чисел делится на р и а не делится на р. Тогда числа а 365
и р взаимно простые. Согласно предложению 1.2, существуют такие целые числа и, v, что au-{-pv=l, откуда abu+pbv = b. Так как аЪ делится на р, то abu+pbv делится на р, т. е. b делится на р. ? ТЕОРЕМА 1.4. Если произведение нескольких целых чисел делится на простое число р, то по меньшей мере один из сомножителей делится на р. Доказательство проводится индукцией по числу сомножителей на основании теоремы 1.3. Предположим, что теорема верна для п сомножителей. Пусть р | (а±... ап х хап+1); следовательно, р\(а1...ап)ап^.1. Согласно теореме 1.3, по меньшей мере одно из двух чисел аг..мп и ап+1 делится на р. Если ап+г не делится на р, то произведение а1...ап делится на р. Следовательно, по индуктивному предположению хотя бы одно из чисел ах.%.ап делится на р. ? ТЕОРЕМА 1.5. Всякое целое положительное число, отличное от 1, представимо в виде произведения положительных простых чисел. Это представление единственно с точностью до порядка сомножителей. Доказательство. Пусть а— целое положительное число, отличное от 1. Докажем представимость а в виде произведения положительных простых множителей, предполагая, что это утверждение верно для всех целых положительных чисел, не равных единице и меньших а. Если а —простое число, то утверждение верно. Если а — составное, то его можно представить в виде произведения be целых чисел 6, с, меньших а и больших единицы. Согласно индуктивному предположению, b и с представимы в виде произведения положительных простых чисел: 6 = р1...рг, с = рг+1...рт. Подставив эти разложения в равенство a = bcf получим представление числа а a = Pi---PrPw-Pm в виде произведения положительных простых чисел. Докажем единственность представления, используя метод индукции. Если а —простое число, то, очевидно, единственность представления следует из определения простого числа. Предположим, что единственность представления для всех чисел, меньших а, имеет место. Предполо- 366
жим, что а составное, и рассмотрим два любых представления числа а в виде произведения положительных простых чисел: (1) a = p1...pm = ql...qn. Так как Pi | ft •.. <7Л, то согласно теореме 1.4 по меньшей мере один из сомножителей ft... qn делится на р±; при соответствующей нумерации можно считать, что р± | ft. Поскольку р± и ft — положительные простые числа, то Pi = ft- Сокращая обе части равенства (1) на рх и полагая а/р1 = а1, получим a1 = p2...pm = q2,..qn. Так как число аг меньше, чем а, то по индуктивному предположению число % имеет единственное представление в виде произведения положительных простых чисел; следовательно, т = п и при соответствующей нумерации р2 == = ft> •••> Pm = Qm- Таким образом, число а единственным образом представимо в виде произведения положительных простых чисел. ? СЛЕДСТВИЕ 1.6. Всякое целое чиоло с, отличное от нуля и ± 1, единственным образом представимо в виде произведения (1) с = ер1...рт, где рх... рт — положительные простые числа и 8 = ± 1. В представлении (1) могут встречаться равные простые числа. Если в представлении (1) объединить равные простые множители и изменить, если это необходимо, нумерацию, то представление (1) можно записать в виде (2)с = ерДО...р?*, где рх, ..., ps — различные положительные простые числа, 8 = ±1 и а?>0 для 1=1, 2, ..., s. Представление целого числа (отличного от нуля) в виде (2) называется его каноническим разлооюением на простые множители. Делители целого числа. Зная каноническое разложение натурального числа, можно полностью описать делители этого числа. ПРЕДЛОЖЕНИЕ 1.7. Пусть п — натуральное число и 367
— его каноническое разложение на простые множители. Тогда каждый натуральный делитель d числа п может быть записан в виде <2)d = pfo\..p««, где bt —целые числа, удовлетворяющие условиям (3) 6/<={0, 1, ..., щ) для * = 1, 2, ..., s. Доказательство. Пустьdесть какой-либо натуральный делитель числа п. Так как каждый простой делитель числа d является делителем числа п, то ввиду (1) в разложении d на простые множители могут встречаться только числа множества {ply ...,ps}. Поэтому число d представимо в виде (2), причем показатели б* должны удовлетворять условиям (3). С другой стороны, если d представимо в виде (2) и показатели б/ удовлетворяют условиям (3), то п = d (р^~б1 ... р««-в«) (а* - 6, Ss 0), т. е. d является натуральным делителем числа п. Число и сумма натуральных делителей числа. Предложение 1.7 позволяет подсчитать число и сумму натуральных делителей числа. ПРЕДЛОЖЕНИЕ 1.8. Пусть п = р^... р"*-каноническое разложение на простые множители натурального числа п. Тогда число % (п) натуральных делителей числа п выражается формулой %(п) = (ах+1) ... (ct^+1). Доказательство. Согласно предложению 1.7, любой натуральный делитель d числа п представим в виде где (3) б*<={0, 1, ..., at} для 1 = 1, 2, ..., s. Поэтому, чтобы найти число всех натуральных делителей числа /г, достаточно подсчитать число всевозможных упорядоченных наборов бх, ..., 8S, удовлетворяющих условиям (3). Ввиду (3) 8t может принимать а* + 1 значений, выборы различных значений бх, ..., б^ не зависят один от другого и в силу единственности разложения на простые множители разным наборам соответствуют различные делители п. Следовательно, число всех натуральных делителей числа п равно (ах+1) ... (оу+1). 368
Примеры. 1. Пусть л =180. Тогда 180 = 22-32-5 и т(180) = (2+1)(2 + 1)(1 + 1) = 18. 2. Пусть я*=60. Тогда 60 = 22-3-5 и т(60) = (2+1)(1 + 1)(1 + 1) = 12. ПРЕДЛОЖЕНИЕ 1.9. Пусть п = р\ ,«1 „а„ s ническое разложение натурального числа п на простые множители. Тогда сумма а(п) всех натуральных делителей числа п выражается формулой а1+1_! р^+1_! Доказательство. Согласно предложению 1.7, каждый делитель числа п имеет вид р^1 ... p*s и (5) о(п)= 2 р?...рУ 6iG{0, 1, ... , «i> Легко видеть, что каждое слагаемое в (5) в точности один раз встречается после раскрытия скобок произведения (6) (l+Pi+... + Р?1) ... (1+Р,+...+#). Следовательно, сумма (5) равна произведению (6). Так как каждый сомножитель есть сумма членов геометрической прогрессии, то произведение (6) равно pF+1-i_pr*+I-i Pi —I " Ps— 1 Таким образом, верна формула (4). ? Пример. Пусть п = 60. Тогда я = 22-3-5 и /спч 23-1 З2-1 52-1 на* ice ^(60)=^гГ • Т=\ • -ь=Г = 7'4'6 =168- Бесконечность множества простых чисел. Следующая теорема была доказана Евклидом. ТЕОРЕМА 1.10. Множество положительных простых чисел бесконечно. Доказательство. Покажем, что для каждого данного конечного множества положительных простых чисел рх, ..., рп существует положительное простое число, 369
отличное от всех чисел этого множества. Для этого рассмотрим число a = Pl'p2 ••¦ Ря+Ь Так как а есть натуральное число, большее единицы, то, по теореме 1.5, оно разложимо в произведение положительных простых чисел и поэтому обладает хотя бы одним положительным простым делителем р. Этот делитель отличен от рг • р2, ..., рл, так как в противном случае р | рг... рЛ, р | а и разность а — рг • р2... р„ = 1 делилась бы на р, а это невозможно. Следовательно, множество всех простых чисел бесконечно. ? Решето Эратосфена. Рассмотрим метод нахождения положительных простых чисел, не превосходящих данного числа. ПРЕДЛОЖЕНИЕ 1.11. Положительное составное число а имеет по крайней мере один положительный простой делитель, не превосходящий ]/ а. Доказательство. Среди отличных от единицы положительных делителей числа а существует наименьший; обозначим его через р. Если бы число р было составным, то оно имело бы положительный делитель q, удовлетворяющий условиям 1<<7<р. В этом случае число q было бы положительным делителем числа а, меньшим р, что противоречит выбору числа р. Следовательно, р—-простое число. Если а = р&, то ftS^p. Перемножая a = pb и Ь^р почленно и сокращая на &, получаем, а^р2 и р^Уа. ПРЕДЛОЖЕНИЕ 1.12. Если положительное число а, отличное от единицы, не делится ни на одно положительное простое число, не превосходящее Ya> то он° простое. Это предложение непосредственно следует из предложения 1.11. Существует простой метод составления таблицы положительных простых чисел, не превосходящих данного целого числа. Этот метод носит название решета Эратосфена. Предположим, что надо найти все положительные простые числа, не превосходящие данного натурального числа а. Для этого выпишем подряд последовательность всех натуральных чисел от 2 до а: 2, 3, 4, ..., а. В этой последовательности вычеркнем каждое второе число после 2. Первое незачеркнутое число —это простое число 3. Далее 370
вычеркнем каждое третье число после 3 (причем надо считать и те числа, которые уже вычеркнуты ранее). Первое следующее за 3 невычеркнутое число — это простое число 5. Вычеркнем каждое пятое число после 5, и т. п. Это вычеркивание продолжаем до тех пор, поине дойдем до первого простого числа, не меньшего ]/ а. В силу предложения 1.12 все числа, оставшиеся невычеркнутыми, будут положительными простыми, не превосходящими числа а. Пример. Составим таблицу положительных простых чисел, не превосходящих 50. Для этого выпишем натуральные числа от 2 до 50 и произведем вычеркивание до встречи первого числа, большего или равного 1^50, т. е. до 11 (вычеркнутые числа — светлые): 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Вычеркнем из этой последовательности каждое второе число после 2, далее —каждое третье число после трех, затем каждое пятое число после 5 и, наконец, каждое седьмое число после 7. Все числа, оставшиеся невычеркнутыми, будут простыми. Таким образом, получаем следующую таблицу положительных простых чисел, меньших 50: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47 Упражнения 1. Покажите, что для любого целого п число л(п + 1) (/г+2) делится на 6. 2. Покажите, что для любого целого п число /г(я+1) (2л+1) делится на 6. 3. Пусть т и л—взаимно простые целые числа. Покажите, что взаимно простыми являются следующие числа: т и т+п, т и т—п, т+п и 2/я+/г. 4. Пусть a, by с, d —целые положительные числа и a/b, c/d — несократимые дроби. Покажите, что если a/b=c/d, то а=с и 6 = rf. 5. Покажите, что если 2Л+1—простое число, то п=2т. 6. Покажите, что если 2Л —1— простое число, то «—простое. 7. Пусть а и п—целые положительные числа а>1. Докажите, что если а71+ 1—простое число, то /г=2от. 8. Разложите число 50! на простые множители. 9. Покажите, что при натуральном /г>1 сумма 1+-к~ + ...Н не может быть целым числом. 371
10. Натуральное число называется совершенным, если оно равно половине суммы своих положительных делителей. Докажите, что всякое четное совершенное число имеет вид 2Л(2л+1—1), где «gN, причем 2/Н"1—1—простое, § 2. НАИБОЛЬШИЙ ОБЩИЙ ДЕЛИТЕЛЬ И НАИМЕНЬШЕЕ ОБЩЕЕ КРАТНОЕ Наибольший общий делитель. Целое число с называется общим делителем целых чисел аъ ..., ап, если с есть делитель каждого из этих чисел. ОПРЕДЕЛЕНИЕ. Наибольшим общим делителем целых чисел аъ ..., ап называется такой их общий делитель, который делится на любой общий делитель этих чисел. Целые числа %,..., ап называются взаимно простыми, если их наибольший общий делитель равен единице. Наибольший общий делитель чисел аъ ..., ап обозначается НОД (аг, ..., ап), положительный наибольший общий делитель этих чисел обозначается нод(%, ..., ап). СЛЕДСТВИЕ 2.1. Если d есть наибольший общий делитель целых чисел аъ ..., апу то множество всех общих делителей этих чисел совпадает с множеством всех делителей числа d. СЛЕДСТВИЕ 2.2. Любые два наибольших общих делителя целых чисел alf ..., ап ассоциированы, т. е. могут отличаться только знаком. Если d есть наибольший общий делитель чисел аъ ..., ап, то число (— d) также есть наибольший общий делитель этих чисел. ПРЕДЛОЖЕНИЕ 2.3. Если a = YlP"p u ь = Цр*р Р\а р\Ъ суть канонические разложения целых положительных чисел а и Ь, то число d d = fjpniin(apipp) р\а р\Ь является наибольшим общим делителем чисел а и Ъ. Доказательство. Число d является делителем как числа а, так и числа Ь в силу предложения 1.7, т. е. d есть общий делитель а и Ъ. Далее, если с —любой положительный общий делитель а и 6, то в силу предложения 1.7 с = ЦрчР, р\Ь 372
причем для каждого делителя а и Ъ выполняются неравенства Ур^ар, Yp^IV Поэтому с\d. Следовательно, d есть наибольший общий делитель чисел а и Ь. ? Пустьаъ ..., ап — любые целые числа. Рассмотрим множество (1) I = {k1a1+...+knan\kli ..., kns=Z} всех целочисленных линейных комбинаций чисел аъ ..., ап. Легко проверить, что это множество есть идеал в кольце §. Этот идеал называется идеалом, порожденным числами ai9 ..., ап, и обозначается через \аъ ..., ап). ТЕОРЕМА 2.4. Для любой совокупности целых чисел аъ ... ,ап существует наибольший общий делитель. Число d является наибольшим общим делителем чисел аг, ..., ап тогда и только тогда, когда идеал {аъ ..., ап) равен идеалу (d). Доказательство. Если все числа аъ ..., ап равны нулю, то единственным наибольшим общим делителем этих чисел является число нуль. Предположим, что хотя бы одно из чисел аг, ..., ап отлично от нуля. Рассмотрим множество / всех целочисленных линейных комбинаций чисел аъ ..., ап. Множество / содержит числа aSf s = 1, ..., п, так как as = kxax + ... ...+knan, где ks=l и ki = 0 для f=^=s. Поэтому множество / содержит числа, отличные от нуля. Множество / есть идеал кольца целых чисел, порожденный числами аъ ..., ап\ / = (а1? ..., ап). Согласно теореме 4.4, каждый идеал кольца % является главным и, значит, состоит из кратных некоторого целого числа d, I = dZ. Докажем, что d есть НОД (аъ ..., ап). Так как каждый элемент множества / делится на d, то d \ at для i = 1, ..., п, т-. е. d есть общий делитель чисел аъ ..., ап. Далее, так как d е /, то ввиду (1) существуют такие целые числа kXi ,.., kni что ^ = ^1^+ ... +knan. Отсюда следует, что любой общий делитель с чисел %,..., ап есть также делитель числа d. Таким образом, любой элемент d, порождающий идеал 1 = (а1, ..., ап), является наибольшим общим делителем чисел аъ ..., ап. Из доказанного, в частности, следует, что любая конечная совокупность чисел аъ ..., ап обладает наибольшим общим делителем. 373
Пусть dr — любой наибольший общий делитель Чис&Л аъ ..., ап и d — по-прежнему число, порождающее идеал /; докажем, что (аъ ..., an) = (d'). Любые два НОД чисел аъ ..., ап ассоциированы, т. е. могут отличаться только знаком. Ввиду этого d'==bd. Поэтому идеал (d') совпадает с идеалом (d). Следовательно, (аъ ..., an) = (d'). ? Анализ доказательства предыдущей теоремы дает возможность формулировать также следующую теорему. ТЕОРЕМА 2.5. Наибольший общий делитель d целых чисел аг, ..., ап представим в виде целочисленной линейной комбинации этих чисел, т. е. в форме d = kLaL + ... + knan с целыми kl9 ..., kn. При этом если не все числа аъ ..., ап равны нулю, то \d\ есть наименьшее целое положительное число, представимое в этой форме. Все числа, представи- мые в этой форме, т. е. все числа идеала (аъ ..., ап), являются кратными числу d. ПРЕДЛОЖЕНИЕ 2.6. Если общий делитель d целых чисел %,..., ап представим в виде целочисленной линейной комбинации этих чисел, то d есть наибольший общий делитель чисел аъ ..., ап. Доказательство. Предположим, что общий делитель d чисел аъ ..., ап представим в виде где kl9 ..., kn — целые числа. Тогда любой общий делитель чисел аъ ..., ап делит сумму кхах-\-...+knan и, значит, d. Таким образом, d есть наибольший общий делитель чисел а19 ..., ап. ? ПРЕДЛОЖЕНИЕ 2.7. Для любых целых чисел а, Ь, с НОД (а, &, с) ~ НОД (НОД (а, 6), с). Доказательство. Пусть dx есть НОД(а, Ь) и d — НОД(Й!, с). Тогда d есть общий делитель чисел dx и с, а число dx есть общий делитель чисел а и Ь. Поэтому d есть общий делитель чисел а, Ь и с. Согласно теореме 2.5, числа d и dx можно представить в виде d = kd1-\-kzp9 (i1 = fe1a+A2&, где ky kl9 k2, kz — целые числа; поэтому d — kk1a-\-kk2b + + k>dc. Таким образом, общий делитель d чисел а, Ь, с можно линейно выразить через эти числа. Следовательно, согласно предложению 2.6, d является наибольшим делителем этих чисел, D 374
Это предложение дает возможность свести нахождение наибольшего общего делителя нескольких чисел к нахождению наибольшего общего делителя двух чисел. ПРЕДЛОЖЕНИЕ 2.8. Для любых целых чисел a, b не НОД(ас, &с)~с-НОД(а, Ь). Доказательство. Пусть d есть НОД(а, Ь). Тогда согласно теореме 2.5 d можно представить в виде где &х и k2 — целые числа, поэтому cd = kxac-\-k2bc. Кроме того, так как d есть общий делитель а и 6, то cd есть общий делитель ас и be. Следовательно, согласно предложению 2.6, число cd есть наибольший общий делитель чисел ае и be. ? Взаимно простые числа. Рассмотрим свойства взаимно простых чисел. ПРЕДЛОЖЕНИЕ 2.9. Целые числа ах, ..., ап взаимно простые тогда и только тогда, когда единица представима в виде целочисленной линейной комбинации этих чисел. Доказательство. Если числа аъ ..., ап взаимно простые, то их наибольший общий делитель единица представим согласно теореме 2.5 в виде целочисленной линейной комбинации этих чисел. Обратно: если единица представима в виде целочисленной линейной комбинации чисел а19 ..., ап, то в силу предложения 2.6 единица есть наибольший общий делитель этих чисел. Поэтому числа а19 ..., ап взаимно простые. ? ПРЕДЛОЖЕНИЕ 2.10. Целые числа аг, ...,апвзаимно простые тогда и только тогда, когда они не имеют общего простого делителя. Доказательство предоставляется читателю. ТЕОРЕМА 2.11. Если целое число делит произведение двух целых чисел и взаимно простое с одним из сомнооюи- телей, то оно делит другой сомнооюитель. Доказательство. Пусть числа а и b взаимно простые и а делит be. Докажем, что а делит с. Так как числа а и Ъ взаимно простые, то существуют такие целые числа k± и &2> что k^a -f- кф = 1. Умножив обе части равенства на с, получим ^ас+кфе^с. Кроме того, а делит be. Поэтому а делит klac-\-k2bc, т. е. а делит с. Q 375
ПРЕДЛОЖЕНИЕ 2.12. Общий делитель d целых ни- сел аъ ..., ап, не равных одновременно нулю, тогда и только тогда является их наибольшим общим делителем, когда числа a±/d, ..., an/d взаимно простые. Доказательство. Так как, по условию, не все числа аъ ..., ап равны нулю, то d Ф 0. Если d есть наибольший общий делитель чисел а1У ..., ап, то согласно теореме 2.5 его можно линейно выразить через а1? ..., ап: (1) k1a1+... + knan = d, где &!, ..., kn — целые числа. Разделив обе части равенства на d, получим (2) А^ + ... + *ж2р-1. Отсюда согласно предложению 2.9 следует, что числа ajd, ..., ajd взаимно простые. Обратно: если числа ajd, ..., an/d взаимно простые, то согласно предложению 2.9 существуют такие целые числа kl9 ..., kn, что выполняется равенство (2). Умножив обе части этого равенства на d, получим равенство (1). Так как общий делитель d чисел аг, ..., ап представим в виде линейной комбинации этих чисел, то согласно предложению 2.6 число d есть наибольший делитель чисел аъ ..., ап. ? Наименьшее общее кратное. Целое число с называется общим кратным целых чисел а1У ..., апу если оно делится на каждое из этих чисел. ОПРЕДЕЛЕНИЕ. Наименьшим общим кратным целых чисел аъ ..., ап называется такое их общее кратное, которое делит любое общее кратное этих чисел. Наименьшее общее кратное целых чисел аъ ..., ап обозначается через НОК (аъ ..., ап). Положительное наименьшее общее кратное чисел аъ ..., аП9 отличных от нуля, обозначается через [а19 ..., ап]. Из определения ИОК(а±, ..., ап) непосредственно вытекают следствия. СЛЕДСТВИЕ 2.13. Любые два наименьших общих кратных цетх чисел аг, ..., ап ассоциированы в %, т. е. могут отличаться только знаком. Если число т есть НОК (аъ ..., ап), то и число (— т) есть НОК (аъ ..., ап). СЛЕДСТВИЕ 2.14. Если т — наименьшее общее кратное чисел аъ ..., ап, то мнооюество всех общих кратных этих чисел совпадает с множеством всех кратных числа т. 376
ПРЕДЛОЖЕНИЕ 2.15. Пусть а = р^...р** и Ь^ = Р^1...p®sj где pv ..., ps — попарно различные положительные простые числа и ait f^ — целые неотрицательные числа. Тогда [а, Ь] = ршах(av pi)...р™** (а*> ps). Доказательство этого предложения предоставляется читателю. ТЕОРЕМА 2.16. Для любой совокупности целых чисел av ..., an существует наименьшее общее кратное. Целое число т есть HOK(#i, •••» #л) тогда и только тогда, когда (а1)(]...[\(ап)^=(т)9 где (о*) — идеал, порожденный числом at. Доказательство. Рассмотрим множество (1) /=(аОП...П(а«). Так как множества (ах), ..., (ап) замкнуты относительно сложения и умножения на целые числа, то легко проверить, что их пересечение / также замкнуто относительно сложения и умножения на целые числа. Кроме того, это множество не пусто, так как содержит нуль. Поэтому / есть идеал кольца целых чисел. Согласно теореме 4.4, любой идеал кольца целых чисел является главным, т. е. существует целое число т такое, что каждое число из / кратно т, 1 = (т). Докажем, что т есть НОК (ai9..., ап). Так как тг/, то ввиду (1) те (а*) для 1=1, ..., т, т. е. т есть общее кратное чисел аъ ..., ап. Кроме того, если т' — любое общее кратное чисел аъ ..., ап, то т' е е (аг), ..., т' е (ап). Следовательно, т! е / = (аг) П ... • • • П fa») = (/я) и поэтому т1 делится на т. Таким образом, т есть наименьшее общее кратное чисел alf ..., ап. Предположим теперь, что тх есть наименьшее общее кратное чисел аъ ..., ап и докажем, что (тг) = (ах) П... • ••П(#л)- Так как числа тг и т суть наименьшие общие кратные одной и той же совокупности чисел аъ ..., ап, то они ассоциированы в 2f, т.е. тг = ±т. Следовательно, (mi) = (m) и поэтому (а1)П...П(«/г) = (т1).П ПРЕДЛОЖЕНИЕ 2.17. Для любых отличных от нуля целых чисел а, Ъ и с при е>0 имеем: [ас, bc] = c[a, b]. Доказательство. Пусть т = [а, 6]. Так как т есть общее кратное чисел а и ft, то cm есть общее кратное 377
чисел ас и be. Пусть т* — любое общее кратное чисел ас и be, т. е. т! = kac = sbc, где & и s — целые числа. Так как сЦ^ 0, то ka = sb. Поэтому &а делится на m и, следовательно, т' делится на тс. Таким образом, cm есть наименьшее общее кратное чисел ас и be. Кроме того, cm>0; поэтому [ас, Ьс] = ст = = с[а, Ь]. ? СЛЕДСТВИЕ 2.18. Для любых отличных от нуля целых чисел a, b и с НОК(о?, Ьс)~с-?ЮК(а, Ь). ПРЕДЛОЖЕНИЕ 2.19. Если целые числа а и b взаимно простые, то ab есть наименьшее общее кратное чисел aub. Доказательство. Число ab есть общее кратное чисел а и Ъ. Поэтому достаточно доказать, что любое общее кратное т чисел а и b делится на ab. Число т кратно &, т. е. т = Ьс, где с—целое число, и а\Ьс. Так как, по условию, а и b взаимно простые, то отсюда согласно теореме 2.11 следует, что а делит с, c = ad. Следовательно, m = abd, т. е. т делится на ab. Таким образом, ab есть наименьшее общее кратное чисел а и Ь. ? ПРЕДЛОЖЕНИЕ 2.20. Если целые числа aub отличны от нуля, то (1) НОК(а, &)~ножЬ>7- Доказательство. Пусть d есть наибольший общий делитель чисел а и Ь. Так как числа а и b отличны от нуля, то d=7^0. Согласно следствию 2.18, (2) HOK(fl, 6)~dHOK(a/d, bid). Далее, в силу предложения 2.12 НОД(я/<2, b/d)—l. Отсюда согласно предложению 2.19 О) нок(?,1)~44. На основании (2) и (3) заключаем, что выполняется соотношение (1). ? ТЕОРЕМА 2.21. Для любых целых чисел a, b и с (1.) НОК(а, &, с)~НОК(ИОК(я, &), с). Доказательство. Пусть m = HOK(tf, b, с), тг = = НОК(#, Ь) и m'=HOK(/rci, с). Согласно теореме 2.16, (2) (т) = (а)П(&)П(*), Ы = (а) П (6), (т') = (тО П (*); 378
поэтому (3) (т') = ((а)П(Ь))()(с) = (а)(\(Ь)№. Из (2) и (3) следует, что (w) = (m'). ? Упражнения 1. Пусть а и Ь—взаимно простые целые положительные числа. Покажите, что сумма 1 т-т после приведения к общему зиаме- d CL-^-O нателю есть несократимая дробь. 2. Докажите, что d есть наибольший общий делитель целых чисел а, Ь, с тогда и только тогда, когда a/d, b/d, c/d —целые взаимно простые числа. 3. Докажите, что для любых целых чисел а, Ь, с, k НОД(?а, kb, kc)~kHOR(a, b, с). 4. Докажите, что общее кратное m целых чисел а, Ь, с есть наименьшее общее кратное тогда и только тогда, когда числа т/а, т/Ь, т/с взаимно простые (а, Ь, сфО). 5. Пусть а=т/п, где т, п—целые взаимно простые числа, тФ§ и /г>0. Если a—r/s, где г, s—целые и s>0, то существует натуральное число t такое, что r=im и s~ln. При этом t есть наибольший общий делитель чисел г и s* § 3. АЛГОРИТМ ЕВКЛИДА И КОНЕЧНЫЕ ЦЕПНЫЕ ДРОБИ Алгоритм Евклида, Рассмотрим наиболее простой способ нахождения наибольшего общего делителя двух целых чисел. ПРЕДЛОЖЕНИЕ 3.1. Пусть а иЬ — два целых числа, ЬфО и (1) a = bq+r (0<r<|6|). Тогда нод(а, 6) = нод (6, г). Доказательство. Из (1) следует, что любой общий делитель чисел а и Ъ есть делитель числа r = a — bq и любой общий делитель чисел bur есть делитель числа а. Поэтому множество всех общих делителей чисел а и Ъ совпадает с множеством всех общих делителей чисел Ь и г. Отсюда следует, что положительный общий делитель чисел а и Ь совпадает с положительным общим делителем чисел Ъ и г, т. е. нод (а, Ь) = нод(Ь, г). ? Если Ь\а, где 6^1, то, очевидно, нод (a, b) = b. Для нахождения нод двух целых чисел применяют способ «яо- смдовательного деления», называемый алгоритмом Евклида. Сущность этого способа состоит в том, что в силу доказанного выше предложения задача нахождения нод чисел а 379
и Ь сводится к более простой задаче нахождения нод чисел & и г, где 0^г<|Ь|. Если г = 0, то нод(а, b) = b. Если же г =т*= 0, то рассуждения повторяем, отправляясь от b и г. В результате получим цепочку равенств a = ba0 + rl9 0<r1<|6|, Ь^Г101 + Г2 0<Г2<Г1, (2) гп -2 = *л-1#л-1 + Гл > 0<Гл<Гл j, Мы получили убывающую последовательность натуральных чисел /i>r2>...>r„>...:^0, которая не может быть бесконечной. Поэтому существует остаток, равный нулю; пусть г,г+1 = 0, гпфО. На основании предложения 3.1 из равенств (2) следует, что нод (а, &) = нод (&, г1) = нод (г1э г2) = ...=нод (гя.1,гя)= =нод(гл, 0) = гя, т. е. гя = нод(а, 6). Итак, мы приходим к выводу: если к целым числам а, 6, где ЬфО, применить алгоритм Евклида, то последний ненулевой остаток в этом алгоритме есть нод (а, Ь). Конечные цепные дроби. Любое рациональное число можно представить в виде а/Ь9 где а и Ь — целые числа и 6^1. Применив к а и b алгоритм Евклида, получим цепочку равенств: а = Ьа0 + гъ b = r1al+r2, Гг=Г42ъ+Г39 ^л -3 = Гп-2@п~2 ~Т rn-Li Г/1-2 == гп-1&п-1 I Г/г* где Ь>г1>г2...>гл_1>гя>0. Эту цепочку равенств 360
можно записать а л = г2 Гп-2 Пг-1 Гп 1 ГП а° + У' '* + -¦ -*> + Tz = а„-г+ = ап. в виде у > Гп Пользуясь этими равенствами, можно выразить а/b через числа а0, аи ..., ап. Действительно, первое равенство запишем в виде заменяя здесь b/r± его выражением из второго равенства, имеем * + - ах+ — >*2 и т. д. В результате мы получаем от 1 fli + «2 + Ч Выражение, стоящее справа в этом равенстве, называют конечной цепной дробью. ОПРЕДЕЛЕНИЕ. Конечной цепной дробью называется выражение вида (1) а0-\ Ц , *i- +l 381
где а0 — целое число, аъ ..., ап — положительные целые числа и ап > 1. Цепную дробь (1) обычно сокращенно записывают в виде |я0; ai> аг, ...» ап\. Приведенные выше рассуждения показывают, что любое рациональное число можно представить в виде конечной цепной дроби. 126 Пример. Разложим в цепную дробь число -~г. С помощью алгоритма Евклида находим: 1 15 2+15 ^VTT т 2+т или ^Г = |3; 2, 2, 7|. Можно показать, что всякое рациональное число обладает единственным представлением в виде конечной цепной дроби. Подходящие дроби. Пусть (!) ао + ^[— Н^о; вь ¦•> ап\ есть конечная цепная дробь. Цепная дробь (2) Ak = \a0; al9 ..., afc\, где fee {0, 1, ..., п}, называется k-й подходящей дробью к дроби (1). По определению, нулевой подходящей дробью к дроби (1) называется число А0 = а0. Отметим, что (й+1)-я подходящая дробь AkJrl может быть получена из ft-й подходящей дроби Ak в результате замены элемента ak на Определим числа Pk и Qk (fte {0, 1, ,.., п)) индуктивно с помощью следующих формул: (3) 382 Р0 — а0> Q0 — 1, Pk = Pk-iCtk + Pk-2, Qk=Qk-idh + Qfe-2 (?<ee{2, 3, ..., n\).
ТЕОРЕМА 3.2. Для любой подходящей дроби Ak к цепной дроби (1) имеет место равенство (4) 4к = §- № = 0, 1, ..., п). Доказательство. Формула (4) доказывается индукцией по k. Из формул (3) непосредственно следуют равенства Л а0 "о Л° ~ 1 ~~ Qo' Л1~"0-Г" ——77 — 7)Г> ai ax Qi ' т, е. утверждение теоремы верно для fe = 0 и &= 1. Далее, Л —п t 1 __ (gQgi+ 0 Д2 + а<з _ -Pi^ + Pq ЛЯ - Оо + i - Ciaa+ ! - Q^ + Qo > *1 + о~2 значит, утверждение теоремы верно для k=2. Предположим, что утверждение теоремы верно для /я-й подходящей дроби, где 2^т<.п, т. е, (5) Ат — ~, Чт и докажем, что утверждение теоремы верно для (т + 1)-й подходящей дроби. На основании формул (3) равенство (5) можно записать в виде /с\ л Рт-1ат"Ь °w-2 В обеих частях равенства (6) заменим элемент ат на ат+ . Эта замена переводит Ат в Лт+1 и поэтому из (6) «m+l получаем Д/п-ы — -i(am+^) +р т-2 Q"-1(am + a-il) + Q" Отсюда в силу (3) m+1 QmW+Qm-i <W (Pm-iam + Рт-г) Дщ-fi + ^m-i (Qm-i^m + Qm-i) ^m+l+Qm-i ' 383
Таким образом, из верности формулы (4) для k = m следует верность этой формулы для k = m+l. Поэтому формула (4) верна при всех &е{0, 1, ..., /г}. Числа Pk и <3Й, определяемые формулами (3), называются соответственно числителем и знаменателем k-й подходящей дроби. Формулы (3) дают удобный способ для последовательного вычисления числителей Pk и знаменателей Qk подходящих дробей. При этом вычисление удобно проводить по следующей схеме: ак \Pk \Qu 1 0 а0 ай 1 % Pi Qi а2 Р2 Q2 с3 Рв Q3 ... ... ... ап \ Рп Qn Пример. Найдем подходящие дроби к цепной дроби 2; 5, 7, 3 |: ak Ри Qk 1 0 2 2 1 5 11 5 7 79 36 3 1 248 113 Таким образом, подходящими дробями цепной дроби |2; 5, 7, 3| являются дроби ^0 — Qo — 1 ' 1"fc'Ql~5, Л2~~<22"~36' Лз""Сз""ПЗ' ТЕОРЕМА 3.3. Для &е{1, ..., п} выполняется равенство (7) Р*-Л-<Э*-Л = (-1)*. Доказательство. Пусть Ak = Pk^1Qk — Qk^1Pk. На основании формул (3) равенство (7) выполняется при к = 1: (8) Ах = P0Qi-Q<A = <?*!-! (a0a1+l)=-l. Кроме того, согласно (3), А* = Pk-iQk - Qk-iPk = Pk-i (Qk-iak + Qk-2) - — Qk-l (Pk-l^k + Pk-t) = Pk-lQk-2 — Qk-lPk-2 = — &k-l (k<={2, ..., я}), 384
В силу (8) отсюда следует, что Д* = (—l)fe для fce={l, 2, ..., я}, т. е. выполняется равенство (7). ? СЛЕДСТВИЕ 3.4. Числа Pk и Qk взаимно простые и, значит, каждая дробь Pk/Qk несократима. Доказательство. Ввиду (7) любой общий множитель Pk и Qk есть делитель единицы. Поэтому числа Pk, Qb взаимно простые и дробь Pk/Qk несократима. ? Между двумя последовательными подходящими дробями имеется важное соотношение, которое вытекает из (7). СЛЕДСТВИЕ 3.5. Для fee{l, ..., п) выполняется равенство Pk Pk i = (-i)fe Qk Qk-i Qk-iQk' Упражнения. 1. С помощью алгоритма Евклида найдите: а) НОД (549, 387); Ъ) НОД (589, 343); с) НОД (12 606, 64 994). 2. Разложите в цепную дробь следующие обыкновенные дроби: а) 2,3547; Ь) ^. о П * 7857 3. Сократите с помощью разложения в цепную дробь а = Q. . . 4. Зная, что 3,141592653 <зх< 3,141592654, найдите первые четыре подходящие дроби для числа я. 5. Зная, что е=2,71828182845..., найдите первые четыре подходящие дроби для числа е. 6. Решите в целых числах следующие уравнения: а) 5*+4*/=3; Ь) 7л: — 19г/ = 5; с) 12л:—7г/=15. § 4. ЦЕЛЫЕ СИСТЕМАТИЧЕСКИЕ ЧИСЛА Целые систематические числа. Пусть g — натуральное число большее 1 и М = {0, 1, ..., g — 1}. Говорят, что натуральное число а записано в позиционной системе с основанием g, если (1) a = asgs + as-1gs~1 + ... + a1g + a0i где s —целое неотрицательное, #0, ..., as ^M и а3ф0. Если каждое число множества М = {0, 1, ..., g— 1} обозначено специальным символом, то эти символы называются цифрами g-ичной позиционной системы. Представление (1) записывается тогда сокращенно в виде a = (asas-1...a1)g 385
и называется записью в g-ичной позиционной системе. Так, например, запись а = (2315)10 означает, что а = 2-103+3.102+1.10 + 5, запись & = (101001)2 означает, что Ь=Ь25 + 0.24 + + Ь23 + 0.22 + 0.21 + 1. ТЕОРЕМА 4.1. Пусть g —данное натуральное число, большее единицы, и М = {0, 1, ..., g— 1}. Всякое натуральное число а однозначно представимо в виде (1) a = a^+^.1^-1+...+a1g+a0, где at^M и а8фО. Доказательство. Существование представления (1) доказывается индукцией по а. Если а=1 или a<Cg> то равенство а = а является искомым представлением. Пусть a^g; предположим, что возможность представления (1) уже установлена для всех натуральных чисел, меньших, чем а. Так как a^g, то разделив а на g с остатком, получим (2) a = bg+a0i где а0^М и 1^6<а. Поскольку b<.at то согласно индуктивному предположению число Ь представимо в виде (3) b = asgs-1+...+a2g+a1, где alt ..., as<=M иа5^0. Подставив выражение (3) для Ъ в правую часть (2), получим представление для числа а, ^ = ^sg's+...+^ig+«o> где й/ЕМ и а8ф0, которое называется разложением числа а по степеням числа g. Докажем однозначность представления индукцией по а. Если 1 ^a<Cg, то легко видеть, что единственность имеет место. Предположим, что единственность доказана для всех натуральных чисел, меньших, чем а. Предположим, что кроме (1) для а существует другое представление: (4) а = а'3^'+...+а'1ё+а'0. Ввиду (1) и (4) имеем (5) a = g(asgs-1+... + a2g + a1) + a0 = = g(c?>g*'-1+... + aig + ai)+ab. 386
Из (5) в силу однозначности деления с остатком следует, что b = asgs-1+... + a2g+al = a's>gs'-1+...+ate + a[. Так как 6<а, то, по индуктивному предположению, s = s' и at = aj для i = 1, ..., s. ? Арифметические операции над целыми систематическими числами.- Если натуральные числа записаны в десятичной системе счисления, то мы пользуемся правилами сложения и вычитания чисел «столбиком». Действия сложения и вычитания целых многозначных чисел в g-ичной системе счисления производятся по тем же правилам, что и в десятичной системе. В ^-ичной системе, как и в десятичной, при сложении многозначных чисел мы складываем сначала единицы, затем переходим к следующему разряду и т. д. до тех пор, пока не дойдем до самого старшего из имеющихся разрядов. При этом всякий раз, когда при сложении в предыдущем разряде получается сумма, большая, чем основание g системы счисления или равная ему, надо сделать перенос в следующий разряд. Следующие примеры иллюстрируют операции сложения в шестиричной и двоичной системах счисления: , (4253)6 , (10011), + (2542)6 + (11001)а (11235)в (101100)а Вычитание в пятиричной системе иллюстрируется примером (42044)5 ~(23141)5 (13403)5 Операция умножения целых многозначных чисел в личной системе счисления производится по тем же правилам, что и в десятичной системе («столбиком»). При выполнении операции умножения удобно пользоваться таблицами умножения. Ниже приведена таблица умножения в шестиричной системе. В каждой клетке этой таблицы стоит произведение чисел, представляющих номера строки и столбца, на пересечении которых находится клетка, причем все числа записаны в шестиричной системе счисления. 387
Следующий пример иллюстрирует операцию умножения («столбиком») в шестиричной системе: 1° 1 2 3 4 5 0 0 и 0 0 0 0 1 0 1 2 3 :4 5 2 0 2 4 10 12 14 3 0 3 10 13 20 23 4 0 4 12 20 24 [32 51 0 5 14 23 32 41 X 235 343 1153 1432 1153 135213 Перевод чисел из одной системы счисления в другую. Пусть число а записано в m-ичной системе. Это значит, что оно представлено в виде суммы: (1) a==bkmk + bk-1mk-1-{-... + b1m + b0. Как записать это число в какой-либо другой системе, скажем, в g-ичной системе? Это значит, надо представить число а в виде (2) a = asgs + as-1gs-1+...+a1g+aQ. Для этого необходимо найти коэффициенты aQl al9 ..., aS9 каждый из которых является какой-либо цифрой от 0 до g- — 1 включительно. Разделим число а, заданное в т-ич- ной системе, на g> получим остаток а0 и частное qv Затем разделим частное qx на g, получим остаток аг и частное q2* Этот процесс мы продолжаем до тех пор, пока не получим остаток, равный нулю. В результате получим все цифры а0, alt ..., aS9 входящие в g-ичное представление (2) числа а. В качестве примера рассмотрим перевод числа а = = (537 8)i0 в шестиричную систему счисления. Разделив его на 6, получим частное 896 и остаток 2. Следовательно, в шестиричной записи числа а последняя цифра равна 2. Чтобы найти вторую цифру, разделим частное 896 на 6. Получим частное 149 и остаток 2. Следовательно, вторая цифра в шестиричной записи числа а есть 2. Затем, раз- 388
делив 149 на б, получим частное 24 и остаток 5. Этот остаток 5 является третьей цифрой в шестиричной записи числа а. Наконец, разделим частное 24 на 6, получим частное 4 и остаток 0. Таким образом, (5 3 7 8)10-(4 0 5 2 2)б. Упражнения 1. Составьте таблицу умножения в семиричной системе счисления. 2. Докажите, что A = (anan_i ... а^а^ц делится на 8 (на 9), если на 8 (на 9) делится число (а1а0)12, образованное его двумя последними цифрами. 3. Покажите, что числа А = (апап_х... сзд,)^ т. е. число angn + + ал-1ЯЛ~х+'*'+а1&+ао> делится на g — 1, если на g"— 1 делится сумма его цифр, т. е. сумма аЛ+аЛ_1 + ... + а1 + ао- 4. Докажите, что натуральное число, десятичная запись которого состоит из 3Л единиц, делится на 3Л. 5. В десятичной записи некоторого натурального числа имеется 30 единиц, а остальные цифры равны нулю. Может ли это число быть полным квадратом? 6. Вы хотите узнать номер моего телефона, задавая мне вопросы, на которые я буду отвечать только «да» или «нет». Найдите способ, гарантирующий успех за наименьшее число вопросов (считая, что телефонный номер состоит из произвольных пяти цифр). § 5. РАСПРЕДЕЛЕНИЕ ПРОСТЫХ ЧИСЕЛ Распределение простых чисел. Обозначим через п(х) число положительных простых чисел, не превосходящих действительного числа я. В § 1 установлено, что существует бесконечно много простых чисел (теорема Евклида). Следовательно, л(л:)->оэ при х->со. А. Лежандр в 1808 г. опубликовал найденную им эмпирически формулу для приближенного представления функции п(х), Лежандр высказал утверждение, что для боль- х ших значений х л(х) приближенно равно w^ZTog366* П. Л. Чебышев в 1849 г. показал ошибочность этого утверждения. В работах, опубликованных в 1848 и 1850 гг., Чебышев установил связь функции п(х) с отношением т—?- Он Доказал следующую теорему: существуют положительные постоянные а и b, a<b, такие, что для всех достаточно больших х ма"щ;<ям<ьт?г- 389
Ниже приводится доказательство теоремы: для всех х^2 выполняются неравенства <2) 1оё2'т|т-2<я^)<41оё2Т^ + 1о§2^ На основании неравенств (2) могут быть найдены константы а и Ь для неравенств (1). Для доказательства неравенств (2) вводится функция Т (x) = log[x]\ и устанавливаются оценки сверху и снизу для функции Т(х) — 2Т\4г). Функции Т(х) и А(х). Символом Л (я) обозначается функция, которая имеет значение logp, если л — простое число или положительная степень простого числа р, а в остальных случаях ее значение — нуль, Ilogp, если п = рт для какого-либо натурального числа т>0, О, если пфрт. Ниже будет нужно следующее свойство этой функции: (1) ^K{d) = \ogn. d\n Пусть я = Х1р^ есть каноническое разложение натуре рального числа п. Легко видеть, что EA(d)=2] logp = 2eplogp = log/z, d\n pa>\n p\n где ра пробегает все степени простых чисел, входящих в п. Символом Т(х) обозначается функция, которая для всякого действительного х^О принимает значение log [я]!, т. е. T(*) = log[*]!= ^logn, п^х где [л:] есть целая часть числа х. Просуммировав (1) по всем положительным целым п^х, получим 2 Л (т)[?] = ^ logn = logl*]! = Т (х). т^.х п^х Таким образом, доказано следующее предложение. 390
ПРЕДЛОЖЕНИЕ 5.1. Для любого действительного числа х^1 (1) Т{х)= 2 аи[-йг]- Неравенства для функции Т(х). Согласно определению функции Т(х) (1) Т (л) = logл!, для любого действительного положительного х (2) T(x) = log[x]l Ввиду (1) (3) 71(2«)-27,(/i) = log^ = logCSl. Докажем, что для любого натурального п^2 выполняются неравенства (4) ^-<СЬ<4». Легко видеть, что Cji < (1 + l)2/l = 4W. Следующие выкладки доказывают второе неравенство: рп _2л(2л-1)(2л-2) ... 2.1 _ С*Я~" Л2(Л-1)2 ... I2 ~~ _2п(2п — 1) (2л—2)(2л—3) 2-1 __ ~~ л2 " (л—I)2 '•" I2 "" — (l-i)(l-W-r>)-('-4)= Ил 1 3 5 2л —1 ^ Лп 1 2 3 * 2 4 6 '•' 2л ^ 2 3 4 ""• 2л —1 _ 4" # * * 2л "" 2л ' Из (3) в силу (4) следуют для л ^2 неравенства (5) Т (2л) - 2Г (/г) < log 4* = 2л log 2, (6) Г (2л) - 2Г (л) > log ~ = 2л^ 2 - log 2л. Пусть л: — произвольное действительное число, большее или равное 2, и пусть 2л есть наибольшее четное число, не превосходящее х. Тогда из равенства (2) следует, что (7) T(x)-T(2n)^logx. 391
Так как Т {х) есть неубывающая функция, то из (5) и (7) следует (8) T(x)-2T(±)<xlog2 + logx. В силу (6) T(x)-2T(^J>(x-2)log2-logx. Отсюда при #3==4 следует неравенство (9) Т (х) - 2Т (j) >x log 2 - 2 log x (x ^ 4). Неравенства Чебышева. Выше (см. неравенство (8)) было получено неравенство (1) T(x)-2T(j^<xlog2 + \ogx и доказано равенство (2) Т(х) = 2 А <«)[?]• Если ^<т^х, то 2т>х. Поэтому из равенства — =1 следует, что Up- =0. Отсюда и из (2) имеем: (3) Г(*)-2Г(|) = J А(<"Щ-2Ш)^ -<т<* j<P^x В силу (2) и (3) (4) {n(x)-Ji{jJjlog~<x\og2-}-logx. Из этого неравенства вьшодим, заменяя х последовательно на lb Т' Т» "•' ряд неРавенств: (4') (n(|)-n(|))log|<f log2 + logf, (4") (n(|)-n(|))log|<|log2 + log|. 392
Суммируя левые части неравенств (4), (4'), (4"), ..., полу* чаем: я (х) log J - я (|) (log |- - log -J) - >n(*)lqg*-(* + f + J+...)log2 = = я (x) log л: — 2х log 2. Сумма правых частей неравенств (4), (4'), (4"), ... будет меньше 2#log2 + log#'log2#> так как число неравенств не превышает log2#. Таким образом, приходим к неравенству я (х) log х — 2х log 2 < 2х log 2 + log x • log2 #, откуда ^(x)<41og2T~J + log2A:. При этом найденное неравенство имеет место для любого х^2. Выше было доказано неравенство r(*)-2Wy)>*log2--21og*. Кроме того, так как Т (х) — 2Т (у ] = =2 А(т)(Н"И)'тоимеем гИ-я-(4)<2АМ-2ЙЙ|<|«'»е Таким образом, х log 2 — 2 log я < я (#) log #. Следовательно, для любого х ^2 т. е. получена нижняя граница нужного вида для п(х). Таким образом, доказана следующая теорема. 393
ТЕОРЕМА 5.2. Для всех х^2 имеем: log2^-2<tt(x)<4 1og2^ + log2(x). П. Л. Чебышев в 1850 г. доказал более точные неравенства. Он доказал, что для достаточно больших х выполняются неравенства (0.92...)1~f<«(*)<(1.105...)1|7. При доказательстве этих неравенств Чебышев вместо Т (х) — 2Т (у] рассматривал более сложное выражение: тм-т($)-т{$)-т($)+т(±). В 1851 г. Чебышев обосновал предположение о зависимости между тс(х) и -fozji ,. п(х) _ 1 _ -г-.— тс (х) так что если предел отношения ?}*\ существует, то он должен быть равен 1. Центральным результатом в теории чисел является асимптотический закон распределения простых чисел, впервые доказанный в 1896 г. Адамаром и Валле-Пуссеном. Этот закон гласит, что отношение п(х): . av стремится log х к 1 при неограниченном возрастании х, т. е. jim gt(*)log* =i Простые числа в арифметических прогрессиях. Рассмотрим три теоремы (5.3 — 5.5), которые являются частными случаями более общей теоремы — теоремы Дирихле. ТЕОРЕМА 5.3. Арифметическая последовательность 4/г + З (п = 0, 1, ...) содержит бесконечно много простых чисел. Доказательство. Рассмотрим число М, определяемое равенством М = 4п\ — 1, где п — целое положительное число. М есть число вида 4& + 3, оно не может состоять только из простых множителей вида 4&+1, потому что 394
произведение чисел вида 4& +1 является числом такого же вида: (4й+1)(4А1+1)=г4(4**1+й+Л1) + 1. Поэтому число М имеет хотя бы один простой множитель вида 4& + 3, который больше п. Таким образом, для каждого натурального числа п существует простое число, большее /г, имеющее вид 4& + 3. ? ТЕОРЕМА 5.4. Арифметическая последовательность 6я + 5 (/г = 0, 1, 2, ...) содержит бесконечно много простых чисел. Доказательство этой теоремы аналогично доказательству предыдущей теоремы. Рассмотрим число М, определяемое равенством М = 6/г! — 1, где п — любое целое положительное число; М есть число вида 6k+ 5. Число М не может состоять только из простых множителей вида 6k +1, так как произведение чисел вида 6k +1 является числом такого же вида: (6k+l)(6k1+l) = 6(6kkl+k + k1) + l. Поэтому число М имеет хотя бы один простой множитель вида 6k+ 5, который больше п. Итак, для каждого натурального числа п существует простое число, большее п, имеющее вид 6& + 5. ? ТЕОРЕМА 5.5. Арифметическая последовательность 4/г + 1 (л = 0, 1, 2, ...) содержит бесконечно много простых чисел. Доказательство. Пусть п — любое натуральное число, большее единицы. Тогда (п!)2 +1, как число нечетное, большее единицы, имеет нечетный простой делитель р; следовательно, р есть число вида 4&+1 или 4& + 3. Предположим, что p = 4k + 3. Так как для натуральных а и нечетных т a + l|(tf»+l), то (nl)*+l\(nl)*{**+V + l. Так как 2(2k+l) = 4k + 2 = p-l и p|(/i!)2 + l, то р\(п\)*-г+1. Следовательно, (1)р\(п\)Р + п\ С другой стороны, по теореме Ферма, (2) р\{п\у-п\ 395
Из (1) и (2) следует р\2(п\), чтр невозможно, так как р есть простое нечетное число, большее п. Следовательно, р должно быть числом вида 4&+1. Мы доказали, что для каждого натурального числа п существует простое число, большее п, имеющее вид 4&-f-l. ? Доказанные выше теоремы являются частными случаями следующей теоремы Дирихле об арифметических прогрессиях: каждая арифметическая последовательность a+km (fe = 0, 1, 2, ...), еде (a, m) = l, содержит бесконечно много простых чисел. Упражнения 1. Покажите, что полином х2+х+А\ для последовательности натуральных чисел я=0, 1, 2, ..., 39 принимает значения, являющиеся различными простыми числами. 2. Пусть /—полином положительной степени от переменной х с целыми коэффициентами. Докажите, что для бесконечного множества натуральных чисел х число f(x) является составным. 3. Опираясь на теорему Дирихле об арифметических прогрессиях, докажите, что для каждого натурального числа т существует простое число, в изображении которого (в десятичной системе счисления или в любой системе счисления с натуральным основанием q > 1) имеется по крайней мере т нулей,
Глава двенадцатая ТЕОРИЯ СРАВНЕНИЙ С АРИФМЕТИЧЕСКИМИ ПРИЛОЖЕНИЯМИ § 1. СРАВНЕНИЯ И ИХ СВОЙСТВА Сравнения в кольце целых чисел. Пусть % — кольцо целых чисел, т — фиксированное целое число и mZ —множество всех целых чисел, кратных т. ОПРЕДЕЛЕНИЕ. Два целых числа а и Ъ называют сравнимыми по модулю т, если т делит а — Ъ. Если а сравнимо с b по модулю т, то это записывается так: (1) a = b (mod т). Отношение сравнимости по модулю т обладает свойствами рефлексивности, симметричности и транзитивности, т. е. является отношением эквивалентности. Следовательно, отношение сравнимости индуцирует разбиение множества Z целых чисел на классы эквивалентности, которые называются классами вычетов по модулю т. Отметим, что отношение сравнимости по модулю т совпадает с отношением сравнимости по модулю (—/п). Отношение сравнимости по модулю 0 совпадает с отношением равенства. Любые два целых числа сравнимы по модулю 1. Так как отношение сравнимости по модулю т есть отношение эквивалентности на множестве Z, то классы эквивалентности, т. е. классы вычетов по модулю т, обладают следующими свойствами: СВОЙСТВО 1.1. Любые два класса вычетов по модулю т либо совпадают, либо не пересекаются. Объединение всех классов вычетов по модулю т совпадает с множеством Z всех целых чисел. СВОЙСТВО 1.2. Пусть А и В—классы вычетов по модулю т, а<~А и Ь gB. Смежные классы Ли В совпадают тогда и только тогда, когда а = Ъ (mod m). 397
СВОЙСТВО 1.3. Если А— класс вычетов по модулю т и а —любой элемент из А, то А=а+тЪ, т. е. А — = {a-\-mk\k gZ}. ПРЕДЛОЖЕНИЕ 1.1. Числа а и Ь сравнимы по модулю т (тфО) тогда и только тогда, когда при делении на т они дают одинаковые остатки. Доказательство. Пусть при делении с остатком чисел а и Ь на т получаются частные q и q± и остатки г и гъ a=qm-\-r, 0^r<m; b = q1m+rl9 0^/'1<m. Предположим, что r>rv Вычитая из первого равенства второе, получим (1) a — b = (q-q1)m + (r-r1)9 0^r-/i<m. Если a = fc(modm), то согласно определению сравнимости а — Ь делится наши поэтому г — г1 = 0 и г = гг. С другой стороны, если г = гъ то в силу (1) а — Ъ делится на т, т. е. a = b (modm). ? Простейшие свойства сравнений. Многие свойства сравнений аналогичны свойствам равенств. СВОЙСТВО 1.4. Сравнения можно почленно складывать и вычитать, т. е. если a = b (modm), c = d (modm), то a-\-c^b + d (modm). Доказательство. По условию, т\(а — Ь) и т\{с — d). Следовательно, m|(a — b)±(c — d), т|(а+с) — (b + d) и m\(a — c) — (b — d). ? СВОЙСТВО 1.5. Сравнения можно почленно перемножить, т.е. если as=b(modm), c = d (modm), то ас = = M(modm). В частности, обе части сравнения можно умножить на одно и то же целое число. Доказательство. По условию, fl-6emZ и c-demZ. Следовательно, ac — bd = (ac — bc) + (bc — bd)=z = (a — b)c-\-b(c — d)^mZ, т. е. ac==bd(modm). ? СВОЙСТВО 1.6. Обе части сравнения можно разделить на их общий множитель, если он взаимно простой с модулем. Доказательство. Если ca^cb(modm), т. е. т\с{а — Ь) и число с взаимно простое с т, то m делит а — Ь. Следовательно, а = b(modm). ? СВОЙСТВО 1.7. Обе части сравнения и модуль можно разделить на их общий делитель. 398
Доказательство. Если ka = kb(modmk), то k(a — b) делится на km. Следовательно, a — b делится на т, т. е. a = b (mod m). ? СВОЙСТВО 1.8. Пусть mL есть любой делитель числа т. Если a = 6(modm), то a^bimodm^). Доказательство. Если a = b(modm), то а — Ь делится на т. Так как т± — делитель т, то а — Ь делится на тъ т. е. а = Ь(то&тх). ? Упражнения 1. Покажите, что любое натуральное число, записанное в десятичной системе, сравнимо по модулю 9 и по модулю 3 с суммой своих цифр. 2. Установите способ проверки арифметических действий при помощи числа 9. 3. Найдите признаки делимости чисел в десятичной системе счисления на 9 и 19. 4. Найдите признаки делимости чисел в десятичной системе счисления на 7 и 13. 5. Найдите признаки делимости на 2, 3, 4, 5, 7, 9 в восьмеричной системе счисления. 6. Найдите признаки делимости на 2, 3, 4, 5, 6, 7, 8, 9, 11, 13 в двенадцатиричной системе счисления. 7. Докажите, что если а = Ь (mod /я), а = Ъ (mod n) и т, n — взаимно простые, то а = Ь (mod mn). 8. Пусть d—наибольший общий делитель целых чисел т и п. Покажите, что если а = Ъ (mod т) и а = Ь (mod я), то а = Ь (mcd-г- ). § 2. ПОЛНАЯ СИСТЕМА ВЫЧЕТОВ Полная система вычетов. Согласно свойству 1.1, каждый класс вычетов по модулю т однозначно определяется любым принадлежащим ему числом а; этот класс является множеством всех чисел вида a + km, т. е. является множеством {a+km\k^Z} = a + mZ. Класс вычетов по модулю т, содержащий число а, т. е. совокупность всех целых чисел b таких, что b = a (mod m), обозначается просто через amodm: a mod т = {а+km \ k e Z}. Любое число, принадлежащее классу вычетов amodm, называется представителем этого класса. ОПРЕДЕЛЕНИЕ. Полной системой вычетов по модулю т называется совокупность т целых чисел, содер- 399
жащая точно по одному представителю из каждого класса вычетов по модулю т. Каждый класс вычетов по модулю т содержит в точности одно из чисел совокупности всех возможных остатков от деления на т, а именно 0, 1, 2, ..., т—1. ОПРЕДЕЛЕНИЕ. Совокупность чисел 0, 1,2,.-., т—1 называется системой наименьших неотрицательных вычетов по модулю т. Всюду ниже запись (а, т) = I будет означать, что числа а и т —взаимно простые. ПРЕДЛОЖЕНИЕ 2.1. Любая совокупность т чисел (т>1), попарно несравнимых по модулю т, есть полная система вычетов по модулю т. Доказательство. Пусть М есть совокупность т чисел, попарно несравнимых по модулю т. Тогда эти числа принадлежат к различным классам вычетов. Кроме того, М содержит т чисел. Следовательно, множество М содержит по одному представителю из каждого класса вычетов по модулю т. П ПРЕДЛОЖЕНИЕ 2.2. Пусть а, Ь —целые числа и (а, т)= 1. Если х пробегает полную систему вычетов по модулю т, то ах+b тоже пробегает полную систему вычетов по модулю т. Доказательство. Пусть М — полная система вычетов. Тогда множество М1 = {ах + Ь\х^ /И}, так же как и М, содержит т элементов. Любые два числа ахг+Ь и ах2+Ь из М несравнимы, если Xi^=x2(modm). Следовательно, множество Мг есть полная система вычетов по модулю т. ? Аддитивная группа классов вычетов. Обозначим через Z//nZ множество всех классов вычетов по модулю т: Z/mZ = {0modm, lmodm, ..., (m-l)modm}. Определим операции +> — на множестве классов вычетов следующим образом: a mod m + b mod m = (а + b) mod m, — (a mod т) = (— a) mod m. Согласно свойствам 1.4 и 1.5 сравнений, отношение сравнимости на множестве Z является конгруэнцией относительно операций сложения в Z и операций перехода к противоположному элементу. Таким образом, любым двум классам amodm и bmodm независимо от выбора 400
в них представителей а, Ъ однозначно соответствует класс {а + 6) mod m, являющийся их суммой. Аналогично, класс — (a mod m) не зависит от выбора представителя а. Так как сложение целых чисел коммутативно и ассоциативно, то коммутативно и ассоциативно сложение классов вычетов, т. е. для любых а, Ь, с^Ъ a mod т + Ъ mod т = Ъ mod m + a mod m, (д mod m + 6 mod m) + с mod m = a mod m -|- + ф mod m+с mod rn). Класс вычетов Omodm является нейтральным относительно сложения, т. е. для любого класса вычетов ambdm a mod m+0 mod m = a mod m. Далее, классы amodm и (¦— a)modm являются взаимно противоположными, т. е. a mod m + (— a) mod m = 0 mod m. Таким образом, имеет место следующая теорема. ТЕОРЕМА 2.3. Алгебра (Z/mZ, +, —> является группой. Эта группа является фактор-группой группы % по подгруппе т%. ОПРЕДЕЛЕНИЕ. Группа <Z/mZ, +, —> называется аддитивной группой классов вычетов по модулю т. Кольцо классов вычетов. На множестве классов вычетов по модулю т определим операцию умножения следующим образохм: (a mod т) • (b mod т) = ab mod m. Согласно свойству 1.5 сравнений, отношение сравнимости по модулю т на Z является конгруэнцией относительно операции умножения на Z. Таким образом, каждым двум классам вычетов a mod m и Ь mod m независимо от выбора в них представителей a, b однозначно ставится в соответствие класс вычетов a&modm, являющийся их произведением. Так как определение операций сложения и умножения классов вычетов сводится к соответствующим операциям над числами из классов вычетов, то при этом сохраняются законы сложения и умножения этих операций, в частности законы коммутативности, ассоциативности и 401
дистрибутивности: (a mod m) (b mod m) = (b mod m) (a mod m), (a mod m) [(b mod m) (c mod m)] = = [(a mod m) (6 mod m)] (c mod m), (a mod m) [(b mod m) + (c mod m)] = (a mod m) (& mod m) + + (a mod m) (c mod m). Кроме того, класс вычетов 1 mod m является нейтральным элементом относительно умножения: (a mod т) (1 mod m) = a mod т. Таким образом, верна следующая теорема. ТЕОРЕМА 2.4. Алгебра <Z/mZ, +, —, •, lmodm) является коммутативным кольцом. ОПРЕДЕЛЕНИЕ. Кольцо <Z/mZ, +, —, •, lmodm) называется кольцом классов вычетов по модулю т. Упражнения 1. Найдите полную систему вычетов и полную систему абсолютно наименьших вычетов по модулю 30. 2. Найдите полную систему абсолютно наименьших вычетов по модулю 19. 3. Образуют ли степени 2°, 21, 22, ..., 210 вместе с числом 0 полную систему вычетов по модулю 11? 4. Подставляя в выражение Ъх-\-7у значения #=0, 1,2,3,4,5,6 и г/ = 0, 1, 2, проверьте, что в результате получится полная система вычетов по модулю 21. § 3. ПРИВЕДЕННАЯ СИСТЕМА ВЫЧЕТОВ Приведенная система вычетов. Пусть п — любое положительное число. Обозначим через ф(л) число положительных целых чисел, не превосходящих п и взаимно простых с п. Наибольший общий делитель целых чисел a, b, являющийся натуральным числом, будем обозначать через (а, Ь). ПРЕДЛОЖЕНИЕ 3.1. Все числа из фиксированного кЛасса вычетов amodm имеют с т один и тот же наибольший общий делитель, равный (а, т). Доказательство. Если b есть любое число класса вычетов amodm, то b = mq + a, где q — некоторое целое число. Отсюда в силу предложения 11.3.1 следует, что (&, m) = (a, m). ? Следовательно, (а, т) зависит только от класса вычетов amodm и не зависит от выбора представителя а 402
в этом классе. В частности, если (а, т) = 1, то класс amodm называется классом вычетов, взаимно простым с модулем т. ПРЕДЛОЖЕНИЕ 3.2. Число классов вычетов, взаимно простых с т, равно ф (т). Доказательство. Из полной системы вычетов по модулю т 1, 2, ..., т выделим систему всех вычетов, взаимно простых с т: #1> #2> • • • > #ср(т)« В силу предложения 3.1 классы вычетов (1) ^modm, a2modm, ..., аф(т)то(1/п взаимно простые с модулем т. Всякий другой класс, не входящий в (1), не взаимно простой с модулем т, так как содержит элемент множества {1, 2, ..., mixl^, а2, ... • •> Яф(т)Ь Классы, входящие в систему (1), различны. Следовательно, число классов, взаимно простых с т, равно ф(/п). ? ОПРЕДЕЛЕНИЕ. Приведенной системой вычетов по модулю т называется совокупность целых чисел, содержащая по одному представителю из каждого класса вычетов, взаимно простого с т. ПРЕДЛОЖЕНИЕ 3.3. Любая совокупность ф(/п) чисел т > 1, взаимно простых с т и попарно несравнимых по модулю т, есть приведенная система вычетов по модулю т. Доказательство. Пусть М есть совокупность ф(т) чисел, взаимно простых с т и попарно несравнимых по модулю т. Тогда эти числа принадлежат к различным классам вычетов. Поэтому множество М содержит по одному представителю из каждого класса вычетов, взаимно простого с модулем т. Следовательно, М есть приведенная система вычетов по модулю т. П ПРЕДЛОЖЕНИЕ 3.4. Пусть а —целое число, взаимно простое с т, и bl9 b2, ..., &ф(т) — приведенная система вычетов по модулю т. Тогда совокупность аЪг, аЬг, ... ..., а&ф(Ш) тооюе есть приведенная система вычетов по модулю т. Доказательство. Ввиду предложения 3.3 достаточно показать, что числа совокупности abx, ab2,..., #ЬФ(т) 403
попарно несравнимы по модулю т. Действительно, если abtssabk(modт) при гфк, то ввиду условия (а, т) = 1, b/ssb^modm), что невозможно, так как, по условию предложения, bi и bk — различные элементы приведенной системы вычетов по модулю т. ? Мультипликативная группа классов вычетов, взаимно простых с модулем. Рассмотрим теорему, выражающую весьма важное свойство классов вычетов, взаимно простых с модулем. ТЕОРЕМА 3.5. Множество классов вычетов по модулю т, взаимно простых с модулем, образуют относительно умножения абелеву группу. Доказательство. Пусть Gm — множество всех классов вычетов по модулю т, взаимно простых с т. Произведение любых двух классов вычетов по модулю т, взаимно простых с модулем, является классом вычетов взаимно простых с модулем, и, значит, множество Gm замкнуто относительно умножения. Далее, операция умножения классов коммутативна и ассоциативна. Класс 1, I = 1 mod m, является нейтральным элементом относительно умножения. Докажем, что для любого класса а е Gm существует в Gm обратный класс. Пусть 0/я = {й1, ..., лф(ОТ)}, т. е. аъ а2, ..., аф(т) — приведенная система вычетов по модулю т. Тогда ааъ aa2i ..., одф <т) согласно предложению 3.4 также есть приведенная система вычетов по модулю т\ следовательно, она содержит число, сравнимое с 1. Пусть aak = 1 (modm). Тогда aak=\, следовательно, ak есть класс, обратный классу а в Gm. Таким образом, система <Gm, •, _1> является абелевой группой. ? ОПРЕДЕЛЕНИЕ. Группа ^m = <Gm, •,-1) называется мультипликативной группой классов вычетов по модулю т, взаимно простых с модулем. СЛЕДСТВИЕ 3.6. Если р —простое число, то множество ненулевых классов вычетов является абелевой группой относительно умножения. ТЕОРЕМА 3.7. Кольцо классов вычетов по модулю т тогда и только тогда является полем, когда т есть простое число. Доказательство. Пусть /п —простое число. Тогда согласно следствию 3.6 множество всех ненулевых классов вычетов по модулю т есть группа относительно 404
умножения. Поэтому кольцо классов вычетов по модулю т является полем. Пусть т — составное число, m = ab, 1 < а, Ь<т. Тогда (a mod m) (b mod т) = 0 mod m, причем согласно условию a mod тфО modm, b modтфО modm. Таким образом, кольцо классов вычетов содержит делители нуля и поэтому не может быть полем. Если т = 1, то кольцо классов вычетов по модулю т является нулевым. Если же т = 0, то кольцо классов вычетов по модулю т, 2/(0), изоморфно кольцу % и поэтому не является полем. ? ОПРЕДЕЛЕНИЕ. Число а называется обратным к числу b по модулю т, если ab=l(modm). Числа а и Ь будем также называть взаимно обратными по модулю т. ПРЕДЛОЖЕНИЕ 3.8. Пусть число а взаимно простое с модулем т и Pn-i — числитель предпоследней подходящей дроби для числа — (— = т^)- Тогда а(—\)п-гРп-х = а \а Чп I = l(modm), т. е. число (—\)п~хРп-\ является обратным к элементу а по модулю т. Р Р Доказательство. Пусть -—^ и ^ —две послед- Чп-i Чп ние подходящие дроби для числа т/а. Тогда т = РП9 a = Qn и, согласно следствию 11.3.5, Рп Рп-1 = (-1)* Qn Qn~i Qn-iQn' Следовательно, а Чп-l Чп-\Чп a {—If'1 Рп-1 в 1 (mod m). ? Пример. Найдем число, обратное числу 79 по модулю /п = 273. 273 Разложим число -^д- в цепную дробь, тогда ??НЗ; 2, 5, 7| 405
Вычислим числители подходящих дробей к числу -^д~ по схеме 1 k 1 q" Pk 1 1 3 3 2 2 7 3 5 38 4 7 273 Р3 = 38 есть числитель предпоследней подходящей дроби для числа 273/79. Следовательно, число (—1)3Р3 = —38 является обратным к числу 79, т. е. 79 (— 38) == 1 (mod 273). Функция Эйлера. Число положительных целых чисел, не превосходящих п и взаимно простых с п, обозначается через ф(п); числовая функция ф, определенная на множестве всех целых положительных чисел, называется функцией Эйлера. Легко видеть, что у(п) равна числу неотрицательных целых чисел, меньших п и взаимно простых с м. Пример: ф(1)= 1, ф(2)=1, ф(6) = 2, ф(5) = 4, Ф(12) = 4. Числовая функция / называется мультипликативной, если для любых положительных взаимно простых целых чисел а и Ъ выполняется равенство f(ab) = f(a)f(b). ТЕОРЕМА 3.9. Функция Эйлера ф мультипликативна. Доказательство. Пусть а и Ъ — взаимно простые положительные целые числа. Рассмотрим множество М всех неотрицательных целых чисел, меньших аЪ. Согласно теореме о делении с остатком, каждое число из М может быть единственным образом представлено в виде bq + rf где ге{0, 1, ..., 6—1}, <7^{0, 1, ..., а—1}. Число bq-\-r взаимно простое с а тогда и только тогда, когда ф, г)=1. Существует ср(Ь) таких г. Пусть гг—-одно из этих чисел. Тогда согласно предложению 2.2 числа гъ Ь + Гх, 2Ь-\-гъ ..., b(a—l) + r1 образуют полную систему вычетов по модулю а. Поэтому среди этих чисел имеется точно ф(а) чисел, взаимно простых с а. Таким образом, каждому числу гг, взаимно простому с 6, соответствует точно ф(а) чисел вида bq + rl9 взаимно простых с а, и, значит, с ab. Поэтому число чисел из М, взаимно простых с ab, равно ф(#)ф(6), т. е. ф(а6) = ф(а)ф(6). 406
ТЕОРЕМА ЗЛО. Если п = Y[ рар — каноническое раз- р\п ложение натурального числа п, то (1) ф(«)=«П(1"7)' Р I п Доказательство. Так как функция ср мультипликативна, то для вычисления <р(п) достаточно уметь вычислять эту функцию для степени простого числа р. Число целых неотрицательных чисел, меньших ра и не взаимно простых с ра, равно ра-1, так как только числа kp, 0^fe<pa~1, не взаимно простые с pa. Поэтому число чисел, меньших ра и взаимно простых с ра, равно ра — ра~\ т. е. (2) ф(р«)=р«(1--±). Так как « = Драр и функция ф мультипликативна, то р\п (3) Ф(/г)=Пф(Р%)- р\п Из (2) и (3) следует, что tW-n^(l-7)-II^n('-7)- р\п р\п р\п -»П('-7)- р|/г значит, верна формула (1). П Пример: Ф(30) = 30(1—l)(l—|-)(l-i-) = -зо4-т4-8- ТЕОРЕМА 3.11. Сумма чисел y(d) no всем натуральным делителям d числа п равна п, т. е. ^i^(d) = n. d\n Доказательство. Если п = Y\ P^1 — каноническое i разложение п, то 2ф^)=Па+ф(р<)+ф(р?)+-"+ф(рГ'))> d\n i 407
так как при раскрытии скобок получим сумму всех значений q>(d). Далее, d\n i Ч 1 Ь } i d\n Теоремы Эйлера и Ферма. В теории сравнений важную роль играет теорема Эйлера. ТЕОРЕМА ЭЙЛЕРА. Если целое число а взаимно простое с т, то (1) лФ<»>вв1(то(1/н). Доказательство. Пусть (2) аъ а2, ,.., аф (т) есть приведенная система вычетов по модулю т. Тогда согласно предложению 3.4 (3) ааг, аа2, ..., яаф(т) также есть приведенная система вычетов по модулю т. Поэтому произведение чисел (3) сравнимо с произведением чисел (2), т. е. (4) а? (|Я>о1а2 ... аф {т) в ахаъ ... аф {т) (mod m). Произведение а^ ... #ф(т) взаимно простое с т. Поэтому согласно свойству 1.6 обе части сравнения (4) можно разделить на это произведение, тогда аф(т) = 1 (modm). ? ТЕОРЕМА ФЕРМА. Если целое число а не делится на простое число р, то ар~г = 1 (mod р). Эта теорема есть частный случай предыдущей теоремы при т = р. Теорема Ферма часто формулируется иначе. ВТОРАЯ ФОРМУЛИРОВКА ТЕОРЕМЫ ФЕРМА. Если р —простое и а —любое целое число, то ар = зз a (mod p). Упражнения 1. Исходя из равенства аР=-(1 + 1+,.. + 1)Р, докажите, что для любого натурального а и простого р выполняется сравнение аР~ — a (mod р). 2. Докажите, что число положительных приведенных дробей, имеющих знаменателями одно из чисел 1, 2, ..., п и не превосходящих единицы, равно ф(1) + ф (2) + ... + ф(я). 3. Докажите, что при п > 1 сумма приведенных вычетов т по модулю п, находящихся в пределах 1 ^ т < п, равна -~- яф (я). 408
4. Покажите на примерах, что сравнение ат = a (mod m)t где т — простое, может не выполняться при составном т. 5. Докажите, что если ап~х = 1 (mod n) и а& =? 1 для всякого положительного делителя d числа (л—1), то п — простое число. 6. Сколько имеется натуральных чисел, меньших числа 234 000 000 и взаимно простых с ним? § 4. СРАВНЕНИЯ ПЕРВОЙ СТЕПЕНИ. СРАВНЕНИЯ ВЫСШИХ СТЕПЕНЕЙ ПО ПРОСТОМУ МОДУЛЮ Степень и число решений сравнения. Сравнение вида (1) апхп-f.. . + ахх+а0в0 (modm), где al9 ..., ап — целые числа, называется алгебраическим сравнением. Число п называется степенью сравнения (1), если ап не делится на т. Если число а удовлетворяет сравнению (1), то любое число Ь, сравнимое с а по модулю т, также удовлетворяет сравнению (1); два таких решения рассматриваются как одинаковые. ОПРЕДЕЛЕНИЕ. Числом решений сравнения по модулю т называется число решений этого сравнения в какой-либо полной системе вычетов по модулю т. Примеры. 1. Сравнению Зх2 — 7=0(mod4) среди чисел 0, 1, 2, 3 полной системы вычетов по модулю 4 удовлетворяют два числа: х=\ и х = 3. Поэтому сравнение имеет два решения: х =1 (mod 4) и х г=3 (mod 4). 2. Сравнению х2 === 1 (mod 8) среди чисел 0, 1, 2, 3, 4, 5, 6, 7 полной системы вычетов по модулю 8 удовлетворяют четыре числа: 1, 3, 5, 7. Поэтому сравнение имеет четыре решения: #=l(mod8), # = 3(mod8), # = 5(mod8), х = 7 (mod 8). Сравнения первой степени. Найдем условия разрешимости сравнения первой степени. ТЕОРЕМА 4.1. Если (а, т) = 1, то сравнение (1) ах s=6 (mod m) имеет одно и только одно решение. Доказательство. По условию, число а —взаимно простое с т. Согласно теореме 3.5, существует целое 409
число а', обратное к а по модулю т, т. е. а'а == 1 (mod m). Умножив обе части (1) на а', получим (2) x = a'b (mod/л). Следовательно, сравнение (1) имеет не больше одного решения. С другой стороны, (2) есть решение сравнения (1), так как a (a'b) = (aa') b = b (mod m). Таким образом, класс вычетов a'bmodm является единственным решением сравнения (1). ? ТЕОРЕМА 4.2. Пусть (a, m) = d. Сравнение (1) a* = b(modm) разрешимо тогда и только тогда, когда d\b. Если d\b, то сравнение (1) имеет своими решениями точно d классов вычетов по модулю т, которые составляют один класс вычетов по модулю m/d. Доказательство. Пусть (а, т) = d> 1. Если сравнение (1) имеет решение х19 то ax1 — b = km, где k — целое число. Так как (a, m) = d, то отсюда следует, что d делит Ь. Предположим теперь, что b делится на d, и докажем, что сравнение (1) имеет d решений. Пусть b = bLd, a = aLd и m = m1d. Сравнение (1) равносильно сравнению (2) #!* = &! (mod я^). Согласно теореме 4.1, сравнение (2) имеет единственное решение a[b1modmli где а[ — число, обратное ах по модулю т±. Пусть х0 = а[Ь±. Класс вычетов A^modm! распадается на следующие d классов вычетов по модулю т: (3) xQ mod m, (x0+тх) mod m, (x0 + 2mx) mod т, ..., (х0 + + (d — \)m-j)mo&m. Легко видеть, что классы вычетов (3) являются различными по модулю т. Таким образом, сравнение (2) имеет своими решениями классы вычетов (3), т. е. точно d классов вычетов по модулю т, которые составляют один класс вычетов по модулю m/d. ? Отметим, что совокупность решений (3) сравнения (1) есть смежный класс аддитивной группы 5 классов вычетов по модулю т по подгруппе -j- -&. Обратно: любой смеж- 410
ный класс группы $ по подгруппе -j-$ можно задать как множество решений некоторого линейного сравнения по модулю т. Сравнения высших степеней по простому модулю. Перейдем к рассмотрению вопроса о числе решений сравнения n-й степени по простому модулю. ТЕОРЕМА 4.3. Сравнение (1) апхп+... +a1x+a0 = 0(modp) степени п по простому модулю р имеет не более п реигений. Доказательство проводится индукцией по п. Если п = 0, то сравнение имеет вид a0^0(modp), где р^а0; в этом случае сравнение имеет нуль решений. Предположим, что сравнение (1) имеет степень п >>0. Если сравнение имеет решения, то для некоторого целого числа х± (2) ап)?[ + ... + ал + Яо е= 0 (mod р). Вычтем это сравнение из (1). Тогда разность членов степени k имеет вид ak{xk~x$ = ak{x--x1){xk-1+x1xk-2+ ... +*?"1) при ft=l, ...,n; каждая разность содержит линейный множитель (х — хг). Поэтому результат вычитания можно записать так: (3) (х - хг) фп^х"-1 + ... + &0) = 0 (mod р), где 60, ..., ЬЛ-Х — некоторые целые числа, Ьп.1 = ап. Любое другое решение сравнения (1), скажем х2, будет решением сравнения (4) W"1 + ... + Ь0 = 0 (mod p). Действительно, так как ^^^(modp) и модуль р простой, то из сравнения (х2 - х±) (bn-ixT1 + ... + b0) = 0 (mod p) следует, что bn-ixV + •.. + b0 = (mod p). Так как степень сравнения (4) равна п— 1, то, по индуктивному предположению, сравнение (4) имеет не более лг — 1 решений. Следовательно, исходное сравнение (1) имеет не более п решений. ? 411
СЛЕДСТВИЕ 4.4. Если сравнение апхп +... +а1х + + а0 е= О (mod р) имеет более п решений, то все его коэффициенты делятся на р. ПРЕДЛОЖЕНИЕ 4.5. Если р —простое число, то сравнение хр~1 — 1 = 0 (mod p) имеет точно р — 1 решений. Это предложение непосредственно следует из теоремы Ферма, а сравнению удовлетворяют любые числа, не делящиеся на р; решениями являются числа 1, 2, ..., р—1. ТЕОРЕМА ВИЛЬСОНА. Если р —простое число, то (l)(p-l)! + l-0(modp). Доказательство. Если р = 2, то теорема, очевидно, верна. Пусть р>2. Рассмотрим сравнение (2) (x-l)(x-2)...(x--(p--l))-(xP1--l) = 0(modp). Его степень меньше р — 1 и в то же время это сравнение имеет р—1 решений: 1, 2, ..., р—1. Поэтому согласно следствию 4.4 все коэффициенты сравнения (2) делятся на р. В частности, последний коэффициент, равный (р— 1)! + 1, делится на р. ? ТЕОРЕМА 4.6. Если р —простое число и d — натуральный делитель числа р—1, то сравнение (1) *<*-l=0(modp) имеет точно d решений. Доказательство. Пусть d — любой делитель р — 1, р — 1 = kd. Тогда сравнение (2) *р-1- 1=0(modp) можно записать в виде (3) (Xd- 1) (**(*-« + **(*-»> + ... +xd +1) = 0 (mod p). Согласно предложению 4.5, сравнение (2) имеет р— 1 решений: 1, 2, ..., р — 1. Каждое решение сравнения (2) должно удовлетворять одному из сравнений: (1) xrf-l=0(modp), (4) ^^-^+...+^+l=0(modp). По теореме 4.3 сравнение (4) имеет не более d(k— 1) = = р — 1 — d решений. Поэтому сравнение (1) должно иметь не менее d решений. Следовательно, ввиду предложения 4.5 сравнение (3) имеет точно d решений. П 412
Упражнения 1. Докажите, что если натуральное чгсто т>1, то сравнение 1-2-3 ... {т— 1) = — 1 (mod m) выполняется тогда и только тогда, когда т—простое число. 2. Найдите решения сравнения ах=\(то&7) при а = 2, 3, 4, 5, 6. 3. Найдите число, кратное семи и дающее остаток 1 от деления на 2, 3, 4, 5, 6. 4. Докажите, что сравнению х2 + \ =0(modp), где р = 4/г+1 — простое число, удовлетворяет число (2/г)! 5. Решите сравнения: *2=— 1 (mod 65); ^ =—2 (mod 33). § 5. ПЕРВООБРАЗНЫЕ КОРНИ И ИНДЕКСЫ Порядок числа и класса вычетов по модулю. Пусть а — число, взаимно простое с т. Порядком числа а по модулю т называется наименьшее целое положительное число d такое, что adz== i (modm). Если 6 = a(modm), то b имеет тот же порядок по модулю т, что и а. Таким образом, все элементы класса вычетов amodm имеют порядок d; число d называется порядком класса вычетов a mod m и обозначается через 0(amodm). ПРЕДЛОЖЕНИЕ 5.1. Если © (a mod m) = d, то числа а, а2, ..., ad попарно несравнимы по модулю т. Доказательство. Если a*s=afe(modm), где k<Cs, k9 sg {1, 2, ..., d}9 то as~k = 1 (modm), что противоречит условию, так как 0<s — k<d. ? ПРЕДЛОЖЕНИЕ 5.2. Пусть 0(amodm) = d и п — любое целое неотрицательное число. Сравнение #*= 1 (modm) выполняется тогда и только тогда, когда п делится на d. Доказательство. Сначала покажем, что из ал== S31 (mod m) следует, что п делится на d. По теореме о делении с остатком, для п и d существуют натуральные числа q и г такие, что (I) n = dq + r, 0^r<d. Покажем, что г = 0. Ввиду (1) и условия ad = 1 (mod m) ап = adqar = (ad)qar = ar = \ (mod m). Так как, по условию, ar^l(modm), если 0<r<d, то сравнение аг = 1 (mod т) возможно лишь при г = 0. Следовательно, п делится на d. Теперь предположим, что п делится на d, n = dk для некоторого k. Тогда a* = a^ = (atf)fe = 1 (modm), т. е. a*E== I (modm). ? 413
ПРЕДЛОЖЕНИЕ 5.3. Если 0(amodm) = d, то <p(m) делится на d. Доказательство. В силу предложения 5.2 из аф(т> = l(modm) и условия 0(amodm) = d следует, что ф(т) делится на d. П ПРЕДЛОЖЕНИЕ 5.4. Пусть 0(amodm) = d. Сравнение as = ak(modm) имеет место тогда и только тогда, когда k = s(modd). Доказательство. Если (1) a* = a5(modm), &^s, то (2) ak~s = 1 (mod m) и поэтому в силу предложения 5.2 k — s делится на d, т. е. (3) k = s(modd). Обратно: из (3) следует (2) и (1). ? ПРЕДЛОЖЕНИЕ 5.5. Пусть а, Ь — числа, взаимно простые с т. Если числа 0(amodm) и 0(bmodm) взаимно простые, то 0 (ab mod m) = 0(a mod m) • 0 (b mod m). Доказательство. Пусть 0(a) = d, 0(b) = e и 0(ab) = f. Докажем, что / делится на de. Так как &е== Esl(modm), то ае = aebe = (ab)e (mod т) и aet = (abf = ss ((ab)f)e е= 1 (mod m). Из ae/ == 1 (mod m) в силу предложения 5.2 следует, что ef делится на d. Так как, по условию, (d, е)= 1, то f делится на d. Также находим, что /делится на е. Следовательно, f делится на de. С другой стороны, (ab)de = (ad)e(be)d=l(rnodm). Согласно предложению 5.2, отсюда следует, что de делится на f. Следовательно, f = de. ? ПРЕДЛОЖЕНИЕ 5.6. Если 0(amodm) = n и d — натуральный делитель числа п, то 0 (ad mod m) = n/d. Доказательство. Пусть 0(admodm) = /. По условию, an = (ad)n/d= 1 (modm). Согласно предложению 5.2, отсюда следует, что n/d делится на /, т. е. n/d = kf, n==kfd для некоторого натурального числа k. Следовательно, afd = = (ad)f= l (modm). Отсюда следует, что fd делится на п. Поэтому &=1, n = /d и f = n/d. П ПРЕДЛОЖЕНИЕ 5.7. ?сяи 0(amodm) = nu (kt n) = d, то 0 (ak mod m) = n/d. 414
Доказательство. Пусть 0(akmodm)=ft k = kLd, n = nxd. Из условия следует, что (akyi/d = (a«) kid == l (mod my Следовательно, число n/d = n± делится на /. С другой стороны, (ak)f = akf?E= l (mod m). Согласно предложению 5.2, отсюда следует, что kf делится на п. Поэтому kj делится на %. Так как (kl9 пг) = 1, то / делится на п±; следовательно, f = n1 = n/d. П ПРЕДЛОЖЕНИЕ 5.8. Если 0 (a mod т) = яи (k, n) = 1, то 0(akmodm) = n. Это предложение непосредственно следует из предыдущего. Первообразные корни по простому модулю. Для описания мультипликативной группы вычетов по простому модулю необходимо изучить числа, имеющие наибольший порядок по этому модулю. ТЕОРЕМА 5.9. Пусть р — простое число и d —натуральный делитель числа р —• 1. В приведенной системе вычетов по модулю р существует точно q)(d) чисел, имеющих порядок d. Доказательство. Пусть В — приведенная система вычетов по модулю р. Пусть d — некоторый натуральный делитель числа р — 1. Обозначим через г|) (d) число элементов из В, порядок которых равен d. Допустим, что существует хотя бы один элемент а^В, имеющий .порядок р, т. е. i|)(d)>0. Тогда а, а2, ..., ad — различные по модулю р решения сравнения (1) xd=l(modp) и, согласно теореме 4.6, других решений нет. Поэтому все вычеты порядка d должны принадлежать множеству М = {а, а2, ..., ad}. Согласно предложениям 5.7 и 5.8, число ak имеет порядок d тогда и только тогда, когда (d, k)=l. Отсюда следует, что ty(d) = cp(d), если существует хотя бы один элемент порядка d. Таким образом, (2) i|)(<i)^(p(<i) для любого делителя d числа (р —1). Так как каждый вычет имеет некоторый порядок d, являющийся делителем р — 1, то <*|<р-1) 415
С другой стороны, согласно теореме 3.11, 2 ф(<о=р-1. поэтому (3) S (T(d)-\|)(d)) = 0. ^l(p-i) На основании (2) и (3) заключаем, что a|)(d) = <p(<i) для любого натурального делителя d числа р — 1. ? Если вычет а по модулю m имеет порядок ф(т), то а называется первообразным корнем по модулю т. ТЕОРЕМА 5.10. Группа вычетов по модулю р, взаимно простых с модулем, циклична. Число первообразных корней по модулю р равно ф(р—1). Эта теорема непосредственно следует из предыдущей теоремы, согласно которой существует ф(р — 1) образующих группы вычетов, взаимно простых с р. Если g есть первообразный корень по модулю р, то р — 1 степеней несравнимы по модулю р. Следовательно, верно следующее предложение. ПРЕДЛОЖЕНИЕ 5.11. Если g есть первообразный корень по модулю р, то р — 1 степеней g, g2, ..., g?-1 представляют собой приведенную систему вычетов по модулю р. Первообразные корни существуют не для всякого модуля т9 а лишь для т = 2, 4, pft, 2р* (р — нечетное простое число). Пример. Пусть р=13. Найдем первообразные корни по этому модулю. Число р — 1 = 12 имеет 6 натуральных делителей: 1, 2, 3, 4, 6, 12; ф(1) = 1,ф(2) = 1,Ф(3) = 2,ф(4) = 2,ф(6) = 2, Ф(12) = 4. Числа 2, 6, 7, 11 являются первообразными корнями по модулю 13. Число 12 имеет порядок 2; число 3 —порядок 3; числа 5,8 —порядок 4; числа 4,10 —порядок 6, число 1 — порядок 1. Индексы по простому модулю. Пусть g есть первообразный корень по модулю р. Тогда числа 416
образуют приведенную систему вычетов по модулю р. Поэтому любое число #, взаимно простое с р, сравнимо с одним и только с одним из чисел ряда (1). Если az=gk(modp), то k называется индексом числа а по модулю р при основании g и обозначается символом inda или ind^a. Если &'—другое число, для которого a=gk' (mod р), то gk = gk' (modp) и, согласно предложению 5.4, & е= fe'(mod (р-— 1)). Таким образом, множество индексов данного числа а образуют класс вычетов по модулю р—1. Из определения индекса вытекает, что из a = b(modp) следует ind as= ind 6(modp — 1). Пример. Пусть р=13. Число 2 есть первообразный корень по модулю 13. Индексы чисел 1, 2, ..., 12 при основании g = 2 таковы: а\\ 2 3 4 5 6 7 8 9 10 11 12 ind а 10 14295 11 38 10 7 6 С помощью этой таблицы по данному числу а находится его индекс по модулю 13. Следующая таблица позволяет по данному индексу находить соответствующее число: indalO 12345 6 789 10 11 а\\ 2 4 8 3 6 12 11 9 5 10 7 С помощью индексов умножение по модулю р можно свести к сложению по модулю р— 1 аналогично тому, как, используя логарифмы, можно свести обычное умножение чисел к сложению. ТЕОРЕМА 5.12. Если числа а, Ь взаимно простые с р и п — любое натуральное число, то п ind а& =^nd я + ind Ь (mod p — 1), ^ ' ind atl==n inda (mod p— 1). Доказательство. По определению индексов чисел а и Ъ имеем: a~==ginda(modp), 6=g-ind6(modp), отсюда находим произведение a&=gindfl+ind6(modp). Следовательно, ind a + ind b есть один из индексов произведения ab, т. е. ind ab = ind a + ind b (mod p — 1). 417
Из сравнения a=ginda(modp) следует, что a*ssg*inde(modp); поэтому n'mda есть один из индексов степени ап, т. е. ind an = n ind a (mod р — 1). Q Примеры. 1. Пусть р = 13, a = 8, 6 = 6; тогда ind 8 = 9, ind6 = 8, ind8-6 = 9 + 8 = 5(modl2). 2. Решить сравнение 6х = 7 (mod 13). Данное сравнение равносильно такому: ind 6 +indх = ind7(modl2), или ind#== =ind7-ind6 = 11-5 = 6 (mod 12). Отсюда следует, что х= 12 (mod 13). ТЕОРЕМА 5.12. Пусть $р — мультипликативная группа классов вычетов, взаимно простых с р, и С есть аддитивная группа классов вычетов по модулю р— 1. Отображение a mod р *—> ind a (mod p — 1), ставящее в соответствие каждому элементу а группы &р элемент ind а группы С, есть изоформизм группы &р на группу С. Доказательство. Согласно определению индекса, соответствие a mod р н-^ ind a (mod р — 1) является биек- ф тивным. Кроме того, сохраняется операция умножения в группе Jp, так как из сравнения ind ab = ind a + ind b (mod p — 1) следует, что [ind ab] = [ind a] + [ind p]. Следовательно, ф есть изоморфизм группы j>p на группу С. ? В обычной арифметике основой теории логарифмов является изоморфизм мультипликативной группы положительных действительных чисел и аддитивной группы всех действительных чисел. Доказанная теорема, являющаяся основной в теории индексов, объясняет причину сходства теории логарифмов (в обычной арифметике) и теории индексов (по простому модулю). Двучленные сравнения. Двучленным сравнением называется сравнение вида (1) axn = b (mod p), где степень п положительна. Если р —простое число, то сравнение (1) равносильно сравнению (2) ft§ = ind& — ind a (mod p— l), где § = ind*. 418
Для того чтобы сравнение (2) было разрешимо, необходимо и достаточно, чтобы число d = (n, р — 1) делило разность ind Ь — ind а. Если это условие выполнено, то сравнение (2) имеет d решений по модулю р—1; следовательно, сравнение (1) имеет точно d решений по модулю р. Пример, Решим сравнение (3) б*8^ 5 (mod 13). Сравнение (2) в этом случае имеет вид 8g== ind5-ind6(mod 12), или 8? ==4(mod 12). Последнее сравнение совместно, так как (8,12) делит 4, и имеет следующие четыре решения: | = 2, 5, 8, 11 (mod 12); ind* = 2, 5, 8, 11 (mod 12). Поэтому сравнение (3) имеет четыре решения: # = 4, 6, 9, 7 (mod 13). Двучленное сравнение (1) можно свести к более простому, умножив обе части сравнения на число а', обратное к а по модулю р, a'a=l(modp). Умножив, получим xn = a'b (mod р). Таким образом, любое двучленное сравнение можно привести к простейшему виду: *m==c(modp). ОПРЕДЕЛЕНИЕ. Число а называется k-степенным вычетом по модулю т, если сравнение xk = a(modm) имеет хотя бы одно решение. Пусть р—-простое число и ? = (&, р — 1). ТЕОРЕМА 5.13. Для любого вычета а по простому модулю р равносильны следующие утверждения: (а) а есть k-степенной вычет по модулю р; (Р) а Ъ =1 (mod p), (у) порядок класса вычетов a mod p есть делитель числа -^р-, т. е. 0(amodp)|((p-l)/&); (б) ind а кратен k. Доказательство. (ос)->-(Р). Пусть а есть ^-степенной вычет; тогда существует вычет х0, взаимно простой 419
с р, удовлетворяющий сравнению x*=a(modp). Следовательно, р-1 р-1 а к 35(4) * = (4//г)Р 1 = l(modp)> т. е. выполняется (Р); (P)-v(y). Согласно предложению 5.2, из сравнения ф) следует (у); (v)->-(6). Из условия (у) следует, что (1) a k == 1 (modp). Пусть g есть первообразный корень по модулю р. Тогда a=zginda и в СИЛу (1) р—1 . J р—1 г • j ч2^— mag»- _ « , л . (ginda) k =g k =l(modp). Поэтому согласно предложению 5.2 ind a • р~ = О (mod p — 1); следовательно, &|inda, т. е. выполняется (б). (б)->(а). Рассмотрим сравнение kl s= ind a (mod p — 1). Так как ? = (?, р— 1) [ ind а, то это сравнение имеет решение. Пусть i0 — решение этого сравнения, &g0==inda (mod p — 1). Тогда gk^° = gind a (mod p), следовательно, (glo)fe = a (mod р), т. е. а есть ^-степенной вычет по модулю р. Таким образом, (б)-^(а). ? Упражнения 1. Составьте таблицу индексов по модулю 19 с основанием 2. 2. Составьте таблицу индексоз но модулю 29 с основанием 10. 3. Найдите первообразные корни чисел 41 и 49. 4. Пусть р— нечетное простое число и п>>\. Покажите, что существует ровно (р — 1) • ф (р — 1) различных первообразных корней числа рп, несравнимых по модулю р2. 5. Если р —простое нечетное число, /г>1, то существует ровно ф(ф(р*)) различных первообразных корней числа рп. 6. Покажите, что если р — нечетное простое число и я>1, то существует ровно ф (ф (рп)) различных первообразных корней числа 2рп. 7. Найдите индекс числа (—1) по нечетному простому модулю р при произвольном основании. 420
8. Покажите, что для простого числа вида 2п-{-\ при /г>3 число 3 является первообразным корнем. 9. Покажите, что если р —простое число вида 4fe+l и g—первообразный корень по модулю р, то р— g есть также первообразный корень по модулю р. § 6. ОБРАЩЕНИЕ ОБЫКНОВЕННОЙ ДРОБИ В СИСТЕМАТИЧЕСКУЮ И ОПРЕДЕЛЕНИЕ ДЛИНЫ ПЕРИОДА СИСТЕМАТИЧЕСКОЙ ДРОБИ Периодическую /п-ичную дробь nft(№+...+bl + %+...+? + &+...+&+..) кратко записывают в виде (*) mh(b1...bh a1...ak). При этом a±...ak называется периодом дроби, a b±...bi— предпериодом дроби. Число k называется длиной периода, число I —длиной предпериода. Периодическая /я-ичная дробь (#) называется нормированной, если выполнены условия: (а) аьФЪь (Р) период ах ... ak имеет наименьшую возможную длину. Если нормированная периодическая m-ичная дробь (*) представляет число а, т. е. а = тк(Ь± ... Ьи ах ... ak), то говорят, что дробь mh(bL... Ьь аг... ak) есть нормированное разложение числа а в периодическую т-ичную дробь. ПРЕДЛОЖЕНИЕ 6.1. Пусть т —фиксированное на- туральное, больиъее единицы число. Для любого заданного положительного рационального числа а существуют целое число h и натуральные числа с, п такие, что (I) a = mh~, (m, n)=l, т-\с, (с, м) = 1. При этом если целое число h± и натуральные числа съ пг удовлетворяют условиям (Г) а = тА^, (ту %)=1, т\съ (cv пг)=1, то h = hv с — сг и п = пг 421
Доказательство. Представим рациональное число а в виде несократимой дроби a = u/v, (и, и) = 1, и, hgN. Обозначим через п наибольший натуральный делитель знаменателя v, взаимно простой с т, v = qn. Тогда каждый простой делитель числа q делит т; поэтому существуют целые числа Этакие, что -gN. Обозначим через t0 наименьшее целое число такое, что —«gN. Пусть с = ти — и, тогда а—тги-^-у т\с, (с, л)=1. Полагая h = —10, видим, что числа h, с, п удовлетворяют условиям (I). Предположим, что числа hu cl9 пх удовлетворяют условиям (Г); тогда а — тн-~==т^--~. Пусть к^къ тогда mh-h^cn1 = c1n. Так как, по условию, (т, п) = \ и т\съ то т^ с^г\ поэтому Л—^ = 0 и т1=^1д, значит, h = h± и — = —. Так как —=»-&- несократимы, то с = сх и /2=^ П СЛЕДСТВИЕ 6.2. Для фиксированного т и данного положительного рационального числа а существует един- ственное целое число h такое, что дробь a/mh имеет взаимно простой с т знаменатель и не делящийся на т числитель, ОПРЕДЕЛЕНИЕ. Представление положительного рационального числа а в виде (I) * = т*.?, где (т, /г)= 1, т^ с, (с, п)— 1, (с, ri)^N> будем называть т-представлением числа а. Число /г будем обозначать также через /i(a). ПРЕДЛОЖЕНИЕ 6.3. Если периодическая т-ичная дробь mh(b1...bh a1... аА) удовлетворяет условию акфЬь то ее предпериод имеет наименьшую возможную длину. 422
Доказательство. Действительно, если ak = bi и />1, то mh(bx...bh аг... ак) = тн+г ф± .. .Ь^ъ a/fli -• - 0*-i)> т. е. можно уменьшить длину предпериода дроби. D ПРЕДЛОЖЕНИЕ 6.4. Пусть дробь (I) mh(blt..bh a1...ак) есть разложение в периодическую т-ичную дробь положительного рационального числа а. Пусть (II) a = m*<e>.? есть т-представление числа а. Тогда равносильны следую- щие утверждения: (а) Ъьфак\ ($)АфВ (modя), где B = b1ml-l + ... + bl и A =a1mfe-1 + ... + a^; (у) h = h(a)\ (fi) -7^" = T==6i---6/' *i •'• а*# Доказательство. (ос)-^(Р). Определим числа А и 5 следующими равенствами: (1) A = a1mk-1 + ...+ak, 0^alt ..., ak<m9 (2) B = 61m'-1 + ... + &,, 0<61э ...,6,<т, Так как 0^bh ak<.m, то из (а) следует (3) акфЬь (modm). На основании (1), (2) и (3) заключаем, что А^В (modm); т. е. имеет место ((5). (P)->(v). Согласно условию, а = тн{Ь± ... Ь/ ах ... ak) = = m^(b1m- + ... + ^ + ^?j+^), 423
значит, Легко видеть, что B(mk— l) + AzEs — B + Azzz — bi + ak (modm). Согласно условию ((3) отсюда следует, что (5) B(mk-l) + A=?Q (modm), т. е. m^(B(mk — 1) + Л). Кроме того, ввиду (II) и (4) /с\ н(а\ с h B(mk—\) + A (6) а = тьм.~ = ть. mk^ . Согласно предложению 6.1 из (5) и (6) следует равенство (7)/i = ft(a); (у)-*(&). По условию, (8) a = m*e>-? = m*(fti ... Ьи ах ... ak). Из (7) и (8) следует (9) ^==^':=sbl "• Ъи ai "• йк> значит, выполняется (6); (б)-^(а). Из условия (б) следует, что с Д(т* — \)+А п ~~ /nft—1 ' т.е. B(mk— l) + A =с . Так как (с, т)=1 и р^1,т) = 1, то B(mk-l)+A=z-B + A=?0 (modm). Кроме того, — В + А = — bi + ak (modm). Следовательно, bt =?ak (mod т). В силу (1), (2) отсюда следует, что Ьгфак. ? ПРЕДЛОЖЕНИЕ 6.5. Пусть 0, а± ... ak есть разложение в периодическую т-ичную дробь положительного рационального числа r/п, (г, п) = 1, т. е. (1) г/л = 0, ах ... ak. Тогда длина k периода делится на порядок класса вычетов т mod/z, 0 (т modn) | k. 424
Доказательство. По условию, Положим A =a1mk~l +.. .+ak. Тогда (2) можно записать в виде ?.-— + — 4- Следовательно, (3) 7Г = S*=I и r(mk— 1) = пЛ. А так как (я, г) = 1, то /г |(т* — 1), т.е. (1) mfe = l (mod тг). В силу предложения 5.2 из (4) следует, что k делится на порядок класса вычетов mmodn. ? ТЕОРЕМА 6.6. Рациональное число ~->0, (г, л) = 1, тогда к только тогда разлагается в чисто периодическую т~ичную дробь с наименьшим периодом (1) 0, ах... ak, когда выполнены условия (2) 0<~<1, (т, /г) = 1. Яра этом длина k наименьшего периода равна порядку класса вычетов т modfi и последовательность аъ ..., ak совпадает с последовательностью цифр в т-адическом представлении числа (mk—l)-r/n. Доказательство. Пусть дано положительное рациональное число а, представленное несократимой дробью г/п> удовлетворяющей условиям (2). Положим k = 0(mmodn). Умножив числитель и знаменатель дроби — на т ~ , получим (3) а=^=;^гг. Пусть (4) A = axmk-*+...+ak 42-5
есть m-адическое представление числа а. Ввиду (3) (5) a=^ = w + ^+... Из (4) и (5) следует, что т. е. получено разложение числа а в чисто периодическую дробь с периодом длины k: а = 0, %...#?. При этом в силу предложения 6.5 длина k периода является минимальной и последовательность %,..., ak совпадает с последовательностью цифр в m-адическом представлении числа (mk — l)-r/n. Теперь предположим, что дано разложение числа —, (г, л)=1, в чисто периодическую дробь с наименьшим периодом, — = 0, %...#?, т. е. П\ JL— fL4- JL^LA-J± L кч п~~ т^^'^т* ^/^+Г^" Пусть (6) А=*а1т*~1+... + ак. Тогда (7) 7r = ^" + 7JP+--- и поэтому (8) ^ = ^zr[- 4-^-4- • • "Г m2k Т Ввиду (7) и (8) 0<A<;mfe — 1. Отсюда и из (8) следует, что 0<-1<1. Из (8) имеем r(mk— 1) = Ая, а так как (л, г) = 1, то n\(mk— 1), т. е. (9) т*ез1 (mod/г). 426
и, значит, (m, л) = 1. Из (9), согласно предложению 5.2, следует, что 0 (т mod я) ] k. По условию, fe есть наименьший период, следовательно, в силу предложения 6.5 k~ = 0(т mod п). Ввиду (8) А = (mk — 1) • -р Далее, ввиду (2) (m*-l).^ = alm*-1+... + ak. Таким образом, последовательность av ...,ak цифр периода дроби 0, a1...ak совпадает с последовательностью цифр в m-адическом представлении числа (mft—1)™. П ТЕОРЕМА 6.7. Любое положительное рациональное число а обладает нормированным разлооюением в периодическую т-ичную дробь mh(b1...bh aL...ak). При этом если a = mh(a) •— есть т-представление числа а, то: 1) Л = Л(а); 2) k = 0(mmodn); 3) последовательность Ъъ ..., bL совпадает с последовательностью цифр в т-адическом представлении числа В, где [Щ, если -^ф1, —к — 1, если —jr e Z; 4) последовательность аъ ..., аЛ совпадает с последовательностью цифр в т-адическом представлении числа А, где А = (т*-1)(-^-в). Доказательство. Согласно предложению 6.1, для числа а существуют целое число h и натуральные числа су п такие, что (I) а = тЛ-р, (т, л) = 1, т\су (с, л) = 1. Число с можно представить в виде с = Вп + г, где 0< <г^п, (г, я) = 1 и 5 —некоторое натуральное число, поэтому 427
Следовательно, имеем: / Г й 1 а , г-ж M-prJ. если -^ф2, В = \ 1-рг-1' если ?eZ- По теореме 6.6, правильная дробь r/п разлагается в чисто периодическую /n-ичную дробь (3) ~- = 0, a±...ak. При этом длина k наименьшего периода равна порядку класса вычетов /л mod/г, (4) k = 0(mmodn), и последовательность а19 ..., ak совпадает с последовательностью цифр в m-адическом представлении числа Л, где A = (m*-l).^ = (m*-l)(^-fi). Пусть В = Ь1тг~"1+... + &/ есть m-адическое представление числа В. Тогда в силу (I), (2) и (3) имеем (5> ^ = 7r = 6l"-&/> ai • • • а*' поэтому (6) а = тн(Ьг ... 6/, % ... а*). Так как h = h(a), то из (6) согласно предложению 6.4 следует неравенство Ъг ^ь ak. Кроме того, ввиду (4) и предложения 6.5 длина k периода в разложении (6) является наименьшей. Таким образом, (6) является нормированным разложением числа а в периодическую m-ичную дробь. ? Упражнения 1. Найдите число цифр в периоде десятичных дробей, в которые обращаются обыкновенные дроби со знаменателями: 3, 7, 11, 13, 17, 19, 21. 2. Обратите следующие периодические десятичные дроби в обыкновенные: 0,35(62); 5,1(538); 3,(27); 11,12(31). 3. Найдите знаменатель дроби, обращающейся в чистую периодическую дробь с тремя цифрами в периоде. 4. Пусть р—просгое число, отличное от 2 и 5. Покажите, что если дробь 1/р обращается в чистую периодическую десятичную 428
дробь с четным числом цифр в периоде, то цифры второй половины периода дополняют до девяти соответствующие цифры первой половины периода. Например, 1/7 = 0,142857. 5. Найдите число цифр в периоде десятичных дробей, в которые обращаются обыкновенные дроби со знаменателями: 41, 13'37, 1ЫЗ-17, 5-7.19, 2-1ЫЗ. 6. Каким может быть знаменатель дроби, обращающейся в чистую периодическую десятичную дробь с тремя цифрами в периоде? 7. Каким может быть знаменатель дроби, обращающейся в чистую периодическую десятичную дробь с пятью цифрами в периоде?
Глава тринадцатая КОЛЬЦА § 1. ИДЕАЛЫ КОЛЬЦА. ФАКТОР-КОЛЬЦО Идеалы кольца. Пусть <з/^ = (/(, +, —, •, 1) —кольцо и /-подмножество множества /С. Множество / называется замкнутым в &С относительно вычитания, если a — b^I для любых элементов а и Ъ из /. Множество / называется устойчивым относительно умножения справа на элементы кольца &?, если ak^I для любого а из / и любого k из /С, т. е. если множество / вместе с каждым своим элементом а содержит все его правые кратные ak, где fte/(. Аналогично определяется множество, устойчивое относительно умножения слева на элементы кольца &?. Множество / называется устойчивым относительно умножения на элементы кольца Sfi\ если оно устойчиво относительно умножения справа и слева на элементы кольца SfC. ОПРЕДЕЛЕНИЕ. Правым {левым) идеалом кольца &? называется любое непустое подмножество множества К, замкнутое в SfC относительно вычитания и устойчивое относительно умножения справа (слева) на элементы кольца е/Г. ОПРЕДЕЛЕНИЕ. Двусторонним идеалом кольца &С или просто идеалом кольца &С называется любое непустое подмножество множества К, если оно является одновременно правым и левым идеалом кольца е/?\ Из определения следует, что любой идеал / кольца &? содержит нуль кольца и замкнут относительно первых трех главных операций кольца. Алгебра </, +, —) является подгруппой аддитивной группы (К, +, —) кольца. Множество Ш#р\ есть идеал кольца Ж, называемый нулевым идеалом. Множество К также есть идеал кольца &?\ он состоит из кратных единицы кольца и поэтому называется единичным идеалом кольца &С. Нулевой и единичный идеалы называются тривиальными идеалами кольца &С. 430
Идеалы кольца, отличные от тривиальных, называются собственными идеалами кольца. Примеры. 1. Пусть % — кольцо целых чисел и п — фиксированное целое число. Множество nZ = {nx\x<=Z} является идеалом кольца %. 2. Пусть ^ — произвольное кольцо и /г —фиксированное целое число. Множество пК = {пх \ х е К} является идеалом кольца SfS. 3. Пусть &С — коммутативное кольцо и а — фиксированный его элемент. Множество {ka\k^K}> состоящее из кратных элемента а, есть идеал. Он называется главным идеалом, порожденным элементом а, и обозначается через (а). В некоммутативных кольцах необходимо различать правые и левые главные идеалы. 4. Пусть &С — коммутативное кольцо и аъ ..., ап^К- Множество {^i+ ... +knan \kl9 ...,?„€/(} есть идеал кольца SfC. Он называется идеалом, порожденным элементами Оц ..., ап, и обозначается символом (а19 ..., ап). В некоммутативных кольцах необходимо различать правые и левые идеалы, порожденные элементами аъ ..., ап. Рассмотрим операции над идеалами. Пересечением идеалов I и J кольца SfC называется множество I{\J. Аналогично определяется пересечение любой совокупности идеалов кольца. Легко проверить, что пересечение любой совокупности идеалов кольца есть идеал этого кольца. Суммой идеалов I и J называется множество I + J, определяемое равенством / + J = {x+y\xe=I, y<=J}. Легко проверить, что сумма идеалов кольца есть идеал этого кольца. Сложение идеалов обладает свойствами коммутативности и ассоциативности. Произведением идеалов I n J кольца &? называется множество всех элементов видаххух-\-.. .+хпуп, где xt е /, yi^ J и п — любое целое положительное число. Произведение идеалов I и J обозначается через / • J. Легко проверить, что произведение идеалов кольца есть идеал этого кольца. Отметим, что главный идеал (а), порожденный элементом а коммутативного кольца S%, является пересечением всех идеалов, содержащих элемент а, и, значит, (а) есть наименьший среди идеалов, содержащих элемент а. Аналогично, идеал (аг, ..., ап), порожденный элементами а19 ..., ап коммутативного кольца &?, является пересечением всех идеалов, содержащих элементы а±, ..., ап, 431
и, значит, (аг, ..., ап) есть наименьший среди идеалов, содержащих элементы аг, ..., ап. Сравнения и классы вычетов ио идеалу. Пусть / — фиксированный произвольный идеал кольца SfC. ОПРЕДЕЛЕНИЕ. Элементы а, Ь кольца &? называются сравнимыми по идеалу I, если a — b^I. Запись a = b (mod/) означает, что элементы а и Ь сравнимы по идеалу /. ПРЕДЛОЖЕНИЕ 1.1. Отношение сравнения по идеалу I в кольце &? (на множестве К) является отношением эквивалентности. Доказательство. Отношение сравнения по идеалу / рефлексивно, так как а — a^I для любого элемента а из К. Отношение сравнения по идеалу / транзитивно, так как из того, что a — b^I и Ь — с<=1, следует, что а — с = (а — b) + (b — с)е/. Отношение сравнения по идеалу / симметрично, так как из a—b^I следует b — a^I. ? ОПРЕДЕЛЕНИЕ. Классы эквивалентности отношения сравнения по идеалу / в кольце &? называются классами вычетов по идеалу I или смежными классами кольца &С по идеалу I. Класс вычетов, содержащий элемент а кольца $%, будем обозначать через а. Очевидно, а = а+/. ТЕОРЕМА 1.2. Классы вычетов кольца &? по идеалу I обладают следующими свойствами: (1) любые два класса вычетов либо совпадают, либо не пересекаются; (2) объединение всех классов вычетов кольца &С по идеалу I совпадает с множеством \SK\\ (3) классы вычетов а и b по идеалу I совпадают тогда и только тогда, когда a^b (mod/); (4) если с^а, то а = с-\-1 (в частности, а=а + 1). Свойства (1) —(4) теоремы выражают соответствующие свойства смежных классов группы (К, +, —> по подгруппе </, +, — >. Рассмотрим следующие основные свойства сравнений по идеалу. СВОЙСТВО 1.1. Сравнения можно почленно складывать и вычитать, т. е. из а^Ь и c = d (mod /) 432
следует, что a+c = b + d и a — c = b — d (modi). Доказательство. В самом деле, если а —Ье/ и С-dG/, ТО а+с — (b + d)^I и (а — с) — (6 — d)^I. Следовательно, a+c^b-{-d, a — c = b — d (mod/). ? СВОЙСТВО 1.2. Обе части сравнения можно умножить на любое целое число п, т. е. из a==b (mod /) следует сравнение na = nb (mod/), где n<=Z. Доказательство. Из а —&е/ следует, что па — — nb = n(a — b)^I. ? СВОЙСТВО 1.3. Обе части сравнения можно умножить справа и слева на любой элемент кольца, т. е. из a==b (mod/) и с^\Ж\ следуют сравнения ca^cb (mod/), ac = bc (mod/). Доказательство. Множество элементов идеала / устойчиво относительно умножения на элементы кольца. Следовательно, для любого элемента с кольца SfC из а — — бе/ следует, что ca — cb^I и ac — bc^I. ? СВОЙСТВО 1.4. Сравнения можно почленно перемножить, т. е. если a==b, c = d (mod/), то ac=bd (mod/). Доказательство. В самом деле, если а — &е/ и c — d^I, то в силу устойчивости идеала / относительно сложения и умножения на элементы кольца имеем ac — bd = ac — bc + bc — bd = (a — b)c-{-b(c — d)^I. ? Фактор-кольцо. Пусть / — идеал кольца & = (К, +, —, •, 1>. Выше было установлено, что отношение сравнения по идеалу / есть отношение эквивалентности на множестве /О Классы эквивалентности называются классами вычетов или смежными классами кольца Ж по идеалу I. Множество всех классов вычетов называется фактор-множеством К по идеалу I и обозначается через К/1. Свойства 1.1 — 1.4 сравнений по идеалу показывают, что отношение сравнения по идеалу / является конгруэнцией в кольце Ж (конгруэнцией относительно всех главных операций кольца Ж). Поэтому, согласно теореме 3.1.9, 433
на фактор-множестве К/1 можно определить операции +, —, •, Т, ассоциированные с главными операциями кольца Ж, следующим образом: а + В = а + Ь, —й = (^~а), йВ=аЬ9 1=1 для любых элементов а, В из К/1. Такое определение операций на фактор-множестве К/1 является корректным, так как не зависит от выбора элементов a, b в смежных классах а и Ъ соответственно. ОПРЕДЕЛЕНИЕ. Алгебра (Klh +, —, •, 1> называется фактор-кольцом кольца &С по идеалу I и обозначается через S%/I. ТЕОРЕМА 1.3. Пусть I —идеал кольца Ж. Тогда алгебра Ж/1 = (К/1, +, —, •, 1) является кольцом. Доказательство. Алгебра (К/1, +, —) есть абе- лева группа, так как она является фактор-группой аддитивной группы (Ку +, —> кольца $% по подгруппе </, +, —) (см. теорему 10.4.2). Алгебра (К/1, •, 1} является моноидом. В самом деле, в силу ассоциативности умножения в Ж для любых а, Ь, с из К/1 д • (5 • С) = Я • (6с) = аЩ) = (ab)c = (ab) • D = (а • В) • С, т. е. умножение в алгебре Ж/1 ассоциативно. Кроме того, #.I=a-l=a = I'a для любого а из K/U т. е. I является нейтральным элементом относительно умножения в алгебре Ж/1. Умножение в ЖII дистрибутивно относительно сложения. В самом деле, в силу дистрибутивности умножения относительно сложения в кольце Ж для любых а, В, с из ЖII имеем (a + B)-C = a + b-C^(a + b)'C = ac + bc=~ac+bc== Аналогично убеждаемся в том, что е (а + 6) = е • а+с • В. П Теорема об эпиморфизмах колец. Пусть ЖиЖ,/- кольца: Ж = (К, +,-,-, 1>, #' = <*'. +.-.-. 1'>. ТЕОРЕМА 1.4. Ядро гомоморфизма кольца Ж в кольцо Ж' является идеалом кольца Ж. Доказательство. Пусть Кегf — ядро гомоморфизма /кольца Ж в кольцо Ж\ т.е. Ker/ = {*e=e/? |/(x)=0'}, 434
где 0' —нуль кольца q%'. Множество Kerf не пусто, так как ОеКегД Для любых а, Ъ из Kerf имеем /(а-&) = «а)-/(&) = 0'-0' = 0', т. е. множество Кег / замкнуто в &? относительно вычитания. Для любого а из Kerf и любого k из К имеем Дйа)=/(Л).Да)=/(*).0'=0', т. е. ka^Kevf. Аналогично убеждаемся, что ak^Kerf. Таким образом, Кег f устойчиво относительно умножения на элементы К* Следовательно, ядро гомоморфизма / является идеалом кольца &С. ? ПРЕДЛОЖЕНИЕ 1.5. Пусть f[ — гомоморфизм кольца &Рвкольцо&' с ядром I. Для любых а, Ъ из К равенство f(a) = f(b) выполняется тогда и только тогда, когда а = Ь. Доказательство. Пусть f(a)=f(b). Тогда (1)/(а-&) = Да)-/(6) = 0', поскольку/~гомоморфизм. Поэтому а —бе/ и, следовательно, a = 5. Теперь допустим, что а = Ь. Тогда a — Ье/иДа — Ь) = = 0', поскольку / = Кег/. Отсюда, учитывая (1), получаем /(а)-/(6) = 0' и/(а) = /(&). П ТЕОРЕМА 1.6. Пусть f —эпиморфизм кольца SK на кольцо SfC1 с ядром I. Тогда фактор-кольцо &C/I изоморфно кольцу &С'. Доказательство. По условию, / = Кег/\ Пусть К = = К/1 — множество всех классов вычетов кольца Ж по идеалу I и «7/= <*//,+,-,•,!>, где 1 = 1+7. Обозначим через h отображение К/1 в |Ж1 |, определяемое следующим образом: (1) h{a) = f(a) для каждого элемента а из К. В силу предложения 1.5 значение h(a) не зависит от выбора представителя а в смежном классе а. Далее, отображение h сохраняет главные операции кольца SfC/L В самом деле, /i(l)=l^/ и для любых а, Ь из К имеем: ft(u + 5) = ft(M^ = /(a + 6) = /(a)+/:(b) = ft(a)+/i(6); ft(-a) = ft((=^)) = f(-a) = -f(a) = -/i(a); h(a.b)=h{ab)=f(ab)=f(a).f(b)=h(a)-h(b). 435
По условию, f отображает \&\ на |йГ'|. В силу (1) отсюда следует, что h есть отображение множества К на множество \SfC'\. Отображение к инъективно. В самом деле, в силу (1) из равенства h(a) = h(b) следует f(a)=* =f(b)\ в силу предложения 1.5 отсюда следует, что а = 5. Следовательно, h является изоморфизмом фактор- кольца ЖII на кольцо &?'. ? Характеристика кольца. Пусть ЗР = (К, +, —, •, е) — кольцо с единицей е. В аддитивной группе (К, +, —) кольца элемент е имеет либо конечный порядок 0(е)=т, либо бесконечный порядок 0(e) = оо. ОПРЕДЕЛЕНИЕ. Говорят, что кольцо &С имеет конечную характеристику т, если в аддитивной группе кольца единица кольца имеет конечный порядок т. Говорят, что кольцо &С имеет характеристику нуль, если единица кольца &? имеет бесконечный порядок. Поскольку всякое поле gF есть кольцо, мы можем говорить о характеристике поля gF. Условимся обозначать через ch{SfC) характеристику кольца &С. Примеры. 1. Пусть 2 —кольцо целых чисел. Для любого целого положительного числа п выполняется условие п-1 ФО, т. е. 0(1)=оо. Следовательно, кольцо целых чисел имеет нулевую характеристику. 2. Пусть т — любое натуральное число, отличное от нуля* Фактор-кольцо %т = %1{т) имеет конечную характеристику т, так как 1—единица кольца Шт, имеет порядок т. 3. Пусть Ж — любое числовое кольцо. Тогда для любого целого положительного числа п выполняется нера? венство п • 1 Ф О и, значит, 0 (1) = оо. Следовательно, любое числовое кольцо имеет характеристику нуль. 4. Пусть sF —поле характеристики т, GK — кольцо квадратных матриц над gF и Е — единичная матрица, единица кольца. Кольцо Ж имеет характеристику т, так как 0(E) = 0i\y) = m. ТЕОРЕМА 1.7. Характеристикой области целостности является либо нуль, либо простое число. Доказательство. Пусть g/^ —область целостности и е — единица кольца Ж. Если 0(e) = оо, то Ж имеет характеристику нуль. Если 0 (е) = 1, то е = 1 ^ = 0^. Однако ^д?Ф $<%>, так как е^* — область целостности. Значит, 0{е)Ф\. Предположим теперь, что 0(е) = т есть положительное составное натуральное число: m = st, l<s, t<,m. Следо- 436
вательно, О = т • е = (st) • е = (se) -(t-e). Так как 0(е) = т и l<s, ?<m, то s-ефО и ^-е^О, а поскольку Ж — область целостности, то (s-e)-(t-e)= =т-ефО. Мы пришли к противоречию, допустив, что т есть составное число. Следовательно, т является простым числом. ? ТЕОРЕМА 1.8. Пусть р — простой элемент кольца %. Тогда фактор-кольцо %р = к/(р) является полем. Доказательство. Пусть а —любой ненулевой элемент кольца 2р. Надо доказать, что а обратим в кольце %р. Условие а Ф О означает, что р не делит а. Следовательно, р и а взаимно просты. Поэтому существуют такие целые числа тип, что /пр+па=1. Следовательно, й-а=1, т. е. элемент а обратим в кольце %р. Таким образом, кольцо %р является полем. ? Наименьшее подкольцо кольца. Подкольцо, порожденное единицей кольца Ж, содержится в любом подкольце этого кольца. ОПРЕДЕЛЕНИЕ. Подкольцо кольца Ж, порожденное его единицей, называется наименьшим или главным под- кольцом кольца Ж. Пусть е — единица кольца Ж = (К, + , —, ., е), Е= = {ne\n^Z} и% — наименьшее подкольцо кольца Ж. Тогда Е является основным множеством кольца %\ Ш = (Е, +, —, •, е). Легко проверить, что кольцо % является пересечением всех подколец кольца Ж. ТЕОРЕМА 1.9. Пусть т —характеристика кольца Ж и Ш — наименьшее подкольцо этого кольца. Если т = 0, то % изоморфно кольцу % целых чисел. Если же т>0, то % изоморфно фактор-кольцу %1(т). Доказательство. Рассмотрим отображение h множества Z в Е такое, что (1) h(n) = ne для любого целого п. В силу (1) h есть отображение множества Z на Е и, кроме того, h сохраняет главные операции кольца g, т. е. h(n + s) = h(n)+h(s)y h(—ri) = — h(n), h(n-s) = h(n)-h(s), h(l) = e для любых целых п и s. Следовательно, h является эпиморфизмом кольца % на кольцо Ш. 437
Покажем, что Ker h = (m). В самом деле, поскольку /i(m) = me = 0, то (m)c=JKer/i. Далее, если s e Ker ft, то /z(s) = 0, значит, s-e = 0. Кроме того, поскольку 0 (е)=т, то s^(m) по теореме 10.3.1. Таким образом, Kerftcz(m); следовательно, Ker h = (m). По теореме о кольцевых эпиморфизмах, f/Kerft^^. А так как Kerft = (/n), то Ш^%1(т). В частности, 8^2/(0) при m = 0. Следовательно, при /я = 0 кольцо % изоморфно кольцу % целых чисел. ? СЛЕДСТВИЕ 1.10. Пусть S% —область целостности характеристики т>0. Тогда Ш —наименьшее под кольцо кольца ?% —является полем. Доказательство. Поскольку т>0, то, по теореме 1.7, т —простое число. Следовательно, по теореме 12.3.7, %1(т) — поле. В силу теоремы 1.9 кольцо Ш изоморфно полю %1(т) и, значит, само является полем., ? Упражнения 1. Пусть /г—любое целое число и nZ={nx ^eZ}, Покажите, что для всякого п множество /aZ есть идеал кольца %. Покажите, что всякий идеал кольца % есть множество пЪ для некоторого натурального п. 2. Покажите, что бинарные операции пересечения и суммы идеалов коммутативны и ассоциативны. 3. Докажите, что пересечение левых (правых) идеалов кольца есть левый (правый) идеал кольца. 4. Покажите, что поле не имеет идеалов, отличных от нулевого и единичного. 5. Пусть V—конечномерное векторное пространство над полем ^. Пусть Ж—кольцо линейных операторов пространства V. Докажите, что кольцо &С не имеет двусторонних идеалов, отличных от нулевого и единичного. 6. Найдите все идеалы кольца g12. 7. Докажите, что конечная область целостности является полем. 8. Пусть $?—кольцо и л—целое число. Покажите, что множество he 6= К | nx=0$g\ является идеалом кольца &C. 9. Пусть У—конечное поле, состоящее из т элементов. Докажите, что ат = а для любого элемента а поля 3:. 10. Найдите все автоморфизмы поля комплексных чисел, оставляющие неизменными действительные числа. 11. Докажите, что при любом изоморфизме числовых полей подполе рациональных чисел отображается тождественно» 12. Докажите, что кольцо матриц вида a+bi c+dil — c+di a—bi] с действительными а, Ь, с, d изоморфно телу (кольцу с делением) кватернионов a+bl + cj + dk над полем действительных чисел. 13. Докажите, что наименьшее подполе любого поля характеристики нуль изоморфно полю рациональных чисел. 438
14. Докажите, что ge/2Z6 ^ g2 и %6/3Ze ^ g§. 15. Пусть л—положительный делитель натурального числа т. Докажите, что %nJnZm^%n. 16. Докажите, что область целостности, содержащая только три элемеща, изоморфна фактор-кольцу %/ЪЪ. 17. Докажите, что поля g (V?) и $(VTT) не изоморфны* § 2. ПОЛЕ ЧАСТНЫХ ОБЛАСТИ ЦЕЛОСТНОСТИ Поле частных области целостности. Весьма важным является вопрос о возможности вложения области целостности в поле. ОПРЕДЕЛЕНИЕ. Поле еГ называется полем частных области целостности &С, если выполнены условия: (a) ОК есть подкольцо поля оГ; (Р) для любого х из F существуют в К такие элементы а и Ь, что х^а-Ь"1. ТЕОРЕМА 2.1. Для любой области целостности существует поле частных. Доказательство. Пусть е%Г = (/(, +, —, ., 1) — область целостности, /С* = /О\{0} и /(Х/С* = {<Д, b)\ae=K, &<=#*}. На множестве КхК* определим бинарное отношение = следующим образом: (a, b) = (c, d) тогда и только тогда, когда ad = bc. Его мы назовем отношением сравнения на КхК** Отношение сравнения рефлексивно, симметрично и транзитивно. Рефлексивность и симметричность очевидны. Свойство транзитивности также имеет место. В самом деле, из посылок следует, что ad = be, cf = de, d=^=0. Умножив обе части первого равенства на Д а второго на Ь, получим: adf — bcf, bcf — bed и, значит, adf = bed. Последнее равенство влечет af = be> поскольку &? — область целостности и d=?0. Следовательно, (a, b)z=s(e, f). Таким образом, отношение сравнения является отношением эквивалентности на множестве /Сх/С*. Класс эквивалентности, содержащий пару (а, Ь), обозначается через [а, Ь], фактор-множество К X К*/= — через F±. Отметим, что для любых [а, Ь] и [с, d] из F± (1) [а, Ь] = [с, d] тогда и только тогда, когда ad = bc. 439
На множестве КхК* определим операции 0, ©, 0: <fl, b)(?>(c, d) = (ad + bc, bd); Q(a, b) = (— a, b); (a, b) © (c, d) = (ac, bd). Так как &С — область целостности, то из ЬфО и d=?0 следует, что bd=?0. Следовательно, множество КхК* замкнуто относительно операций 0, © и ©. Легко видеть, что операции сложения и умножения коммутативны. Докажем, что отношение сравнения на КхК* является конгруэнцией относительно операций 0, © и 0. Учитывая, что операции сложения и умножения коммутативны, достаточно показать, что из условия (2) (а, Ь)^(а', V) следуют соотношения: (3) (a, &>0<c, d>Es<a\ &'>0<c, d); (4) ©<a, &> = ©<a', &'>; (5) (a, b)Q(c, d)^(a', b')Q(c, d). Проверка (S) сводится к установлению соотношения (ad + bc, bd) = (a'd + b'c, b'd). Это соотношение сводится к равенству {ad + be) b'd = (a'd+b'c) bd, в свою очередь, сводящемуся к равенству ab'd2 = a'bd2, которое получается из равенства ab'=a'b. Последнее равенство следует из условия (2). Проверка (4) сводится к установлению соотношения <_а, &>^<-а', &'>, сводящегося к равенству (— а) Ъ' = (— о!) Ь, которое, в свою очередь, сводится к равенству ab'=a'b, верному в силу условия (2). Проверка (5) сводится к установлению соотношения (ас, bd) = (a'c, b'd), сводящегося к равенству ac-b'd = a'c-bd, которое, в свою очередь, получается из равенства ab' =ab, верного в силу условия (2). 440
Итак, установлено, что отношение сравнения на множестве К X /С* является конгруэнцией относительно операций 0, 0, 0. По теореме 3.1.9 о конгруэнциях, на фактор-множестве Fx определяются операции + > — > • следующими формулами: (6) [a, b] + [c, d] = [ad+>bc, bd]\ (7) -[я, Ь] = [-а, ft]; (8) [а, 6].[с, ?f] = [flc, ftd], причем значения так определенных операций не зависят от случайного выбора пар {а, ft) и (с, d) из классов эквивалентности [а, ft] и [с, d] соответственно. Для любого элемента а из К положим а = [а, 1], в частности 0 = [0, 1], 1=[1, 1]. На основании (1) заключаем, что: [а, Ь] = 0 тогда и только тогда, когда я = 0; [а, 6] = 1 тогда и только тогда, когда а = Ъ\ [a, b] = [ac, be] для любого сфО. Докажем, что алгебра gF1 = (F1, +, —, •, I) является полем. Непосредственная проверка показывает, что сложение в Jr1 коммутативно и ассоциативно, 0 есть нейтральный элемент относительно сложения и для любого [а, Ь] из F± имеем [а, Ь] + (-[а9 ft]) = 0. Следовательно, алгебра (Fly +,—> есть абелева группа. Непосредственная проверка также показываем что умножение в of ± коммутативно и ассоциативно и 1 есть нейтральный элемент относительно умножения. Следовательно, алгебра (Fv •, 1) является коммутативным моноидом. Покажем, что умножение в Jr1 дистрибутивно относительно сложения, т. е. для любых [а, ft], [с, d], [e, f] из/7! ([а, Ь\ + [с, d])[e, Я = [я> Ь][е, /! + [*, d][e, f]. Необходимо показать, что [ade + Ьсе, bdf] = [ae'df+ce-bf, bf-df], или (ade+bcet bdf)^((ade + bce)f, bdf-f) (/#0). 441
Последнее соотношение следует из того, что {аъ bL) = = (aif> bj) для любых аъ bly f при /=^0. Таким образом, алгебра &г является коммутативным кольцом. В кольце ^г выполняется условие 0=^1, так как 0-1=^=1-1 в поле_аГ. В кольце oFx обратим любой элемент, отличный от 0. В самом деле, если [а, й]=т*=0, то а ^0, [Ь9 a\^Fx и [а, Ь] • [Ь, а] = I. Итак, установлено, что алгебра ^г является полем. Поле eFi содержит подкольцо, изоморфное кольцу <$. В самом деле, рассмотрим множество/Ci = {[a, l]|aei<]. Это множество замкнуто в вГх, так как (9) [а, 1} + [Ь9 \\={а + Ь, 1], —[at 1] = [-я, 1], [а, 1][6, 1] = И, 1], [1, l]e/d для любых [а, 1], [Ь, 1] из /Сх. Следовательно, алгебра e^,1 = (/Ci, +, —, •, 1> есть подкольцо поля eFle Определим отображение hL множества Ki в К следующим образом: hi([a, 1]) = # для каждого а из К. Очевидно, hx есть инъективное отображение множества Кг на К. В силу (9) отображение hL сохраняет главные операции кольца c^i, т. е. h1(a + b) = a + b9 ftx(—а) = —a, h1(ab) = ab9 hL(l) = l. Таким образом, ht есть изоморфизм кольца &?х на кольцо ofC\ Следовательно, поле <УХ содержит подкольцо $%х, изоморфное исходному кольцу <з/?\ Теперь по полю <FX необходимо построить новое поле, изоморфное полю <&\ и содержащее подкольцо е/?\ Для этого заменим в множестве F± каждый элемент [а, 1] элементом а (образом элемента [а, 1] при отображении fti), оставляя все остальные элементы множества Fx неизменными. Положим F = (F1\K1) U К. Обозначим через h следующее отображение множества Ft на F: ihix), если хе=К19 \ х, если x^F±\Кг. Отображение к является инъективным отображением множества Рг на F, продолжающим отображение h±. 442
На множестве F определим операции +, —, • формулами а + р = /1(/1-1(а)+Я-1(Р)), (*) _a = /i(— /r1 (<x)), а-р-Л^-Ча^Л-ЧР)) (а, Pe=F). Отметим, что l=/i(T). Рассмотрим алгебру °F = (F, +, —, •, 1). На основании формул (*) заключаем, что верны формулы /г-1(а + Р) = ^1И+/г-1(Р), /Г1(_ а) = — Л-1 (а) (а, Р^/7), /1-1(аР)=^1И'^"1(Р), Эти формулы показывают, что /г1 есть изоморфизм алгебры eF на поле aFle Следовательно, алгебра <У является полем. При этом &? является подкольцом поля of, так как К cz cFhb силу формул (#) операции +> —, • в of продолжают соответствующие главные операции кольца Ж. В самом деле, для любых а, р из К имеем: а + Р = Л([а, 1] + [Р, l]) = /i([a + p, 1]) = а + Р; -oc = ft(-[a, l]) = /i([-a, 1]) = -а; а-р=М[а, 1]-[Р, l])==/i([ap, 1]) = ар. Каждый элемент х из F можно представить в виде частного элементов кольца &?. В самом деле, если Ьтг(х) = = [а, Ь], где а, Ь^К и ЬфО, то [а, 6] = [а, 1].[1, Ь] и hr\x) = a<(jb)-\ Следовательно, х = h (а • Б*1) = /i (а) • А (6~г) = а • б^1, значит, л: = а • &-1. Итак, установлено, что of —поле, удовлетворяющее условиям: (a) SK есть подкольцо поля <#"; (Р) для всякого х из Т7 существуют в /( такие элементы а, Ь, что # = а- Ь*1. Следовательно, <зГ является полем частных для области целостности &С. ? Изоморфизм полей частных. Покажем, что всякая область целостности имеет единственное поле частных с точностью до изоморфизма. 443
ТЕОРЕМА 2.2. Пусть ЯГ = <ЛС, +, —, •, I)-область целостности. Пусть qF = <F, +> —» •» О И <^ = <Р, ©, ©> 0, 1) —поля частных кольца ЗР. Тогда существует изоморфизм поля оУ на поле й5, переводящий каждый элемент кольца &С в себя. Доказательство. По условию, oF —поле частных, значит выполняются условия: (а) Sff есть подкольцо поля of; (Р) для любого # из F существуют в К такие элементы а, Ь, что х = а-Ь-г. Далее, по условию, ^ — другое поле частных кольца е/2*, значит выполняются условия: (у) &? есть подкольцо поля &\ (б) для любого у из Р существуют в К такие элементы аъ bl9 что у = а± 0 &Г1 • Определим отношение h следующим образом: (1) /г(а-Ь~1) = а© Ь"1 для любых а, Ь из /С. Покажем, что h есть отображение из F в Р. Надо показать, что равенство (1) определяет единственное значение h(x)9 не зависящее от конкретного представления элемента х в виде х = а-Ь-г. В самом деле, если х = = c-d-1(c, d^K) есть любое другое такое представление элемента х, то a-b~1 = c-d-1. Следовательно, в силу (а) a-d = b-c. В силу (у)отсюда следует, что а 0 Ь"г = с © Ъ~1. Поэтому /l(a-&-1) = a0b-1 = c©d-1 = /i(cd-1). Таким образом, установлено, что h является отображением (функцией). В силу (1) и условия (Р) Domh = F. В силу (1) и условия (б) Im/i = P. Следовательно, h является отображением множества F на Р. Непосредственная проверка показывает, что h есть гомоморфизм поля <гГ на поле $\ т. е. для любых х, # из F выполняются условия h(x+y) = h(x)®h(y)> h(—x) = eh(x), h(x-y)h(x)®h(y)9 /г(1^) = 1^ Отображение h инъективно. В самом деле, если для каких-нибудь элементов a-b~l и c-d~l из F (2) /i(a.b~1) = /i(c.d-1), то согласно (1) в поле & выполняется равенство a 0 б*1 = = c0d_1. В силу (б) отсюда следует равенство a-d = &-c. 444
В силу (а) из последнего равенства следует, чта (3) а-Ъ-г = с-&-\ Итак, установлено, что для любых элементов а-Ъ"1 и c-dr1 множества jF из (2) следует (3). Следовательно, h есть инъективное отображение. Кроме того, h есть гомоморфизм. Следовательно, h является изоморфизмом поля еГ на поле 5s. Наконец, в силу (1) h(a)=a для любого а из К, т. е. h переводит каждый элемент кольца Ж в себя. п. Упражнения 1. Пусть е/^—подкол ьцо поля & и К—его основное множество. Пусть с?5 — подполе поля &9 порожденное множеством К* значит, $* есть пересечение всех подполей поля У, содержащих множество К- Докажите, что <^ является полем частных кольца Ж. 2. Пусть Z[?] = {m + m | m, «gZ} и %Щ — подкольцо поля комплексных чисел с основным множеством Z [?]. Пусть (? (i) = — {a+bi\at b <= Q} и (H(i) — подполе поля комплексных чисел с основным множеством Q (i). Покажите, что (g (i) есть поле частных кольца % [i]. 3. Пусть $* и ёР'—поля частных для областей целостности Ж и Ж' соответственно и h—изоморфизм Ж на Ж'. Докажите, что существует единственный изоморфизм поля е?5 на с?5', продолжающий изоморфизм к. 4. Пусть g^ — поле частных области целостности Ж и ср—мономорфизм Ж в поле 3?. Докажите, что ср можно продолжить, и притом единственным образом, до мономорфизма поля $* в поле 3*. § 3. КОЛЬЦА ГЛАВНЫХ ИДЕАЛОВ Простейшие свойства делимости в коммутативном кольце. Пусть Ж — коммутативное кольцо и а, Ъ — его элементы. ОПРЕДЕЛЕНИЕ. Элемент Ь называется делителем ау а элемент а —кратным Ь, если в Ж существует такой элемент с, что а = Ьс. Запись Ъ\а означает, что Ь есть делитель а. Запись а\Ь означает, что а делится на Ь, или а кратно Ь. Элемент с называется общим делителем а и Ь, если с\а и с\Ъ (или а\с и Ь\с). Аналогично определяется общий делитель нескольких элементов кольца. Элементы а и Ъ кольца Ж называются ассоциированными в Ж, если а \ Ь и b \ а. Элемент а называется обратимым в Ж или делителем единицы, если существует в Ж такой элемент 6, что ab= 1; в этом случае пишут Ь = сгг. 445
Делитель единицы делит любой элемент кольца. Если е/2* —поле, то обратим любой его элемент, отличный от нуля. Рассмотрим простейшие свойства делимости в коммутативном кольце. ПРЕДЛОЖЕНИЕ 3.1. Отношение делимости в кольце рефлексивно и транзитивно, т.е. является предпорядком, ПРЕДЛОЖЕНИЕ 3.2. Общий делитель двух или нескольких элементов кольца является делителем суммы и про- изведения этих элементов. ПРЕДЛОЖЕНИЕ 3.3. Если элемент с делит хотя бы один из элементов аъ ..., ап, то он делит произведение этих элементов. ПРЕДЛОЖЕНИЕ 3.4. Отношение ассоциированности в коммутативном кольце является отношением эквивалент- ности. ПРЕДЛОЖЕНИЕ 3.5. Если а ассоциировано с b и Ь\с, то а\с. Доказательство предложений 3.1—3.5 предоставляется читателю. ПРЕДЛОЖЕНИЕ 3.6. В области целостности элементы а и b ассоциированы тогда и только тогда, когда существует такой обратимый в кольце элемент и, что a = ub. Доказательство. Пусть &С — область целостности и а, Ь — элементы, ассоциированные в с/2\ а~&. Если один из элементов a, b равен нулю, то необходимо равен нулю и другой. Тогда а = 1^-Ь. Предположим, что а<-^>Ь и афО, ЬфО. Тогда существуют такие ненулевые элементы и и у, что a = ub и 6 = = ш. Следовательно, a = uva и a(uv— 1) = 0. Поскольку Ж — область целостности и афО, из последнего равенства следует, что uv — 1 = 0 и uv = 1. Таким образом, элемент и обратим в Ж и а = й. Предположим теперь, что а = гЬ, где 8—.обратимый элемент кольца &?\ тогда 6 = 8~1а. Следовательно, а и b ассоциированы в Ж. ? ПРЕДЛОЖЕНИЕ 3.7. Пусть А —множество всех обратимых элементов коммутативногь кольца Ж, &С' = = (К, +, —,•>!}• Тогда алгебра (Л, •, -1}, где ^ — унарная операция, ставящая в соответствие элементу а из А обратный элемент а~\ является группой. Доказательство предложения 3.7 предоставляется читателю. Простые и составные элементы области целостности. Пусть ^-—область целостности. Всякий элемент а кольца 446
делится на любой обратимый элемент кольца (на любой делитель единицы кольца) и на каждый ассоциированный с а элемент кольца. Такие делители называются тривиальными делителями элемента а. ОПРЕДЕЛЕНИЕ. Собственным делителем элемента а называется любой его нетривиальный делитель, т. е. делитель, не ассоциированный с а и необратимый в кольце е/?\ ОПРЕДЕЛЕНИЕ. Элемент области целостности &С называется составным или приводимым в &?, если он отличен от нуля и его можно представить в виде произведения двух необратимых элементов кольца &?. Другими словами, элемент области целостности называется составным, если он отличен от нуля и его можно представить в виде произведения двух собственных делителей. ОПРЕДЕЛЕНИЕ. Элемент области целостности Ж называется простым или неприводимым в Ж, если он отличен от нуля, необратим и имеет только тривиальные делители. Отметим, чго в любом поле нет простых и нет составных элементов. Примеры. 1. В кольце % целых чисел элемент р, отличный от 0 и ± 1, является простым в том и только в том случае, когда его делителями являются только элементы ± 1, ± р. Простыми в кольце % являются числа -+~2 -*~3 -+-5 2. В кольце % элемент 6 составной, так как 6 = 2-3 и 2, 3 — необратимые элемешы. Множество всех элементов области целостности распадается на четыре класса: 1) множество, содержащее один элемент —нуль; 2) множество всех обратимых элементов (множество всех делителей единицы); 3) множество всех простых элементов; 4) множество всех составных элементов. Последние два класса могут быть пустыми (если область целостности — поле). ТЕОРЕМА 3.8. Пусть Ж — область целостности, а, Ь^К и 1 — единица кольца Ж. Тогда: (1) Ь\а тогда и только тогда, когда (а)а(Ь)\ (2) а\\ тогда и только тогда, когда (а) = (1); (3) аг^Ь тогда и только тогда, когда (а) = (Ь); (4) если Ь — собственный делитель а, то (а)5Е(&); 447
(5) (а)ф(b) тогда и только тогда, когда Ь\а и а не делит Ь. Доказательство. (1) Пусть Ь\а, т. е. существует такой элемент с из /С, что а = be; тогда а е (Ь)\ (а) = {та\теЕК} = {mcb\т*=К} cz{lb\l «=#} = (&) и, значит, (а) с= (Ь). Допустим теперь, что (a) cz (6); тогда flG(6) и, значит, a —be для некоторого с из Д", т. е. Ь\а\ (2) если а|1, то (l)cz(a) в силу (1). Кроме того, (a)d(l), поскольку (!) = /(; следовательно, (а) = (1). Если (а) = (1), то а\ 1 в силу (1); (3) если аг^Ь, т. е. а\Ь и Ь|а, то в силу (2) (b)cz(a) и (а) с: (6) и, значит, (а) = (Ь). Если (а) = (6), то а ^(6) и &е(а) и поэтому & | а и а \ Ь, следовательно, а <~^ Ь; (4) пусть b есть собственный делитель а, т. е. &^1, Ь^я и &|а. Тогда в силу (1) и (3) (Ь)Ф(а) и (а)с:(&), значит, (а)^(Ь); (5) если (a)SE(b), то в силу (1) b \a и в силу (3) a-^ b и, значит, fe-fa. Обратное следует из (1) и (3). ? Кольца главных идеалов. В классе областей целостности необходимо выделить и изучить такие кольца, у которых каждый идеал был бы главным. ОПРЕДЕЛЕНИЕ. Кольцом главных идеалов называется область целостности, в которой каждый идеал является главным. Примеры. 1. Любое поле есть кольцо главных идеалов. 2. Кольцо % целых чисел является кольцом главных идеалов. Напомним, что множество (а, Ъ) = {ах + Ьу\х, у ^ /С}, где a, b — фиксированные элементы /С, является идеалом коммутативного кольца Ж. Рассмотрим свойства колец главных идеалов. ПРЕДЛОЖЕНИЕ 3.9. Пусть р — простой элемент кольца off главных идеалов и а^К. Если р не делит а, то (р, а) = (1). Доказательство. По условию, каждый идеал кольца Ж —главный. Следовательно, существует в Ж такой элемент с, что (р, а) = (с). Элемент с делит элементы р и а: (1) с|р, с\а. 448
Так как с —делитель простого элемента р, то с^р или с делит 1. Если с^р, то р\с, и поскольку в силу (1) с\а, то р\а, что противоречит условию. Поэтому с делит 1. Следовательно, (с) = (1) и (р, а) = (1). ? ПРЕДЛОЖЕНИЕ 3.10. Пусть р — простой элемент кольца главных идеалов Ж и a, &Ei(. Если р делит ab, то р делит а или Ь. Доказательство. Если р не делит а, то в силу предложения 3.9 (р, а) = (1). Следовательно, существуют б К такие элементы и, v, что up + va—1. Умножив обе части равенства на Ь, имеем upb + vab = b. Следовательно, если р делит ab, то р делит upb + vab и &. Таким образом, если р^с а, то р|&. ? ПРЕДЛОЖЕНИЕ 3.11. Пусть р — простой элемент кольца &С главных идеалов и а±, ..., ап е /С. Если р делит произведение аха2 ... ал, то р делит хотя бы один из со- множителей ах, ..., ап. Доказательство этого предложения проводится индукцией по п на основании предложения ЗЛО. ОПРЕДЕЛЕНИЕ. Последовательность (%), (а2), (as),... главных идеалов кольца называется возрастающей цепочкой идеалов, если (1) Wcfejc^c,,, Ф Ф Ф ПРЕДЛОЖЕНИЕ 3.12. В кольце главных идеалов возрастающая цепочка идеалов не может быть бесконечной. Доказательство. Пусть (1) —возрастающая цепочка кольца Ж главных идеалов. Обозначим через / объединение всех идеалов цепочки (1), т. е. (2) /=U(a*). Непосредственная проверка показывает, что множество / замкнуто относительно вычитания и устойчиво относительно умножений на элементы кольца $?. Поэтому / есть идеал кольца SfC и притом главный. Следовательно, в К имеется такой элемент с, что 1 = (с). В силу (2) найдется такой индекс т, что ce(affl). Так как cg(aJ и ат<=1 = (с), то I = (ат) = (с). Следовательно, идеал (ат) является последним звеном в цепочке (1). ? Факториальность кольца главных идеалов. Нашей целью является обобщение на кольца главных идеалов теоремы 449
о существовании и единственности разложения элементов кольца целых чисел % на простые множители. ОПРЕДЕЛЕНИЕ. Говорят, что элемент а области целостности &С обладает однозначным разложением на простые множители, если выполняются условия: (1) существуют в Ж такие простые элементы ри что т ? = 1 п (2) если а = П <7* —Другое разложение, в котором qt— i = l простые элементы е/2\ то т = п и при соответствующей нумерации р? ~ qt для I = 1, ..., т. ОПРЕДЕЛЕНИЕ. Кольцо G% называется факториаль- ным, если оно есть область целостности и всякий отличный от нуля необратимый элемент кольца обладает однозначным разложением на простые множители. Отметим, что любое поле есть факториальное кольцо, так как не имеет отличных от нуля необратимых элементов. ТЕОРЕМА 3.13. Кольцо главных идеалов факториально. Доказательство. Пусть &? — кольцо главных идеалов. Нам надо доказать, что всякий отличный от нуля необратимый элемент кольца обладает разложением на простые множители. Допустим, что существует в &? необратимый ненулевой элемент а, который неразложим на простые множители в &?. Тогда элемент а является составным. Следовательно, его можно представить в виде произведения двух собственных делителей а = агЬг и, по пункту (4) теоремы 3.8, (а)с^(а1). Ф По крайней мере один из множителей av bl9 например аъ не обладает разложением на простые множители. Следовательно, aL можно представить в виде произведения двух собственных множителей: а± = аф29 (ах)с:(а2) Ф и т. д. Таким образом, существует бесконечная возрастающая цепочка (a) cz(a1)cz (а2)<=... Ф Ф Ф идеалов кольца &?, "что невозможно в силу предложения 3.12. Следовательно, всякий необратимый отличный от нуля 450
элемент кольца Ж обладает разложением на простые множители. Докажем однозначность разложения на простые множители. Если а —простой элемент, то теорема верна. Предположим, что теорема верна для элементов, предста- вимых в виде произведения п простых множителей, и докажем, что тогда она верна для элементов, представимых в виде произведения п +1 простых множителей. Пусть даны любые два разложения элемента а на простые множители: (1) а = рг... pnPn+i = Яг. • • <7*<7т- Простой элемент /?„+1 делит произведение q±... qs+1. Следовательно, по предложению 3.14, он делит хотя бы один из множителей q±, ..., qs+1, например qs+1. Так как /?Л+1 и qs+i — простые, то qs+1 = upn±1, где и — обратимый элемент кольца. Сокращая обе части равенства (1) на рл+1, имеем Следовательно, по индуктивному предположению, n = s и при соответствующей нумерации pi^qi для t = l, ..., п. Кроме того, ря+1~<7л+1. Индукция проведена полностью. ? Евклидовы кольца. Пусть N —множество всех натуральных чисел, а К — основное множество кольца 9S. ОПРЕДЕЛЕНИЕ. Область целостности X называется евклидовым, кольцом, если существует отображение h множества К в N, удовлетворяющее условиям: (а) для любых а, & из К при ЬфО существуют в К такие элементы q, r, что a = bq + r и h(r)-<h(b); (Р) для любого а из К равенство /z(a) = 0 выполняется тогда и только тогда, когда а = 0. Пример. Пусть Я —такое отображение множества Z целых чисел в N, что /z(a) = |a|. В силу теоремы о делении с остатком (см. теорему 4.4.4) h удовлетворяет условиям (а) и (j3). Следовательно, % есть евклидово кольцо. ТЕОРЕМА 3.14. Евклидово кольцо является кольцом главных идеалов. Доказательство. Пусть Ж —евклидово кольцо и h — отображение множества К в N, удовлетворяющее условиям (а) и (Р). Нулевой идеал, очевидно,— главный. Пусть М —ненулевой идеал кольца GK. Нам надо доказать, что идеал М — главный. Так как М\{0} — непустое множество, то в силу (Р) А(М\{0}) есть непустое подмножество множества N\{0} и, значит, по теореме 4.3.11, /i(M\{0}) 451
имеет наименьший элемент. Следовательно, существует в М такой ненулевой элемент Ь, что (1) h(b)^h(x) для любого х из М\{0}. Докажем, что М = (Ь). Пусть а — произвольный элемент множества М\{0}. В силу условия (а) существуют в К такие элементы q и г, что (2) a = bq + r и h(r)<h(b). Так как М —идеал и a, JeM, тог = а-^?М ив силу (1), (2) имеем (3) г^М\{0}. Следовательно, г = 0 и a = bq. А так как а —произвольный ненулевой элемент множества М, то М а(Ь). Поскольку ^еМ, то М = (6); следовательно, любой идеал евклидова кольца &С является главным. ? СЛЕДСТВИЕ 3.15. Любое евклидово кольцо факториально. СЛЕДСТВИЕ 3.16. Кольцо % целых чисел является кольцом главных идеалов и, значит, факториально. Пример. Пусть Z[l] = {m+nl\m9 neZ}. Множество ЪЩ замкнуто в кольце *? комплексных чисел. Поэтому алгебра % [l] = (Z [/], + , — , •, 1) есть подкольцо кольца ^. Это кольцо называется кольцам целых гауссовых чисел. Покажем, что кольцо % Щ — евклидово. Рассмотрим отображение h множества Z[l] в N такое, что при a = m-\-ni h (a) = | а |2 = /п2+я2. Условие (Р), очевидно, выполняется. Покажем, что для h выполняется условие (а). Пусть а, b e Z [/] и Ъ Ф 0. Тогда а/b = в + т1, где or, т е Q. Существуют такие целые числа s и t, что \s — сг|^у и \t — r\^Y- Положим а = а —5 и $ = x — t. Тогда az=b(s + a + (t+ $)i) = bq + r,meq = s + tLii r = b(a + $i)\ при этом q = s + tieZ[l] и r = a — bq<^Z[L]. Поэтому h(r) = \r\* = \b\*(a? + $*)^\\b\* = ^h{b) и ft (г) </г (&), т. е. /г удовлетворяет также условию (а). Таким образом, кольцо целых гауссовых чисел является евклидовым. Упражнения 1. Пусть К — множество всех рациональных чисел т/п с нечетными знаменателями п и с/? = (/<*, + , — , •, 1) — подкольцо поля (Ц 452
рациональных чисел. Покажите, что $С есть кольцо главных идеалов. 2. Пусть % [i] — кольцо целых гауссовых чисел. Найдите обратимые элементы этого кольца. 3. Докажите, что фактор-кольцо % [i]/(3) кольца целых гауесо- вых чисел по идеалу (3) есть поле из девяти элементов. 4. Докажите, что фактор-кольцо % [i]/(n) кольца целых гауссовых чисел по идеалу (л) является полем тогда и только тогда, когда и — простое число, не равное сумме двух квадратов целых чисел. 5. Пусть К={а + ыУг\а, Ь <= Z} и 58Г=</С» + , —, •, 1> — подкольцо поля комплексных чисел. Покажите, что в кольце &С всякий необратимый элемент, отличный от нуля, разложим на простые множители, но не всегда однозначно. В частности, покажите, что 4 = 2 • 2 = (1 + i УЪ) (1 — i Кз~) — два разложения числа 4 в произведение простых множителей, причем 2 не ассоциировано с 1 ± П^З. 6. Пусть К — множество всех комплексных чисел вида а + ib УъУ где а и b — либо оба целые, либо оба половины нечетных целых чисел. Пусть &? — подкольцо поля комплексных чисел с основным множеством К- Докажите, что кольцо $? является евклидовым. 7. Докажите, что элемент р кольца главных идеалов &С простой тогда и только тогда, когда фактор-кольцо &?1{р) является областью целостности. _ 8. Пусть Z [/2 ] = {т + п\/~2\ т, п е= Z} и % [V^] — подкольцо поля действительных чисел с основным множеством Z [l^2 ], Докажите, что кольцо % [^2 ] является евклидовым. § 4. НАИБОЛЬШИЙ ОБЩИЙ ДЕЛИТЕЛЬ. НАИМЕНЬШЕЕ ОБЩЕЕ КРАТНОЕ Наибольший общий делитель. Пусть ^ — коммутативное кольцо. Элемент с называется общим делителем элементов %,..., ат кольца Я?, если с является делителем (в &?) каждого из этих элементов. ОПРЕДЕЛЕНИЕ. Наибольшим общим делителем элементов аъ...,ат кольца Ж называется такой их общий делитель, который делится на любой общий делитель этих элементов. Наибольший общий делитель элементов ах,..., ап обозначается через НОД (alt ..., ап). Из данного определения непосредственно вытекает следующее предложение. ПРЕДЛОЖЕНИЕ 4.1. Если d наибольший общий делитель элементов %,..., ап в 5?\ то множество всех общих делителей элементов а±, ..., ап совпадает с множеством всех делителей элемента d. ОПРЕДЕЛЕНИЕ. Элементы а и Ь кольца &С называются взаимно простыми, если единица (делитель единицы) кольца &С является их наибольшим общим делителем в Ж. 453
Ниже рассматриваются свойства наибольшего общего делителя в кольце главных идеалов. Предложение 4.2 имеет место в любом коммутативном кольце. ПРЕДЛОЖЕНИЕ 4.2. Любые два наибольших общих делителя элементов alf ..., ап кольца Ж ассоциированы в Ж. Если с есть наибольший общий делитель элементов %,..., ап и с ассоциировано с d, то d также является наибольшим общим делителем этих элементов. Это свойство непосредственно следует из определения наибольшего общего делителя. ПРЕДЛОЖЕНИЕ 4.3. Для любого набора аъ ..., ап элементов кольца главных идеалов SfS существует наибольший общий делитель в &?. Элемент d является наибольшим общим делителем элементов аъ ..., ап тогда и только тогда, когда (аг, ..., an) = (d). Доказательство. Предположим, что (1) (аг, ..., an) = (d), и докажем, что d есть НОД(а15 ..., ап). Из условия (1) следует, что d есть общий делитель элементов аъ ..., ап и (2) d = X1a1-{-... + lnani где %ъ ..., К^К. Кроме того, в силу (2), если с есть общий делитель #i, ..., ап, то с делит d. Следовательно, d есть ИОД^,... ..., ап). Предположим теперь, что d есть НОД(ах, ..., ап), и докажем, что тогда (%, ..., an) = (d). Так как е^* —кольцо главных идеалов, то существует в К такой элемент с, что (а1у ..., ап) = (с). По только что доказанному, с есть НОД(а1? ..., ап). В силу предложения 4.2 отсюда следует, что end ассоциированы и, значит, по теореме 3.8, (с) = = (d). Следовательно, (%, ..., an) = (d). ? ТЕОРЕМА 4.4. Пусть d —общий делитель элементов а±, ..., ап кольца главных идеалов &С. Элемент d есть НОД (#!, ..., ап) тогда и только тогда, когда его можно представить в виде d = Х1а1 +... + hAn, где Х±,..., Кп е К. Доказательство. Пусть d есть НОД^, ..., arj. Тогда, по предложению 4.3, (d) = (a1, ..., ап). Поэтому d можно представить в виде d = 'k1a1+... + 'knani где 7^, ... Предположим теперь, что d можно представить в виде d = 7^a1+...-\-Xnan, %i^K. Тогда любой общий делитель с элементов аХ9 ..., ап делит сумму V*i+«--H~^a/*> т- е. 454
делит d. Следовательно, d есть наибольший общий делитель элементов а19 ..., ап. ? ПРЕДЛОЖЕНИЕ 4.5. Для любых элементов %,..., ап с кольца главных идеалов Фс имеем НОД(сах, ..., сап)~с- НОД (alt..., ап). Доказательство. Пусть d есть НОД^, ..., ап). По теореме 4.4, в К существуют элементы Х±, ..., %п такие, что d = X1a1-\-... + Xnan. Поэтому сй = Я1(ш1) + ... . • -+К (сап). Кроме того, так как d — общий делитель аъ ... ..., ап, то cd есть общий делитель саг, ..., шл. Следовательно, по теореме 4.4, cd является наибольшим общим делителем элементов саъ ..., сап. П ПРЕДЛОЖЕНИЕ 4,6. Если d —наибольший общий делитель элементов а и Ь в кольце главных идеалов SfC и d^O, то элементы a/d и b/d —взаимно простые. Доказательство. По условию, НОД (a, b) = d^0. По теореме 4.4, отсюда следует, что K1a + X2b = d для некоторых 7^, X2^Ki поэтому lk1-^- + X2-j==l. По теореме 4.4, отсюда следует, что 1 есть наибольший общий делитель элементов a/d и b/d, т. е. элементы a/d и b/d — взаимно простые. ? Очевидно, предложение 4.6 можно обобщить следующим образом: если d — наибольший общий делитель элементов аъ ..., ап в кольце главных идеалов &С и d^O, то 1 есть наибольший общий делитель элементов ajd, ..., an/d. ТЕОРЕМА 4.7. Если в кольце главных идеалов а делит be и элементы а, Ь —взаимно простые, то а делит с. Доказательство. По условию, НОД (а, 6) = 1. По теореме 4.4, отсюда следует, что X1a-\-lk2b=l для некоторых Xi, Я2 е К". Умножив обе части равенства на с, получим %1ас + 'кфс=^с. Так как, по условию, а делит be, то а делит ^ас + Хфс и, значит, а делит с. ? Наименьшее общее кратное. Пусть &? — кольцо главных идеалов. Элемент с называется общим кратным элементов аъ ..., ап кольца Ж, если с делится в Ж на каждый из этих элементов. ОПРЕДЕЛЕНИЕ. Наименьшим общим кратным элементов аъ ..., ап кольца &? называется такое их общее кратное, которое делит любое общее кратное этих элементов. Наименьшее общее кратное элементов аг, ..., ап кольца &С обозначается через HOK(tfi, ..., ап). 455
Из данного определения непосредственно вытекает следующее предложение. ПРЕДЛОЖЕНИЕ 4.8. Если т есть наименьшее общее кратное элементов аъ ..., ап кольца &?, то множество всех общих кратных элементов аъ ..., ап совпадает с множеством всех кратных элемента т. Рассмотрим свойства наименьшего общего кратного в кольце главных идеалов &?. Предложение 4.9 имеет место в любом коммутативном кольце. ПРЕДЛОЖЕНИЕ 4.9. Любые два наименьших общих кратных элементов аъ ..., ап кольца &? ассоциированы в &?\ Если т —наименьшее обшре кратное элементов а1у ..., ап и т ассоциировано cm', то т' также является наименьшим общим кратным элементов аъ ..., ап. Это предложение непосредственно следует из определения наименьшего общего кратного. ПРЕДЛОЖЕНИЕ 4.10. Элемент т является наименьшим общим кратным элементов кольца Ж тогда и только тогда, когда (%)flWn...flW = (4 Доказательство. Предположим, что (1) te)n...nfo) = (m). Тогда т является общим кратным элементов а19 ..., ап. Кроме того, если т* есть общее кратное элементов аи ... ..., ап, то т'<=(%), ..., т'е(ая), т. е. /n'G(a1)fl...flW = (/rt) и, значит, т' кратно т. Следовательно, т является наименьшим общим кратным элементов аъ ..., ап. Предположим, что т есть НОК {аъ ..., ап). Поскольку Ж — кольцо главных идеалов, то существует в- К такой элемент тъ что По только что доказанному, тг является наименьшим общим кратным элементов а1у ..., ап. По предложению 4.9, т± ассоциировано с т. Следовательно, (тг) = (т) и (аг) (]... П (ап) = (т). ? СЛЕДСТВИЕ 4.11. Для любого набора аъ ..., ап элементов кольца Ж существует наименьшее общее кратное в Sff. 456
ПРЕДЛОЖЕНИЕ 4.12. Для любых элементов а, Ь, с кольца &? НОК(яс, be) ~ с-НОК (а, 6). Доказательство. Пусть т есть НОК(#, Ь). Надо доказать, что те есть НОК(а<?, be). Это, очевидно, верно при с = 0. Предположим, что сфО. Так как т — общее кратное а и Ь, то тс является общим кратным ас и be. Пусть т'~ любое общее кратное элементов ас и Ьс, т. е. (2) m' = kac, m'=sbc, где &, se/C. Поскольку <%* — область целостности и сфО, из kac = sbc следует ka = sb. Поэтому &а кратно т, т. е. ka = rm, где г^К. Следовательно, в силу (2) т' = гтс и, значит, /л' кратно тс. Таким образом, тс есть НОК (ас, be) и, по предложению 4.9, НОК (ас, bc)r^cm. ? ПРЕДЛОЖЕНИЕ 4.13. Если а и Ь —взаимно простые элементы кольца SfC, то ab является наименьшим общим кратным элементов я, Ь. Доказательство. Пусть т — любое общее кратное а и Ь. Докажем, что т кратно ab. Так как т кратно Ь9 то т = Ьс, где с^К. Поскольку а делит т и, по условию, а и 6— взаимно простые в Ж, то а делит с (см. теорему 4.7). Поэтому аб делит be и, значит, m кратно ab. Следовательно, аб является наименьшим общим кратным элементов а, Ь. ? ПРЕДЛОЖЕНИЕ 4.14. ?Ьш а, Ь —ненулевые элементы nh кольца &С, то НОК (я, 6)^нод ,—гг. Доказательство. Пусть йесть НОД (а, Ь) в 5?. Так как я, 6 —ненулевые элементы, то йфО. По предложению 4.12, (1) НОК(я, &)~?*-НОК(?, -у)- В силу предложения 4.6 НОД f~, у] = 1, т. е. элементы ~ и -^- — взаимно простые. Отсюда, по предложению 4.13, следует, что (2) HOK(i,4) = ^4- На основании (1) и (2) заключаем, что НОК (а, Ь)~~. ? 457
ТЕОРЕМА 4.15. Пусть а = и-рЪ... р%*> 6 = »-р{1... • • • Р^т» г^е Pi' • • • > Р/я — попарно различные неприводимые элементы факториального кольца $f?, а и, v — обратимые элементы кольца. Тогда имеем: (1) НОК(я, &) = Р^ ...р*т» где у, = тах(а,, р,): (2) НОД(а, &) = pfi ...pfr, где 6, = тт(а|, р,). Доказательство формулы (1) аналогично доказательству предложения 11.3.8. Доказательство формулы (2) аналогично доказательству предложения 11.3.1. Упражнения 1. Докажите теорему 4.15. 2. Докажите, что теорема 4.7 и предложение 4.6 верны для любого факториального кольца &С. 3. Покажите, что предложения 4.10 — 4.14 верны для любого факториального кольца Ж. 4. Пусть а, Ь, с—элементы факториального кольца, НОД(а, с) ~ /vl и НОД(6, с)~1. Докажите, что НОД(а6, с) ~ 1. 5. Пусть а, Ь^ с—элементы факториального кольца. Докажитеэ что НОК(а, НОД(6, с))~НОД(НОК(а, Ь)г НОК (а, с)).
Глава четырнадцатая ПОЛИНОМЫ ОТ ОДНОЙ ПЕРЕМЕННОЙ § 1. КОЛЬЦО ПОЛИНОМОВ Простое трансцендентное расширение кольца. Пусть Ж и X — коммутативные кольца с основными множествами К и L соответственно. ОПРЕДЕЛЕНИЕ. Кольцо X называется простым расширением кольца &? с помощью элемента и, если выполняются условия: (1) X — подкольцо кольца X; (2) любой элемент а из L можно представить в виде а = а0+а1и + ...+апип, где а0, а19 ..., ап<=К. Запись Х = &[и] означает, что кольцо X есть простое расширение кольца &С с помощью элемента и. В этом случае основное множество кольца X обозначают также через К [и], L = K[u]. ОПРЕДЕЛЕНИЕ. Кольцо Х = ё%[и] называется простым трансцендентным расширением кольца &С, если выполняется следующее условие: (3) для любых элементов а0, alf ..., ап множества К из равенства сс0+а1и + ...+алц/г==0 следуют равенства а0 = 0, ах = 0, ..., аЛ = 0. Если X = &? [и] — простое расширение кольца &С с помощью и и и удовлетворяет условиям (3), то элемент и называется трансцендентным относительно &С. Если ОК [и] — простое трансцендентное расширение кольца оК с помощью и, то кольцо &С [и] называется также кольцом полиномов от и над &?, а элементы- кольца SfC [и] — полиномами от и над &? или полиномами над &С. ПРЕДЛОЖЕНИЕ 1.1. Пусть Ж [и] —простое трансцендентное расширение кольца &С при помощи и. Тогда для любого элемента а кольца &?\и\, если а = а0-\-ахи-{~... ... + апип и а = а'в + а'1и-\-...+а'пип, где ah а/е/С, то Q>i = cti для ? = 1, ..., п. 459
Доказательство. Если a = ao+axu + ...+anun — ab + a[u + ...+anUn (ah al<=K), то (1) a0— a'0 + (a1 — a[)u+... + (an — arn)un = 0. По условию, элемент и является трансцендентным относительно &С. Поэтому из (1) следуют равенства Я/ — al = 0 и ai = a'i для 1 = 0, 1, ..., п. ? ТЕОРЕМА 1.2. Пусть &С и 36 — коммутативные кольца, ф — изоморфизм S% на 36, а &%[х] и 36 [у] — простые трансцендентные расширения колец &? и 36 соответственно. Тогда &?[х]^36[у], причем существует единственный изоморфизм кольца 8%[х] на кольцо 36 [у], переводящий х в у и продолжающий изоморфизм ф кольца <!К на 36. Доказательство. Обозначим через г|э отображение кольца &?\х\ в кольцо 36\у\ определяемое следующим образом: для любого а = а0+...+атхт из К[х] 1|>(Яо + . • .+атхт) = <р(а0) +.. . + ф (ат) ут. Нетрудно видеть, что ib удовлетворяет условиям: г|)(а0)=? = Ф(#о) для любого а0 из К, ty(x) = y и Imi|) = L[y]. Дроме того, г|) сохраняет главные операции кольца &? [х]. Действительно, если а = а0+...+атхт и Ъ = Ь0+... ... + bnxn(m^n), a, b^K[x], то ^(a + b)^^((a0 + bQ)+... + (am+bm)xm + bm^x^+... ... + b^1xn-1 + bnxn) = = 4>(a0 + b0) + ...+<p(am+bm)ym+ + Ф (bm±i)ym+1 + • • • + Ф (bn-i) Уп'г + <Р (bn) Уп = -(фЫ+...+фЫЛ+(ф№о)+... ...+Ф(Ь|.)|Г) = *(л)++(Ь). Аналогично можно показать, что я|)(-а) = — г|)(а), ф(а6) = ф(а)я|)(6), ^(^Последовательно, г|) есть изоморфизм е/2* [х] на «5? [г/], переводящий х в у и продолжающий изоморфизм ф. Докажем, что существует единственный изоморфизм с указанными свойствами. Допустим, что % —другой изоморфизм кольца оК\х\ на кольцо 36 [у] такой, что $i(a0)— 460
= ф(яо) Для любого а0 из К и ^1(х) = у. Тогда для любого а = а0 + ... + атхт из /C[x] ^(й)=%Ы+...+%Ы%Н=фЫ+ф(^)г/+... ...+фЫГ=1)(а); таким образом, ,ф1 = 'ф. ? СЛЕДСТВИЕ. Пусть Ж[х] и Ж [у]-два простых трансцендентных расширения коммутативного кольца &С. Тогда <№\х\^$%[у\, причем существует единственный изоморфизм кольца &С [х] на кольцо &? [у], переводящий х в у и индуцирующий тождественное отображение на /С Теорема о существовании простого трансцендентного расширения коммутативного кольца. Пусть SfC — ненулевое коммутативное кольцо. Бесконечная последовательность а = (oq, Оц ..., ) элементов из /С, у которой все члены ah кроме конечного их числа, равны нулю, называется псевдобесконечной последовательностью над &. Для всякой псевдобесконечной последовательности а существует такое натуральное число п, что #/ = 0 для всех i^n. Множество всех псевдобесконечных последовательностей над &? обозначим через Lx. На множестве Ьг введем отношение равенства, считая, что (а0, аг, ...) = (&о» Ьъ ...) тогда и только тогда, когда ai = bi для любого натурального числа i. Сумма любых двух элементов а = (а0, аъ ...) и b = = ф0, bl9 ...) определяется равенством Ниже через (а 0 b)i будем обозначать t-ю компоненту суммы а+6. Произведение элемента % из К на элемент а из Ьг определяется формулой Яа = (Яя0, Ыъ ...). В частности, полагаем ©а = (—1)я = (—«о, J-«i, ...)• Сложение в Ьг коммутативно, ассоциативно, обладает нейтральным элементом 0 = (0, 0, ...) и для каждого а из Lx элемент ©а является противоположным, т.е. а© (@а)= = 0. Следовательно, алгебра (Lx, 0, ©> является коммутативной группой. Произведение любых двух элементов а = (Яо, аъ ...) и b = (b0, blf ..,) из Lx определяется формулой (Оо, at, ...)©(60> К .-.) = (со, ^1, ..•)> 461
где ck 2 а& Для любого натурального числа k. Ниже через {aQb)k будем обозначать fe-ю компоненту произведения ab. Таким образом, на множестве Ьг определены две бинарные операции (сложение© и умножение©) и унарная операция ©, ставящая в соответствие каждому а из Ьг противоположный элемент ©а. Всюду ниже 1—единица кольца &С, 1 = 1^г и 1 = (1, 0, 0, ...). ЛЕММА 1.3. Алгебра <5?1 = <L1, ©,©,©, !> является коммутативным кольцом. Доказательство. Выше было установлено, что алгебра (Li, ©, ©> есть абелева группа. Из определения умножения в Ьг непосредственно следует, что оно коммутативно. Умножение в Ьг ассоциативно. В самом деле, для любых а, Ь, с из Ьг (я©(&0с))* = 2 *№-с)9= 2 а,( 2 b&) = = 2 flAft> ((а©6)©с),= 2 И)А= 2 f S «AVi = = 2 aJbkci- Следовательно, a © (b © c) = (a 0 b) 0 с Умножение в Ьг дистрибутивно относительно сложения. В самом деле, дли любых а, &, с из Ьг ((a®b)Qc)i= 2 (a®&)A= 2 (<*fik + bjCk), (а©сфб0с)| = (а0с),©(Ь0с)|= 2 аА + + 2 V*= 2 (flj°k+bjck). Следовательно, (a®fc)©c = a©c®ft©c. Кроме того, 1 является нейтральным элементом относительно умножения в Ьг. Итак, установлено, что алгебра Хх является коммутативным кольцом. ? 462
Положим «о = (1, 0, 0, ...), «1 = (0, 1, О, 0, ...), .... uk = = (0^^, 1, 0, ...)• k нулей Всякий элемент а = (а0, аъ ...) из Lx можно записать в виде а = а0(1, О, О, ...)0%(О, 1, 0, ...)©... ...©МО, ..., о, 1, о, ...)=ад©ед©...©ал, т. е. а = а0«0 © ад ©... © a„«„, где я —такое натуральное число, что at = 0 для всякого i>n. Для любого натурального /г система элементов и0, и19... ..., ип линейно независима над <%*, т. е. для любых элементов Я0, Лх, ..., Ял множества /С из равенства (1) Vo®Mi®...®M* = 0 следуют равенства Я0 = 0, ^ = 0, ..., %п = 0. В самом деле, из (1) следует Mo + Mi+...+M* = (^o> Ai, ..., К, 0, 0, ...) = = (0, 0, 0, ...), поэтому %0 = 0, ^ = 0, ..., Яя = 0. Положим ^ = ^ = (0, 1, 0, 0, ...). Из определения умножения в Lt следует, что х2 = и2, х2 = и2Оиг=и3> ..., хп = ип-1<Эи1 = ип. Следовательно, всякий элемент а из Ll9 для которого at = 0 при любом i>n, можно представить в виде а = а0и0 © агиг ©... © апип = а0и0 © а±х ©... © апхп. ТЕОРЕМА. 1.4. Для каждого ненулевого коммутативного кольца S% = (K, +, —, •, 1) существует простое трансцендентное расширение. Доказательство. Пусть /^ — множество всех псевдобесконечных последовательностей над &С. По лемме 1.3, алгебра ^i=<?i> ®> в, О, 1> 463
является коммутативным кольцом. Множество Ki={a0uQ\aQezK}, где <v*o = K> 0, 0, ...}, замкнуто в кольце Хг и не пусто. Следовательно, алгебра ^1 = <К, 0, 0, 0, 1> является подкольцом кольца <й?1# Отображение hx: К-г+К такое, что h1(a0uQ) = a0 для каждого а0 из К9 очевидно, есть инъективное отображение множества К± на К. Кроме того, hx сохраняет главные операции кольца Sffl9 так как для любых а0> Ь0 из К ftiK"o®W = «o + &o» ^i(0aoMo) = — a0> К(а0и0ОЬ0и0) = а0-Ь0, М10"о)=1 (т. е. МТ)=1яг). Следовательно, ht является изоморфизмом кольца &?г на &С. Таким образом, Хх содержит подкольцо о%ъ изоморфное кольцу &?. Нам надо по кольцу Хг построить новое кольцо, изоморфное Э5Х и содержащее подкольцо &С. Для этого заменим в множестве L± каждый элемент а0и0 из Кг элементом а0 из К (т. е. заменим а0и0 элементом /ii(a0«0)), оставляя все остальные элементы множества Lx неизменными. Положим L = (L1\K1)UK и определим отображение h: Lx-+L следующим образом: г , ч ( Ma), если а^Ки h(a)=\ [а, если a^L1\K1. Нетрудно видеть, что h является инъективным отображением множества L± на L, продолжающим отображение h±, т. е. ftxc:/i. На множестве L определим операции +,—,., 1 формулами a + p = /i(/i-1(a)e/i-1(P)) (a, p<=L); т — a = /i(0/i-1(cx)); {Ч а.р=Л(Л-1(а)©Л-1(Р)); 1=A(T)=1«T. 464
Рассмотрим алгебру cS? = <L, -f-> —, •, 1>. Из формул (I) следуют формулы ^(a + P) = fr*(a)0/r4P); {П) /i"1(a.p) = /i-1(a)©ft-1(P); ft-l(l) = I Формулы (II) показывают, что Ъг1 есть изоморфизм алгебры X на кольцо Хх, Отсюда следует, что алгебра X является коммутативным кольцом, изоморфным кольцу %г. Главные операции в кольце X являются продолжениями соответствующих операций в кольце &?. В самом деле, в силу (I) для любых а и (5 из К имеем: a + p = /i(/i-1(a)e^1(P)) = AK0P"o) = = h(au0) + h($u0) = h1(au0)+h1($u0)==a + $; — a = h (Q hr1 (a)) = h(Q au0) = — h (au0) = = — hL(au0) = — a; a.p = ft(ft-1(a)0/i-1(P)) = ft(aao0P"o) = = h (au0) • h (p«0) = h± (au0) • hx фи0) = a(J. Следовательно, S% является подкольцом кольца «5?. Любой элемент из X можно представить в виде линейной комбинации элементов 1, х, х2, ... с коэффициентами из К, так как h(а0и0©...0 апип) = а0+а1и1 + ... + апип = = аь + а1х-\-...-\-апхп (я/Ge/Q. Следовательно, ? = 3%[х]. Элемент х является трансцендентным относительно X. В самом деле, равенство ао + а1х + ... + апхп = 0 влечет равенство h-1(aQ+a1x+ ,..+^л) = аоиофа1%0...0ал = О. Поскольку элементы н0, ..., ип линейно независимы над с/2*!, отсюда следует, что я0 = 0, % = 0, ..., ал = 0. Следовательно, х есть трансцендентный элемент относительно &С и кольцо ?=:$%[х] является трансцендентным расширением кольца &С с помощью х. П Степень полинома. Пусть SfC — ненулевое коммутативное кольцо и &С [х] — кольцо полиномов от х, т. е. простое 465
трансцендентное расширение &С с помощью х. Любой ненулевой элемент а из К[х] можно единственным образом представить в виде линейной комбинации степеней х с коэффициентами из К. ОПРЕДЕЛЕНИЕ. Пусть а-полином из К[х]. Натуральное число п называется степенью полинома а, если а = а0+а1х+...+апхп, где апФ0. При этом а0, аъ ..., ап называются коэффициентами полинома, элемент ап — старшим коэффициентом. Полином а называется нормированным, если его старший коэффициент равен единице кольца $Г. Обозначать степень полинома а будем через deg а. Таким образом, степень определена для всех полиномов, кроме нулевого; степень нулевого полинома не определяется. Степень полинома а0, где а0 —ненулевой элемент кольца &С, равна нулю. Отметим некоторые свойства степени полинома. ПРЕДЛОЖЕНИЕ 1.5. Степень суммы двух ненулевых полиномов не больше максимальной степени слагаемых, т. е. deg (а+6)^ max (deg a, deg&). ПРЕДЛОЖЕНИЕ 1.6. Степень произведения двух ненулевых полиномов не больше суммы степеней сомножителей, т. е. при аЬфО deg(afc)<;dega+degb. Доказательство предложений 1.5 и 1.6 предоставляется читателю. ПРЕДЛОЖЕНИЕ 1.7. Если S% — область целостности, то степень произведения двух ненулевых полиномов равна сумме степеней сомножителей, т. е. deg (ab) = deg a+deg b. Доказательство. Пусть а = а0+...+атхт, fe = = b0+...+bnxn — полиномы над областью целостности ofC и атфО, ЬпфО. Тогда ab = a0b0+(a0b1+a1b0)x+... ... + ambnxm+n. Так как &? — область целостности, то атЬп ф 0. Следовательно, deg (ab) = m+n = deg a+deg 6. ? ТЕОРЕМА 1.8. Если &? —область целостности, то кольцо полиномов &С\х\ также является областью целостности. Эта теорема непосредственно следует из предложения 1.7. Из теорем 1.8 и 13.2.1 вытекает следующее следствие. СЛЕДСТВИЕ 1.9. Для кольца полиномов SfC\x\ над областью целостности &С существует поле частных. Деление полинома на двучлен и корни полинома. Пусть &? [х] — кольцо полиномов от х над ненулевым коммутативным кольцом &С. Если f = a0+a1x+...+anxn^ <=#[#] и с0^К, то сумму Оо+^0+...+алс« будем 466
обозначать через / (с0) и называть значением полинома для аргумента cQ. ТЕОРЕМА 1.10 (Безу). Пусть f —полином над кольцом 3% и с0^К. В кольце &? [х\ существует такой полином q, что f = (x — c0)q + a{c0). Доказательство. Теорема верна, если f —нулевой полином; в этом случае f(cQ) = Q и можно положить q = 0. Пусть / = я0 + яЛ + --- + Ял#Л-- ненулевой полином, тогда !-!(с0) = а1(х-с0) + а2(х2-с1)+... + ап(хп-с%)== = (х-с0)[а1 + а2(* + с0) + ... + а^^^ следовательно, f = (x — cQ)q-\-f(cQ), где q = a1 + a2(x + c0)+... + an(x»-1+... + c«-l)e=K[x]. ? Часто теорему Безу формулируют следующим образом: остаток от деления полинома f из К[х], где S& —коммутативное кольцо, на двучлен (х — с0), (с0^К), равен f(cQ). Пусть f — полином над кольцом &С и с0 е К- ОПРЕДЕЛЕНИЕ. Элемент с0 кольца &С называется корнем полинома f над кольцом &?> если /(с0)=0. ТЕОРЕМА 1.11. Пусть f —полином над кольцом &? и с0 е К- Элемент с0 является корнем полинома f тогда и только тогда, когда х — с0 делит полином f в кольце SfC [x]. Доказательство. Пусть с0 — корень полинома f, f(c0) = Q. По теореме Безу, f = (x — cQ)q, где q<=K[x]. Следовательно, х — с0 делит полином f в 3%[х]. Предположим теперь, что х — с0 делит полином f в &С\х\, т. е. f = (x — cQ)g, где g<=K[x]. Тогда f(c0) = = (c0-c0)g(c0) = 0. П Теорема о наибольшем возможном числе корней полинома в области целостности. Пусть &С [х] — кольцо полиномов над кольцом Ж. ТЕОРЕМА 1.12. Пусть Ж — область целостности. Любой полином из К[х] степени п имеет не более п различных корней в Ж. Доказательство проводится индукцией по п. Если deg/ = 0, т. е. f = a0, где а0^К и а0ф0, то полином / имеет нуль корней. Предположим, что любой полином из К[х] степени п имеет не более п корней. Пусть f^ ^К[х~] и deg/ = ft+l. Если / не имеет корней в <%*, то теорема верна. Если же f имеет корни в 5&, то f(c0) = 0 для некоторого элемента с0 из /С. По теореме Безу, f = = (х — cQ)g, meg^K[х]\ при этом, поскольку &? — область 467
целостности, в силу предложения 1.7 степень полинома g равна п. Элемент Ь0 кольца &С, отличный от с0, есть корень полинома f тогда и только тогда, когда f(b0) = = (Ь0 — cQ)g(b0) = Q, т. е. когда g(bo) = 0, поскольку 8% — область целостности. Так как степень g равна п, то, по индуктивному предположению, g имеет не более п различных корней в &?. Следовательно, полином f степени я + 1 имеет в Ж" не более п+l различных корней. ? СЛЕДСТВИЕ 1.13. Если полином f = а0+-. .+апхпе=К [х] имеет в области целостности ofC более чем п различных корней, то f является нулевым полиномом. Алгебраическое и функциональное равенства полиномов. Пусть &С [х] — кольцо полиномов над областью целостности &? и f = aQ+axx+...+апхп е К [х]. Обозначим через /* функцию {<Я, ao + cbk+... + ante)\b€zK}9 ставящую в соответствие каждому X из К элемент f(X) = a0 + a1X+... + anXrii т. е. значение полинома f для аргумента X. Для некоторых колец ofC различные полиномы могут определять одну и ту же функцию. Так, например, если 22 = 2/22 и Ш2[х] — кольцо полиномов над полем 22, то полиномы х+х2, х — х2 и 0 определяют одну и ту же функцию. ТЕОРЕМА 1.14. Пусть &?\х\ —кольцо полиномов над бесконечной областью целостности &С. Полиномы fug из К[х] равны тогда и только тогда, когда равны определяемые ими функции f* и g*. Доказательство. Пусть / и g — полиномы из К[х] и f*, g* — определяемые ими функции. Предположим, что / = g". Если f и g —нулевые полиномы, то f* = g*. Предположим, что / и g — ненулевые полиномы степени п: / = а0+ %*+...+ алл;л, g(x) = b0 + bix+...+bnxn. Поскольку f = g, то (1) а0 = Ь0, ..., ап = Ьп. Для любого X из К имеем: f*(b) = ao + (h%+... + anKn, g*(X) = b0 + b1X+... + bnX». Следовательно, в силу (1) /*=g*. Предположим теперь, что f* = g*, т. е. для любого X из К f(X) = a0 + alX + ... + anX" = g(X) = b0 + b1X+... + bnX». 468
Тогда для полинома h = f — g выполняется условие (2) h(k) = 0 для всякого Я из К. Так как множество К бесконечно, то (2) означает, что полином h имеет бесконечное множество различных корней. По следствию 1.13, h — нулевой полином, т. е. /— —g = 0 и f = g. Таким образом, из f*=g* следует f = g. П Упражнения 1. Докажите предложения 1.5 и 1.6. 2. Пусть ^[х] — кольцо полиномов над полем & и / — непустое множество из F [х], замкнутое относительно вычитания и удовлетворяющее условиям: если /е/, то*-/е/иЯ/е/ для любого К из F. Докажите, что множество / является идеалом кольца & [х]. 3. Найдите все автоморфизмы кольца полиномов % [х]. 4. Найдите все автоморфизмы кольца полиномов $ [х]. 5. Найдите все автоморфизмы кольца полиномов & [х]. 6. Найдите все автоморфизмы кольца полиномов ^ [я] над полем ^ комплексных чисел. 7. Пусть % [х] — кольцо полиномов над кольцом % целых чисел. Покажите, что множество всех полиномов из Z [х] с четными свободными членами есть идеал кольца % [х], не являющийся главным идеалом, § 2. ПОЛИНОМЫ НАД ПОЛЕМ Теорема о делении с остатком. Пусть У [х] — кольцо полиномов над полем У и F [х] — его основное множество. ТЕОРЕМА 2.1. Пусть h —ненулевой полином из F[x]. Для каждого полинома f из F[x] существует в F[x] единственная пара полиномов q и г таких, что (1) f = h-q-\-r и degr<degft или г = 0. Доказательство. Сначала докажем индукцией по степени п полинома f существование полиномов q и г, удовлетворяющих условиям (1). Пусть deg/i = m, h = b0+... + bmxm (ЬафО). Отметим, что если f — нулевой полином или deg/<m, то f = h-0+f и, значит, можно положить q = 0 и r = f. Поэтому нам остается рассмотреть случай, когда degf^m. Допустим, что теорема верна для любого полинома f степени меньшей, чем п. Пусть degf = n^m. В этом случае полиномы / и anb~^lxn-mh имеют одинаковые старшие коэффициенты. Следовательно, полином (2) g^f-a^x^-h 469
либо нулевой степени, либо его степень меньше п. Если g = 0, то / = аЛЬ^1л:/?~т/1 + 0 и можно положить q — aj)^ хп~т иг = 0. Если же degg</z, то, по индуктивному предположению, в F[x] существуют полиномы q и г такие, что (3) g — hq + r и degr<degft, или г = 0. В силу (2) и (3) f = h(q+апЬ^11хп-т) + г, или если положить q — q + anb'^Llxn'm, (4) fz=h-q-±-r и г = 0 или degr<degft. Докажем, что для заданных полиномов f и h «неполное частное» q и «остаток» г в (4) определяются однозначно. В самом деле, предположим, что (5) f = ft?i+/i и /i = 0 или deg/i<deg/i (rl9 <7i€=F|>:]). Тогда в силу (4) и (5) имеем (6) rx — r = h(q — ft), /i — r = 0 или deg(rx —r)<degft. Если Гц — r=^=0, то 9~9i=t^=0 и deg (rx - r) = deg h + deg (? - qx) ^ deg ft, что противоречит условиям (6). Если же rx — r = 0, то q — q1 = Q и, следовательно, q = qx. П СЛЕДСТВИЕ 2.2. Если OF — поле, то кольцо полиномов F[x] является евклидовым кольцом. СЛЕДСТВИЕ 2.3. Кольцо полиномов У [х] над полем OF является кольцом главных идеалов. СЛЕДСТВИЕ 2.4. Если OF — поле, то кольцо полиномов ^[х] факщориально. Алгоритм Евклида. Пусть ^ — коммутативное кольцо. ЛЕММА 2.5. Пусть в коммутативном кольце &? для элементов a, b, q и г выполняется равенство (1) a = bq + r; тогда (2) НОД(а, Ь)~НОД(6, г). Доказательство. Пусть й = НОД(а, 6), d' = = НОД(&, г). Так как d\af d\b9 то ввиду (1) d\r. Поскольку d есть общий делитель Ь и г, то d \ d'. Аналогично убеждаемся, что d'\d. Следовательно, dr^d!. ? Для нахождения НОД двух элементов кольца полиномов F[x] (или любого евклидова кольца) применяют спо- 470
соб «последовательного деления», называемый алгоритмом Евклида. Смысл этого способа состоит в сведении вычисления НОД данных полиномов а, Ь из F[x] к вычислению НОД полиномов Ь и г с меньшими степенями. Предположим, что ни один из полиномов а, Ь не делится (в ^[х]) на другой, и положим Ь = ЬХ] тогда я = &i<7i + b2; deg bt > deg 62, 61 = M2 + &з> deg b2 > deg 68. Продолжаем этот процесс до тех пор, пока не получим при делении нулевой остаток: bk-2 = &ft-ift-i+bk> deg &*_! > deg bk9 bk-i = bkqk + 0. Этот процесс последовательного деления называется алгоритмом Евклида. Отметим, что последовательность degbl9 deg&2, ... есть убывающая последовательность натуральных чисел. Поэтому она обрывается через конечное число шагов. Предположим, что ЬкфО и bk+1 = 0; тогда deg &! > deg b2 > deg b3 >... > deg Ьк-г > deg bk. На основании леммы 2.5 из выписанных выше равенств следует: НОД (а, бО^НОД^, &2)~...~НОД(6*-1, bk)~ ~НОД(&Л, 0) = bk. Таким образом, НОД (a, b)~bk и bk есть НОД (а, 6). Мы пришли к следующему выводу. Если к полиномам а и b кольца qF[x] применить алгоритм Евклида, то получающийся при этом последний ненулевой остаток есть НОД полиномов а и Ь. СЛЕДСТВИЕ 2.6. Пусть еГ — подполе поля S5, eF[x] и $Р [х] — кольца полиномов соответственно над oF и над е7\ Пусть а и b — не равные одновременно нулю полиномы из oF[x]. Если d и d'— нормированные наибольшие общие делители полиномов а и Ъ соответственно в оГ [х] и в* [х], то d = d'. Неприводимые над данным полем полиномы. Пусть еГ [х] — кольцо полиномов над полем <У. В кольце gF[x] обратимы только полиномы нулевой степени (делители единицы поля еГ), т. е. ненулевые элементы поля «Г. Следо- 471
вательно, любой полином положительной степени из F[x] необратим в кольце eF[x]. Полином из F [х] является приводимым, или составным, в кольце oF[x] или приводимым над полем eF, если его можно представить в виде произведения двух полиномов положительной степени из F[x]. Другими словами, полином приводим в eF [x], если он имеет положительную степень и обладает нетривиальными делителями. Полином из F[x] является неприводимым, или простым, в кольце оТ\х\ или неприводимым над полем У, если он имеет положительную степень и обладает только тривиальными делителями, т. е. любой делитель полинома либо ассоциирован с ним, либо ассоциирован с единицей. Другими словами, полином а неприводим в кольце оГ[х], если он имеет положительную степень и в любом разложении вида a —be, где Ъ, ceF[4 один из множителей (Ь или с) ассоциирован с единицей поля, а другой—ассоциирован с а. Примеры. 1. Если <3F — поле, то в кольце полиномов off*] неприводим любой полином первой степени. 2. В кольце полиномов <М\х\, где е^ —поле действительных чисел, полином второй степени неприводим тогда и только тогда, когда он не имеет действительных корней. ПРЕДЛОЖЕНИЕ 2.7. Пусть р — неприводимый и а — любой полином кольца qF[x]. Тогда либо р делит а, либо р и а —взаимно простые. Доказательство. Мы предполагаем, что of —поле. По следствию 2.3, F[x] является кольцом главных идеалов. Следовательно, в силу 13.3.9 если р не делит а, то (р, а) = (1). Поэтому ^+^20=1 для некоторых 7^, 7^ из F. Следовательно, по теореме 13.4.4, наибольший общий делитель р и а равен 1, т. е. полиномы р и а —взаимно простые. ? ПРЕДЛОЖЕНИЕ 2.8. Пусть р —полином, неприводимый в кольце qF[x], и аг, ..., айе?[4 Если р делит произведение аг, а2 ... ап, то р делит хотя бы один из полиномов аг, а2, ..., ап. Это предложение непосредственно вытекает из следствия 2.3 и предложения 13.3.11. ТЕОРЕМА 2.9. Пусть <М\х\ — кольцо полиномов над полем <М действительных чисел. Фактор-кольцо е%![х]/(х2+1) изоморфно полю комплексных чисел. 472
Доказательство. Пусть С —основное множество поля ^ комплексных чисел. Пусть /х —отображение множества R[x] в С такое, что М/)=/(0 для любого / из R[#]. Непосредственная проверка показывает, что h является эпиморфизмом кольца <М\х\ на поле ^ комплексных чисел с ядром (х2+1), т. е. Ker/i = (*2+l). Следовательно, по теореме 13.1.6 о кольцевых эпиморфизмах получаем ТЕОРЕМА 2.10. Пусть of [#] — кольцо полиномов над полем У и р—полином, неприводимый в &[х]. Тогда фактор-кольцо &[х]/(р) является полем. Доказательство этой теоремы предоставляется читателю. Разложение полинома в произведение нормированных неприводимых множителей. Пусть 5^ —поле, а ^[х] — кольцо полиномов над eF. ТЕОРЕМА 2.11. Любой полином положительной степени из F[x] можно единственным образом представить в виде произведения элемента поля <У и нормированных неприводимых в кольце aF [х] полиномов. Доказательство. Пусть а — полином положительной степени из F[x]. Так как кольцо о^[х] факториально, то полином а можно представить в виде произведения а = = #1 ..¦ qs полиномов ql9 ..., qs, неприводимых в кольце ^[х]. Пусть Ид,—-старший коэффициент полинома qk9 uk^F. Тогда qk = ukpk, где pk — нормированный полином, неприводимый в JF [х]. Следовательно, (1) а = ир± ... ps, где и = их ... us^F. Докажем единственность разложения. Пусть (2) a = vpt ... pf, dgF, — произвольное разложение, в котором р*, ..., р? — нормированные полиномы, неприводимые в кольце of [x]. Так как кольцо &[х] факториально, то: 1) u=-v, поскольку и, v — старшие коэффициенты одного и того же полинома а; 2) при соответствующей нумерации полиномы pt и р* ассоциированы. Поскольку р/, pf —нормированные полиномы, то из их ассоциированности следует, что pi = pt для t = l,..., s. ? 473
Пусть а е F [х] и (1) а = ирг ... pS9 где u^F, — разложение полинома а в произведение нормированных неприводимых в <^[х] множителей. Пусть ръ ..., р^ —все различные нормированные неприводимые множители полинома а и ах, ..., аЛ —кратности их вхождения в разложение (1). Тогда имеет место разложение (I)a = iq#...pJ* (u<=F). ОПРЕДЕЛЕНИЕ. Разложение (I) называется каноническим разложением полинома а из 3[х] на неприводимые над 3 (нормированные) множители. Упражнения 1. Укажите, при каком значении % полиномы я3—2А,#+А,3 и х*+№—2 имеют общий корень в поле комплексных чисел. 2. Найдите наибольший общий делитель полиномов я3—1 и я* + -}-л;3+2*2-|-#+1 и его линейное представление через эти полиномы. 3. Найдите наибольший общий делитель и наименьшее общее кратное полиномов х*—4л:3+1 ид:3—3*2+1. 4. Найдите наименьшее общее кратное полиномов я33—1 и х>*—1. 5. Пусть 3[х]—кольцо полиномов над полем 3 и а, Ь, с—полиномы из F [х]. Найдите в F [х] наименьший, идеал, содержащий все эти полиномы. 6. Пусть 3[х]—кольцо полиномов над полем 3. Докажите, что множество всех общих кратных двух данных полиномов / и g из F [х] является идеалом кольца 3[х]. 7. Пусть х0 и у0—полиномы из F[x], удовлетворяющие равенству ах0+Ьуо=с, где а, 6, cef [л-]. Найдите в F [х] множество всех решений уравнения ах + by—с. 8. Докажите, что если полином h взаимно простой с полиномами / и g, то h взаимно простой с / • g. 9. Докажите неприводимость над полем (? полинома х±—2х+3. 10. Пусть р—полином из F[x] такой, что любой другой полином из F [х] либо взаимно простой с р, либо делится на р. Докажите, что полином р неприводим над полем 3. 11. Пусть 3[х] —кольцо полиномов над числовым полем 3- Пусть с—степень неприводимого над 3 полинома, a, b e F [х] и с делит ab. Докажите, что с делит а или с делит bh для некоторого натурального k. 12. Пусть /:=р11р22 ... pfeft—каноническое разложение полинома / над полем 3» Сколько нормированных делителей с коэффициентами из F имеет полином /? 13. Пусть 3 [х]—кольцо полиномов над числовым полем 3, р —неприводимый над 3 полином и / — идеал, порожденный полиномом р, Докажите, что фактор-кольцо 3 [х]/1 является полем. 474
§ 3. ФАКТОРИАЛЬНОСТЬ КОЛЬЦА ПОЛИНОМОВ НАД ФАКТОРИАЛЬНЫМ КОЛЬЦОМ Примитивные полиномы. Всюду ниже используются следующие обозначения: &С — факториальное кольцо, еГ — поле частных кольца &С\ &С [х] — кольцо полиномов от х над &?\ У [х] — кольцо полиномов от х над &. ОПРЕДЕЛЕНИЕ. Пусть f = а0 + ахх + ... + Ял*л — произвольный ненулевой полином из К[х]. Наибольший общий делитель коэффициентов а0, аъ ..., ап в кольце ЯГ называется содержанием полинома f. ОПРЕДЕЛЕНИЕ. Полином f, содержание которого есть единица или делитель единицы (в Ж), называется примитивным в кольце &?\х\. Содержание полинома f в &С\х\ определяется однозначно с точностью до множителей, являющихся делителями единицы. Другими словами, любые два содержания полинома f ассоциированы в &С. ПРЕДЛОЖЕНИЕ 3.1. Если d — содержание ненулевого полинома из К[х], то f = dg, где g — примитивный в 3%[х] полином. Доказательство. В самом деле, если в правой части равенства f = a0-\-aLx-\-.. .+апхпвынести d за скобки, то получим равенство f = d(~- + ^х+...+~-хп) = dg, причем в силу предложения 13.4.6 единица есть наибольший общий делитель коэффициентов —-, -—, ..., ~р полинома g. Следовательно, g — примитивный в &[х] полином. ? Отметим, что всякий неприводимый над кольцом &? полином положительной степени примитивен в &?\х\. Действительно, если / не примитивен, то, по предложению 3.1, f=dg, где g — примитивный в &%[х] полином положительной степени, a d — содержание f. Поскольку f не примитивен, то d не является делителем единицы вЖи, значит, d и g — необратимые элементы &%[х]. Следовательно, f приводим в Ж\х\. Таким образом, всякий непримитивный полином положительной степени приводим в Ж\х\, а, значит, всякий неприводимый в Ж\х\ полином положительной степени примитивен в Sff[x]. Заметим также, что примитивный в Ж [х] полином приводим над &С тогда и только тогда, когда его можно представить в виде произведения полиномов положительной степени (причем примитивных). Для произвольного непри- 475
митивного полинома f это неверно, так как возможно, что f = dg, где d — содержание f и degd = 0, a g —примитивный неприводимый полином. ЛЕММА 3.2. Пусть f, h — примитивные в &?\х\ полиномы и (1) cf = dh, где с, deK\{0}. Тогда d ассоциирован с с в &? и f ассоциирован с he &С\х\. Доказательство. Пусть f = a0+...+anxny h = b0+...+bmxm (апфО, ЬтфО); тогда cf=ca0+...+canxn, dh = dbQ+...+dbmxm. В силу (1) п = т и (2) ca0=dbQf ..., can = dbn. Поскольку 1 есть наибольший общий делитель коэффициентов а0, ..., ап, то в силу предложения 13.4.5 с —наибольший общий делитель коэффициентов ш0, ..., сап. Аналогично, на основании примитивности h и равенств (2) заключаем, что d — наибольший общий делитель коэффициентов ш0, ..., сап. Следовательно, end ассоциированы вЖи поэтому d = ее, где 8 — обратимый элемент кольца &С. Разделив обе часги равенства (1) на с, получим / = eft, т. е. f и h ассоциированы в &?[х\. ? ЛЕММА 3.3. Пусть f и h —примитивные в &С\х\ полиномы. Если полиномы f и h ассоциированы в oF [x]9 то они ассоциированы также в &С\х\. Доказательство. Пусть f и h ассоциированы в ^[х]. Тогда f = ah, где а— некоторый ненулевой элемент поля of. Поскольку oF — поле частных кольца Ж, элемент ос можно представить в виде a = dc1, где d, cgK\{0}. Таким образом, f = dc~Vi и cf — dh. По лемме 3.2, отсюда следует, что полиномы f и g ассоциированы в кольце Ж\х\ ? ЛЕММА 3.4 (Гаусса). Произведение примитивных в Ж [х] полиномов является примитивным в $% [х] полиномом. Доказательство. Пусгь / и g — произвольные примитивные в &С\х\ полиномы: f = a0 + a1x+... + amxm (ате=К\{0}), g = b0 + b1x+...+bnx" (6ле/С\{0}); тогда fg = c0 + c1x+...+cm+nxm+n (ст+п = атЬпфО). 476
Покажем, что полином fg примитивен в кольце &С\х\. Предположим, что р — любой простой элемент кольца йГ, и докажем, что хотя бы один коэффициент полинома fg не делится на р. В самом деле, в силу примитивности полинома / существует коэффициент аГ9 не делящийся на р и имеющий наименьший индекс. Аналогично, существует ^ — коэффициент полинома g, не делящийся на р и имеющий наименьший индекс. Коэффициент cr+s полинома fg можно представить в виде суммы: (1) cr+s = а А + (0г+А-1 + • • •+flr-Аи+•..)• Первое слагаемое этой суммы не делится на р, а второе—делится на р или отсутствует. Таким образом, cr+s не делится на р. Поэтому содержание полинома fg* равно 1, т. е. полином fg является примитивным в &С\х\. ? ЛЕММА 3.5. Пусть f —полином в Ж[х]. Если полином f приводим в <Р[х], то он приводим также в S?[x]. Доказательство. Пусть полином f приводим в У[х\, т. е. (1) f=gh, где g и ft —полиномы положительной степени из F[x\. Допустим, что f неприводим в SfC\x\ и, следовательно, примитивен в Ж\х\. Пусть g = aQ + a1x+... + anxn. Поскольку of — поле частных кольца Ж, то каждый коэффициент щ можно представить в виде ai = arbTi, где аь bt^K (i = 0, ..., п). Положим Ь = Ь0 • &х ... Ьп\ тогда bg^K[x] и в силу предложения 3.1 (2) bg = cgx (b, сс=К\{0}), где gi —примитивный в <Х\х[ полином положительной степени, а с —содержание полинома g. Аналогично убеждаемся в том, что существуют элементы due такие, что (3) dh = eh± (d, eeEK\{0}), где /^ — примитивный в &С\х\ полином положительной степени. В силу (1), (2) и (3) имеем (4) (bd) f = (се) gA (bd, се е= К\{0})9 477-
причем, по лемме Гаусса, полином g-Ji-^ примитивен в Ж [х]. По лемме 3.2, из (4) следует, что полиномы f и gji^ ассоциированы в Ж[х]. Следовательно, f = eg±hl9 где г — элемент, обратимый в К, и gl9 h± — полиномы положительной степени из К[х], что противоречит нашему допущению. Таким образом, полином f приводим в Ж [х]. П СЛЕДСТВИЕ 3.6. Если полином положительной степени неприводим в кольце Ж [x], то он неприводим также в кольце gF[x]. Факториальность кольца полиномов. Докажем основную теорему этого параграфа. ТЕОРЕМА 3.7. Если кольцо Ж факториально, то и кольцо полиномов Ж\х\ факториально. Доказательство. ПустьЖ — факториальноекольцо. Докажем, что любой отличный от нуля необратимый элемент кольца Ж[х] однозначно с точностью до порядка сомножителей и обратимых множителей разложим в произведение простых множителей вЖ[х]. Сначала докажем возможность разложения на простые множители. Пусть f — произвольный ненулевой полином из К[х]. Если / — полином нулевой степени, то f^K- Поскольку кольцо Ж факториально, полином f можно представить в виде произведения простых множителей в Ж и, значит, в Ж[х]. Предположим, что degf = n>0, и всякий полином, степень которого меньше п, разложим в произведение простых множителей. Пусть (l)f = dg(x)9 где d^K, g(*) — полином положительной степени, примитивный в Ж[х]. Если полином g неприводим над Ж, то, разлагая в (1) множитель d на простые множители, получим разложение f на простые множители. Если же полином g(x) приводим в Ж[х], то его можно представить в виде произведения двух полиномов положительной степени, меньшей, чем п: g(x) = h(x)q>(x). По индуктивному предположению, h(x) и ср(л;) можно представить в виде произведения простых множителей в Ж[х]. Следовательно, g, а в силу (1) и f также можно представить в виде произведения простых множителей. Докажем единственность разложения. Пусть даны любые два разложения / на простые множители в Ж[х]: (2) f=p1...pkq1...qs = pi...prq'i...q't, 478
где ph p'i^K, и qh ^' — неприводимые, а значит, и примитивные полиномы положительной степени. По леммам 3.2 и 3.4, из (2) следует, что (3) p1...pk~p'i-*.p'r в &?\ (4) qt...qs~q[...qi в Sft\x\ Поскольку кольцо $К факториально, то из (3) следует, что k = r и при соответствующей нумерации (5) Pt^p'i в ?% для t = l, ..., k. Далее, по следствию 3.6, полиномы qt и q[ неприводимы в кольце ef [х]. В силу факториальности кольца of [х] из (4) следует, что s = t и при соответствующей нумерации qt~q'i в <^[х] для t = l, ..., s. Полиномы # и ql неприводимы в Ж\х\ и, значит, примитивны в &? \х\ кроме того, эти полиномы ассоциированы в cF[x]. Следовательно, по лемме 3.3, они ассоциированы в &?\х\ (6) qi^q't в Ж\х\ при 1 = 1, ..., s. В силу (5) и (6) полином / обладает однозначным разложением на простые множители в кольце Ж\х\. Итак, показано, что кольцо SfC [х] факториально. ? Упражнения 1. Приводим или неприводим полином х2+2х-+-2: (а) в кольце $|Х|; (Ь) в кольце (М\х\\ (с) в кольце &[х]? 2. Приводим или неприводим полином 2*+6: (а) в кольце (?[х]; (Ь) в кольце % [а:]? 3. Всякий неприводимьы в кольце % [х] полином является примитивным в % [х]. Верно ли обратное утверждение? § 4. ФОРМАЛЬНАЯ ПРОИЗВОДНАЯ ПОЛИНОМА. НЕПРИВОДИМЫЕ КРАТНЫЕ МНОЖИТЕЛИ Формальная производная полинома. Пусть &? — кольцо полиномов от х над полем <#: Ж = #[#]. Пусть &?\у\ — простое трансцендентное расширение кольца &С при помощи у. Кольцо Ж [у] будем обозначать также через еГ [х, у]. Здесь элементы кольца of [x, у], если они являются элементами кольца аГ[я], будем обозначать через f(x), g(x) и т. д.; если же они являются элементами кольца «^ [#]>--то через f(y), g(y) и т. д. 479
В кольце of [л:, у] рассмотрим полиномы f(x) = aQ+a1x+ ... +апхп (at <=F), f(y) = a0+a1y+...+anyn и их разность f{x) — f(y). Легко видеть, что f(*W(sO=SM*-y*) = fc=i = (х - У) 2 ak (*«+^+ ... +1/*-1) = = (*-г/)Ф(*, у), П где Ф (я, t/) = 2 а* (**_1+*ft~2#+ •.. + t/fe_1). Отметим, что ф (л:, х) = 2 какхк~г = аг + 2a2* + ... + папхп'1. ОПРЕДЕЛЕНИЕ. Пусть f = а0 + o^jc + ... + алх" — полином над полем of. Полином п ф (х> х) = 2 kakxk~x = аг + 2а2х + ... + папхп-г называется формальной производной полинома f и обозначается через /' или /'(#). ТЕОРЕМА 4.1. Пусть ^[х] —кольцо полиномов над полем qF, f, g—-любые полиномы из F[x] и %^F\ тогда: (1) (f+gy=r+& (2)(fg)'=fg'+rg; (3)(^)'=V; (4) (fm)' =mfm-1f при любом натуральном m. Доказательство. (1) Пусть /i = /+g; тогда f(*)-f(y) = (*-lOO(*-0).g(*)-g(0)H*-|0G(*.J0. /l(^)-/i(t/) = f(x)-f(y)+gW-gf(y) = = (Х-0)[Ф(Х, J0 + G(*, l/)]. Поэтому /г'=Ф(д;, x)-\-G(x, x)=f'-j-g'; следовательно, <f+gy=r+tf- 480
(2) Положим <p = fg, тогда Ф (x)-4>(y)=f(x)g(x) -f(y)g(y) = =f(x)(g(x)-gW+e(y)(f(x)-f(y))= = (x-y)[f(x)G(x, y)+g(y)<S(x, y)]. Отсюда получаем q>'=f(x)G(x, x)+g(x)0(x, x)=nx)g'(x)+g(x)f'(x)', следовательно, (fg)'=fg'+f'g. (3) Формула (З) непосредственно следует из формулы (2) при g = X, так как в этом случае g'=0. (4) Доказательство формулы (4) проводится индукцией по т на основании формулы (2). ? Разложение полинома по степеням разности х — с. При делении полинома / = а0хп + ... + ап на двучлен вида х — с вычисления удобнее всего располагать по следующей схеме (называемой схемой Горнера): с а0 bo а0 а± я2 cb± + a2 ... ... Яп-l bn-l cbn^ + ctn-i an r cbn^ + an Очевидно, a0 = b0; любой же следующий коэффициент частного и остаток г вычисляются по формулам Ьк = сЬк-г + ак (?=1, ..., п— 1); r = cbn^ + an. Эти формулы получаются из равенства аоХп+а^-1 + ... + ап-гх+ап = (х — с) (Ь0хп-г + + b1x»-*+...+bn.1) + r9 если раскрыть скобки и, сделав приведение подобных членов, приравнять друг другу коэффициенты при одинаковых степенях в обеих частях равенства. Схема Горнера удобна при разложении данного полинома / по степеням двучлена х — с. 481
Пусть / = (*-<?) <7i + r0, ?!=(*-?!) fc + rlf qn-2 = {x-c)qn-1+rn-1, ?*-! = (*--с) a0 + >Vi, где qk и rk обозначают частное и остаток, полученные при делении qk.x на х — с. Если последнее выражение в (1) для qk-x подставить в предыдущее равенство, а затем то, что при этом получится, подставить вместо <7л-2 и т. д., то придем к равенству (2) /вГо + г1(х-с) + г1(х-с)»+ ...+гл-1(*-с)"-1 + +Оо(х-с)п. Это есть разложение данного полинома f по степеням (х — с). Дифференцируя обе части равенства (2) и полагая х~с, получим f(c) = 'o. /'(*) = >i> Г(^) = 2! г2, ..., fM(c) = /i! aQ. Поэтому равенство (2) можно записать в виде f = f(c)+f'(c)(x-c)+^(x-c)*+ ... +^(х-су, если только / — полином над полем нулевой характеристики. Это и есть формула Тейлора для полиномов. Деление по схеме Горнера / на х — с дает коэффициенты частного qv которое в свою очередь надо делить на х — с и т. д.; все вычисления удобно расположить в одну таблицу: Гх=Г(Р) Г2 = Г(С) С а0 аг ... Ь0 Ьх ... С0 (\ ... d0 d± ... До >Vi Ял-1 яЛ Л> __ р-1, (с) Неприводимые кратные множители полинома. Пусть ef [x] — кольцо полиномов над полем of нулевой характеристики. 482
ОПРЕДЕЛЕНИЕ. Пусть / — полином из F[x] и р — его неприводимый множитель. Полином р называется множителем кратности т (или m-кратным множителем) полинома /, если (1) f = pmg, p\g, ge=F[x]. При т> 1 полином р называется кратным множителем, г при m = 1 — простым множителем полинома f. ТЕОРЕМА 4.3. Пусть ^[х] —кольцо полиномов над полем gF нулевой характеристики и /gF[4 Пусть р — неприводимый множитель кратности т^\ полинома f. Тогда р является множителем кратности т—\ производной f. Доказательство. По условию, р есть т-кратный множитель полинома /, значит, выполняются условия (1). Используя свойства производной, находим Г^тр^р'ё + Р"1^, (2) r^P^Hmp'g + Pg'). Так как, по условию, поле of имеет нулевую характеристику, то тр'ФО и deg(mp')<degp; поэтому р \ тр\ Поскольку р — неприводимый полином и (ввиду (1)) р \ g, то p-\{mp')g, поэтому (3)Р + (mp'g+pg'). На основании (2) и (3) заключаем, что р является множителем кратности т— 1 производной /'. ? СЛЕДСТВИЕ 4.4. Полином f из F[x] имеет кратные неприводимые множители тогда и только тогда, когда наибольший общий делитель полиномов f и f имеет поло- жительную степень. Кратные корни полинома. Пусть of [х] — кольцо полиномов над полем oF и ^[х] — его основное множество. ОПРЕДЕЛЕНИЕ. Пусть / — полином из F[x] и с — его корень в оГ. Элемент с называется корнем кратности т (т-кратным корнем), если f=z(x — c)mg, g(c)=?0, gE eF[x]; при т> 1 элемент с называется кратным корнем, а при т = 1 — простым корнем полинома /. ПРЕДЛОЖЕНИЕ 4.5. Пусть eF[x] —кольцо полиномов над полем нулевой характеристики и f^F[x]. Элемент с из F является кратным корнем полинома f тогда и только тогда, когда f(c) = f'(c) = 0. Это предложение непосредственно следует из теоремы 1.9 и следствия 4.4, 483
ПРЕДЛОЖЕНИЕ 4.6. Пусть <^[х\ — кольцо полиномов над полем of нулевой характеристики и f^F[x]. Элемент с является т-кратяым корнем полинома f тогда и только тогда, когда (1) /(с) = Г(с) = ... = /(да"1)(с) = 0, ^тЦс)фО. Доказательство. По теореме 4.3, элемент с тогда и только тогда будет m-кратным корнем полинома / (т. е. (х — с) — m-кратный множитель полинома /), когда (2) (х-с) делит /, f, ..., р-1* и (*-c)f/<«>. В силу теоремы Безу условия (1) и (2) равносильны. ? Упражнения 1. Разложите полином д:6—5л:5+Зл:3 — 1 по степеням х—1. 2. Разложите полином х*+4х*—х3 — 29*2— Ых--1 по степеням разности х—2. 3. Разложите полином хЪ—#3+1 по степеням x+i. 4. Вычислите значения полинома #4+3#2 — 5л:+1 и его производных при х = — 1. 5. Определите кратность корня 1 полинома х6 — хъ—-я4+2*3— _*?_*+1. 6. Определите кратность корня i полинома a:6+#5+3*4+2*3 + 7. Определите коэффициенты а и Ь так, чтобы полином ш^ + -\- bx*-\-l из Q [л:] делился на (я— I)2. 8. Определите коэффициенты а и 6 так, чтобы полином ахп+1-\- -j-bxn+l из ЦИ делился на (х — I)2. 9. Определите коэффициент а так, чтобы полином хь—ах2—ах-\-\ из Q [х] имел —1 корнем не ниже второй кратности. 10. Найдите условия, при которых полином xb+axz-{-b имеет в поле комплексных чисел двойной корень, отличный от нуля. 11. Имеет ли полином хп-\-а, где п — натуральное число к а — отличное от нуля число, кратные корни в поле комплексных чисел? X X2 Хп 12. Докажите, что полином 1 + тг + кг + • • • + ~т не имеет кратных корней в любом числовом поле. 13. Пусть 2F и «^ — числовые поля, причем «F-—подполе поля $>. Докажите, что если полином f неприводим в кольце полиномов & [х], то он не имеет кратных множителей в кольце §р> [х].
Глава пятнадцатая ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 1. КОЛЬЦО ПОЛИНОМОВ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ Кратное расширение кольца. Пусть &С — ненулевое под- кольцо коммутативного кольца X и х19 ..., хт — элементы кольца X. ОПРЕДЕЛЕНИЕ. Минимальное расширение кольца е/2*, являющееся подкольцом кольца 35 и содержащее элементы х19 ..., хт из L, называется подкольцом кольца 36, порожденным кольцом &С и элементами хг, ..., хт. Это кольцо обозначается через ?% [хъ ..., хт], а его основное множество — через К[хг, ..., хт]. Очевидно, кольцо &С [х19 ..., хт] является пересечением всех подколец кольца «5?, содержащих элементы х19 ..., хт и имеющих кольцо &? в качестве подкольца. ОПРЕДЕЛЕНИЕ. Кольцо, обозначаемое через &? [х±]... ...[#m] и определяемое индуктивно формулами *WW=(*W)[4 Ш [хг] [х2]... [хт] = (Ж [* j [х2]... [^_J) [хт1 называется т-кратным расширением кольца SfC. ТЕОРЕМА 1.1. Пусть Ж' — подкольцо коммутативного кольца X и хг, ..., хт е L; тогда (1) (%*[%, #2, ..., Хт] = &[хД[хД...[хт]. Доказательство. Теорема, очевидно, верна при т= 1. Предположим, что теорема верна, когда к кольцу ?% присоединяется /п — 1 элементов. Из определения следует, что К[х±, ..., *m_Jс: /С^!, ..., хт] их«б^ *m]> поэтому (2) (K[xl7 ..., x«-i])[*,Jc:/C[*i, ..., хт]. 485
С другой стороны, поскольку х19 ..., xm^(K[xlf ... ..., хт])[хт], то (3) /C[*i, ..., xm]cz(K[xl7 ..., хт^])[хт]. В силу (2) и (3) имеем (4) K[xlt ..., хт !, *т] = /([*!, ..., хт-г][хт]. По индуктивному предположению, (5) К [хг, ..., xm_3] = К [хг]... [хт-г1 На основании равенств (4) и (5) заключаем, что Л'[*1> Х2, ..., *т] = К [*i][*2] ••.[*/*]. Следовательно, верна формула (1). ? Кольцо полиномов от нескольких переменных. Пусть т — целое положительное число и N — множество всех натуральных чисел. Пусть NX = N и при т>\ Nm = {(*'i, ..., im)\ii> •••> »ni6N|, где (1"1э ..., im) — m-мерный вектор. По теореме 1.1, 3%[х19 х2\ = (?%[х1])[х2]. Поэтому элементы кольца &?\хъ х2] суть суммы вида а0 + агх2+...+апх2у где щ = ai0 + 0а#1+• • •+#/m*r (#/* еДат- наибольшая из степеней полиномов а0, о^, ..., аЛ. Следовательно, элементы кольца &[хг, х2] можно записать в виде Ci,'.)eAf где М — непустое конечное подмножество множества N2 = = NxN. На основании теоремы 1.1 заключаем также, что элементы кольца S% [хъ ..., хт] суть суммы вида где М — непустое конечное подмножество множества N771 и at i е/С. Такую сумму будем кратко записывать в виде 2 я(0д?...*>, где (i) = (ilf ..., im). (i)<=M 486
Напомним, что элемент хг кольца &[хг] называется трансцендентным над &С, если для любых элементов а19 ... п ..., ап кольца &? из равенства ^ aix[= 0 следуют равен- 1=1 ства а1 = 01 ..., ап = 0. Обобщением этого понятия является понятие алгебраической независимости совокупности элементов х±, ..., хт над 3&. Пусть &С —- подкольцо коммутативного кольца X. ОПРЕДЕЛЕНИЕ. Элементы х19 ..., хт кольца X называются алгебраически независимыми над кольцом &С, если для любых элементов а^ кольца ofC из равенства (!) 23 s/i1 • • • %im = °> где М с: N", (О ем. следует равенство нулю всех коэффициентов a{i). При т=1 мы получаем определение элемента, алгебраически независимого над &С, которое совпадает с определением элемента, трансцендентного над Ж. ТЕОРЕМА 1.2. Пусть о% — подкольцо коммутативного кольца X и х1у ..., xm^L. Элементы хъ ..., хт алгебраически независимы над Ж тогда и только тогда, когда для каждого se{1, ..., т] элемент xs является трансцендентным над Ж[х1у ..., Xs-x]. Доказательство. Предположим, что элементыхг>... ..., хт алгебраически независимы над кольцом <%*, и докажем, что для каждого se{1, ..., т\ элемент xs является трансцендентным над кольцом &? [хг, ..., xs _х]. Пусть (II) Ао + AiXs+... + Aixi^O, где Ak<=K[xl9 ..., х3-г]. Слагаемые Akxk можно записать в виде S Akxks = 2] "«А1 • • • tex*fi+i • • •**' гда м*с N" fe = 0, ..., I. Тогда равенство (II) можно записать следующим образом: (3) 2 ^Х1-^Я°+1---^=о- В силу алгебраической независимости элементов х19..., хт над кольцом && из (3) следует равенство нулю всех коэффициентов ащ для (i) е У М *, поэтому Л* = 0 для k = О, 487
1, ..., /. Следовательно, для каждого sg{1, ...,m} элемент xs является трансцендентным над Ж [xv ..., xs-±]- Предположим, что для каждого s ^ {1, ..., т} элемент xs трансцендентен над &С [хъ ..., д^-J, и докажем индукцией по т, что из (I) следует равенство нулю всех коэффициентов а^. Для т=1 утверждение, очевидно, верно. Предположим, что утверждение верно для совокупности элементов х19 ..., хт-г. Запишем равенство (I) в виде ( V До ~Т~ Al%m "Г A%Xm -f-.. . + ArXm = 0, где (OeAfft M = [)Mk. к По условию, элемент хт трансцендентен над &С [xv ..., a^-J, поэтому из (4) следуют равенства А0 = О, Лх = 0,..., Аг = 0. По индуктивному предположению, отсюда вытекают равенства а(/) = 0 для (i)<=[)Mk = M. Следовательно, элементы х19 ..., хт алгебраически независимы над 3%. ? Пусть 8% — ненулевое коммутативное кольцо и &С [хг]... ..• [Хт] — fe-кратное расширение кольца Ж элементами хъ ... ..., хт. По теореме 1.1, е^[х1...хт] = <з%Г[л:1]...[л:т] и, значит, кольцо g^[^i, ..., хт] также является ^-кратным расширением кольца &?. ОПРЕДЕЛЕНИЕ. Кольцо &?[хъ ..., хт] называется т-кратным трансцендентным расширением кольца Ш, если для любого se{1, ..., т] кольцо <Х[хъ ..., xs] является простым трансцендентным расширением кольца &[хг, ..., Xs-x] при помощи xs. Отметим, что при т = 1 m-кратное трансцендентное расширение кольца &? является простым трансцендентным расширением кольца SR. ТЕОРЕМА 1.3. Пусть &С — ненулевое коммутативное кольцо. Для любого натурального т, отличного от нуля, существует т-кратное трансцендентное расширение кольца &С. При этом если Ж — область целостности, то т-кратное трансцендентное расширение этого кольца также является областью целостности. 488
Доказательство. На основании теоремы 14.1.2 о существовании простого трансцендентного расширения кольца можно последовательно строить кольца: (#M...[*«-dH*«]. где &? [хг] — простое трансцендентное расширение кольца &? при помощи х19 ($ [л:х]) [х2] — простое трансцендентное расширение кольца Ж [лгх] при помощи х2 и т. д. Наконец, \&С [х±]... [#m-i]) [xm] — простое трансцендентное расширение кольца &? [хх]... [хт-г] при помощи хт. Согласно определению, предшествующему теореме, последнее кольцо является m-кратным трансцендентным расширением кольца &С. При этом, по теореме 14.1.6, если &С — область целостности, то все- построенные выше кольца являются областями целостности. ? ОПРЕДЕЛЕНИЕ. Кольцо &%[хъ ..., хт\ являющееся m-кратным трансцендентным расширением ненулевого коммутативного кольца 3%, называется кольцом полиномов над Ш от х19...9 хт. Иногда, если это требуется, элементы /, g и т. д. этого кольца будем также обозначать через f(xl9 ..., хт), g(#i, ..., хт) и т. д. Изоморфизм колец полиномов. Пусть S& и ^ — ненулевые коммутативные кольца. ТЕОРЕМА 1.4. Пусть &? и X' — изоморфные кольца и ф — изоморфизм $% на35,а&С [х19..., хп], 3S [уъ ..., уп]— кольца полиномов. Тогда существует изоморфизм кольца &С [xlt ..., хп] на кольцо X [уъ ..., уп], переводящий xlf... ..., хп соответственно в у19 ..., уп и продолжающий изоморфизм ф. Доказательство проведем индукцией по п. Если /1=1, то, по теореме 14.1.2, существует изоморфизхМ фх кольца $%[хг] на кольцо Х[уг] такой, что ^>i(x1)==y1 и фх(а) = ф(а) для всякого элемента а из К. Допустим, что существует изоморфизм фл кольца &С [х17 ..., хп] на кольцо X [уъ ..., уп\ переводящий хъ ... ..., хп в */3, ..., уп соответственно и продолжающий изоморфизм ф. Тогда, по теореме 14.1.2, существует изоморфизм фл+1 кольца (ё%[х1...хп])[хп+г] на кольцо (Х[уъ ... • • • > Уп]) [#лн]> переводящий хпП в уп+1 и продолжающий 489
изоморфизм фл. Учитывая, что, по теореме 1.1, (Ж[Х19 ..., *J)[*,h.i] = »[*!, •••> *ii+l] И (%bti, ...» Уп\)[Уп+А=%[Уь ..., y«+i], получаем, что фЛ+1 — изоморфизм &?\хъ ..., #л+1] на % [Ун • • • > Ул+i]» переводящий элементы хг,..., д:л+1 в ylf... •. •» Ул+1 соответственно и продолжающий изоморфизм ф. Таким образом, утверждение теоремы верно для любого натурального числа п. П СЛЕДСТВИЕ 1.5. Пусть Щхъ ...,хя]иЖ[уг, ...,#,]- кольца полиномов над кольцом GK. Тогда существует изоморфизм ф кольца УС [х19 ..., хп] на кольцо &С [уг,..., уп], переводящий xlf ..., хп соответственно в ylf ..., упи такой, что (р(а) = а для любого элемента кольца S%. Нормальное представление полинома и степень полинома. Пусть N — множество всех натуральных чисел и т — фиксированное натуральное число, отличное от нуля. Для любого натурального числа k определим множество Sk\ S* = {(<i> ..- «eN*|*i+... + *« = *}. Отметим, что (1) St[\Sk^0 при 1фк. Полином 2 аа& • • • х%т называется нулевым, если все его коэффициенты a(i) равны нулю. ТЕОРЕМА 1.6. Пусть f —ненулевой полином из кольца полиномов GK [xl9 ..., хт]. Для полинома f существует на- туральное число п и такое представление (2) / = ? ( 1> "{t$---*k\ Где аОе^ что хотя бы для одного ненулевого коэффициента a{i) *i + -••+*/« = я- Это представление единственно в том смысле, что если (3) f-ZlE ь x\K.Jrn\T^b{i)^K, k = 0\{i)(=Sk J — другое такое представление, то s = n и а(/) = &(/) для всех (i) из Sk при & = 0, 1, ..., д. 490
Доказательство. Пусть (4) /= Е Vi1"-^ (а«)^Ю> (О ем где М — конечное подмножество множества Nm. В этой сумме нет подобных членов, и поскольку / — ненулевой многочлен, то в сумме (4) есть ненулевые коэффициенты. Так как множество М конечно, существует натуральное число п, удовлетворяющее условиям и если akl...km?=0> то кг + ... + кт^п для всякого (К •••> km)e=M. п Пусть Л1* = U S&- Положим a{i) = 0 для (i)EM*\M. На основании (4) заключаем, что (5) /- S «w4•¦•*!?• (Оелг* Поскольку М* = (J Skn Si(]Sk = 0 при 1фк>т (5) сле- fc = 0 дует представление (2). Допустим, что кроме представления (2) существует представление (3). Если т<.п, то, вычитая из равенства (2) равенство (3), получаем (6) ? а<1)Х\к..^ + ... т ft = 0\(/)ESft У В силу алгебраической независимости элементов хъ ... ..., хт все коэффициенты в (6) равны нулю, в частности а(?) = 0 для всех (i) e S/z, что противоречит условию теоремы. Аналогично убеждаемся в невозможности неравенства п<.т, поэтому т = п. 491
Таким образом, равенство (6) можно записать в виде (7) 2( 2 (а(/)-Ь(/))^-^ = 0. В силу алгебраической независимости х19..., хт из (7) следует, что аи) = Ьи) для всех (j)<=Sk, где & = {0, 1, ... ..., п}. ? Представление (2) теоремы 1.6 называется нормальным представлением полинома. ОПРЕДЕЛЕНИЕ. Степенью одночлена а,{)х1*>..х1т с ненулевым коэффициентом a{i) называется сумма h+... ...+*m. ОПРЕДЕЛЕНИЕ. Степенью ненулевого полинома f, / е /С [*i, ..., #да], называется наибольшая из степеней ненулевых одночленов, входящих в нормальное представление полинома /. Степень нулевого полинома не определяется. Степень полинома / обозначается символом deg/. ОПРЕДЕЛЕНИЕ. Полином / степени п называется однородным, если Однородный полином первой степени называется линейным полиномом. Отметим простейшие свойства степени полинома. ТЕОРЕМА 1.7. Пусть f и g —любые ненулевые полиномы кольца полиномов &? [хъ ..., хт]. Тогда: (1) если f+g=?0, то deg(/ + g)^max {degf, degg}; (2) если f-g — ненулевой полином, то deg (fg) ^ deg /+deg g; (3) если S% —область целостности, то deg (fg) = deg f + + degg. Доказательство теоремы 1.7 предоставляется читателю. Факториальность кольца полиномов. Докажем теорему, аналогичную теореме 14.3.7. ТЕОРЕМА 1.8. Пусть Ж — факториальное кольцо. Тогда кольцо полиномов &? [х19..., хп] от хъ ..., хп над Ж также является факториальным. Доказательство. Теорема доказывается индукцией по п. Для п=1 утверждение верно по теореме 14.3.7. Предположим, что кольцо полиномов &? [xv ..., хп-г] от 492
xl9 ..., хп-г над Ж факториально. Докажем, что тогда факториально также кольцо Ж [х19 ..., хп]. По теореме 1.1, Ж[Хг% ..., хп] = Ж[хД ...[хп] = (Ж[хг] ... [хя-Д)[хя] = = (Ж[х19 ..., ХП-Л[ХЯ]. По индуктивному предположению, кольцо Ж [х19 ..., хп^\ факториально. Следовательно, в силу теоремы 14.3.7 факториально его расширение (Ж [х19 ..., хя-.г]) [xn] с помощью элемента хП9 трансцендентного над кольцом Ж [х19 ..., хп-^\. Таким образом, кольцо полиномов X [xl9 ..., хп] факториально для любого натурального п. ? СЛЕДСТВИЕ 1.9. Кольцо полиномов <У [х19 ..., хп] над полем qF факториально. Упражнения 1. Покажите, что неприводимы над полем рациональных чисел следующие полиномы от двух переменных: (а) За:2—у; (Ь) х2+у2—\. Приводимы ли эти полиномы над полем комплексных чисел? 2. Докажите, что кольцо полиномов У [х, у] над полем У от двух переменных не является кольцом главных идеалов. 3. Пусть &[ху у]— кольцо полиномов над полем У от двух переменных. Докажите, что фактор-кольцо ^\х9 y]/(x—у) изоморфно кольцу eF [х]. § 2. СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ Лексикографическое упорядочение членов полинома. Пусть N —множество всех натуральных чисел и т —фиксированное натуральное число, отличное от нуля. Элементы множества Nm суть /n-мерные векторы с натуральными координатами. Пусть l = (lli •••> lm)i к = \к±, •••> &т)» На множестве Nm введем лексикографическое упорядочение, считая, по определению, (1) (h, ...> im)<(ki> •••> km), если положительна первая ненулевая координата вектора (ki — il9 ..., km — im). При этом будем говорить, что вектор / ниже вектора k9 а вектор k выше вектора /. ТЕОРЕМА 2.1. Лексикографическое упорядочение на множестве Nm является отношением строгого линейного порядка. Доказательство. Из определения лексикографического упорядочения следует, что для любых двух векто- 493
ров /, к из Nm выполняется одно и только одно из трех условий: /<С#, / = ?, k<i. Отношение < на множестве Nm транзитивно. В самом деле, если /<fc и fc</, то k — />0, / — к>0, где 0 = (0, ..., 0). Отсюда следует, что (k — i) + (l — k)>0 и / —/>0, т. е. /</. ? СЛЕДСТВИЕ 2.2ь Пусть М—непустое конечное подмножество множества Nm. Тогда лексикографическое упорядочение (порядок) на Nm индуцирует строгий линейный порядок на М. Доказательство. Пусть / — ненулевой полином кольца полиномов Ж [х19 ..., хт\ и (2)/= S «№#•••**- — его представление, не имеющее нулевых коэффициентов, т. е. а^)ФО для каждого (?) е М. Пусть S — множество одночленов, входящих в f (в сумму (2)). На множестве S введем отношение порядка, считая, что (3) а? , х\* ...х?™<аь у х*1... xk™ в том и только в том случае, когда (il9..., im) < (&х,..., йш). Действительно, это бинарное отношение транзитивно, анти- рефлексивно и, кроме того, линейно. Следовательно, отношение лексикографического порядка на S является также строгим линейным порядком. П ОПРЕДЕЛЕНИЕ. Наибольший элемент упорядоченного множества <S, <) называется высшим членом полинома f. Если выполняется неравенство (3), то говорят, что член a. j х]1 ... х1т ниже, чем член а. ь fa ... xkm. Высший член, очевидно, выше любого другого одночлена полинома Д Лемма о высшем члене произведения двух полиномов. При изучении свойств симметрических полиномов необходима следующая лемма. ЛЕММА 2.3. Пусть SV[xl9 ..., хт] — кольцо полиномов от xl9 ..., хт над областью целостности $??. Высший член произведения двух ненулевых полиномов кольца Ж [xl9..., хт] равен произведению высших членов сомножителей. Доказательство. Пусть fug — ненулевые полиномы рассматриваемого кольца, ах**... х1™ и bxk%1,.. fy — 494
высшие члены соответственно полиномов f и g. Надо доказать, что высшим членом полинома fg является одночлен (I) ab*/i+*i ...jpfji+Ч Заметим, что аЬфО, так как е/2* —область целостности. Пусть (1) cxi1... х'п и dx*1 ... Xs™ 4 / 1 т 1 т — любые ненулевые слагаемые в нормальных представлениях полиномов / и g соответственно. Тогда выполняются неравенства (2) (/i, ..., /ш)<(*1, ..., 1т) (3) (slf ..., sm)<(*i, ..., *m). Нам достаточно показать, что если хотя бы одно из этих неравенств является строгим, то (4) cdx{i+si... xjm^m < a&A+*i ... *>+Ч ^ / 1 т 1 tn В самом деле, если хотя бы одно из неравенств (2) и (3) является строгим, то (5) (*i —Д, ..¦> im — lm)>0 ИЛИ (fci-Si, ..., ^» —5m)>0 и в силу (2), (3), (5) (6) (*! + &!, ..., im + km)-(Jl + Slt ..., /« + S«)>0. Из (6) следует (4). Неравенство (4) выполняется для любых ненулевых слагаемых (1) в нормальных представлениях полиномов f и g> по крайней мере одно из которых не является высшим членом соответствующего полинома. На основании этого заключаем, что одночлен (I) является высшим членом произведения fg. ? Симметрические полиномы. Пусть SP[xl9..., хт] — кольцо полиномов от хг, ..., хт над коммутативным кольцом X. Пусть Sm — множество подстановок степени т. ОПРЕДЕЛЕНИЕ. Полином f из Ж\хъ ..., хт] называется симметрическим полиномом отхъ ..., хт9 если для любой подстановки tgS^ выполняется равенство / (Хц . . . , Хт) = / (#Т(1)> • • • > #Т(/Я)). Пример. Полином х\+ ... +*m+#1+.r2-f- ... +хт переходит в себя при любой подстановке элементов х19 ... • • • 9 %т* 495
ОПРЕДЕЛЕНИЕ. Элементарными симметрическими полиномами от хъ ..., хт называются полиномы сг3 = Xi-f-х2 -f-... -\- хт\ СГ2 = ХуХ^ -р XiXs + ... + Xm-iXm\ &т — ХхХ% ... Хт. Они возникают естественным образом при рассмотрении полинома ф = (z — хг) {z — x2) ... (z — хт), который равен полиному zm-(x1+x2+ ... +xm)zm-1 + (x1x2+ ... +*т-Л)г"*-2+ Таким образом, ф = zm — o^z™-1 + 02гт~2 —...+(— 1 )т вт. Легко проверить, что множество всех симметрических полиномов кольца &? [х1у..., хт] является подкольцом этого кольца; обозначим его через SSK \хъ ..., хт]. С другой стороны, элементарные симметрические полиномы от хг, ... ..., хт порождают некоторое подкольцо Ж [хъ ..., хт]\ обозначим его через &С [а±, ..., ат]. Легко видеть, что ^К ..., <5«\^>Ш\хъ ..¦, Xml Совпадают ли эти два кольца? Можно ли любой симметрический полином от хг, ..., хт представить в виде полинома от элементарных симметрических полиномов а19 ..., сгт? Ниже будет дан положительный ответ на этот вопрос. Леммы о симметрических полиномах. Пусть S&[xl9 ... • • • > Хт] — КОЛЬЦО ПОЛИНОМОВ ОТ Хг, . . . , Хт. ЛЕММА 2.4. Если ах*!***... rffm _ высший член сим- метрического полинома, то k± ^ k2 ^ ... ^ km. Доказате л ьство. Пусть /—• полином из K[xlf..., хт], симметрический относительно х19 ..., хт, и (1) ox{ij?...**« (ае/0 — высший член полинома /\ В нормальное представление симметрического полинома / входят также одночлены (2) оф?*5«...;?*, (3)а^Х2...^. Так как одночлен (1) выше одночлена (2), то k1'^k2. 496
Поскольку одночлен (1) выше одночлена (3), то k2Szk3 и т. д. Следовательно, k1^k2^k3^ ... ^km. ? ЛЕММА 2.5. Пусть ах\1хк^ ... xkfm —высший член ненулевого симметрического полинома f e К[х±, ..., хт]. Тогда высшие члены полиномов f и ао^^а^*3... ofy совпадают. Доказательство. Нетрудно видеть, что элементарные симметрические полиномы al9 а2, ..., от.г, от имеют соответственно следующие высшие члены: Х±> Х±Х2, • • • > ^1-^2 • • • %m-li %1%2 • • • ^/Я# По лемме о высшем члене произведения полиномов, высшими членами полиномов (1) ао\*-\ о&~Ч ..., <fe~*m> °5Г являются соответственно одночлены ах\^\ {xvx^\ ..., (*x*2 ... xm_tf'*+-*'n9 (Xi... xmfm. В силу той же леммы произведение этих одночленов, т. е. одночлен ах^х1^ ... xk^, является высшим членом произведения полиномов (1). Таким образом, высшие члены полиномов f и аа*1_Ч ..., о^и совпадают. П Пусть &? \хъ ..., хт] — кольцо полиномов от Хх, .»., #m. На множестве ненулевых полиномов этого кольца введем бинарное отношение >: f>g тогда и только тогда, когда высший член f выше, чем высший член g. Нетрудно видеть, что это отношение есть отношение линейного порядка. ОПРЕДЕЛЕНИЕ. Последовательность фх, ср2, <р3, ... полиномов из К [хц ..., хп] называется убывающей цепочкой, если (1) Ф1>Ф2>Ф3> ... ЛЕММА 2.6. Убывающая цепочка ненулевых симметрических полиномов кольца полиномов &? [хъ ..., хт] не может быть бесконечной. Доказательство. Пусть (1) есть убывающая цепочка симметрических полиномов. Тогда высший член ф/ выше, чем высший член ф/+1 для * = 1, 2, 3,.... Пусть ax\ixk*... &™ — высший член полинома фх. Из симметричности ф1э по лемме 2.4, следует, что kt^k2^ ... ^km. 497
Пусть (ll9 129 ..., 1т) — вектор показателей высшего члена любого симметрического полинома ф/ цепочки (1), отличного от фх. В силу (1) («1, «2> • ••> ^mj^v/l» 'г> •••> ^т/> поэтому (2) К^1^1г-2*...^1М. Заменим эти условия следующими, более слабыми условиями (3) 0^1±^к19 ..., 0^lm^kv Число векторов (ll9 ..., 1т) из Nm, удовлетворяющих условиям (3), при фиксированном k± конечно и равно (А1+1)ш- Поэтому число векторов (ll9 ..., lm)9 удовлетворяющих условиям (2), также конечно, так как из условий (2) следуют условия (3). Следовательно, цепочка (3) не может быть бесконечной. ? Основная теорема о симметрических полиномах. Пусть &? [х19 ..., хт] — кольцо полиномов от х19..., хт над областью целостности Ж. Пусть о19 ..., ат — симметрические полиномы от х19 ..., хт. Любой полином g(oL9 ..., ат) над &? будем рассматривать как симметрический полином g((7i(*i,..., Хт),..., ат(х19..., хт)) отxlt..., хттлЖ. ТЕОРЕМА 2.7. Всякий симметрический полином из кольца полиномов Ж\хъ ..., хт] можно представить в виде полинома над &? от элементарных симметрических полиномов olt ..., ат9 т. е. для любого f{xl9..., хт) <= К[х19 ... .. • > Хт] существует такой полином g (xl9 ..., хт) е ?Ж"[%, ..., хт]9 что f(xl9 ..., xm) = g{(y1(xl9 ..., хт), ..., cr^^i, .,., *m)). Доказательство. Пусть f — ненулевой симметрический полином над Ж и а0хкгг... я**» — его высший член. Полином — симметрический, как разность симметрических полиномов, причем, по лемме 2.5, f>f^. Пусть я^1...*^ — высший член полинома /х. Аналогично, полином (2) f. — fi —fl^"^ ... oJ« 498
является симметрическим, причем /i>/2 и т. д. В результате получается убывающая цепочка симметрических полиномов/0>/1>/2> ... . По лемме 2.6, эта цепочка не может быть бесконечной. Предположим, что она обрывается на (я+1)-м шаге, т. е. Складывая почленно равенства (1), (2),..., (s +1), получим f = a/i~k*... о^+аХ1"1»... о1™ + ... +аяо^-я»..л>. Это равенство дает искомое представление симметрического полинома f в виде полинома над &С от элементарных симметрических полиномов а19 ..., ат. ? Пример: ^1+^1+ ••• +*ш = = (% + ...+хт)2~2(л:1л:2+... + л;т_1л:т) = а?--2о'2. СЛЕДСТВИЕ 2.8. Яг/стб (p = zm+a1zm-1 + ... +ат — полином над числовым кольцом &С и q> = (z — c1)(z — c2) ... ... (z — сда), где сх,..., ст е С. ?Ъш / (%, ..., #да) — симметрический полином от хъ ..., хт с коэффициентами из К. то / fo, ..., ст) ее К. Доказательство. Из равенства (z-cJ(z-c2)...(z-cm) = zm + alzm-1+a2zm-2+...+am вытекают следующие формулы (Виета), выражающие связь между корнями и коэффициентами полинома: ??!+... +?я1 = — Of, ^2 "Г • • • "Г ст-1ст == #2» ^2 -.-c» = (— l)wam. Эти равенства можно записать в виде °1 (^1» • • • > ст) = — #1> /1 ч 0*2 (с19 ..., ст) = а2; В силу основной теоремы о симметрических полиномах симметрический полином f из К [х19 .. • > Хт] можно пред- 499
ставить в виде полинома g от элементарных симметрических полиномов аъ ..., ат с коэффициентами из /С, т. е. (2) /(*1, ..., #m)=g(CTi(*i, ..., Хщ), ..., От{хъ ..., *w)). Полагая в равенстве (2) хг = сг, ..., хт = ст и учитывая равенства (1), получим (3) f(cl9 ..., cm) = gr(— аъ а2, ..., (—^ая,). Кроме того, g<=K[xl9 ..., д:т] и %,..., ^Gi(, следовательно, Упражнения 1. Является ли симметрическим полином (#!—дг2) (#2--*з) (*з—*i)? 2. Найдите высший член полинома 2a|0|af, где (Ji=x1+x2+x3l a2 = #1*2-J-Х±Х$ -\- X^Xfr 0"з = #]#2^3* 3. Покажите, что множество всех симметрических полиномов из К [#i> ..., хп], где /С—основное множество области целостности &Р, замкнуто в кольце полиномов $?\хъ ..., хп]. 4. Найдите сумму кубов комплексных корней полинома 2z4— — 4гз + 2г2—6z + l. 5. Найдите сумму квадратов комплексных корней полинома xn + an_iXn~i-{-...+aixЛ-ао наД полем комплексных чисел. 3. РЕЗУЛЬТАНТ ПОЛИНОМОВ И ИСКЛЮЧЕНИЕ ПЕРЕМЕННЫХ Результант двух полиномов. Пусть f и g — полиномы из кольца полиномов oF [x] над полем eF. Найдем условия, при которых эти полиномы обладают общим делителем положительной степени. ТЕОРЕМА 3.1. Пусть f и g —полиномы от х над полем of такие, что f = a0xn + a1xn-1+...+an9 g = b0xm + b1xm-1+... + bm, и по крайней мере один из коэффициентов aQf b0 отличен от нуля. Полиномы fug имеют общий делитель положительной степени в <^[х] тогда и только тогда, когда в F[x] существуют полиномы cud, удовлетворяющие условиям: (a) fc = gd, (Р) с = с0хт-1 + ^.+ст^ d = d0^-1 + ... + dw_1, (у) хотя бы один из полиномов cud отличен от нуля. 500
Доказательство. Предположим, что полиномы fug имеют в F[x] общий делитель и положительной степени. Тогда существуют полиномы cud такие, что f = du, g = cu. Легко проверить, что полиномы end удовлетворяют условиям (а) —(у). Предположим теперь, что существуют полиномы с, d, удовлетворяющие условиям (а), (|J) и (у). Предположим, что степень полинома / равна п, т. е. а0фО (в противном случае можно было бы поменять ролями / и g). Пусть ф — наибольший общий делитель cud. Тогда в Р[х] существуют такие полиномы сг и dl9 что (1) с = схф, d = dx9, HOflfo., 40 = 1. Отметим, что ^=?0, так как в противном случае tf = U и ввиду (а) с = 0, что противоречит условию (у). В силу (1) и условия (а) /с1ф = ^1ф и, значит, (2) fc^gd^ Поскольку полином dx делит fc± и является взаимно простым с съ то dx делит f\ так что (3) f = dj9 где ? —полином положительной степени, так как степень dx не выше степени d, а степень d ниже степени / в силу условия (Р). Из (3) и (2) получаем d1th = gd1 и g = ht. Таким образом, fug имеют общий делитель t положительной степени. ? Запишем условия (а) и (Р) более подробно: (1) (а0хп+... + ап)(с0хт~1 + ...+ст-г) = = (bQxm + ... + bm)(dQxn-i+... + dn„1). Произведя умножение в обеих частях равенства и приравнивая коэффициенты при одинаковых степенях х, получаем следующую систему линейных уравнений: UqCq = UoUq'j aLc0 + а0сг = bxdQ + bQd^ ago+<*&+Я(А = Mo + Mi + b0d2; ClnCm-2 +an-lCm-l = bmdn-2 + bm_xdn-? 501
Это есть система п-\-т однородных линейных уравнений с п + т переменными c0i съ ..., ст-ъ d0, йъ ..., йп-г. Она имеет ненулевые решения тогда и только тогда, когда определитель этой системы равен нулю. Для того чтобы избежать появления минусов перед элементами матрицы определителя, можно, перенеся правые части уравнений влево, считать переменными с0, сг, ..., ст.ъ — d0, — йъ ... ..., —^л-i- Если, кроме того, транспонировать матрицу определителя, то определитель системы примет вид \а0 ах ... ап а0 а± ... ап а0 а± ... ап b0 b1...bm b0 bx...bm I b0 bx ... b, ОПРЕДЕЛЕНИЕ. Результантом полиномов f=a0xn+... ... + an и g = bQxm-\-... + bm называется определитель R. Из теоремы 3.1 следует, что полиномы f и g (у которых а0фО или Ь0Ф0) имеют общий делитель положительной степени тогда и только тогда, когда система линейных уравнений имеет ненулевые решения, т. е. когда определитель R равен нулю. Итак, доказана следующая теорема. ТЕОРЕМА 3.2. Пусть f=aQxn + ... + an, g = b0xm+... .. . + bm — полиномы над полем JF и хотя бы один из коэффициентов aQ и Ь0 отличен от нуля. Полиномы fug имеют общий делитель положительной степени тогда и только тогда, когда результант этих полиномов равен нулю. СЛЕДСТВИЕ 3.3. Если результант полиномов fug равен нулю, то либо полиномы имеют общий делитель полоэюительной степени, либо коэффициенты aQ и Ь0 равны нулю, и обратно. Исключение переменных. Результант можно применить к исключению переменных из системы двух алгебраических уравнений, хотя бы одно из которых нелинейно, с двумя переменными. Пусть дана система уравнений (!)/(*. У) = 0, g(x,y) = 09 502 т
где / и g — полиномы от х и у над полем sf. Запишем эти полиномы по убывающим степеням х: f(x, y) = a0(y)xn + a1(y)xn-1+...+an(y); g(x* У) = Ь0(у)хт + Ь1(у)хт-1+...+Ьп(у), где di(y) и bk (у) — полиномы из кольца JF\y\ Найдем результант полиномов f и g, рассматривая их как полиномы от х. Этот результант есть полином из кольца JF [у], обозначим его через R(y). Предположим, что система (1) имеет в поле оГ (или в его расширении) решение (а, Р). Тогда полиномы g(x, P) = MP)^ + MP)^+--- + MP) имеют общий корень а. Поэтому они имеют общий множитель положительной степени (над F($)). Следовательно, в силу теоремы 3.2 их результант, равный R($), должен быть равен нулю. Обратно: если р~ корень результанта R(y), т. е. i?(p) = 0, то, по следствию 3.3, полиномы fix, Р) и g(x, Р) либо имеют общий корень, либо их коэффициенты а0(Р) и &0(Р) °ба равны нулю. Таким образом, решение системы уравнений (1) с двумя переменными сведено к решению уравнения (2)R(y) = 0 с одной переменной у. Говорят, что уравнение (2) представляет собой результант исключения х из системы уравнений (1). Пример. Найдем решения системы уравнений /1ч х2у2+х2у+у+х = 0, к ' ху2 + 2ху+1=0. Исключим х из системы (1). Для этого запишем левые части уравнений по убывающим степеням х: /9,ч (У2 + У)х2 + х+у = 0, К } (У2 + 2у)х+1=0 и составим определитель: У2+У 1 У R(y) = \y2+2y 1 о О у2 + 2у 1 503
Вычисляя определитель, получаем Я(у) = У2 + У+У(У2 + 2у)2-у*-2у = у[(у* + 2у)*~1]. Уравнение R (у) = у [(у* + 2yf - \] = у(у+\)Чу* + 2у-\) имеет корни 0, —1, —1+]/*2, —1—")/"2. При # = 0 система (1) переходит в систему х = 0, 1=0, которая несовместна. При у = — 1 система (1) переходит в систему х — 1 =0, — #+1=0. Таким образом, получается решение системы (1): о. -о- При у = — 1±У"2 система (1) превращается в систему (2 =р УЪ#+х+{- 1 ± У3)=0, *+1=0, которая имеет решение х = — 1. Следовательно, мы получаем еще два решения системы (1): (—1, —1+1^2), (-1, -1-1/5). Упражнения 1. Вычислить результант полиномов: (a) 2х3 — 3*2+2*+1 и х*+х+Ъ; (b) x3+2x2+2x—2 и х2 —2х + 4; (c) х3 —Зх+6 и х3 + х2--х—1. 2. При каком значении К полиномы имеют общий корень: (a) *3—2Ях+Я3 и х2 + а,2—2; (b) х3+Ях2—9 и x2+ta—3? 3. Исключите х из системы уравнений *2__3*t/+r/2—2 = 0, 2д;2—ху+3уъ—1=0. 4. Решите с помощью результанта систему уравнений ?2+я2_0_з* = О, */2 —блгг/—х2 + llr/+7x —12 = 0.
Глава шестнадцатая ПОЛИНОМЫ НАД ПОЛЕМ КОМПЛЕКСНЫХ ЧИСЕЛ И НАД ПОЛЕМ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ § 1. АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ КОМПЛЕКСНЫХ ЧИСЕЛ Теорема о возрастании модуля полинома. Пусть IS [z] — кольцо полиномов над полем комплексных чисел W и С [г] —его основное множество. ТЕОРЕМА 1.1. Пусть f —полином положительной степени из С [г]. Для всякого действительного числа М>0 существует такое действительное число г>0, что для любого комплексного числа z \ f (г) | ^ М, как только \г\^г. Доказательство. Пусть f(z) = a0+a1z+... + anzn^C[z], апфО, п^\. В силу свойств модуля (теорема 4.7.8) \anzn+an.1zn-1+.. .+a0\'Sz\anzn\—\a0+a1z+.. .+ая,12^-1\9 I aQ+atz+.. .+ал-12л"11 ^ | а0 \+\ а± \ \ z |+.. .+| ап.г\ \z\n~\ Следовательно, при z=?0 mm^P,mp[i-(T^LT,+...+J^L)]. Положим <2>»=НЙ т^}- Отметим, что при k^l и |г|^1 выполняются неравенства |2|*SHz| И На основании (1) —(3) получаем (4)|/(2)|^KI|2|n(l-j^). 505
Легко видеть, что (5) (1-^)^-1, если|г|^2л&. Далее, имеем (6) ' *',¦ ' ^М, если |z|^j—j . На основании (4) — (6) заключаем, что \f(z)\^zM, если |z|5sr, где r = max|l, 2nb, \^-^j |. П Непрерывность модуля полинома. Пусть / — полином от z над полем комплексных чисел. Отображение z н-> | / (z) |, определенное на множестве С всех комплексных чисел, есть действительная функция комплексной переменной. Ее мы будем называть модулем полинома f и обозначать символом |/|. ТЕОРЕМА 1.2. Пусть f — любой полином из С [г]. Модуль полинома f является непрерывной функцией на множестве С. Доказательство. Покажем, что для всякого положительного 8 найдется такое положительное б, что для всякого комплексного числа z, если |г — а|<б, то llfOOl-If(*)ll<e. Теорема, очевидно, верна, если полином / нулевой или имеет нулевую степень. Предположим, что полином / имеет положительную степень /г. Разложим / по степеням разности z — a: f(z)=c0 + c1(z-a) + ...+cn(z-a)n {спфО). Поскольку /(а) = с0, то f(z)-f(a) = c1(z-a) + ...+cn(z-a)n и по теореме 4.7.8 получаем неравенство (1) |f(2)-/(«)KI^||2-fl|+...+ |^||2-fl|*. Положим 6 = тах{|сД ..., |сл|}; так как спфО, то ЬфО. Легко видеть, что при k^l (2) \z — a\k^\z — a\, если \г~а\<*\. 506
В силу (1) и (2) имеем |/(*)-/(a)|</ift|z-a|. Кроме того, для любого s>0 nb | z — a | < 8, если | z — a | < e/nb. Каждому числу e поставим в соответствие положительное число б = min |~-, 11; тогда | / (z) — f (a) | < 8, если \г — а|<6. Кроме того, для любого комплексного числа z \\№\-\№\\<\№Ч(а)\. Следовательно, для любого 8>0 можно найти такое 6>0, что для всякого z из С И/(*)Ы/(а)||<е, если |z-a|<5. П ТЕОРЕМА 1.3. Пусть / — полином из С [г]. Если последовательность (zn) сходится к комплексному числу а, то последовательность (\f(zn)\) сходится к числу |/(#)|. Доказательство. По теореме 1.2, (1) (V8>0)(38>0)(V*e=C)(|z--a|<8-> -+\\№\-\№\\<*)- По условию, последовательность (zn) сходится к числу а. Следовательно, для любого 8>0 существует такое натуральное число я0, что \zn — a|<6 для всякого п>п0. Отсюда в силу (1) следует (Ve>0)(3neSN)(V/ieN)(n>/ie-^||f(2e)|-|f(fl)||<e). Таким образом, последовательность < | / (zn) |> сходится к числу \f(a)\. U Наименьшее значение модуля полинома. Ниже будет нужна следующая известная из анализа теорема Больцано— Вейерштрасса: всякая бесконечная последовательность (zn) точек круга | z | ^ г (г — фиксированное положительное действительное число) обладает подпоследовательностью, сходящейся к некоторой точке этого круга. ТЕОРЕМА 1.4. Пусть f —полином из С [г], г —положительное действительное число и m = inf |/(z)|. Тогда существует такое комплексное число а, что \f{a)\ = = m и \а\^г. Доказательство. Пусть (гп) — последовательность положительных действительных чисел, сходящаяся к нулю. 507
Так как т= inf \f(z)\, то для каждого члена ел после- |2|<Г довательности существует такое zn, что (1) m<|f(2e)|<m+ ^л> I Zn I ^ Г. Поэтому последовательность <|/(гл)|) сходится к т: (2) lim \f(zn)\ = m. П-+СО В силу (1) все элементы последовательности (zn) принадлежат кругу | z | ^ г. По теореме Больцано — Вейерштрасса, эта последовательность обладает подпоследовательностью (хп), сходящейся к некоторой точке а круга |z|^r, т. е. (3) lim хп = а, \а\^г. п—юо По теореме 1.3, из (3) следует, что (4) \im\f(xn)\ = \f(a)\. П-+СО Так как (| / (хп) | > есть подпоследовательность последовательности (f(Zn)), которая сходится к т, то (5) \im\f(xn)\ = m. На основании (3), (4) и (5) заключаем, что \f(a)\ = m и |а|<г. п ТЕОРЕМА 1.5. Модуль любого полинома f из C[z] достигает своего наименьшего значения на множестве С. Доказательство. Теорема, очевидно, верна, если degf = 0 или f (0) = 0. Поэтому предположим, что deg/S^l и / (0) Ф 0. Положим М = | f (0) |. По теореме 1.1, (1) (Зг>0)(УгеС)(|г|^г-^|Дг)|^М. Пусть К = {z е С11 z | ^ г}. По теореме 1.4, | /1 достигает наименьшего значения в круге К, т. е. существует число а такое, что (2) \f(a)\^\f (z) |, если |z|<r, в частности (3) |f(a)|<|/(0)| = M. На основании (1) и (3) заключаем, что (4) |/(а)|<|/(*)|, если \z\^r. В силу (2) и (4) имеем (у*еС)(|/(a)|<|/(z)|). Таким образом, | /1 достигает на множестве С наименьшего значения в точке а. ? 508
Лемма Даламбера. Доказательство теоремы 1.7 в значительной мере основано на следующей лемме, называемой леммой Даламбера. ЛЕММА 1.6. Пусть f (х) — полином положительной степени над полем комплексных чисел «аеС. Если f(a) Ф ФО, то существует такое комплексное число с, что \№\<\№\. Доказательство. Пусть f(x) = a0+...+anxn — полином степени п>0 и ?(а)фО. Разложим / по степеням разности х — а: (1) f(x) = c0 + c1(x-a)+...+cn(x-a)n, где^еС, сй = !(а)фО, спфО. Положим г — х —а и (2) g(z) = c0 + c1z + ...+cnzn. Пусть ст — ненулевой коэффициент полинома g о наименьшим положительным индексом (0<т^д); тогда (3) f(a + z) = g(z) = c0 + cmzm+cm+1z™+1 + ...+cnz». Определим h(z): ( Cm+i+...+CnZ4-™-1, если т < /г, если т = п. (4)М^0> Тогда равенство (3) можно записать в виде (5) g(z) = c0 + cmzm + z^h(z). В силу (1) —^=0. Обозначим через d какой-либо ко- ст рень m-й степени из числа (—с0/ст): (6) dm = -c0/cm. Рассмотрим в (5) значения z вида (7) z = Xd, где0<Я<1, JieR. В силу (5) и (6) получаем равенства g {Ы) = с0 - с0Хт+Xm^dm^h (Xd), ( ' g(Xd) = c0 [1 -Хт + %m^c-,4m^h(M)]. На основании (4) заключаем, что dm^h {Ы) = cm+1dm+1 +... + cndnfkn-m-x (m<n); 509
и ICdm+1ft(^)I<koh4kmn^+M+...+l^^](m<n). Положим теперь (9) В = { l^l"1H^+idm+1I + ---+lc^lb если т<п> \ О, если т~п. Отметим, что при т < п В > 0, поскольку сл и d отличны от нуля. Из (8) и (9) вытекает неравенство \§(М)\^\с0\[1-%™+№Щ = \с0\[1-№(1-%В)1 Если Я удовлетворяет условиям 0<Я<1, Я5<1, то |g(ta/)|<|c0|. А так как c0 = f(a) и в силу (3) g(kd) = = f(a + Xd), то 0<ft,<min{l, В-1} \f(a+Xd)\<\f(a)\, если при m<n, I 0<Я<1 при т = п.П Пусть <^ [а:] — кольцо полиномов от х над полем of. ОПРЕДЕЛЕНИЕ. Поле sF называется алгебраически замкнутым, если любой полином положительной степени из qF[x] имеет в поле ef хотя бы один корень. ТЕОРЕМА 1.7. Яоле комплексных чисел алгебраически замкнуто. Доказательство. Пусть f — произвольный полином положительной степени из F[x]. Если f(0) = 0, то нуль есть корень полинома f. Допустим, что f(0)=?0, и положим М = |/(0)|. Пусть г —такое положительное число, что (l)(VzeC)(|2|<r->iM^|f(e)|). Такое г существует в силу теоремы 1.1. Пусть /С = {г^С||г]^г}. В силу теоремы 1.5 функция |/| достигает наименьшего значения на множестве К, т. е. существует такое число а <= /С, что (2) |f(a)!^|/(z)| для всякого ге=/( (|z|<r0), в частности (3) \f(a)\^\f(0)\ = M. 510
Из (1) и (3) получаем (4)(VzeC)(|z|<r0->|f(a)|<|/(z)|). На основании (2) и (4) заключаем, что (5)(V2eC)(|/(a)|<|f(z)|). Если f(a)^0, то, по лемме Даламбера, существует такое комплексное число с, что \f(o)\<\f(a)\ (^с)- Однако последнее неравенство противоречит (5), поэтому случай, когда f(a)=^=0, невозможен. Следовательно, f(a) = = 0, т.. е. комплексное число а является корнем полинома f. ? СЛЕДСТВИЕ 1.8. Всякий полином из кольца &[х], степень которого больше единицы, приводим в кольце &[х\. Доказательство. Пусть }^^[х] и deg/>l. По теореме 1.7, существует аЕС такое, что f(a)=0. Тогда, по теореме 14.1.11, (х — а) делит Д т. е. существует такой полином g в ^[х], что f = (x — a)-g. При этом degg>0, поскольку deg/>l. Таким образом, полином f приводим в кольце ^[х]. СЛЕДСТВИЕ 1.9. Любой полином f положительной степени из кольца ^[х] можно единственным образом представить в виде произведения комплексного числа и нор- мированных линейных множителей, т. е. в виде (1) f = c(x-a1)...(x-an), где аъ ..., ап —корни полинома f (в С) и с —старший коэффициент полинома. Это утверждение вытекает из следствия 1.8 и теоремы 14.2.11 о разложимости полинома над полем в произведение нормированных неприводимых множителей. Если в разложении (1) с^, ..., ат суть все различные корни полинома / в С, то это разложение можно представить в виде (2) f = c(x-a1fi ... (я-ОяОЧ *i+...+ft« = n. Разложение (2) называется каноническим разложением полинома f на неприводимые множители. Число ks называется показателем кратности корня as. СЛЕДСТВИЕ 1.10. Всякий полином f положительной степени п из ^[х] имеет точно п комплексных корней, 511
если каждый его корень считать столько раз, какова его кратность. Формулы Виета. Установим зависимость между корнями и коэффициентами полинома. ТЕОРЕМА 1.11 (Виета). Пусть f = zn + c1zn-1 + ... ... + cn-1z-\-cn — полином над полем комплексных чисел и <*i> ..., аЛ —его корни; тогда с1=_(а1 + а2 + ... + аЛ); с2 = аха2 + сад, + - • • + a*-i<V. (1) св = — (а^аз +... + аЛ_2аЛ_!аЛ); сп = (—1)по^а2 ... аЛ. Доказательство. Так как о^, ..., ал — корни полинома f, то, по следствию 1.9, zn+c1zn-1+...+cn-1z+cn = (z--a1)(z--az) ... (г-аЛ). Перемножив линейные множители в правой части равенства, получим zn+c1zn'1 + ... + cn.1z + cn^zn-(a1 + ... + an)zn-1 + ... ,.. + (—1)пага2 ... ап. Из равенства двух полиномов от z следует равенство коэффициентов при одинаковых степенях z; приравнивая коэффициенты при одинаковых степенях z, получаем формулы (1). ? Формулы (1) называются формулами Виета. СЛЕДСТВИЕ 1.12. Если аъ ..., ап — корни полинома c0zn+cxzn~x+...+cn-xz+сп степени п из С [z], то JL = 0^2+OjCCg+...+ая-1«я; Со Упражнения 1. Разложите на линейные множители в кольце %[z] полиномы: (а) ga + Z+l+ft (Ь) 24 + 23 — 2 — 1. 2. Разложите на неприводимые множители полином 2*+323 + + 422+3z+l b?[z]hb <M\A- 3. Разложите полином zn— 1, где /г—натуральное число, отличное от 0 и 1, на линейные множители в ^[г]. 512
4. Сумма двух корней уравнения 2л?— л;2—7л;+Я=0 равна 1. Найдите X. 5. Определите X так, чтобы один из корней уравнения xz — 7x-\- -j-X = 0 равнялся удвоенному другому. 6. Зная, что полином zn+an_iZn-1-\-...-\-a1z+aQl где ап_19 ... ..., «о—-комплексные числа, имеет корни alt ...,an, вычислите произведение (0^+1) (а2+1) ... (ая+1). 7. Пусть 62<4ас, где а, Ь, с—действительные числа. Докажите, что фактор-кольцо <& [z]/(az2 + bz+c) изоморфно полю комплексных чисел. 8. Докажите утверждение, обратное теореме Виета (теорема 1.11): если имеют место формулы Виета (формулы (1)), то комплексные числа «1» ..., ап являются корнями полинома /=г/г+С1гЛ~*+...+сЛ над полем #, § 2. ПОЛИНОМЫ НАД ПОЛЕМ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ Сопряженность мнимых корней полинома с действительными коэффициентами. Пусть <М [х] — кольцо полиномов над полем действительных чисел &2. Напомним, что комплексное число а + Ы, где a, fceR, называется мнимым, если ЬфО. Если а = а-\-Ы, то через а будем обозначать сопряженное комплексное число а — Ы. ЛЕММА 2.1. Если f —полином из кольца <М\х\ и а — произвольное комплексное число, то f(a) = f(a). Доказательство непосредственно вытекает из теоремы 4.7.6. ТЕОРЕМА 2.2. Пусть f — произвольный полином из кольца <М\х\. Если а+Ы —мнимый корень полинома f, то а — Ы также является корнем этого полинома. Доказательство. Пусть a + 6t — корень полинома, т. е. /(а + Ь?) = 0. Тогда, по лемме 2.1, f(a-bi)=f{a + bi) = f(a + bi) = 0 = 0, т. е. f(a-bi) = 0. ? Неприводимые над полем действительных чисел полиномы. ТЕОРЕМА 2.3. Пусть f —полином, степень которого больше единицы, неприводимый над полем действительных чисел <&. Тогда существуют такие a, 6eR, что b ^ О и полином f ассоциирован с полиномом (х — а)2 + Ь2. Доказательство. По теореме 1.7, полином f имеет хотя бы один комплексный корень. Пусть а -\-Ы — корень полинома f, где a,b <= R. Если b = 0, то х — а делит Д что противоречит условию неприводимости f над е^. Следовательно, ЬфО. Применим к полиномам f и (х — а)2+ 6 теорему 513
о делении с остатком. Согласно этой теореме, в кольце <&[х] существуют полиномы q(x) и cx-{-d такие, что f(x) = q(x)[(x-ay + b2] + (cx+d), с, deR. Полагая в этом равенстве х = а+Ы, получаем f(a + bi) = c(a+bi) + d = 0, (ca+d) + bci = 0. Отсюда вытекает, что ca + d = 09 bc = 0. Так как ЬфО, то с = 0 и d = 0. Таким образом, № = q(x)[(x-ar+b*\. Поскольку, по условию, полином / неприводим над ей?, то степень полинома q(x) равна нулю. Следовательно, полином f ассоциирован с полиномом (х-а)2 + Ь2. ? СЛЕДСТВИЕ 2.4. В кольце <ffl\x\ неприводимы только полиномы первой степени и полиномы второй степени, ассоциированные с полиномами вида (х — а)2+Ь2, где а, Ь —любые действительные числа и ЬфО. Из следствия 2.4 и теоремы 14.2.11 вытекает следующая теорема. ТЕОРЕМА 2.5. Любой полином f положительной степени из кольца <М\х\ можно единственным образом представить в виде произведения действительного числа и неприводимых над <=!% полиномов не выше чем второй степени: f = dYl[(x-akY + bl]Jl(x-cs)9 где ЬкфО. k S СЛЕДСТВИЕ 2.6. Любой полином с действительными коэффициентами имеет четное число мнимых корней. СЛЕДСТВИЕ 2.7. Полином нечетной степени с действительными коэффициентами имеет хотя бы один действительный корень. СЛЕДСТВИЕ 2.8. Пусть f —полином степени п из <М\х\. Четность числа действительных кюрней полинома f совпадает с четностью числа п. Упражнения 1. Найдите полином наименьшей степени с действительными коэффициентами, имеющий корни г —1, я, —1 + iVs. 2. Разложите на неприводимые множители над полем действительных чисел полиномы: (a) xs+x+2; (b) х*+2х*+4; (с) л*—1; (d) x*— х*+\. 3. Разложите полином л?+4 на неприводимые множители: (а) над полем <ё\ (Ь) над полем ^\ (с) над полем $, 514
4. Разложите на непрйЁодймЫе множители над полем действительных чисел полином я4—ах2-\-\, где —2<са<:2. 5. Докажите, что полином xw+tf^+xW*2 делится на полином tf+x+L 6. Пусть f—полином над полем действительных чисел, у которого старший коэффициент и свободный член имеют разные знаки. Докажите, что полином / имеет хотя бы один действительный корень^ § 3. УРАВНЕНИЯ ТРЕТЬЕЙ И ЧЕТВЕРТОЙ СТЕПЕНИ Уравнения третьей степени. Уравнение (1) x*+px+q = 0 (р, ?еС) называется неполным кубическим уравнением. В уравнении (1) положим x=u + v, т. е. вместо одной переменной введем две. Получим {u + v)*+p(u + v) + q = 09 или (2) us+v3 + q + (3uv + p)(u + v) = 0. Потребуем, чтобы выполнялось условие 3uv+p = 0, т. е. условие uv = — р/3. При выполнении этого условия и и v удовлетворяют системе (3) u3+vz = — q, uv = — p/3. На основании (3), (2) и (1) заключаем: если (и, v) есть решение системы (3), то сумма u-\-v является решением уравнения (1). Покажем, что верно также обратное утверждение: если х есть корень уравнения (1), то существует такое решение (и, v) системы (3), что x = u-\-v. В самом деле, пусть х — корень уравнения (1). Рассмотрим уравнение У2-ху-р/3 = 0. Пусть и, v — его комплексные корни. Тогда, по формулам Виета, x = u + v, uv — — р/3. Так как х — корень уравнения (1), то (и, v) есть решение (2) и, следовательно, решение системы (3). Таким образом, зная решения системы (3), можно найти все корни уравнения (1). Система уравнений (4) u* + v3 = — q, u3v* = — p3/27, 515
очевидно, есть следствие системы (3). Числа и, v удовлетворяют (4) тогда и только тогда, когда числа иг, Vs являются корнями квадратного уравнения (5) z2 + <7Z-p3/27 = 0. Это уравнение называется разрешающим для уравнения (1). Его дискриминант обозначим через А: ^ 4 ^ 27 ' Корни zl9 z2 уравнения (5) выражаются формулами (6) гх = иъ = — q/2 + V&, z2 = v3 = — q/2-V~&. Отсюда находим девять решений системы (4). Отбирая из них только такие решения (и, v) системы (4), которые удовлетворяют условию uv =— р/3, получаем все решения системы (3). Система (3) имеет хотя бы одно решение. В самом деле, пусть (иг, 1^) есть какое-нибудь решение системы (4), тогда u\v\ =— р3/27. Значит, МЛ = — у> или щрг=*—-~-е, или ^1^ = — у-&2, где е3=1; поэтому %?>! = — у, ИЛИ %(У!82) = — -|~, ИЛИ «1(^8) = —^-. Следовательно, для любого значения и корня третьей степени из z± существует такое значение v корня третьей степени из z2, что uv = — р/3, т. е. пара (и, v) будет решением системы (3). Если и, иг, иг2 — значения корня третьей степени из г19 то им соответствуют v, юг2, юг — значения корня третьей степени из z2. Таким образом, если (и, ю) — какое-нибудь решение системы (3), то (и, ю), (иг, юг2), (иг2, юг) есть совокупность всех решений системы (3) — система (3) имеет три различных решения. Заключаем, что уравнение (1) имеет следующие решения: (7) х1 = и + ю, х2 = иг + юг2, х3 — иг2 + юг. ТЕОРЕМА 3.1. Пусть дано уравнение (1) x* + px+q = 0. 516
Пусть zt и z2 — корни разрешающего уравнения z2 + qz— — р3/27 = 0. Корни уравнения (1) выражаются формулами (1) x±=u + v, x2 = m + vs2, х3 = иг2 + иг, где и и v —числа, удовлетворяющие условиям (*) u2 = z1, v3 = z2, uv = — p/3, и г— мнимый корень третьей степени из единицы. Доказательство. Непосредственная проверка показывает, что x*+px+q делится на х — хъ причем частное равно х2+х1х+х\+р\ следовательно, (2) x3+px + q = (x — x1)(x2 + x1x+xl + p). Далее, имеем (3) (а: — х2)(х — х3)=х2 — (х2+х3)х+х2х3. В силу формул Виета (4) 1+е + е2 = 0 и г + е2 = — 1. Отсюда и из формул (I) следует, что (5) Xi-\-x2-\-x3 = 0, —(х2+х3) = х±. В силу формул (I), (*) и (4) получаем х2х3 = (иг + ve2) (иг2 + vs) = u2 + v2 + uv (г2 -f е) = — u2 + v2 — uv = (u + v)2 — 3uv = х\ + р, т. е. (6) x2x3 = xl + p. В силу (5) и (6) формулу (3) можно записать в виде (7) (# — х2)(х — х3) = х2+х1х+х\ + р. На основании (2) и (7) заключаем, что x3+px + q = (x — хг)(х — х2)(х — х3). П СЛЕДСТВИЕ 3.2. Корни уравнения (1) выражаются формулами (II) x± = u + v\ x2 = — ^{u + v) + i?f-{u-v)\ X* = — ~2(u + v)—1>I-2-{tl — v), где и и v —числа, удовлетворяющие условиям (*). 517
Доказательство. Формулы (И) ^олучакэтсй из 1 Vs формул (I), если положить 8 = — "2™*"Н2~# ^ Исследование корней уравнения третьей степени с действительными коэффициентами. Следующая теорема дает возможность определять число действительных и мнимых корней уравнения третьей степени. ТЕОРЕМА 3.3. Пусть (I) *3 + рх + <7 = 0 — уравнение с действительными коэффициентами и Д = = Т + ё-- Тогда: (a) если Д>0, то уравнение (1) имеет один действительный корень и два мнимых сопряженных', (b) если Д = 0, то корни уравнения (1) действительны и хотя бы один из них кратный; (c) если А<0, то все корни уравнения (1) действительны и различны. Доказательство. Первый случай: Д>0. В этом случае корни zx и z2 разрешающего уравнения действительны и различны. Следовательно, хотя бы один из них, например г19 отличен от нуля. Пусть и = (z1)V3 — арифметический корень из zx. Число v также является действительным числом, поскольку uv = — р/3. Так как г±фг2 и, значит, иъФьъ, то ифю. По следствию 3.2, (II) x1 = u + v> х% = — \{и + ь) + 1^-{и--ю), X3 = — \(u + v)-iX^{u--v). Поскольку и и v — действительные различные числа, из формул (II) следует, что хг — действительный корень, а х2 и лг3 — мнимые сопряженные. Второй случай: Д = 0. Если Д = 0 и qфO, то z1=z2 = = — q/2 Ф 0. Пусть и = (— q/2)x^ — арифметический корень из числа —q/2. Поскольку uv = p/3 есть действительное число, то v = (— q/2)V3, т. е. u = v=?0. В силу формул (II) отсюда следует, что х± = 2иф0, х2 = х3 =— и. Таким образом, при qФ0 уравнение (I) имеет три действительных корня, причем один из них двукратный. 518
Если же Д = 0 и <7 = 0, то и р = 0. В этом случае уравнение (1) имеет вид #3 = 0. Следовательно, х1 = х2 = хг = 0. Третий случай: Д<0. В этом случае z± =— q/2+УА, z2 = — q/2-V~K. Следовательно, zx и z2 — мнимые сопряженные числа, поэтому (1) \Zl\ = \z2\^0 И (2) гхфгг. В силу теоремы 3.1 существуют числа и и v такие, что (3) u3 = zl9 uv = — p/3, v3 = z2. Из (1) и (3) следует, что \u\3 = \v\3Ф0 и, значит, (4) \и\ = ^\ф0. Далее, в силу (2) (5) и Ф v. На основании (3) и (4; заключаем, что На основании (3) и (6) получаем (7) у = — тг-= — /=-.#= — —^-й = й. Из (5) и (7) следует, что и и v — мнимые сопряженные числа. По следствию 3.2 имеем: (И) *2 = — Y(u + v) + i^i-(u — v)l 1 1/2Г x3 = — Y(u + v) — iLY(u — v). Поскольку u = v и и Фи, из этих формул следует, что все корни х19 х2 и хв действительны. Кроме того, они попарно различны. Действительно, в силу формул (II) х2фх3. Допустим, что xt = x2. Тогда в силу формул (I) и-)Гх) = и&-\-ие2, откуда и(1 — г) = v(е2 — 1); поэтому и = = v&2. Отсюда вытекают равенства z± = z2 и Д = 0; однако последнее равенство противоречит условию Д<0. 519
Аналогично убеждаемся, что хгФх3. ? Уравнения четвертой степени. По методу Феррари решение уравнения четвертой степени сводится к решению некоторого вспомогательного уравнения третьей степени. Метод Феррари состоит в следующем. Данное уравнение четвертой степени с комплексными коэффициентами (1) x*+ax3 + bx2+cx + d = 0 запишем в виде л?+ах3 = — Ьх2 — сх — d. Прибавив к обеим частям уравнения а2#2/4, получим (*+?)'-(f-b)*-«-d. Далее, прибавив к обеим частям уравнения сумму (*+f)»+$. в левой части уравнения получим полный квадрат: (2) (x* + % + JL)* = (*-b+y)X^-c)X+^-d. Трехчлен справа зависит от параметра у. Подберем параметр у так, чтобы этот трехчлен был квадратом двучлена первой степени от х. Для того чтобы трехчлен Ах2+Вх+С был квадратом линейного двучлена от х, достаточно, чтобы В2 — 4ЛС = 0. В самом деле, при выполнении этого условия получаем Ах2+Вх+С = Ах2 + 2УЖх+С = (У~Ах+УС)2. Следовательно, в правой части (2) надо подобрать у так, чтобы выполнялось условие (Т—Г-Чт-*+») №- -) -* которое можно записать в виде (3) y*-by2 + (ac-4d)y-[c2 + d(a2-4b)] = 0. При выполнении этого условия правая часть уравнения (2) будет квадратом линейного двучлена от х. Решая вспомогательное уравнение (3), найдем один из его корней у0. Затем найдем числа т и п такие, чтобы квадрат двучлена тх + п был равен правой части равенства (2), тогда (4) (*2 + f- + f)2 = (m* + n)2, 520
где m = Т/ -^- — b+y0l n = l/^-—d. Решение уравнения (4) сводится к решению совокупности следующих двух квадратных уравнений: *2+lT + f = nvc + n9 x* + ^- + f = -mx-n. Решив эти два уравнения, найдем все четыре корня исходного уравнения (1). Упражнения 1. Решите следующие уравнения третьей степени: (а) *з_з*+2 = 0; (Ь) *з__бл:+4=0; (с) *3+3*--*+4 = 0; (d) x*+3x—2Z = 0. 2. Решите следующие уравнения четвертой степени: (a) х*+2х*+2х* + х—7 = 0; (b) &—&—&+2х—2 = 0; (c) *4+12*+3 = 0. 3. Докажите, что (*!—*2)2(*i —х3)2(х2 —*3)2=— 4р3—27q2f где хъ х2, х3—корни уравнения x*-{-px-{-q = Q. § 4. ОТДЕЛЕНИЕ ДЕЙСТВИТЕЛЬНЫХ КОРНЕЙ ПОЛИНОМА Система полиномов Штурма. Пусть / — полином с действительными коэффициентами, а и Ь, а < Ь — произвольные действительные числа, не являющиеся корнями полинома. Ниже методом Штурма решается задача о нахождении точного числа различных действительных корней полинома f в интервале а<х<Ь. Пусть дана конечная последовательность действительных чисел, например 2, 5, —3, 4, —5, —2, 7. Знаки чисел этой последовательности чередуются следующим образом: +, +> —, +, —, —, + и меняются четыре раза. Таким образом, в данной последовательности имеется четыре перемены знаков. Пусть / — полином положительной степени с действительными коэффициентами, не имеющий кратных действительных корней. Определим конечную последовательность полиномов /0, fl9 /2, ..., fm, исходя из данного полинома 521
f0 = /, следующим образом: /i = /', где f' — производная от /; fo = flrifi —fe /l = #2/2 "" IЗу lm-1 — Qmlm* Таким образом, мы применяем к полиномам f и f алгоритм Евклида (способ последовательное деления), изменяя при этом всякий раз знак остатка на противоположный. ОПРЕДЕЛЕНИЕ. Последовательность полиномов f0i h> fa» • • • 9 fm называется системой полиномов Штурма для }. Отметим некоторые свойства полиномов системы Штурма. СВОЙСТВО 4.L Любые два соседних полинома системы Штурма не имеют общих действительных корней. Доказательство. Это утверждение верно для полиномов f0 и М/о = Л fi = f')> так как / не имеет кратных действительных корней. Три рядом стоящие полинома связаны равенством (*) fk-i = qkfk — fk+i- В силу этого равенства одновременное обращение в нуль соседних полиномов fk и fk+1 повлекло бы за собой одновременное обращение в нуль /*_х и fk, затем то же для полиномов fk-2 и fk-х и т. д., наконец, для полиномов /0 и /х, что невозможно. ? СВОЙСТВО 4.2. Если у — действительный корень промежуточного полинома fk, l^k<m9 то числа fk-i{y) и fk+i(y) имеют разные знаки. Доказательство. В самом деле, если fk(y) = 0, то, полагая в равенстве (*) х = у, получаем /*-i(y) = = —f*+i(v). ? Теорема Штурма. При доказательстве теоремы Штурма будет использована следующая теорема Вейерштрасса: если действительная функция f непрерывна на отрезке [а, Ь] и числа /(a), f(b) имеют разные знаки, то / имеет корень между а и Ь. Пусть f — полином с действительными коэффициентами. Пусть для каждого действительного числа с w(c) обозначает число перемен знака в числовом ряде f0(c), fi(c), ... ..., fm(c), в котором опущены все нули. 522
ТЕОРЕМА (Штурма). Пусть f —полином с действа- тельными коэффициентами, не имеющий кратных действительных корней, и \Ч /0> /1> • • • » \т — система полиномов Штурма для f. Пусть аиЪ{а<,Ъ) — произвольные действительные числа, не являющиеся корнями полинома f. Число различных действительных корней полинома f в интервале (а, Ь) равно разности w(a) — w(b). Доказательство. Пусть М — множество всех действительных корней полиномов (1). Элементы множества М разбивают интервал (а, Ь) на подынтервалы. Внутри каждого такого подынтервала ни один из полиномов (1) не обращается в нуль. В силу теоремы Вейерштрасса отсюда следует, что внутри каждого подынтервала все полиномы (1) сохраняют свои знаки и, значит, число w(c) не изменяется. Нам остается исследовать, как изменится число w(c) при переходе через действительное значение у, в котором хотя бы один из полиномов (1) обращается в нуль, т. е. у е М. Пусть аир (а < Р) — внутренние точки двух соседних подынтервалов, примыкающих к точке у. Докажем, что разность до (ос) — до(Р) выражается формулами Предположим, что 7 — К0Рень полинома ffc9 где 1^ ^k<.m. По свойству 4.2, числа fk-i(y) и fk+i(y) имеют противоположные знаки. Поэтому в двух подынтервалах, примыкающих к у, значения полиномов Mi и Mi имеют противоположные знаки. Следовательно, число перемен знаков в последовательностях Mi(<*)> /* («), MiH и Mi(P)> MP), Mi(P) одно и то же, a именно равно единице. В остальных частях системы полиномов (1) число перемен знаков не меняется. Следовательно, в рассматриваемом случае до (а) — до(Р) = 0. Предположим теперь, что у — корень полинома / (/ = /о» /i = f')- Так как> по условию, полином / не имеет кратных действительных корней, то существует такой 523
полином g с действительными коэффициентами, что (3)/o(*) = (*-Y)g(*)> g(Y)?=0; следовательно, В силу (4) знак полинома /^ в точке у, а следовательно, и в обоих примыкающих к у подынтервалах совпадает со знаком числа g(y). В то же время в силу (3) знак /0 для каждого значения х совпадает со знаком (х — y)g(y). Следовательно, между /0(а) и /х(а) есть одна перемена знака, а числа f0(P) и /Х(Р) имеют один и тот же знак. При этом все остальные возможные перемены знака в ряде (1), как уже показано, сохраняются при переходе через точку у. Таким образом, в рассматриваемом случае w(a) — w($) = 1. Итак, доказано, что только при переходе через значение корня полинома f число w(c) уменьшается на единицу. Следовательно, число различных действительных корней полинома f равно разности w(a) — w(b). ? Теорема Штурма верна также и в том случае, когда полином имеет кратные действительные корни. Доказательство теоремы в этом случае несущественным образом отличается от доказательства, приведенного выше. Для определения числа всех различных корней полинома f с помощью теоремы Штурма удобно выбрать а и Ь такими, чтобы ни один полином системы Штурма не имел корней вне интервала а^х^Ь. Тогда знаки полиномов системы Штурма будут определяться знаками их старших коэффициентов. Действительно, для очень больших значений х знак полинома а0хп + а1хп-1+... + ап совпадает со знаком а0, а для очень больших по абсолютной величине отрицательных значений х знак полинома совпадает со знаком (—1)па0. Следовательно, при таком способе нет необходимости думать о том, как велики должны быть а и 6, так как достаточно знать только знаки старших коэффициентов полиномов системы Штурма для f и степени этих полиномов. Используя теорему Штурма, можно действительные корни полинома f отделить — найти интервалы, в каждом из которых лежит только один корень полинома /. Пример. Найдем число положительных и отрицательных корней полинома f == х* — 4х2+х +1. 524
Применив метод последовательного деления, находим для f следующую систему полиномов Штурма: f1 = 4*3-8x+l; fz = 8x2-3x-4; /=3 = 87л;-28; Для отрицательного и достаточно большого по абсолютной величине значения х ряд знаков будет +, —, +, —, + (четыре перемены знака). При х = 0 знаки совпадают со знаками свободных членов, т. е. +, +, —, —, + (две перемены знака). Таким образом, потеряны две перемены знака, следовательно, полином f имеет два отрицательных корня. Для положительного достаточно большого значения х имеем знаки старших членов +, +, +, +, + (нуль перемен знака). Следовательно, полином имеет два положительных корня. Упражнения 1. Составьте полиномы Штурма и отделите корни полиномов: (а) я5*—3*—3; (Ь) **—*—1; (с) я*—4*4-4**—4; (d) л;* — — 4*2—1. 2. Определите с помощью теоремы Штурма число действительных корней полинома *5+ /?* + # с действительными коэффициентами р и q. 3. Определите с помощью теоремы Штурма число действительных корней полинома xn-\-px-\-q при действительных р и q. 4. Докажите, что если система Штурма для полинома / степени п с действительными коэффициентами состоит из /г+1 полиномов, то число перемен знака в ряду старших коэффициентов полиномов Штурма равно числу пар сопряженных комплексных корней полинома /. 5. Найдите число действительных корней полинома я4—2*2 + + 4*—1. Между какими последовательными целыми числами лежат эти корни?
Глава семнадцатая ПОЛИНОМЫ НАД ПОЛЕМ РАЦИОНАЛЬНЫХ ЧИСЕЛ И АЛГЕБРАИЧЕСКИЕ ЧИСЛА § 1. ЦЕЛЫЕ И РАЦИОНАЛЬНЫЕ КОРНИ ПОЛИНОМА. КРИТЕРИЙ НЕПРИВОДИМОСТИ Целые и рациональные корни полинома. Следующая теорема дает возможность найти рациональные корни полинома с целыми коэффициентами. ТЕОРЕМА 1.1. Пусть т и q —целые взаимно простые числа и щФ§. Если ml q —корень полинома aQ+a1x+... ...+апхп с целыми коэффициентами, то т делит а0 и q делит ап. Доказательство. По условию, i я* i I (т \п~г т (т\п л <к+а1 —+...+а№-1[—) +<Цу; =°- Умножив обе части равенства на qny получим (1) a^qn+axmqn-'1+...+an-1mnr-1q + аптп = 0. На основании равенства (1) заключаем, что т делит a0qn. А так как числа т и q — взаимно простые, то взаимно простыми будут числа т и qn. Следовательно, т делит а0. В силу (1) q делит аптп. Кроме того, числа q и тп — взаимно простые, так как, по условию, числа q и т — взаимно простые. Следовательно, q делит ап. ? СЛЕДСТВИЕ 1.2. Если целое число т есть корень полинома а^-\-ахх-\-.^-\-апхп с целыми коэффициентами, то т делит свободный член ПОСЛЕДСТВИЕ 1.3. Рациональный корень нормированного полинома ао+ахх-\-...+хп с целыми коэффициентами является целым числом. Критерий неприводимости Эйзенштейна. Вопрос о приводимости полинома в кольце й[х] сводится к вопросу о приводимости в кольце %[х\. ПРЕДЛОЖЕНИЕ 1.4. Пусть f — полином из кольца полиномов %[х]. Если полином f приводим в кольце &[х], то он приводим в кольце %\х\. 526
Поскольку поле & является полем частных кольца % целых чисел, то предложение 1.4 непосредственно следует из леммы 14.3.5. ТЕОРЕМА 1.5 (критерий Эйзенштейна). Пусть f = = с0+сгх+...+спхп — полином с целыми коэффициентами. Пусть все коэффициенты полинома /, кроме старшего, делятся на какое-нибудь простое число р и свободный член с0 не делится на р2. Тогда полином f неприводим в кольце й[х]. Доказательство. Допустим, что полином f приводим в кольце &[х]. Тогда в силу предложения 1.4 он приводим в кольце %[х], т. е. в Z[x] существуют такие полиномы g и h положительной степени, что f = gh. Пусть g = flb+---+e***i h = b0+... + bmxm (акфО, ЬтфО); тогда (1) f=(a0+...+akxk)(bQ+...+bmxm)=c0+c1x+...+cnxn, причем l^k, m<.n, (2) с0 = а0Ь0, (3) cn = akbm. По условию, (4) p\cq, p2^c0. В силу (2) и (4) только одно из чисел а0 и Ь0 делится на р; пусть (5) p\aQ, pjfb0. По условию, р\сп. Отсюда в силу (3) следует, что (6) pfak. Пусть as — не делящийся на р коэффициент полинома g с наименьшим индексом, т. е. (7) р\а0, ..., р\а3-ъ p<\-as (l^s^k<n). В силу (1) коэффициент cs можно представить в виде cs=ajj0 + (fl^-A+...+a0bs) (s<n). Из (7) следует, что р делит <Va&:L+...+aA, а так как Р не делит 60 и as, то р не делит csy причем s^&<n. Это противоречит условию теоремы, поскольку, по условию, р делит коэффициенты с0, съ ..., сп-г. ? 527
СЛЕДСТВИЕ 1.6. Если р —простое число и п —любое целое положительное число, то полином хп — р неприводим в кольце @[х]. Упражнения. 1. Докажите, что- полином / с целыми коэффициентами не имеет целых корней, если /(0) и /(1) —нечетные числа. 2. Установите, какие из следующих полиномов неприводимы над полем рациональных чисел: (а) 2x5+6x4—9*2-1-12; (Ь) х*+х+\; (с) х2+Зх-4; (d) л* —12; (е) хз+х—2; (f) л*_Зх+5; (g) х*—2х+Ъ. хР 1 3. Докажите, что полином т-=л:Р~*ж+#р~2+...+#+1, где х — 1 р —простое число, неприводим надполем рациональных чисел. 4. Докажите, что полином лЗ—р, где р —простое число, неприводим над полем рациональных чисел. 5. Для каких целых чисел п полином xz-\~n приводим над полем рациональных чисел? 6. Для каких целых чисел тип полином тх3+п приводим над полем рациональных чисел? 7. Разложите полиномы я6 — 1 и х8 — 1 на неприводимые над полем рациональных чисел множители. 8. Найдите условия приводимости полинома л;4+ах2 + р, где а, Р — рациональные числа, над полем рациональных чисел. 9. Докажите, что если полином f неприводим над полем (^ рациональных чисел, то полином f(ax+$), где а, ? —рациональные числа иа^О, также неприводим над полем (?. § 2. ПРОСТОЕ АЛГЕБРАИЧЕСКОЕ РАСШИРЕНИЕ ПОЛЯ Простое расширение поля. Пусть с?5 [х] — кольцо полиномов от х над полем ЗР, где ^ — подполе поля qF. Напомним,, что элемент а поля qF называется алгебраическим над полем <^, если а является корнем какого- нибудь полинома положительной степени из Ф [х]. ОПРЕДЕЛЕНИЕ. Пусть № -^gF и a<=F. Простым расширением поля &> с помощью элемента а называется наименьшее подполе поля of, содержащее множество Р и элемент а. Простое расширение S5 с помощью а обозначается через S5 (а), основное множество поля & (а) обозначается через Р(а). Пусть а??, $[х] — кольцо полиномов от # и P[d\ = {f{a)\feP[x]}, т. е. Р [а] есть множество всех выражений вида а0+аха+... .. .-\-апап, где а0, alt ..., ап^Р и п — любое натуральное число. 528
Легко видеть, что алгебра <Р[а], +, —, •, ^ — под- кольцо поля ЯР (а) — является кольцом; это кольцо обозначается символом ЯР [а]. ТЕОРЕМА 2.1. Пусть ЯР [х\ —кольцо полиномов от х над ЯР и ЯР (а) — простое расширение поля ЯР. Пусть о|)— отображение Р[х] на Р[а] такое, что /ф(/)=/(а) для любого f из Р[х]. Тогда: (a) для любого а из Р о|)(а) = а; (b) ф(*)=а; (c) г|) является гомоморфизмом кольца ЯР [х] на кольцо ЯР [а]; (d) Kerq = {f<=P[x]\f(a)=0}; (e) фактор-кольцо ЯР [х]/Кег^ изоморфно кольцу ЯР[а\. Доказательство. Утверждения (а) и (Ь) непосредственно следуют из определения -ф. Отображение г|э сохраняет главные операции кольца ЯР[х\, так как для любых/ и g из Р[х] *(F+*)=/(a)+*(a). *(&)=/(<*)*(«)¦ *0) = 1. Далее, по условию, г|) есть отображение Р [х] на Р [а]. Следовательно, 'ф является гомоморфизмом кольца ЯР\х\ на кольцо ^[а]. Утверждение (d) непосредственно следует из определения отображения -ф. Поскольку *ф — гомоморфизм кольца ЯР[х\ на ЯР [а], то, по теореме 13.1.6, фактор-кольцо ЯР [#]/Ker г|э изоморфно кольцу ЯР [а]. П СЛЕДСТВИЕ 2.2. Пусть а —трансцендентный элемент над полем ЯР. Тогда кольцо полиномов ЯР\х~\ изоморфно кольцу 5s [а]. Доказательство. В силу трансцендентности а над ЯР Kera|i = {0}. Поэтому, согласно теореме 13.1.6, ЯР[х]/{0}^ ^ЯР[а]. Кроме того, фактор-кольцо кольца ?Р[х] по нулевому идеалу изоморфно ЯР[х]. Следовательно, ЯР[х]^ О^ЯР[а]. П Минимальный полином алгебраического элемента. Пусть ЯР [х] — кольцо полиномов над полем ЯР. ОПРЕДЕЛЕНИЕ. Пусть a — алгебраический элемент над полем ЯР. Минимальным полиномом элемента а над ЯР называется нормированный полином из ЯР\рс\ наименьшей степени, корнем которого является а. Степень минимального полинома называется степенью элемента а над ЯР. 529
Легко видеть, что для всякого элемента а, алгебраического над gK существует минимальный полином. ПРЕДЛОЖЕНИЕ 2.3. Если а — алгебраический элемент над полем &>, a g и ф — его минимальные полиномы над&>, то ? = ф. Доказательство. Степени минимальных полиномов g и ф совпадают. Если g-ф^у то элемент а (степени п над I5) будет корнем полинома g — ф, степень которого меньше степени полинома ф (меньше п), что невозможно. Следовательно, ? = ф. ? ТЕОРЕМА 2.4. Пусть а —алгебраический элемент степени п над полем ^(афР) и g — его минимальный полином над g7\ Тогда: (a) полином g неприводим в кольце S5 [х]; (b) если /(а)=0, гдг feP[4 то g делит f; (c) фактор-кольцо oP[x]/(g) изоморфно кольцу <^[а]; (d) &[x]/(g) является полем; (e) кольцо ^[а] совпадает с полем ^(а). Доказательство. Допустим, что полином g приводим в кольце qP[x], т. е. существуют в Р[х] такие полиномы ф И ft, ЧТО g = q*, l<degф, deg/i<degg = n. Тогда g (а)=ф (a) h (а) = 0. Так как & (а) — поле, то ф (а) = 0 или /г(а) = 0, что невозможно, поскольку, по условию, степень элемента а над 3* равна п. Предположим, что / ^Р[х] и /(а) = 0. По условию, g(cx) = 0. Следовательно, f и §*не могут быть взаимно простыми. Поскольку полином g неприводим, то g делит /. Пусть "ф — гомоморфизм кольца ?Р[х] на кольцо &*[а] (i|) (/) = f (а) для всякого f из Р[х]), рассмотренный в теореме 2.1. В силу (Ь) ядро гомоморфизма я|) состоит из кратных полинома g, т. е. Kerof==(g). Следовательно, по теореме 13.1.6, фактор-кольцо & = SP [x]/(g) изоморфно кольцу в5 [а]. Поскольку Р[а]сР(а), то ^[а] есть область целостности. Так как <^^<^[а], то фактор-кольцо &* также есть область целостности. Нам надо показать, что любой ненулевой элемент f из 8* обратим в $\ Йусть f — элемент смежного класса /. Так как f^O, то /(а)=^0; поэтому 530
полином g не делит полином f. Поскольку полином g неприводим, отсюда следует, что полиномы / и g —взаимно простые. Следовательно, в Р[х] существуют такие полиномы и и v, что uf-\-vg=l. Отсюда вытекает равенство af = l, показывающее, что элемент f обратим в кольце W. Итак, установлено, что фактор-кольцо ?Р является полем. В силу (с) и (d) <^[a] является полем и поэтому P(a)czP[a]. Кроме того, очевидно, Р[а]сР(а). Значит, Р[а] = Р(а). Следовательно, кольцо е^[а] совпадает с полем <^(а). П Строение простого алгебраического расширения поля. ТЕОРЕМА 2.5. Пусть а —алгебраический над полем 8* элемент положительной степени п. Тогда любой элемент поля <^(а) однозначно представим в виде линейной комбинации п элементов 1, а, ..., а71'1 с коэффициентами из Р. Доказательство. Пусть (5 — любой элемент поля ^(а). По теореме 2.4, Р(а) = Р[а]\ следовательно, существует в Р[х] полином f такой, что (1) р=/(а). Пусть g — минимальный полином для а над <^; в силу условия теоремы его степень равна п. По теореме о делении с остатком, существуют в Р [х] полиномы h и г такие, что (2) f=zgh + rf где г = 0 или degr<degg = ft, т. е. г = с0+с1х+.. .+сп^1хп~1 (ъ <= Р). Полагая в (2) х = а и учитывая равенство (1), имеем (3) р = с0+с&+...+«wx*-1. Покажем, что элемент j3 однозначно представим в виде линейной комбинации элементов 1, а, ..., а"-1. Пусть (4) $ = d0 + d1a + ... + dn._1a»-* (ЪеР) — любое такое представление. Рассмотрим полином ср q> = (c0-dQ) + (c1--di)X+...+(cn~1--dn-1)xn-1. Случай, когда степень ер меньше п, невозможен, так как в силу (3) и (4) ф(а) = 0 и степень ф меньше степени g. Возможен лишь случай, когда ф = 0, т. е. с0 = d0,..., сп-г = = dn-x. Следовательно, элемент р однозначно представим в виде линейной комбинации элементов 1, а, ..., аяа; П 531
Освобождение от алгебраической иррациональности в знаменателе дроби. Задача об освобождении от алгебраг ической иррациональности в знаменателе дроби состоит в следующем. Пусть а — алгебраический элемент степени п>\ над полем <^; / и h — полиномы из кольца полиномов ^[х] и к{а)фЪ. Требуется представить элемент •{ггх ef(a) в виде линейной комбинации степеней эле- tl (СС) ч ' мента ос, т. е. в виде ф(а), где феР[4 Эта задача решается следующим образом. Пусть g— минимальный полином для а над 8*. Так как, по теореме 2.4, полином неприводим над <^ и /i(a)=^=0, тоgнаделит h и, значит, полиномы h и g — взаимно простые. Поэтому существуют в Р[х] такие полиномы и и у, что (1) uh + vg=l. Поскольку g(a) = 0, из (1) следует, что и(а)А(оь) = 1, Тфу-= "(<*)• Следовательно, f(a)/h(a)==f(a)u(rx)9 причем f, u^P[x] и/(а)и(а)?Р[а]. Итак, мы освободились от иррациональности в знаменателе дроби -г-рр Упражнения 1. Найдите минимальный полином для а над полем с?5, если: (а) а=— и &> = <&; (b)a = i/2, <^ = ^; (с) a=t/2; ff^fi; (d) а = -у + *-^-, <^ = $; (е) a-f^2f e»=fi. 2. Освободитесь от алгебраической иррациональности в знаменателе Дроби -г-^ г-г= . ^4—2^2 — 1 3. Освободитесь от иррациональности в знаменателе дроби /2 + 21/2-1 ' § 3. СОСТАВНОЕ АЛГЕБРАИЧЕСКОЕ РАСШИРЕНИЕ ПОЛЯ Конечное расширение поля. Пусть «^ — подполе поля oF. Тогда мы можем рассматривать gF как векторное пространство над S5, т. е. рассматривать векторное пространство (F, +, {©х|Ье=Р}>, 532
где со^ —операция умножения элементов из F на скаляр Я<=Р. ОПРЕДЕЛЕНИЕ. Расширение «Г поля еТ5 называется конечным, если of, как векторное пространство над &, имеет конечную размерность. Эта размерность обозначается через [af: &]. ПРЕДЛОЖЕНИЕ 3.1. Если а —алгебраический элемент степени п над 8*, то [<^(а): <^] = я. Это предложение непосредственно следует из теоремы 2.5. ОПРЕДЕЛЕНИЕ. Расширение еГ поля @> называется алгебраическим, если каждый элемент из/7 является алгебраическим над еР. ТЕОРЕМА 3.2. Любое конечное расширение <У поля &> является алгебраическим над ЯР. Доказательство. Пусть n-размерность «зГ над 5s. Теорема, очевидно, верна, если /i = 0. Предположим, что п>0. Любые /г+1 элементов из F линейно зависимы над <Э\ В частности, линейно зависима система элементов 1, а, ..., ап, т. е. существуют в Р такие элементы с0, cv ..., сл, не все равные нулю, что Следовательно, элемента является алгебраическим над #*. П Отметим, что существуют алгебраические расширения поля, не являющиеся конечными расширениями. Составное алгебраическое расширение поля. Расширение оГ лоля $> называется составным, если существует возрастающая цепочка подполей SSt поля oF такая, что ^=^0^^1-5...^ = / и k>l. ТЕОРЕМА 3.3. Пусть gF — конечное расширение поля X и «# —конечное расширение поля в5. Тогда of является конечным расширением поля SP и (I) [^\Щ^[^\ХУ[Х\Щ. Доказательство. Пусть (1) al9 . . . , 0Lm — базис поля X над 6* (как векторного пространства) и (2) plf ..., рл — базис поля of над «5?. Любой элемент d m F можно линейно выразить через базис: (3) d = /1Pi+...+Wi.('*e=L). 533
Коэффициенты lk можно линейно выразить через базис (1): (4) /* = Pife^ + ... + pmkam (pik <= P). Подставляя выражения для коэффициентов lk в (3), получаем *е{1, ..., т} fte{i, ... * гг} Таким образом, каждый элемент поля sF представим в виде линейной комбинации элементов множества Б, где Д = {о|РЛ|*е{1, ..., m}, ?<={*, ..., ft}}. Отметим, что множество В состоит из пт элементов. Покажем, что В есть базис оГ над полем с?5. Нам надо показать, что система элементов множества В линейно независима. Пусть (5) 2'i*a*P* = 0, i, ft где cik e P. Так как система (2) линейно независима над X, то из (5) следуют равенства (6) clkax+ ...+cmkam = 0 (&=1, ..., п). Поскольку элементы аъ ..., ат линейно независимы над с?5, то из (6) следуют равенства clk = 0, ..., cmk = 0 (ft=l, ..., п), показывающие, что все коэффициенты в (5) равны нулю. Таким образом, система элементов В линейно независима и является базисом ©Г над $\ Итак установлено, что [аГ, &b] = nm = [Jr :<%]•[%:&>]. Следовательно, <# является конечным расширением поля S5 и имеет место формула (I). ? ОПРЕДЕЛЕНИЕ. Расширение oF поля еТ5 называется составным алгебраическим, если существует возрастающая цепочка подполей поля ^ (1) ^ = c§?0Hc§?14...-4cS?A = sF (ft>l) такая, что при /=1, ..., k поле Xi является простым алгебраическим расширением поля Х^г, Число k называется длиной цепочки (1). СЛЕДСТВИЕ 3.4. Составное алгебраическое расширение <У поля &> является конечным расширением поля 3*. 534
Доказательство легко проводится индукцией по длине цепочки (1) на основании теоремы 3.3. ТЕОРЕМА 3.5. Пусть av ..., ak — алгебраические над полем & элементы поля of. Тогда поле &{аъ ..., ak) является конечным расширением поля с7\ Доказательство. Пусть <5?о = <2\ ^i = ^[cci], X* = &[<hf «J. ••> ^ = Тогда ?1 = Sb[al] есть простое алгебраическое расширение поля cS?0» <3?2 есть простое алгебраическое расширение поля Х19 так как Я^ЩЪ, a2] = (^[a1])[a2]==^1[a2] = i?1(a2) и т. д. Таким образом, oft = <5?0 -"§ «5?! """?... ""3 обk = 2F , где %i = ?i-i(a,i) при t = l, ..., &, т.е. каждый член цепочки (2) является простым алгебраическим расширением предшествующего члена цепочки. Итак, поле qF является составным алгебраическим расширением поля <Э\ Следовательно, в силу следствия 3.4 поле oF является конечным расширением поля <9Ч ? СЛЕДСТВИЕ 3.6. Составное алгебраическое расширение поля является алгебраическим расширением этого поля. Простота составного алгебраического расширения поля. ТЕОРЕМА 3.7. Пусть числовое поле еГ есть составное алгебраическое расширение поля <3*. Тогда of является простым алгебраическим расширением поля 8*. Доказательство. Пусть ^ -^>? -><zF, причем L = = P(a), F = L((5) и, следовательно, F = P(a, P). Пусть f и g — минимальные полиномы над S5 соответственно для чисел а и р и deg/ = /n, degg = n. Полиномы fug неприводимы над Ф и, следовательно, не имеют в поле ^ комплексных чисел кратных корней. Пусть a = ax, ..., am —корни полинома / в С и P = Pi, ..., рл —корни полинома g в С. Рассмотрим конечное множество М: 535
Поскольку о?5 —числовое множество (и, значит, бесконечное), то в Р существует число с, отличное от элементов множества М, с^Р\М, сфМ. Пусть (1) v = a+cp. Тогда выполняются соотношения (2) у^щ + фь (te{l, ..., m}, k<={2, ..., п}). В самом деле, в случае равенства a -f-cjJ = o^+фк было бы Р —Pfe что противоречило бы выбору числа с. Пусть Qr1 = ^s(7) и gF1 [х] — кольцо полиномов от а:. Пусть h = f(y — cx) — полином из Fx[x\ (у, ceP(v)=F1). Покажем, что х — р есть наибольший общий делитель полиномов й g в кольце <Ух\х\ Так как g(P)=0, то х— р делит g в ^[х]. Далее, в силу (1) A(P) = /(Y-tf)=/(a) = 0. Поэтому л; —р делит полином Л в &[х]. Таким образом, # —Р есть общий делитель h и g в кольце ^[х]. Докажем, что g и h в С не имеет корней, отличных от р. В самом деле, допустим, что Р*, &е{2, ..., п}, есть их общий корень. Тогда h($k)=f(y — c$k) = 0. Следовательно, найдется такой индекс iGJl, ..., m}, что y = a,i-\-c$k (k>l), а это противоречит (2). На основании этого заключаем, что х — Р есть наибольший общий делитель g и h в сё\х\ Поскольку х — Р — нормированный полином, то отсюда следует, что х — Р является наибольшим общим делителем g и h в кольце <зГг[х]. Поэтому (*-Р)е^М и Pefi = P(T). Кроме того, а = у —cP^Fi. Таким образом, F = P(a-, pjcFx, FlC:F. Следовательно, F = P(y). Далее, так как у (как и всякий элемент из F) есть алгебраический элемент над S5 и еГ = = ^(т)» то поле ^r = <^5(v) является искомым гтростым алгебраическим расширением поля 5s. ? Поле алгебраических чисел. В классе подполей поля комплексных чисел одним из наиболее важных является поле алгебраических чисел. 536
ОПРЕДЕЛЕНИЕ. Алгебраическим числом называется комплексное число, являющееся корнем полинома положительной степени с рациональными коэффициентами. Отметим, что алгебраическое число есть любое комплексное число, алгебраическое над полем й. В частности, любое рациональное число является алгебраическим. ТЕОРЕМА 3.8. Множество А всех алгебраических чисел замкнуто в кольце ^ = <С, +> —, •, 1) комплексных чисел. Алгебра &# = (А, +> —, •, 1) является полем, подполем поля W. Доказательство. Пусть а и 6 —любые элементы из Л. По следствию 3.6, поле $(а, Ь) является алгебраическим над &. Поэтому числа а + 6, —a, ab, 1 являются алгебраическими, т. е. принадлежат множеству А. Таким образом, множество А замкнуто относительно главных операций кольца fS. Поэтому алгебра orf — подкольцо кольца ^ — является кольцом. Кроме того, если а —ненулевой элемент из Л, то arx GQ(a, V) и поэтому яг1 принадлежит Л. Следовательно, алгебра orf есть поле, подполе поля ^. ? ОПРЕДЕЛЕНИЕ. Поле от? = (А, +, —, •, 1> называется полем алгебраических чисел. Алгебраическая замкнутость поля алгебраических чисел. ТЕОРЕМА 3.9. Поле алгебраических чисел алгебраически замкнуто. Доказательство. Пусть orf[x] — кольцо полиномов от х над полем ©^ алгебраических чисел. Пусть f = a0 + a1x+... + anxn (a0, ..., anz=A) — любой полином положительной степени из А[х]. Нам надо доказать, что f имеет корень в Л. Так как f^C[x] и поле ^ алгебраически замкнуто, то f имеет корень в ^, т. е. существует такое комплексное число с, что /(с) = 0. Пусть Х = ща0, ..., ап) и X(с) — простое алгебраическое расширение поля X с помощью с. Тогда б -^Х -^Х(с), Х(с) есть конечное алгебраическое расширение поля X. По теореме 3.2, X есть конечное расширение поля й. В силу теоремы 3.3 X (с) является конечным расширением поля U. Отсюда, по теореме 3.2, следует, что поле X (с) является алгебраическим расширением поля & и, значит, се Л. Таким образом, любой полином из А[х] положительной степени имеет в Л корень, т. е. поле о^ алгебраически замкнуто. ? 537
Упражнения 1. Найдите степень поля У над полем сТ5, если: (a) &=&(№ \Г% «*=fi; (b) ^-fi0/2,^5), ^ = й(^2); (с) ^ = е^, <^ = е^. 2. Найдите базис и степень поля & над полем е?5, если: (а) У=&{1> №*&' = (& (Ь) ^=еЯ<-0. ^=<^; (с) #¦=*. 3. Пусть / и g—полиномы над полем рациональных чисел, имеющие общий действительный корень. Докажите, что fug имеют общий делитель положительной степени с рациональными коэффициентами. 4. Докажите, что неприводимый над числовым полем полином не имеет кратных корней в поле комплексных чисел. 5. Докажите, что комплексное число есть алгебраическое число тогда и только тогда, когда оно является корнем полинома положительной степени с целыми коэффициентами. § 4. УСЛОВИЯ РАЗРЕШИМОСТИ УРАВНЕНИЯ ТРЕТЬЕЙ СТЕПЕНИ В КВАДРАТНЫХ РАДИКАЛАХ Понятие разрешимости уравнения в квадратных радикалах. ОПРЕДЕЛЕНИЕ. Поле <зГ называется квадратичным расширением поля S5, если существует такой элемент а, что Р = Р(а), афР, а2е=Р. Примеры. 1. Поле $(21/2) есть квадратичное расширение поля й. 2. Поле d%(i) является квадратичным расширением поля <М. 3. Поле йф1'8) не является квадратичным расширением поля б. Говорят, что уравнение (1) xn+alxn-1+.9.+an^1x+an=^0 ^gQ) разрешимо в квадратных радикалах, если его корни можно выразить рационально (т. е. с помощью операций сложения, вычитания, умножения и деления) через корни цепочки двучленных квадратных уравнений: *2 — a0 = 0, a0eQ=F0; *2_ai==o, alsF1 = Fo(l/^; х2 — a2 = 0, a2eP2 = P1(]/*cx1); д;2-аА-1 = 0, a*-i e PA-X == P*_2 ("J/ ak^). 538
Таким образом, все корни уравнения (1) рационально выражаются через числа У~Ор, V^v • • • > 1/oca-i и принадлежат полю вГЛ = вГА-1(|/гаЛ_1). Другими словами, уравнение (1) разрешимо в квадратных радикалах, если существует возрастающая цепочка числовых полей такая, что каждое поле oF* цепочки является квадратичным расширением предыдущего поля of^ и поле &k содержит все корни уравнения (1). ОПРЕДЕЛЕНИЕ. Говорят, что уравнение (1) разрешимо в радикалах, если его корни можно выразить рационально через корни цепочки двучленных уравнений: хп° — a0 = 0r aGQ=F0; *«i — ax = 0, a1e/r1 = F0(i/"a0); л;"* - а2 = 0, a2Ef2 = Fx fi/aO; ^ft-i_ал-1 = о, aA_xe=JVi = Fk_2{ k~ftak-2). Таким образом, все корни уравнения (1) рационально вы- ражаются через числа у а0, ..., у а^ и принадлежат полю <Pk = fk-i\ k'V^kX)- Условия разрешимости уравнения третьей степени в квадратных радикалах. ТЕОРЕМА 4.1. Уравнение третьей степени (1) x*+ax2 + bx + c = 0 с рациональными коэффициентами разрешимо в квадрат- ных радикалах тогда и только тогда, когда оно имеет хотя бы один рациональный корень. Доказательство. Если полином f = x?+ax2 + bx+c имеет хотя бы один рациональный корень, например d, то полином можно представить в виде где е, gGQ. Поэтому уравнение (1) разрешимо в квадратных радикалах. Предположим, что уравнение (1) разрешимо в квадратных радикалах и не имеет рациональных корней. Тогда 539
существует такая цепочка квадратичных расширений (2) Q^ocFiC.cfHcF*, что хотя бы один из корней хъ х29 х3 уравнения (1) содержится в Fk\Fk-l9 например (3) Xl^Fk\Fk^ и ни один из корней хг, х2> х3 уравнения (1) не содержится в Fk-l9 (4) {х19 х2, х8}П^1=ф. Поле qFu есть квадратичное расширение поля Fk-l9 т. е. существует элемент ае?Д^и такой, что (5) Fk^Fk^(a)y a^FA^, a2sFH. На основании (3) и (5) заключаем, что (6) Xl = p + qa, где р, q<=Fk-l9 q?=0. Непосредственная проверка показывает, что p — qa также является корнем полинома /. В самом деле, (7) f(p + qa) = (p + qa? + a(p + qa)* + b(p + qa) + c = = А+Ва, где A=f(p) + 3pq*a* + aq*a*, К } B = 3p2q + q3a2 + 2apq + bq. Так как Л, B^Fk-! и a^Fk-l9 то из (9) f(p + qa) = A + Ba = 0 следует, что (10) А = 5 = 0. На основании (7), (8), (9) и (10) заключаем, что f(p-qa) = A-Ba = 0. Таким образом, р — qa есть также корень полинома f. Пусть x2 = p — qa. Тогда в силу (6) х± — x2 = 2qa=?0 и, значит, хгфх2. По формулам Виета, хг+х2 + х3 =— а. Кроме того, в силу (6) х± + х2 = 2р е Ffe-i. Поэтому #3 = — a — 2/? е F/j_i> что противоречит предположению (4). Q СЛЕДСТВИЕ 4.2. Уравнение (1) с рациональными коэффициентами разрешимо в квадратных радикалах тогда и 540
только тогда, когда полином xs + ax2 + bx + c неприводим в кольце &[х\. Примеры задач, неразрешимых в квадратных радикалах. В геометрии доказывается, что корни уравнения х3+ах2 + Ьх+с=0 с рациональными коэффициентами могут быть построены циркулем и линейкой тогда и только тогда, когда это уравнение разрешимо в квадратных радикалах, т. е. когда решение этого уравнения сводится к решению цепочки квадратных уравнений. Задача об удвоении куба. Построить ребро куба, объем которого вдвое больше объема данного куба. Нам дан только отрезок — ребро данного куба; примем этот отрезок за единичный. Тогда длина х ребра искомого куба удовлетворяет уравнению (1) х3-2 = 0.. Это уравнение неразрешимо в квадратных радикалах, так как не имеет рациональных корней. Следовательно, корни уравнения (1) не могут быть построены циркулем и линейкой. Задача о трисекции угла. Разделить данный угол на три равные части. Мы можем считать, что даны два луча, исходящие из точки О и образующие угол ср. Проведем дугу круга единичного радиуса. Построим точку А такую, что отрезок О А имеет длину а = cos ф. Обратно: зная отрезок О А длины coscp, легко построить угол циркулем и линейкой. Поэтому мы можем считать, что искомым является угол x = cos-|-. Так как coscp + tsin<p = fcos -?- + tsin |j = = cos3 f - 3cosf sin2|- + i (3cos21- sin | - sin31), TO cos ф = cos31- — 3cos I sin21 = = cos31- — 3cos|- (1 — cos2 ^ j и 4cos3 -|— 3cos -|-—cos ф = Oo 541
Поскольку # = cos-~, то (1) 4x3-3x-a = 0. При ф = -у fl = 0 и поэтому уравнение (1) разрешимо в квадратных радикалах. Если же <р = ^, то a = cos -~- = ^ и мы получим уравнение (2) 8л:3 —6л:—1=0. Полагая в нем у = 2х, получим (3) г/з_з^_1=0. Уравнение (3) и, значит, (2) неразрешимо в квадратных радикалах, так как не имеет рациональных корней. Следовательно, корни этих уравнений невозможно построить циркулем и линейкой. Таким образом, угол л/3 невозможно разделить на три равные части циркулем и линейкой. Задача о построении правильного семиугольника. Построить правильный семиугольник, вписанный в единичный круг. Корни уравнения г7 — 1 = 0 изображаются на плоскости вершинами правильного семиугольника, вписанного в единичный круг. Один из корней этого уравнения равен единице, а остальные удовлетворяют уравнению (1) г6 + г5 + г*+г3 + г2 + г-И=0. Докажем, что уравнение (1) неразрешимо в квадратных радикалах. Разделив обе части уравнения (1) на г3 и сгруппировав слагаемые, получим Полагая (2) t = z+\, получим (3) *3-|-*2.-2*--l=0. Уравнение (3) неразрешимо в квадратных радикалах, так как не имеет рациональных корней. Уравнение (1) неразрешимо в квадратных радикалах. В самом деле, если бы 542
уравнение (1) было разрешимо в квадратных радикалах, то в силу (2) уравнение (3) также было бы разрешимо в квадратных радикалах. Следовательно, корни уравнения (1) невозможно построить циркулем и линейкой. Отсюда следует, что правильный семиугольник невозможно построить циркулем и линейкой. Для каких натуральных п (п>2) можно построить правильный я-угольник при помощи циркуля и линейки? Вопрос этот был решен полностью Гауссом в 1795 г. Гаусс доказал, что построение возможно в том и только в том случае, когда п можно представить в виде п = 2кргр2 ... рт, где & — натуральное число, а р19 ..., рт—• различные простые числа вида 2m+l (/kgN\)0|). Упражнения 1. Покажите, что полином #6+*3+l неприводим над полем рациональных чисел. 2. Покажите, что полином третьей степени над полем либо неприводим, либо имеет корень в этом поле. Является ли полином хъ — — 5л;2+1 неприводимым над полем рациональных чисел? 3. Покажите, что полином от двух переменных *2+у2—1 неприводим над полем рациональных чисел. Приводим ли он над полем комплексных чисел? 4. Докажите, что уравнение д:5—1=0 разрешимо в квадратных радикалах. 5. Докажите, что правильный пятиугольник можно построить циркулем и линейкой. 6. Докажите, что правильный девятиугольник невозможно построить циркулем и линейкой,
ЛИТЕРАТУРА 1. И. В. Арнольд. Теория чисел. М., 1939. 2. А. А. Бухштаб. Теория чисел. М., 1966. 3. И. М. Виноградов. Основы теории чисел. М., 1976. 4. Б. Л. В а н-дер-В ар ден. Алгебра. М., 1976. 5. Д. Гей л. Теория линейных экономических моделей. М., 1963. 6. Ж- Дьедонне. Линейная алгебра и элементарная геометрия. М., 1972. 7. И. М. Гельфанд. Лекции по линейной алгебре. М. 1966. 8. Л. А. Калужнин. Введение в общую алгебру. М., 1973. 9. М. И. К а р г а п о л о в, Ю. И. М е р з л я к о в. Основы теории групп. М., 1972. 10. А. И. Кострикин. Введение в алгебру. М., 1977. 11. А. Г, Курош. Курс высшей алгебры. М., 1971. 12. А. Г. Курош. Лекции по общей алгебре. М., 1962. 13. И. А. Лавров, Л. Л. Максимова. Задачи по теории множеств, математической логике и теории алгоритмов. М., 1975. 14. А. И. Мальцев. Основы линейной алгебры. М., 1970. 15. А. И. Мальцев. Алгебраические системы. М., 1970. 16. А. А. Марков. Теория алгоритмов. — Труды Математического института АН СССР 42, 1954. 17. Э. Мендельсон. Введение в математическую логику, М., 1971. 18. П. С. Новиков. Элементы математической логики. М., 1973. 19. М. М. Постников. Теория Галуа. М., 1963. 20. И. В. Проскуряков. Сборник задач по линейной алгебре. М., 1967. 21. Е. Слупецкий, Л. Борковский. Элементы математической логики и теории множеств. М., 1965. 22. Р. Р. Сто л л. Множества, логика, аксиоматические теории. М., 1968. 23. Д. К. Фаддеев, И. С, Соми некий. Сборник задач по высшей алгебре. М., 1977. 24. С. Феферман. Числовые системы. М., 1971. 25. Р. Фор, А. Кофман, М. Дени-Папен. Современная математика. М., 1966. 26. Г. Хассе. Лекции по теории чисел. М., 1953. 27. П. Халмош. Конечномерные векторные пространства. М., 1963. 28. М. Холл. Комбинаторика, М„ 1970.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютное значение элемента 151 Абелева группа 94 Автоморфизм алгебры 84 — группы 99 — кольца 107 Аддитивная группа 95, 96, 135 векторного пространства 246 классов вычетов 356, 400 кольца 104 поля 146 Аддитивный моноид натуральных чисел 123 Аксиома математической индукции 119, 120 Алгебра 82 — кватернионов 299 — линейная 298 — линейных операторов 300 — матриц 299 Алгебраическая замкнутость поля 510 — независимость элементов 487 — система 112, 113 Алгебраический элемент 528 Алгебраическое расширение поля 531, 533 — число 537 Алгоритм Евклида 379 Алфавит 117 Арифметический корень л-й степени 154 Арифметическое векторное пространство 175 Ассоциативность 76, 347 Ассоциированные элементы 445, 446 Базис векторного пространства 256 ортогональный 271 ортонормированный 278 — системы векторов 182 Бинарная операция 75 Бинарное отношение 48, 49 Вектор нормированный 277 — собственный 307, 309 Векторное пространство 245, 246 арифметическое 175 действительное 276 евклидово 276 конечномерное 256 со скалярным умножением 270 Взаимно-простые числа 372, 375 Включения знак 40 Вполне упорядоченное множество 73 545
Выпуклый конус пространства 318 Высказывания 5—8 Геометрическое представление комплексных чисел 164 Главные операции алгебры 82 — элементы алгебры 83 Гомоморфизм 84 —- алгебраической системы 114 — алгебры 84 — векторного пространства 283 — группы 99 — кольца 107 Граф 52 — бинарного отношения 53 График предиката 52 Группа 94 — абелева 94 — симметрическая 96, 350 — циклическая 102, 355 Двучленные сравнения 418 Делимость элементов 445 Делитель 445 — нуля 104, 105 — общий наибольший 372, 453, 454 — собственный 447 Дефект оператора 286 Диагональная матрица 227, 313, 314 Диаграммы Эйлера—Венна 45 Дизъюнкция 6 Дистрибутивность 76, 128, 129 Доказательство косвенное 19, 20 — от противного 19, 20 — по индукции 121 Дополнение множества 45 Дополнение ортогональное 273 Евклидово пространство 276 Единица группы 95 — кольца 104 Единичный идеал 430 Естественное отображение 70 Естественный гомоморфизм 92 Зависимость линейная 176 Закон двойного отрицания 12 — де Моргана 45 — исключенного третьего 10 — контрапозиции 12 — сокращения 98, 125 Замкнутое подмножество 80, 87 Знак включения 40 — подстановки 224 — принадлежности 39 — числа 224 Идеал 430 — главный 431, 448 — единичный 430 — нулевой 430 Изоморфизм алгебры 84 линейных операторов 301 — алгебраической системы 114 — векторного пространства 266, 283 *— группы 99 — евклидова пространства 280 — кольца 364, 430 Изоморфные алгебры 84 — алгебраические системы 114 — векторные пространства 266 — группы 99 — евклидовы пространства 280 — кольца 107 Импликация 7 Индекс числа по модулю 417 Исключение переменных 502, 503 Истинностная таблица 6, 7, 13 Канонические задачи линейного программирования 328, 335 546
Каноническое разложение на простые множители 367, 474 Квантор общности 28 — существования 28, 29 Класс вычетов 397, 432 — смежный 352 — эквивалентности 68 Кольцо 104 — главных идеалов 448- — евклидово 451 — классов вычетов 401 — коммутативное 104 — нулевое 104 — полиномов 489 — факториальное 450, 478 — целых чисел 139—141 — числовое 163 Коммутативная группа 94 Коммутативность 76, 124, 129 Комплексные числа 161 Композиция отображений 50, 56-58 Конгруэнция 81 Конечное расширение поля 533 Конъюнкция 6 Координатная строка вектора 265 Корень из единицы 159 — полинома 467 кратный 483 простой 483 Кратность корня 483 Критерий неприводимости Эйзенштейна 527 — несовместности системы неравенств 323 — совместности системы линейных уравнений 191 Лексикографическое упорядочение 72, 493 Лемма Гаусса 476 — Даламбера 509 Линейная зависимость системы векторов 176, 247 — независимость системы векторов 176, 247 — оболочка 176, 251 Линейно упорядоченное множество 72 Линейное многообразие 253 — отображение векторного пространства 283 Линейный оператор обратимый 303, 304 пространства 283 = с простым спектром 312 — порядок 72 Логика высказываний 8 Логическое следствие 14, 26 Математическая индукция 121 Матрица 210 — квадратная 210 — линейного оператора 289, 290 — обратимая 215, 240 — транспонированная 213 Многообразие линейное 253 Множество 39 — вполне упорядоченное 73 — замкнутое относительно операции 80 — линейно упорядоченное 72, 150 — упорядоченное 72 — частично упорядоченное 72 Модуль комплексного числа 163 Моноид 83, 346 — натуральных чисел (мультипликативный) 130 Мономорфизм алгебры 84 Наибольший общий делитель 327, 453, 454 Наименьшее общее кратное 376, 455 — подкольцо кольца 437 547
Натуральные числа 119, 120 Независимость линейная 247,248 Неприводимый полином 472 — элемент кольца 447 Неравенство треугольника 277 — Чебышева 392 Нейтральный элемент 77 НОД 372, 453 НОК 376, 455 Норма вектора 277 Нормальный делитель группы 358 Нулевое кольцо 104 Нулевой идеал 430 — элемент 80 Нуль 120, 146 Область целостности 104 — значений 50, 55 — определения 50, 55 Образ линейного оператора 286 Обратимый элемент 81, 98 Обратимая матрица 215 Объединение множеств 41 Однотипные алгебры 83 Операция бинарная 75 — я-местная 75 — сложения 80 — умножения 81 — унарная 75 Определитель матрицы 227 Ортонормированная система векторов 278 Отношение 49, 52 — антирефлексивное 66 — антисимметричное 66 — бинарное 49 — делимости 143 — изоморфизма 86, 99 — конгруэнтности 81, 91 — линейного порядка 72 — я-местное 52 — порядка 71, 131, 148 — рефлексивное 65 Отношение симметричное 66 — строгого порядка 71 — транзитивное 66 — эквивалентности 65, 67, 68 Отображение 54, 55 — инъективное 59 — линейное 283 Отрицание высказывания 6 Пара упорядоченная 48 Первообразный корень 415, 416 Переменная свободная 22 — связанная 28, 29 — предметная 33 Пересечение множеств 42 Период систематической дроби 421 Подалгебра 87 Подгруппа 100, 350 Подкол ьцо 109 — наименьшее 437 Подмножество 40 — замкнутое в алгебре 87, 89 Подобные матрицы 297, 313 Подполе 146 — простое 146 Подпространство векторного пространства 250 Подстановка 221 — нечетная 223 — обратная 222 — четная 223 Подсистема алгебраической системы 115 Поле 146 — алгебраически замкнутое 510, 537 — алгебраических чисел 537 — действительных чисел 153 — классов вычетов 404 — комплексных чисел 157, 161 — простое 146 — рациональных чисел 148 — скаляров 245 548
Поле упорядоченное 150 — частных 148, 439 — числовое 162 Полином минимальный 529 — неприводимый 472 — нормированный 466 — от нескольких переменных 486 — приводимый 472 — примитивный 475 — симметрический 459, 498 Полная линейная группа 305 — система вычетов 399 Полугруппа 346 Порядок 71, 72 — группы 94 — классов вычетов 413 — нестрогий 71 — строгий 71 — числа по модулю 413 — элемента группы 354 Правила введения и удаления 18 Правило Крамера 241 — отделения 19 Предикат 23, 25, 26, 27 Предикатные формулы 34 Предметные переменные 33 Приведенная система вычетов 402, 403 Принадлежности знак 39 Принцип математической индукции 121 Произведение матриц 211 Производная полинома формальная 480 Простое алгебраическое расшире- рение поля 528, 531 — поле 146 — расширение поля 459 *— трансцендентное расширение кольца 459, 461 — число 365 Простой корень полинома 483 Простой элемент области целостности 446 Противоположный элемент 80, 95 Противоречие 10 Процесс ортогонализации 272 Прямая сумма подпространств 252 Прямое произведение множеств 48, 49 Пустое множество 41 Равенство полиномов алгебраическое 468 функциональное 468 — множеств 39 Равносильные формулы 15 — предикаты 26 — системы уравнений 186 Разбиение множества 68 Разложение на простые множители 366, 450, 473, 478 — определи 1еля 235 Размерность векторного пространства 260 Разность множеств 42 Ранг линейного оператора 294 — матрицы 189, 199, 200 — операции 75 — системы векторов 183 Распределение простых чисел 389 Расширение поля алгебраическое 533 конечное 533 простое 528 составное 533, 534 трансцендентное 459 Рациональные числа 148 Результант 502 Рефлексивное отношение 65 Решение системы линейных неравенств 335 уравнений 185, 206— 208, 220 549
Решение уравнений 515, 520 Решето Эратосфена 370 Свободная переменная 22 Свойства группы 97 — кольца 106 — поля 146 Связанная переменная 28, 29 Симметрическая группа 96, 350 Симметрический полином 495 Симплекс-метод 335 Система действительных чясел 150, 153 — алгебраическая 112 — векторов ортогональная 271 — линейных неравенств 317 уравнений 185 однородная 192, 203 Скалярное произведение 270 Следствие систем линейных уравнений 180, 195, 196 неравенств 318 Смежный класс 352, 433 левый 353 правый 352 Собственное значение 307, 309 Собственный вектор 307, 309 — делитель элемента 447 Сравнение по идеалу 432 — по модулю 397 Стандартные задачи линейного программирования 327, 328, 335 Старший коэффициент полинома 466 Степенные вычеты 419 Степень полинома 466, 492 — элемента 529 Строгий порядок 71 Ступенчатая матрица 198 —- — приведенная 201 Сужение функции 63 Сумма подпространств 251, 252 Таблица истинности 6, 7 Тавтология 10 Теорема двойственности 330, 333 — Кронекера—Капелли 193 — Кэли 351 — Лагранжа 353 — Минковского 321 — о гомоморфизмах 362 — о делении с остатком 141,142, 469 — Ферма 408 — Штурма 523 — Эйлера 408 Тернарное отношение 52 Тождественно истинная формула 10 — ложная формула 10 Транзитивное отношение 66 Трансцендентное расширение кольца 459, 488 Тригонометрическая форма комплексного числа 166, 168 Трисекция угла 541 Удвоение куба 541 Универсальное множество 44 Упорядочение лексикографическое 493 Упорядоченное множество 72 — поле 150 Уравнения третьей степени 515 — четвертой степени 520 Условие с одной свободной переменной 23 — с несколькими свободными переменными 23 Фактор-алгебра 91 Фактор-группа 359, 360 Фактор-кольцо 433, 434 Фактор-множество 68 Формула логики высказываний 8 Формулы Крамера 242 550
Фундаментальная система решений 204 Функция 54, 55 — инъективная 59 — обратная 60—62 — Эйлера 406 Характеристика кольца 436 Характеристическое уравнение 310, 311 Целые числа 135, 139 Циклическая группа 102, 355 Числа алгебраические 537 — действительные 153 — комплексные 161 сопряженные 163 — натуральные 119, 120 — простые 365 — рациональные 148 — целые 135, 139 Эквивалентности отношение 65, 67, 68 Эквивалентность 67 «— логическая 15 Эквивалентные системы векторов 180 Эквиваленция 8 Элемент алгебраический 528 — множества 39 — нейтральный 77 — обратный по умножению 81 — противоположный по сложению 80 — симметрический 78, 79 Элементарные преобразования системы векторов 181 «- симметрические полиномы 496 Эндоморфизм алгебры 84 Эпиморфизм 84 Ядро гомоморфизма 361 *= линейного оператора 286
ОГЛАВЛЕНИЕ Предисловие , ,.,..., , 3 Глава первая Элементы логики § 1. Логика высказываний , . . . . 5 Высказывания (5). Логические операции над высказываниями (5). Формулы логики высказываний (8). Законы логики (10). Упражнения (14). § 2. Логическое следствие , . . . , 14 Основные определения (14). Схемы доказательств (18). Косвенное доказательство (19). Упражнения (21). § 3. Предикаты 22 Свободные переменные (22). Предикаты (22). Операции над предикатами (24). Логическое следствие. Равносильные предикаты (25). Упражнения (27). § 4. Кванторы , . , ,..,.... 28 Квантор общности (28). Квантор существования (28). Запись высказываний на языке логики предикатов (31). Упражнения (32). § 5. Предикатные формулы. Законы логики ..,,., 33 Элементарные формулы (33). Предикатные формулы (34). Законы логики предикатов (35). Упражнения (37). Глава вторая Множества и отношения § 1. Множества ,,,¦...., f 39 Понятие множества (39). Подмножества (40). Пустое множество (41). Операции над множествами (41). Основные свойства операций над множествами (43). Универсальное множество. Дополнение множества (44). Диаграммы Эйлера — Венна (45). Упражнения (47). § 2. Бинарные отношения ,,»..., 48 Прямое произведение множества (48). Бинарные отношения (49). п-местные отношения (52). Представление бинарных отношений графами (52). Упражнения (53) § 3. Функции , , 54 Понятие функции (отображения) (54). Композиция функций (56). Инъективные функции (59). Обратимые функции (60). Ограничение функции (63). Упражнения (64). 552
§ 4. Отношение эквивалентности 65 Некоторые виды бинарных отношений (65). Отношение эквивалентности (67). Фактор-множество (68). Отношение равнообразности отображения (69). Упражнения (70). § 5. Отношения порядка , * , ¦¦.... 71 Отношения порядка (71). Линейный порядок (72). Упорядоченное множество (72). Упражнения (73). Глава третья Алгебры и алгебраические системы § 1. Бинарные операции 75 Бинарные и n-местные операции (75). Виды бинарных операций (76). Нейтральные элементы (77). Регулярные элементы (77). Симметричные элементы (78). Подмножества, замкнутые относительно операций (80). Аддитивная и мультипликативная формы записи (80). Конгруэнция (81). Упражнения (82). § 2. Алгебры ж 82 Понятие алгебры (82). Гомоморфизмы алгебры (84). Подалгебры (87). Фактор-алгебра (91). Упражнения (93). § 3. Группы , 94 Понятие группы (94). Примеры групп (95). Простейшие свойства группы (97). Гомоморфизмы групп (98). Подгруппы (100). Упражнения (103). § 4. Кольца 104 Понятие кольца (104). Простейшие свойства кольца (106)» Гомоморфизм колец (107). Подкольца (109). Упражнения (112). § 5. Алгебраические системы 112 Понятие алгебраической системы (112). Изоморфизмы алгебраических систем (114). Подсистемы (114). Упражнения (116). Глава четвертая Основные числовые системы § 1. Система натуральных чисел .,.,.,,,,., 117 Алфавит и слова (117). Слова в однобуквенном алфавите (118). Система натуральных чисел (119). Принцип математической индукции (121). Упражнения (122). § 2. Свойства сложения и умножения натуральных чисел .... 122 Свойства сложения (122). Свойства умножения (128). Упражнения (131). § 3. Отношение порядка на множестве натуральных чисел ... 131 Отношение порядка (131). Полная упорядоченность множества натуральных чисел (133). Упражнения (134). § 4. Кольцо целых чисел 135 Аддитивная группа целых чисел (135), Естественное умножение в аддитивной группе целых чисел (138). Кольцо целых чисел (139). Теорема о делении с остатком (141). Отношение делимости в кольце целых чисел (143)» Упражнения (144). § 5. Поля. Поле рациональных чисел 146 Понятие поля (146). Простейшие свойства поля (146). Поле рациональных чисел (148). Упражнения (149) § 6. Система действительных чисел . . . . , 150 Упорядоченные поля (150). Система действительных чисел (152). Построение системы действительных чисел (154). Упражнения (156). 553
§ 7. Поле комплексных чисел 157 Комплексное расширение поля (157). Поле комплексных чисел (161). Сопряженные комплексные числа (163). Модуль комплексного числа (163). Геометрическое представление комплексных чисел (164). Упражнения (165). § 8. Тригонометрическая форма комплексного числа. Извлечение корней из комплексных чисел , . . , . 166 Тригонометрическая форма комплексного числа (166). Корни /г-й степени из единицы (169). Корни n-й степени из произвольного комплексного числа (171). Упражнения (172). Глава пятая Арифметические векторные пространства и системы линейных упражнений § 1. Арифметические векторные пространства , ¦ * . ¦ 174 Арифметическое n-мерное векторное пространство (174). Линейная зависимость и независимость системы векторов (176). Эквивалентные системы векторов (180). Базис конечной системы векторов (182). Ранг конечной системы векторов (183). Упражнения (184). § 2. Системы линейных уравнений ¦ ¦ . . ¦ « 185 Следствия системы линейных уравнений (185). Равносильные системы линейных уравнений и элементарные преобразования системы (186). Равенство строчечного и столбцового рангов матрицы (188). Критерий совместности системы линейных уравнений (191). Связь между решениями неоднородной линейной системы и решениями ассоциированной с ней однородной системы (193). Теоремы о следствиях системы линейных уравнений (195). Упражнения (197). § 3. Ступенчатые матрицы и системы линейных уравнений , , . 198 Ступенчатые матрицы (198). Приведенные ступенчатые матрицы (201). Однородные системы линейных уравнений (203). Фундаментальная система решений (204). Решение системы линейных уравнений методом последовательного исключения переменных (206). Упражнения (209). Глава шестая Матрицы и определители § 1. Операции над матрицами и их свойства ..¦,.....*. 210 Операции над матрицами (210). Транспонирование произведения матриц (213). Упражнения (214). § 2. Обратимые матрицы ...,..»,... 215 Обратимые матрицы (215). Элементарные матрицы (216). Условия обратимости матрицы (218). Вычисление обратной матрицы (219). Запись и решение системы п линейных уравнений с п переменными в матричной форме (220). Упражнения (221). § 3. Подстановки > 221 Подстановки. Группа подстановок (221). Четные и нечетные подстановки (223). Знак подстановки (224). Упражнения (225). § 4. Определители 226 Определитель квадратной матрицы (226). Основные свойства определителей (227). Упражнения (231). § 5. Миноры и алгебраические дополнения, Теоремы об определителях 232 Миноры и алгебраические дополнения (232). Разложение определителя по строке или столбцу (235). Определитель произведения матриц (237). Необходимые и достаточные условия равенства нулю определителя (238). Упражнения (239). 554
§ 6. Теоремы о матрицах. Правило Крамера * ¦ 239 Теорема о ранге матрицы (239). Обратная матрица (240). Правило Крамера (241). Условия, при которых система п линейных однородных уравнений с п переменными имеет ненулевые решения (242). Упражнения (243.) Глава седьмая Векторные пространства § 1. Векторные пространства 245 Понятие векторного пространства (245). Простейшие свойства векторных пространств (247). Линейная зависимость и независимость системы векторов (247). Упражнения (248). § 2. Подпространства векторного пространства , 250 Подпространство (250). Линейная оболочка множества векторов (250). Сумма подпространств (251). Линейные многообразия (253). Упражнения (255). § 3. Базис и размерность векторного пространства 256 Базис векторного пространства (256). Дополнение независимой системы векторов до базиса (258). Размерность векторного пространства (260). Упражнения (263). § 4. Изоморфизмы векторных пространств , 265 Координатная строка вектора относительно данного базиса (265). Изоморфизм векторных пространств (266). Упражнения (269). § 5. Векторные пространства со скалярным умножением .... 270 Скалярное умножение в векторном пространстве (270). Ортогональная система векторов (271). Процесс ортогонализации (272). Ортогональное дополнение к подпространству (273). Упражнения (275). § б. Евклидовы векторные пространства , . , 0 ¦ 276 Евклидово векторное пространство (276). Норма вектора (277). Орто- нормированный базис евклидова пространства (278). Изоморфизмы евклидовых пространств (280). Упражнения (282). Глава восьмая Линейные операторы § !. Линейные отображения . « * * , 283 Линейные отображения и операторы (283). Ядро и образ линейного оператора (286). Операции над линейными отображениями (287). Упражнения (288). § 2. Представление линейных операторов матрицами 289 Матрица линейного оператора (289). Связь между координатными столбцами векторов х и ф(*) (291). Ранг линейного оператора (294). Связь между координатными столбцами вектора относительно различных базисов (295). Связь между матрицами линейного оператора относительно различных базисов (296). Упражнения (297). § 3. Линейные алгебры * , 298 Линейная алгебра (298). Алгебра линейных операторов векторного пространства (300). Изоморфизм алгебры линейных операторов и полной матричной алгебры (301). Упражнения (302). § 4. Обратимые операторы 303 Обратимые операторы (303). Полная линейная группа (305). Упражнения (306). 555
§ 5. Собственные векторы и собсгвгнные значения. Характеристические уравнения 307 Собственные векторы и собственные значения (307). Нахождение собственных векторов линейного оператора (308). Характеристическое уравнение (309). Линейные операторы с простым спектром (311). Условия, при которых матрица подобна диагональной матрице (313). Упражнения (315). Глава девятая Системы линейных неравенств § 1. Системы линейных неравенств 317 Основные понятия (317). Однородные системы линейных неравенств и выпуклые конусы (318). Следствия однородной системы линейных неравенств (319). Теорема Минковского (321). Критерий несовместимости системы линейных неравенств (323). Неотрицательные решения системы линейных уравнений и системы линейных неравенств (325). Упражнения (326). § 2. Стандартные и канонические задачи линейного программирования. Теоремы двойственности 327 Стандартные и канонические задачи (327). Допустимые и оптимальные векторы (328). Теоремы двойственности для стандартных задач (330). Теорема двойственности для канонических задач (333). Теорема равновесия (334). Упражнения (335). § 3. Симплекс-метод **...,...,,,*,«.* 335 Симплекс-метод (335). Упражнения (344). Глава десятая Группы § 1. Полугруппы и моноиды , * 346 Полугруппы (346). Моноиды (346). Обобщенный закон ассоциативности (347). Упражнения (349). § 2. Подгруппы и смежные классы ¦ 350 Подгруппы (350). Смежные классы (351). Теорема Лагранжа (353). Упражнения (353) § 3. Циклические группы ,.,.«...,..,,.»* 354 Порядок элемента группы (354). Циклические группы (355). Подгруппы циклической группы (357). Упражнения (358). § 4. Нормальные делители и фактор-группы ••,»»,,«,,, 358 Нормальные делители группы (358). Фактор-группа (359). .Ядро гомоморфизма (361). Теорема о гомоморфизмах (362), Упражнения (362). Глава одиннадцатая Теория делимости в кольце целых чисел § 1. Разложение целых чисел на простые множители ....¦* 364 Идеалы кольца целых чисел (364). Простые числа (365). Разложение целых чисел на простые множители (365). Делители целого числа (367). Число и сумма натуральных делителей числа (368). Бесконечность множества простых чисел (369). Реидето Эратосфена (370). Упражнения (371). § 2. Наибольший общий делитель и наименьшее общее кратное 372 Наибольший общий делитель (372). Взаимно простые числа (375). Наименьшее общее кратное (376). Упражнения (379). 556
§ 3. Алгоритм Евклида и конечные цепные дроби 379 Алгоритм Евклида (379). Конечные цепные дроби (380). Подходящие дроби (382). Упражнения (385). § 4. Целые систематические числа 385 Целые систематические числа (385). Арифметические операции над целыми систематическими числами (387). Перевод чисел из одной системы счисления в Другую (388). Упражнения (389). § 5. Распределение простых чисел 389 Распределение простых чисел (389). Функции Т (х) и Л (х) (390). Неравенства для функции Т {х) (391). Неравенства Чебышева (392). Простые числа в арифметических прогрессиях (394). Упражнения (396). Глава двенадцатая Теория сравнений с арифметическими положениями § 1. Сравнения и их свойства «»..*»,••»«•*»,,#*• 397 Сравнения в кольце целых чисел (397). Простейшие, свойства сравнений (398). Упражнения (399). § 2. Полная система вычетов. , . 9 , . , ¦ 399 Полная система вычетов (399). Аддитивная группа классов вычетов (400), Кольцо классов вычетов (401). Упражнения (402). § 3. Приведенная система вычетов 402 Приведенная система вычетов (402). Мультипликативная группа классов вычетов, взаимно простых с модулем (404). Функция Эйлера (406). Теоремы Эйлера и Ферма (408). Упражнения (408). § 4. Сравнения первой степени. Сравнения высших степеней по простому модулю ..,.,., ¦ 409 Степень и число решений сравнения (409). Сравнения первой степени (409). Сравнения высших степеней по простому модулю (411). Упражнения (413). § 5. Первообразные корни и индексы 413 Порядок числа и класса вычетов по модулю (413). Первообразные корни по простому модулю (415). Индексы по простому модулю (416). Двучленные сравнения (418). Упражнения (420). § 6. Обращение обыкновенной дроби в систематическую и определение длины периода систематической дроби , , . . f , $ 421 Упражнения (428). Глава тринадцатая Кольца § 1. Идеалы кольца. Фактор-кольцо 430 Идеалы кольца (430). Сравнения и классы вычетов по идеалу (432). Фактор-кольцо (433). Теорема об эпиморфизмах колец (434). Характеристика кольца (436). Наименьшее подкольцо кольца (437). Упражнения (438). § 2. Поле частных области целостности 439 Поле частных области целостности (439). Изоморфизм полей частных (443). Упражнения (445). § 3. Кольца главных идеалов »...,.,.,.,,,»,,¦.. 445 Простейшие свойства делимости в коммутативном кольце (445). Простые и составные элементы области целостности (446). Кольца главных идеалов (448). Факторна л ьность кольца главных идеалов (449). Евклидовы кольца (451). Упражнения (452). 557
§ 4. Наибольший общий делитель. Наименьшее общее кратное 453 Наибольший общий делитель (453). Наименьшее общее кратное (455). Упражнения (458). Глава четырнадцатая Полиномы от одной переменной § 1. Кольцо полиномов ..,,..»,, , . . , » , » , Простое трансцендентное расширение кольца (459). Теорема о существовании простого трансцендентного расширения коммутативного кольца (461). Степень полинома (465). Деление полинома на двучлен и корни полинома (466). Теорема о наибольшем возможном числе корней полинома в области целостности (467). Алгебраическое и функциональное равенства полиномов (468). Упражнения (469). § 2. Полиномы над полем ,...,,,«...,* Теорема о делении с остатком (469). Алгоритм Евклида (470). Неприводимые над данным полем полиномы (471). Разложение полинома в произведение нормированных неприводимых множителей (473). Упражнения (474). § 3. Факториальность кольца полиномов над факториальным кольцом ,,,,..,*.,,....,,,«,, . Примитивные полиномы (475). Факториальность кольца полиномов (478). Упражнения (479). § 4. Формальная производная полинома. Неприводимые кратные множители , . . . , Формальная производная полинома (479). Разложение полинома по степеням разности х—с (481). Неприводимые кратные множители полинома (482). Кратные корни полинома (483). Упражнения (484). Глава пятнадцатая Полиномы от нескольких переменных § 1. Кольцо полиномов от нескольких переменных • , , Кратное расширение кольца (485). Кольцо полиномов от нескольких переменных (486). Изоморфизм колец полиномов (489). Нормальное представление полинома и степень полинома (490). Факториальность кольца полиномов (492). Упражнения (493). § 2. Симметрические полиномы Лексикографическое упорядочение членов полинома (493). Лемма о высшем члене произведения двух полиномов (494). Симметрические полиномы (495). Леммы о симметрических полиномах (496). Основная теорема о симметрических полиномах (498). Упражнения (500). § 3. Результант полиномов и исключение переменных Результант двух полиномов (500). Исключение переменных (502). Упражнения (504). Глава шестнадцатая Полиномы над полем комплексных чисел и над полем действительных чисел § 1. Алгебраическая замкнутость поля комплексных чисел $ . . 505 Теорема о возрастании модуля полинома (505). Непрерывность модуля полинома (506). Наименьшее значение модуля полинома (507). Лемма Даламбера (509), Алгебраическая замкнутость поля комплексных чисел (510). Формулы Виета (512). Упражнения (512). 558 459 469 475 479 485 493 500
§ 2, Полиномы над полем действительных чисел .¦•*.»,,. 513 Сопряженность мнимых корней полинома с действительными коэффициентами (513). Неприводимые над полем действительных чисел полиномы (513). Упражнения (514). § 3, Уравнения третьей и четвертой степени 515 Уравнения третьей степени (515). Исследование корней уравнения третьей степени с действительными коэффициентами (518). Уравнения четвертой степени (520). Упражнения (521). § 4. Отделение действительных корней полинома 521 Система полиномов Штурма (521). Теорема Штурма (522). Упражнения (525). Глава семнадцатая Полиномы над полем рациональных чисел и алгебраические числа § 1. Целые и рациональные корни полинома. Критерий неприводимости • »#........•..»• с . 526 Целые и рациональные корни полинома (526). Критерий неприводимости Эйзенштейна (526). Упражнения (528). § 2. Простое алгебраическое расширение поля .,.,.,.,* 528 Простое расширение поля (528). Минимальный полином алгебраического элемента (529). Строение простого алгебраического расширения поля (531). Освобождение от алгебраической иррациональности в знаменателе дроби (532). Упражнения (532). § 3. Составное алгебраическое расширение поля . , 532 Конечное расширение поля (532). Составное алгебраическое расширение поля (533). Простота составного алгебраического расширения поля (535). Поле алгебраических чисел (536). Алгебраическая замкнутость поля алгебраических чисел (537). Упражнения (538). § 4. Условия разрешимости уравнения третьей степени в квадратных радикалах .*¦,,,,,* ».»».... 538 Понятие разрешимости уравнения в квадратных радикалах (538). Условия разрешимости уравнения третьей степени в квадратных радикалах (539). Примеры задач, неразрешимых в квадратных радикалах (541). Упражнения (543). Литература г , . ¦ . . 544 Предметный указагель .».,,..,,....,.., 545
ЛЕОНИД ЯКОВЛЕВИЧ КУЛИКОВ АЛГЕБРА И ТЕОРИЯ ЧИСЕЛ Редактор А. И. Селиверстова. Художник Ю. Д. Федичкин. Художественный редактор В. И. Пономаренко. Технический редактор Н. В. Яшукова. Корректор Г. И. Кострикова. ИБ № 1647 Изд. № ФМ-607. Сдано в набор 25.01.79. Подп. в печать 19.06.79. Формат 84х1087з2. Бум. тип. № 2. Гарнитура литературная. Печать высокая. Объем 29,40 усл. печ. л. 26,99 уч.-изд. л. Тираж 40 000 экз. Зак. 452. Цена 1 руб, Ю коп. Издательство «Высшая школа», Москва, К-51, Неглинная ул., д. 29/14 Ордена Октябрьской Революции, ордена Трудового Красного Знамени Ленинградское производственно-техническое объединение «Печатный Двор» имени А. М. Горького «Союзполиграфпрома» при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 197136, Ленинград, П-136, Гатчинская, 26,