Text
                    М осковский государственный технический университет
имени Н .Э . Баумана

А. В. Ч аш кин, Д. А. Ж у к о в

ЭЛЕМЕНТЫ
КОНЕЧНОЙ АЛГЕБРЫ
гр уп п ы , кольца, поля,
л и н е й н ы е пространства

В)
Москва
ИЗДАТЕЛЬСТВО
М ГТУ им. Н. Э. Баумана

2 0 16


УДК 512.6 ББК 22.14 Ч-29 Издание доступно в электронном виде на портале ebooks.bmstu.ru по адресу: h ttp ://e b o o k s .b m s tu .r u /c a ta lo g Факультет «Информатика и системы управления» Кафедра «Информационная безопасность» Рекомендовано редакционно-издательским советом М ГТУ им. Н. Э. Баумана в качестве учебного пособия Рецензенты: профессор механико-математического факультета МГУ им. М. В. Ломоносова С. Б. Гашков; доцент факультета ВМК МГУ им. М. В. Ломоносова М. А. Черепнев Ч аш ки н , А . В. Ч-29 Элементы конечной алгебры: группы, кольца, поля, линейные пространства: учебное пособие / А. В. Чашкин, Д. А. Ж уков — Москва: Издательство МГТУ им. Н. Э. Баумана, 2016. — 368 с . : ил. ISBN 978-5-7038-4354-3 Учебное пособие основано на материалах лекций и семинаров, проводимых в МГТУ им. Н. Э. Баумана для студентов, специа­ лизирующихся в области защиты информации. В пособии рас­ смотрены основные алгебраические структуры и их свойства. Все утверждения снабжены подробными доказательствами и проиллюстрированы большим числом примеров. Основное вни­ мание уделено конечным полям и линейным пространствам над конечными полями. Для чтения пособия достаточно уверенного владения математикой в объеме средней школы. ISBN 978-5-7038-4354-3 УДК 512.6 ББК 22.14 © М ГТУ им. Н. Э. Баумана, 2016 © Оформление. Издательство МГТУ им. Н. Э. Баумана, 2016
Оглавление П р е д и с л о в и е ..................................................................................... 6 Г л а в а 1. М н о ж е с т в а и о т о б р а ж е н и я ............................. 9 1.1. М н о ж е с т в а ................................................................................ 9 1.2. Отнош ения на м н о ж е с т в а х ................................................. 11 1.3. О тображ ения 13 1.4. Конечные множ ества и их м о щ н о с т и ............................. Задачи Г л а в а 2. ......................................................................... .................................................................................................. 17 23 Ц е л ы е ч и с л а ............................................................... 25 2.1. Д елимость. А лгоритм Е в к л и д а ....................................... 25 2.2. Разложение на просты е м н о ж и т е л и ................................ 33 2.3. Теорема Ч е б ы ш ё в а ............................................................... 35 2.4. С р а в н е н и я ................................................................................ 39 2.5. К лассы вы четов ..................................................................... 41 2.6. Решение с р а в н е н и й ............................................................... 43 2.7. Китайская теорема об остатках ....................................... 44 2.8. Функция Э й л е р а ...................................................................... 47 Задачи Г л а в а 3. .................................................................................................. 50 Г р у п п ы ......................................................................... 52 3.1. Определения и п р и м е р ы ..................................................... 52 3.2. Группа подстановок ........................................................... 59 3.3. Смеж ные классы и ф а к т о р -г р у п п ы ................................ 66 3.4. И зом орф измы г р у п п ........................................................... 71 3.5. Гомом орф измы групп ........................................................ 80 .................................................................................................. 84 Задачи
4 Оглавление Глава 4. ......................................................................... 87 4.1. Кольца и п о л я ......................................................................... 87 4.2. М орф изм ы к о л е ц .................................................................. 93 4.3. Ф а к т о р -к о л ь ц а ......................................................................... 96 4.4. К ольцо многочленов 98 4.5. А риф м етика м н о г о ч л е н о в ................................................. 106 4.6. Ч исло неприводимых м н о г о ч л е н о в ................................ 115 4.7. К ольцо остатков и поле м н о г о ч л е н о в .............................119 4.8. Китайская теорема об остатках для многочленов . . . 122 Задачи Г л а в а 5. К ольца ........................................................... .................................................................................................. 131 Л и н е й н ы е п р о с т р а н с т в а .................................... 134 5.1. Линейные пространства и их с в о й с т в а ......................... 134 5.2. Линейные операторы 5.3. М атрицы 5.4. О п р е д е л и т е л и ......................................................................... 156 5.5. С войства о п р е д е л и т е л е й .....................................................162 Задачи Г л а в а 6. ........................................................... 143 ................................................................................... 147 .................................................................................................. 174 П р о с т р а н с т в а с о п е р а т о р а м и .......................... 177 6.1. Системы линейных у р а в н е н и й .......................................... 177 6.2. Обращение невырож денных м а т р и ц .............................180 6.3. Решение линейных матричных у р а в н е н и й ...................184 6.4. Инвариантные п о д п р о ст р а н ст в а ....................................... 194 Задачи Г л а в а 7. .................................................................................................. 217 С т р у к т у р а к о н е ч н ы х г р у п п ..............................220 7.1. Д ействие группы на м н о ж е с т в е .......................................220 7.2. Теоремы С и л о в а ..................................................................... 228 7.3. Прямые произведения г р у п п ..............................................232 7.4. Конечные абелевы группы ................................................. 236 7.5. Группа Zn ................................................................................244 Задачи .................................................................................................. 250 Г л а в а 8. К он ечн ы е поля ..................................................... 253 8.1. Мультипликативная группа поля .................................... 253 8.2. Разложение х рП — х на м н о ж и т е л и ................................ 258
Оглавление 5 8.3. С труктура конечного п о л я .................................................. 265 8.4. 8.5. А риф м етика в конечных п о л я х ........................................277 Порядки м н о го ч л е н ов ............................................................ 295 Задачи .................................................................................................. 306 Г л а в а 9. А л г о р и т м ы ................................................................ 309 9.1. 9.2. Свободны е о т квадратов м н о го ч л е н ы ..............................309 А лгоритм Берлекемпа. Общий с л у ч а й .......................... 322 9.3. 9.4. Логарифмирование. М етод согл а сов а н и я .......................327 М етод Полига — Хеллмана — Н е ч а е в а .......................... 332 9.5. К оды , исправляющие о ш и б к и ........................................... 337 Задачи .................................................................................................. 348 Л итература .....................................................................................351 П ри л ож ен и е A . П ри м и ти вн ы е эл ем ен ты поля Zp . 354 П ри л ож ен и е B . Р азл ож ен и е на п р осты е м н ож и тел и ч и с е л в и д а pn — 1 ................................................................ 356 П ри л ож ен и е C . Н еп ри вод и м ы е и при м и ти вн ы е м н огочлен ы .............................................................................. П р ед м етн ы й указател ь 359 ......................................................... 363
Предисловие Э то учебное пособие основано на лекциях и семинарах, кото­ рые вот уж е более десяти лет проводятся авторами в М Г Т У им. Н .Э . Баумана для студентов, специализирующ ихся в обла­ сти защ иты информации, одной из составны х частей которой является криптография. В современной криптографии активно использую тся результаты таких разделов математики, как тео­ рия вероятностей, теория чисел, теория слож ности и т. д. В этом ряду одно из первых мест, безусловно, принадлеж ит алгебре, так как в основе подавляющ его числа криптограф ических кон­ струкций и методов леж ат алгебраические стр ук тур ы — группы, кольца, поля, линейные пространства. И зучению этих структур и посвящ ена настоящ ая книга. А лгебра (как общ ая, так и линейная) давно является неотъ­ емлемой частью подготовки инженеров и научных работников. Благодаря этом у сейчас сущ ествует обш ирная и качественная учебная литература, посвященная тем разделам алгебры, ко­ торы е традиционно изучаю тся в высш их технических учебны х заведениях и на математических и естественны х факультетах университетов. В месте с тем следует отм етить, что эти разделы в основном имею т дело с «бесконечной» частью алгебры — с ал­ гебраическими структурам и, так или иначе связанными с поля­ ми действительны х и комплексных чисел. «К онечн ой » части — конечным полям, линейным пространствам над конечными по­ лями и т. п. — уделяется значительно меньше внимания, в то время как в современных задачах, имеющих дело с различными преобразованиями больш их объемов информации, наиболее вос­ требованы именно методы конечной алгебры. Такое положение бы ло одной из главных причин, побудивших авторов к написа­
Предисловие 7 нию учебного пособия по алгебре, в к отором основное внимание бы ло бы уделено конечной алгебре и, в частности, конечным полям и линейным пространствам над конечными полями. При этом авторы стремились создать максимально независимое и по­ дробное пособие, для чтения большей части которого д остаточ­ но уверенного владения математикой в объеме средней школы. В результате получилась книга с подробными доказательства­ ми и больш им числом разнообразны х примеров, для работы с которой нет необходимости прибегать к дополнительной литературе1) . Книга состои т из девяти глав. Первая глава содерж ит про­ стейш ие сведения из теории множ еств и носит в основном спра­ вочный характер. В торая глава является п росты м введением в элементарную теори ю чисел. Ч асть результатов второй главы обобщ ается в следую щ их главах для групп и колец и использует­ ся в качестве примеров появляющихся там общ их конструкций и результатов. М атериал третьей главы д остаточн о традиционен и содерж ится в больш инстве начальных курсов алгебры — в ней изучаю тся группы и их основные свойства. В четвертой гла­ ве рассм атриваю тся кольца. Значительная часть этой главы по­ священа изучению колец многочленов над конечными полями. В частности, для л ю бого п ростого p и л ю бого натурального n дока­ зы вается сущ ествование поля из pn элементов как поля вычетов многочленов по модулю неприводимого многочлена. В пятой и шестой главах подробно рассм атриваю тся линейные простран­ ства над конечными полями и их линейные преобразования. Рассматриваю тся методы решений систем линейных уравнений над конечными полями, изучаю тся циклические пространства. М атериалы, составляю щ ие четвертую , пятую и ш естую главы, достаточн о сильно отличаю тся от материалов, содерж ащ ихся в аналогичных разделах больш инства курсов общей и линейной алгебры, где основное внимание уделяется кольцам многочле­ нов и линейным пространствам над полями действительны х и комплексных чисел. В этих главах, в частности, нет основной х)Это ни в коем случае не рекомендация для работы с книгой, это воз­ можность!
8 Предисловие теоремы алгебры и теоремы о ж ордановой нормальной ф орм е линейного оператора. Основная задача глав 4— 6 — создать необ­ ходимые инструменты для изучения в восьмой главе конечных полей. В седьмой главе подробно изучаю тся конечные группы. Д ается описание строения произвольной абелевой группы и, в частности, группы целых чисел с операцией умножения по со ­ ставном у модулю. В восьмой главе рассм атриваю тся конечные поля, их структура, особенности выполнения в них арифметиче­ ских операций и т. п. Д оказывается единственность, с точн остью д о изоморфизма, поля из p n элементов и устанавливается о т су т ­ ствие други х конечных полей. Не сильно преувеличивая, мож но сказать, что восьмая глава является центром, вокруг которого построена книга. Причина этого в том исключительном полож е­ нии, которое занимают конечные поля в создании и применении современных алгоритмов работы с дискретными данными. На­ конец в девятой главе приводятся примеры таких алгоритм ов: алгоритмы дискретного логарифмирования в конечных полях, алгоритм разложения на неприводимые множители многочлена над конечным полем и алгоритм исправления ош ибок в прими­ тивных Б Ч Х -кодах. А втор ы надеются, что настоящ ая книга позволит ее читате­ лям продолж ить изучение алгебраических стр у к ту р и методов на более высоком уровне и, кроме того, облегчит знакомство как с другими областями математики, имеющими важные практи­ ческие приложения, так и с самими приложениями.
Глава 1 Множества и отображения П онятия «м н ож ества», «отнош ения», «отображ ен ия» и пр. яв­ ляю тся базовыми для всей математики — и дискретной, и непре­ рывной. Они закладываю т необходимую основу для всех даль­ нейших построений, зачастую весьма слож ны х. Алгебраические стр ук тур ы на множ ествах являю тся основным объ ектом прак­ тически всех теоретических и прикладных математических дис­ циплин, в частности математической криптографии. 1.1. Множества Понятие «м н ож ества» — одно из фундаментальных неопре­ деляемых понятий математики. Под множ еством, понимают лю бую определенную совокупн ость объектов, называемых эле­ м ент ами множ ества. Элементы множ ества различны и отличи­ мы друг о т друга. М нож ества обы чно обозначаю тся прописны­ ми буквами, а их элементы — строчны ми. Для некоторы х особо важ ны х множ еств приняты стандартные обозначения: N — мно­ ж ество натуральных чисел, Z — целых, Q — рациональных, R — действительны х, C — м нож ество комплексных чисел. Если объ ект х является элементом множ ества M , то говорят, что х принадлежит M (M содерж ит х ) и использую т обозначе­ ние х G M . В противном случае говорят, что х не принадлежит M и пиш ут х £ M . Например, \/2 £ Q и \/2 G R. М нож е­ ство M — подм нож ест во множ ества N (M содерж ит ся в N , N включает M ), если каж дый элемент M есть элемент N . Э то
10 Глава 1. Множества и отображения свойство обозначается M С N или M С N : M С N & V x G M : x G N. Например, N С Z . Д ва множ ества называются равными, если в них входят одни и те ж е элементы: M = N & (M С N , N С M ). П уст ое множ ество 0 , не содерж ащ ее элементов, по определе­ нию является подмнож еством л ю бого множества: V M 0 С M . Если M С N , но M = N и M = 0 , то M называется собст вен­ ным подмнож еством N . М нож ество с конечным числом элементов называется конеч­ ным. Конечные множ ества м огут бы ть описаны явным перечис­ лением всех их элементов, при этом принято заклю чать их в ф игурны е скобки. Например, M = {2 , 3, 5, 7 } — множ ество всех п росты х натуральных чисел, меньших 10. По нашему определе­ нию, м нож ество является неупорядоченным объектом , в част­ ности, {2 , 3, 5, 7 } = {5 , 2, 7, 3 }. Ч исло элементов конечного мно­ ж ества M назы ваю т его м ощ ност ью . Оно обозначается |M|. Например, 10 1 = 0, но |{0}| = 1. Ф акт конечности M часто обозначается |M| < то, в противном случае использую т запись |M |= то. Над множ ествами обы чно рассм атриваю тся следующ ие опе­ рации: 1) объединение M U N = { x : x G M или x G N }; 2) пересечение M П N = { x : x G M и x G N } ; 3) разност ь M \ N = { x : x G M и x G N } ; 4) симмет рическая разност ь M Д N = (M U N ) \ (M П N ), причем легко убедиться, что такж е M Д N = (M \ N ) U (N \ M ); 5) дополнение M = { x : x G M }. Операция дополнения под­ разумевает некое универсальное множ ество U , такое, что M С U и M = U \M . Если M П N = 0 , то говорят, что M и N не пересекаются. Операции объединения и пересечения допускаю т обобщение: ес­ ли I — некоторое множ ество, элементы которого использую тся как индексы, то |^J M i = { x : 3 i G I x G M i }, p| M i = { x : V i G I x G M i }. ie i iei
1.2. Отношения на множествах 11 П усть U — универсальное множ ество и M , N , K С U — про­ извольные подмножества. Нетрудно убедиться, что введенные операции над множествами обладаю т следующ ими свойствами: 1) идемпотентность: M U M = M , M П M = M ; 2) коммутативность: M U N = N U M , M П N = N П M ; 3) ассоциативность: (M U N ) U K = M U (N U K ), (M П N )П П К = M П (N П K ); 4) дистрибутивность: ( M U N ) П K = (M U K ) П (N U K ), (M П N ) U K = (M П K ) U (N П K ); 5) поглощение: (M U N ) П M = M , (M П N ) U M = M ; 6 ) свойство нуля: M U 0 = M , M П 0 = 0 ; 7) свойство единицы: M U U = U , M П U = M ; 8 ) инволютивность: M = M ; 9) правила де Моргана: M U N = M П N , M П N = M U N . Равенства |M U N | = |M|+ |N|- |M П N |, |M \ N | = |M|— - | M П N |, |M Д N |= |M|+ |N|— 2|M П N | и пр. легко следую т из определений. 1.2. Отношения на множествах Если a G A и b G B , то через (a, b) обозначим упорядоченную пару. Две упорядоченные пары (a, b) и (c, d) считаю тся равны­ ми тогда и только тогда, когда a = с и b = d. В ообщ е говоря, (a, b) = (b, a). П рямым или декартовым произведением двух множ еств A и B называется множ ество всех различных упоря­ доченны х пар, в которы х первый элемент каж дой пары из A, а второй — из B : A х B = { (a, b) : a G A, b G B } . С т епенью множ ества A называется его прямое произведение сам ого на себя: A n = A х . . . х A (n раз). Очевидно, что для конечных множ еств A и B справедливо |AxB| = |A|-|B|. О тсю да следует |An | = |A|n . П усть A и B — два множества. Тогда произвольное подмно­ ж ество R их прямого произведения A х B называется от нош е­ нием из множ ества A в множ ество B (от англ. relation — о т ­
12 Глава 1. Множества и отображения ношение), или, точнее, бинарным отношением. Для бинарных отнош ений принято использовать инфиксную ф орм у записи: ес­ ли R С A х B , то пиш ут aRb в том и только в том случае, когда (a, b) G R. Если A = B и R С A 2, то говорят об отношении на м нож ест ве A . В качестве примера м ож но привести известные отнош ения = , < , ^ , определенные на множ естве натуральных чисел. Обобщением бинарного отнош ения является n -арное о т ­ ношение R С A i х . . . х A n , где множ ества A j не обязательно различны. Далее рассм атриваю тся только бинарные отношения, которы е для краткости называются просто отношениями. П усть R i С A х B , R 2 С B х C — отнош ения из A в B и из B в C соответственно. Тогда отношение R 1 о R 2 = {(a , c) : a G A, c £ C : 3 b G B a R 1b, bR2c } называется композицией отношений R i и R 2 . П усть R С A 2 — некоторое отнош ение на A. Тогда отнош е­ ние R -1 = {(a , b) : (b, a) G R } называется обратным к отнош е­ нию R, а отнош ение R = {(a , b) : (a, b) G R } — его дополнением. Отношение {(a , a) : a G A } называется т ож дест венны м или отнош ением равенства на A. Например, отнош ение = является дополнением к отнош ению равенства на множ естве N. Отношение R С A 2 называется рефлексивным, если для всех a G A выполнено aR a. Если для всех a, b G A из aRb следует bRa, то отнош ение R называется сим м ет ричным , а если для всех a, b, c G A из aRb, bRc следует aR c, то отнош ение R называется т ранзитивным. Нетрудно убедиться в справедливости следую щ его утвер­ ждения. Л е м м а 1 .1. От нош ение R на м нож ест ве A являет ся р е­ флексивным в том и только в том случае, когда оно содерж ит т ож дест венное от нош ение. Отношение R симметрично то­ гда и только тогда, когда R = R - 1 . Отношение R транзитивно тогда и только тогда, когда R о R С R. Рефлексивное, симметричное и транзитивное отнош ение на­ зы вается от нош ением эквивалентности. Эквивалентность эле­ ментов a и b обозначается a ~ b.
1.3. Отображения 13 П усть ф — отнош ение эквивалентности на множ естве A и a G A. П одмнож ество A ~ множ ества A, состоящ ее из всех таких элементов x G A, что x ф a, называется классом эквивалентно­ сти элемента a. Л е м м а 1 .2 . Всякое от ношение эквивалентности на м но­ ж ест ве A определяет разбиение м нож ест ва A на непуст ые классы эквивалентности. Различные классы эквивалентности не пересекаются: если a ф b, то A ~ = A £ , и если a ф b, то A ~ ПA^ = 0 . Обратно, всякое разбиение м нож ест ва A на непу­ стые непересекающ иеся подм нож ест ва определяет некоторое от нош ение эквивалентности на м нож ест ве A . Если ф — отнош ение эквивалентности на множ естве A, то множ ество классов эквивалентности называется фактор-мно­ ж ест вом множ ества A по эквивалентности ф и обозначается A /~ = { A~ : a G A }. 1.3. Отображения П усть R — отнош ение из A в B . Отношение R называется однозначным или функциональным, если для каж дого элемен­ та a из A из того, что aRb и aR c, следует b = c. Отношение R называется т от альным, или всю ду определенным на A, если для каж дого a G A найдется такой элемент b G B , что выполне­ но aRb. Однозначное всю ду определенное1) на множ естве A отнош е­ ние R С A х B называется от ображ ением или функцией из A в B . Д ля однозначных отношений (отображ ений) вместо запи­ си aRb используется запись b = R (a ), а сами они обозначаю тся строчны ми латинскими или греческими буквами: f , g, ^, ф и т. д. Д ля отображ ения f из A в B используется обозначение « f : A ^ Наряду со всюду определенными функциями важную роль в дискрет­ ной математике играют также функции частичные (однозначные нетоталь­ ные отношения). Однако далее они почти не встретятся, поэтому для удоб­ ства будем считать, что значения функции f : A ^ B определены на всем множестве A.
14 Глава 1. Множества и отображения ^ В » . М нож ество A называется областью определения, а В — област ью значений f . Если b = f (a), то a называется аргум ен­ том, а b — значением функции f на аргументе a. С уж ением ф ункции f : A ^ В на множ ество C С A называется функция f |с = {(a , b) G f : a G C }. П р и м е р 1 .1 . П усть N — произвольное множ ество, A — под­ множ ество N . Функция X a (x ) : N ^ { 0 ,1 } называется характе­ рист ической функцией множ ества A , если X a ( x ) = 1 при x G A и X a (x ) = 0 при x G A. □ М нож ество Im f = { f (a) : a G A } С В называется образом, отображ ения f из A в В . Н аряду с Im f для образа часто ис­ пользуется и обозначение f (A ). М нож ество f - 1(b) = {a G A : b = f (a )} С A называется прообразом элемента b G В . Отображ ение f : A ^ В называется сюръект ивным в слу­ чае Im f = В , т. е. тогда, когда прообраз лю бого элемента из В непуст. О тображ ение f называется инъективным, когда из a = a; следует f (a) = f (a;), т. е. все значения f на элемен­ тах из A различны. Инъективное и сю ръективное отображ ение называется биективным или взаимно однозначным. О тметим, что задание области определения и области значе­ ний отображ ения сущ ественны для его определения. Так, от об­ ражения f : N ^ N и g : R ^ R, будучи определены одним правилом f ( a ) = a 3 и g (a ) = a 3, имею т разные свойства: f инъективно, но не сю ръективно, а g — биекция. По определе­ нию, равенство двух отображ ений f , g означает совпадение об­ ластей определения и значений: f : A ^ В и g : A ^ В , причем f (a) = g (a ) для всех a G A. Композицией, а такж е суперпозицией или произведением 1) отображ ений g : A ^ В и f : В ^ C называется отображ ение f о g : A ^ C , определяемое при каж дом x G A равенством ( f о g )(x ) = f (g ( x ) ) . ^Определение композиции отображений является следствием опреде­ ления композиции отношений, однако ввиду его особой важности мы дали его явно.
1.3. Отображения 15 В дальнейшем вместо f о g мы будем часто писать просто f g . О тметим, что композиция определена не для лю бы х отображ е­ ний f и g: область определения f долж на совпадать с областью значений g. Следующ ая теорема ф орм улирует важнейшее свойство ком­ позиции отображ ений, которое неоднократно будет использова­ но ниже. Т е о р е м а 1 .1 . К ом позиция отображ ений ассоциативна. Точ­ нее, если h : A ^ B , g : B ^ C и f : C ^ D — три от ображ е­ ния, то f о (g о h) = ( f о g) о h. Д о к а з а т е л ь с т в о . Сравним значения отображ ений f о^оЛ.) : A ^ D и ( f о g) о h : A ^ D на произвольном элементе x G A. Согласно определению композиции, ( f о (g о h )) (x ) = f ( (g о h )(x )) = f (g ( h ( x ) ) ) . С другой стороны , ( ( f о g ) о h) (x ) = ( f о g ) (h (x )) = f (g ( h ( x ) ) ) . Сравнивая правые части двух последних равенств, убеж даемся в том , что ( f о (g о h )) (x ) = ( ( f о g) о h) (x ) при лю бом x. Следо­ вательно, отображ ения f о (g о h) и ( f о g) о h совпадаю т согласно определению равенства отображ ений. Приведенные рассуж дения наглядно дем онстрирует диаграм­ ма, изображенная ниже на рисунке. П ро подобные диаграммы A D * (о h B g C говорят, что они коммут ат ивны: результат перехода от одной ее фиксированной вершины к другой не зависит от пути из ориентированных ребер. Так, пунктирное ребро р соответствует
16 Глава 1. Множества и отображения композиции р = g о h, а результат перехода от A к C (соглас­ но определению композиции) не зависит о т того, сделать ли это сразу по пунктирному ребру, или через В по ребрам, помечен­ ным h и g. А налогично другое пунктирное ребро диаграммы задает отображ ение ф = f о g. Ориентированный путь р , f при­ водит из A туда же, куда и путь h, ф (а такж е путь h , g , f ), п оэтом у отображ ения f о р и ф о h равны. Теорема доказана. Далее ввиду доказанной ассоциативности в выражениях ви­ да f о (g о h) будем опускать скобки и писать просто f о g о h. Заметим, что композиция отображ ений, вообщ е говоря, неком­ мутативна, т. е. f о g = g о f даж е в том случае, когда оба эти выражения имею т смы сл (например f , g : A ^ A ). Однако если мы обозначим 6а отображ ение, переводящее каж дый элемент x G A в себя (такое отображ ение называется т ож дест венны м или единичны м ), то очевидно получим f о eA = eA о f = f для л ю бого f из A в A. Если композиция f о g отображ ений f : В ^ A и g : A ^ В совпадает с тож дественны м отображ ением eA, то говорят, что f — левое обратное отображ ение к g, а g — правое обратное к f . Если одновременно f о g = eA и g о f = е в , то говорят, что отображ ение f — обратное к g, отображ ение g — обратное к f , и пишут, соответственно, f = g -1 и g = f - 1 . О тображ ение называется обратимым (слева, справа), если оно имеет (левое, правое) обратное отображ ение. С ледую щ ую п ростую теорем у об обратим ости отображ ений приведем без доказательства. Т е о р е м а 1 .2. Отображение: 1) обратимо слева тогда и только тогда, когда оно инъект ивно; 2 ) обратимо справа тогда и только тогда, когда оно сюръективно; 3) обратимо тогда и только тогда, когда оно биективно. П р и м е р 1 .2. П усть f отображ ает множ ество A = { 0 , 1 , . . . , 5} в м нож ество В = { 0 , 1 , . . . , 10} по правилу f (x) = 2x, а g от об­ раж ает В в A по правилу g (x ) = |_x/2_|. Л егко видеть, что f инъективно, а g сю ръективно. При этом g о f = eA, и хотя ком­ позиция f о g сущ ествует, она не равна е в . □ Так как композиция биективных отображ ений биективна, то,
1.4. Конечные множества и их мощности 17 очевидно, имеет место следую щ ее утверж дение об обратим ости композиции обратим ы х отображ ений. Т е о р е м а 1 .3 . К ом позиция обратимых отображ ений обра­ тима. П р и м е р 1 .3 . Рассмотрим множ ество целых чисел Z и его несобственное подм нож ество 2Z, состоящ ее из всех четных чи­ сел. Н етрудно видеть, что отображ ение f : Z ^ 2Z, действу­ ющее по правилу f (n) = 2 n, является взаимно однозначным и обладает обратны м f - 1 : 2Z ^ Z , действую щ им по правилу f - 1(2n) = n. Такж е взаимно однозначным будет сужение f 2z отображ ения f на множ ество 2Z. П оэтом у композиция f 2z о f , отображ аю щ ая целые числа в множ ество 4Z, состоящ ее из всех целых кратных четырем, является обратим ы м отображ ением с обратны м g - 1 : 4Z ^ Z, действую щ им по правилу g(4n ) = n. □ Говорят, что множ ества A и B равномощны, если сущ ествует взаимно однозначное отображ ение A в B (очевидно, что одно­ временно сущ ествует и взаимно однозначное отображ ение B в A ). Л егко видеть, что два конечных множ ества равномощ ны, ес­ ли их мощ ности равны. П оэтом у никакое конечное м нож ество не равномощ но никакому своему собственном у подмножеству. Для бесконечны х множ еств это не так. П р и м е р 1 .4 . В силу предыдущ его примера множ ества Z , 2Z и 4Z равномощ ны. □ 1.4. Конечные множества и их мощности П усть A = |й1, . . . , ап } — конечное множ ество. С овокупность из к элементов множ ества A (не обязательно различных) на­ зы вается к-выборкой множ ества A. В ы борка называется упоря­ доченной, если каж дом у ее элементу поставлен в соответствие номер — натуральное число, не превосходящее к так, что раз­ ным элементам соответств у ю т разные числа. Упорядоченные выборки будем называть такж е наборами. Элементы упорядо­ ченных вы борок будем заклю чать в круглые скобки, а элемен­ ты неупорядоченных вы борок — в ф игурны е скобки. Например,
18 Глава 1. Множества и отображения (a i, a 2 , a 2) и (a 2 , a i, a 2) — две различные упорядоченные вы бор­ ки, а { a i , a 2, a 2 } и { a 2 , a i , a 2 } — одна и та ж е неупорядоченная выборка. Перест ановкой n -элементного множ ества A = { a i , . . . , a n } называется лю бой набор (a^1, . . . , a^n), состоящ ий из элементов A, в котором каж дый элемент из A встречается ровно один раз. Например, у трехэлементного множ ества { a i , a 2 , a s } сущ ествует ровно ш есть различных перестановок: (a i, a 2 , as), ( a i ,a 3 , a 2), (a 2,a i ,a s ) , (a 2, a 3, a i), (a 3, a i , a 2), (a 3 , a 2,a i ) . Найдем число Pn различных перестановок n -элементного множ ества. Для этого из n -элементного множ ества будем по­ следовательно выбирать элементы и ф орм ировать из них упо­ рядоченную выборку: первый выбранный элемент станет пер­ вым элементом упорядоченной выборки, второй — вторы м и т. д. Н етрудно видеть, что первый элемент мож но выбрать n способами. В торой элемент будет выбираться из (n — 1) остав­ шихся элементов, п оэтом у его мож но выбрать (n — 1) способом . П родолж ая выбор, заметим, что после выбора первых k элемен­ тов останется (n — k) невыбранных элементов. Следовательно, (k + 1)-й элемент мож но выбрать (n —k) способами. Перемножив числа сп особов, которы м и мож но выбрать первый, второй, . . . , (n — 1)-й и n -й элементы, получим величину, равную числу сп о­ собов, которы м и м ож но упорядочить n -элементное множ ество. Таким образом, Pn = n ■(n — 1) ■. . . ■2 ■1 = n!. (1.1) Разм ещ ением из n элементов по k называется произвольная перестановка k-элементного подмнож ества n -элементного мно­ ж ества. Для обозначения числа размещений из n элементов по k используется символ An. Рассуждениями, аналогичными при­ веденным выше при определении величины Pn , нетрудно пока­ зать, что n! A n = n (n — 1) ' . . . ' (n — k + 1) = (n —! k) ! . (1.2)
1.4. Конечные множества и их мощности 19 Сочетанием из n элементов по к называется произвольное кэлементное подм нож ество n -элементного множ ества. Ч исло сочетаний из n элементов по к обозначается через (^) (иногда так­ ж е используется символ ). Так как у одного к-элементного подмнож ества сущ ествует ровно к! различных перестановок, то из ( 1 .2 ) легко следует, что n!n (n — 1 ) ■. . . ■(n — к + 1) (n — к)!к! к(к — 1) ■. . . ■2 ■1 Из равенства (1.3) легко вы текаю т следую щ ие часто используе­ мые свойства сочетаний: (1.4) Сочетанием с повторениями из n элементов по к называ­ ется неупорядоченная к-вы борка n -элементного множ ества. На­ пример, из трех элементов a i, a 2 и аз м ож но составить шесть сочетаний с повторениями по два элемента: a 1a 1,a 1a2, a 1a3, a 2a2, a 2a3, a 3a3. К аж дое сочетание с повторениями из n элементов по к однознач­ но определяется тем, сколько раз каж дый элемент множ ества входит в рассматриваемое сочетание. П усть в некоторое такое сочетание элемент ai входит mi раз, где i = 1, 2, . . . , n . Э том у сочетанию поставим в соответстви е набор 1 . . . 1 0 1 . . . 10 0 1 ... 1 (1.5) из к единиц, сгруппированных в n блоков, и n — 1 нулей, раз­ деляющ их эти блоки. В этом наборе первый блок из m i единиц соответствует элементу m i, второй блок из m 2 единиц — элемен­ ту a2, и т .д . Приведенным выше двухэлементным сочетаниям соответств у ю т следую щ ие шесть наборов: 1100 , 1010 , 1001 , 0110 , 0101 , 0011 .
20 Глава 1. Множества и отображения Очевидно, что набор вида (1.5) однозначно определяет соответствую щ ее ему сочетание с повторениями. П оэтом у число H,jk сочетаний с повторениями из n элементов по k равно числу на­ боров из k единиц и n — 1 нулей. К аж ды й такой набор мож но рассм атривать как набор значений характеристической ф ун к­ ции k-элементного подмнож ества (n + k — 1)-элементного мно­ ж ества. Следовательно, Числа сочетаний называются такж е биномиальными ко- эффициентами, так как они появляются в формуле бинома Ньют она ( 1 .6 ) Справедливость равенства (1.6) следует из того, что после рас­ кры тия ск обок в выражении ( 1 + x ) n коэф ф ициент при k-й степе­ ни переменной x будет равен числу способов, которыми мож но выбрать k раз переменную x из n двучленов (1 + x ). П р и м е р 1 .5 . В n -элементном множ естве найдем число под­ множ еств четной и нечетной мощ ности. Очевидно, эти числа равны Y . S 1 (2к) и Х^к==0 G fc+ J . Для вычисления этих сумм воспользуемся ф ормулой бинома Н ьютона. Подставляя в (1.6) вместо x единицу и минус единицу, получим тож дества Вычисляя сум м у и разность этих тож деств и деля результаты пополам, получаем, что Таким образом, в n -элементном множ естве сущ ествует ровно 2n 1 подмнож еств четной мощ ности и столько ж е подмнож еств нечетной мощ ности. □
21 1.4. Конечные множества и их мощности Полезным средством при подсчете числа элементов различ­ ных множ еств является формула включений и исключений, ко­ торая выраж ает мощ ность объединения множ еств через мощ но­ сти их пересечений. Для двух множ еств эта ф орм ула выглядит достаточн о п росто: |A U B| = |A| + |B| — |A П B | . В общ ем случае справедлива следую щ ая теорема. Т е о р е м а 1 .4 . Д ля любых конечных м нож ест в A i , . . . , A n справедливо равенство |Ai U ' - ' U A n |= |Ai | i^i^n . . . + ( —1)k+ i |Aii n A i 2 1+ . . . i^ii<i2 ^n £ |Aii П - - - П Aik |+ . . . i^il<^^^<ifc^n (L 7 ) ••• + ( —1)n + i|Ai n . . . П An|. Д о к а з а т е л ь с т в о . П усть целое m не меньше нуля и не боль­ ше m. Д опустим , что некоторый элемент a принадлежит ровно m множ ествам. Тогда a принадлеж ит (m) попарным пересечени­ ям множ еств A i , . . . , A n , (m) тройны м пересечениям этих мно­ ж еств, и в общ ем случае (m) пересечениям по k множ еств. Сле­ довательно, в сумме, стоящ ей в правой части (1.7), этот элемент будет учтен ровно m ) —(m) + - ( —^ ( m ) + + ( —D m + i ( ; : ) ™ раз. Из (1.6) следует, что ( 1 —1 Г = : — ( m ) + ( m ) —.. . + - 4 кI m\ I + <—11> k) + \m I m - + ( —L) Vm I / 1 П оэтом у сумма (1.8) равна единице. Следовательно, в правой части (1.7) каж дый элемент, принадлежащий объединению мно­ ж еств A i , учиты вается ровно один раз, и п оэтом у вся сум м а рав­ на мощ ности объединения этих множ еств. Теорема доказана.
22 Глава 1. Множества и отображения П р и м е р 1 .6 . Найдем число N (n, m ) сю ръективны х отобра­ жений n -элементного множ ества A = { a 1, . . . , an } в m -элемент­ ное множ ество B = {b 1, . . . , bm}. К аж дое такое отображ ение f однозначно определяется набором образов ( f (a 1) , . . . , f (an)) = (bii , . . . ,bin ) (1.9) всех элементов множ ества A, в котором встречается каждый элемент множ ества B . Л егко видеть, что сущ ествует ровно m n отображ ений (не обязательно сю ръективны х) множ ества A в множ ество B . Из всех таких отображ ений составим m под­ множ еств N 1, . . . , N m, так, что Ni будет состоять из всех тех отображ ений, при которы х элемент bi не имеет прообраза в A, т. е. этот элемент отсутствует в наборе (1.8). Тогда N (n, m ) = = m n — |N1 U ■■■U N m |, где мощ ность объединения находится при помощи ф орм улы вклю чений-исклю чений. Следовательно, N (n, m ) = = m n — |N1 U ■■■U N m| = m n —^ |Ni |+ 1^i^m ^ |Nii П N i2|— . . . 1^ii<i2^m ------+ ( —1)k ^ |Nii П " ' П N ik 1+ . . . 1^il<^"<ifc ^m . . . + ( —1) m|N1 П - - - П Nm|. О тображ ения из множ ества N ii П- ■-П N ik мож но получить от об­ раж ая элементы множ ества A в м нож ество {bii , . . . , bik}. Следо­ вательно, |Nii П ■■■П N ik 1 = (m — к)П. Подставляя это равенство в преды дущ ую ф орм улу и учитывая, что число различных множ еств N ii П ■■■П N ik равно (m ), полу­ чаем иском ое число N (n ,m ) = ± □ ( —1) ‘ (m — k ) n f m ) = £ ( —1)k \к) - k>’;m ! . k !(m — к) !
Задачи 23 Задачи 1.1. Пусть R = {(a, b) : a, b G N, а = b2}. Какими свойствами обладает отношение R? 1.2. Доказать, что если |A| = n, то число различных бинарных отношений на множестве A равно 2” . Сколько среди них рефлексив­ ных, симметричных? 1.3. Привести примеры отношений: 1) не рефлексивного, но сим­ метричного и транзитивного; 2) не симметричного, но рефлексивного и транзитивного; 3) не транзитивного, но симметричного и рефлек­ сивного. 1.4. На множестве прямых на плоскости рассмотрим отношения: 1) параллельности прямых; 2) перпендикулярности прямых. Опреде­ лить, будут ли эти отношения отношениями эквивалентности. 1.5. Доказать, что пересечение двух отношений эквивалентности на некотором множестве также является отношением эквивалентно­ сти на нем. 1.6. Отношение R на множестве A называется антисимметрич­ ным, если для любых a, b G A из aRb и bRa следует a = b. Рефлек­ сивное, антисимметричное и транзитивное отношение называется от­ ношением частичного порядка на множестве A и обозначается сим­ волом ^. Множество A с отношением ^ называется частично упо­ рядоченным. Показать, что множество 2х всех подмножеств конеч­ ного множества X с отношением включения «С » является частично упорядоченным и что всякое частично упорядоченное множество X изоморфно некоторой системе своих подмножеств, частично упорядо­ ченной отношением включения. 1.7. Доказать, что если R — частичный порядок, то R -1 — также частичный порядок. 1.8. Отношение частичного порядка на множестве A, для которого любые два элемента сравнимы, т. е. a ^ b или b ^ a для любых a, b G G A, называется отношением линейного порядка. Доказать, что всякий частичный порядок на конечном множестве может быть продолжен до линейного порядка. 1.9. Привести пример линейного порядка на множестве N х N. 1.10. Доказать леммы 1.1 и 1.2. 1.11. Доказать теорему 1.2 для отображений на конечных множе­ ствах.
24 Глава 1. Множества и отображения 1.12. Установить взаимно однозначное соответствие между мно­ жествами целых и рациональных чисел. 1.13. Найти сумму ^П = 0 k (П). 1.14. Найти число n-элементных перестановок ( i i , . . . , in) множе­ ства { 1, . . . , n } таких, что k = ik для k = 1, . . . , n. 1.15. Найти число прямоугольных таблиц из n строк и m столбцов с элементами ± 1, у которых произведения всех элементов каждой строки и каждого столбца положительны. 1.16. За круглым столом сидят n человек. Сколькими способами из них можно выбрать k человек так, чтобы среди выбранных не было соседей. 1.17. Найти число натуральных решений уравнения x i + ■■■+xk = = n. 1.18. Сколько существует натуральных десятичных n-разрядных чисел, у которых цифры следуют в невозрастающем порядке? 1.19. Доказать, что miH----+mk=n 1.20. Выразить функцию XAlU--UAn(x) через функции x a (x). 1.21. Используя предыдущую задачу, доказать формулу включе­ ний-исключений.
Глава 2 Целые числа Эта глава является кратким введением в элементарную теорию чисел. В ней содерж атся просты е и в то ж е время необходи­ мые для изучения появляющихся далее алгебраических стр у к ­ т ур сведения о целых числах и их свойствах. 2.1. Делимость. Алгоритм Евклида Будем говорить, что целое число a делится на целое число b = 0, если сущ ествует такое целое c, что a = bc. Если целое a делится на целое b, то число b будем называть делителем a, и будем говорить, что b делит a и обозначать это так: b | a. Очевидно, что для каж дого a = 0 числа ± a и ± 1 являю тся делителями a. Такие делители будем называть тривиальными. Если b не делит a, то запишем b { a. С войство одного числа делить другое задает на множ естве целых чисел отнош ение делимости «|», которое, как нетрудно видеть, является транзитивным (если b | a и c | b, то c | a) и обладает следующ ими простыми свойствами: если a | b и b | a, то a = ± b ; если c |a и c |b, то c |a ± b; если c |b, то c |ab. Доказываемая далее теорема играет фундаментальную роль при изучении свойств целых чисел и называется теоремой о де­ лении с остатком . Т е о р е м а 2 .1 . Д ля любых целого a и натурального b найдут­ ся, и притом единственные, такие целые q и r, что a = qb + r, где 0 ^ r < b.
Глава 2. Целые числа 26 Д о к а з а т е л ь с т в о . Рассмотрим множ ество целых неотрица­ тельных чисел вида a — bk, где k — целое. П усть r = a — bq — наименьший неотрицательный элемент этого множ ества. Тогда 0 ^ r < b. Если это не так и r = a — bq ^ b, то неравенство 0 ^ a — (q + 1)b < r противоречит минимальности r. Д окаж ем единственность указанного представления. П ред­ положим, что a = qb + r = q1b + r' и 0 ^ r < r' < b. О тсю да (q' —q)b = r ' —r, т. е. неотрицательное число r' —r делится на b. С другой сторон ы r ' — r < b. Противоречие. Следовательно, r = r' и (q' — q)b = 0, т. е. q = q'. Теорема доказана. Ч исло r из теоремы 2.1 называется остатком от деления a на b, а число q — (не)полным частным или целой част ью дроби a и обозначается |^J . Целое b, которое делит каж дое из целых чисел a 1, a 2 , . . . , an , называется общ им делителем этих чисел. Наибольшее число сре­ ди общ их делителей чисел a 1, a 2 , . . . , an называется их наиболь­ ш им общим, делителем и обозначается символом (a 1, a 2 , . . . , an) или Н О Д (a l, a 2 , . . . , an). Например, (2, 4, 6 ) = 2. Л егко видеть, что если целые a и b не имею т нетривиальных общ их делителей, то (a, b) = 1. Такие числа называются взаимно простыми. Т е о р е м а 2.2 (Е вклид). Д л я любых двух нат уральных a и b минимальное натуральное d, для которого справедливо равен­ ство d = ax + by, где x и y целые, являет ся наибольшим общим, делителем чисел a и b. Д о к а з а т е л ь с т в о . Рассмотрим м нож ество {a x + by} всех ли­ нейных комбинаций чисел a и b с различными целыми коэф ф и ­ циентами x и y. П усть d = axo + byo — минимальное натуральное число этого множ ества. Покажем, что a делится на d. Для этого разделим a на d с остатком и представим его в виде a = qd + r, где 0 ^ r < d. Тогда r = a — qd = a — q (a x 0 + by0) = = a (1 — qxo) — b(qyo) = a x 1 + byb где x 1 = 1 —qxo и y 1 = —qyo. Так как d — минимальное натураль­ ное число множ ества { a x + b y } и r < d, то r = 0 и, следовательно,
2.1. Делимость. Алгоритм Евклида 27 a делится на d. Аналогичным образом доказывается делим ость на d числа b. Следовательно, d является общ им делителем чисел a и b. Теперь покажем, что d будет наибольшим общ им делите­ лем. Д ействительно, если a и b делятся на d ■d; , где d; > 1, то в равенстве d = axo + byo правая часть будет делиться на d ■d; , а левая не будет. Следовательно, d = (a, b). Теорема доказана. Рассмотрим алгоритм нахождения наибольшего общ его де­ лителя двух натуральных чисел a и b. Будем полагать, что a > b. Тогда a = qib + r i , где 0 ^ r i < b. Л егко видеть, что (a, b) = (b, r i ). П оэтом у вместо (a, b) будем искать (b, r i). П ро­ долж ая подобные рассуж дения, получим цепочку равенств a = b qi + r i , (a, b) = (b, r i), b = r i q 2 + r 2, (b, r i) = ( r i , r 2), ri =r2q3 + r3, ( r i , r 2) = (r 2 , r 3), rn - 2 —rn -1 qn + rn rn - i = rnqn + b (2 .1) ( r n - 2 ,r n - i ) = (Г п - 1,Гп), (Г п - 1,Гп) = Гп, в которой последний положительный остаток rn и будет наи­ больш им общ им делителем чисел a и b. Приведенный алгоритм нахождения наибольшего общ его де­ лителя называется алгоритмом Евклида, а вычисление очеред­ ного остатка ri называется i-м ш агом этого алгоритма. А л го­ ритм ( 2 . 1 ) состои т из (n + 1) шагов, а если rn = 1 , то из n шагов, так как последнее деление на единицу мож но не выполнять. За­ метим, что остатки ri в алгоритме Евклида убывают, оставаясь положительными, п оэтом у очевидно, что алгоритм остановится за конечное число шагов. Оценим число шагов в алгоритме Ев­ клида. Для этого рассм отрим последовательность {a n }^ = i, ко­ торая начинается с чисел 1, 2, 3, 5, 8,13, 21, 34, 55, 8 9 ,1 4 4 ,..., ( 2 .2 ) и в которой каж дый член, начиная с третьего, равен сумме двух предыдущ их. Применяя алгоритм Евклида к числам an+2
28 Глава 2. Целые числа и an+ 1, нетрудно убедиться, что для определения наибольшего общ его делителя этих чисел потребуется ровно n шагов алго­ ритма и что (an+ 2 ,a n+ 1) = 1. Например, для n = 2 наибольший общий делитель чисел а 4 = 5 и а 3 = 3 определяется за два шага: 5 = 3 ■1 + 2, 3 = 2 ■1 + 1. Теперь покажем, что определение наибольшего общ его де­ лителя чисел an+2 и an+1 требует максимального количества шагов алгоритма Евклида среди всех пар натуральных чисел х и у, в к оторы х меньшее число не превосходит an+ 1. Сделаем это индукцией по n. Далее везде полагаем, что у < х. Если у ^ а 1, то n = 0 и (х, у) = 1 определяется без выполне­ ния делений. Если у ^ а 2 = 2, то n = 1 и легко видеть, что (х, у) м ож но найти, выполнив только один шаг алгоритма Евклида. Д ва эти случая (n = 0 ,1 ) положим в основание индукции. Предположим, что наибольший общий делитель лю бы х на­ туральны х х ' и у' мож но найти, выполнив самое больш ее n ша­ гов алгоритма Евклида, если только х ' > у ' и у 1 ^ an+ 1. Рас­ см отрим натуральные х и у такие, что х > у, у ^ an+2 и n ^ 1 . Тогда х = у ^1 + r 1. Если Г1 ^ an+ 1, то в силу предположения индукции наиболь­ ший общий делитель чисел у и Г1 мож но найти, выполнив не более чем n делений, и, следовательно, для определения (х, у) потребуется выполнить не более чем (n + 1) шагов алгоритма Евклида. П усть теперь Г1 > an+ 1. В этом случае у = Г1^2 + Г2 , где r 2 ^ у — r 1 < an+ 2 — an+1 = an . Следовательно, в силу предпо­ ложения индукции наибольший общий делитель чисел Г1 и Г2 м ож но найти, выполнив не более чем (n — 1) делений. П оэто­ му для определения (х, у) достаточн о выполнить самое большее (n + 1) шагов алгоритма Евклида. Полученный результат сформулируем в виде следующ ей тео­ ремы о слож ности алгоритма Евклида. Т е о р е м а 2 .3 . Если м ен ьш ее из двух нат уральных чисел не превосходит an + 1 , то наибольший общий делитель эт их чисел
2.1. Делимость. Алгоритм Евклида 29 м ож н о найти, выполнив самое больш ее n шагов алгоритма Е в­ клида. Вычисление наибольшего общего делителя чисел an+2 и an+1 требует выполнения ровно n шагов алгоритма Евклида. Покажем, что при каж дом натуральном k для членов после­ довательности ( 2 .2 ) имеет место равенство afc = / 5 ( a fc+1 — в к+1) , (2.3) в к отором постоянные а = 1+2^5 и в = 1—г 5 являю тся корнями уравнения x 2 — x — 1 = 0. Сделаем это индукцией по k. Так как а + в = 1, а в = —1 , а 2 = а + 1 , в 2 = в + 1 и а — в = / 5 , то легко видеть, что а 2 — в 2 = (а — в ) ( а + в ) = / 5 , а 3 — в 3 = (а — в ) ( а 2 + а в + в 2) = (а — в ) ( а + в + 1) = 2 / 5 . П оэтом у ^15 ^а 2 — в 2) = 1 = a 1 и ^ а 3 — в 3) = 2 = a2. Таким образом, два первых члена последовательности ( 2 .2 ) удовлетво­ ряю т равенству (2.3). Эти равенства положим в основание ин­ дукции. Предположим, что равенство (2.3) такж е справедливо при всех k, не превосходящ их некоторое m. Тогда из предположения индукции и равенства an+2 = an+1 + an имеем am+2 = am+1 + am = Равенство (2.3) доказано. Воспользуемся теоремой 2.3 и равенством (2.3) для оцен­ ки числа шагов алгоритма Евклида, д остаточн ого для нахож ­ дения наибольшего общ его делителя натуральных чисел a и b. Д опустим , что меньшее число b удовлетворяет неравенствам
Глава 2. Целые числа 30 an < b ^ an+ 1. Тогда из теоремы 2.3 следует, что для вычисле­ ния (a, b) потребуется не более n шагов. Величину n оценим при помощи (2.3). Из этого неравенства легко следует, что an ^ a n . П оэтом у loga b > loga an ^ loga = n. Т ак как > 10, то, переходя к десятичным логарифмам получим следую щ ую оценку числа n: n < loga b = 5 log a5 b < 5log 10 b. Из полученного неравенства немедленно следует теорема Ламе о максимально возмож ном числе шагов в алгоритме Евклида. Т е о р е м а 2 .4 (Л аме). Число шагов алгоритма Евклида при определении наибольшего общего делителя двух чисел не пре­ восходит пятикратную длину десят ичной записи м ен ьш его из эт их чисел. Заметим, что алгоритм Евклида мож но использовать для вычисления целых х и у, удовлетворяющ их равенству (a, b) = = ах + Ьу (такие х, у называются коэффициентами Б езу для чисел a, b). Для этого с пом ощ ью предпоследнего равенства из (2.1) надо выразить (a, b) через rn - 1 и rn - 2 . Затем в получен­ ном равенстве вместо r n - 1 надо подставить его выражение че­ рез r n - 2 и rn - 3, и т .д . Рассмотрим этот алгоритм на следующ ем примере. П р и м е р 2 .1 . Ниже в левом столбце вычисляется наибольший общий делитель 73 и 14, а в правом находятся целые х и у, для которы х (73,14) = 73х + 14у: 73 = 14 ■5 + 3, 1 = 3 — 2, 14 = 3 ■4 + 2, 1 = 3 — (14 — 3 ■4), 3 = 2 ■1 + 1. 1 = (73 — 14 ■5) — (14 — (73 — 14 ■5)4) = 73(1 + 4) — 14(5 + 1 + 20) = = 7 3 -5 - 1 4 -2 6 . Таким образом, (73,14) = 1, х = 5, у = —26. □
2.1. Делимость. Алгоритм Евклида 31 Предложенный выше сп особ вычисления коэф ф ициентов Безу мож но условно разделить на два этапа: прямой ход (вы чис­ ление остатков ri и неполных частны х q при возрастающ ем i) и обратный ход (последовательное вычисление коэф ф ициентов линейных комбинаций ri и ri- i при убывающ ем i). Э то не все­ гда удобно, поскольку требует дополнительных затрат памяти на хранение ri, qi и рекурсию. С ущ ествует модификация алго­ ритма Евклида, свободная от этого недостатка. Ее ф ормулировка использует арифметические операции над упорядоченными наборами чисел, называемыми векторами. П о­ дробнее о векторах мы расскаж ем в главе 5, а здесь просто будем пользоваться записью q ■ (x, y, z) для обозначения упорядочен­ ной тройки (qx, qy, qz) и записью (x, y, z) ± (x ; , y ;, z ;) для тройки ( x ± x ; , y ± y ;, z ± z ;), считая, как обы чно, что умножение имеет бо­ лее высокий приоритет, чем сложение и вычитание, а равенство упорядоченны х наборов означает равенство всех их компонент. Л е м м а 2.1 (Расширенный алгоритм Евклида). П уст ь a, b G G N и a > b. Рассмот рим последоват ельност ь (x i,y i,z i) G Z 3, i = - 1 , 0 ,1 , 2 , . . . , такую, что (2.4) и (2.5) где qi = |_zi_2 /zi_i_|. Тогда 1) числа zi, i ^ 1 совпадают с остатками, полученными на i -м шаге деления в алгоритме Евклида поиска Н О Д ^ , b) (см. (2.1)); 2) при любом i ^ —1 выполнено равенство axi + byi = zi; ( 2 .6 ) 3) если n — число делений с остатком в алгоритме Евклида, то zn = (a, b), причем x n и yn — искомые коэффициенты Безу линейной комбинации axn + byn = (a, b).
Глава 2. Целые числа 32 Д оказател ьство. 1. Равенство (2.5) показывает, что для третьей координаты вектора (x i,y i,Z i) выполнено Zi = Zi_2 — — Lzi_2/ z i —1J Zi- 1, т. е. Zi является остатком от деления Zi_2 на Zi- 1. П оэтом у последовательность { z i } совпадает с последова­ тельн остью { r i } остатков алгоритма Евклида для r _1 = z _1 = a, ro = zo = b. 2. Д окаж ем искомое равенство по индукции. При i = —1, 0 оно верно в силу выбора начальных условий (2.4). П усть aXi_2 + + byi _2 = zi-2 и a x i_ 1 + byi_ 1 = zi - 1 . Тогда из (2.5) имеем axi + byi = a(xi_2 — ^ х ^ ) + b(yi_2 — qi yi_1) = = (axi_2 + byi—2) — 9i(axi_1 + by i_l) = = Zi_2 — qiZi_1 = Zi. 3. И скомое утверж дение непосредственно следует из пп. 1—2. Л емма доказана. П р и м е р 2 .2 . Применим алгоритм леммы 2.1 к числам из примера 2.1. Вычисления, производимые этим алгоритмом, удоб­ но сводить в таблицу: 1 0 1 —4 5 0 1 —5 21 —26 73 14 3 2 1 0 Д ва ее первых столбца являю тся начальными условиями (2.4). Согласно (2.5), каждый очередной столбец таблицы, имеющий номер i ^ 1, вычисляется как линейная комбинация двух стоя ­ щих слева о т него столбцов с коэффициентами 1 и ( —qi). Н иж ­ няя строка таблицы содерж ит остатки алгоритма Евклида. В ы ­ числения оканчиваются, как только в нижней строке появился нуль. Тогда последний ненулевой остаток — это Н О Д (7 3 ,14), а над ним в таблице находятся коэф ф ициенты Безу искомой ли­ нейной комбинации: 1 = (73,14) = 73 ■5 + 14 ■( —26). О тметим, что объем дополнительной памяти для данного алго­ ритма весьма скромен: для проведения вычислений по ф ор м у ­ ле (2.5) достаточн о всего 10 целочисленных переменных. □
2.2. Разложение на простые множители 33 Целое положительное b, которое делится на каж дое из це­ лых чисел a 1, a2, . . . , an , называется общ им кратным этих чи­ сел. Наименьшее положительное число среди общ их кратных чисел a 1,a 2 , . . . , a n называется их наим еньш им общим, крат­ ным и обозначается символом Н О К ^ 1, a 2 , . . . , an). Например, Н О К (2, 4, 6 ) = 12. М ож но показать, что Н О Д ^ , b) ■Н О К ^ , b) = = ab для лю бы х натуральных a и b. 2.2. Разложение на простые множители Н атуральное число р называется простым, если у него есть ровно два различных натуральных делителя — единица и само число p. Среди первых тридцати натуральных чисел простыми являю тся 2, 3, 5, 7, 11, 13, 17, 19, 23, 29. Из определения п ростого числа легко следует, что лю бое на­ туральное число мож но разлож ить в произведение просты х, на­ пример 12 = 2■ 2 ■3. Покажем, что такое разложение единственно с точн остью до порядка следования сомнож ителей. Сначала д о ­ кажем две просты е леммы. Л е м м а 2 .2 . Если произведение ab нат уральных a и b делит­ ся на простое р, то хот я бы один из сом нож ит елей такж е делится на p . Д о к а з а т е л ь с т в о . Д опустим , что утверж дение леммы не верно. Тогда ни один из сомнож ителей не делится на р. Сле­ довательно, (a ,p ) = 1 и (b, р) = 1 , и из утверж дения теоремы 2.2 следует, что найдутся такие целые x 1, x 2 и y 1,y 2, что 1 = x 1a + x 2p, 1 = y 1b + y 2p. Перемножив эти равенства, получим, что 1 = ( x 1a + x 2p )(y 1b + y 2p) = = ( x 1y 1)ab + p (x 2y 1b + x 1y 2a + x 2y 2p),
34 Глава 2. Целые числа т. е. в силу теоремы 2.2 числа ab и p взаимно просты . П ротиво­ речие. Лемма доказана. Л е м м а 2 .3 . Если произведение a ia 2 ■■■an нат уральных ai де­ лит ся на прост ое р, то хот я бы один из сом нож ит елей такж е делится на p . Д о к а з а т е л ь с т в о . Л емму докаж ем индукцией по числу со ­ множителей. Случай n = 2 доказан в предыдущей лемме. Д оп у­ стим, утверж дение леммы справедливо для лю бы х произведе­ ний, содерж ащ их не более k сомнож ителей. Тогда если произве­ дение (a ia 2 ■■■ak)ak+i делится на р, то из леммы 2.2 следует, что либо a ia 2 ■■■ak, либо ak+i делится на р. В первом случае утвер­ ждение леммы следует из предположения индукции. В о втором случае справедливость леммы очевидна. Лемма доказана. Теперь мож но доказать основную теорем у арифметики о единственности разложения целого числа на просты е сом нож и­ тели. Т е о р е м а 2 .5 . Любое натуральное число единст венным об­ разом раскладывается в произведение прост ых сом нож ит елей и притом единст венным образом,, с т очност ью до и х порядка. Д о к а з а т е л ь с т в о . Теорему докаж ем методом математиче­ ской индукции. В основание индукции положим число 2, един­ ственность разложения которого очевидна. П редположим, что каж дое натуральное число, не превосходящее N , разлагается на просты е множители единственным образом. Покажем, что из этого предположения следует единственность разложения чис­ ла N + 1. Д ействительно, если натуральное N + 1 имеет два различных разложения в произведение п росты х сомнож ителей, то n + 1 = pk1pk2 - ••рПп = qS1qS2 ■••qm, где р 1 < р 2 < ■■■ < pn и q 1 < q2 < ■■■ < qm. Покажем, что p i = q i. Так как простое p i делит произведение q i " - q i <?2 " - q 2 ■.......... ■qm ■■■qm, si раз S2 раз sm раз (2.7)
2.3. Теорема Чебышёва 35 то в силу леммы 2.3 число p 1 такж е делит один из его сом н о­ жителей. В (2.7) все сомнож ители — просты е числа. Следова­ тельно, р 1 совпадает с одним из них. Так как р 1 — минимальный простой делитель N + 1, то легко видеть, что р 1 = q1. Сокращ ая левую и правую части равенства (2.7) на р 1, получим N - + 1 = —k1- 1—(k2 ••• p k nn = q?1- 1qS2 ••• p1 ( 2 .8 ) . По предполож ению индукции натуральное (N + 1 ) /—1 расклады­ вается на просты е множители единственным образом. П оэтом у в (2.8 ) n = m и для каж дого i G { 1 , . . . , n } справедливы равен­ ства —i = qi и ki = Si. Теорема доказана. 2.3. Теорема Чебышёва Нетрудно показать, что п росты х чисел бесконечно много. Е с­ ли это не так, то найдется максимальное простое число n. Оче­ видно, что n! = Iin =1 k делится без остатка на каж дое простое, и, следовательно, остаток о т деления n! + 1 на каж дое простое равен единице, т. е. n! + 1 не делится ни на одно из п росты х чи­ сел. П оэтом у либо n! + 1 само простое, либо содерж ит простой делитель, больший n. Получивш ееся противоречие доказы вает бесконечность числа п росты х чисел. Э тот ф а к т был известен еще Евклиду в III в. д о н. э. Однако естественный вопрос о том, как часто среди натуральных чисел встречаю тся простые, дол го оставался без ответа. Через n (x ) обозначим количество п росты х чисел, не превосходящ их x. Если рассм отреть первые просты е числа 5 7 11 41 97 2 43 47 101 103 3 53 59 107 109 61 67 113 127 13 17 19 71 73 79 131 137 139 23 29 157 163 167 173 179 181 191 199 211 223 31 37 83 89 149 151 и вычислить разности м еж ду соседними, то м ож но заметить, что промеж утки
Глава 2. Целые числа 36 1 6 4 2 2 6 2 6 2 4 4 10 2 2 2 4 2 4 6 6 4 6 6 4 6 8 6 2 6 2 2 4 6 4 4 10 2 2 8 4 6 4 14 12 12 м еж ду соседними простыми в среднем возрастают, п оэтом у м ож ­ но предполож ить, что n ( n ) /n ^ 0 с ростом n. Э то действительно так. Более того, Гаусс и Лежандр, в конце X V III в. независимо д руг от друга численно изучавшие функцию n (n ) (количество вычисленных ими значений n (n ) исчислялось сотнями ты сяч), предположили, что имеет место асимптотическое равенство1) п (х ) - х -^ , ln х (2.9) но доказать это предположение не смогли. И только в самом конце X IX в. А дамар и Валле-Пуссен, такж е независимо и одно­ временно, установили справедливость равенства (2.9), называе­ мого асимпт от ическим законом распределения прост ых чисел. О тметим, что первое сущ ественное продвижение в изучении распределения п росты х чисел было сделано П. Л. Чебыш ёвым, которы й в середине X IX в. нашел порядок роста функции n (n ), установив для нее достаточн о близкие верхнюю и ниж ню ю оцен­ ки. Далее в теореме 2.6 докаж ем ослабленные оценки Чебышёва. Д ля этого п отребую тся п росты е неравенства 2 2n ^ 2n ) 2n < U ' < „,’ 2‘ для среднего биномиального коэффициента, справедливость ко­ торы х при всех n > 1 легко следует из ф орм улы бинома Н ью ­ тона. Т е о р е м а 2 .6 (Ч ебы ш ёв). Сущ ест вую т такие постоянные С1 и С2, что для любого целого n > 2 справедливы неравенства n n вц -------- ^ n (n ) ^ в2 log 2 n log 2 n ^Формула a(n) ~ b(n) означает, что lima(n)/b(n) = 1 при n ^ to.
2.3. Теорема Чебышёва 37 Д о к а з а т е л ь с т в о . Сначала получим верхнюю оценку ф ун к­ ции n (n ). Д ля этого рассм отрим биномиальный коэффициент 2n^ _ 2n(2n - 1) ■■■(n + 1) n n ( n - 1) 2 Н етрудно видеть, что каж дое п ростое число, которое больш е n и не больш е 2n, присутствует в числителе правой части (2.10) и не сокращ ается ни с одним из множителей знаменателя, все мно­ жители которого не превосходят n. П оэтом у коэф ф ициент 2nn делится на все просты е числа, которы е больш е n и не больш е 2n. В сего таких чисел ровно n (2n ) — n (n ). Так как то справедливы неравенства (n + 1) n(2n)-n(n) < < 22n, < 2 2n из к оторы х после логарифмирования и несложных преобразо­ ваний получим оценку разности значений функции п на четном аргументе 2n и его половине n: 2n n (2 n ) — n (n ) < -------- . log 2 n (2.11) Д ля степеней двойки последнее неравенство, очевидно, эквива­ лентно следующ ей рекуррентной оценке функции n (n ): 2k n (2 k) < n ( 2 k -1) + — . (2.12) Теперь, используя полученное рекуррентное неравенство, ин­ дукцией по k покажем, что i, 4 •2k n (2 k) < — — . k (2.13) В основание индукции положим очевидный случай к = 3. Далее в силу (2.12) при к ^ 4 имеем . k u 2k 4 ■2k -i 2k 3 ■2k n (2 k) < n (2 k - i ) + ------- < -------------------------------------+ v ; v ; k - 1 k - 1 k - 1 k - 1 4 ■2k --------= к ------- ^ — — .
Глава 2. Целые числа 38 Наконец, при n ^ 2k < 2n из последнего неравенства следует, что n (n ) ^ п (2 к) < 4 •2к k 4 •2n < log 2 n Верхняя оценка теоремы доказана. Для доказательства нижней оценки теоремы снова восполь­ зуемся биномиальным коэф ф ициентом 2nn . Покажем, что в его разложении 2n „ к,= —к1 • " - i n (2.14) на просты е множители каж дый множ итель —iк,, не превосходит 2n. Для этого определим степень k(—), с которой простое число — входит в разложение числа n! на просты е множители. Нетруд„ n но видеть, что среди первых n натуральных чисел ровно p n p2 —3 и т .д . П оэтом у 2 чисел делятся на —2, делятся на —, n k(—) = — — + n —2 + ■ ■+ n p3 чисел делятся на n —i + (2.15) — rp (2n\ (2n)! Так как I I= !/! , то степень вхож дения числа — в разло­ жение (2.14) равна разности степеней вхождения числа —в чис­ литель и знаменатель. Из равенства (2.15) немедленно следует, что искомая величина равна сумме 2n _—_ —2 n \ — — ■■■ + + ■■■ / 2n —i —2 n Г —i — +... (2.16) в которой только первые |_l°gp 2 nJ слагаемых м огут бы ть отлич2n i ны от нуля, так как = 0 при — > 2n. Теперь, учиты вая неравенства 0 ^ |_2 xJ — 2 |_xJ ^ 1 , получаем, что сумма (2.16), а следовательно, и степень k, с которой число — входит в (2.14), не превосходят величины |_l°gp 2nJ. П оэтом у —k ^ —Llogp 2nJ ^ —logp 2n = 2n .
2.4. Сравнения 39 Таким образом, разложение (2.14) содерж ит не более n (2n ) со ­ множителей, каж дый из которы х не превосходит 2n. П оэтом у справедливы неравенства — n ) ^ ( 2 n )n(2n), 2n < P n из к оторы х после логарифмирования и несложных преобразова­ ний получим ниж ню ю оценку функции п для четных аргумен­ тов: 2n 1 2n n ( 2n) ^ -------------- 1 ^ - • ------------------ . log 2 2 n 2 log 2 2 n А налогичная оценка справедлива и для нечетных аргументов ф ункции п. Действительно, так как каж дое четное число боль­ шее двух не является просты м, то 1 2n 1 2n — 1 n ( 2 n — 1) = n ( 2 n) ^ - • ----------- > - • -------т---------- 2 log 2 2 n 2 log 2 ( 2 n — 1 ) для л ю бого n ^ 2. Теорема доказана. 2.4. Сравнения Будем говорить, что целые a и b сравнимы по модулю нату­ рального m, если совпадаю т их остатки от деления на m. Срав­ нимость a и b по модулю m будем обозначать равенством a = b (m od m ), которое называется сравнением. Л егко видеть, что если целые a и b сравнимы по модулю m, то их разность a — b делится на m и сущ ествует такое целое k, ч т о 1) a = b + km. И спользуя это равенство, покажем, что сравнения мож но почленно складывать, вычитать и умнож ать. х)Верно и обратное, поэтому a = b (mod m) тогда и только тогда, когда найдется такое целое к, что a = b + km.
40 Глава 2. Целые числа П усть ai = bi (m od m ) и a 2 = b2 (m od m ). В этом случае найдутся такие целые ki и k 2, что a 1 = b1 + k 1m,a 2 = b2 + k 2m. Тогда, так как a i + a 2 = (bi + k im ) + (62 + k2m ) = bi + b2 + (ki + k 2)m , то a 1 + a 2 = bi + b2 (m od m ). А налогичны м образом из равенства ai — a 2 = (bi + k im ) — (b 2 + k 2m ) = bi — b2 + (ki — k2)m следует, что ai — a 2 = bi — b2 (m od m ). Наконец, поскольку a ia 2 = (bi + k im )(b 2 + k 2m ) = bib 2 + (bik 2 + b2ki + k ik 2m )m , то a 1a 2 = b1b2 (m od m ). Если a = b (m od m ), то ad = bd (m od md) для л ю бого нату­ рального d. Д ействительно, из того, что разность b — a делится на m, легко следует, что bd — ad делится на md. Аналогичным образом легко видеть, что если m = m id , a = a id и b = bid, то из сравнения a = b (m od m ) следует сравнение ai = bi (m o d m i), т. е. обе части сравнения и модуль мож но разделить на их общий делитель. П усть теперь a = b (m od m i) и a = b (m od m 2). В этом слу­ чае b — a делится на m i и m 2 и, следовательно, делится на их наименьшее общее кратное, т. е. a = b (m od Н О К (m 1,m 2)). Если a = b (m od m im 2), то найдется такое целое k, что a = b + k (m 1m 2) = b + (k m 1)m 2 = b + (k m 2) m 1. Следовательно, a и b сравнимы по модулям m i и m 2 . О тсю да видим, что из сравнения a = b (m od m ) следует сравнимость a и b по модулю, равному л ю бом у делителю m.
2.5. Классы вычетов 41 2.5. Классы вычетов Сравнение чисел по модулю ф иксированного натурального числа m определяет на множ естве целых чисел отнош ение экви­ валентности и разбивает это множ ество на классы эквивалент­ ности, называемые классами вычетов по модулю m. Символом [i]m будем обозначать класс вычетов, состоящ ий из всех целых чисел, сравнимых с i по модулю m. Такое обозначение неодно­ значно, например, [8 ]з и [2 ]з обозначаю т один и т о т ж е класс, состоящ ий из чисел, сравнимых с двойкой по модулю три. Та­ кая неоднозначность доставляет определенные неудобства, из­ беж ать которы е мож но, используя для обозначения классов вы­ четов минимальные неотрицательные элементы этих классов. М нож ество классов вы четов по модулю m будем обозначать сим­ волом Z m, т. е. Zm = { [0 ]m, [1]m, . . . , [m — 1]m}. Выш е бы ло установлено, что сравнения по одинаковому м о­ дулю мож но складывать и умнож ать. Воспользуемся этим и определим в Z m операции сложения и умножения классов вы­ четов, положив [i]m + [j ]m = [i + [i]m [j ]m = [ij ]m. (2.17) П р и м е р 2 .3 . [5]10 + [6]10 = [11]10 = [1]10, [5]10[6]10 = [30]10 = [0]10, [5]s + [6 ]8 = [11 ]8 = [3]8, [5] 8 [6 ]8 = [30]8 = [6 ]8 . □ Введенные операции обладаю т многими свойствами, при­ сущими операциям сложения и умножения целых чисел. Так, нетрудно показать, что для них справедливы законы ассоциа­ тивности ([i]m + [j]m) + [k] m — [i]m + ([j] m + [k]m), ([i]m [j ]m)[k]m = [i]m([j ]m[k]m),
42 Глава 2. Целые числа коммутативности [i]m + [j]m = [j ]m + И mo [i]m [j ]m = [Ят-И то закон дистрибутивности ([i]m + [j ]m)[k]m = [i] m[k]m + [j] m[k]m и свойства сложения с нулем и умножения на единицу [i]m + [0]m = И то [i]m [1]m = [i]m. Операции (2.17) называются сложением и умножением по моду­ лю m. Ч асто бы вает удобно, рассматривая классы вычетов, от о ж ­ дествлять сами классы вы четов и их минимальные неотрица­ тельные элементы — использовать символ i как для целого чис­ ла из множ ества { 0 , 1 , . . . , m — 1}, так и для класса [i]m. П оэтом у далее через Z m будем обозначать не только множ ество классов вы четов по модулю m, но и множ ество { 0 , 1 , . . . , m — 1 }, подра­ зумевая при этом, что его элементы, называемые такж е выче­ тами, склады ваю тся и умнож аю тся по модулю m как соответ­ ствую щ ие им классы. Если числа 5 и 6 рассматривать в качестве элементов Zs, то в соответствии с примером 2.3 их сумма равна 3, а произведение 6. Л ю бы е m чисел, принадлежащие разным классам эквива­ лентности в Z m, называются полной сист емой вычетов по м о­ дулю m. Например, четные и нечетные числа обр азую т классы вы четов по модулю два, а пара (3, 4) является полной системой вы четов по этом у модулю. Т е о р е м а 2 .7 . П уст ь (a, m ) = 1 и { х 1, . . . , х т } — полная си­ стема вычет ов по м одулю m. Тогда м нож ест во {a x i + b}m =1, где b — произвольное целое, будет полной сист емой вычетов. Д о к а з а т е л ь с т в о . Д опустим, что a x i + b = a x j + b (m od m ). Тогда в силу рассм отренны х выше свойств сравнений axi = = a x j (m od m ) и, следовательно, a (x i — x j ) = km. Так как a и m взаимно просты е, то m дол ж н о делить разность xi — x j , что, очевидно, невозмож но. Таким образом, все m различных чисел axi + b попарно несравнимы по модулю m. Теорема доказана.
2.6. Решение сравнений 43 2.6. Решение сравнений Будем говорить, что линейное сравнение ax = b (m od m ) раз­ реш им о относительно переменной X, если сущ ествует такое це­ лое n, что справедливо сравнение an = b (m od m ). Если n — решение рассматриваемого сравнения, то и n + km при лю бом целом k такж е будет решением этого сравнения, т. е. решением сравнения будет класс вычетов по модулю m. Т е о р е м а 2 .8 . Сравнение ax = b (m od m ) разрешимо тогда и только тогда, когда (a, m ) делит b. Если d = (a, m ) делит b, то на м нож ест ве Z m сравнение имеет ровно d решений, срав­ ним ых по модулю m /d . Д о к а з а т е л ь с т в о . П усть хо — решение сравнения и (a, m) = = d. Тогда a = a'd и m = m 'd, где a' и m ' — целые. Из равенства a x 0 = b (m o d m ) следует, что b = a'dX 0 — k m 'd = d (a 'x 0 — k m '), где k — целое, т. е. d является делителем b. Теперь покажем, что если d делит b, то решение существует. Из теоремы 2.2 следует, что сущ ествую т такие целые p и q, что d = ap + mq. П усть b = b'd. Тогда b = db' = a(pb') + m (qb') и, сле­ довательно, a(pb') = b (m od m ). Таким образом, pb' — решение рассматриваемого сравнения. Теперь найдем число решений системы на множ естве Z m. П усть m = m 'd и Xi и Xj — решения. Тогда a 'd (x i — X j) = = 0 (m od m 'd ), или после сокращ ения на общий множ итель d, a '(x i — X j) = 0 (m od m '), где ( a ', m ') = 1. Из последнего равен­ ства следует, что m ' делит Xi — X j, т. е. Xi и Xj сравнимы по модулю m '. П оэтом у если Xo — минимальное неотрицательное решение, то решениями в Z m будут такж е числа Xo + km ', где k = 1 , . . . , d — 1. Теорема доказана. Будем говорить, что число a обратимо по модулю m, если разрешимо сравнение aX = 1 (m od m ). Если это сравнение разре­ шимо, то его решение обозначим через a -1 и назовем обратным, к a по модулю m. Из теоремы 2.8 легко извлекается необходи­ мое и достаточн ое условие обратим ости одного целого числа по модулю другого.
44 Глава 2. Целые числа Т е о р е м а 2 .9 . Число а обратимо по м одулю m тогда и т оль­ ко тогда, когда (a, m ) = 1. Если а обратимо по м одулю m , то оно имеет единст венное обратное по эт ом у модулю. П рим ер 2 .4 . На множ естве Z 73 решим сравнение 14x = = 1 (m od 73). Так как (14, 73) = 1 (см. пример 2.1), то в силу тео­ ремы 2.9 сравнение имеет единственное решение 14-1 (m o d 73). Д ля нахождения обратного воспользуемся найденным в приме­ ре 2.1 равенством 1 = 73 ■5 — 14 ■26, из которого следует, что 14-1 = —26 = 47 (m od 73). □ П р и м е р 2 .5 . На множ естве Z 20 найдем все решения сравне­ ния 8 x = 12 (m od 20). Так как ( 8 , 20) = 4, 4 делит 12 и 20 = 4 ■5, то в силу теоремы 2.8 сравнение имеет четыре решения. Разде­ лив элементы исходного сравнения на 4, получим новое срав­ нение 2x = 3 (m od 5), имеющее на множ естве Z 5 единственное решение. Так как (2, 5) = 1 = —2 ■2 + 5, то 2 -1 = —2 = 3 (m od 5). Следовательно, x = 3 ■ 3 = 4 (m od 5) и x 0 = 4 (m od 20) — ре­ шение сравнения на Z 20. Остальные три решения сравнимы с найденным x 0 по модулю 5. П оэтом у x 1 = 9, x 2 = 14, x 3 = 19. □ 2.7. Китайская теорема об остатках Будем рассматривать систем ы линейных сравнений простей­ шего вида x = ai (m od —i) c попарно взаимно простыми моду­ лями —i. Решение таких систем ниже полностью описывается в двух теоремах. В торая из этих теорем называется китайской теоремой об остатках. Т е о р е м а 2 .1 0 . П уст ь —1, . . . , —n — попарно взаимно простые полож ит ельные, а 1, . . . , an — целые. Система сравнений x = а1 (m od —1), x = а2 2 (m od —2), 2 x = an (m od —n), (2.18) имеет реш ение, причем все реш ения сист емы (2.18) сравнимы по м одулю —1—2 . . . —n .
2.7. Китайская теорема об остатках Д оказател ьство. 45 Без ограничения общ ности будем счи­ тать, что в (2.18) каж дое ai принимает значение о т 0 д о pi — 1. П оэтом у легко видеть, что при фиксированных ч и сл а х p 1, . . . , pn сущ ествует ровно M = р 1 х ••• х pn различных систем вида (2.18). Столько ж е сущ ествует и целых чисел, принадлежащих м нож еству Zm . Так как каж дое число из Z m является решением некоторой системы (2.18), то общ ее число решений систем (2.18) на множ естве Z m равно числу этих систем. П оэтом у для доказа­ тельства теоремы достаточн о показать, что в Zm нет двух чисел, являющ ихся решениями одной и той ж е систем ы вида (2.18). Сделаем это методом о т противного. Д опустим, что некоторая система (2.18) имеет такие решения z и у, что 0 ^ у < z < M . В этом случае разность z — у удовлетворяет неравенствам 0 < z —у < M (2.19) и является решением системы сравнений х = 0 (m od p 1), х = 0 (m od p 2), x = 0 (m od pn). ( 2 .20 ) Из (2.20) следует, что каж дое pi делит z — у и, следовательно, входит в каноническое разложение z —у на просты е множители. П оэтом у z — у ^ M , что противоречит (2.19). Таким образом, каж дая система вида (2.18) имеет не более одного решения среди целых неотрицательных чисел из Z m . Теорема доказана. Теперь найдем решение системы (2.18). Сделаем это в сле­ дую щ ей теореме. Т е о р е м а 2 .1 1 (Китайская теорема об остатках). П уст ь p 1, p 2 , . . . , pn — взаимно простые натуральные, a 1, . . . , an — целые, M = ПП=1 pi. Единст венным реш ением сист емы сравнений х = a1 (m od p 1), х = a2 (m od p 2), x = an (m od pn),
Глава 2. Целые числа 46 на м нож ест ве Zm являет ся X0 = a 1M 1N 1 + ■■■+ aiM i N i + ■■■+ anM nN n (m od M ), где M i = M /p i и N = M -1 (m od pi) для (2.21) i = 1, 2 , . . . , n. Д о к а з а т е л ь с т в о . Сущ ествование и единственность реше­ ния рассматриваемой системы на множ естве Z m сл едую т из предыдущей теоремы . Так как X (m od pi) = ( x (m od M )) для л ю бого x и каж дого i = 1, 2 , . . . , n условий теоремы справедливы равенства Mj = 0 (m od pi) (m od pi) и, кроме того, в силу при i = j , M iN i = 1 (m od pi ), то легко видеть, что X0 действительно является решением рас­ сматриваемой системы сравнений. Теорема доказана. П р и м е р 2 .6 . Решим систем у сравнений x= 1 (m od 3), x= 2 (m od 4), x= 3 (m od 5). Н етрудно видеть, что M = 60, M 1 = 20, M 2 = 15, M 3 = = 12. Кроме того, так как M i = 2 (m o d 3), M 2 = 3 (m o d 4) и M 3 = 2(m od 5), то M - 1 = 2 (m od 3), M —1 = 3 (m od 4) и M - 1 = 3 (m od 5). Подставляя полученные значения в форм улу (2.21), находим x = 1 ■20 ■2 + 2 ■15 ■3 + 3 ■12 ■3 = 238 = 58 (m od 60). Следовательно, число 58 является единственным решением рас­ сматриваемой системы на множ естве Z 60. П Китайская теорема об остатках является мощ ным средством , облегчаю щ им вычисления с большими составными модулями.
2.8. Функция Эйлера 47 П р и м е р 2 .7 . Решим уравнение x 3 + 12x + 15 = 0 (m od 35). Из свойств сравнений следует, что решение рассматриваемого уравнения равносильно решению системы x 3 + 2x = 0 (m od 5), x 3 + 5x + 1 = 0 (m od 7). Э ту систем у решим, последовательно подставляя в первое урав­ нение все элементы из Z 5 , а во второе — из Z 7 . В результате получим единственное решение, удовлетворяющ ее системе срав­ нений x = 0 (m od 5), x = 1 (m od 7), решив которую , находим единственное решение исходного урав­ нения x = 15 (m od 35). □ 2.8. Функция Эйлера Функция p (m ), равная количеству натуральных чисел, не превосходящ их m и взаимно п росты х с m, называется функцией Эйлера. В следующ ей таблице представлены первые двенадцать значений этой ф ункции: n p (n) 1 0 2 1 3 4 5 2 2 4 6 2 7 8 9 10 6 4 6 4 11 10 12 4 Л егко видеть, что р ( —) = — — 1 для каж дого п ростого —. Такж е несложно найти значение функции Эйлера для степени простого числа. Л е м м а 2 .4 . П уст ь — — простое. Тогда р ( —k) = —k —— k-1 для любого натурального k . Д о к а з а т е л ь с т в о . Среди первых —k натуральных чисел ров­ но — k-1 делится на —. К аж дое из —k — — k-1 остальны х чисел взаимно п росто с —. Следовательно, р ( —k) = —k — —k -1 . Лемма доказана.
48 Глава 2. Целые числа Л е м м а 2 .5 . Д л я любых взаимно прост ых натуральных a и b справедливо равенство p(ab) = p (a )p (b ). Д о к а з а т е л ь с т в о . К аж дое из p(ab) взаимно п росты х с ab и не превосходящ их ab натуральных чисел взаимно просто одно­ временно с a и b. Все эти числа находятся в таблице 1 2 a+ 1 2a + 1 a+ 2 2a + 2 ■■ ■ ■■■ ■■ ■ a+ i 2a + i ■ ■ ■ ja + 1 ja + 2 .. . ja + i ... — 1)a + 1 (b — 1)a + 2 ■■ ■ i (b — 1)a + i ■ ■ a 2a 3a ( j + 1)a ba из b стр о к и a столбцов. В каж дой строке этой таблицы находит­ ся полная система вы четов по модулю a и, следовательно, p (a ) чисел, взаимно п росты х с a. В каж дом столбце таблицы все эле­ менты одного столбца имею т одинаковые вычеты по модулю a. Таким образом, в таблице есть p (a ) столбцов, полностью со ст о ­ ящих из чисел, взаимно п росты х с a. В силу взаимной простоты a и b и теоремы 2.7 в каж дом из этих столбцов находится пол­ ная система вы четов по модулю b и, следовательно, p (b) чисел, взаимно п росты х с b. Следовательно, в таблице находится ровно p (a )p (b ) чисел, одновременно взаимно п росты х с a и b. Лемма доказана. Т е о р е м а 2 .1 2 . Если m = p ^ p ^ ■■■p;akn то p (m ) = m ( 1 — 1 ) (1 — M . . . (1 — —) J^1) ( 1 — -pp22 pn p Д о к а з а т е л ь с т в о . Из доказанных выше лемм 2.4 и 2.5 легко следует, что ^(pk 1pk2 ■■■pn- ) = ^(pk 1M p k 2) ■■■^ n - ) = k2-2 r , k1- 1V z n k2 = ( p !1 — p ? 1- 1 )(pk 2 — pk2- 2 ) ■■■ (pn- — pn- - 1 ) Теорема доказана.
2.8. Функция Эйлера 49 П р и м е р 2 .8 . Найдем ^>(120). Так как 120 = 2 3 ■ 3 ■ 5, то <^>(120) = 4 - 2 - 4 = 32. П Д окаж ем имею щ ую многочисленные приложения классиче­ ск ую теорем у элементарной теории чисел — теорем у Эйлера. Т е о р е м а 2 .1 3 (Эйлер). Если (a, n) = 1, то a^(n) = 1 (m od n). Д о к а з а т е л ь с т в о . Будем полагать, что все встречающ иеся далее числа принадлежат Z n . П усть a i, a 2 , . . . , a^(n) — подмно­ ж ество полной системы вычетов по модулю n, состоящ ее из всех взаимно п росты х с n вычетов. Такое множ ество называется при­ веденной сист емой вычетов. Если a взаимно просто с n, то в силу теоремы 2.7 числа aa i, aa 2 , . . . , aa^(n) обр азую т ту ж е са­ мую приведенную систем у вычетов, взятую , в общ ем случае, в другом порядке. П оэтом у a 1 ■a 2 ■■■a^(n) = a a 1 ■aa 2 ■■■aa^(n) = = a^(n)a 1 ■a 2 ■■■a^(n) ( 2 .22 ) (m od n). С окращ ая в (2.22) одинаковые множители, приходим к равен­ ству a^(n) = 1 (m od n ). Теорема доказана. П росты м следствием теоремы Эйлера является ее частный случай — малая теорема Ферма. Т е о р е м а 2 .1 4 (Ф ерм а). Если a = 0 (m od p), то ap - i = 1 (m od p). П р и м е р 2 .9 . Воспользуемся малой теоремой Ферма для ре­ шения уравнения x 124 + 2x 4 + 1 = 0 (m od 55). Т ак как в силу малой теоремы Ферма X4 = 1 (m od 5) и X 10 = 1 (m od 11) и, кроме того, 124 = 0 (m od 4) и 124 = 4 (m od 10), то решаемое уравнение равносильно системе 4 = 0 3x 4 + 1 = 0 (m od 5), (m od 11).
Глава 2. Целые числа 50 Очевидно, что первое уравнение системы решений не имеет, и, следовательно, исходное уравнение такж е не имеет решений. □ Задачи 2.1. Доказать, что отношение делимости a |b является отношени­ ем частичного порядка на множестве натуральных чисел. Построить диаграммы частично упорядоченных множеств делителей для чисел n = 6,12,18, 24, 36. 2.2. Показать, что если a делит с, b делит с и (a, b) = 1, то ab делит с. 2.3. Доказать, что LIJ hi - i x -k - для любых натуральных x, k, i. 2.4. Доказать, что для любых натуральных a i , . . . , an существуют такие целые bi , . . . , bn, что aibi + •••+ anbn = ( a i , . . . , an). 2.5. Доказать, что множество пар коэффициентов Безу для на­ туральных чисел a, b, т. е. множество всех таких целых x, y G Z, что ax + by = (a, b), бесконечно. Как по одной известной паре коэффици­ ентов Безу найти все остальные такие пары? 2.6. Доказать, что оба алгоритма из примера 2.1 и леммы 2.1 на­ ходят минимальные по модулю числа среди всех пар коэффициентов Безу. 2.7. Доказать, что существует пара коэффициентов Безу, которая удовлетворяет или неравенству |x| ^ (a, b) •|, или неравенству |y| ^ < (a, b) •f . 2.8. Доказать, что 1) ( 2f — 1, 2Ь — 1) = 2 (f’b) — 1; 2) (kf — 1, kb — 1) = k(f,b) — 1 для любого натурального k = 1 . 2.9. Найти все целые решения уравнений: 1) 83x + 115y = 1; 2) 2015x — 1286y = 5; 3) 426x + 125y = 14. 2.10. Сформулировать и доказать критерий разрешимости в це­ лых числах уравнения a ix i + •••+ anx n = b, где a*, b G Z.
Задачи 51 2.11. Сколько различных делителей имеет число pk 1 .. .pmm, где pi — различные простые числа? Чему равна сумма всех его делителей? 2.12. (Теорема Вильсона) Доказать, что целое p > 1 является простым тогда и только тогда, когда (p — 1)! = — 1 (mod p). 2.13. Показать, что если n — не простое число, то (n — 1)! = 0 (mod n) за исключением случая n = 4. 2.14. Найти вычет, обратный к вычету 777 по модулю 1000. 2.15. Решить уравнение 42x = 87 в Z 123. 2.16. Решить уравнение x 11 + 3x4 + 4 = 0 в Z 420. 2.17. Доказать, что система сравнений x = a 1 (mod m.1), x = a2 (m odm 2), имеет решение тогда и только тогда, когда (m i,m 2) делит ai — a 2, и это решение единственно на множестве Z h o k (т1,т2). 2.18. Решить систему сравнений x = 2 (mod 18), x = 8 (mod 24). 2.19. Каким числом нулей оканчивается число 1000! в десятичной записи? 2.20. Доказать, что (5n + 3m, 13n + 8m) = (n, m) для всех нату­ ральных m, n. 2.21. Числа ak (см. (2.2)), для которых было получено равен­ ство (2.3), называются числами Фибоначчи. Доказать, что 1) ak+m ak - 1am + akam+ Ъ 2) (ak,a k+1) = l , 3) S fc =0 a 2k+ 1 = a2„ + 2, 4) 'l2k=0 a 2k = a 2n+1 — 1, 5) (ak, am) a(k,m). 2.22. Найти число подмножеств в множестве чисел от 1 до k, в которые не входят соседние числа. Как связан ответ с числами Фибо­ наччи? 2.23. Доказать, что
Глава 3 Группы В этой главе начинается изучение одного из важнейших объ ек­ тов современной математики — множ ества с заданной на нем би­ нарной операцией, удовлетворяющ ей нескольким определенным свойствам. П ростейш ими примерами таких множ еств являю тся целые числа с операцией сложения, действительные числа без нуля с операцией умножения, все взаимнооднозначные отобра­ жения конкретного множ ества в себя с операцией композиции. К аж ды й такой объ ект называется группой. Группы обр азую т фундамент, на котором построены все остальные алгебраиче­ ские структуры . В силу этого многие свойства групп наследу­ ю тся более слож ны ми структурам и, такими как кольца, поля и линейные пространства, при этом достаточн о часто задачи, связанные с этими алгебраическими структурам и, сводятся к задачам, решаемым в рамках теории групп, основы которой за­ кладываются ниже. 3.1. Определения и примеры 1. П о н я т и е г р у п п ы . Бинарной операцией на множ естве M на­ зы вается произвольное отображ ение множ ества упорядоченны х пар элементов из M в само множ ество M . К ак правило, ф акт применения бинарной операции к элементам x и y обозначают, связывая эти элементы при помощи символа операции, напри­ мер: x + y, x х y, x о y и т. д. Бинарными операциями на множ е­ стве натуральных чисел будут операции сложения и умножения, на множ естве целых чисел — сложение, вычитание и умнож е­
3.1. Определения и примеры 53 ние. На множ естве всех подмнож еств множ ества M бинарными операциями будут объединение и пересечение, а на множ естве функций f : M ^ M — композиция функций. Бинарная опе­ рация на множ естве M не обязана бы ть бинарной операцией на произвольном подмнож естве N этого множ ества. Например, слож ение не будет бинарной операцией на множ естве нечетных целых чисел. Если ж е бинарная операция остается таковой на подмнож естве N , то будем говорить, что N замкнуто относи ­ тельно этой бинарной операции. Среди всевозм ож ны х пар (мно­ ж ество, бинарная операция) будем рассматривать специальные пары — группы. М нож ество G с определенной на нем бинарной операцией о, называется группой (G , о), если: ( 1 ) операция о ассоциативна, т. е. g i о (g 2 о g 3) = (gi о g^) о g 3 для всех g i , g 2 , g 3 из G; (2) сущ ествует единичный (нейтральный) элемент e G G такой, что g о e = e о g = g для л ю бого g G G; (3) для каж дого элемента g G G сущ ествует обратный эле­ п такой, что g о g —1 м ент g —1 1GG 1 = g — 11 о g = e. Нетрудно видеть, что группами будут множ ество целых чи­ сел, множ ество рациональных чисел, множ ество действитель­ ных чисел и множ ество комплексных чисел, в к оторы х в каче­ стве групповой операции используется обы чное сложение, а ней­ тральным элементом является нуль. Натуральные числа груп­ пу с операцией слож ения не образуют, так как для пары (N, + ) справедливо свойство (1), но не выполняются свойства (2) и (3) из определения группы. М нож ества Q \ { 0 } , R \ { 0 } и C \ { 0 } об­ разую т группы с операцией умножения. Единичным элементом в этих трех группах будет единица. Целые числа без нуля груп­ пу с операцией умножения не образуют, так как ни одно целое число, кроме единицы и —1 , не имеет обратного относительно умножения. Ч асто групповую операцию называют либо сложением, ко­ торое обозначаю т знаком « + » , либо умножением, для которого использую тся знаки « х » или « ■». В первом случае говорят об ад­ дитивной ф орм е записи группы, во втором — о мультипликатив­
Глава 3. Группы 54 ной ф орм е. При использовании мультипликативной ф орм ы знак умножения часто опускают, так ж е как это делаю т при умнож е­ нии чисел. Далее, как правило, будем использовать мультипли­ кативную форму. При использовании аддитивной ф орм ы еди­ ничный элемент будем называть нулевым. Группа G называется конечной, если она состои т из конечного числа элементов. Э то число называется порядком группы G и обозначается |G|. П р и м е р 3 .1 . М нож ество Z m = {0 ,1 , . . . , m — 1} образует группу с операцией сложения по модулю m. Нулевым (нейтраль­ ным) элементом в этой группе будет 0 , а m — k будет обратны м элементом для k. □ Обозначим через Z ^ м нож ество натуральных чисел, не пре­ восходящ их m и взаимно п росты х с m. Например, ZJ5 = {1 , 5 }, Z p = {1, 2, 3, 4, 5, 6 }, Z 8 = {1, 3, 5, 7 }, Z p„ = {1, 3, 5 , . . . , 2n — 1}. П р и м е р 3 .2 . При п ростом p множ ество Zp образует группу с операцией умножения по модулю p. Д ействительно, из равен­ ства ab = 0 (m od p) следует делим ость ab на p, откуда в свою очередь в силу леммы 2.2 и простоты p следует делим ость на p хотя бы одного из чисел a, b, что очевидно невозмож но, так как 1 ^ a, b ^ p — 1. Таким образом, ab = 0 (m od p), и, следо­ вательно, множ ество Zp зам кнуто относительно умножения по модулю p. Очевидно, что 1 будет единичным элементом, а су ­ ществование обратного для каж дого элемента в Zp следует из п ростоты p и теоремы 2.9 об обратим ости по п ростом у модулю. А налогичны м образом мож но показать, что группой является и множ ество Zm с операцией умножения по модулю m при состав­ ном m. □ Группа G называется абелевой (или коммутативной), если для лю бы х элементов g i и g 2 из G справедливо равенство g ig 2 = = g 2g i . Все упомянутые д о сих пор группы абелевы. П р и м е р 3 .3 . Важ ным примером неабелевой группы являет­ ся м нож ество взаимно однозначных отображ ений произвольно­ го множ ества M на себя с операцией композиции. Ранее бы ло показано, что композиция ассоциативна (теорема 1.1). Замкну­ т ость рассматриваемого множ ества отображ ений очевидна, так
3.1. Определения и примеры 55 как композиция двух биективных отображ ений снова будет би­ ективным отображ ением. Единичным элементом в группе явля­ ется тож дественное преобразование, а сущ ествование обратны х элементов следует непосредственно из биективности отображ е­ ний. Если множ ество M состои т из конечного числа элементов, например из n, то группа взаимно однозначных отображ ений множ ества M на себя называется симмет рической группой порядка n, или группой подстановок на n элементах, а ее эле­ менты называются подстановками. Если элементы множ ества M обозначить числами 1 , 2 , . . . , n , то подстановку, отображ аю ­ щ ую 1 в ii, 2 в *2 и т .д ., мож но представить в виде таблицы из двух строк, в первой строке которой находятся числа от 1 д о n, а во второй их образы: / 1 2 ... \*1 *2 . . . k ... n —1 ... *«,—1 n Д ля вычисления произведения двух подстановок надо найти композицию отображ ений. Например, в произведении подстано/1 2 3 4\/ 1 2 3 4\ вок 2 1 4 3 2 3 4 1правая подстановка отображ ает 1 в 2 , левая 2 в 1 , и, следовательно, произведение оставляет 1 на месте. Определив аналогично образы для 2, 3 и 4, находим, что Л 23 4\ Л 2 3 4\ = ^2 14 3у ^ 2 3 4 V V /1 2 3 4\ 1 4 3 2) ' Перемножив эти подстановки в обратном порядке, видим, что /1 2 23 34 4\ 1 /1 2 2 1 3 4\ = 4 3 = /1 2 3 2 3 4\ 1 4 . Таким образом, группа S4 не является абелевой. □ К онечную группу G = {g i, g 2 , . . . , gn } м ож но задать при по­ мощи таблицы умножения, в которой на пересечении i-й строки и j -го столбца стои т элемент, равный произведению gigj элемен­ тов gi и g j . Такая таблица называется таблицей Кэли, по имени английского математика X IX в. А р ту р а Кэли, которы й первым в 1854 г. ввел в математику современное определение группы. Д о Кэли рассматривали только группы подстановок.
Глава 3. Группы 56 П р и м е р 3 .4 . Для групп Z 4 и Z5 таблицы Кэли выглядят следую щ им образом: 0 0 1 2 1 1 2 2 2 3 х 0 1 2 3 3 3 3 3 3 0 0 1 0 1 2 1 1 2 2 2 3 1 2 4 4 + 3 4 3 4 4 1 3 1 4 3 2 2 1 В приведенных выше таблицах Кэли групп Z 4 и Z| каждая линия (строка или столбец) состои т из различных элементов. Покажем, что подобное свойство справедливо для таблицы Кэли произвольной группы. Если в таблице какой-либо группы G = = {g i, g 2 , . . . , gn } в j -м столбце k-й и i-й элементы равны, то gkgj = g ig j. У множ ив правую и левую части этого равенства справа на g- 1 , придем к противоречию gk = gi. П Нетрудно заметить, что в каж дой из рассм отренны х выше групп есть ровно один единичный элемент, и лю бой элемент каж дой группы имеет ровно один обратны й. Покажем, что эти два свойства справедливы для лю бой группы. Т е о р е м а 3 .1 . В группе сущ ест вует ровно один единичный элемент, и у каж дого элемента сущ ест вует ровно один обрат­ ный элемент. Д о к а з а т е л ь с т в о . Д опустим, что в некоторой группе G есть два единичных элемента e и e;. Тогда из свойств единичного элемента следует, что e = e ■e; = e; ■e = e; . Таким образом, e = e; . Теперь допустим, что у элемента g есть два обратны х эле­ мента g i и g 2 . Тогда из свойств обратн ого элемента следует, что g i = g i ■e = g i ■(g ■g 2) = (g l ■g ) ■g 2 = e ■g 2 = g 2 . Следовательно, gi = g 2 . Теорема доказана.
3.1. Определения и примеры 57 Воспользуемся доказанной теоремой для нахождения обрат­ ного элемента произведения нескольких элементов группы. Так как (g ig 2) ( g - 1g - 1) = g i (g 2g—1)g — 1 = g ig - 1 = e , то единственным обратны м элементом произведения g ig 2 явля­ ется произведение g - 1g -1 обратны х элементов сомнож ителей, взяты х в обратном порядке. Нетрудно видеть, что аналогичная ф орм ула (g ig 2 " "g fe ) - i = g - 1 ' " g - 1g r 1 справедлива для л ю бого числа сомнож ителей. 2. П о д г р у п п ы . П одмнож ество H группы G называется под­ группой этой группы, если H является группой относительно операции группы G. П усть H — подгруппа группы G. Будем говорить, что эле­ мент a сравним с элементом b по модулю подгруппы H a = b (m od H ), если ab -1 G H . Так как (ab -1)-1 = ba -1 G H , то и элемент b сравним с a по модулю подгруппы H , т. е. из сравнения a = = b (m od H ) следует сравнение b = a (m od H ). П оэтом у мож но говорить, что a и b сравнимы по модулю подгруппы H . П р и м е р 3 .5 . М нож ество целых чисел образует подгруппу в группе рациональных чисел с операцией сложения. Нетрудно видеть, что рациональные x и у сравнимы по модулю подгруп­ пы целых чисел, если равны их дробны е части. В св ою очередь рациональные числа обр азую т подгруппу в группе действитель­ ных чисел с операцией сложения, и два действительны х числа сравнимы по модулю подгруппы рациональных чисел, если их разность — рациональное число. □ П р и м е р 3 .6 . Д ля л ю бого целого m в группе целых чисел с операцией сложения подгруппой будет множ ество m Z , состоя ­ щее из всех целых кратных m. Теперь покажем, что в Z нет подгрупп, отличны х от подгрупп вида m Z . П усть H — подгруп­ па в Z. П олож им m = m in(x — у), где минимум берется по всем парам целых чисел из H , в которы х x > у. Так как m G H ,
58 Глава 3. Группы то и все кратные m числа такж е леж ат в H . Д опустим, что в H найдется n, которое не делится на m. Тогда n = km + r, где 0 < r < m. Но в этом случае r = n —km < m такж е принадлежит H , что невозмож но в силу вы бора m. Следовательно, H = m Z .^ Т е о р е м а 3 .2 . П уст ь G — группа, H и K — ее подгруппы. Тогда H П K будет подгруппой группы G. Д о к а з а т е л ь с т в о . Очевидно, что единичный элемент при­ надлежит множ еству H П K . П оэтом у для доказательства тео­ ремы достаточн о показать, что H П K зам кнуто относительно групповой операции и что для л ю бого g из H П K его обратный элемент такж е леж ит в H П K . П усть g i G H П K и g 2 G H П K , тогда g ig 2 G H и g ig 2 G K и, следовательно, g ig 2 G H П K . Таким образом, м нож ество H П K зам кнуто относительно опе­ рации группы G. Если g G H П K , то g - i G H и g - i G K и, следовательно, g - i G H П K . Теорема доказана. П р и м е р 3 .7 . В группе целых чисел пересечение подгрупп 6Z и 4Z состои т из всех целых, делящихся на 6 и 4. Следовательно, 6Z Р| 4Z = 12Z. Н етрудно видеть, что в общ ем случае для лю бы х целых m и n справедливо равенство m Z Q n Z = H O K (m ,n )Z . □ Для группы G и ее подгрупп H и K определим произведение H K = { x G G | x = hk, где h G H , k G K } этих подгрупп. И меет место следую щ ая теорема. Т е о р е м а 3 .3 . П уст ь G — группа, H и K — ее подгруппы. М нож ест во H K будет подгруппой группы G тогда и только тогда, когда H K = K H . Д о к а з а т е л ь с т в о . П окажем достаточн ость условия H K = = K H . Из этого условия следует, что для лю бы х k G K и h G H найдутся такие k1 G K и b! G H , что hk = k;h; . Тогда (h ik i) ( h 2k2) = h i(k ih 2)k 2 = h i(h /2k/1)k 2 = (h ih /2)(k /1k 2), т. е. множ ество H K замкнуто относительно групповой операции. А налогичны м образом из условия H K = K H следует сущ ество­ вание обратного элемента h;k; для произвольного hk: e = (h k )(h k )- i = (h k )(k - i h - i ) = (h k )(h /k/).
3.2. Группа подстановок 59 Следовательно, H K — группа. Теперь установим необходимость условия H K = K H . П усть H K — подгруппа в G. Тогда для произвольного произведения h 'k ' элементов из H и K в H K леж ит его обратный элемент hk. П оэтом у h' k' = ((h 'k ')- 1) - 1 = (h k )- 1 = k - 1 h - 1 . Следовательно, H K = K H . Теорема доказана. Так как в абелевой группе hk = kh для лю бы х ее элементов h и k, то из теоремы 3.3 вытекает следую щ ее п ростое утверж де­ ние. С л е д с т в и е 3 .1 . П уст ь G — абелева группа, H и K подгруппы. Тогда H K — подгруппа группы G. — ее П р и м е р 3 .8 . Н етрудно видеть, что в силу теоремы 2.2 при л ю бы х целых m и п произведением подгрупп m Z и n Z в группе Z будет подгруппа Н О Д ( т , п ^ . □ 3. П о л у г р у п п ы и м о н о и д ы . М нож ество G с определенной на нем ассоциативной бинарной операцией называется полугруп­ пой. М нож ество G с определенной на нем ассоциативной бинар­ ной операцией называется полугруппой с единицей (или моно­ идом ), если в нем сущ ествует единичный элемент. П р и м е р 3 .9 . М нож ество целых чисел Z с операцией ум но­ жения образует моноид, а множ ество 2Z с той ж е операцией — лишь полугруппу. □ 3.2. Группа подстановок Напомним (см. пример 3.3), что множ ество взаимно одно­ значных отображ ений n -элементного множ ества {1, 2 , . . . , п } на себя с операцией композиции называется симметрической груп­ пой Sn , ее элементы называются подстановками, и каждая под­ становка п представляется в виде п = ( 1 i1 2 ... i2 . . . k ... ik . . . п —1 п) , in 1 in (3.1)
Глава 3. Группы 60 где ifc = п (к ) — образ элемента к. В (3.1) первая строка состои т из упорядоченны х аргументов отображ ения п, а вторая — из их образов. Если аргументы подстановки п не упорядочивать, то ее мож но представить n ! различными способами вида п = ( Ч 12 \j 1 j 2 . . . j fc ...... ... i n - i in ^ , j n - 1jn j (3.2) где jfc = n(ifc). П одстановка п из Sn называется циклом длины m, если найдутся такие i i , . . . , , что п ( п ) = *2 , п(* 2) = is, . . . , п(гт - 1) = im, п (гт ) = ii, п (?) = j для всех j G { i i , . . . , im }. Цикл будем представлять строкой (ii ■■■ifc ■■■im), в которой каж дый элемент является образом предыдущ его, а первый эле­ мент — образом последнего. Заметим, что для цикла длины m есть ровно m различных представлений. Например, (12345) м ож но записать следующ ими способами: цикл (12345) = (23451) = (34512) = (45123) = (51234). Циклы длины два называются транспозициями. П р и м е р 3 .1 0 . В группе S3 все подстановки, кроме тож д е­ ственной, являю тся циклами. Э то три транспозиции (12), (13) и (23), и два цикла длины три (123) и (132). □ Циклы называются непересекающ имися (или независимы­ ми), если не пересекаются множ ества их элементов. П р и м е р 3 .1 1 . В Ss все циклы пересекаются. В S 4 есть три пары непересекающихся транспозиций: (12) и (34), (13) и (24), и (14) и (23). В S 5 есть 15 пар непересекающихся транспозиций и 20 пар непересекающихся циклов, состоящ их из транспозиции и цикла длины три. Так как три непересекающихся цикла нееди­ ничной длины содерж ат не менее шести различных элементов, то ни в S 4 , ни в S 5 нет трех непересекающихся циклов. □
3.2. Группа подстановок 61 П р и м е р 3 .1 2 . Рассмотрим произведение двух непересекающихся циклов. Так как перестановка столбцов в (3.2) не изме­ няет подстановку, то для лю бы х непересекающихся циклов из равенств (i1 i2 . . . ik)(j1 j2 . . . j m) = 11 i2 . . . i k j1 j2 . . . j m 12 i3 . . . il j l j 2 . . . jm 11 i2 . . . i k j1 j2 . . . j m 12 i3 . . . i1 j2 j3 . . . j1 i 1 i 2 . . . ik j 1 j 2 . . . j m i 1 i 2 . . ik j2 j3 . . . j 1 j 1 j 2 . . . jm il i 2 j2 j3 . . . j1 i2 i3 j1 j2 . . . j m i1 i2 . . . ik j1j2 .. j2 j3 . . . j1 i1 i2 . . . ik j1j2 .. ik i1 jm i 1 i 2 . . jm i2 i3 . . = ( j i j 2 . . . jm )(ii i 2 . . . ik) следует, что эти циклы коммутируют. Более того, индукцией по числу сомнож ителей нетрудно показать, что произведение л ю бого числа непересекающихся циклов не зависит о т порядка сомнож ителей. □ Т е о р е м а 3 .4 . К аж дая нет ож дест венная подстановка п G Sn предст авляет ся в виде произведения непересекаю щ ихся цик­ лов, и притом единст венным с т очност ью до порядка сомно­ ж ит елей образом. Д о к а з а т е л ь с т в о . Так как подстановка п — взаимно одно­ значное отображ ение множ ества { 1 , 2 , . . . , п } на себя, то для каж дого элемента i этого множ ества найдется такое минималь­ ное натуральное ki, что п ^ (i) = i. Воспользуемся этим свой­ ством и разобъем множ ество { 1 , 2 , . . . , n } на непересекающиеся упорядоченны е наборы. Первый набор составим из элементов 1, п ( 1 ) , . . . , п ^ - 1^ ) . Если ki < п, то среди элементов, не по­ павших в первый набор, выберем минимальное i и второй на­ бор составим из элементов i ^ ( i ) , . . . , п ^ - 1^ ). Если ki + ki < n, то построим третий набор и т. д. Д опустим, что множ ество { 1 , 2 , . . . , n } указанным способом разбито на непересекающиеся наборы A i , . . . , , где A j = ( i j , п ( ij), п 2 ( i j ) , . . . , п ^ ' ! ( i j )).
62 Глава 3. Группы Переместив в каж дом наборе A j первый элемент в конец, полу­ чим s новых наборов A j = (n (ij ) , n 2( i j ) , . . . , n kij i (ij ) , i j ), при­ чем A j = A j тогда и только тогда, когда kj = 1. Так как i-й элемент п г( i j ) в A j является образом i-го эле­ мента n i - i ( i j ) из A j , то столбцы в (3.1) мож но упорядочить так, чтобы подстановка п выглядела следующ им образом: Теперь заметим, что возникшее в рассмотренном выше при­ мере 3.12 равенство I■ ■ - A ( i i i2 . . .ifc j i j2 . . . jm \ ( i i i2 . . . ifc) ( j i j 2 . . . j m ) = ( • • • У*2 *3 . . . П J2 J3 . . . Ji / легко обобщ ается на лю бое число непересекающихся сом нож и­ телей. П оэтом у нетрудно видеть, что подстановка (3.3) явля­ ется произведением непересекающихся циклов ( A i ) ( A 2) ■■■(A s). Е динственность указанного представления следует из однознач­ ности определения множ еств A j и A j . Теорема доказана. П р и м е р 3 .1 3 . Следуя доказательству теоремы 3.4, разло­ ж им подстановку в произведение непересекающихся циклов: 1 2 3 4 5 6 7 8\ = / 1 2 4 3 5 7 8 6\ = 24 317 5 86/ ^2 4 1 3 7 8 6 5 / = (1 2 4 )(3 )(5 7 8 6) = (1 2 4)(5 7 8 6). Записывая произведения циклов, часто пропускаю т циклы дли­ ны один, каждый из которы х является тож дественной подста­ новкой. Выш е в последнем произведении так пропущен цикл (3). □ Т е о р е м а 3 .5 . К аж дая подстановка п G представляется в виде произведения транспозиций. Д о к а з а т е л ь с т в о . Из равенства (1 2 3 4 . . . k) = (1k) ■■■(14)(13)(12) (3.4)
3.2. Группа подстановок 63 следует, что любой цикл разлагается в произведение транспози­ ций. А так как каж дая подстановка представляется в виде про­ изведения непересекающихся циклов, то очевидно, что ее мож но представить и как произведение транспозиций. Теорема доказа­ на. П р и м е р 3 .1 4 . Разлож им в произведение транспозиций под­ становку (1234)(12). Из равенства (3.4) легко следует, что (1 2 3 4)(12) = (14)(13)(12)(12) = (14)(13). С другой стороны , (1234) = (2341), и поэтом у (1 2 3 4)(12) = (2 3 4 1)(12) = (2 1 )(24)(23)(12). Таким образом, представление подстановки в виде произведе­ ния транспозиций неоднозначно и разные представления м огут состоя ть из разного числа транспозиций. □ Т е о р е м а 3 .6 . Если подстановка g G Sn раскладывается дву­ м я способами в произведение транспозиций п1п2- '-п к = g = СТ1СТ2- --am , (3.5) то k = m (m od 2). Величина sgng = ( —1)к называется знаком подстановки g. Д о к а з а т е л ь с т в о . П усть i < j и s < t. Будем говорить, что транспозиция ( i j ) меньше транспозиции (st) (пишем ( i j ) < (st)), если i < s или i = s и j < t. Произведение транспози­ ций п 1п 2 ■■■п& назовем упорядоченным, если пг+1 < пг для r = 1, 2 , . . . , к — 1. Покажем, что лю бое произведение транс­ позиций мож но перестроить в равное ему упорядоченное про­ изведение. Сделаем это индукцией по числу сомнож ителей. В основание индукции полож им произведения из двух сом н ож и те­ лей. У сомнож ителей м огут совпадать минимальные элементы, максимальные элементы, максимальный элемент первого с ми­ нимальным элементом второго, транспозиции м огут не пересе­ каться. Во всех этих случаях произведения мож но упорядочить
64 Глава 3. Группы следую щ им образом: (12)(13) = (23)(12), (13)(23) = (23)(12), (3 6) (12)(23) = (23)(13), (12)(34) = (34)(12). ( . ) Д опустим , что лю бое произведение из k транспозиций мож но упорядочить. Тогда в произвольном произведении п 1п 2 ■■■пкпк+i упорядочим k левых транспозиций. Если в преобразованном произведении п^п2■■■пкп^+1 транспозиции пкп^+1 упорядоче­ ны (пк > п^+1 или пк = пк+ i), то упорядочено и все произ­ ведение. Если нет, то упорядочиваем пару пкпк+ i при помощи подходящ его равенства из (3.6) и получаем новое произведение п ! п2 ■■■пк+ i, правая транспозиция пк+ i которого меньше правой транспозиции пк+ i исходного произведения. Если произведение < п2 ■■■пк+ i не упорядочено, то повторяем выполненные дей­ ствия д о тех пор, пока это возмож но. Так как в каж дом новом произведении правая транспозиция меньше правой транспози­ ции в предыдущ ем, то после конечного числа повторений вы­ полнить очередное преобразование будет невозмож но, т. е. про­ изведение станет упорядоченным. Теперь допустим , что для подстановки g из Sn справедливы равенства (3.5). Тогда e п 1п 2 " " " п кa m " " " a 2 a l . (3.7) У порядочим произведение в правой части (3.7) и удалим из него пары стоящ их рядом одинаковых транспозиций. Очевидно, что четность числа транспозиций r в новом произведении п^п2 ■■■п£ совпадает с четн остью k + m. П усть s — минимальный элемент, встречаю щ ийся в транспозициях нового произведения. В этом произведении выберем сам ую левую транспозицию с элементом s — пусть это будет (st), где t > s. Тогда транспозиции справа о т (st) не содерж ат элемент t, а транспозиции слева о т (st) не содерж ат элемент s. П оэтом у все произведение отображ ает t в s, т. е. не мож ет бы ть тож дественны м . Возникшее противоречие исчезает, если r = 0. Таким образом, k + m = 0 (m od 2), и, следовательно, k = m (m od 2). Теорема доказана.
3.2. Группа подстановок 65 П одстановка п называется четной, если sgn п = 1, и нечет ­ ной, если sgn п = —1. Очевидно, что тож дественная подстановка является четной подстановкой. К ром е того, нетрудно показать, что sgn (^ s g n (п ') = sgn (п п ') для лю бы х подстановок п и п ' . Из последнего равенства и четно­ сти тож дественной подстановки следует, что sgn (п) = s g n ^ - 1 ) для лю бой подстановки п. Таким образом, четные подстановки обр азую т в Sn подгруппу. Такая подгруппа называется знакопе­ рем енной группой A n порядка n. Покажем, что A n состои т из n !/2 элементов. П усть п 1, . . . , п — все четные подстановки в Sn , a i , . . . , a* — все нечетные подстановки в этой группе. Тогда подстановки ( 1 2 ) п 1 ,..., (12)п 8 будут нечетными, и, следовательно, t ^ s. С другой стороны , четными будут подстановки ( 1 2 ) a i ,. . . , (1 2 )a t, следовательно, s ^ t. О бъединяя получившиеся неравенства, ви­ дим, что s = t, т. е. четные подстановки составляю т ровно поло­ вину из n! подстановок в Sn . П усть T — подм нож ество группы G, (T ) — множ ество всех элементов из G, представимых в виде произведений элементов из T и обратны х к ним. М нож ество (T ) называется сист емой образующ их (порож даю щ их) элементов этой группы G, если ( T ) = G. П р и м е р 3 .1 5 . Z = (1), m Z = (m ). □ П р и м е р 3 .1 6 . Из теоремы 3.5 следует, что в Sn м нож ество всех транспозиций является системой образую щ их. □ П р и м е р 3 .1 7 . М нож ество всех циклов длины 3 является си­ стемой образую щ их в A n при n ^ 3. Д ействительно, лю бое про­ изведение четного числа транспозиций мож но разбить на па­ ры транспозиций так, что они имею т вид ( i j ) ( j k ) = (ijk ) или (ij)(k 1 ) = (ik j)(ik 1 ). □ П одмнож ество T группы G называется минимальной систе­ мой образую щ их или базисом этой группы, если G = (T ) и G = (T ') для л ю бого собственного подмнож ества T ' множе-
Глава 3. Группы 66 ства T . М ож но легко убедиться, что минимальность системы T равносильна тому, что x G (T \ { x } ) для всех x G T . П р и м е р 3 .1 8 . Н етрудно видеть, что при n ^ 3 системы об­ разую щ их из двух последних примеров не являю тся минималь­ ными. М инимальную систем у м ож но получить, если заметить, что ( i j ) = (1 i)(1 j)(1 i), откуда лее того, (23 ...n ) ( 1 2 ) ( 2 3 . . . n ) - i = = ((1i) : i = 2, . . . , n ) . Б о­ (13), откуда по индукции следует, что (1i) = (23 . . . n )i - 2 (12)(23 .. . n ) - ( i - 2 ) . Очевидно, что (23 . . . n ) - i = (23 . . . n )n - 2 , (12) G ((23 . . . n )) и (23 . . . n) G ((12)). Таким образом, система T = {(1 2 ), (23 . . . n ) } является мини­ мальной порож дающ ей системой. □ О тметим, что минимальная система образую щ их группы G не обязательно имеет минимальную среди ее образую щ их си­ стем мощ ность. Так, система (12), (13), . . . , (1n) из предыдущ его примера очевидно является минимальной в (выбрасывание лю бой транспозиции делает ее неполной), однако число образу­ ющ их системы (12), (23 . . . n) меньше. 3.3. Смежные классы и фактор-группы 1. С м е ж н ы е к л а с с ы и т е о р е м а Л а г р а н ж а . Рассмотрим про­ извольную группу G = { g i , . . . , gn , . . . } и ее подгруппу H = = { h i , . . . , hm, . . . }. Л евым см еж ны м классом группы G по под­ группе H называется м нож ество g H = { g h i , . . . ,g h m, . . . }, где g — фиксированный элемент группы G. Правым см еж н ы м клас­ сом группы G по подгруппе H называется множ ество H g = = { h i g , . . . , hmg , . . . }. М нож ество левых (правых) см еж ны х клас­ сов называется левым (правым) факт ор-множ ест вом G / H груп­ пы G по подгруппе H . В абелевых группах левые и правые см еж ­ ные классы совпадают, п оэтом у в случае абелевой группы гово­ рят просто о см еж ны х классах и ф актор-м нож ествах. П р и м е р 3 .1 9 . Смеж ными классами группы Z по подгруппе 3Z будут: подгруппа 3 Z ; м нож ество 1 + 3Z, состоящ ее из всех целых, сравнимых с единицей по (m od 3); множ ество 2 + 3Z, со ­ стоящ ее из всех целых, сравнимых с двойкой по (m od 3). Л егко видеть, что ф актор-м н ож ество Z /3 Z будет м нож еством Z 3 . □
3.3. Смежные классы и фактор-группы 67 Т е о р е м а 3 .7 . Д ва левы х (правых) см еж н ы х класса группы G по подгруппе H либо совпадают, либо не пересекаются. Д о к а з а т е л ь с т в о . Покажем, что если два левых смеж ны х класса группы G по подгруппе H имею т хотя бы один общий элемент, то тогда эти классы совпадают. Д опустим g G g iH и g G g 2H . Тогда в H найдутся такие элементы hi и h j , что g = g i h = g 2h j . П оэтом у g i = g 2h jh -1 и, следовательно, для л ю бого gihk G g iH справедливо равенство gihk = g 2 ( h j h - 1hk). Так как h j h - 1hk G H , то gihk G g 2H , и, следовательно, g iH С g 2H . Включение g 2H С g iH доказы вает­ ся аналогично. Таким образом, g iH = g 2H . Д оказательство для правых см еж ны х классов аналогично. Теорема доказана. Т е о р е м а 3 .8 (Л агранж ). Порядок конечной группы делится на порядок любой ее подгруппы. Д о к а з а т е л ь с т в о . П усть G — конечная группа, H — под­ группа группы G. К аж ды й элемент группы G принадлежит н екотором у левому см еж ном у классу G по подгруппе H , при­ чем каж дый смеж ный класс состои т ровно из |H| элементов. П оэтом у |G| равно числу см еж ны х классов, умнож енному на |H| . Теорема доказана. П усть g — произвольный элемент группы G. Произведение k элементов g называется k-й степенью g k этого элемента. Из ассоциативности умножения легко следует, что g V = g 1g k = g 1+k (3.8) для лю бы х натуральных l и k. Так как (g k) -1 = (g - 1 ) k, то для упрощения вычислений положим g -k = (g - 1 ) k. Если G — конечная группа порядка n, то среди степеней g, g 2, . . . , gn найдется такая степень k, что g k = e. Д опустим , что такой степени нет. Тогда среди n степеней g будет не более n — 1 различных элементов G, и, следовательно, по крайней мере две степени, например g s и g*, где s > t, будут равны. У множ ая * s_* * _* левую и правую части равенства g*gs * = g* слева на g , прич—* ходим к равенству g s * = e, которое противоречит сделанному
68 Глава 3. Группы предположению. Следовательно, одна из степеней g ,g 2, . . . , g n равна единичному элементу. П усть k — минимальное натураль­ ное, для которого g k = e. Такое k называется порядком элемента g и обозначается обы чно |g|, o(g) или ord (g ). М нож ество { e , g , . . . , g k - i } зам кнуто относительно умнож е­ ния, которое (см. (3.8)) коммутативно на нем. Э то м нож ество содерж ит единичный элемент е, и каж дый его элемент g* = e имеет обратный g k - i . Следовательно {e, g , . . . , g k - i } является абелевой группой и подгруппой в G. Такая группа называет­ ся конечной циклической группой, порож денной элементом g, и обозначается (g). Элемент g называется порож дающ им эле­ м ент ом группы (g). В общ ем случае группа G называется цик­ лической с порож даю щ им элементом g и обозначается (g) или (g)fc для конечной группы порядка k, если каж дый ее элемент является целой степенью g. П р и м е р 3 .2 0 . Л егко видеть, что циклическими группами бу­ д у т Z = (1) = (—1) и Z£ = (2) = (3). □ Из теоремы Л агранжа следует, что в конечной группе поря­ д о к каж дого элемента делит порядок группы. Если n — порядок группы, k — порядок элемента g и n = km, то g n = (g k) m = e. Таким образом, в конечной группе лю бой элемент в степени, равной порядку группы, равен единичному элементу. П росты м следствием этого ф акта являю тся доказанные в главе 2 теорема Эйлера и малая теорема Ферма. П р и м е р 3 .2 1 . Рассмотрим группу G п ростого порядка р. К аж ды й неединичный элемент g этой группы порож дает в ней циклическую подгруппу (g). П орядок этой подгруппы должен делить р, а так как р — простое, то порядок (g) равен р, т. е. (g) = G. Следовательно, любая группа п ростого порядка будет циклической. □ Л е м м а 3 .1 . П уст ь в группе G с единичным элементом e выполнено равенство g k = e для некот орых g G G и k G N. Тогда число k нацело делится на порядок элемента g . Д о к а з а т е л ь с т в о . П усть n = |g|, тогда g n = e и g m = e для л ю бого натурального m < n. Разделив k на n с остатком ,
3.3. Смежные классы и фактор-группы 69 получим k = nq + r, где 0 ^ r < n. О тсю да g k = gnq+ r = = (gn)qg r = g r . Так как по условию g k = e, то и g r = e. Но r < n, п оэтом у r = 0, иначе получим противоречие с определением порядка элемента g. Лемма доказана. 2. Ф а к т о р - г р у п п ы . П усть G — абелева группа, H — ее под­ группа. На ф актор-м н ож естве G / H введем операцию умнож е­ ния, полагая, что (g i H ) ( g2H ) = (glg2) H . П реж де всего отметим, что для лю бы х hi , hj из H ((g l hi) H ) ( ( g2hj )H ) = (g l hi) ( g2hj )H = = (gi g 2)(h ih j H ) = (gig2)H , (3.9) т. е. результат умножения не зависит о т выбора представителей см еж ны х классов. Следовательно, операция умножения опреде­ лена корректно. Такж е заметим, что из ассоциативности группо­ вой операции легко следует и ассоциативность введенного ум но­ жения. Далее, так как для л ю бого g £ G g H H = H g H = gH , (3.10) g H g - 1 H = g - 1 H g H = H, то ф актор-м н ож ество G / H с такой операцией умножения будет группой, в которой единичным элементом является подгруппа H , а смеж ный класс g - 1 H является обратны м к см еж н ом у клас­ су g H . Оказывается, что для справедливости (3.9) и (3.10) груп­ па G не обязательно долж на бы ть абелевой. Н етрудно видеть, что для этого достаточн о, чтобы подгруппа H была перестано­ вочна с каж дым элементом группы, т. е. g H = H g для лю бого g £ G ! ) . Такая подгруппа H называется нормальной подгруппой (обозначается H < lG ), а ф актор-м н ож ество по этой подгруппе — фактор-группой G / H группы G по нормальной подгруппе H . Таким образом, справедлива следую щ ая теорема. ^Равенство gH = Hg эквивалентно равенству gHg 1 = H .
Глава 3. Группы 70 Т е о р е м а 3 .9 . Ф акт ор-м нож ест во группы G по нормальной подгруппе H являет ся группой. П р и м е р 3 .2 2 . Так как sgn п = sgn п -1 для лю бой подстанов­ ки п из Sn , то множ ество п А пп - 1 состои т только из четных под­ становок. Следовательно, п А пп - 1 = A n , т. е. A n — нормальная подгруппа в Sn . Ф актор-группа Sn/ A n состои т из двух смеж ны х классов: подгруппы A n и множ ества нечетных подстановок. □ П р и м е р 3 .2 3 . В конце X IX в. американским изобретателем игр и головолом ок С эмюэлем Л ойдом была предложена следу­ ющая задача, называемая игрой в «пятнаш ки». Квадратная ко­ робочка разделена на 16 полей. В полях установлены 15 квад­ ратных фиш ек, занумерованных числами о т 1 до 15. Одно поле коробочки остается свободным. Ниже на рисунке слева изобра­ ж ено начальное расположение фиш ек в коробочке. За один ход м ож но передвинуть на свободное поле лю бую из соседних с ним ф иш ек (например, на левом рисунке это фишки 12 и 15). Т р е­ буется получить из начального расположения фиш ек их расста­ новку, изображ енную на рисунке справа. 1 2 3 4 1 2 3 4 5 6 7 8 5 6 7 8 9 10 11 12 9 10 11 12 13 14 15 13 15 14 Головоломка бы стр о стала очень популярной не в послед­ ню ю очередь благодаря обещ анному за ее решение крупному вознаграж дению. О богатиться, однако, бы ло невозможно: зада­ ча не имеет решения. Д ействительно, сопоставив свободном у по­ лю число 16, каж дое расположение фиш ек м ож но представить некоторой перестановкой п из группы S i6 . Перемещение фишки на свободное место означает перестановку ее номера с числом 16,
3.4. Изоморфизмы групп 71 т. е. каждый ход является транспозицией и меняет sgn п. П оэто­ му перестановки, получаемые четным числом ходов, долж ны иметь одинаковый знак. Ч тобы пустое поле вернулось на преж ­ нее место, число 16 дол ж н о переместиться вверх столько ж е раз, сколько и вниз, а влево столько ж е раз, сколько и вправо, т. е. ко­ личество ходов дол ж н о бы ть четным. Однако подстановки слева и справа на рисунке имею т разные знаки. □ 3.4. Изоморфизмы групп 1. И з о м о р ф и з м ы . П усть G и H — группы с операциями * и о соответственно. Взаимно однозначное отображ ение f : G ^ H называется изоморфизмом, если равенство f (а * b) = f (а) ◦ f (b) (3.11) справедливо для лю бы х элементов а и b из G. П ро отображ ение, удовлетворяющ ее равенству (3.11), говорят, что оно сохраняет групповую операцию, а группы G и H , для которы х сущ ествует изоморф изм, называются изоморфными. Для обозначения изо­ м орф изма групп используется символ = . П р и м е р 3 .2 4 . Покажем, что Z 4 = Z 55. Обе группы являю т­ ся циклическими: в Z 4 порож даю щ им элементом является 1, а в Z 5 — 2. И зом орф изм f группы Z 4 в группу Zg определим, отобразив порож даю щ ий элемент в порож дающ ий, т. е. поло­ ж им f (1) = 2, а значения на оставш ихся элементах группы Z 4 зададим, используя свойство сохранения групповой операции: f (2) = f (1 + 1) = f (1) ■f (1) = 2 ■2 = 4 (m od 5), f (3) = f (2 + 1) = f (2) ■f (1) = 4 ■2 = 3 (m od 5), f (0) = f (3 + 1) = f (3) ■f (1) = 3 ■2 = 1 (m od 5). Н епосредственной проверкой легко убедиться в том, что f дей­ ствительно является изоморф изм ом. □ П р и м е р 3 .2 5 . Покажем, что Z = 2Z. Для этого зададим отображ ение Z в 2Z по правилу f ( k ) = 2k. Очевидно, что та­ кое отображ ение взаимно однозначно и, кроме того, сохраняет
72 Глава 3. Группы групповую операцию, так как равенства f (k + l) = 2(k + l) = 2k + 21 = f (k) + f (l) справедливы для лю бы х целых k и 1. Следовательно, f является изоморф изм ом. □ П р и м е р 3 .2 6 . Рассмотрим функцию f ( x ) = 2х , отображ а­ ю щ ую взаимнооднозначно м нож ество R действительны х чисел на множ ество R + полож ительны х действительны х чисел. Л егко видеть, что f (x i + x 2) = 2х1+х2 = 2X1 ■2х2 = f (x i) ■f (x 2) для лю бы х действительны х x i и x 2 . Так как множ ество R с операцией сложения и множ ество R + с операцией умножения являю тся группами, то функция f (x ) = 2х устанавливает изо­ морф изм этих групп. □ И зом орф измы , построенные в рассм отренны х выше приме­ рах, обладаю т несколькими общ ими свойствами. Так, напри­ мер, нетрудно заметить, что каждый изоморф изм отображ ает единичный элемент одной группы в единичный элемент другой группы. Такж е нетрудно видеть, что в каж дом из трех примеров выполняется равенство f ( g - i ) = f ( g ) - i , и кроме того, обрат­ ное отображ ение каж дого из рассм отренны х изом орф изм ов са­ мо является изоморф изм ом. Например в третьем примере такое обратное отображ ение задается функцией log 2 у, которая от об­ раж ает R + в R и для которой равенство log 2 (yi ■У2) = log 2 yi + log 2 У2 справедливо при всех полож ительны х y i, У2 . Э то обстоятел ьство не является случайным. Покажем, что каж ды м из трех указан­ ных свойств обладает лю бой изоморф изм f : G ^ H произволь­ ных изом орф ны х групп G и H . Т е о р е м а 3 .1 0 . П уст ь G и H — изоморфные группы с еди­ ничными элементами e и e '. Любой изоморфизм f : G ^ H обладает следующ им и свойст вам и:
3.4. Изоморфизмы групп 73 1) / (e) = e' ; 2) / (g - 1 ) = / (g )-1 для каж дого g G G; 3) обратное от ображ ение являет ся изоморфизмом. Д о к а з а т е л ь с т в о . Покажем, что изоморф изм / отображ ает единичный элемент e группы G в единичный элемент e' группы H , т. е. / (e) = e'. Д ействительно, из свойств единичного элемен­ та следует, что e * g = g * e = e для л ю бого g из G, а из взаимной однозначности / следует, что для л ю бого h из H в G найдется такой элемент g, что h = / (g). П оэтом у для л ю бого h (и его прообраза g) h 0 / (e) = / (g ) 0 / (e) = / (g * e) = = / (g ) = / (e * g ) = / (e) 0 / (g ) = / (e) 0 h . Следовательно, / (e) — единичный элемент. Теперь покажем, что изоморф изм / отображ ает g -1 в эле­ мент, являющийся обратны м элементом к / (g), т. е. / (g - 1 ) = = / (g )- 1 . Для этого воспользуемся установленным выше свой­ ством / (e) = e' и определением обратного элемента: / (g ) 0 / (g -1 ) = / (g * g -1 ) = / (e) = = e' = / (e) = / (g -1 * g) = / (g - 1 ) 0 / (g). (3 1 2 ) ( . ) Наконец покажем, что обратное отображ ение / -1 : H ^ G такж е является изоморф изм ом. Так как / — взаимно однознач­ ное отображ ение, то оно, очевидно, имеет обратное, которое так­ ж е взаимно однозначно. П оэтом у нам достаточн о доказать спра­ ведливость равенства / - 1 (hi 0 h 2) = / -1 (h i) * / - 1 (h 2) для произ­ вольных hi и h 2 из группы H . П усть g i = / - 1 (h i) и g 2 = / - 1 (h 2). Тогда / - 1 ( h i 0 h2) = / - 1 ( / ( g i ) 0 / ( g2)) = = / - 1 ( / ( g i * g2)) = g i * g2 = / - 1 ( h 1) * / - 1(h 2) . Таким образом, справедливость всех трех свойств установлена. Теорема доказана.
74 Глава 3. Группы Среди всевозм ож ны х изоморф изм ов различных групп отм е­ тим изоморф изм ы группы на себя, называемые автоморфизма­ ми. В частности, автоморфизмами группы G являю тся сопря­ ж ен и я ha : g ^ a ga -1 относительно произвольного элемента а группы. Н етрудно показать, что автом орф изм ы произвольной группы G образую т группу относительно операции композиции. Такая группа называется группой автоморфизмов группы G и обозначается A u t(G ). Все сопряж ения группы G обр азую т под­ группу в группе A u t(G ). 2. Т е о р е м а К э л и . Ранее бы ло отмечено, что д о середины X IX в. в математике рассматривались только группы подста­ новок. Распространив понятие группы на произвольное множ е­ ство с бинарной операцией, А р ту р Кэли показал, что каждая конечная группа изоморф на некоторой подгруппе симметриче­ ской группы подходящ его порядка. Т е о р е м а 3 .1 1 (К эли). Любая конечная группа порядка n изо­ морфна некоторой подгруппе Sn . Д о к а з а т е л ь с т в о . Рассмотрим множ ество взаимно однознач­ ных отображ ений H = { f a} группы G в себя, действую щ их по правилу f a : g ^ ag. Такие отображ ения называются сдвига­ м и . Рассматриваемое м нож ество является группой относитель­ но операции суперпозиции, так как суперпозиция ассоциативна, а из равенства ( f a о f b) ( g ) = f a( f b(g » (3.13) легко следует, что для л ю бого элемента а группы G и единич­ ного элемента e этой группы fe о f a = f a о f e = fa, fa о f a- i = f a- i о fa = f e, т. е. в группе H элемент f e будет единичным элементом, а f a- i — обратны м к f a. Элементы группы H являю тся подстановками на n-элемент­ ном множ естве элементов группы G. Следовательно, H — под­ группа группы Sn . О тображ ение р : a ^ f a определяет и зом ор­ ф изм групп G и H , так как оно биективно и равенство p(ab ) = fab = fa о fb = р (а ) о p(b)
3.4. Изоморфизмы групп 75 легко следует из (3.13). Теорема доказана. П р и м е р 3 .2 7 . Найдем в группе S 4 подгруппу, и зом орф ную группе ( Z 5 , х ) . О тображ ения f a : g ^ ag, использованные в доказательстве теоремы 3.11, д ей ствую т на множ естве Zj5 сле­ дую щ им образом: 1 2 3 , 4 f:2 fi : 3 4 1 2 2 3 1 4 1 , 4 3 1 3 1 fs : 3 ^ 4 , 4 1 4 3 --У f4 : 3 2 2 4 1 П оэтом у подгруппа группы S4, изоморфная группе (Z 5 , х ), со ­ стои т из тож дественной подстановки f i , двух циклов длины че­ ты ре f 2 = (1243) и fs = (1342) и произведения транспозиций f 4 = (14)(23). □ 3. Ц и к л и ч е с к и е г р у п п ы . Среди всех конечных групп наи­ более п росто устроены циклические группы, в каж дой из ко­ торы х все элементы являю тся степенями одного порож даю щ е­ го элемента. П оэтом у все конечные циклические группы одного порядка устроены одинаково. Точнее, справедлива следующ ая теорема. Т е о р е м а 3 .1 2 . Любая конечная циклическая группа порядка п изоморфна группе (Z n , + ) . Д о к а з а т е л ь с т в о . П усть конечная циклическая группа по­ рядка n порож дается элементом g. Рассмотрим отображ ение f : g k ^ k. Тогда для лю бы х элементов g i = g k и g 2 = g m группы G имеем: f (g ig 2) = f (g kg m) = f (g k+m) = [k + m ]„ = = [k]n + [m]n = f (g k) + f (g m) = f (g i ) + f (g 2) . Таким образом, f — изоморфизм. Теорема доказана. Т е о р е м а 3 .1 3 . П уст ь m делит п. В любой конечной цикли­ ческой группе порядка п сущ ест вует единственная подгруппа порядка т . В се подгруппы циклической группы циклические.
Глава 3. Группы 76 Д о к а з а т е л ь с т в о . В силу теоремы 3.12 достаточн о пока­ зать, что доказываемое свойство справедливо для (Z n , + ) . П реж ­ де всего отметим, что по крайней мере одна подгруппа порядка m существует. Эта подгруппа образована числами, делящимися на d = n /m : 0, d , . . . , (m — 1)d, порож дается элементом d и по­ этом у является циклической. О тсутстви е других подгрупп сле­ дует из того, что по следствию теоремы Л агранжа для каж до­ го элемента а такой подгруппы долж н о выполняться равенство m ■a = 0 (m od n ), т. е. каж дый ее элемент долж ен делиться на d. В Z n таких чисел ровно m, и все они принадлежат первой подгруппе. Теорема доказана. Т е о р е м а 3 .1 4 . В любой циклической группе порядка n сущ е­ ст вует ровно ^>(n) порож даю щ их элементов. Д о к а з а т е л ь с т в о . Снова воспользуемся теоремой 3.12. П о­ кажем, что в (Z n , + ) порож дающ ими элементами будут все чис­ ла, взаимно просты е с n, и только они. В силу теоремы 2.2 вза­ имная п ростота чисел n и а эквивалентна сущ ествованию таких целых k и m, что kn + m a = 1. Из этого равенства следует, что m -a = 1 (m od n ). (3.14) П оэтом у единица — порож дающ ий элемент в (Z n , + ) — являет­ ся суммой m элементов а. Следовательно, a — порож дающ ий элемент в (Z n , + ) . С другой стороны , если a — порож дающ ий элемент, то единица долж на бы ть суммой некоторого числа эле­ ментов a, т. е. дол ж н о сущ ествовать целое m, для которого спра­ ведливо (3.14), откуда в свою очередь следует взаимная п росто­ та n и a. Теорема доказана. П росты м следствием двух предыдущ их теорем является сле­ дую щ ее утверждение. Т е о р е м а 3 .1 5 . П уст ь m делит n. В любой конечной цик­ лической группе порядка n сущ ест вует ровно ^>(m) элементов порядка m . Д о к а з а т е л ь с т в о . К аж ды й элемент порядка m порож дает подгруппу такого ж е порядка. Так как в циклической группе
3.4. Изоморфизмы групп 77 есть только одна подгруппа порядка m, то все элементы поряд­ ка m принадлежат одной и той ж е подгруппе и являю тся ее порож дающ ими элементами. Теорема доказана. Т е о р е м а 3 .1 6 . В циклической группе порядка n c порож да­ ющ им элемент ом g для порядка элемента g k справедливо ра­ венст во ki _ n (n, k ) . Д о к а з а т е л ь с т в о . Согласно теореме 3.12, достаточн о дока­ зать ф орм улу в циклической группе (Z n , + ) с порож дающ им вы четом 1. П орядком произвольного вычета k £ Z n являет­ ся наименьшее натуральное решение x сравнения x ■ k = 0 (m od n ). Все его целочисленные решения составл яю т множ е­ ство { i n /( n , k) : i £ Z } (см. доказательство теоремы 2.8). Наи­ меньшим положительным из них будет x = n /( n ,k ) . Теорема доказана. Из теоремы 3.16 легко извлекается следую щ ее полезное утвер­ ждение. С л е д с т в и е 3 .2 . Элемент g k являет ся порож дающ им эле­ м ент ом циклической группы (g)n тогда и только тогда, когда (n, k) = 1. П р и м е р 3 .2 8 . Если g — элемент некоторой (не обязательно циклической или коммутативной) группы, имеющий порядок 18, то порядок элемента g 15 равен (1Ц 5) = 6 . □ П р и м е р 3 .2 9 . Рассмотрим уравнение z 8 = g 12 в циклической группе G = (g ) 20. К аж ды й элемент z £ G имеет представление вида z = g x при некотором x £ Z 20, откуда z 8 = g 8x = g 12. П о­ следнее равенство равносильно сравнению 8x = 12 (m od 20). В примере 2.5 были найдены все его решения x = 4, 9 ,1 4 ,1 9 . Поэтом у элементы g 4 4 , g 99 ,g 14 ,g 19 являю тся решениями исходного уравнения в группе G, и други х решений в G у него нет. Анало­ гичным образом нетрудно установить, что уравнение z a = g b в группе (g )n либо не имеет решений, когда (a, n) { b, либо имеет ровно (a, n) решений в противном случае. О тметим, что и этот пример основан на теоремах 2.8 и 3.12. □
Глава 3. Группы 78 4 . П р я м о е п р о и з в е д е н и е г р у п п . Внешним, прямым произве­ дением G i х ■■■ х Gk групп G i , . . . , Gk называется м нож ество всех упорядоченны х наборов ( g i , . . . , g k ) длины k, где gi G Gi, с определенной на этом множ естве покомпонентной операцией умножения (g i , . . . , gk ) ( g i , . . . , gk) = (g ig i , . . . , gkgk ^ в которой умножение по i-й компоненте является умножением в G i. Л егко видеть, что такое умножение ассоциативно, мно­ ж ество G i х ■■■ х Gk зам кнуто относительно этого умнож е­ ния, содерж ит единичный элемент e = ( e i , . . . , e k ), составлен­ ный из единичных элементов групп G i , . . . , G k , и для каж до­ го набора g = ( g i , . . . , g k ) сущ ествует такой обратный набор g -1 = (g - 1 , . . . , g- 1 ), что g g -1 = g - 1 g = e. Таким образом, внеш­ нее прямое произведение групп само является группой. П р и м е р 3 .3 0 . Перечислим все подгруппы в прямом произ­ ведении Z 4 х Z 9 групп Z 4 и Z 9 . Группа Z 4 х Z 9 состои т из 36 пар (a, b), где a G Z 4 , b G Z 9 , и п оэтом у порядки ее нетриви­ альных подгрупп содерж атся среди чисел 2, 3, 4, 6 , 9, 12, 18. П о­ кажем, что для каж дого из этих чисел найдется единственная подгруппа соответствую щ его порядка. Так как групповыми опе­ рациями в Z 4 и Z 9 являю тся сложения по m od 4 и m od 9, то для Z 4 х Z 9 будем использовать аддитивную ф орм у записи. П усть k — порядок элемента (1 ,1 ), тогда k ( 1 ,1) = (k, k) = (0, 0). П о­ следнее равенство эквивалентно тому, что k = 0 (m od 4) и k = 0 (m od 9) . Из китайской теоремы об остатках следует, что k крат­ но 36. Следовательно, Z 4 х Z 9 — циклическая группа с п орож ­ дающ им элементом (1 ,1 ). П оэтом у в силу теоремы 3.13 о цик­ лических группах Z 4 х Z 9 содерж ит ровно по одной подгруппе порядка 2, 3, 4, 6 , 9, 12, 18. Нетрудно видеть, что такими подгруп­ пами будут 2 Z 4 х { 0 } , { 0 } х 3 Z 9, Z 4 х { 0 } , 2 Z 4 х 3 Z 9, { 0 } х Z 9, Z 4 х 3 Z 9 и 2 Z 4 х Z 9. Заметим, что все приведенные выше рассуж дения примени­ мы и к группе Z 9 х Z 4 . Следовательно, Z 4 х Z 9 = Z 9 х Z 4 . □ Н екоторые свойства группы Z 4 х Z 9 из рассм отренного при­ мера справедливы для лю бы х внешних прямых произведений
3.4. Изоморфизмы групп 79 групп. М ож но легко показать, что G i X G 2 — G 2 X G i для лю ­ бы х G i и G 2 , и если Hi — подгруппа в Gi, то H i X H 2 будет подгруппой в G i X G 2 . П р и м е р 3 .3 1 . П усть p и q — различные простые, A = (a) и B = (b) — циклические группы порядков p и q. Покажем, что прямое произведение A X B такж е будет циклической группой. П овторяя рассуж дения из предыдущ его примера, найдем поря­ д о к k элемента (a, b). Так как (a, b)k = (a k, bk) = (e, e), то k = 0 (m od p) и k = 0 (m od q). Из китайской теоремы об остатках следует, что k кратно pq. Следовательно, A X B — циклическая группа порядка pq. □ Т е о р е м а 3 .1 7 . П уст ь n = qiq 2 ■■■qk, где все qi попарно вза­ имно простые. Тогда Zn = Zq1 X Zq2 X ■■■ X Zqfc, Z n = Z g1 X Z g2 X ■■■ X Z gk. Д о к а з а т е л ь с т в о . Для каж дого a из Z n и каж дого i из { 1 , 2 , . . . , k } положим ai = a (m od qi). Из китайской теоремы об остатках следует, что отображ ение f ( a ) = (a 1, a 2 , . . . , ak) из Z n в Z q1 X Z q2 X ■■■X Z qk будет взаимно однозначным. Сравнения м ож но складывать, поэтом у f (a + b) = (a i + bi, a 2 + b2 , . . . , ak + bk) = = (a i, a 2, . . . , ak) + (bi, b2, . . . , bk) = f (a) + f (b) для лю бы х a и b из Z n . Таким образом, f — изоморф изм из группы Z n в группу Z q1 X Z q2 X ■■■ X Z qk. Далее заметим, что если a взаимно просто с n, то оно вза­ имно просто и с лю бым его делителем. П оэтом у если a £ Zn, то ai £ Zq . Верно и обратное, если все ai взаимно просты с n, то и соответствую щ ее им a из Z n будет взаимно просто с n. Следо­ вательно, если ai £ Zq. при каж дом i из {1, 2 , . . . , k }, то a £ Z n . Теперь из китайской теоремы об остатках следует, что отобра­ жение f (a) = (a k, a2, . . . , ak) из Zn в Zq1 X Zq2 X ■■■ X Zqfc будет взаимно однозначным. Так как сравнения мож но умнож ать, то f (ab) = (a ib i, a 2b2 , . . . , ak bk) =
Глава 3. Группы 80 = (a i, a 2 , . . . , ak)(bi, b2 , . . . , bk) = / ( a )/(b ) для лю бы х a и b из Zn. Следовательно, / — изоморф изм из группы Zn в группу Z*1 х Z*2 х ■■■ х Z*fc. Теорема доказана. Л е м м а 3 .2 . П уст ь g G G, h G H . Тогда порядок элемента (g, h) в прямом произведении G х H групп G и H равен наи­ м ен ьш ем у общ ему кратному Н О К (|g|, |h|) порядков элемента g и элемента h . Д о к а з а т е л ь с т в о . П олож им n = |(g, h)| и N = Н О К (|g|, |h|). Тогда (g ,h )n = (gn ,h n) = ( e c , e n ), и по лемме 3.1 имеем, что число n делится и на |g|, и на |h|. Следовательно, n делится на N . С другой стороны , ( g ,h ) N = (g N , hN) = ( e c , e # ) в силу де­ лимости N на |g| и |h|, откуда следует, что N делится на n. П оэтом у n = N . Л емма доказана. С л е д с т в и е 3 .3 . П уст ь g = ( g i , . . . , gk) G G i х . . . х Gk, тогда |g | = Н О К ( |g l |,. . . , |gk|). 3.5. Гомоморфизмы групп П усть G и H — группы с операциями * и 0 соответственно. О тображ ение / : G ^ H называется гомоморфизмом группы G в группу H , если / ( a * b) = / ( a ) 0 /( b ) для всех элементов a и b группы G. Ядром гомоморфизма / называется м нож ество K er / = {g G G |/ (g) = e }. Нетрудно видеть, что всякий и зом ор­ ф изм является гом ом орф изм ом , ядро которого состои т только из единичного элемента. П р и м е р 3 .3 2 . Отображ ение / : Z ^ Z 2, определенное равен­ ством / (k) = [k]2 , является гом ом орф изм ом с ядром 2Z. Дей­ ствительно, равенство / (k + m ) = [k + m ]2 = [k]2 + [m ]2 = / (k) + / (m ) справедливо для лю бы х целых k и m, а каж дое четное l отобра­ ж ается в нулевой элемент группы Z 2: / (l) = [l]2 = [0]2. □
3.5. Гомоморфизмы групп 81 Т е о р е м а 3 .1 8 . П уст ь f : G ^ H — гомоморфизм группы G в группу H c ядром, K . Тогда K — нормальная подгруппа в G. Д о к а з а т е л ь с т в о . Покажем, что ядро K гом ом орф изм а f образует подгруппу в G. Для лю бы х k i,k 2 G K и единичного элемента e' группы H имеем f (k ik 2) = f (k i) ■f (k 2) = e' ■e' = e', т. е. k ik 2 G K и ядро гом ом орф изм а зам кнуто относительно групповой операции. Единичный элемент е группы G принад­ леж ит ядру гом оморф изма, так как при k G K е' = f (k) = f (k ' e) = f (k) ' f (e) = e' ' f (e) = e'. Д ля каж дого k из K и его обратного k - i справедливы равенства e' = f ( k k - i ) = f ( k ) ■f ( k - i ) = e' ■f ( k - i ) = f (k - i ). Следовательно, k - i G K . Таким образом K — подгруппа группы G. Так как для каж дого g из G f (g K g - i ) = f (g) ■f ( K ) ■f (g - i ) = = f ( g ) ■f ( g - i ) = f ( g g - i ) = f ( e ) = e' , то K — нормальная подгруппа. Теорема доказана. У каж ем два просты х, но важ ны х свойства гом ом орф изм ов. П ервое состои т в том, что для л ю бого гом ом орф изм а f группы G в группу H и каж дого элемента g G G имеет место равенство f ( g - i ) = f ( g ) - i . Д оказательство этого ф акта дословно повто­ ряет рассуж дения, приведенные в доказательстве теоремы 3.10 (последовательность равенств (3.12)) о свойствах изом орф из­ мов. В торое свойство заклю чается в том , что если f (g i) = f (g 2), то g1 и g 2 принадлежат одному и том у ж е см еж ном у классу группы G по ядру гом оморф изма f . Действительно, так как f (g - i g i ) = f (g - i ) f (g i ) = f (g2) i f (g i ) = f (g i ) i f (g i ) = e' ,
82 Глава 3. Группы где e' — единичный элемент группы H , то g - i g i G Ker f или g i G g 2Ker f . Очевидно, что верно и обратное свойство: если эле­ менты g 1 и g 2 принадлежат одному и том у ж е см еж ном у классу группы G по ядру гом ом орф изм а f , то f (g i) = f (g 2). Из при­ надлежности g1 и g 2 одном у и том у ж е см еж ном у классу следует сущ ествование такого элемента ядра h, что gi = g 2h. Тогда f (g i ) = f (g 2h) = f (g 2) f (h) = f (g 2)e ' = f (g 2) . Л егко видеть, что образ гом ом орф изм а Im f = { f (g) | g G G } является подгруппой в H (в отличие от ядра не обязательно нормальной). П р и м е р 3 .3 3 . Выясним, какие группы м огут бы ть образа­ ми гом ом орф изм ов группы S s . Из теоремы 3.18 следует, что необходимым условием сущ ествования гом ом орф изм а является наличие в S 3 нормальной подгруппы, являющейся ядром гом о­ морф изма. Будем рассм атривать гом ом орф изм ы , ядра которы х не совпадаю т с самой группой S 3 и состоя т более чем из одно­ го элемента. Н етрудно видеть, что в группе Ss есть три под­ группы H i = {e , (1 2 )}, H 2 = {e, (1 3 )} и H s = {e, (2 3 )} порядка два, и одна подгруппа порядка три — знакопеременная группа As = {e , (123), (1 3 2 )}, являющ аяся нормальной подгруппой в S 3 . Ни одна из подгрупп порядка два не является нормальной. У бедиться в этом мож но прямой проверкой, к оторую выпол­ ним для подгруппы H 1 . Действительно, так как (132)(12)(123) = = (13), то (1 3 2 )H i(1 3 2 )- i = H i. Аналогичные неравенства м ож ­ но получить и для подгрупп H 2 и Hs. Таким образом, нет ни одного гом ом орф изм а группы Ss, ядром которого является под­ группа порядка два. Теперь построим гом ом орф изм f с ядром As. Для этого вос­ пользуемся равенством sgn (n)sgn (п ') = s g n (n n '), справедли­ вым для лю бы х подстановок п и п '. Очевидно, что отображ ение f : п ^ sgn (п) сохраняет групповую операцию и, следователь­ но, является гом ом орф изм ом Ss в группу G = {1, - 1 } с опера­ цией умножения. Такж е легко видеть, что f отображ ает четные подстановки в 1 — единичный элемент G, т. е. A s — ядро f . Т ак как As единственная нетривиальная нормальная подгруппа
3.5. Гомоморфизмы групп 83 в S 3, то любой нетривиальный гом оморф ны й образ группы S 3 изоморф ен группе G. □ В следующ ей теореме рассмотренны й выше пример обобщ а­ ется на произвольную группу и лю бую ее нормальную подгруп­ пу. Т е о р е м а 3 .1 9 . П уст ь K — нормальная подгруппа в G . То­ гда сущ ест вует гомоморфизм f : G ^ являет ся подгруппа K . G / K , ядром, которого Д о к а з а т е л ь с т в о . Рассмотрим отображ ение f : g ^ gK , ставящ ее в соответстви е элементу g смеж ный класс, котором у он принадлежит. Так как подгруппа K нормальна в G, то f (g lg 2) = g lg 2K = g lg 2 K K = g lK g 2 K = f ( g i ) f (g2) для лю бы х g 1 и g2 из G. Следовательно, f сохраняет групповую операцию и п оэтом у является гом ом орф изм ом . Теорема доказа­ на. Т е о р е м а 3 .2 0 . П уст ь f : G ^ H — гомоморфизм группы G в группу H c ядром, K . Тогда G / K — I m f . Д о к а з а т е л ь с т в о . Рассмотрим отображ ение p : g K ^ f (g), ставящ ее в соответстви е см еж ном у классу g K образ элемента g при гом ом орф изм е f . Из свойства сохранения операции гом о­ м орф измом следует, что p ( g i K ■g 2 K ) = p (g ig 2 K ) = f (gig2) = = f (g i ) f (g2) = P (g i K ) P (g2K ) для лю бы х g i и g 2 из G. П оэтом у p сохраняет групповую опе­ рацию и, таким образом, является гом ом орф изм ом . Теперь покажем, что р — биективное отображ ение. Т ак как Im p = I m f в силу определения р, то оно сю ръективно. П окажем инъективность р . Д ействительно, если найдутся g 1 и g 2 такие, что p ( g kK ) = p (g 2K ), то f (g i ) = P (g i K ) = P (g2K ) = f (g2),
84 Глава 3. Группы и, следовательно, элементы g1, g 2 принадлежат одному и том у ж е см еж ном у классу группы G по K , т. е. g i K = g 2K . Таким образом, p ( g i K ) = p (g 2K ), если g i K = g 2K . Теорема доказана. Задачи 3.1. Определить, образует ли группу множество с указанной опе­ рацией, и если оно является группой, то найти ее порядок и выяснить, абелева она или нет, циклическая она или нет; если циклическая, то найти число ее образующих: 1) все взаимнооднозначные отображения f : Z 5 ^ Z 5 относитель­ но операции композиции отображений; 2 ) все булевы функции двух аргументов относительно опера­ ции f V g; 3) все булевы функции двух аргументов относительно опера­ ции / 0 g; 4) все необратимые по умножению вычеты из Z 1024 относительно сложения вычетов; 5) все необратимые по умножению вычеты из Z 216 относительно сложения вычетов. 3.2. Пусть х, у — элементы некоммутативной группы G. Доказать, что порядки элементов ху и ух совпадают. 3.3. Доказать, что если ху = ух и (х) П (у) = e, то порядок элемен­ та ху равен наименьшему общему кратному порядков элементов х и у. Показать на примере, что каждого из условий ху = ух и (х) П (у) = e в отдельности недостаточно. 3.4. Пусть а = (01)(23)(456)(769), в = (0423)(196758). Найти зна­ ки и порядки подстановок а, в. Определить, коммутируют ли они. Вычислить а -1 и в 2014. Решить уравнение ах = в. Решить уравнение х 2 2 = а. 3.5. (Эквивалентное определение знака подстановки) Пусть п — некоторая подстановка из Sn. Доказать, что ее знак удовлетворяет равенству ^ п (п ) = П “ Tj — • K i< K n п(?) " п(г) 3.6. Найти при п = 3, 4 , . . . , 12 максимальный порядок элемента в группе Sn и число элементов максимального порядка.
Задачи 85 3.7. Найти при n = 3, 4 , . . . , 12 максимальный порядок элемента в группе A n и число элементов максимального порядка. 3.8. Пусть n ^ 3. Доказать, что A n = (T}, где T — множество, состоящее из циклов: 1) (123), (1 2 4 ),..., (12n), 2) (123), (2 3 4 ),..., (n - 2, n - 1, n ). Являются ли эти множества минимальными порождающими груп­ пу An системами? 3.9. Пусть число n G N является произведением двух различных простых чисел. Показать, что сравнение x 1+v(n) = x (mod n) спра­ ведливо для всех вычетов x G Z n, а не только для обратимых по модулю n (следствие теоремы Эйлера, на котором основана коррект­ ность системы RSA). 3.10. Пусть G — группа порядка n, H — ее подгруппа, и элемент g G G таков, что g k G H , причем (k, n) = 1. Доказать, что д G H . 3.11. Перечислить все неизоморфные группы порядка 4. 3.12. Существует ли в группе A n минимальная образующая си­ стема из двух элементов? 3 .13. Найти ^ m|n^(m ). 3.14. Пусть G — циклическая группа порядка 600 с образующим элементом а. 1) Найти порядок элемента a70 G G и число элементов из G по­ рядков 16, 20,100; 2) найти число подрупп группы G; 3) решить уравнения x 70 = 1 и x85 = а100 в группе G, определить, множество решений какого из них образует подгруппу в G; 4) построить изоморфизм между группой G и группой H = = + ). 3.15. Показать, что автоморфизмы произвольной группы образу­ ют группу относительно операции композиции. 3.16. Показать, что сдвиги группы G образуют подгруппу в груп­ пе Aut(G). 3.17. Показать, что сопряжения группы G образуют подгруппу в группе Aut(G). 3.18. Найти группы Aut(Z), A ut(Z5), A ut(Z6). 3.19. Найти число автоморфизмов конечной циклической группы порядка n.
86 Глава 3. Группы 3.20. Показать, что при изоморфизме групп образ любого эле­ мента имеет тот же порядок, что и прообраз, подгруппы переходят в подгруппы (того же порядка), а системы образующих — в системы образующих. 3.21. Пусть G — конечная группа, H и К — ее подгруппы. Пока­ зать, что |H П K |•|HK|= |H|•|К|. 3.22. Пусть f : G ^ H — гомоморфизм. Доказать, что порядок x делится на порядок f (x) для всех x G G. 3.23. Показать, что композиция гомоморфизмов будет гомомор­ физмом. 3.24. Пусть f : G ^ H и ф : H ^ К — гомоморфизмы группы G в группу H и группы H в группу K . Показать, что Ker (ф о f)/K e r f = Ker ф. 3.25. Построить все возможные гомоморфизмы f : (a )60 ^ (Ь)40. Указать среди них все такие, что |Ker f |= 6. 3.26. Найти все гомоморфизмы f : (a) 10 ^ S4 и g : S4 ^ (a) 10. 3.27. Найти все нормальные подгруппы H в группе подстановок S 4, построить фактор-группы S4/ H . 3.28. На примере группы A 4 показать, что нормальная подгруп­ па Hi нормальной подгруппы H 2 группы G не обязательно является нормальной в G. 3.29. Выяснить, для каких групп G отображение f : G ^ G, определенное правилом: 1) f (x ) = x 2; 2 ) f(x ) = x - 1 , является гомо­ морфизмом. При каком условии оно является изоморфизмом? 3.30. Пусть H 1<iG, H 2 <G и H 1ПH 2 = e. Доказать справедливость равенства x 1x 2 = x 2x 1 для всех x* G Hj.
Глава 4 Кольца В этой главе вводятся алгебраические структуры с двум я опера­ циями — кольца и поля. К ольцом называется множ ество с двумя заданными на нем бинарными операциями, удовлетворяющ ими некоторым определенным свойствам и называемыми слож ени­ ем и умножением. Поле представляет собой важный частный случай кольца, в котором операция умножения подчиняется д о ­ полнительным требованиям. Примерами кольца и поля явля­ ю тся, соответственно, целые и действительные числа с операци­ ями сложения и умножения. Ниже рассм атриваю тся основные свойства произвольных колец. После этого подробно изучаю т­ ся кольца многочленов. Эти кольца играю т важ ную роль при подробном изучении полей в восьмой главе. 4.1. Кольца и поля М нож ество K с определенными на нем бинарными операци­ ями сложения + и умножения ■ называется кольцом, если: (1) множ ество K с операцией + является абелевой группой; (2) множ ество K с операцией ■ является полугруппой; (3) для всех a,b и с из множ ества K выполняю тся законы дистрибутивности: a ■(b + с) = a ■b + a ■с, (b + с) ■a = b ■a + с ■a. Группа (K , + ) называется аддитивной группой кольца, а ее еди­ ничный элемент — нулевым элементом кольца. Нулевой элемент
88 Глава 4. Кольца кольца обозначается символом 0. П олугруппа (K , ■) называется мультипликативной полугруппой кольца. Кольцо K называется кольцом с единицей, если сущ ествует такой элемент 1, что a ■ 1 = 1 - a = a для л ю бого a G K. К оль­ цо называется конечным, если оно состои т из конечного числа элементов. П р и м е р 4 .1 . М нож ество целых чисел с обычными операция­ ми сложения и умножения является кольцом с единицей, а мно­ ж ество 2Z четных целых чисел с такими ж е операциями — коль­ цом без единицы. Конечным кольцом с единицей будет множ е­ ство Z m с операциями сложения и умножения по модулю m, а конечным кольцом без единицы — множ ество четных элементов из Z 2m с операциями сложения и умножения по модулю 2m. □ П р и м е р 4 .2 . Обозначим через Z[\/2] все числа, которы е м ож ­ но получить из целых чисел и \/2 при помощи сложений и ум но­ жений. Э то м нож ество состои т из чисел вида a + b\/2, где a, b — целые, и с обы чными операциями сложения и умножения явля­ ется кольцом с единицей. □ П одмнож ество L кольца K называется подкольцом, если оно зам кнуто относительно сложения и умножения, т. е. если a, b G L, то a + b G L и ab G L. П р и м е р 4 .3 . М нож ество 2Z является подкольцом в Z, 2Z2m — подкольцом в Z 2m, Z — подкольцом в Z[\/2] и кольце R дей­ ствительны х чисел. □ П р и м е р 4 .4 . Из примера 3.6 на с. 57 легко следует, что в кольце целых чисел все подкольца имею т вид m Z . □ Кольцо называется коммутативным, если операция ум но­ жения коммутативна. Все кольца в рассм отренны х выше приме­ рах коммутативные. Пример некоммутативного кольца мож но найти на с. 150. Выполняя действия над элементами произвольных колец, будем использовать ряд соглашений и свойств, позволяющ их упрости ть выкладки и имеющих очевидные аналогии в коль­ це целых чисел. Обратный элемент по слож ению к элементу a
4.1. Кольца и поля 89 будем обозначать —а. С ум му элементов а и —b будем обозначать как а — b, введя по сути дополнительную операцию вычитания. Т е о р е м а 4 .1 . П уст ь K — кольцо. Д л я любых его элементов а и b а 0 = 0 а = 0, а ( —b) = ( —а)Ь = —(аЬ), ( —а ) ( —b) = ab. Если K — кольцо с единицей, то ( —1)а = —a, ( —1 )(—1) = 1. Д о к а з а т е л ь с т в о . Так как а + 0 = а для л ю бого а, то а 2 + 0 = а 2 = а(а + 0) = а 2 + а0 ^ а0 = 0. А налогичны м образом устанавливается равенство 0а = 0. Д а­ лее, используя предыдущ ее свойство, видим, что 0 = а0 = a(b — b) = ab + а (—Ь) ^ —ab = a ( —b). (4.1) Т ак как —( —b) = b, то, подставляя это равенство в (4.1), при­ ходим к равенству ( —а ) ( —b) = ab. В св ою очередь из этого ра­ венства легко следует, что ( —1)а = —а и ( —1)( —1) = 1. Теорема доказана. Кольцо K называется кольцом без делителей нуля или це­ лостным, если из равенства ab = 0 следует либо а = 0, либо b = 0. Ненулевые элементы a, b G K называются делителями нуля в кольце K , если ab = 0. Например, кольцо Z содерж ит делители нуля (это вычеты 2, 3, 4), а в кольце Z 5 их нет. Л е м м а 4 .1 . В кольце без делителей нуля выполняется закон сокращения: если c = 0 и ac = bc, то а = b. Д о к а з а т е л ь с т в о . Из равенства ас = bc следует, что (а — —b)c = 0, и так как с = 0 и в кольце нет делителей нуля, то а — b = 0, т. е. а = b. Лемма доказана.
90 Глава 4. Кольца П усть K — кольцо с единицей 1. Тогда элемент x £ K называ­ ется обратимым (по умнож ению ), если в K найдется такой эле­ мент x - 1 , что x ■x -1 = x -1 ■x = 1. Элемент x -1 в этом случае на­ зы вается (мультипликативным) обратным к x. Из теоремы 4.1 очевидно, что нулевой элемент 0 лю бого кольца необратим, так как 0 = 1 . В отличие о т обратим ости по сложению, не каждый элемент кольца обратим по умножению. Если a, b £ K — делители нуля, т. е. ab = 0, то ни a, ни b не имею т обратного в K: из предполо­ жения 1 = a - 1 a домнож ением обеих частей этого равенства на b немедленно получаем b = 1 ■b = a - 1 ab = a -1 ■0 = 0. Рассмотрим м нож ество всех обратим ы х по умнож ению эле­ ментов кольца K: K* = { x £ K : 3 x -1 £ K }. Например, (Zg)* = {1 , 5 }. Обозначение K* полностью согласует­ ся с введенным ранее на с. 54 обозначением Z ^ для множ ества взаимно п росты х с m вы четов и обобщ ает его на произвольное кольцо: по теореме 2.9 вы чет [x] кольца Z m имеет обратный вы­ чет тогда и только тогда, когда представляющ ее его целое число x взаимно просто с m. Л е м м а 4 .2 . П уст ь K — произвольное кольцо с единицей, не обязат ельно коммутативное. Тогда м н ож ест во K * являет ся группой от носит ельно ум нож ения кольца K . Д о к а з а т е л ь с т в о . Я сно, что единица 1 кольца K леж ит в множ естве K*, так как 1-1 = 1 в силу равенства 1 ■1 = 1, и яв­ ляется его единичным элементом. А ссоциативность умножения следует из аксиом кольца. Далее, м нож ество K * зам кнуто относительно умножения. Д ействительно, пусть элементы x и y обратимы, тогда (x y ) ■(y - 1 x - 1 ) = x (y y - 1 ) x -1 = x 1 x -1 = 1, (y - 1 x - 1 ) ■(x y) = 1, а это означает, что произведение x y такж е обратим о и (x y )-1 = = y 1 ! x 1 1. Наконец, в силу тож дества ( x - 1 ) -1 = x обратный к элемен­ т у x £ K* элемент такж е леж ит в K*. Лемма доказана.
4.1. Кольца и поля 91 Группа K* называется м ультипликативной группой коль­ ца K. Например, Z* = {1, - 1 } . Ком мутативное кольцо с единицей 1 = 0, в котором каждый ненулевой элемент обратим по умножению, называется полем. М нож ество ненулевых элементов поля замкнуто относительно операции умножения, так как если произведение двух ненуле­ вых элементов a и b равно нулю, то цепочка равенств a = a(bb- 1 ) = (ab)b-1 = 0b-1 = 0 немедленно приводит к противоречию с условием a = 0. Таким образом, в поле нет делителей нуля, а все его ненулевые элемен­ ты обр азую т коммутативную группу, которая называется м у л ь­ типликативной группой поля. Воспользуемся этим свойством и дадим новое, независимое от понятия кольца определение поля. М нож ество F с определенными на нем бинарными операци­ ями сложения + и умножения ■ называется полем, если: (1) м нож ество F с операцией сложения является абелевой группой (F, + ) и эта группа называется аддитивной группой по­ ля, а ее нулевой элемент 0 — нулевым элементом (нулем) поля; (2) множ ество F* = F \ { 0 } с операцией умножения является абелевой группой (F*, ■) и эта группа называется м ульт ипли­ кативной группой поля, а ее единичный элемент — единичным элемент ом (единицей) поля; (3) для всех a, b и с из множ ества F выполняю тся законы дистрибутивности: a ■(b + с) = a ■b + a ■с,(b + с) ■a = b ■a + с ■a. Нетрудно видеть, что полями являю тся множ ества Q, R, C с обы чными для этих множ еств операциями сложения и умнож е­ ния. Поле называется конечным, если оно состои т из конечного числа элементов. К основны м арифметическим операциям в поле относятся сложение, вычитание, умножение и деление. Под вычитанием a — b, как и в кольце, понимается сложение с аддитивным об­ ратным, т. е. a + ( —b). А налогично деление а определяется как умножение на мультипликативный обратный элемент a ■b- 1 , где b = 0.
92 Глава 4- Кольца П рим ер 4 .5 . Обозначим через Q[\/2] все числа, которы е м ож но получить из рациональных чисел и у/ 2 при помощи сложений и умножений. Э то множ ество состои т из чисел вида a + by/2 , где a,b — рациональные. Так как (a + Ьу/2) ^ a2 - 2 b2 - a2 - 2b2 ■^ 2) = 1 то каж дый ненулевой элемент в Q[\/2] имеет обратный по ум но­ ж ению и п оэтом у Q[\/2] с обы чными операциями сложения и умножения является полем. П ро поле Q[\/2] говорят, что оно по­ лучено расширением поля рациональных чисел при помощи кор­ ня уравнения х 2 — 2 = 0. Аналогичным образом мож но сказать, что поле комплексных чисел является расширением R[i] поля действительны х чисел при помощи корня уравнения х 2 + 1 = 0. □ Т е о р е м а 4 .2 . К онечное коммутативное кольцо без делите­ лей нуля являет ся полем. Д о к а з а т е л ь с т в о . Для доказательства теоремы достаточн о показать, что в конечном коммутативном кольце без делителей нуля есть единичный элемент и каждый ненулевой элемент та­ кого кольца имеет обратный по умножению. П усть a — произвольный ненулевой элемент коммутативного кольца без делителей нуля, a i , a 2 , . . . , a n — все его ненулевые элементы. Если среди произведений aa i, aa 2 , . . . , aan найдутся два равных, например aai = a a j, то равенства a(ai — a j) = aai — aaj = 0 приводят к противоречию с отсутстви ем делителей нуля. П оэто­ му все произведения aai различны и среди этих произведений найдется произведение a a j, равное a. В этом случае из равен­ ства aaj = aaj aj следует, что a(a j — a2) = 0 или aj = a2. О тсю да для л ю бого ненулевого ai справедливы равенства aiaj = a ^ = (aiaj )a j = aj (ai a j),
4.2. Морфизмы колец 93 а так как все произведения a ja i, aja 2 , . . . , a ja n различны, то aj является единичным элементом. Теперь заметим, что среди произведений a a i, aa 2 , . . . , aa n найдется произведение aa k, равное единичному элементу. Сле—1 довательно, a 1= a k, т. е. каж дый ненулевой элемент коммута­ тивного кольца без делителей нуля имеет обратный по умнож е­ нию. Теорема доказана. С л е д с т в и е 4 .1 . При простом p м нож ест во Z pс операциями слож ения и ум нож ени я по модулю p являет ся полем 1 . 4.2. Морфизмы колец 1. И з о м о р ф и з м к о л е ц . П усть (K, + , ■) и (K ', ®, 0 ) — коль­ ца. Взаимно однозначное отображ ение / : K ^ K ' называется изоморфизмом, если оно сохраняет операции, т. е. равенства / (a + b) = / (a) ® / (b), / (ab) = / (a) 0 / (b) справедливы для лю бы х a и b из K. Для обозначения и зом ор­ ф изма колец используется символ = . П р и м е р 4 .6 . О тображ ение / : Z[\/2] ^ Z[\/2], преобразую ­ щее a + b\/2 в a — b\/2, является изоморф изм ом кольца Z[\/2]. □ Прямой сум м ой K i 0 ■■■0 K mколец K i, . . . , K mназывается множ ество всех упорядоченны х наборов (a i, . . . , a m ) длины m, где a i G K i, с определенными на этом множ естве покомпонент­ ными операциями умножения и сложения (a 1, . . . , a m ) ( a i, . . . , a m ) —(a ia i, . . . , a ma m) , (a i, . . . , a m ) + ( ai , . . . , am ) = ( a i + a i , . . . , a m+ a m ), в к оторы х умножение и сложение по i-й компоненте является умножением и сложением в K i. Такие операции на множ естве 1)Отметим, что этот факт следует независимо от теоремы 4.2 также из расширенного алгоритма Евклида и результатов раздела 2.4.
94 Глава 4. Кольца K i 0 ■■■ 0 K m ассоциативны, и для них справедливы законы дистрибутивности, а само множ ество является абелевой группой относительно операции сложения и полугруппой относительно операции умножения. П оэтом у прямая сумма K i 0 - ■. 0 K m явля­ ется кольцом с нулевым элементом 0 = ( 0 , . . . , 0), составленным из нулевых элементов колец K i , . . . , K m. Если каж дое кольцо Ki является кольцом с единицей, то и K i 0 ■■■0 K m будет кольцом с единицей ( 1 , . . . , 1), состоящ ей из единиц колец K j. П р и м е р 4 .7 . Прямая сумма R 0 R является коммутативным кольцом с единицей, но не является полем. □ П р и м е р 4 .8 . Прямая сумма Z n 0 Z m является комм утатив­ ным кольцом с единицей. □ Следующ ее утверж дение является очевидным следствием теоремы 3.17 и п оэтом у приводится без доказательства. Т е о р е м а 4 .3 . П уст ь n = qi q2 ••• 9fc, где все qj попарно вза­ имно простые. Тогда Z „ = Z gi 0 Zq2 0 ••• 0 Zqfc• К ак и теорему 2.11, теорему 4.3 часто называют китайской теоремой об остатках. 2. Г о м о м о р ф и з м к о л е ц . П усть (K, + , ■) и (K ', 0 , 0 ) — кольца. О тображ ение f : K ^ K ' называется гомоморфизмом, если оно сохраняет операции, т. е. равенства f (а + b) = f (а) 0 f (b), f (ab) = f (a) 0 f (b) справедливы для лю бы х a и b из K. Ядром гомоморфизма f называется множ ество K er f = {a G K | f (a) = 0 }. Л егко видеть, что ядро гом ом орф изм а f : K ^ кольцом в K. K ' будет под- П р и м е р 4 .9 . Гомом орф измом кольца Z в кольцо Z m будет отображ ение f : a ^ [a]m. Я сно, что Ker f = m Z является подкольцом в Z. □
4.2. Морфизмы колец 95 Следующ ая теорема легко следует из свойств гом ом орф из­ мов групп. Э ту теорему, как и сформ улированную выше теоре­ му 4.3, приведем без доказательства, которое оставляем читате­ лю в качестве неслож ного упражнения. Т е о р е м а 4 .4 . Если f : К ^ К/ гомоморфизм колец К и К ;, то: 1) f (0) = 0; 2) f ( - а ) = —f (а) для любого a G К. П одмнож ество I кольца К называется (двусторонним ) идеа­ лом, если оно является подгруппой аддитивной группы кольца и ab G I и ba G I для л ю бого a G I и лю бого b G К. П ро иде­ ал говорят, что он выдерж ивает умножение на любой элемент кольца. Если b G K er f , то для лю бого a G К f (ab) = f ( a ) f (b) = f (a) ■0 = 0, f (ba) = f ( b ) f (a) = 0 ■f (a) = 0. П оэтом у ab G Ker f и ba G Ker f . Следовательно, ядро гом ом ор­ ф изма является идеалом в К. Выш е бы ло отмечено, что в кольце целых чисел каж дое подкольцо имеет вид m Z . Так как m Z состои т из всех целых крат­ ных m , то легко видеть, что m Z будет идеалом в Z , т. е. каж дое подкольцо в Z является идеалом. В общ ем случае это не так, на­ пример, целые числа в Z[\/2] обр азую т подкольцо, но не идеал. С другой стороны , аналоги идеалов в кольце целых чисел су ­ щ ествую т в произвольном коммутативном кольце. Так как для л ю бого такого кольца К и лю бы х его элементов a, x, y ax + ay = a (x + y ), (a x )y = a (x y ), то aK будет идеалом в К. Такой идеал назы ваю т главным иде­ алом, порожденным элементом a. Если каждый идеал I коль­ ца К главный, т. е. сущ ествует порож дающ ий его элемент a G I, такой, что I = a ^ то кольцо К называется кольцом главных идеалов. П р и м е р 4 .1 0 . Кольца Z и Z m при лю бом m G N являю тся кольцами главных идеалов. □
96 Глава 4. Кольца 4.3. Фактор-кольца В произвольном кольце K любой идеал I является подгруп­ пой аддитивной абелевой группы этого кольца. П оэтом у в силу теоремы 3.9 ф актор-м н ож ество K / I , элементы которого скла­ ды ваю тся по правилу (a + I ) + (Ь + I ) = (а + Ь) + I, (4.2) будет абелевой группой. На этом ф актор-м н ож естве введем опе­ рацию умножения, полагая, что (a + I )(Ь + I ) = ab + I. (4.3) Эта операция ассоциативна, что легко следует из ассоциативно­ сти умножения в K, а так как для лю бы х ii, i 2 из I ((a + ii) + I )((b + 22) + I ) = (a + i 1)(b + 22) + I = = ab + i 1b + a i2 + I = ab + I, то результат умножения не зависит от вы бора представителей см еж ны х классов. Следовательно, операция умножения опре­ делена корректно, и ф актор-м н ож ество K / I будет полугруппой относительно этой операции. Для операций сложения и умнож е­ ния на K / I справедливы законы дистрибутивности, что нетруд­ но видеть из следую щ их равенств: (a + I )((b + I ) + (c + I )) = (a + I )((b + c) + I )) = = a(b + c) + I = = ab + ac + I = ab + I + ac + I = = (a + I )(b + I ) + (a + I )(c + I ). Таким образом, ф актор-м н ож ество K / I с операциями (4.2) и (4.3) будет кольцом. Оно называется фактор-кольцом кольца K по идеалу I . П одводя итог, видим, что аналог теоремы 3.9 для групп и их нормальных подгрупп имеет место для колец и их идеалов.
4.3. Фактор-кольца 97 Т е о р е м а 4 .5 . Ф акт ор-м нож ест во кольца K по идеалу I яв­ ляет ся кольцом. Д ве следующ ие теоремы о гом ом орф изм ах колец делаю т о т ­ меченную аналогию м еж ду нормальными подгруппами и идеа­ лами более полной. Т е о р е м а 4 .6 . П уст ь I — идеал в кольце K . Тогда сущ ест ву­ ет гомоморфизм f : K ^ K / I , ядром, которого являет ся иде­ ал I. Д о к а з а т е л ь с т в о . Рассмотрим отображ ение f : а ^ а + I, ставящ ее в соответстви е элементу а смеж ный класс, котором у он принадлежит. Так как f (a i + a2) = ai + a2 + I = ai + a2 + I + I = = ai + I + a 2 + I = f (a i) + f (a 2), f (a ia 2) = a ia 2 + I = (ai + I )( a 2 + I ) = f ( a i ) f (a 2) для лю бы х ai и a 2 из K, то f сохраняет операции и поэтом у является гом ом орф изм ом . Теорема доказана. Т е о р е м а 4 .7 . П уст ь f : K ^ K кольцо K — гомоморфизм кольца K в c ядром, I . Тогда K / I = I m f . Д о к а з а т е л ь с т в о . Рассмотрим отображ ение р : a + I ^ ^ f (а), ставящ ее в соответстви е см еж ном у классу a + I об­ раз элемента а при гом ом орф изм е f . Из свойства сохранения операции гом ом орф изм ом следует, что p ( ( a i + I ) + (a 2 + I )) = p ((a i + a 2) + I ) = f (ai + a 2) = = f (a i) + f (a 2) = p (a i + I )+ p ( a 2 + I ), p ( ( a i + I )(a 2 + I )) = ^ ( a ia 2 + I ) = f (a ia 2) = = f ( a i ) f (a 2) = p (a i + I ) p ( a 2 + I ) для лю бы х ai и a 2 из K. П оэтом у p сохраняет операции и, таким образом, является гом оморф измом. Теперь покажем, что р — биективное отображ ение. Так как Im p = I m f в силу определения р, то оно сю ръективно. П окажем
Глава 4. Кольца 98 инъективность р. Д ействительно, если найдутся ai и a 2 такие, что р ^ + I ) = р ^ 2 + I ), то f (a i) = p (a l + I ) = р ^ 2 + I ) = f (a 2), и, следовательно, элементы a 1 и a 2 принадлежат одному и том у ж е см еж ном у классу кольца K по идеалу I , т. е. ai + I = a 2 + I . Таким образом, р ^ 1 + I ) = p ( a 2 + I ), если ai + I = a 2 + I . Теорема доказана. 4.4. Кольцо многочленов 1. О с н о в н ы е с в о й с т в а . П усть K — кольцо, x — переменная, n — целое неотрицательное. Выражение anx n + an -1 x ra-i + ■■■+ a^x* + ■■■+ a kx + ao с коэффициентами ao, a i , . . . , an из кольца K назовем м ногочле­ ном a (x ) над кольцом K степени n относительно переменной x, если an = 0. Степень многочлена a (x ) обозначим через deg a (x ). С уммой многочлена a (x ) = anx n + an - ix ra-i + ■■■+ ao степени n и многочлена b(x) = bmx m + bm -1x m -i + ■■■ + b0 степени m называется многочлен сгx r + cr - lXr-1 + ■■■+ со, где с* = a* + b* и r = m ax(n, m ). Произведением этих многочленов называется многочлен dkxk + dk- 1 x k -i + ■■■ + do , где d* = a*b0 + ai-1 bk+ + ■■■+ aob* и k = n + m. Н етрудно проверить, что определенные так сумма и произведение многочленов удовлетворяю т свойству дистрибутивности и другим аксиомам кольца. Значением a (a ) многочлена a (x ) = anx n + an - ix ra-i + ■■■+ + a o на элементе а £ K называется такой элемент в кольца K, что в = ana n + an - i a ra-i + ■■■ + ao. К орнем многочлена a(x ) называется элемент а £ K, для которого a (a ) = 0. Будем говорить, что многочлен a (x ) делится на многочлен b(x) = 0, если сущ ествует такой многочлен ^ x ) , что a (x ) = = b (x )^ x ). Если многочлен a (x ) делится на многочлен b(x), то многочлен b(x) будем называть делителем a (x ), и будем гово­ рить также, что b(x) делит a (x ) (обозначение b(x) |a (x )).
4.4. Кольцо многочленов 99 М нож ество, состоящ ее из всех многочленов лю бой конечной степени над K называется кольцом многочленов K[x]. Нетрудно показать, что K[x] будет кольцом, содерж ащ им кольцо K . Б о­ лее того, если K — кольцо без делителей нуля, то и K[x] будет кольцом без делителей нуля. Д ействительно, если произведение многочлена a (x ) степени n и многочлена b(x) степени m равно нулю, то равен нулю и коэф ф ициент anbm при старшей степе­ ни произведения, что, очевидно, невозмож но, так как an и bm элементы кольца без делителей нуля. Если кольцо коэф ф ициентов K является полем, то в кольце многочленов над K справедлива теорема об однозначности де­ ления с остатком , аналогичная теореме о делении с остатком в кольце целых чисел. Т е о р е м а 4 .8 . П уст ь F — некоторое поле. Тогда для любых многочленов a (x ),b (x ) G F[x], где d e g b (x ) > 0, сущ ест вую т и притом единст венные многочлены q (x ), r (x ) G F[x], такие, что a (x ) = b(x) ■q (x) + r (x ), d e g r (x ) < d e g b (x ). (4.4) М ногочлен r (x ) называется остатком, а q(x) — неполным частным при делении a (x ) на b(x). Д о к а з а т е л ь с т в о . Обозначим n = deg a (x ), m = deg b(x), и пусть a (x ) = ^П= о aix i , b(x) = bix i . М ож но считать, что n > m > 0, так как все остальные случаи либо сводятся к это­ му, либо являю тся тривиальными. Заметим, что старш ие к оэф ­ фициенты an , bm не равны нулю, п оэтом у сущ ествует b^1 G F. Обозначим а(ж) = a (x ) — b(x) ■anbm1x n -m G F[x]. К оэф ф ициент при x n в разности a (x ) —b(x) ■anbm1x n -m равен an —bm ■anbm1 = 0, п оэтом у deg a (x ) < n. Получили равенство a (x ) = b(x) ■anbm1x n -m + a (x ), deg a (x ) < n. Применив по индукции эти рассуж дения к а(ж) и b(x), найдем такие q ( x ) ,r ( x ) G F[x], для к оторы х а(ж) = b(x) ■ q(x) + r (x ), причем deg q < n —m и deg r < m. Тогда q(x) = anbm1x n -m + q(x) и r (x ) д аю т искомое представление (4.4).
100 Глава 4. Кольца Теперь докаж ем единственность представления (4.4). Д оп у­ стим, что a = bq + r = bq' + r', 0 ^ deg r < deg b, 0 ^ deg r ' < deg b. Т огда b (q —q') = r ' —r. Но d e g (r' —r) < deg b, а deg b(q—q') ^ deg b при q — q' = 0. П ротиворечия не будет только в случае, когда q = q' и r = r'. Теорема доказана. П усть F — поле. Если коэф ф ициент при старшей степени многочлена над полем F равен единице, то многочлен называ­ ется нормированным. Без доказательства приведем следующ ее очевидное утверждение. Т е о р е м а 4 .9 . П уст ь F — поле. Тогда F[x] — коммутативное кольцо с единицей и без делителей нуля. Применяя в кольце многочленов теорему о делении с остат­ ком, мож но легко убедиться, что если F — поле, то F[x] — кольцо главных идеалов. Д оказательство этого ф акта аналогично дока­ зательству того, что каж дый идеал кольца Z главный. Л ю бой многочлен c (x ), который делит многочлены a (x ) и b(x), называется общ им делителем этих многочленов. Н орми­ рованный многочлен наибольшей степени среди общ их дели­ телей многочленов a (x ) и b(x) называется их наибольшим об­ щ им делителем (сокращ енно Н ОД ) и обозначается символом (a (x ), b (x )). М ногочлены, не имеющие общ их делителей ненуле­ вой степени, называются взаимно прост ым и. Л егко видеть, что (a (x ), b (x)) = 1 для лю бы х взаимно п росты х многочленов a (x ) и b(x). Т е о р е м а 4 .1 0 . П уст ь F — поле. Тогда для любых ненулевых многочленов a (x ) и b(x) над полем F ненулевой нормированный многочлен минимальной ст епени d (x ), удовлет воряющ ий ра­ венст ву d (x ) = a (x )s (x ) + b (x )t(x ), (4.5) где s (x ) и t(x ) — многочлены над F, являет ся наибольшим об­ щ им делителем многочленов a (x ) и b(x).
4-4- Кольцо многочленов 101 Д о к а з а т е л ь с т в о . Покажем, что a (x ) делится на d (x ). П ред­ ставим a (x ) в виде a (x ) = p (x )d (x ) + q (x ), где d e g q (x ) < d e g d (x ). Тогда q(x) = a (x ) — p (x )d (x ) = a (x ) — p (x )(a (x )s (x ) + b (x )t(x )) = = a (x )(1 — p (x )s (x )) — b (x )(p (x )t(x )) = a (x )s '(x ) + b (x )t'(x ), где s '(x ) = 1 —p (x )s (x ) и t'(x ) = —p (x )t(x ). Так как d (x ) — нену­ левой нормированный многочлен минимальной степени, удовле­ творяющ ий (4.5), то q (x ) = 0 и, следовательно, a (x ) делится на d (x ). Аналогичны м образом доказывается делим ость на d(x) многочлена b(x). Следовательно, d (x ) является общ им делите­ лем многочленов a (x ) и b(x). Теперь покажем, что d (x ) будет наибольшим общ им делителем. Д ействительно, если a (x ) и b(x) делятся на d (x )d ; (x ), где d e g d ;(x ) > 0, то в (4.5) правая часть будет делиться на d (x )d ;(x ), а левая не будет. Следовательно, d (x ) = ( a (x ),b (x )). Теорема доказана. М ногочлен p (x ) называется неприводимым над полем F, ес­ ли из равенства p (x ) = a (x )b (x ), где a (x ),b (x ) G F[x], следует deg a (x ) = 0 или deg b(x) = 0. Из определения неприводимого многочлена легко следует, что лю бой многочлен мож но пред­ ставить в виде произведения неприводимых многочленов, на­ пример, в Z 2 [x] имеет место равенство х 4 + x = x (x + 1 )(x 2 + x + 1). Л е м м а 4 .3 . Если произведение a (x )b (x ) многочленов a (x ) и b(x) над полем F делится на неприводимый многочлен p (x ), то хот я бы один из сом нож ит елей т акж е делится на p (x ). Д о к а з а т е л ь с т в о . Д опустим, что утверж дение леммы невер­ но. Тогда ни один из сомнож ителей не делится на p (x ). Следова­ тельно, ( a ( x ),p (x )) = 1 и (b (x ),p (x )) = 1, и из теоремы 4.10 сле­ дует, что найдутся такие многочлены S i(x ),S 2 (x ) и t i ( x ) , t 2 (x ), что 1 = s 1(x )a (x ) + s2(x )p (x ), 1 = t 1(x )b (x ) + t2(x )p (x ).
102 Глава 4. Кольца Перемножив эти равенства, получим 1 = ( s ^ x ^ x ) + s 2(x )p (x )) ■(ti ( х )Ь(х ) + t2(x )p (x )) = = ( s i (х)^i (х )) ■a (x )b (x )+ + ( « 2( х )^1( х )Ь(х ) + s ^ x ^ ^ x ^ x ) + s2(x )t 2(x )p (x )) ■p (x ), т. е. в силу теоремы 4.10 многочлены a (x )b (x ) и p (x ) взаимно просты . П ротиворечие. Лемма доказана. Л е м м а 4 .4 . Если произведение a i ( x ) a 2 (x) ■■■an (x) м ногочле­ нов a j(x ) надполем F делится на неприводимый многочлен p (x ), т о хот я бы один из сом нож ит елей т акж е делится на p ( x ) . Д о к а з а т е л ь с т в о . Л емму докаж ем индукцией по числу со ­ множителей. Случай п = 2 доказан в предыдущей лемме. Д о­ пустим, утверж дение леммы справедливо для лю бы х произве­ дений, содерж ащ их не более k сомнож ителей. Тогда если произ­ ведение (a i (x )a 2(x ) ■■■a^(x))afc+ i (x ) делится на p (x ), то из лем­ мы 4.3 следует, что либо a i (x )a 2(x) ■■■a^(х ), либо afc+ i (x ) делит­ ся на p (x ). В первом случае утверж дение леммы следует из пред­ положения индукции. Во втором случае справедливость леммы очевидна. Лемма доказана. Т е о р е м а 4 .1 1 . К аж ды й нормированный многочлен над по­ лем F единст венным, с т очност ью до порядка следования со­ м нож ит елей, образом, раскладывается в произведение норми­ рованных неприводим ых многочленов. Д о к а з а т е л ь с т в о . Далее все многочлены считаем нормиро­ ванными. Теорему докаж ем методом математической индукции. В основание индукции положим многочлены степени 1, един­ ственность разложения к оторы х очевидна. П редположим, что каж дый многочлен, степень которого не превосходит n, разла­ гается на неприводимые множители единственным образом. П о­ кажем, что из этого предположения следует единственность раз­ ложения л ю бого многочлена степени п + 1. Д ействительно, если некоторый многочлен t(x ) степени п + 1 имеет два различных разложения в произведение неприводимых сомнож ителей, то t(x ) = p^1( х ) ^ 2(х ) ■■■рПп (х ) = q f (x)q^2(х ) ■■■ (х ).
4-4- Кольцо многочленов 103 Покажем, что p i(x ) совпадает с одним из многочленов ^(ж ). Так как неприводимый многочлен p i(x ) делит произведение q i(x ) ■q i(x ) 42 (ж) ■■■42 (ж) ■..........■дт (ж) ■■■4т (ж ), '----------*----------''----------*----------' '-----------*-----------' s1 раз S2 раз sm раз (4.6) то в силу леммы 4.4 многочлен p i(x ) такж е делит один из его сомнож ителей. В (4.6) все сомнож ители — неприводимые много­ члены. Следовательно, p i (ж) совпадает с одним из них. Без огра­ ничения общ ности будем полагать, что p i(x ) = q i(x ). Сокращ ая левую и правую части равенства (4.6) на p i( x ), получим p^1- i (x )p ^ (ж) ••• рПп (ж) = ^ ^ ( ж ) ^ 2(ж) ••• 4^^ (ж). (4.7) По предполож ению индукции многочлен £(ж )/р!(ж ) раскладыва­ ется на неприводимые множители единственным образом. П о­ этом у в (4.7) n = m и для каж дого i G { 1 , . . . , n } справедливы равенства pi (ж) = %(ж) и ki = Si. Теорема доказана. Л е м м а 4 .5 (теорема Б езу). М ногочлен f (ж) полем F де­ лит ся на двучлен ж — а , где а G F, тогда и только тогда, когда f (а ) = 0. Значение многочлена f (ж) в точке а равно остатку от деления f (ж) на ж — а . Д о к а з а т е л ь с т в о . Если многочлен f (ж) делится на ж — а, то f (ж) = Л,(ж)(ж — а ). Тогда f (а ) = Л ,(а)(а — а ) = 0. С другой стороны , f (ж) = Л,(ж)(ж — а ) + в , и если f (а ) = 0 , то легко видеть, что в = 0. Следовательно, f (ж) делится на ж — а . Лемма доказана. Т е о р е м а 4 .1 2 . М ногочлен f ст епени n над полем F имеет в поле F не более n корней. Д о к а з а т е л ь с т в о . Теорему докаж ем индукцией по степени многочлена. Очевидно, что ненулевой многочлен нулевой степе­ ни не имеет корней. Э тот случай (deg f = 0) положим в основа­ ние индукции. Д опустим , что утверж дение теоремы справедли­ во для всех многочленов степени не более k. П усть deg f = k + 1.
104 Глава 4. Кольца Если многочлен f (ж) в поле F не имеет корней, то утверж де­ ние теоремы очевидно. П усть а — корень многочлена f (ж). Т о­ гда в силу леммы 4.5 многочлен f (ж) делится на ж — а, т. е. f (ж) = h (x )(x — а ), где многочлен k-й степени h (x ) по предполо­ ж ению индукции имеет в F не более k корней. Следовательно, f имеет в поле F не более k + 1 корней. Теорема доказана. При доказательстве теорем 4.8—4.12 бы ло сущ ественно, что множ ество коэф ф ициентов K является полем. В случае, когда K не является полем, все они, вообщ е говоря, неверны. Д ействительно, пусть, например, K = Z 6 . К ольцо ^б[ж] яв­ ляется ассоциативным, коммутативным кольцом с единицей, но, как и Z6, содерж ит делители нуля: например, 2ж ■3ж = 0. В рассматриваемом кольце для ж2 и 2ж не сущ ествует та­ ких многочленов д(ж) и г(ж), что ж2 = 2ж ■д(ж) + г(ж)и d e g r < < deg2ж = 1, иначе для старш его коэффициента a G Z6 част­ ного д(ж) долж н о бы ть выполнено равенство 2а = 1, но вычет 2 необратим в Z6. А для многочленов 2ж3 и 2ж2 + 2ж + 1 таких пар (q, r) несколько: 2ж3 = (2ж2 + 2ж + 1)(ж + 5) + ж + 1 = = (2ж2 + 2ж + 1)(4ж + 2) + 4ж + 4. Таким образом, в Z 6 ^ ] неверна и теорема о делении с остатком . М ногочлен ж2 + 3ж + 2 имеет в Z6 четыре корня ж = 1, 2, 4, 5, что больше, чем его степень. В кольце Z 6 ^ ] он такж е неодно­ значно разлагается на неприводимые множители: ж2 + 3ж + 2 = = (ж + 1)(ж + 2) = (ж + 4)(ж + 5). Наконец, равенство (2ж2 + ж)(3ж + 1) + (2ж + 1)(ж2 + ж + 1) = 1 иллю стрирует неприменимость теоремы 4.10 в кольце Z ,^ ] : оба многочлена а(ж) = 2ж2 + ж = ж(2ж + 1) и Ь(ж) = 2ж + 1 делятся на Ь(ж), однако нормированного делителя максимальной степени у них нет. Таким образом, кольца Щж] и F[ж] имею т серьезные отличия. 2. Е в к л и д о в ы к о л ь ц а . Ф ормулировки и доказательства утвер­ ж дений о разложении в кольце многочленов очень похожи на аналогичные формулировки и доказательства в кольце целых
4.4. Кольцо многочленов 105 чисел. Э то не случайно, так как оба эти кольца являю тся ев­ клидовыми кольцами. Ц елостное кольцо (без делителей нуля) K называется евклидовым, если каж дом у его ненулевому элементу a поставлено в соответствие целое неотрицательное число A (a ) так, что: (1) A (ab ) ^ A (a ) для всех a, b = 0 из K; (2) для всех a, b = 0 из K сущ ествую т такие q, r £ K, что a = qb + r и A ( r ) < A (b ) или r = 0. В кольце целых чисел значение A (a ) совпадает с |a|, а в кольце многочленов равно степени многочлена. В целостном кольце необратимый элемент p называется про­ ст ым , если не сущ ествует таких необратимы х элементов a и b, что p = ab. На множ естве ненулевых элементов целостного коль­ ца отнош ение делимости определяется аналогично отнош ениям делимости в кольце целых чисел и кольце многочленов. Наи­ больш им общим делителем элементов a и b целостного кольца называется их общ ий делитель, делящийся на все общ ие делите­ ли этих элементов. Н етрудно показать, что в евклидовом кольце для лю бы х ненулевых элементов a и b сущ ествует их наиболь­ ший общ ий делитель, обладающ ий такими ж е свойствами, что и наибольшие общ ие делители в Z и F[x]. Ц елостное кольцо называется факториальным, если каждый его ненулевой элемент a м ож но представить в виде произведе­ ния a = bp^11p22 ■■■ рПп, (4.8) где b — обратим ы й элемент, а различные п росты е элементы P i,P 2 , . . . ,p n определены однозначно с точ н остью до обратим ы х множителей. В кольце Z есть ровно два обратим ы х элемента 1 и — 1, п оэтом у каж дое число p*, являющееся просты м элементом кольца Z в разложении (4.8) целого числа a, определено с точн о­ стью д о множ ителя ± 1 . Следуя доказательствам утверждений данного раздела, нетрудно показать, что лю бое евклидово коль­ цо является ф акториальным.
Глава 4. Кольца 106 4.5. Арифметика многочленов Из доказательства теоремы 4.8 извлекается известный со школы алгоритм деления многочленов в столбик (уголком). П р и м е р 4 .1 1 . Рассмотрим многочлены a (x ) = x 5 + 2 x 4 + 2 x 3+ + x + 1 и b(x) = x 4 + x 2 + 2x + 2 над полем Z 3 и найдем неполное частное q (x) и оста ток r (x ) о т деления a (x ) на b(x). При делении в столбик удобно записывать не сами многочлены, а только их коэф фициенты, объединенные в упорядоченный набор, называе­ мый век тор ом 1). Так, например, многочлен a (x ) представляется вектором 122011 . С оответствие м еж ду многочленами и вектора­ ми их коэф ф ициентов взаимно однозначно, если договориться записывать старш ие коэф ф ициенты слева. Для сравнения при­ ведем деление a (x ) на b(x) в стандартной записи и в векторной, которая, очевидно, более компактна: x 5 + 2x 4 + 2x 3 + x + 1 x 4 + x 2 + 2x + 2 5 + x 3 + 2x 2 + 2x x x +2 2 x 4 + x 3 + x 2 + 2x + 1 2x 4 + 2x 2 + x + 1 x 3 + 2x 2 1 2 201 1 10122 1 0122 12 21121 20211 + 1210 Таким образом, q(x) = x + 2 = 12 и r (x ) = x 3 + 2 x 2 + x = 1210 . Следовательно, x 5 + 2 x 4 + 2 x 3 + x + 1 = (x 4 + x 2 + 2 x + 2 )(x + 2 ) + x 3 + 2 x 2 + x, или 122011 = 10122 ■ 12 + 1210 в векторной записи. Ниже, тож е в векторной ф орм е, приведено умножение и сло­ жение полученных многочленов, которы е м ож но считать про^Векторам и векторным пространствам посвящена глава 5. Здесь мы не будем забегать вперед и ссылаться на пример 5.5, векторное представле­ ние многочлена будет пока использоваться нами только в целях укорочения его записи. Арифметика таких «векторов» является арифметикой просто переобозначенных по-другому многочленов.
4.5. Арифметика многочленов 107 веркой правильности деления: 10122 X 12 +121101 1210 20211 10122 122011 121101 □ Полезно знать, что умножение и деление в столбик явля­ ю тся не наилучшими по числу затраченных операций в поле коэф ф ициентов алгоритмами. Их широкая распространенность обусловлена главным образом простотой реализации и привыч­ н остью (дан ью традициям). Начиная со второй половины X X в. бы ло разработано много альтернативных м етодов^ (алгоритмы Карацубы, Тоома, Ш ёнхаге — Ш трассена, Ф юрера и пр.). Для многочленов больш ой степени их сл ож ность гораздо меньше, чем у умножения — деления в столбик. Далее для удобства будем использовать введенную выше векторную запись n многочлена а(ж) G F ^ ] уж е без пояснений, особенно когда из контекста ясно, что вектор является вектором коэффициентов н екоторого многочлена. П р и м е р 4 .1 2 (схема Горнера). Удобный сп особ вычисления значения многочлена f (ж) = апжп + . . . + а ^ + ао G F ^ ] в точке ж = а G F вытекает из следую щ его равенства: f (а ) = ( ( . . . (((а п а + а п - ^ а + ап-2 ) а + an- з ) . . .)а + а ^ а + ао, полученного последовательным вынесением за скобки общ их множителей одночленов. Он сводится к рекуррентному вычис­ лению последовательности bo = ап, bi = Ьоа + a n -i, х)См. [5, 23, 29, 30]. ... b = Ь ^ а + a n -i, i ^ n. (4.9)
108 Глава 4- Кольца По индукции нетрудно установить, что ее последний член bn яв­ ляется искомым значением f (а ). Такж е легко видеть, что эле­ менты последовательности {b i} совпадаю т с коэффициентами неполного частного д(ж), вычисляемого при делении в столбик f (ж) на ж — а (bo является старш им коэффициентом, а bn - i — свободны м членом q (x )). Результат работы принято записывать таблицей вида bo bi ai b2 bn-1 ao )а ( f( an-1 n b an 2 n а Из (4.9) следует мнемоническое правило: каж дый элемент ее нижней строки (начиная с bi) равен сумме соседа сверху с про­ изведением соседа слева на а . По теореме Безу данное вычисле­ ние значения f (а ) является одновременно вычислением остатка о т деления f (ж) на ж — а и, как оказывается, заодно и неполного частного. В качестве примера найдем значение многочлена f (ж) = ж8+ +4ж 7 + 2ж5 + ж4 + ж3 + 3ж + 2 в точке ж = 3 над полем Z 5: 3 1 4 0 2 1 1 0 3 2 1 2 1 0 1 4 2 4 4 Таким образом, f (3) = 4. П опутно мы установили, что (в векторной записи) 140211032 = 12101424 ■ 12 + 4. Схема Горнера использует n = deg f сложений и n ум но­ жений коэф ф ициентов в поле F. М ож но показать1) , что данное число операций является минимально возмож ны м для л ю бого алгоритма, находящ его f (а ) и не использующ его деление в по­ ле F. Таким образом, схема Горнера оптимальна для вычисления f (ж) в одной точке. Д ля вычисления значений f (ж) одновремен­ но в m точках при больш ом m сущ ествую т сп особы с меньшей сл ож ностью , чем независимое вычисление в каж дой точке по отдельности, например, бы строе преобразование Ф урье2). □ х)См. [1, с. 227—232]. 2)См. [3, 5, 23, 30].
4.5. Арифметика многочленов 109 Из теоремы 4.8 о делении с остатком в кольце многочле­ нов F[x], где F — поле, следует, что для вычисления Н О Д много­ членов м ож но применять те ж е способы , что и для вычисления Н О Д в кольце Z (см. с. 30—32). В частности, аналогично лем­ ме 2.1 доказывается следующ ее утверж дение, в котором , как и ранее, запись (X , Y, Z ) — Q ( X ', Y ', Z ') означает упорядоченную трой ку ( X — Q X ', Y — Q Y ', Z — Q Z '), только уж е не чисел, а многочленов. Л е м м а 4 .6 . П уст ь a (x ),b (x ) G F[x], d e g a (x ) ^ d eg b (x ) и b(x) = 0. Рассмот рим последоват ельност ь троек м ногочле­ нов ( X i,Y ;,Z i ) над полем F, такую, что ( X - i ,Y - i , Z - i) = = (1, 0, a (x )), ( X o , Yo, Zo) = (0 ,1 , b(x)) и /X A /X i - 2 \ /X i-i\ I Yi I = I Yi-2 I — Qi I Yi-1 I \ zJ \ Z i - 2j при i ^ 1, где Qi = |_Zi_2/Z i_ iJ \ Z i-i) — неполное частное от деле­ ния многочлена Z _ на Z i_ i. Тогда сущ ест вует наим еньш ее такое n ^ 0, что Z n+ i = 0, и многочлен Zn являет ся с точ­ ност ью до пост оянного нормирующ его м нож ит еля наиболь­ ш им общим, делителем многочленов a (x ) и b(x). Более того, a ■X i + b ■Yi = Zi при всех i ^ —1. В частности, a ' X n + b ■Yn = Z n. (4.10) М ногочлены последовательности Z i , . . . , Z n из леммы 4.6 — это остатки алгоритма Евклида. Значит, на последнем шаге име­ ем Z n | Н О Д ^ , b) и Н О Д ^ , b) | Z n . О статок о т деления да­ ж е нормированных многочленов не обязательно нормирован, а НОД, по нашему определению, долж ен иметь старший коэф ф и ­ циент 1. П оэтом у если c G F, c = 0 — старший коэф ф ициент многочлена Z n (x ), то делением обеих частей (4.10) на c получа­ ем равенство a ■X n + b ■^ = Z n = Н О Д (a ,b ), c c c (4.11)
Глава 4. Кольца 110 гарантированное нам теоремой 4.10. О тметим, что равенству (4.5) теоремы 4.10 удовлетворяет бесконечное число пар мно­ гочленов s ( x ) ,t ( x ) G F[x]. М ногочлены s(x ) и t(x ) (в частности многочлены X n/ c и Yn/ c ) , как и в случае целочисленной линей­ ной комбинации, называются коэффициентами Безу. Справедливо следующ ее утверж дение. Л е м м а 4 .7 . Степени найденных алгоритмом леммы 4.6 ко­ эффициентов X n/ c и Yn/ c являют ся наим еньш им и из всех возм ож н ы х ст епеней коэффициентов Б езу s, t для м ногочле­ нов a, b в равенст ве (4.5). П р и м е р 4 .1 3 . Найдем Н О Д и коэф ф ициенты Безу для мно­ гочленов a (x ) = x 5 + 2x 4 + 2 x 3 + x + 1 = 122011 и b(x) = = x 4 + x 2 + 2 x + 2 = 10122 над полем Z 3 аналогично тому, как сделали это для чисел в примере 2.2. Первый шаг леммы 4.6 (деление с остатком Z _ i = a на Zo = b) был проделан в приме­ ре 4.11. О тсю да Q i = 12 , X i = 1 — 12 ■0 = 1 и Yi = 0 — 12 ■1 = 2 1 . Переходим к шагу i = 2. Поделив с остатком Zo на Z i, полу­ чаем Q 2 = 11 , Z 2 = 112 и 10122 = 1210 ■ 11 + 112 , откуда Х 2 = 0 — 11 ■ 1 = 2 2 , Y2 = 1 — 11 ■21 = 100 . Д ействуя и далее подобным образом, заполним таблицу: 1 0 1 22 122 2102 0 1 21 100 2221 11220 122011 10122 1210 112 11 2 0 В данном случае число делений n оказалось равно 4 (так как Z 5 = 0, Z 4 = 0). В силу d e g Z 4 = 0 многочлены a (x ) и b(x) вза­ имно просты . Из последнего столбца таблицы по формуле (4.10) имеем 122011 ■2102 + 10122 ■11220 = 2 . Найденный многочлен Z 4 = 2 не нормирован, следовательно, поделив обе части последнего равенства на его старший к оэф ­ фициент с = 2 , получим a (x ) ■1201 + b(x) ■22110 = (a (x ),b (x )) = 1. (4.12)
4.5. Арифметика многочленов 111 Таким образом, многочлены х 3 + 2 х 2 + 1 и 2х4 + 2х3 + х 2 + х являю тся искомыми коэффициентами Безу. □ Л е м м а 4 .8 . П уст ь a (x ),b (x ) G F[x] и d eg b (x ) ^ d e g a (x ) ^ ^ N . Тогда число операций поля IF, потраченное для вычисле­ ния наибольшего общего делителя (a (x ),b (x )) и коэффициентов Б езу алгоритмом леммы 4.6, не превосходит по порядку вели­ чины N 2. Д о к а з а т е л ь с т в о . Д ействительно, из равенств —- l = Q l —0 + —Ъ —0 = Q 2—l + —2, следует, что ... —n -2 = Q n —n - l + —n n Z - i = Z n - i П Qi + h (x ), i=l где h (x ) — некоторый многочлен, степень которого стр ого мень­ ше N = deg Z - 1. П оэтом у n n z —h deg Ц Qi = deg Qi = deg ——------ < N . i=i i= i -n -i Ч тобы найти коэф ф ициенты представления —i- 2 = Q i—i- i + —i, достаточн о O (d eg —i- 2 ■deg Q i) операций поля F при использова­ нии деления в столбик. П оследовательность степеней остатков алгоритма Евклида монотонно убывает: deg —i < deg —i- i. О т­ сю да следует, что сл ож ность вычисления всех коэф ф ициентов последнего ненулевого остатка —n не превосходит по порядку величины n n ^ deg —i - 2 ■deg Qi < N ^ deg Qi ^ N 2. i= l i=l А налогично получаю тся квадратичные оценки слож ности и для нахождения X n , Yn. Лемма доказана. П р и м е р 4 .1 4 . Найдем все неприводимые многочлены над по­ лем Z 2 , степень к оторы х не превосходит четырех.
112 Глава 4. Кольца Из определения неприводимого многочлена следует, что все многочлены первой степени неприводимы. Над полем Z 2 их име­ ется всего два: это многочлены / i ( x ) = x и /2 (ж) = x + 1. Среди многочленов второй степени и выше уж е есть приво­ димые, например x n = x n - i ■x. Тем не менее для многочленов степени 2 и 3 имеется очень простой сп особ проверки приводи­ мости. Его дает выш еупомянутая теорема Безу: если / G F[x] и deg / ^ 3, то многочлен / неприводим над F в том и только в том случае, когда он не имеет корней в поле F. В самом де­ ле, если / = gh — приводим, то d e g g ,h ^ 1, что в сочетании с неравенством deg / ^ 3 дает deg g = 1 или deg h = 1, а много­ член первой степени всегда имеет корень в поле коэффициентов. О сталось вы брать среди всех нормированных многочленов сте­ пени 2, а именно среди многочленов 2 x 2, x2 2 + 1, x2 2 + x, x2 2+ x + 1 те, у которы х нет корней в Z 2 . Таким, а значит неприводимым, будет единственный многочлен / 3(x ) = x 2 + x + 1. В м есто того, чтобы перебирать все нормированные много­ члены третьей степени1) (а их всего 23 = 8), заметим, что 0 — корень многочленов с нулевым свободны м членом и только их, а единица является корнем многочлена из Z 2 [x] тогда и только тогда, когда число слагаемых в нем четно. Из восьми многочле­ нов третьей степени только два имею т нечетное число одночле­ нов и одновременно ненулевой свободный член, это многочлены / 4(x ) = x 3 + x + 1 и / 5(x ) = x 3 + x 2 + 1. Из шестнадцати многочленов 4-й степени только четыре не имею т корней в Z 2 : x 4 + x + 1, x 4 + x 2 + 1, x 4 + x 3 + 1, x 4 + x 3 + x 2 + x + 1. Теперь, однако, этого недостаточно для неприводимости: при­ водимый многочлен 4-й степени мож ет являться произведением ^ Легко видеть, что число нормированных многочленов степени n над конечным полем Fq равно qn, а число всех многочленов степени n равно (q — 1)qn (старший коэффициент не может быть нулем).
4.5. Арифметика многочленов 113 двух неприводимых многочленов 2-й степени и не иметь кор­ ней в поле коэф ф ициентов. Так как неприводимый многочлен 2-й степени у нас один, то приводимый многочлен 4-й степени без корней в Z 2 такж е единственен и является его квадратом, в частности это многочлен (ж2 + ж + 1)2 = ж4 + ж2 + 1. Значит, остальные многочлены f 6 ^ ) = ж4 + ж + 1, f z ^ ) = ж4 + ж3 + 1 и f s ^ ) = ж4 + ж3 + ж2 + ж + 1 неприводимы. Иных неприводимых многочленов, кроме f i , . . . , f s , в заданном диапазоне степеней нет. □ Результаты вычислений примера 4.14 составляю т часть при­ водимой ниже таблицы неприводимых над Z 2 многочленов сте­ пени не больш е 5. Таблица Неприводимые многочлены над Z 2 степени ^ 5 полином векторное представление степень 1 ж ж+ 1 10 11 степень 2 ж2 + ж + 1 111 степень 3 ж3 + ж + 1 ж3 + ж2 + 1 1011 ж4 + ж + 1 10011 ж4 + ж3 + 1 ж4 + ж3 + ж2 + ж + 1 11001 11111 ж5 + ж2 + 1 ж5 + ж3 + 1 100101 101001 ж5 + ж3 + ж2 + ж + 1 ж5 + ж4 + ж2 + ж + 1 101111 110111 ж5 + ж4 + ж3 + ж + 1 ж5 + ж4 + ж3 + ж2 + 1 111011 111101 степень 4 степень 5 1101 П усть f — многочлен степени n. Покажем, что f неприводим тогда и только тогда, когда он не делится ни на какой непри­ водимый многочлен степени |^nJ и менее. Д ействительно, если
114 Глава 4- Кольца f неприводим, то он не делится ни на какой многочлен мень­ шей степени, в том числе неприводимый. Если ж е f приводим, то f = gh, где deg g ^ 1 и deg h ^ 1. Так как deg g + deg h = n, то степень одного из многочленов g и h не превыш ает n /2 . П усть для определенности это многочлен g. Если он неприводим, то мы нашли у многочлена f искомый неприводимый множитель степени не более n /2 . В случае, когда g приводим, в качестве иском ого множ ителя м ож но взять лю бой неприводимый мно­ ж итель g — он имеется, так как каж дый многочлен разлагается в произведение неприводимых, и степень этого множ ителя не превосходит d e g g ^ n /2 . П оэтом у для проверки многочлена степени n на приводи­ м ость достаточн о проверить его делим ость на каж дый неприво­ димый многочлен степени не выше n /2 : если он не делится ни на один из них, то он неприводим^. Для этого мож но восполь­ зоваться заранее вычисленной таблицей неприводимых м ного­ членов. Например, таблица на с. 113 позволяет проверять на неприводимость все многочлены над Z 2 вплоть д о 11-й степени. П р и м е р 4 .1 5 . Проверим многочлен f (ж) = ж9 + ж4 + 1на неприводимость над Z 2. Так как f (0) = 0 и f (1) = 0, то f (ж) не делится ни на ж, ни на ж + 1. Д елим ость на остальные неприво­ димые многочлены проверим делением с остатком . В результате получим следующ ие равенства: 1000010001 = 111 ■11011101 + 10, 1000010001 = 1011■1011110 + 11, 1000010001 = 1 1 0 1 ■ 1 1 1 0 1 1 1 + 1 0 , 1000010001 = 1 0 0 1 1 ■ 1 0 0 1 1 1 + 1000, 1000010001 = 11001 ■ 111100 + 1101, 1000010001 = 11111 ■ 110000 + 00001. Ни один из шести остатков не равен нулю, т. е. f (ж) не делится ни на какой неприводимый многочлен степени 4 и менее, поэтом у f (ж) неприводим. □ ^Имеются и более эффективные способы проверки приводимости, ос­ нованные на строении конечных полей, см. пример 8.7.
4.6. Число неприводимых многочленов 115 П р и м е р 4 .1 6 . Найдем число неприводимых нормированных многочленов второй степени над полем Z 19. Нормированный многочлен второй степени из Z i 9 [x] имеет вид x 2 + ax + b, где a, b G Z 19 произвольны. Л егко видеть, что сущ ествует ровно 192 = 361 таких многочленов. Если нормированный многочлен приводим, то он представляется произведением x 2 + ax + b = (x + c )(x + d) (4.13) двух нормированных двучленов, где коэф ф ициенты с, d леж ат в поле Z 19 и не обязательно различны. Значит, число приводимых нормированных многочленов равно числу различных представ­ лений вида (4.13). Если с = d, то имеется = 1 9 1 8 = 171 таких произведений, так как (x + c )(x + d) = (x + d )(x + с ) . Если с = d, то их ровно 19. Следовательно, число неприводимых нор­ мированных многочленов равно разности числа всех нормиро­ ванных многочленов и числа приводимых нормированных мно­ гочленов1), т. е. равно 192 — ( ( 1f ) + 19) = 171. □ Аналогично нетрудно установить, что в кольце Z p [x] имеется ровно р 2 — = (р) = 2 2 2 неприводимых нормированных многочленов второй степени, а значит при достаточн о больш их p вероятность неприводимости наугад выбранного нормирован­ ных квадратного трехчлена близка к 2 . В следую щ ем разделе мы убедимся, что найти точное число неприводимых нормиро­ ванных многочленов степени n даж е для больш их значений n достаточн о просто. 4.6. Число неприводимых многочленов Ч исло нормированных неприводимых над полем Z p много­ членов степени n из Z p [x] обозначим через N (р, n ). Найдем это число, установив ключевой результат — лемму 4.9 — при помо­ щи метода производящ их функций2). 1)Можно было сразу заметить, что число приводимых многочленов ви­ да (4.13) равно числу сочетаний с повторениями из 19 по 2. 2)Ниже утверждение леммы 4.9 будет получено без использования про­ изводящих функций в разделе 8.2.
116 Глава 4- Кольца Л е м м а 4 .9 . Д л я последоват ельност и N (p, n) справедливо рекуррент ное равенство pn = ^ m N (p , m ). m |n (4.14) Д о к а з а т е л ь с т в о . П усть p im ,p 2m, . . . , p n (p,m)m — все непри­ водимые нормированные многочлены степени m. Н етрудно ви­ деть, что, раскрывая скобки в произведении те N (p,m) П m=i П k=i ( 1 + p km + (pkm)2 + ■■■+ (pkmУ + . . . ^ , (4.15) получим сум м у всевозм ож ны х произведений неприводимых мно­ гочленов, причем каж дое произведение встретится в этой сум ­ ме ровно один раз. Так как каж дый нормированный многочлен единственным образом раскладывается в произведение неприво­ дим ы х нормированных многочленов, то в рассматриваемой сум ­ ме будет содерж аться ровно pn произведений степени n. К а ж д о­ му неприводимому многочлену степени m поставим в соответ­ ствие одночлен ж™-, а произведению (4.15) — произведение те N (p,m) П m= i П ( 1 + ж™ + ( ж™)2 + . . . + ( ж™)1 + •••) = k= i те s 1 ^ N(p,m) (4.16) П ( 1 — ж™ m=i Т ак как сущ ествует ровно pn многочленов степени n, у которы х коэф ф ициент при жп равен единице, то легко видеть, что в ряду, получившемся после раскрытия ск обок в (4.16), коэф ф ициент при жп будет равен pn . Следовательно, 1 те / 1 \ N(p,m) ---------- = П ( ------------ ) 1 — p^ 1 1 \1 m=i 4 — ж™ /7 . (4.17) Л огариф м ируя правую и левую части (4.17), получим новое ра­ венство ln 1 те 1 — p^ ^ m=i 1 N (p, m ) ln ’ 1 — ж™
4-6- Число неприводимых многочленов 117 Теперь, применяя ф орм улу ln = X m =i ” ж” , разложим в ряд правую и левую части последнего равенства: Е n РПж” = Е Е k N (p m ^ ™ = Ц Е n=1 m=1 fc=1 n=1 \fcm=n k N ^ m) ж” . / Приравнивая в получившемся равенстве коэф ф ициенты при n -й степени ж, находим -P n = n Е (P ,m ) = Е k fcm=n m N (p , m ). n m |n Л емма доказана. Для того чтобы из равенства (4.14) в явном виде выразить ф ункцию N (p, n ), воспользуемся ф ормулой обращения Мёбиуса, к оторую докаж ем далее в лемме 4.11. Сначала определим функ­ цию М ёбиуса 1, если n = 1; ju(n) = ^ ( —1)k, если n — произведение k п росты х чисел; 0, если n делится на квадрат п ростого числа, и покажем, что имеет место следую щ ее утверждение. Л е м м а 4 .1 0 . Справедливо равенство m |П 1, если n = 1; 0, если n > 1. Д о к а з а т е л ь с т в о . Если n = 1, то единица является един­ ственным делителем, и, следовательно, ^ (1) = 1. При n > 1 представим n в виде произведения п росты х чисел: n = р !1 ■■■p?r . Легко видеть, что в сумме (4.18) нуж но учиты вать только де­ лители без кратны х множителей. П оэтом у Е M m) = Е m |nfc=0 1^ii < —<ik Л емма доказана. Е ^ (pii ■■■ pik ) = Е Q fc=0 ( —1)k = 0.
118 Глава 4- Кольца Л е м м а 4 .1 1 (Обращение М ёбиуса). Функции f (n) и h (n ), определенные на м нож ест ве целых полож ит ельны х чисел, удо­ влет воряют равенст ву f(n ) = h (m ) m |n при всех n G N (4.19) тогда и только тогда, когда h (n ) = £ ^ ( ~ ) f (m ) m| n при всех n G N. (4.20) Д о к а з а т е л ь с т в о . Покажем, что из (4.19) следует (4.20). Для этого преж де всего заметим, что £ к m ) f <™>=s ^ < m )f ( m )■ m| n m| n так как суммы, стоящ ие в обеих частях равенства, отличаю тся только порядком следования слагаемых. Затем в правую часть последнего равенства вместо f (m ) подставим правую часть ра­ венства (4.19). Меняя в получившейся двойной сумме порядок суммирования и применяя лемму 4.10, получим следую щ ую це­ почку равенств: £ ^ ( m ) f ( m ) = £ ^ (m ) £ h(k)= m |n m |n k |— m = £ £ m In k I n m M m )h (k ) = =£ £ ^ (m )h (fc) = £ k |n m |n X ) M m )h (k ) = km In h(k) £ k |n ^ (m ) = h (n ). m |^ Таким образом, справедливость равенства (4.20) установлена. О братное утверж дение доказывается аналогично. Лемма дока­ зана. Т е о р е м а 4 .1 3 . Д ля числа N (p, n) неприводим ых м ногочле­ нов ст епени n справедливо равенство N (p ,n ) = 1 £ ^ ( — ) p m n m m| n
4.7. Кольцо остатков и поле многочленов 119 Д о к а з а т е л ь с т в о . Из леммы 4.9 следует, что первое равен­ ство леммы 4.11 справедливо при f (n) = pn и h (n ) = n N (p , n) для всех натуральных n. П оэтом у утверж дение теоремы следует непосредственно из леммы 4.11. Теорема доказана. 4.7. Кольцо остатков и поле многочленов М нож ество многочленов из Z p ^ ] степени не выше n — 1 с операциями сложения и умножения по модулю многочлена Л,(ж) степени n является кольцом. Оно называется кольцом остат­ ков по модулю Л,(ж) и обозначается Z p ^ / h ^ ) . Нетрудно видеть, что кольцо Z p ^ / h ^ ) изом орф но ф актор-кольцу K / I кольца K = Z p [ж] по идеалу I = hK, образованному всеми многочлена­ ми из Z p ^ ], кратными многочлену Л,(ж): элемент a G Z p ^ ] / h ^ ) представляет смеж ный класс а + 1 С Z p ^ ]. Очевидно, что коль­ цо Z p ^ / h ^ ) состои т из pn элементов, где n = d e g h(ж). Такж е нетрудно видеть, что Z p ^ ] / h ^ ) содерж ит в себе Z p как подкольцо и является коммутативным кольцом с единицей. Более того, справедлива следую щ ая теорема. Т е о р е м а 4 .1 4 . П уст ь p — простое и Л,(ж) — многочлен из Z p^ ] ст епени n. Тогда фактор-кольцо Z p [ж]/h(ж) являет ся по­ лем из pn элемент ов в том и только в том случае, когда Л,(ж) неприводим над полем Zp . Д о к а з а т е л ь с т в о . К ольцо Z ^ ^ h ^ ) является комм утатив­ ным кольцом с единицей и состои т из pn элементов. П оэтом у достаточн о показать, что любой ненулевой элемент этого коль­ ца имеет обратны й по умножению, если Л,(ж) неприводим. Так как ( f (ж),Л,(ж)) = 1 для л ю бого ненулевого f (ж) из Z ^ ^ h ^ ) , то в силу теоремы 4.10 найдутся такие многочлены з(ж) и £(ж), что 1 = s ^ ) f (ж) + ^ж)Л-(ж). П оэтом у f (ж)«(ж) = 1 (m od Л,(ж)), т.е. f (ж) имеет обратный элемент в Z p [ж]/h(ж). С другой стороны , если Л,(ж) = а(ж)Ь(ж), то а(ж) и Ь(ж) являю тся делителями нуля в кольце Z p [ж]/h(ж) в силу равен­ ства а(ж) ■ Ь(ж) = 0 (m od Л,(ж)). П оэтом у если многочлен Л,(ж)
120 Глава 4. Кольца приводим над Z p, то кольцо Z p [x ]/h (x ) не является полем. Тео­ рема доказана. Т е о р е м а 4 .1 5 . Д л я любого простого p и любого натураль­ ного n сущ ест вует конечное поле из pn элементов. Д о к а з а т е л ь с т в о . Сущ ествование поля из pn элементов для п ростого p и натурального n легко следует из теоремы 4.14 и сущ ествования в Z p [x] неприводимого над Z p многочлена любой степени n. В свою очередь сущ ествование такого многочлена яв­ ляется просты м следствием теоремы 4.13 о числе неприводимых многочленов. Действительно, по определению функции Мёби­ уса ^ ( m ) ^ —1 при всех m |n. Следовательно, N (p, n) = 1 Е ^ ( — ) p m ^ n m m|n ^ n ( ^ ( 1 ) ■ pn + Е ( —1)■ pm ) ^ n f p n — Е pm) = у m|n, m=n J \ m=0 / = 1 f pn — pn — 1 A = pn+l — 2pn + 1 ^ 1 n \ p —1 J n (p — 1) ^ n (p — 1) так как pn+ l ^ 2pn в силу того, что p ^ > 0 ’ 2. М ы доказали, что при всех натуральных n и при всех п росты х p величи­ на N (p, n) положительна. К ром е того, N (p, n) — целое число. Значит, N (p, n) ^ 1 и неприводимый многочлен степени n най­ дется в Z p [x] при всех n и p. Теорема доказана. П р и м е р 4 .1 7 . Найдем асимптотику числа N (p, n ) неприво­ дим ы х над Z p многочленов при n ^ то и фиксированном про­ стом p. Оценим N (p, n) сверху и снизу функциями с одинако­ вым асимптотическим поведением. Так, из теоремы 4.13 оче­ видно следует, что, во-первых, N (p, n) ^ pn/ n при всех n и p. В о-вторы х, N (p, n) ^ 1 (p n — npn/2j , так как у числа n не больш е n делителей, и наибольший сре­
4.7. Кольцо остатков и поле многочленов 121 ди них (отличный о т n) не превосходит n /2 . О тсю да сл е д у е т ^ , что N (p, n) ~ pn/ n при n ^ то. □ З а м е ч а н и е 4 .1 . О тметим, что из того, что N (p, n) ^ то при n ^ то, не следует, что N (p, n) > 0 при всех n, а тол ь­ ко при достаточн о больш их n. Иными словами, теорема 4.15 не является следствием рассм отренного выше примера. З а м е ч а н и е 4 .2 . П усть n > 1 и h (x ) = anx n + . . . + a i x + a0 — произвольный многочлен над Z p, не обязательно неприводимый. Рассмотрим ф актор-кольцо К = Z p [x ]/h (x ) и его элемент — вы­ чет2) [x] = [x]h. П одставим [x] в многочлен h (x ) в качестве ар­ гумента — это действие корректно, так как поле Z p коэф ф ици­ ентов многочлена h (x ) изоморф но влож ено3) в К: h([x]) = an[x]n + a n _i[x]n - i + . . . + ai[x] + ao = = [an][x]n + [an_i][x]n - i + . . . + [ai][x] + [ao] = = [anxn + . . . + a ix + ao] = [ f (x)] = [0]. М ы видим, что значение h([x]) является нулем кольца К . Та­ ким образом, каким бы ни был многочлен h, вычет [x] явля­ ется его корнем в кольце остатков по модулю h и вдобавок са­ мым «п р осто устроенны м » корнем среди всех остатков. П оэтом у определение корня многочлена, данное на стр. 98, м ож ет бы ть естественным образом обобщ ено с кольца его коэф ф ициентов на другие алгебраические структуры . Напомним, что запись f n ~ gn при n ^ то означает, что существует предел limn^ ^ f n/gn = 1. Согласно известной теореме из анализа (мажо­ ритарный признак сходимости последовательностей), если последователь­ ности an, bn и cn таковы, что an ~ cn и an ^ bn ^ cn при всех n, начиная с некоторого no, то bn ~ an и bn ~ cn. 2)Элементы кольца остатков Zp[x]/h(x) иногда обозначаются [g]h по аналогии с вычетами из Zn (стр. 41), чтобы подчеркнуть, по какому мо­ дулю берется вычет g. Также запись в квадратных скобках используется вместо обозначающей остаток по модулю записи g (mod n) или g (mod h) для компактности, например [—5]з = 1. Обычно, однако, квадратные скоб­ ки и индексы к ним опускаются, когда модуль и природа аргумента ясны из контекста. 3)Изоморфизм Zp с подкольцом в K определен равенством ip(a) = [a]h.
122 Глава 4. Кольца Теорема 4.14 позволяет задавать конечные поля в явном ви­ де и выполнять в этих полях операции сложения и умножения. Для задания поля из pn элементов выберем в Z p[x] неприво­ димый над Z p многочлен n -й степени h (x ). Элементы поля бу­ дем представлять в виде упорядоченны х наборов (an - i , . . . , ao) длины n с элементами из Z p. При этом операция сложения выполняется покомпонентно, а для умножения элементов a = = (an - i , . . . , ao) и b = (bn - 1, . . . , bo) надо вычислить произведе­ ние r (x ) = rn - 1x n - i + ■■■ + r 0 многочленов a (x ) = an - 1x n - 1+ + ■■■+ a 0 и b(x) = bn - 1x n - i + ■■■+ b0 по модулю многочлена h (x) и в качестве произведения ab взять набор (rn - i , . . . , ro) коэф ф и ­ циентов многочлена r (x ). П р и м е р 4 .1 8 . П остроим поле F из 27 элементов. Для этого понадобится неприводимый нормированный многочлен третьей степени из Z 3 [x]. Так как лю бой приводимый многочлен третьей степени над Z 3 имеет корень в Z 3 , то многочлен x (x + 1 )(x + 2) + + 1 = x 3 + 2 x + 1 будет неприводимым над Z 3 . П оэтом у в качестве поля F мож но взять ф актор-кольцо Z 3 [ x ]/(x 3 + 2x + 1). Элемен­ ты такого поля удобно представлять наборами коэф ф ициентов многочленов a 2x 2 + a ix + ao из Z 3 [x ] /(x 3 + 2 x + 1), т.е. наборами вида (a 2a ia o), где ai G Z 3 . Найдем сум м у и произведение эле­ ментов ( 111 ) и ( 2 2 0 ). Л егко видеть, что ( 111 ) + ( 2 2 0 ) = ( 0 0 1 ). Далее, так как (x 2 + x + 1)(2x 2 + 2x ) = 2x 4 + x 3 + x 2 + 2 x = = (x 3 + 2 x + 1)(2x + 1) + (x + 2 ), то ( 111 ) ■ ( 2 2 0 ) = ( 012 ). □ 4.8. Китайская теорема об остатках для многочленов Д оказательство теоремы 4.14 указывает удобный сп особ на­ хождения обратного элемента в K = Z p [x ]/h (x ) не только в том случае, когда многочлен h (x ) неприводим, но и когда этот мно­ гочлен приводим, а кольцо K не является полем. В частности,
4-8- Китайская теорема об остатках для многочленов 123 f (ж) G K обратим, т. е. f (ж) G K * , тогда и только тогда, когда найдутся многочлены з(ж),£(ж) такие, что в кольце 2^[ж] выпол­ нено равенство s ^ ) f (ж) + £(ж)Л,(ж) = 1. (4.21) У становить такие в(ж), £(ж) или доказать их отсутстви е, а значит и необратимость f (ж), помогает алгоритм Евклида (см. с. 109). Д ействительно, для лю бы х многочленов f (ж),Л,(ж) G 2 р [ж] эт о т алгоритм находит нормированный наибольший общий де­ литель ^(ж) = ( f , h) и коэф ф ициенты Безу з; (ж),£; (ж), так что s ' ^ f (ж) + ^(ж)Л,(ж) = ^(ж). Если ^(ж) = 1, то это противоречит равенству (4.21), так как его левая часть делится на ^(ж), а значит f (ж) G K*. Иначе, рас­ см отрев остатки от деления обеих частей (4.21) на Л,(ж), имеем s ^ ) f (ж) = 1 (m od Л,(ж)), а значит f - 1 ( ж) = з(ж) (m od Л,(ж)). П р и м е р 4 .1 9 . П олученное на с. 110 в кольце ^э[ж] тож д ество 122011■1201+10122■22110 = 1 показывает, что вы чет f (ж) = 10122 обратим в кольце K = = Z s ^ / h ^ ) , где h(ж) = 122011, причем f - 1^ ) = 22110. Н етрудно такж е убедиться, что Н О Д (122011 ,1111) = 101 = 1, п оэтом у вычет 1111 не имеет обратного в K. Так как 122011 = = 101 ■1211, где многочлены а(ж) = 101 и Ь(ж) = 1211 неприво­ димы над Z 3 , то делителями нуля в K будут кратные а(ж) или Ь(ж) вычеты, и други х делителей нуля в K нет. □ Д ругой сп особ производить арифметические действия в ф ак ­ тор-кольце K = Z p ^ / h ^ ) при составном модуле Л,(ж) описан ниже в данном разделе. Он основан на строении кольца K, и в его основе леж ит следую щ ая теорема, называемая китайской теоремой об остатках для многочленов. Т е о р е м а 4 .1 6 . П уст ь т 1(ж ),. . . , т п (ж) — попарно взаимно простые многочлены над полем F, M (ж) = m i (ж) ■■■т п (ж) — их произведение, а 1(ж ),. . . , ага(ж) — такие многочлены над полем F,
124 Глава 4- Кольца что deg а (ж) < deg mi (ж). Единст венным реш ением системы сравнений Ь(ж) = a i (x ) (m od m i (x )), Ь(ж) = а2(ж) (m od m 2(x )), Ь(ж) = an (x ) (m od m n (x )), ^ в кольце F [ x ] /M (ж) являет ся многочлен ( n ) bo (ж) = ( £ а*(ж )М г(ж )^(ж )^ i= i (m od M (ж)) (4.23) где(ж) = M ( ж) / —Д ж) и ^ (ж )М Д ж ) = 1 (m od —Дж)) для i = = 1 , 2 , . . . , n. Д о к а з а т е л ь с т в о . Д опустим , что система (4.22) имеет два различных решения с(ж) и ^(ж) G F [ж ]/M (ж). В этом случае их разность Ь(ж) = с(ж) — ^(ж) = 0 удовлетворяет неравенствам 0 ^ deg Ь(ж) < deg M (ж) (4.24) и является решением системы сравнений Ь(ж) = 0 (m od m i ), Ь(ж) = 0 (m od m 2), Ь(ж) = 0 (m od m n). (4.25) Из (4.25) следует, что каж дое 'Шг(ж) делит с(ж) — ^(ж) и, сле­ довательно, входит в разложение с(ж) — ^(ж) на неприводимые многочлены. П оэтом у d e g (c ^ ) — ^(ж)) ^ d e g M (ж), что противо­ речит (4.24). Таким образом, каж дая система вида (4.22) имеет не более одного решения в кольце F ^ ] / M (ж). Найдем это решение. П реж де всего отметим, что многочлены Мг(ж) и 'Шг(ж) взаимно простые. П оэтом у в силу теоремы 4.10 сущ ествует такой многочлен N j(ж), что М г(ж )^ (ж ) = 1 (m od 'Шг(ж)).
4.8. Китайская теорема об остатках для многочленов 125 Т ак как Ь(ж) (m od ш^(ж)) = (Ь(ж) (m od M (ж))) (m od ш^(ж)) для л ю бого Ь(ж) и каж дого i = 1 , 2 , . . . , n, и, кроме того, в силу условий теоремы M j (ж) = 0 (m od ш^(ж)) при i = j , то легко видеть, что многочлен bo (ж), определяемый ф ор м у ­ лой (4.23), действительно является решением рассматриваемой системы сравнений. Теорема доказана. П р и м е р 4 .2 0 . Найдем решение системы над полем Z 5 : Ь(ж) = 4 (m od ж + 1), Ь(ж) = 1 (m od ж + 2 ), Ь(ж) = 2 (m od ж + 3). Очевидно, что двучлены ж + 1, ж + 2 и ж + 3 попарно взаимно просты . Тогда по теореме 4.16 имеем Ь(ж) = 4 ■M i ■N i + 1 ■M 2 ■N 2 + 2 ■M 3 ■N 3 (m od M (ж)), где M (ж) = (ж + 1)(ж + 2)(ж + 3) = ж3 + ж2 + ж + 1 и M ^ ) = (ж+ 2)(ж + 3) = ж2 M 2^ ) = (ж+ 1)(ж + 3) = ж2 + 4ж + 3, M 3^ ) = (ж+ 1)(ж + 2) = ж2 + 3ж + 2. + 1, К ак следует из доказательства теоремы 4.16, многочлен Ni яв­ ляется обратны м к многочлену M i по модулю mi, а каждый многочлен mi в данном случае имеет вид ж — а для некоторо­ го а G Z 5 . П оэтом у мож но воспользоваться теоремой Безу и найти M ^ ) = M ( —1 ) = 2 (m od ж + 1 ), M 2^ ) = M ( —2) = 4 (m od ж + 2), M 3^ ) = M ( —3) = 2 (m od ж + 3),
Глава 4. Кольца 126 откуда в силу изоморф изм а Z 5 [x ]/(x — a) = Z 5 следует, что N l = N 3 = 2- i = 3 (m od 5) и N 2 = 4- i = 4 (m od 5).О тсю ­ да получаем ответ b(x) = 4 ■3 ■(x + 2 )(x + 3) + 1 ■4 ■(x + 1 )(x + 3) + + 2 ■3 ■(x + 1 )(x + 2) = = 2 (x 2 + 1) + 4 (x 2 + 4x + 3) + (x 2 + 3x + 2) = 2x2 + 4x + 1. Таким образом, b(x) = 2 x 2 + 4x + 1 является единственным ре­ шением системы в кольце Z 5 [x ]/M (х ), а в кольце Z 5 [x] систе­ ма имеет бесконечно много решений вида b(x) + c(x ) ■M (х ), где c (x ) — произвольный многочлен из кольца Z 5 [x]. П роверить най­ денный ответ мож но такж е с помощ ью теоремы Безу: нетрудно видеть, что действительно b(—1) = 4, b(—2) = 1, b(—3) = 2 . □ П р и м е р 4 .2 1 . Решим в кольце многочленов Z 2 [x] систему сравнений b(x) = 10 b(x) = 101 b(x) = 1111 (m od 111), 1 (m od 1101), > (m od 10011). М ногочлены m l (x) = 111 = x 2+ x + 1 , m 2(x ) = 1101 = x 3 + x 2 + 1, m 3(x ) = 10011 = x 4 + x + 1 неприводимы над Z 2 (см. с. 113) и, следовательно, взаимно просты . Применим теорем у 4.16. П осле­ довательно находим: M (х) = 1001010101, M 2(x) = 1111001, M l (x ) = 11000111, M 3(x ) = 100011. Далее находим M l (x ) = 11(m od m l (x )), M 2(x) = 110(m od m 2(x )) и M 3(x ) = 101(m od m 3(x )). О тсю да N l (x ) = M l ( x ) - i = 10 (m od m l (x )), N 2(x ) = M 2( x ) - i = 10 (m od m 2(x )), N 3(x ) = M 3( x ) - i = 1011 (m od m 3(x )).
4.8. Китайская теорема об остатках для многочленов 127 Последние равенства были получены с помощ ью алгоритма Ев­ клида. П одставляя полученные значения в ф орм улу (4.23), на­ ходим b(x) = a 1(x ) ■M 1(x ) ■N 1(x) + a2(x ) ■M 2(x ) ■N 2(x) + + a3(x) ■M 3(x ) ■N 3(x) = = a 1( x ) -110001110 + a2( x ) -11110010 + a3( x ) - 101111101 = = 110110111101 = 1000011(m od M (x )). Следовательно, многочлен b(x) = 1000011 является единствен­ ным решением рассматриваемой систем ы в кольце Z 2 [x ]/M (x ). М нож ество ее решений в кольце Z 2 [x] выражается формулой b(x) = 1000011 + ^ x ) ■M ( x ), где ^ x ) G Z 2[x] — произвольный многочлен. □ Китайская теорема об остатках для кольца многочленов (теорема 4.16) имеет следствие, аналогичное теореме 3.17 для колец числовых вы четов (и аналогично доказы ваемое), которое удобно ф орм улировать на языке изоморф изм ов и прямых сумм. Т е о р е м а 4 .1 7 . П уст ь g (x ) и h (x ) — произвольные м ногочле­ ны полож ит ельной ст епени из Z p [x]. Если g (x ) и h (x ) взаимно просты, то фактор-кольцо Z p [ x ] / / ( x ) , где / (x ) = g (x ) ■ h (x ), изоморфно прямой сум м е фактор-колец Z p [x ]/g (x ) и Z p [x ]/h (x ). Заметим, что если (g ,h ) = 1, то последнее утверж дение, во­ общ е говоря, неверно. Итак, пусть M ( x ) = m i(x ) ■••mn (x ) — разложение много­ члена M (x ) G Z p [x] в произведение различных взаимно просты х многочленов m i(x ). Тогда, применяя по индукции теорему 4.17, получим Z p[x ]/M (x ) = Z p [x ]/m 1(x) ® ® Z p [x ]/m n (x ). (4.26) К аж ды й элемент b(x) кольца Z p [x ]/M (x ) однозначно опреде­ ляется системой остатков a i ( x ) , . . . , an (x ) по формулам (4.22) и (4.23). Для сокращ ения запишем это одним из двух следую ­ щих способов: b = [ a i , . . . , an]mb ...,m„ или b = [ a i , . . . , a n ]m ,
Глава 4. Кольца 128 причем будем опускать внешние индексы в случае, когда из кон­ текста ясно, по какой системе взаимно п росты х делителей како­ го многочлена представлен вычет b. Данное представление го­ м ом орф н о (сохраняет обе операции кольца Z p [ж ]/М ), т. е. если b = [а1, . . . , an] и b' = [а1 , . . . , а” ], то b + b' = [а 1 + а 1 , . . . , ап + а” ], b ■b' = [а 1 ■а 1 , . . . , ап ■а” ]. П одчеркнем, что здесь в i-й компоненте ai о ai упорядоченного набора [а 1 о а 1 , . . . , а” о а” ] используется операция о £ { + , ■} кольца Z p ^ / m i . Будем называть такое представление вычетов кольца Z p^ ] / M (ж) представлением сист емой остатков. Представление многочленов системой остатков имеет мно­ го полезных следствий. И зом орф изм колец (4.26) влечет изо­ морф изм их мультипликативных групп. В частности, элемент b = [а 1, . . . , а” ] обратим по умнож ению тогда и только тогда, ко­ гда обратим ы все а^ причем b-1 = [а- 1 , . . . , а- 1 ], где обратный к ai вы чет берется в кольце Z p ^ ]/m i. При всяком l £ Z спра­ ведливо и более общ ее свойство b1 = [ а1,. . . , а” ]. П оэтом у (лем­ ма 3.2) мультипликативный порядок элемента b £ (Z p ^ ] / M )* равен наименьшему общ ему кратному порядков элементов ai £ £ ( Z p ^ /m i ) * . П р и м е р 4 .2 2 . К ак мы убедились в примере 4.20, над по­ лем Z 5 справедливо равенство 2ж2 + 4ж + 1 = [4,1, 2]x+1,x+2,x+3. Л егко такж е видеть, что 3ж + 2 = [4,1,3]. П оэтом у разность 2ж2 + ж + 4 многочленов 2ж2 + 4ж + 1 и 3ж + 2 представляется системой остатков [4,1, 2] — [4,1, 3] = [4 — 4,1 — 1, 2 — 3] = [0, 0, 4], а их произведение [4,1, 2] ■[4,1, 3] = [4 ■4,1 ■1, 2 ■3] = [1,1,1] рав­ но единице, т. е. эти многочлены являю тся взаимно обратными вычетами в кольце Z ^ ] / ^ + 1)(ж + 2)(ж + 3). □ П р и м е р 4 .2 3 . Рассмотрим кольцо вычетов Z ” по составному модулю n = а ^ где а, b > 1. Если (а, b) = 1, то, согласно тео­ реме 4.3, Z ab = Z a 0 Zb. Следовательно, Z ^ = Z^ x Z*. Ч исло обратим ы х по модулю n вы четов совпадает с порядком груп­ пы Z ” и равно p (n ), где p — функция Эйлера. Ч исло элементов
4.8. Китайская теорема об остатках для многочленов 129 в прямом произведении Z^ х Z* равно ^ (a )^ (b ). Таким образом, мы убедились в мультипликативности функции Эйлера, т. е. в равенстве <^(ab) = ^ (a )^ (b ) при (a, b) = 1, независимо от лем­ мы 2.5. □ П рим ер 4 .2 4 . П орядок мультипликативной группы коль­ ца Zgi = Z 7 0 Z i3 равен ^>(91) = ^>(7) ■ ^>(13) = 6 ■ 12 = 72. П оэтом у x 72 = 1 (m od 91) для л ю бого x G Zgi по теореме Эйле­ ра (теорема 2.13). Воспользуемся изоморф изм ом Z^i = Z * x Z ®3 и рассм отрим элемент x = ( xi , x 2) G Z7 x Z* 3 . Заметим, что x® = 1 (m od 7) и x®2 = 1 (m od 13), п оэтом у порядки элементов x® G Z7 и x 2 G Z ®3 являю тся делителями чисел 6 и 12 соответствен ­ но. П орядок элемента x = ( x®, x 2) равен наименьшему общ ему кратному порядков элементов x i и x 2, причем Н О К (6, 12) = 12. Следовательно, в данном случае теорема Эйлера м ож ет бы ть немного усилена: в действительности x i2 = 1 (m od 91) для лю ­ бого x взаимно простого с 91. Аналогичным образом нетрудно установить, что x ^ (n) = 1 (m od n ), где ^ (n ) равно наименьшему общ ему кратному чи­ сел ^>(pki) = p ki — p ^ 1, если n = p^1 .. .p!?s и ( x , n ) = 1. □ П р и м е р 4 .2 5 . В примере 4.21 бы ло показано, что 1000011 = [10, 101, 1111]M (x), где M ( x ) = 111 ■ 1101 ■ 10011 = 1001010101. П орядок муль­ типликативной группы К* кольца К = Z p [x ]/M (x ) равен 3 ■7 х х15 = 315 в силу неприводимости многочленов 111, 1101,10011. Н етрудно убедиться, что порядки элементов 10, 101 и 1111 в мультипликативных группах полей Z p [x ]/(1 1 1 ), Z p [x ]/(1 1 0 1 ) и Z p[x ]/(1 0 0 1 1 ) равны 3, 7 и 5 соответственно. П оэтом у порядок элемента 1000011 G К* равен Н О К (3 ,7, 5) = максимально возмож ным в К *. □ 105 и является Аналогичные китайской теореме об остатках утверж дения справедливы для многих колец и идеалов1). П одобные ф акты ценны тем, что п ом огаю т свести изучение составного кольца, например кольца Z fc1 k s , к изучению более п росто2) устроp1 ...ps 1}См. , например [23]. 2)Строению кольца Zn посвящен раздел 7.5.
130 Глава 4. Кольца енных колец типа Zpk. В частности, справедливо, что Zзoo = = Z 22 0 Z 3 0 Z 52, однако Z 300 = Z i5 0 Z 20. Т е о р е м а 4 .1 8 (интерполяционная теорема Л агранж а). П уст ь F — поле, f (ж) G F ^ j и ж0, ж1, . . . , ж п G F, жi = жj• — попар­ но различные элемент ы поля F. П уст ь deg f = n и известны значения многочлена f в n + 1 точках: f (жо) = Уо, f (Ж1) = y i , . . . , f (Жп) = Уп, тогда ^ (Ж — Жо) . . . (Ж — Ж ^)(Ж — Жi+ l) . . . (ж — Жп) yi ^ i — Жо) . . . (Жi — ж ^ ) ^ — Жi+l) . . . ^ i — Жп). (4.27) Равенство (4.27) называется интерполяционной формулой Лагранжа, а многочлен в его правой части — интерполяцион­ ным полиномом Л агранж а. Д о к а з а т е л ь с т в о . По теореме Безу f (ж^ = yi тогда и только тогда, когда f (ж) = yi (m od (ж — ж 0). (4.28) М ногочлены ш^(ж) = ж — Жi попарно взаимно просты , поэтому, применяя к системе равенств (4.28) при 0 ^ i ^ n китайскую теорем у об остатках, мож но найти f (ж). Д ействительно, в об о­ значениях теоремы 4.16 ai(ж) = yi G F, M (ж) = ^ M( ) (ж—Жк), Mi (ж) = Д ( ж —Жк) = ^ 7 ^ причем N i ^ M i ^ ) = 1 (m od (ж —ж^), откуда с учетом того, что M ^ ) = M ^ ^ (m od (ж —ж^) и M i (жi) = 0, следует, что ^ ( ж ) = = M i(ж i)- l , т. е. многочлен ^ ( ж ) является некоторой констан­ той из F. Применяя ф орм улу (4.23), имеем
Задачи 131 так как степень каж дого ее слагаемого a j(x )M j(x )N j(x ) стр о­ го меньше степени многочлена M (х ). Под делением в поле, как обы чно, понимается умножение делимого на обратный к дели­ телю элемент. Теорема доказана. С л е д с т в и е 4 .2 . Любой многочлен ст епени n над полем F однозначно определяет ся своими значениями в n + 1 различных т очках поля F. Последнее утверж дение имеет естественное ограничение: в поле F дол ж н о бы ть не менее n + 1 элементов. П р и м е р 4 .2 6 . Найдем многочлен f (х) наименьшей степени над полем Z 7 , принимающий значения 2, 6, 3 в точках 1, 2, 3 со ­ ответственно. Из ф орм улы (4.27) получаем = 2 (х — 2 )(х — 3) + 6 (х — 1 )(х — 3) + 3 (х — 1 )(х — 2) = f (х ) ^ (1 — 2)(1 — 3) + 6 ^(2 — 1)(2 — 3) + 3 ^(3 — 1)(3 — 2) = (х 2 + 2х + 6) + (х 2 + 3х + 3) + 5 (х 2 + 4х + 2) = 4х + 5, где деление в поле Z 7 — это умножение на обратный вычет. □ Задачи 4.1. Будет ли множество Q[ a/2 , л/ 3] с обычными операциями сло­ жения и умножения кольцом? Полем? 4.2. Показать, что любой гомоморфизм поля будет либо изомор­ физмом, либо будет отображать все элементы поля в нулевой элемент. 4.3. Доказать, что над полем F множество всех линейных функ­ ций вида ax + b, a = 0 образует группу относительно операции супер­ позиции. Найти ее порядок при |F| = q и исследовать ее структуру (коммутативность, цикличность, система образующих и пр.). 4.4. Доказать, что если идеал кольца содержит обратимый эле­ мент, то он совпадает со всем кольцом. 4.5. Образуют ли идеал необратимые элементы кольца 1) Z, 2) Z n, 3) Z p[x], 4) R[x], 5) C[x]? 4.6. Доказать, что при любых простом p, натуральном n и h(x) G Z p[x] все идеалы в кольцах Z, nZ, Z n, Zp[х] и Z p[x]/h(x) — главные.
132 Глава 4. Кольца 4.7. Доказать, что кольцо Z[x] и кольцо Z 2 [x, у], состоящее из все­ возможных многочленов от двух переменных x, у с коэффициентами из Z 2, не являются кольцами главных идеалов. 4.8. На стр. 97 была отмечена схожесть идеалов с нормальными подгруппами. Показать, что аналогично тому, как образ гомоморфиз­ ма групп является подгруппой (не обязательно нормальной), так и образ гомоморфизма колец является подкольцом (но уже не обяза­ тельно идеалом). 4.9. Найти все гомоморфизмы колец 1) Z — mZ, 2) 2Z — 2Z, 3) 2Z ——3Z, 4) Z ——Z . n m 4.10. Останется ли верной теорема 4.8, если F — кольцо без дели­ телей нуля, не являющееся полем? 4.11. Доказать леммы 4.6 и 4.7. 4.12. Доказать теорему 4.17. 4.13. Определить, изоморфны ли фактор-кольца Z 2 [x]/(x3 + 1) и Z 2 [x]/(x3 + x + 1 ) . П П 4.14. Пусть / (x) = ^2 =о akxk — неприводимый многочлен над Z 2 . Показать, что многочлен =о akx - неприводим. nk 4.15. Найти число правильных несократимых дробей со знамена­ телем / (x) = x8 + x 7 + x 4 + x 3 + 1 G Z 2 [x]. 4.16. Найти с помощью расширенного алгоритма Евклида для кольца многочленов обратный вычет к вычету x 4 + x 3 + 2 в кольце Z 3[x ]//(x ), где / (x) = x 6 + 2x3 + x 2 + 2 . p 4.17. Доказать, что если многочлен / (x) неприводим над Z , то многочлен / (ax + b) также неприводим при всех a, b G Z , a = 0. p 4.18. Показать, что в целостном кольце наибольший общий дели­ тель определен однозначно с точностью до обратимого множителя. 4.19. Показать, что в евклидовом кольце для любых ненулевых элементов a и b существует их наибольший общий делитель d, который можно представить в виде d = au + bv, где u и v — элементы кольца. 4.20. Доказать факториальность произвольного евклидова коль­ ца. 4.21. Показать, что всякое евклидово кольцо является кольцом главных идеалов. 4.22. В кольце 2Z привести примеры элементов с неединственным разложением на простые элементы. 4.23. Является ли определенная на стр. 129 функция ^(n) муль­ типликативной, т. е. верно ли, что ^(ab) = ^(a)^(b) при (a, b) = 1?
Задачи 133 4.24. Доказать, что функция Мёбиуса ^(n) так же, как и функция Эйлера <^(n), мультипликативна, т. е. что ^(а6) = ^(а)^(6) для всех взаимно простых натуральных а и 6. Доказать, что при всех n G N 4.25. Доказать мультипликативный вариант формулы Мёбиуса (ср. с леммой 4.11): функции f : N ^ R и h : N ^ R удовлетворяют равенству f (n) = П m|n h(m) при всех n G N тогда и только тогда, когда при всех n G N выполнено равенство m|n Данное утверждение справедливо и для функций / , h : N ^ G, где G — произвольная абелева группа с операцией, обозначаемой умно­ жением. 4.26. Доказать, что произведение всех нормированных неприво4.27. (Обобщенная китайская теорема об остатках.) Пусть K — коммутативное кольцо с единицей, а I, J С K — такие его идеалы, что I + J = K. Доказать, что произведение I J является тогда пересечени­ ем I П J, а также что K /( I J ) = K /I ® K / J . Более того, изоморфизм : K / I ® K /J ^ K /( I J ) можно задать равенством <^>(ж,у) = *ж + jy , где элементы i G I , j G J таковы, что i + j = 1.
Глава 5 Линейные пространства Возникшая при взаимодействии физики, геометрии и матема­ тического анализа теория линейных (векторны х) пространств успеш но используется практически во всех непрерывных разде­ лах современной математики. Не менее эф ф ективно линейные пространства м ож но использовать и при изучении дискретны х объектов, в частности конечных полей. В этой главе вводятся основные понятия теории линейных пространств и устанавли­ вается ряд ее фундаментальных результатов, необходимых для различных приложений этой теории. 5.1. Линейные пространства и их свойства М нож ество V с операциями сложения и умножения на эле­ менты поля F называется линейным (векторным) простран­ ст вом над полем F, если: (1) V — абелева группа относительно операции сложения; (2) a ( v + w ) = a v + a w для лю бы х v, w e V и a e F; (3) (a + в )v = a v + в v для лю бы х v e V и a, в e F; (4) ( a e ) v = a ( e v ) для лю бы х v e V и a , в G F; (5) 1v = v для л ю бого v e V и единицы 1 поля F. Элементы линейного пространства называются векторами, нейтральный элемент группы называется нулевым вектором. Рассмотрим некоторые примеры линейных пространств. П р и м е р 5 .1 . На множ естве наборов из Fn введем две опера­ ции: операцию покомпонентного сложения « + », отображ аю щ ую
5-1- Линейные пространства и их свойства 135 наборы и и v в их сум м у и + v, и операцию покомпонентно­ го умножения «■» набора на константу из F. Для i-х разрядов сум м ы и + v и произведения а ■и (i = 1 , 2 , . . . , n) положим (и + v )i = ui + Vi, (а ■u )i = aui. Л егко видеть, что м нож ество F” с операциями « + » и «■» будет линейным пространством , в котором нулевым элементом будет нулевой набор 0 = ( 0 , . . . , 0). Скалярным произведением (ж, у ) векторов ж, у из F” называется величина (ж, у ) = ж1У1 + . . . + ж ^ + . . . + ж” У” . В екторы называются ортогональными, если их скалярное про­ изведение равно нулю. О тметим, что линейную ф ункцию с ну­ левым свободны м членом а ^ 1 + . . . + а ^ ” мож но рассм ат­ ривать как скалярное произведение вектора ее коэф ф ициентов a = ( а 1, . . . , а ” ) и вектора переменных ж = (ж 1, . . . , ж” ). □ П р и м е р 5 .2 . Поле Z ^ ] / ^ 3 + 2ж + 1) из примера 4.18 обра­ зует линейное пространство над своим подм нож еством — полем Z 3 с операцией сложения « + » , и операцией умножения «■» на элементы из Z 3 . □ П усть ж1, . . . , Ж" £ V, а 1, . . . , а& £ F. В ектор а 1ж 1 + ■■■+ +а&ж^ называется линейной комбинацией векторов Жi с к оэф ­ фициентами a i. М нож ество всех линейных комбинаций векто­ ров ж 1, . . . , ж^ называется линейной оболочкой этих векторов и обозначается (ж 1, . . . , жд.). Л егко видеть, что линейная оболочка лю бы х векторов ж 1, . . . , ж^ будет линейным пространством. Если линейное пространство V совпадает с линейной об о­ лочкой конечного числа векторов, то пространство называется конечномерным, в противном случае пространство называется бесконечномерным. П р и м е р 5 .3 . На множ естве F ^ , состоящ ем из бесконечных наборов вида ( а 1, а 2 , . . . , а i , . . . ) , где а i £ F, введем операции покомпонентного слож ения и по­ компонентного умножения набора на константу из F, так ж е как
Глава 5. Линейные пространства 136 и в примере 5.1. Н етрудно видеть, что множ ество F ^ с такими операциями будет бесконечномерным линейным пространством. □ В екторы ж®, . . . , Хк называются линейно зависимыми, если в поле F найдутся такие одновременно не равные нулю элемен­ ты а®, . . . , а к , что линейная комбинация векторов Xi с коэф ф и ­ циентами а равна нулевому набору: а®и® + . . . + а к п = 0. Если при лю бы х одновременно не равных нулю элементах ai линейная комбинация векторов Xi с коэффициентами a i не рав­ на нулевому набору, то векторы ж®,. . . , жк называются линейно независимыми. Л егко видеть, что для линейной оболочки векторов справед­ ливы следующ ие просты е свойства: (Х 1, . . . , Х^ . . . , x j , . . . , Хк) — (Х 1, . . . , x j , . . . , x i , . . . , Хк) для лю бы х i, j ; (х®, . . . , Хк) = (х®, . . . , а Х к ) для лю бого ненулевого а; ( х ®, . . ., Хк) = ( х ®,. . . , Хк_1, Хк_1 + Хк). Из этих свойств следует, что для лю бого ненулевого a i и произ­ вольных а ®, . . . , а ^ 1, а ^ ® , . . . , ак ( x l , . . . , x i , . . . , Хк) = = (х®, . . . , а®Х 1 +------ + aiX i +---------- + ак Хк, . . . , Хк). Л е м м а 5 .1 . П уст ь ж®,. . . , x n и у ®,. . . , y m — линейно неза­ висимые сист емы векторов, и каж дый y i G (ж®,. . . , x n). Тогда m ^ n. Д о к а з а т е л ь с т в о . Д опустим, утверж дение леммы неверно и m > n. Без ограничения общ ности будем полагать, что у® зави­ си т о т ж®, т. е. в равенстве у® = ^ *=1 al,iЖi коэф ф ициент а®,® о т ­ личен о т нуля. В системе векторов ж®,. . . , x n вектор ж® заменим вектором у®. Из (5.1) следует, что (у®, Ж2, . . . , x n ) = (х®, . . . , x n ). Среди векторов Х 2 , . . . , x n и у 2 , . . . , у т найдем пару Xi, У j, в которой Уj зависит от Xi. П усть такую пару обр азую т векторы Ж2 и у 2- В системе векторов у®, Ж2 , . . . , x n вектор Х 2 заменим вектором у 2 . И снова из (5.1) следует, что (у®, у 2 , Ж3 , . . . , x n ) =
5.1. Линейные пространства и их свойства 137 = < x i , . . . , x n). Будем проводить такие замены, пока это возм ож ­ но. П редположим, что это сделано s раз и в результате получе­ на система векторов у ь . . . , y s, x s+ i , . . . , x n , линейная обол оч­ ка которой совпадает с < x i , . . . , x n ). С ледую щ ую замену нель­ зя сделать по одной причине — среди векторов x s+ i , . . . , x n и y s+ i , . . . , y m нельзя найти пару векторов Xj, y j , в которой век­ т о р y j зависит от Xj. Следовательно, все векторы y s+ i , . . . , y m зависят только о т векторов y i , . . . , y s, т. е. справедливо вклю че­ ние ( У ъ . . ^ У щ) Q <У1, . . . , Уs), где s ^ n < m. Очевидно, что это включение противоречит линейной независимости векторов y i , . . . , y m. Таким образом, m ^ n. Лемма доказана. П усть V — произвольное линейное пространство. Система векторов x i , . . . , Xk называется базисом в V , если эти векторы линейно независимы и их линейная оболочка совпадает с V . На­ пример, в рассмотренном в примере 5.1 пространстве Fn базисом будет следую щ ая система векторов E n : e i = (1, 0, 0 , . . . , 0, 0), e2 = (0,1, 0 , . . . , 0, 0), ез = (0, 0 , 1 , . . . , 0, 0), e n = (0, 0, 0, . ., 0, 1), в которой каж дый из векторов содерж ит ровно одну единичную компоненту. Базис E n называется стандартным базисом в Fn . Так как конечномерное линейное пространство V совпадает с линейной оболочкой конечного числа векторов, то отсю да и из леммы 5.1 легко получаем следующ ее утверждение. Т е о р е м а 5 .1 . В каж дом конечномерном линейном простран­ ст ве V найдется базис. В се базисы V сост оят из одинакового числа векторов. Будем говорить, что векторы v i , . . . , vk порож дают линей­ ное пространство V , если V = < v i , . . . , v k ). Очевидно, что лю ­ бое линейное пространство порож дается своим базисом, но не
Глава 5. Линейные пространства 138 всякая система векторов, порож даю щ ая линейное пространство, является базисом этого пространства. Например, система векто­ ров e i , . . . , е п , e i + e 2 порож дает пространство F”-, но не является его базисом. Ч исло векторов в базисе пространства V называется размер­ ност ью пространства V и обозначается через dim V . П ростран­ ство размерности k часто назы ваю т k-мерным пространством. Из леммы 5.1 и теоремы 5.1 легко извлекаются следующ ие просты е и полезные утверждения. Л е м м а 5 .2 . При m > k в k -мерном линейном пространстве любые m векторов линейно зависимы. Л е м м а 5 .3 . В k -мерном линейном пространстве любые k линейно независимых векторов являют ся базисом эт ого про­ странства. П р и м е р 5 .4 . Найдем число различных базисов в Z ^ П реж де всего заметим, что каж дый базис в Z^^ состои т ровно из n век­ торов. Э то легко следует из леммы 5.1 и сущ ествования базиса Е п. В Z^^ выберем n линейно независимых векторов. Сделаем это, последовательно выбирая векторы из Z^^ так, чтобы выбранный на очередном шаге вектор не принадлежал линейной оболочке ранее выбранных векторов. Первый вектор v i мож но выбрать рп —1 способами: подойдет любой ненулевой вектор. В торой век­ то р V2 м ож но вы брать рп — р способами: подойдет любой век­ тор, отличный о т a v i , где a G Z p. На k-м шаге мож но выбрать лю бой вектор, не принадлежащий линейной оболочке векторов V i , . . . , Vfc_i. Так как линейная оболочка ( v i , . . . , Vfc_i) состои т из pk - i векторов, то вектор v& м ож но вы брать рп — p k -i сп осо­ бами. Таким образом, все n векторов мож но выбрать (рп — 1)(рп — р) ■. . . ■(рп — р к) ■. . . ■(рп — рп -1 ) (5.2) способами. Следовательно, число различных базисов в Z^J равно произведению (5.2). □
5.1. Линейные пространства и их свойства 139 Очевидно, что каж дый вектор v, лежащий в k-мерном про­ странстве V , представляется в виде линейной комбинации v = a i v i +-------- + a fcv k (5.3) базисных векторов v i , . . . , vk этого пространства. Величины a называются координатами вектора v в базисе v i , . . . , v k . Не­ трудно видеть, что представление (5.3) единственно. Д ействи­ тельно, допустим , что найдутся две различные линейные ком­ бинации базисных векторов, каж дая из к оторы х равна вектору v. Тогда a i v i +-+ ak vk = в1 v i +-----------------+ вк v k . Вычисляя разность этих линейных комбинаций, получаем, что ( a i — e i ) v i +-+ (ak — ek )vk = 0, причем среди коэф ф ициентов a i — вг обязательно найдется хо­ тя бы один, не равный нулю. Следовательно, векторы v i , . . . , vk линейно зависимы, т. е. эти векторы не обр азую т базис в V . П ро­ тиворечие. Л е м м а 5 .4 . При m < k в k -мерном линейном пространстве любые m линейно независимых векторов м ож н о дополнить до базиса пространства. Д о к а з а т е л ь с т в о . В k-мерном линейном пространстве V рассм отрим линейно независимые векторы v i , . . . , v m. Так как m < k, то в V найдется вектор v, не являющийся линейной комбинацией векторов v i , . . . , v m. П олож им v m+ i = v. Если m + 1 = n, то в силу леммы 5.3 система v i , . . . , v m+ i будет ба­ зисом в V . Если m + 1 < k, то в V найдется новый вектор v, не являющийся линейной комбинацией векторов v i , . . . , v m+ i, ко­ торы й вместе с этими векторами образует линейно независимую систему. П овторяя эту процедуру в общей слож ности k — m раз, получим базис пространства V, в к отором содерж атся векторы v i , . . . , v m. Лемма доказана. Линейные пространства V и W над полем F называются изо­ морфными, если сущ ествует такое взаимно однозначное отобра­ жение р : V ^ W , что:
140 Глава 5. Линейные пространства (i) р(ж + у ) = р(ж ) + р ( у ) для всех ж, у G V; (ii) p ( a x ) = a p ( x ) для всех a G F и ж G V. О тображ ение р : V — W называется изоморфизмом, а ф акт изоморф изм а пространств V и W обозначается через V = W . П р и м е р 5 .5 . П усть V = { / G F[x] : deg / < n } — множ ество, состоящ ее из всех многочленов степени n — 1 и менее с к оэф ­ фициентами из поля F. Оно очевидно зам кнуто относительно операций сложения многочленов и их умножения на констан­ ты из поля F !) . Такж е из свойств кольца F[x] сл едую т свойства (1 )—(5) определения на с. 134. Таким образом, V образует ли­ нейное пространство над F, причем dim V = n. Оно изоморф но п ространству Fn из примера 5.1. □ П р и м е р 5 .6 . М нож ество F[x] всех многочленов над полем F относительно операций предыдущ его примера изом орф но про­ стран ству W всевозм ож ны х бесконечных последовательностей элементов из F, имеющих конечное число ненулевых членов. И зом орф изм р : F[x] — W ставит в соответстви е многочлену ao + . . . + a nx n набор его коэф ф ициентов ( a o , . . . , a n , 0, 0 , . . . ) , дополненный нулями. □ Из определения изоморф изм а легко следует, что и зом ор­ ф изм р : V — W отображ ает нулевой вектор пространства V в нулевой вектор пространства W и что композиция изом орф из­ мов р : V — W и ф : W — U является изоморф изм ом простран­ ства V в пространство U. Т е о р е м а 5 .2 . Д ва линейных конечномерных пространства V и W над полем F изоморфны тогда и только тогда, когда их размерност и совпадают. Д о к а з а т е л ь с т в о . Покажем, что произвольное k-мерное ли­ нейное пространство V над полем F изом орф но линейному про­ стран ству F k наборов длины k из примера 5.1. П усть v i , . . . , v^ — базис пространства V и e i , . . . , — стандартный базис про­ странства F k. Так как каж дый вектор x из V единственным 1)Отепень суммы многочленов не превосходит наибольшей степени сла­ гаемых, степень многочлена a f не превосходит степени f при любом a £ F .
5-1- Линейные пространства и их свойства 141 образом представляется в виде суммы х = ж^ 1 + ■■■ + ж^Vk и любая сумма такого вида принадлежит V , то отображ ение р : V ^ F k, определяемое равенством <^(ж^ 1 +-+ жкvk) = (ж!, . . . , жк), является взаимно однозначным. Для такого отображ ения и лю ­ бы х векторов x = ж^ 1 + ■■■ + жкVk и у = y i v i + ■■■+ yk Vk из пространства V р ( х + у ) = р ((ж ^ 1 +-------- + ЖkVk) + ( y i v i +-------- + yk Vk)) = = р ((ж ! + y i ) v i +-------- + (Жk + yk )Vk) = = (ж! + yi, . . . ^ k + yk) = = ( ж! , . . . , Жk) + ( yi , . . . , yk) = p ( x ) + р ( у ). Т акж е легко видеть, что для л ю бого а из F и лю бого х из V р ( а х ) = р ( а ж ^ + ■■■+ ажkv k) = = ( аж! , . . . , ажk) = а ( ж! , . . . , жk) = а р ( х ) . Таким образом, V = F k. Рассмотрим изоморф изм р пространства V в пространство F k и изоморф изм ф пространства F k в пространство U. Так как композиция изоморф изм ов является изоморф изм ом, то компо­ зиция ф о р будет изоморф изм ом V в U. Следовательно, любые два линейных k-мерных пространства V и U над полем F изо­ морф ны. Теперь покажем, что если k = m, то никакое k-мерное про­ стран ство V над полем F неизоморф но никакому m -мерному п ространству U над тем ж е полем. В силу доказанного выше для этого д остаточн о показать, что F k неизоморф но F m. П усть m > k. Д опустим , что сущ ествует изоморф изм р : F m ^ F k и p ( e i ) , . . . , p ( e m) — образ стандартного базиса F m. Тогда в силу леммы 5.2 найдется ненулевой набор коэф ф ициентов a i , . . . , a m, для к оторого a i p ( e i ) +-+ a mp ( e m) = 0.
142 Глава 5- Линейные пространства В этом случае приходим к противоречию со свойствами и зом ор­ ф изма, так как р(а1 в1 +------ + а ™ е т ) = а 1 р (е1 ) +---------- + а™ р(е™ ) = 0, т. е. p отображ ает ненулевой вектор а 1е 1 + ■■■ + а т е т из F m в нулевой вектор пространства F k, что, очевидно, невозмож но. Следовательно, пространства F k и F m неизоморфны. Теорема доказана. П усть V — линейное пространство над полем F, V ' С V . М но­ ж ество V ' называется линейным подпространством простран­ ства V , если: (1) сумма ж + у £ V ' для всех ж, у £ V '; (2) аж £ V ' для всех а £ F и для всех ж £ V '. П р и м е р 5 .7 . П ространство W , рассмотренное выше в приме­ ре 5.6, является бесконечномерным подпространством простран­ ства F ^ из примера 5.3. □ П р и м е р 5 .8 . Найдем число различных k-мерных подпро­ стран ств в Z ” . К аж дое такое подпространство определяется ба­ зисом, состоящ им из k линейно независимых векторов. П овто­ ряя рассуж дения из примера 5.4, видим, что число таких бази­ сов равно (p” — 1)(p” — p) ■. . . ■(p” — p k -1 ). При этом в каж дом подпространстве сущ ествует (pk — 1 )(pk — p) ■. . . ■(pk — p k -1 ) различных базисов. Следовательно, число различных k-мерных подпространств в Z p ” равно (p” — 1)(p” — p) ■. . . ■(p” — p k -1 ) ^ (pk — 1 )(pk — p) ■. . . ■(pk — p k -1 ) . П усть U — подпространство пространства V над полем F. Т ак как U и V абелевы группы, то U, очевидно, будет подгруп­ пой в V, и сущ ествует ф актор-груп п а V /U группы V по подгруп­ пе U. Н епосредственной проверкой свойств (2 )—(5) определения
5.2. Линейные операторы 143 линейного пространства нетрудно убедиться в том, что ф ак тор ­ группа V /U будет линейным пространством над F. Такое про­ стран ство называется фактор-пространством пространства V по подпространству U. 5.2. Линейные операторы П усть V и U — линейные пространства над полем F. О тоб­ ражение A : V ^ U называется линейным оператором,, если A (v + w ) = A ( v ) + A ( w ) A (a v ) = a A (v ) (5.4) для лю бы х v, w e V и л ю бого a e F . П усть v i , . . . , v n — базис в V , U i , . . . , u m — базис в U. Тогда для л ю бого вектора x = ж^ 1 + . . . + жnv n из первого простран­ ства в силу свойств (5.4) выполнено равенство A ( x ) = А ( ж! v i + . . . + In v n ) = Жl A( vl ) + . . . + жпА ^ п). (5.5) Следовательно, значение линейного оператора однозначно опре­ деляется его значениями на векторах базиса. С другой стороны , рассм отрим образы базисных векторов vj, выразив их через эле­ менты базиса в U: A ( v j) = VijUi + V2iU 2 +-+ VmiUm, i = 1, 2, . . . , n. (5.6) Подставив равенства (5.6) в (5.5), видим, что A ( x ) = ж ! А ^ 1) + . . . + ж п А ^ п ) = = ж1 (ViiUi +-+ VmiUm) + . . . ------+ жп(^1п« ! +-+ VmnUm) = (5.7) = (^цж1 +--------- + V ^ ^ U i + . . . ------+ (v m1ж1 + ■■■ + vmnжn) u m. Если A ( x ) = y = y 1u 1 + ■■■+ ymu m, то из (5.7) следует, что yi = V j^ i + Vг2Ж2 +-+ VгmЖn, i = 1, 2, . . . , m. (5.8)
144 Глава 5. Линейные пространства Очевидно и обратное: если отображ ение A ( x ) = у задано ф о р ­ мулами (5.8), то оно является линейным оператором . Функции y i , . . . , ym называются его компонентами. Таким образом, выбрав базисы в пространствах V и U, ли­ нейный оператор из V в U м ож но рассматривать как отображ е­ ние из F”- в F m, все компоненты которого являю тся линейными ф ункциями с нулевыми свободными членами. К аж ды й такой оператор будем называть линейным (n, m )-оператором. С уммой линейных операторов A : V ^ U и B : V ^ называется такой оператор (A + B) : V ^ U, что U (A + B )(x ) = A ( x ) + B (x ) для каж дого x G V . Очевидно, что сумма линейных операто­ ров такж е будет линейным оператором. В торое равенство в (5.4) определяет произведение линейного оператора и элемента поля, над которы м определено линейное пространство. Н етрудно по­ казать, что м нож ество линейных операторов A из V в U с ука­ занными операциями слож ения и умножения на элементы поля является линейным пространством, размерность которого равна произведению размерностей пространств V и U. Ком позицией B о A линейного оператора A : V ^ U и линейного оператора B : U ^ W называется такой оператор C : V ^ W , что C (x ) = B ( A (x )) (5.9) для каж дого x из V. Покажем, что композиция линейных операторов является линейным оператором . Рассмотрим композицию C (x ) = B ( A (x )), зафиксировав базисы в пространствах V, U, W . П усть в этом случае компоненты операторов A и B определяются следую щ и­ ми равенствами: ai = а^Ж! + . . . + aij ж^- + . . . + а^Жп, i = 1,2 , . . . , m ; (5.10) bi = biiyi + . . . + bij yj + . . . + bimym, i = 1 , 2 , . . . , k, (5.11) где n = dim V , m = dim U, k = dim W . Выразим компонен­ ты Ci оператора C через коэф ф ициенты операторов B и A . Для
5.2. Линейные операторы 145 этого компоненты оператора A из (5.10) подставим в (5.11) вме­ сто переменных у®,. . . , ym. В результате при i = 1, 2 , . . . , к для i-компоненты C получим ci = b ii(a iix i + . . . + aitxt + . . . + ainxn) + . . . . . . + bim(a m ix 1 + . . . + amtx t + . . . + amnx n) = = (bi i a 11 + . . . + bitati + . . . + bimam i) x 1 + . . . . . . + (bi i a 1n + . . . + bitatn + . . . + bimamn)x n. Следовательно, каждая компонента ci оператора C является ли­ нейной функцией, для j -го коэффициента которой справедливо равенство cij = bi i a 1j + . . . + bitatj + . . . + bimam j. (5.12) Таким образом, композиция линейных операторов является ли­ нейным оператором. О ператор E : V ^ V называется т ож дест венным, если E (ж) = ж для каж дого ж из V. Л егко видеть, что тож дественный оператор является линейным. О ператор A : V ^ V называет­ ся обратимым или невырож денным , если сущ ествует обратный оператор A_® такой, что A _ ® ( A ( x ) ) = A ( A _ ® ( x ) ) = E (ж). В силу теоремы 1.2 оператор невырожден тогда и только тогда, когда он биективен. Н етрудно показать, что оператор, обратный к линейному невырож денному оператору, такж е будет линей­ ным. П оэтом у (см. теорем у 1.3) м нож ество всех невырожденных операторов A : V ^ V образует группу относительно операции композиции. Тож дественны й оператор E является ее единичным элементом. Эта группа называется общей линейной группой про­ странства V и обозначается G L (V ) или G L (n, F), если V = Fn . Т акж е отметим, что множ ество всех операторов A : V ^ V об­ разует кольцо операторов с операциями суммы и композиции, мультипликативной группой которого является группа G L (V ). Ядром линейного оператора A : V ^ U называется множ е­ ство всех таких ж G V , для которы х A ( x ) = 0. Я д ро оператора
146 Глава 5. Линейные пространства A обозначается через Ker A . Образом, оператора A называется множ ество всех таких y £ U, что y = A ( x ) . О браз оператора A обозначается через Im A . Нетрудно показать, что ядро и образ л ю бого линейного оператора являю тся линейными подпростран­ ствами в V и U соответственно. Размерность образа линейного оператора A называется его рангом и обозначается через rank A . Т е о р е м а 5 .3 . П уст ь dim V = n. Д л я любого определенного на V линейного оператора A n = dim Ker A + dim Im A . Д о к а з а т е л ь с т в о . П усть векторы v i , . . . , vk обр азую т базис в Ker A . П роизвольным образом дополним этот базис д о бази­ са всего пространства V . Новые базисные векторы обозначим через v k + i , . . . , v n . Теперь для доказательства теоремы д оста­ точн о показать, что образ оператора A порож дается векторами A ( v k + i ) , . . . , A ( v „ ) , т.е. Im A = ( A ( v k + i ) , . . . , A ( v „ ) ) . П реж де всего убедимся, что векторы A ( v k + i ) , . . . , A ( v n) ли­ нейно независимы. Д ействительно, если это не так, то найдутся такие одновременно не равные нулю постоянные a k + i , . . . , a n , что a k + iA (v k + i) + . . . + a „ A ( v „ ) = 0. Откуда, используя линейность оператора A , легко получаем, что 0 = a k + iA (v k + i) + . . . + a „ A ( v „ ) = = A ( a k+ lv k+l + . . . + a nv n), т. е. вектор (a k + ivk + i + . . . + a nv n) принадлежит ядру оператора A . П ротиворечие с вы бором векторов v k + i , . . . , v n . Следователь­ но, векторы A ( v k + i ) , . . . , A ( v n) линейно независимы. Теперь покажем, что каж дый вектор из образа A выраж а­ ется в виде линейной комбинации векторов A ( v k + i ) , . . . , A ( v n). Для этого произвольный вектор а из V разложим по базису v i , . . . , v n и применим к этом у вектору оператор A : A (a ) = A ( a i v i + ... + a „v „) =
5.3. Матрицы 147 = A ( a i v i + . . . + a fcv k) + A ( a fc+i v fc+i + . . . + a n v „) = = a k + iA (v k + i) + . . . + a n A (v n ). Таким образом, лю бой элемент из Im A выражается в виде ли­ нейной комбинации векторов A ( v k + i ) , . . . , A ( v n). Так как эти векторы линейно независимы, то они обр азую т базис в Im A . Следовательно, d im lm A = n — k. Теорема доказана. П усть dim V = n и A : V — V . Если d im K er A = 0, то линейный оператор A биективен. Д ействительно, из теоремы 5.3 следует сю ръективность A . Если найдутся такие неравные а и b, что A ( a ) = A (b ), то A ( a — b) = 0, что очевидно противоречит равенству dim Ker A = 0, т. е. A инъективен. Таким образом, оператор A невырожден тогда и только тогда, когда его ранг равен n. 5.3. Матрицы Далее полагаем, что во всех рассматриваемых пространствах зафиксированы базисы. П усть V — n -мерное линейное простран­ ство над полем F, U — m -мерное линейное пространство над тем ж е полем. Удобным средством описания линейных операто­ ров из V в U являю тся матрицы. Матрицей линейного (n, m )оператора A = ( a i , . . . , am) с компонентами a i = a i i x i + ai2 x 2 + .......... + ain xn, a2 = a 2ixi + a22 x2 + .......... + ain xn, am — am ix 1 + am2x 2 + .......... + amnx n называется прямоугольная таблица из m стр ок и n столбцов ( a ii A • a 1j a 1n \ aii . aij a \am1 • •• am n/ (5.13)
148 Глава 5. Линейные пространства составленная из коэф ф ициентов а^ оператора А . Величины а^ называются элементами матрицы (5.13). М атрицу из m строк и n столбцов с элементами из поля F будем называть ( m , n ) матрицей A = (а ^ ) над полем F или матрицей размера m x n над полем F. Если m = n, то (n, n)-м атри ц у будем называть квадратной матрицей порядка n, или п росто матрицей порядка n. В частности, легко видеть, что матрицей тож дественного опе­ ратора будет квадратная матрица E ” = ( e j ), элементы которой определяются равенством eij = 1, при i = j , 0, при i = j . М атрица E ” называется единичной матрицей порядка n. М атрица A T = (а ^ ) размера m x n называется транспони­ рованной матрицей к матрице A = (а ^ ) размера n x m, если а|/ = а^. Л егко видеть, что для любой матрицы A справедли­ во равенство A T T = A . Квадратная матрица A называется симм ет рической, если A T = A , и кососимм ет рической, если A T = —A . 0 П р и м е р 5 .9 . Если A = ( 3 1 4 2\ i T ' 0 3^ 5 J , то A T = | 1 4 | . □ Определим операцию умножения матрицы на элемент поля и операции сложения и умножения матриц. Сделаем это так, чтобы матрица произведения а А элемента а и оператора А бы ­ ла равна произведению а и матрицы A оператора А , матрица суммы А + В линейных операторов А и В была равна сумме матриц этих операторов, а матрица композиции В о А линейных операторов В и А — произведению матриц этих операторов. П роизведением элемента а и матрицы A называется такая матрица C = ( c j ), что C j = а а ^ . Очевидно, что матрица C является матрицей оператора а А . С уммой A + B двух (m , ^ -м а т р и ц A = (а ^ ) и B = ( b j ) называется такая (m , ^ -м а т р и ц а C = ( c j ), что C j = а^ + b j . Н етрудно видеть, что матрица суммы двух линейных операто­ ров равна сумме матриц этих операторов.
5-3- Матрицы 149 П роизведением B A (k, т )-м а т р и ц ы B = ( 6j ) и (m , ^ -м а т р и цы A = (a ij) называется такая (k, ^ -м а т р и ц а C = ( c j ), ч т о !) cij = 6i l a lj + . . . + 6itatj + . . . + 6imam j. Если матрицы B и A являю тся матрицами операторов B и A , заданных равенствами (5.10) и (5.11), то из определения произ­ ведения матриц и равенства (5.12) легко следует, что матрица B A действительно будет матрицей композиции B о A . М нож ество (m , ^ -м а т р и ц над полем F с указанными опе­ рациями сложения и умножения на элементы поля образует ли­ нейное пространство размерности m n над F. Н етрудно показать, что это пространство матриц изом орф но линейному простран­ ству соответствую щ и х матрицам операторов. Если рассматривать набор х из Fn в качестве матрицы, со ­ стоящ ей из единственного столбца вы соты n, то из определения матриц легко следует, что значение линейного (n, т )-о п е р а т о р а A на наборе х мож но найти, вычислив произведение А х матри­ цы этого оператора и набора x . Далее, говоря о произведении А х , набор х будем иногда называть вектором-столбцом для того, чтобы подчеркнуть его «вертикальное» положение в этом произведении. П р и м е р 5 .1 0 . В линейном пространстве над полем Z 5 рас­ см отрим оператор A = ( a i , a 2) с компонентами ai = ж! + ж2 и а 2 = ж! + 2 ж2 + 3жз. Найдем его значение при ж! = ж2 = жз = 1. Сделаем это, умнож ив матрицу оператора A на вектор-столбец ( 111 ): Следовательно, образом вектора (111) является вектор (21), т. е. а ! (ж! ,ж 2 ,ж3) = 2 , а 2 (ж! ,ж2 ,ж3) = 1. Аналогичный результат по­ лучается после вычисления A ( 1 , 1 , 1 ) по формулам его компо­ нент. □ ^Заметим, что элемент Cj равен скалярному произведению i-й строки матрицы B и j -го столбца матрицы A.
Глава 5. Линейные пространства 150 К ак и при вычислении композиции линейных операторов, произведение B A матриц B и A определено не всегда, а тол ь­ ко в том случае, когда число столбцов матрицы B равно числу стр о к матрицы A . П оэтом у легко видеть, что произведения A B и B A матриц B и A определены одновременно только для квад­ ратных матриц одного порядка. О тметим, что операция умнож е­ ния квадратны х матриц не коммутативна, т. е. найдутся такие матрицы A и B одного порядка, что A B = B A . П р и м е р 5 .1 1 . Рассмотрим две треугольные матрицы втор о­ го порядка A = ( i ! ) и B = ( 0 ! ) с элементами из Z 2 . Для произведений A B и B A этих матриц справедливы равенства Следовательно, A B = B A . □ Н епосредственно из определений операции умножения и сло­ жения матриц следует, что каж дая из этих операций ассоциа­ тивна, и кроме того, эти операции связаны законами дистри бу­ тивности: для лю бой матрицы A размера m х n, лю бы х матриц B и C размера n х k и любой матрицы D размера k х l справед­ ливы равенства A (B + C ) = A B + A C , (B + C ) D = B D + C D . О тсю да следует, что м нож ество квадратны х матриц одного порядка образует некоммутативное кольцо с единицей, которое, очевидно, изом орф но кольцу соответствую щ и х матрицам опе­ раторов. М атрицы мож но разбивать на блоки — матрицы меньших размеров и при условии подходящ его выбора размеров блоков выполнять поблочное сложение и умножение матриц. Напри­ мер, рассм отрим разбитые на четыре блока (m , ^ -м а т р и ц у A и (n, ^ -м а т р и ц у B : A A ll A 21 A l2 A 22 B ll B 21 B l2 B 22
5.3. Матрицы 151 Если размеры блоков A jt и B tj таковы, что произведения A jtB tj определены для всех 1 ^ i, t, j ^ 2, то для произведения C = A B справедливо равенство C С каж дой матрицей свяж ем три линейных пространства: пространство строк, пространство столбцов и ортогональное пространство. Пространством строк матрицы A называется линейное пространство А, порож денное строками этой матрицы. П ространство стр ок матрицы A будем обозначать такж е через ( A) . Если А — пространство стр ок матрицы A , то матрица A называется порож даю щ ей матрицей пространства A. Простран­ ст вом столбцов матрицы A называется линейное пространство, порож денное столбцами этой матрицы. Л егко видеть, что для лю бой матрицы A пространство ее столбцов совпадает с про­ странством стр ок транспонированной матрицы. П оэтом у про­ стран ство столбцов матрицы A будем обозначать через ( A t ) и A T . Ортогональным пространством матрицы A называет­ ся линейное пространство А ^ , состоящ ее из всех тех векторов v, для к оторы х A v = 0. Матрицу, столбцы которой обр азую т базис ортогонального пространства матрицы A , назовем матри­ цей, ортогональной к A , и обозначим через A ^ . Заметим, что ортогональная матрица в общ ем случае определена не однознач­ но. Нетрудно видеть, что ядро и образ л ю бого линейного опера­ тора A совпадаю т с ортогональны м пространством и простран­ ством столбцов матрицы A этого оператора, т. е. А ± = K er A , A T = Im A . (5.14) П оэтом у из теоремы 5.3 вытекает следую щ ее утверждение. Т е о р е м а 5 .4 . Д л я любой матрицы A , сост оящ ей из n столб­ цов, справедливо равенство dim A ^ + dim A T = n.
152 Глава 5. Линейные пространства Введем три элементарных преобразования стр ок произволь­ ной матрицы: (1) умнож ение i-й строки матрицы на ненулевую константу; (2) перестановку i-й и j -й стр ок матрицы; (3) при­ бавление i-й строки матрицы к ее j -й строке. Если матрица B получена из матрицы A при помощи элементарных преобразо­ ваний строк, то будем говорить, что эти матрицы эквивалентны. Эквивалентность матриц A и B будем обозначать через A B. Т е о р е м а 5 .5 . Д л я любых эквивалентных матриц A и B их орт огональные пространства совпадают, т. е. = Б ^. Д о к а з а т е л ь с т в о . Очевидно, что при умножении компонен­ ты линейного преобразования на ненулевую константу и при пе­ рестановке компонент линейного оператора его ядро не изменя­ ется. П оэтом у в силу первого равенства в (5.14) элементарные преобразования 1-го и 2-го типов над строками матрицы не из­ меняю т ее. Следовательно, для доказательства теоремы д оста­ точн о показать, что третье элементарное преобразование строк такж е не изменяет ортогонального пространства. Рассмотрим линейное пространство V , порож денное векто­ рами v ®, . . . , ^к, и линейное пространство V ', порож денное век­ торами v®, . . . , v k . Будем полагать, что вторая система получена из первой прибавлением ее i-го вектора к j -му, т. е. vt = v t при t = j и v j = Vi + V j. Л егко видеть, что в этом случае Vj = v j —vi. Д окаж ем равенство V ^ = (V ')^ . Д ля этого рассмотрим произвольный вектор u из пространства V ^ . Очевидно, что (u , v t) = 0 для каж дого вектора v t первой системы. П оэтом у 0 = (u , v j ) + (u , v i) = (u , v j + v i) = (u , v j ). Следовательно, u G (v ')^ , и, таким образом, пространство V ^ содерж ится в пространстве (V ')^ . С другой стороны , если u G (V ')^ , то (u , vt) = 0 для каж дого вектора vt второй системы. П оэтом у 0 = К vj ) - К v i) = К v j - v i) = К vj ) . Следовательно, u G V ^ , и пространство (V ')^ содерж ится в про­ странстве V ^ . Таким образом, V ^ = (V ')^ . Теорема доказана.
5.3. Матрицы 153 Т е о р е м а 5 .6 . Д л я любой (m , n ) -матрицы A справедливо ра­ венст во dim A = dim A T . (5.15) Ч исло (5.15) называется рангом матрицы A и обозначается через rank A . Д о к а з а т е л ь с т в о . П усть dim A = k. Без ограничения общ ­ ности будем полагать, что первые k стр ок матрицы A линейно независимы, а остальные m — k стр ок матрицы являю тся их линейными комбинациями. При помощи элементарных преоб­ разований стр ок преобразуем матрицу A в эквивалентную ей матрицу B , в которой только первые k стр ок не будут нулевы­ ми. Для этого из каж дой из последних m — k стр ок матрицы A надо вы честь равную ей линейную комбинацию первых k строк. В силу предыдущей теоремы A ^ = В ^. Так как все ненулевые компоненты столбцов матрицы B сосредоточены в ее первых k строках, то легко видеть, что размерность пространства стол б­ цов матрицы B не превосходит k. Таким образом, из преды ду­ щих рассуж дений и теоремы 5.4 имеем dim A T = n — dim A ^ = n — dim B^ = dim BT ^ k = dim A. Следовательно, dim A T ^ dim A. Применяя приведенные рас­ суж дения к матрице A T , получаем неравенство dim A T ^ dim A. Теорема доказана. Теорему 5.6 мож но переформулировать так: у лю бой матри­ цы ранг систем ы ее стр ок совпадает с рангом системы ее стол б­ цов и равен рангу задаваемого ею оператора. Теперь рассмотрим вопрос о том , как, зная матрицу опера­ тора в одном базисе, найти матрицу этого оператора в другом базисе. П усть v i, v 2 , . . . , v n и v i , v ^ , . . . , v^ — два базиса n-м ер­ ного пространства V , и векторы второго базиса вы раж аю тся че­ рез векторы первого следующ ими формулами v i = a i i v i + ai2 v2 + . . . + ain v „ , v'2 = a 2i v i + a 22 v 2 + . . . + a 2n v „ , v n = an lv l + an2 v 2 + •••+ ann v n. , > (5.16)
154 Глава 5. Линейные пространства В этом случае будем говорить, что переход о т первого базиса ко втором у задается матрицей ( a ii A = ai2 a21 a 22 . . ... ani^ an2 Va 1n a 2n ... ann столбцы которой являю тся наборами координат векторов вто­ рого базиса в первом и которая называется матрицей перехода о т базиса v i, v 2 , . . . , v n к базису v i, v 2 , . . . , vn. Рассмотрим в пространстве V произвольный вектор x и его координаты ( u i , . . . , un) и ( u i , . . . , иП) в этих базисах. Тогда x = Ui vi + U2v 2 +-------- + Unvn, x = u i v i + U2v^ + •••+ unvn. Найдем формулы , выраж ающ ие набор координат u = ( u i , . . . , un) вектора x в первом базисе через его координаты U = ( u i , . . . , иП) во втором базисе. Для этого в правой части последнего равен­ ства вместо векторов vi подставим соответствую щ ие ф орм улы из (5.16) и соберем вместе слагаемые с одинаковыми множ ите­ лями v i. В результате имеем x = u i v i + u2 v^ +----------+ unvn = = u i (ai i v i + ai2 v2 + . . . + ain vn) + + u;2 (a 2 ivi + a22 v2 + . . . + a2n vn) + + un (an iv 1 + an2 v 2 + •••+ ann v n) = = (u ia ii + u^a2i + . . . + u n a n i)v i + + (u iai2 + u^a22 + . . . + unan2)v2+ + (u ia in + u2 a2n + •••+ unann) v n. Сравнивая последню ю сум м у с координатами вектора x в базисе
5.3. Матрицы 155 Vi, V2 , . . . , v ^ видим, что u i = a iiu l + a2i + . . . + ап1^п, U2 = ai2ul + a22 u2 + . . . + ап2ип, (5.18) ип = а 1пи 1 + а 2пи 2 + . . . + аппип . Равенства (5.18) мож но записать в матричной ф орм е — умнож ая матрицу перехода A на вектор-столбец и ': A n ' = и. П усть B — матрица линейного оператора B : V ^ V в ба­ зисе v i, V2 , . . . , v n . Найдем матрицу B ' этого оператора в базисе v l, v 2 , . . . , Vn . Для этого потребуется понятие обратной матри­ цы. Квадратная матрица A - i называется обратной матрицей квадратной матрицы A , если A _1A = A A _1 = E. Не каж дая квадратная матрица имеет обратн ую матрицу. П одробно обратны е матрицы будут рассм отрены ниже в разде­ ле 6.2. Здесь ж е достаточн о того очевидного ф акта (легко сле­ д ую щ его из изоморф изм а кольца квадратны х матриц и кольца соответствую щ и х операторов), что матрица л ю бого невырож ­ денного оператора имеет обратную . Л егко видеть, что линейный оператор с матрицей A из (5.17) невырожден, так как ранг этой матрицы равен n. П оэтом у матрица A _1 существует. Если A u ' = и , B 'u ' = w ' и B u = w , то A w ' = w . Следова­ тельно, B A u ' = w = A w '. У м нож ив на матрицу A - i правую и левую сторон ы последнего равенства, видим, что A - l B A u ' = A - l A w ' = w '. Таким образом, произведение A _1B A , где A — матрица перехо­ да от базиса v i, V2, . . . , v n к базису v l, v2>,. . . , v ^ будет матрицей B ' оператора B в базисе v l, v2>,. . . , v ^ Заметим, что так как B ' = A _1B A , то, очевидно, что справедливо и равенство B = A B ' A _1. П оэтом у нетрудно по­ казать, что матрица A _1 будет матрицей перехода от базиса v l, v ;2 , . . . , vn к базису v i , v 2, . . . , v ^
Глава 5. Линейные пространства 156 5.4. Определители Будем рассматривать функции вида f ( 0 1 , . . . , a i , . . . , а ” ) = = у, где ai — вектор из n -мерного линейного пространства F” , а у — элемент поля F. Функция f называется полилинейной (ли­ нейной по каж дом у своем у аргументу), если f ( а 1, . . . , a i + а ^ . . . , а ” ) = = f ( а 1, . . . , а Ь . . . , а ” ) + f ( а Ъ . . . , a i , . . . , а ” ), f ( a 1, . . . , Ла^ . . . , а ” ) = ^f ( а 1, . . . , a i , . . . , а ” ) для каж дого i £ { 1 , . . . , n } и каж дого Л £ F. Функция f называ­ ется кососиммет рической, если для всех 1 ^ i = j ^ n f ( a 1, . . . , а ^ . . . , a j , . . . , a ” ) = f ( a 1, . . . , a j , . . . , а ^ . . . , a ” ) . Покажем, что каж дая полилинейная функция f , обращ аю ­ щаяся в нуль, если среди ее аргументов есть два одинаковых, является кососимметрической. Для этого вычислим значение f , полагая, что при лю бом k = i, j ее k-й аргумент равен вектору a " , а i-й и j -й аргументы равны сумме a i + a j . В этом случае 0 — f ( a 1, . . . , a i + a j , . . . , a i + a j , . . . , а ” ) — = f ( а 1, . . . , а ^ . . . , a i , . . . , а ” ) + f ( а 1, . . . , a i , . . . , a j , . . . , а ” ) + + f ( а 1, . . . , a j , . . . , а ^ . . . , а ” ) + f ( а 1, . . . , a j , . . . , a j , . . . , а ” ) = = f ( а 1, . . . , a i , . . . , a j , . . . , а ” ) + f ( а 1, . . . , a j , . . . , a i , . . . , а ” ) . Следовательно, f ( а 1, . . . , а ^ . . . , a j , . . . , а ” ) = f ( а 1, . . . , a j , . . . , a i , . . . , а ” ), и f — кососимметрическая функция. Верно и обратное — зна­ чение кососимметрической функции с двум я одинаковыми ар­ гументами равно нулю. Д ействительно, если a i = a j = а , то f ( a 1, . . . , ..., . . . , a ” ) = f ( а 1, . . . , a i , . . . , a j , . . . , а ” ) = = —f ( а 1 , . . . , a j , . . . , a i , . . . , а ” ) = = —f ( a 1, . . . , a , . . . , a , . . . , a ” ).
5-4- Определители 157 Таким образом, f ( a i , . . . , a , . . . , a , . . . , a n) = —f ( a b . . . , a , . . . , a , . . . , a n) = 0. Ч асто оказы ваю тся полезными функции f ( a i , . . . , a n), поз­ воляющ ие разделять линейно зависимые и линейно независи­ мые системы векторов. В линейных пространствах над полем действительны х чисел такой естественной функцией векторов a i , . . . , a n является ориентированный объем V ( a i , . . . , a n) па­ раллелепипеда, построенного на этих векторах. Н етрудно пока­ зать, что V ( a i , . . . , a n) — полилинейная функция, и эта ф ун к­ ция равна нулю, если среди ее аргументов есть два одинаковых вектора! ) . П р и м е р 5 .1 2 . В двумерном действительном пространстве R 2 найдем площадь параллелограмма A B C D , построенного на век­ торах (1, 0) и (1, 2). П оместив вершину A в начало координат, получим координаты остальны х вершин: B = A + (1, 0) = (1, 0), C = A + (1, 2) = (1, 2), D = A + (1, 0) + (1, 2) = (2, 2). Очевидно, что A B C D — параллелограмм с основанием |AB| = 1 и высотой |CB| = 2, и его площадь равна 2. Такой ж е результат нетрудно получить, пользуясь полилинейностью двум ерного объема: V ((1, 0), (1, 2)) = V ((1, 0), (1, 0) + (0, 2)) = = V ((1, 0), (1, 0)) + V ((1, 0), (0, 2)) = = 0 + 2 V ((1, 0), ( 0, 1) ) = 0 + 2 = 2. □ Для n -мерного линейного пространства над произвольным полем F найдем ф ункцию f , обладаю щ ую свойствами, аналогич­ ными указанным выше свойствам объема. Эта функция долж на бы ть полилинейной и кососимметрической. Покажем, что среди таких функций есть функции, равные нулю, если их аргументы линейно зависимы, и не равные нулю в противном случае. Будем полагать, что векторы a i, a 2 , . . . , a n заданы своими координатами в базисе Vi, V2 , . . . , v n . Сначала рассм отрим слу­ чай трех векторов a i, a 2 , a 3 , заданных координатами в базисе х)См. , например, [15].
Глава 5. Линейные пространства 158 v i, V2 , V3 . Воспользовавш ись полилинейностью искомой ф ун к­ ции f , получим следующ ие равенства: 3 3 3 f (а ь а 2 , a 3) = f ( ^ 2 aiiV i, ^ a 2j v j , ^ a 3 fcv fc) i= i j= i k=i 3 3 3 ^ a i i f ( v i , ^ a 2j v j , ^ a 3 fcv fc) i= i j= i k=i 3 3 3 ^ a i i J ] a 2j f К i=i j=i 3 3 3 vj ^ a3kv fc) k=i aii ^ a 2j ^ a3kf (v i, v j , v fc) i= i j= i k=i 3 3 3 S E E a iia2j a3kf (v i , v j , v k) • i= i j= i k=i Затем из последней суммы удалим все слагаемые с нулевыми множителями f . Так как такими будут все с двум я равными аргументами, то в результате получим равенство 3 3 3 EEE a iia 2j a 3fcf (v i, v j , v fc) i= i j= i k=i i^i=j=fc=i^3 в правой части которого в каж дом слагаемом индексы i, j и к попарно различны. П оэтом у каж дый из этих индексов представим как результат действия подстановки симметрической группы S 3 на единицу, двойку или тройку, по­ сле чего снова воспользуемся кососим м етричностью функции f , чтобы в каж дом слагаемом упорядочить ее аргументы — векто­ ры v i, V2 , V3 . При этом величина f ( v n(i), v n(2), v n(3)) совпадает с f ( vi , V2 , V3), если знак подстановки п совпадает со знаком т о ж ­ дественной подстановки, т. е. п является четной, и совпадает с
5.4. Определители 159 величиной —f ( vi , v 2, v 3), если подстановка п является нечетной. Таким образом, ^ ' a lia2ja 3kf l^*=j=k=i^3 v j , v k) — ^ ' a ln(l) a2n(2) a3n(3)f ( v n(l), v n(2), v n(3)) neS3 = E a ln (l)a2n(2)a3n(3)sg n п ■f ( v l , v 2, v 3) . neS3 О бъединяя получившиеся равенства и вынося f ( vi , v 2 , v 3) изпод знака суммирования видим, что f (O l , a 2 , a 3) = f ( v l , v 2, v 3 ^ Sgn п ■a in(l) a2n(2)a3n(3). пейз (5.19) Формула (5.19) легко обобщ ается на n векторов a i , 0 2 , . . . , a n , заданных координатами в базисе v i , v 2 , . . . , v n . Нетрудно пока­ зать, что имеет место равенство f ( a l ,0 2, . . . , a n) = = f ( v i , v 2, . . . , v „ ) E sg n п ■a in (i)a 2n(2) ■■■ ann(n). (5.20) nesn Из равенства (5.20) видно, что любая полилинейная кососим м ет­ рическая функция f однозначно определяется своим значением на базисны х^ векторах v i, v 2 , . . . , v n , т. е. для полного опреде­ ления функции f достаточн о задать ее значение на векторах v i, v 2 , . . . , v „ . Далее рассмотрим наиболее интересный частный случай ра­ венства (5.20), в котором векторы a i , 0 2 , . . . , a n задаю тся ко­ ординатами в стандартном базисе e i, e 2 , . . . , en , и при этом зна­ чение f ( ei , e 2 , . . . , e n) полилинейной кососимметрической ф ун к­ ции f на векторах этого базиса равно единице. Такую ф ункцию ^ Подчеркнем, что равенство (5.20) выполнено не только в случае, ко­ гда vi, V2, . .. , vn — базис, но и когда векторы vi, v2,... , vn линейно зависи­ мы, причем ац являются уже не координатами, а просто коэффициентами линейных комбинаций.
160 Глава 5. Линейные пространства назовем определителем системы векторов и обозначим симво­ лом d e t . В этом случае равенство (5.20) записывается в виде d e t ( a 1, а 2, . . . , 'У ' П •a 1n(1)a2n(2) ••• ann(n). (5.21) П р и м е р 5 .1 3 . Д ля трех векторов (5.21) превращ ается в ф о р ­ мулу det (а®, а 2 , а з) = aiia22a33 — aiia23a32 — a®2a2ia33+ + a®2a23 a3i + a®3a2ia32 — a®3 a22a3®, слагаемые в правой части которой упорядочены в соответствии с лексикографическим порядком на множ естве вторы х стр ок (ijk ) подстановок В следующ ей теореме покажем, что функция det разделяет линейно зависимые и линейно независимые системы векторов, т. е. является искомой функцией. Т е о р е м а 5 .7 . В линейном n -мерном пространстве для лю ­ бых векторов а ®, . . . , a n det ( а®, . . . , a n) = 0, если а®, . . . , a n линейно зависимы; = 0, если а®, . . . , a n линейно независимы. Д о к а з а т е л ь с т в о . Д опустим , что векторы а®, а 2, . . . , a n линейно зависимы и a n = ^ ^ l 1 \ a i . Тогда так как в последней сумме каж дый определитель содерж ит два одинаковых аргумента. П усть теперь векторы а®, а 2 , . . . , a n линейно независимы. В этом случае векторы стандартного базиса e®, e 2, . . . , e n мож но
5- 4 - Определители 161 выразить через векторы a i , a 2 , . . . , a n . П усть = X j = li ej aa jj Из свойств функции det и равенства (5.20) видим, что 1 = det ( ei , e 2 , . . . , en) = det ( a l, a 2, . . . , a n ^ Sgn n ■61п(1)62п(2) ' ' ' enn(n). Следовательно, det ( ai , a 2 , . . . , a n) = 0. Теорема доказана. Определителем det A квадратной матрицы A = (a j ) назы­ вается определитель системы ее стр ок det A ^ ' sgn п ' a ln (l)a2n(2) ' ' ' ann(n). (5.22) П р и м е р 5 .1 4 . К ак и в предыдущ ем примере, легко видеть, что a ii det I a 2i a i2 a 22 a i3 a23 I =aiia22a33 — aiia23a32 — ai2a2ia33+ \a3l a32 a33/ + ai2a23a3i + ai3 a2ia32 — ai3a22a3i. □ Из теоремы 5.7 легко следует, что если ранг квадратной мат­ рицы совпадает с ее порядком, то ее определитель отличен от нуля, а если ранг меньше порядка, то определитель равен нулю. Из сказанного выше видно, что определитель квадратной матрицы — это полилинейная кососимметрическая функция стр о к матрицы, которая равна единице на единичной матрице. П р и м е р 5 .1 5 . Следующ ее равенство справедливо в силу ли­ нейности определителя по первой строке: (5.23)
162 Глава 5. Линейные пространства 5.5. Свойства определителей В этом разделе перечислим основные свойства определите­ лей, обеспечивающ ие успешное применение последних в реше­ нии различных задач линейной алгебры. 1) П усть A — квадратная матрица порядка n, a i , . . . , a n — ее строки, A ' — матрица размера (n — 1) х n, получающ аяся из A удалением первой строки. Тогда в силу полилинейности и кососим метричности определителя j , I a i + Л2а2 + ■■■+ AnaT det = det ( A ^ j + Л2det f A2 ) +-+ Лndet f A ' ) = det A , так как при i = 2 , . . . , n в матрице I ai есть две одинаковые строки, и, следовательно, определитель каж дой такой матрицы равен нулю. Очевидно, что установленное равенство справедли­ во не только для первой строки. П оэтом у если к любой строке квадратной матрицы прибавить линейную комбинацию других ее строк, то определитель матрицы не изменится. 2) Покажем, что определитель произведения двух квадрат­ ных матриц равен произведению их определителей. Т е о р е м а 5 .8 . Д л я лю бых квадратных матриц A и B одного порядка det A B = det A ■det B . Д о к а з а т е л ь с т в о . П усть C = A B , a j — элемент, стоящ ий на пересечении j -й строки и i-го столбца в матрице A , bi — i-я строка матрицы B , Cj — j -я строка матрицы C . Тогда Cj aj i bi i=l т. е. j -я строка матрицы C является линейной комбинацией стр о к матрицы B с коэффициентами, взятыми из j -й строки
5-5- Свойства определителей 163 матрицы A . П оэтом у для вычисления значения определителя стр о к матрицы C мож но воспользоваться ф ормулой (5.20): det A B = det C = det ( c 1, c 2, . . . , C” ) = det (b 1, b2, . . . , b” ) Sgn Па1п(1)а2п(2) " " " а” п(” ) = det B ■det A = det A ■det B . Теорема доказана. 3) П усть A и A ' — матрицы оператора А : V ^ V в базисах v 1, v 2 , . . . , v ” и v1, v 2 , . . . , v ” пространства V, B — матрица пе­ рехода о т первого базиса ко второму. Так как A ' = B - 1 A B , то в силу теоремы 5.8 det A ' = det ( B -1 A B ) = det B -1 ■det A ■det B = (5.24) = det (B 1B ) ■det A = det E ■det A = det A . Таким образом, определитель матрицы оператора не зависит о т выбора базиса, и п оэтом у м ож но говорить об определителе линейного оператора. Для вычисления определителя линейного оператора надо в пространстве выбрать базис и найти опреде­ литель матрицы оператора в этом базисе. 4) Найдем значение определителя транспонированной мат­ рицы A T = (а ^ ). Так как sg n п = sg n п - 1 , то поменяем порядок суммирования и перейдем к элементам матрицы A . В результа­ те получим равенства det A T = Е = Е Sg n П ' а 1п(1)а2п(2) ' ' ' а” п(” ) = Sg n П ' а1п-1(1)а2п-1(2) ' ' ' а” п-1(” ) = ^ ' sgn п ■ап—!(1)1ап-х (2)2 " " " ап—!(” )” . Далее в каж дом слагаемом последней суммы упорядочим мно­ ж ители по возрастанию первого индекса: 'У ' sgn п ■ап-1 (1)1ап-1 (2)2 ' ' ' ап-1 (” )”
164 Глава 5. Линейные пространства nesn E Sgn П •a 1n(1)a2n(2) •••ann(n) . Таким образом, из (5.22) следует, что det A T = det A , (5.25) и определитель любой квадратной матрицы A является полили­ нейной кососимметрической функцией столбцов этой матрицы. В следую щ ем примере используем это свойство определителей для разложения определителей из правой части равенства при­ мера 5.15. П р и м е р 5 .1 6 . Для первого определителя из правой части (5.23) имеем: Переставляя столбцы во втором и третьем определителях так, чтобы их первые строки совпали с первой строкой первого опре­ делителя, видим, что справедливы равенства:
5.5. Свойства определителей 165 Подставляя найденные ф орм улы в (5.23), приходим к равенству являющ емуся частным случаем следствия (5.25) и доказывае­ мой ниже в теореме 5.9 ф орм улы разложения определителя по столбцу. □ 5) В квадратной матрице A порядка п удалим i-ю строк у и j -й столбец. Определитель получившейся квадратной матрицы порядка n — 1 называется минором M j матрицы A . П роизве­ дение ( —1)i+j M ij называется алгебраическим дополнением A ij элемента a j матрицы A . Т е о р е м а 5 .9 . П уст ь A — квадратная матрица порядка п. Тогда для любого j £ {1, 2 , . . . , п } справедливо равенство П (5.26) i=1 Равенст во (5.26) называется разлож ением определителя по j -у столбцу. Д о к а з а т е л ь с т в о . Перечислим несколько п росты х ф актов о матрицах и их определителях, совокупность которы х позволит легко доказать настоящ ую теорему. 1. Из равенства (5.22) легко следует, что /a n det 0 \ 0 0 ... 0 \ a22 ... a2n an2 . . . arara/ (5.27) 2. П реобразуем матрицу A в матрицу A ( i j ), передвинув ее i-ю стр ок у на место первой строки, а j -й столбец на место пер­ вого столбца. Для перестановки стр ок нуж но последовательно
Глава 5. Линейные пространства 166 выполнить i — 1 транспозицию стр ок — поменять i-ю стр ок у ме­ стами с i — 1-й, затем с i — 2-й и далее соверш ать такие переста­ новки со всеми предш ествующ ими строками вплоть д о первой. А налогичные действия надо проделать и над столбцами. П оэто­ му в силу кососим метричности определителя det A ( i j ) = ( —1)i+ j 2det A = ( —1)i+ jdet A . (5.28) 3. Если i-я строка и j -й столбец квадратной матрицы A со ­ держ ат единственный ненулевой элемент a j , то в силу (5.27) и (5.28) det A = aij ( —1)i+j M ij = aij A i j . (5.29) 4. Воспользуемся линейностью определителя матрицы по первому столбцу и представим определитель матрицы A в виде сум м ы n определителей: ( a ii det ai2 a2i a22 \ani an2 I 0 ain\ ( a ii a2n ••• a \ 0 ai2 ... = det J ai2 a 2i + det ... a22 a in\ a2n a„2 a J a i„\ 0 a22 a2n 0 an2 an 0 0 \ani + J a i2 a22 a in\ a2n an2 a nn (5.30) 5. И спользуя линейность определителя по первой строке, первый определитель из сум м ы в правой части равенства (5.30) представим в виде суммы det a ii 0 0 a 22 a2n V 0 a„2 a J + det 0...00 a i2 0 a22 a23 a2n \0 a„2 a„3 an J /0 + det 0... 0 + ••• 0 . 0 a i„\ 0 a 22 . a2n - i a2n \0 an2 an n -i ann
5.5. Свойства определителей 167 n определителей, из к оторы х только первый отличен о т нуля. П оэтом у det ( a ii 0 0 ai2 a 22 a 1n\ a2n an2 . . . ann / a ii 0 = det 0 0 a 22 0 a2n an2 a J a ii A i i . 6. П овторив рассуж дения из предыдущ его пункта для i-го слагаемого из суммы в правой части равенства (5.30), видим, что ( 0 ai2 . . . ain\ det 7. aii ai2 0 an2 a = aii A i i . ann Из (5.30) и последнего равенства следует, что справедлива ф орм ула разложения определителя по первому столбцу: det A = ^ ai1A i1. i=1 8. Н етрудно видеть, что рассуж дения п.п. 4—7 справедливы для произвольного столбца определителя. Таким образом det A = Е aij A iJ. i=1 Теорема доказана. Из теоремы 5.9 и равенства (5.25) немедленно следует ф о р ­ мула разлож ения определителя по i -й строке: det A = ^ aij A ij . (5.31) j= i 6) Из теоремы 5.9 легко следует, что определитель любой верхнетреугольной (aij = 0 при i > j ) матрицы A равен произ-
Глава 5. Линейные пространства 168 ведению ее диагональных элементов: ( a ii 0 ai2 a22 ... ... ain\ a2n det a l l a22 ■■■ann. 0 (5.32) a v 0 Равенство (5.32) позволяет достаточн о просто вычислять опре­ делители больш их матриц. Ч тобы воспользоваться формулой (5.32), покажем, что произвольная матрица м ож ет бы ть пре­ образована в верхнетреугольную при помощ и двух элементар­ ных преобразований: (2) перестановки строк; (3;) прибавлении к i-й строке линейной комбинации остальны х строк. Заметим, что первое из этих преобразований умнож ает определитель мат­ рицы на —1, а второе, по свойству 1), определитель матрицы не изменяет. Рассмотрим произвольную квадратную матрицу ( a ii A = a ln ^ a 2l ai2 a 22 ■ ■ ■■■ Vanl an 2 ■■■ ann a2n (5.33) порядка n. Если все элементы первого столбца равны нулю, то det A = 0. Если это не так, то в первом столбце найдется ненуле­ вой элемент a ^ . В матрице A из каж дой j -й строки (при j = i) вычтем i-ю строку, умнож енную на a jia - 1 , и переставим первую и i-ю строки (при i = 1). В результате получим новую матрицу A' / a'ii 0 0 a l2 a22 ^n2 a ln\ a2n V / ^nn/ определитель которой либо равен определителю исходной мат­ рицы, либо, если a ii = 0, отличается о т него множителем —1. Проделав аналогичные преобразования с последними n — 1 стр о­ ками матрицы A ;, либо обнаруж им, что первые два столбца мат­ рицы A ; линейно зависимы, т. е. det A ; = 0, либо получим новую
5.5. Свойства определителей 169 матрицу « 1 0 Л" 0 V 0 a 12 a22 0 a 13 a23 a33 ' ' ' ' ' ' a2n a2n 0 <3 ' a"" i ^nn/ П овторив в общей слож ности подобные преобразования не более n — 1 раз, придем к верхнетреугольной матрице, определитель которой равен определителю исходной матрицы, умнож енному на ( —1 ) k, где k — общ ее число сделанных перестановок строк. П р и м е р 5 .1 7 . Вычислим определитель матрицы Л с к оэф ­ фициентами из Z 5 . П реобразуем эту матрицу к верхнетреуголь­ ному виду: Л r^j 0 1 2 2 3 4 2 2 1 0 0 2 2 0 3 3 2 3 3 0 1 1 2 3 2 2 1 1 0 2 2 3 4 1 2 2 0 1 0 0 2 2 0 0 3 1 1 0 3 0 2 1 2 3 3 0 2 4 3 1 1 3 4 4 1 0 0 0 2 3 3 2 0\ 1 0 0 4 4 0 1 Определитель последней матрицы равен 12 = 2 (m od 5), при этом строки переставлялись ровно один раз на первом шаге. Следовательно, det Л = —2 = 3. □ 7) П усть Л и B — произвольные квадратные матрицы по­ рядков m и n соответственно. Покажем, что det Л 0 det Л •det B . (5.34) Л 0 0 En по последним n строкам, видим, что ее определитель равен опре­ П оследовательно раскладывая определитель матрицы делителю матрицы Л . Аналогичным образом находим, что опре-
Глава 5 170 делитель матрицы A 0 0 B det Em 0 = det f A f 0 = det f A 0 Линейные пространства 0 B равен det B . Следовательно, 0 Em E” 0 0 E” det 0 B Em 0 0 B det A det B . Теперь покажем, что равенство (5.34) является частным случа­ ем равенства (5.35) с произвольной матрицей C . П реж де всего заметим, что если det B = 0, то строки матрицы в (5.35) линейно зависимы, и, сле­ довательно, ее определитель равен нулю. Если ж е det B = 0, то строки матрицы B линейно независимы, и каж дая строка мат­ рицы C является линейной комбинацией стр ок матрицы B . В этом случае справедливость равенства (5.35) следует из свой­ ства определителей, установленного в п. 1 ). 8) М атрица A = (а ^ ) называется присоединенной матрицей квадратной матрицы A , если ее i j -й элемент а^- равен алгебра­ ическому дополнению 1) A ji матрицы A . П р и м е р 5 .1 8 . Для матрицы A = 1 2 над полем Z 5 най­ 3 4 дем присоединенную матрицу A . Так как A 11 = 4, A 12 = —3 = 2, A 21 = —2 = 3 и A 22 = 1, то A = ( 4 3 ). Далее легко 2 1 видеть, что det A = 3 и 1 2 4 3 4 3 1 2 3 0 3 4 2 1 2 1 3 4 0 3 т. е. A A = det A =3 1 0 0 1 E. □ 1)Подчеркнем, что присоединенная матрица является не матрицей ал­ гебраических дополнений, а транспонированной к ней.
5.5. Свойства определителей 171 Покажем, что произвольная матрица A и ее присоединенная матрица A связаны соотнош ениями a A = det A ■E = A A . (5.36) П реж де всего заметим, что из двух равенств в (5.36) д оста­ точн о доказать одно, второе равенство будет просты м следстви­ ем первого и (5.25). П оэтом у ограничимся доказательством ле­ вого равенства. Нетрудно видеть, что сумма в правой части равенства (5.31) является произведением i-й строки матрицы A и i-го столбца присоединенной матрицы A : n n det A — ^ ^aij A ij — ^ ^ai j A ji. j= l j= l Таким образом, для доказательства (5.36) достаточн о показать, что произведение i-й строки A и j -го столбца A равно нулю при i = j. В матрице A заменим i-ю строк у ее j -й строкой и разло­ ж им определитель новой матрицы A ' по i-й строке. Так как ал­ гебраические дополнения элементов i-й строки новой матрицы совпадаю т с соответствую щ им и алгебраическими дополнениями матрицы A , то n det A ^ ^ajk A ifc. fc=l С другой стороны , i-я и j -я строки в матрице A ' одинаковы. Следовательно, определитель матрицы A ' равен нулю. Таким образом, при i = j приходим к равенствам n n ^ ' ajfcA fci^ ' ajfc A ifc = 0 , fc=l fc=l которы е заверш аю т доказательство (5.36). Из (5.36) следует, что каж дая матрица A = (a ij) с ненулевым определителем имеет обратн ую матрицу, найти к оторую мож но
172 Глава 5. Линейные пространства по ф орм уле1) a 11 a21 a1 2 .. . a2 2 . . . a 1n\ a2n an1 an2 annJ ' ' -1 / A 11 det A det A det A det A 1 A 1n A 2n det A A 21 A 12 = . . A 22 \det A 1 . . A n1 \ det A A „2 det A (5.37) A nn J det A / 2 над Z 5 из преды­ 3 4 дущ его примера найдем обратн ую матрицу. Так как det A = 3, 4 3 то 3 -1 = 2 (m od 5) и A = П р и м е р 5 .1 9 . Д ля матрицы A 2 1 1 1 2 3 4 2 ■4 2 ■3 2 2 2 1 3 1 4 2 □ П р и м е р 5 .2 0 . О бобщ ая предыдущий пример, получаем a c b d 1 1 / d -b ad — bc V —c □ a Нахождение обратны х матриц по форм уле (5.37) слишком трудоем ко для матриц больш их порядков, и п оэтом у эта ф о р ­ мула имеет в основном теоретический интерес. П одробнее об­ ратные матрицы и сп особы их вычисления будут рассмотрены ниже в разделе 6 .2 . 9) Рассмотрим важный пример вычисления определителя имеющей многочисленные приложения матрицы Вандермонда 1 1 X2 . .. 1 ... Xn \ (5.38) Vn = . . xn - i x2 . nn v*n-1 1 с элементами из поля F. 1) Здесь и далее дробь а используется для обозначения произведения ab 1.
5.5. Свойства определителей 173 Л е м м а 5 .5 . Д л я определителя матрицы Вандермонда Vn справедливо равенство det Vn = П (xi — X j). i^j<i^n (5.39) Д о к а з а т е л ь с т в о . Л емму докаж ем индукцией по n. В осн о­ вание индукции положим очевидный случай n = 2. Д опустим, что утверж дение леммы верно при n ^ m. Покажем, что оно справедливо и при n = m + 1. П реж де всего заметим, что если Xi = X j, то матрица Vm+i будет содерж ать два одинаковых столбца, и, следовательно, ее определитель будет равен нулю. П оэтом у в этом случае равен­ ство (5.39) верно. Далее будем полагать, что все Xi различны. В матрице Vm+i заменим x m+ i переменной X, после чего определитель разложим по последнему столбцу. Н етрудно ви­ деть, что в этом случае определитель преобразованной матрицы будет многочленом степени m о т X: / 1 Xi 1 ... 1 X2 ... Xm 1 \ X D (x ) = det — dm Xm + . . . + d ix + do, \^xm i m ^x2 ... ^x m ^x m / где коэф ф ициент dm — определитель матрицы Vm. Многочлен D (x ) имеет ровно m корней — X i , . . . , Xm. П оэтом у D (x ) = dm (x — x i ) ( x — X2) •••(x — Xm), где dm G F. Так как по предполож ению индукции имеет место равенство dm = n i ^j <i^m(xi — X j), то det Vm+i = D (X m + i) = = П (x i — x j ) П (x m+i — x j ) = П (x i — x j ) . i^j<i^m i^j^m i^j<i^m +i Л емма доказана. Из леммы 5.5 следует, что определитель матрицы Вандермонда отличен о т нуля тогда и только тогда, когда все Xi в (5.38) различны.
174 Глава 5. Линейные пространства Задачи 5.1. Доказать эквивалентность двух следующих определений ба­ зиса линейного векторного пространства: 1) множество векторов V является базисом пространства V, если векторы V линейно независимы и V является линейной оболочкой V ; 2) множество векторов V является базисом пространства V, если V является линейной оболочкой V и не является линейной оболочкой никакого его собственного подмножества V '. 5.2. Определить, является ли каждое из указанных множеств ли­ нейным пространством, и если является, то найти его размерность, мощность и указать базис: 1) все булевы функции трех аргументов относительно операции f V g (над полем Z 2); 2 ) все булевы функции трех аргументов относительно операции f ф g; 3) множество матриц размера 3 х 3 с элементами из Z 7; 4) все симметрические матрицы размера 3 х 3 с элементами из Z 7; 5) все кососимметрические матрицы размера 3 х 3 с элементами из Z 7; 6 ) множество всех многочленов двух переменных степени не бо­ лее 3 с коэффициентами из Z 7 . 5.3. Найти число векторов из пространства Z 32, ортогональных вектору u = 102002220101. Привести пример ненулевого вектора это­ го пространства, ортогонального самому себе. 5.4. Найти число k-мерных подпространств пространства Z^, со­ держащих данный вектор. 5.5. Как изменится матрица перехода от одного базиса к другому, если: 1) поменять местами два вектора первого базиса; 2 ) поменять местами два вектора второго базиса; 3) записать векторы обоих базисов в обратном порядке? 5.6. Найти матрицу перехода от базиса 1, x, x 2, . . . , xn к бази­ су 1,x — a, (x — a)2, . . . , (x — a)n пространства многочленов степени не выше n над полем действительных чисел. 5.7. Найти число различных линейных операторов f , действую­ щих из пространства Z^ в пространство Z™. Сколько из них имеет полный ранг (то есть dim lm f = m)? 5.8. Найти число различных матриц порядка n над Z p, p — про­ стое, имеющих ранг m.
Задачи 175 5.9. Найти число различных линейных операторов f : Z ” ^ Z ^ , которые переводят фиксированный вектор и = 0 в нулевой вектор. 5.10. Пусть V i, V 2 — произвольные линейные подпространства в некотором пространстве размерности n над полем F. Доказать, что их сумма V i + V 2 = {ж ! + Х2 : Xi е V i, Х2 е V 2 } и пересечение V i П V 2 также являются подпространствами. Привести пример подпространств V i и V 2, объединение которых V i U V 2 не является подпространством. 5.11. Пусть V 1 = (12011, 21102, 12121), V 2 = (20210, 02001,11012) над полем Z 3 . Найти dim (V 1 + V 2), dim(V 1 П V 2) и указать базисы в пространствах V i + V 2 и V i П V 2. 5.12. Пусть V i и V 2 — подпространства пространства V. Показать, что dim (Vi + V 2) = dim V i + dim V 2 —dim (Vi П V 2). 5.13. Пусть V — линейное пространство и U — его произвольное подпространство. Доказать, что (U^)^ = U. 5.14. Привести пример такого подпространства U в линейном ко­ нечномерном пространстве над конечным полем, что U^ = U. 5.15. Показать, что существует ровно одна полилинейная функ­ ция f : (Z” )” ^ Z 2, равная нулю на линейно зависимых аргументах и равная единице в противном случае. 5.16. Найти число различных полилинейных кососимметрических функций f : (Z” )” ^ Zp, p — простое, равных нулю на линейно зави­ симых аргументах и неравных нулю в противном случае. 5.17. Показать, что для любых квадратных матриц A и B одина­ кового порядка det (A + B) < det A + det B. 5.18. Пусть A — квадратная матрица порядка n и ранга k. Найти ранг присоединенной матрицы A . 5.19. Показать, что если в квадратной матрице есть строка из еди­ ниц, то сумма всех алгебраических дополнений этой матрицы равна ее определителю. 5.20. Матрица Hn над R порядка 2” называется матрицей Ада-
176 Глава 5. Линейные пространства 5.21. Воспользовавшись методом индукции, указать способ вы­ числения произведения Hnx матрицы Hn на произвольный действи­ тельный вектор-столбец x длины 2n, использующий по порядку не более n2n операций с действительными числами. 5.22. Доказать, что матрица Адамара обладает максимальным (по модулю) определителем среди всех матриц порядка 2n над R с элементами ±1. 5.23. Матрица Fn = ( / j ) над C порядка n называется матрицей дискретного преобразования Фурье, если = ^4* 1)(j 1), где £n — первообразный корень n-й степени из единицы (£n = 1 и ^ = 1 при 0 < k < n). Найти det Fn и F n 1.
Глава 6 Пространства с операторами В этой главе рассм атриваю тся различные вопросы, связанные с решением систем линейных уравнений, и изучается структура линейных пространств с заданными на них линейными опера­ торами. Материал этой главы сущ ественным образом использу­ ется далее в восьмой и девятой главах при изучении конечных полей и алгоритмов. С таким, ориентированным на конечные поля, «прикладны м » характером данной главы связан ряд осо­ бенностей, основная из к оторы х порож дена тем, что при вы­ числениях в конечных полях от су т ств у ю т ошибки округления. П оэтом у в излагаемых ниже методах решения линейных систем вопросы точн ости не рассматриваю тся, и точн ость этих методов в «бесконечной» линейной алгебре м ож ет оказаться неудовле­ творительной. 6.1. Системы линейных уравнений Над полем F рассм отрим систем у из m линейных уравнений ацЖ1 + а12 Х2 + . . . + а1” X” = &1, ' а21Х1 + а22 X2 + . . . + а2” X” = b2, (6.1) ат 1 х 1 + ат2 х 2 + . . . + ат ” х ” — bm J с коэффициентами а ^ , свободными членами bi и c n неизвест­ ными Xi. Э ту систем у мож но записать в виде матричного урав-
178 Глава 6. Пространства с операторами нения ( a ii ai2 a21 a22 \ami am2 a 1n \ a 2n x1 x2 a xn = b1 b2 (6.2) bm с (m , п )-матрицей Л = ( a j ), составленной из коэф ф ициентов ф ункций систем ы (6.1), вектором -столбцом свободны х членов b = (bi) и вектором -столбцом неизвестных х = ( xi ). М атричное уравнение называется согласованным, если оно имеет хотя бы одно решение. Далее будем изучать решения уравнения (6.2), а следовательно, и решения системы (6.1). П реж де всего выясним, в каких случаях уравнение (6.2) со ­ гласовано. Для этого из матрицы Л и вектора b рассматривае­ мого уравнения составим новую матрицу (Л |b), добавив к мат­ рице Л в качестве нового столбца вектор b и отделив его при этом от Л вертикальной линией. Получивш аяся матрица a 11 a21 a 12 a22 ■ ■ ■ ■ a 1n a2n b1 b2 am1 am2 ■ ■ amn bm называется расширенной матрицей уравнения (6.2) (а такж е и системы (6.1)). Имеет место следующ ий критерий согласованно­ сти матричного уравнения. Т е о р е м а 6.1 (Кронекера — Капелли). Уравнение Л х = b с ( m, n ) -мат рицей Л имеет реш ение тогда и только тогда, ко­ гда ранг матрицы Л равен рангу расширенной матрицы (Л| b). Д о к а з а т е л ь с т в о . Если rank Л = rank (Л |b), то вектор b является линейной комбинацией столбцов a i , . . . , a n матрицы Л , т. е. b — a i a i + ■■■+ a«an (6.3) Т ак как равенство (6.3) эквивалентно матричному равенству Л а = b, то очевидно, что вектор а = ( a i , . . . , a n) будет ре­ шением уравнения Л х = b.
6.1. Системы линейных уравнений 179 С другой стороны , если вектор-столбец а = ( a i , . . . , a n) яв­ ляется решением уравнения A x = b, то, очевидно, справедливо равенство (6.3), из которого немедленно следует равенство ран­ гов матриц A и ( A |b). Теорема доказана. Т е о р е м а 6 .2 . Если уравнение A x = b с (m , n ) -матрицей A имеет хот я бы одно реш ение, то все реш ения эт ого уравнения образуют см еж ны й класс пространства Fn по орт огональному пространству матрицы A . Д о к а з а т е л ь с т в о . Д опустим, что уравнение A x = b имеет решение xo. В этом случае для доказательства теоремы д оста­ точн о показать, что лю бой вектор, лежащий с вектором xo в одном смеж ном классе пространства Fn по ортогональному про­ стран ству матрицы A , является решением уравнения A x = b, и наоборот, лю бое решение рассматриваемого уравнения принад­ леж ит том у ж е см еж ном у классу пространства Fn по ор т ого­ нальному пространству матрицы A , что и вектор xo. Рассмотрим ортогональное пространство А ^ матрицы A . Д ля каж дого вектора v из пространства А ^ справедливы ра­ венства A ( x 0 + v ) = A x 0 + A v = b + 0 = b. Следовательно, вектор xo + v является решением уравнения A x = b. С другой стороны , если y — решение рассматривае­ мого уравнения, то A ( y — x 0) = A y — A x 0 = b — b = 0. П оэтому, y — x 0 G A ^ . Следовательно, y принадлежит том у ж е см еж н ом у классу пространства Fn по А ^ , что и вектор x 0 . Теорема доказана. Из доказанной теоремы следует, что для нахождения всех решений уравнения A x = b достаточн о решить две задачи: 1) найти хотя бы одно решение x 0 этого уравнения, такое реше­ ние называется част ным; 2) найти ортогональное пространство матрицы A .
Глава 6. Пространства с операторами 180 О ртогональное пространство матрицы A является решением однородного уравнения A x = 0 (соответствую щ ая этом у урав­ нению система линейных уравнений такж е называется однород­ ной), а базис этого пространства называется фундаментальной сист емой реш ений уравнения (6.2) (и системы (6.1)). Решения задач 1) и 2) рассм атриваю тся в двух следую щ их разделах. 6.2. Обращение невырожденных матриц Квадратная матрица A называется невырож денной , если ее строки линейно независимы. Из равенства (5.25) и теоремы 5.7 следует, что столбцы невырожденной матрицы такж е линейно независимы. Л е м м а 6 .1 (А лгоритм Гаусса). Квадратную невы рож ден­ ную матрицу при помощи элементарных преобразований строк м ож н о преобразовать в единичную матрицу. Д о к а з а т е л ь с т в о . Теорему докаж ем индукцией по поряд­ ку матрицы. В основание индукции положим очевидный случай матрицы первого порядка. Далее предполож им, что утверж де­ ние теоремы верно для всех невырож денных матриц, порядок которы х не превосходит (n —1). Рассмотрим произвольную невы­ рож денную матрицу ( ai i A a 2l \anl ai2 ■ ■ ■ a22 ■■■ an2 ■ ■ ■ ain\ a2n (6.4) ann/ порядка n. Так как матрица невырождена, то в ее первом стол б­ це найдется хотя бы один ненулевой элемент. В матрице A пере­ ставим строки так, чтобы после перестановки первый элемент первой строки стал ненулевым. После этого умнож им первую стр ок у матрицы на константу из F так, чтобы ее первый элемент стал равным единице. Затем из каж дой строки вычтем первую
6.2. Обращение невырожденных матриц 181 строку, умнож енную на первый элемент уменьшаемой строки. В результате получим новую матрицу A' = 1 0 a 12 ■ ■ a 1n^ a22 ■ ■ a2n 0 an2 ■ a' ^nn/j в которой в первом столбце ненулевой элемент встречается тол ь­ ко один раз — в первой строке, где он равен единице. Так как последние (n — 1) стр о к матрицы A ' линейно независимы, то, следовательно, матрица, получающ аяся из матрицы A ' удале­ нием первой строки и первого столбца, будет невырожденной матрицей порядка (n — 1), и по предполож ению индукции эту матрицу мож но преобразовать в единичную матрицу при помо­ щи элементарных преобразований строк. Л егко видеть, что ана­ логичные преобразования, выполненные над последними (n — 1) строками матрицы A ', преобразую т ее в матрицу A" П 0 a 12 1 a1n\ 0 \0 0 1 в которой на пересечении последних (n — 1) стр ок и последних (n — 1) столбцов стои т единичная матрица. Теперь из первой строки матрицы A '' вычтем втор ую строку, умнож енную на a®2 , третью строку, умнож енную на а®з, и т .д . вплоть д о последней строки, умноженной на a®n . Очевидно, что в результате получим единичную матрицу. Лемма доказана. Вместе с элементарными преобразованиями стр ок будем так­ ж е рассм атривать и аналогичные элементарные преобразования столбцов. Л егко видеть, что справедливо следую щ ее утверж де­ ние. Л е м м а 6 .2 . Квадратную невы рож денную мат рицу при по­ м ощ и элементарных преобразований столбцов м ож н о преобра­ зоват ь в единичную матрицу.
182 Глава 6. Пространства с операторами Заметим, что применение первого элементарного преобразо­ вания стр о к к данной матрице, т. е. умножение ее i-й строки на константу а, сводится к умнож ению этой матрицы на единич­ ную матрицу, в которой вместо единицы на пересечении i-й стр о­ ки и i-го столбца стои т а , применение втор ого элементарного преобразования к сводится к умнож ению матрицы слева на еди­ ничную матрицу с переставленными i-й и j -й строками, а приме­ нение третьего элементарного преобразования — к умнож ению слева на единичную матрицу с дополнительной единицей, ст о ­ ящей на пересечении j -й строки и i-го столбца. Например, для перестановки первой и четвертой стр ок ниж нетреугольной мат­ рицы четвертого порядка имеем 0 0 0 1 1 1 1 0 0 1 0 1 0 1 1 1 0 1 0 0 0 0 1 0 1 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0 1 0 0 0 0 1 1 0 а для прибавления к первой строке этой матрицы ее четвертой строки — 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 1 1 0 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 1 2 1 1 1 1 1 Таким образом, для каж дой невырожденной матрицы A най­ дется матрица B , являющ аяся произведением матриц, соответ­ ствую щ и х выполненным элементарным преобразованиям строк, и такая, что B A = E. Аналогичным образом мож но показать, что каж дое элемен­ тарное преобразование столбцов матрицы эквивалентно ум но­ ж ению этой матрицы справа на соответствую щ ую ему матрицу. П оэтом у в силу леммы 6.2 для каж дой невырожденной матрицы A найдется матрица C , являющ аяся произведением матриц, со ­ ответствую щ и х элементарным преобразованиям столбцов, пре­ образую щ их A в единичную матрицу, такая, что A C = E . Так как C = (B A )C = B (A C ) = B,
6.2. Обращение невырожденных матриц то C = B = A 183 1, т. е. каж дая невырожденная матрица порядка 1 такую , что n имеет единственную обратную матрицу A A - 1 A = A A -1 = E ” . О тметим, что множ ество невырож денных матриц одного порядка образует группу с операцией умнож ения1) . Из сказанного выше следует п ростой сп особ обращения невы­ рож денной матрицы A . Сначала элементарными преобразова­ ниями стр ок матрица A преобразуется в единичную матрицу, или, что эквивалентно, матрица A умнож ается слева на некото­ рую матрицу B такую , что B A = E . Затем аналогичные преоб­ разования производим над единичной матрицей, т. е. умножаем единичную матрицу на ту ж е матрицу B и, следовательно, име­ ем B E = B . Очевидно, что матрица, получившаяся из единич­ ной матрицы, будет обратной к матрице A . П р и м е р 6 .1 . Применим сформулированный выше алгоритм обращения невырож денных матриц к матрице над Z 3 . Элементарные преобразования над обращаемой и единич­ ной матрицами будем выполнять одновременно, разделив эти матрицы вертикальной линией. Л егко видеть, что справедливы следующ ие соотнош ения: 1 0 0 1 1 0 0 0 0 0 2 1 1 1 0 0 0 1 0 1 1 1 1 1 1 0 2 1 0 0 0 1 0 0 0 0 2 2 1 1 1 0 1 2 1 0 1 0 0 х)Этот факт, так же как и существование обратной матрицы, является следствием изоморфизма колец матриц и операторов.
184 Глава 6. Пространства с операторами 6.3. Решение линейных матричных уравнений 1. С и с т е м а т и ч е с к и е м а т р и ц ы . М атрица A называется си­ стематической, если она состои т из двух блоков — единич­ ной матрицы порядка m и следующ ей за ней матрицы размера m х (n — m ), т.е. A _ /1 0 ... 0 0 ai m+i ••• ain \ 0 1 ... 0 0 a2 m+l ••• a 2n \0 0 ... 0 1 amm+l ••• amn/ (6 5 ) Покажем, что произвольную матрицу просты ми преобразова­ ниями стр ок и столбцов мож но превратить в систем атическую . И меет место следую щ ее утверж дение. Л е м м а 6 .3 . Л юбую матрицу при помощи элементарных преобразований строк, удаления нулевых строк и перестановки столбцов м ож н о преобразовать в сист емат ическую матрицу. Д о к а з а т е л ь с т в о . Рассмотрим (m , п)-м атрицу A ранга k. Переставим строки и столбцы этой матрицы так, чтобы в новой матрице первые k стр ок и столбцов были линейно независимы. Затем из каж дой из последних m — k стр ок матрицы A вычтем равную ей линейную комбинацию первых k строк. В преобразо­ ванной матрице A последние k стр ок станут нулевыми. Удалим эти строки. Далее рассм отрим матрицу Ад., состоя щ ую из пер­ вых k столбцов матрицы А ;. Очевидно, что эта матрица будет невырожденной. Следовательно, найдется последовательность элементарных преобразований стр ок R, переводящая матрицу А д в единичную матрицу порядка k. Л егко видеть, что эта же последовательность R преобразует матрицу А ; в эквивалентную ей систем атическую матрицу. Л емма доказана. М атрицы A и B называются перестановочно эквивалентны­ м и , если матрицу A мож но преобразовать в матрицу B элемен­ тарными преобразованиями стр ок и перестановкой столбцов. Заметим, что любая (m , п)-м атрица B ранга k м ож ет бы ть получена перестановкой столбцов из подходящей (m , п)-м атрицы A ранга k с первыми k линейно независимыми столбцами.
6.3. Решение линейных матричных уравнений 185 Следовательно, любая (m , п)-м атрица ранга к перестановочно эквивалентна некоторой систематической (к, п)-матрице. Для преобразования матрицы в перестановочно эквивалент­ ную ей систем атическую матрицу удобно использовать модиф и­ кацию приведенного в предыдущ ем разделе алгоритма преоб­ разования невырожденной матрицы в единичную. Отличие м о­ дификации о т исходного алгоритма состои т только в том, что при выполнении очередного шага алгоритма над произвольной матрицей м ож ет возникнуть ситуация, когда преобразуемый на этом шаге столбец будет равен линейной комбинации преды ду­ щих столбцов. В этом случае преобразуемый столбец надо про­ сто пропустить и продолж ить выполнение алгоритма со следую ­ щим столбцом. Заканчивается выполнение алгоритма удалени­ ем нулевых стр о к (если такие строки появятся) и перестановкой пропущ енных столбцов в конец матрицы. П р и м е р 6 .2 . П реобразуем указанную далее матрицу A над Z 3 в перестановочно эквивалентную ей систем атическую матри­ цу А ; . Применяя для этого описанный выше алгоритм, после­ довательно получим пять приведенных ниже матриц. Первые четыре матрицы эквивалентны матрице A , а последняя, являющаяся систематической, перестановочно эквивалентна: (1 2 A 0 1 1 1 1 2 0 1 0 1 2 1 1 2 2 1 Vo 0 1 2 (1 1 0 0 1 0 1 0 0 0 0 1 0 0 0 1 2 1 0 0 0 0 0 ''NJ 1 0 1 0 0 0 1 1 0 1 1 0 1 1 2 1 1 0 1 2 0 0 1 2 0 1 1 2 2 2 1 2 0\ 1 2 1 0 0 1 0 1 1 1 1 1 0 0 0 0 0 1 0 1 0 0 1 0 0 1 0 0 0 1 0 0\ 2 1 0 0 0 0 0 1 0 0 0 0 0 0 2 1 0 1 0 0 2 0 2 1 0 0\ 2] . 1 На первом шаге алгоритма первая строка матрицы А прибав­ лена к ее второй строке. На втором шаге вторая строка новой
186 Глава 6. Пространства с операторами матрицы прибавлена к удвоенной третьей и четвертой строкам. Л егко видеть, что в полученной матрице третий столбец явля­ ется линейной комбинацией первых двух столбцов. П оэтом у на третьем шаге третий столбец оставлен без изменений, преоб­ разован четвертый столбец — третья строка матрицы удвоена и прибавлена ко второй. На четвертом шаге к первой строке прибавляются удвоенные вторая и третья строки. Наконец на последнем шаге переставлены третий и четвертый столбцы , а последняя строка, состоящ ая только из нулей, удалена. П олу­ ченная в результате преобразований матрица является система­ тической. □ 2. Р е ш е н и е о д н о р о д н о г о у р а в н е н и я . Приведем алгоритм, которы й находит базис ортогонального пространства произволь­ ной (m , ^ -м а тр и ц ы . Сначала рассм отрим частный случай — опиш ем алгоритм, решающий данную задачу для систематической матрицы. Для этого систематической матрице A = ^EmA^ поставим в со о т ­ ветствие (n, ш,)-матрицу A ' = ( A J, которая состои т из двух \E n -m / блоков — матрицы —A и находящейся под ней единичной мат­ рицы порядка (n —m ). Л егко видеть, что для произведения A A ' справедливы равенства: a a ' = ( E ma ) ( e : A J = ( A — a ) = ° Таким образом, пространство A 'T , порож денное столбцами мат­ рицы A ', входит в ортогональное пространство матрицы A . Так как размерность этого пространства равна n — m, а размерность пространства стр о к матрицы A равна m, т. е. dim A 'T + d im А = = n, то из теоремы 5.4 легко следует, что А ^ = A 'T . Таким об­ разом, в качестве базиса ортогонального пространства матрицы A мож но взять столбцы матрицы A ' . Приведенный алгоритм очевидным образом модифицирует­ ся в алгоритм нахождения базиса ортогонального простран­ ства произвольной матрицы. М атрицу A надо преобразовать в
6.3. Решение линейных матричных уравнений 187 перестановочно эквивалентную ей систем атическую матрицу B . При этом следует запомнить все выполненные в процессе преоб­ разования перестановки столбцов — действую щ ую на множ естве столбцов подстановку п G Sn . Затем для матрицы B описанным выше способом строится матрица B ; , столбцы которой порож да­ ю т ортогональное пространство матрицы B . Наконец на строки матрицы B ; действуем подстановкой п - 1, восстанавливая исход­ ный порядок координат. Полученная матрица C будет п орож ­ дать ортогональное пространство исходной матрицы A . П р и м е р 6 .3 . Для матрицы A из рассм отренного выше при­ мера 6.2 построим матрицу, п орож даю щ ую ее ортогональное пространство. Сначала преобразуем матрицу A в перестановоч­ но эквивалентную ей систем атическую матрицу B . Из приме­ ра 6.2 имеем A 1 2 0 0 1 0 1 2 0 1 1 1 1 2 0 1 1 0 1 2 0 1 2 I B 1 0 0 2 0 0 = [ 0 1 0 1 1 2 0 0 1 0 0 1 2 При преобразовании A в B переставлялись третий и четвер­ тый столбцы . Д ля матрицы B легко находим порож даю щ ую ее ор/огон а л ьн ое пространство матрицу B ;: умнож ая матрицу 2 0 0 1 0 0 13 = [1 1 2 1 на —1, получаем матрицу [ 2 2 1 I , к кото0 0 1 0 0 2 рой снизу приписываем единичную матрицу третьего порядка. Затем в матрице B ; выполняем обратн ую к ранее выполненной перестановку стр ок — снова меняем местами третью и четвер­ т у ю строки. В результате имеем B' 1 2 0 2 0 1 0 0 1 2 0 0 1 0 0 I 0 0 1 , C = 1 2 1 0 2 0 1 0 0 0 0 1 0 2 0 I 0 0 1
Глава 6. Пространства с операторами 188 Непосредственной проверкой легко убедиться в справедливости равенства Л С = 0, и так как rank C + rank Л = 6 , то C — искомая матрица. □ И спользуя приведенный в предыдущ ем разделе алгоритм об­ ращения невырож денных матриц, мож но легко решить уравне­ ние Л х = b с невырожденной квадратной матрицей Л . Для решения этого уравнения д остаточн о обрати ть матрицу Л и ум нож ить найденную матрицу Л -1 на вектор b. Действительно, умнож ая матрицу Л -1 на левую и правую части рассматривае­ мого уравнения, видим, что Л 1b = Л 1Л х = Е х = х . Следовательно, решением уравнения Л х = b с невырожденной матрицей Л является вектор Л - 1Ь. Рассмотрим простой при­ мер. П р и м е р 6 .4 . Решим над Z 3 матричное уравнение М атрица из этого уравнения была обращ ена в примере 6.1. Ис­ пользуя его результат, имеем Таким образом, решением рассм атриваем ого уравнения являет­ ся вектор-столбец ( 121 ). □ Заметим, что для решения уравнения Л х = b с невырож ­ денной матрицей Л необязательно эту матрицу обращ ать. Д о­ статочно выполнить над вектором b действия, преобразующ ие матрицу Л в единичную матрицу. П р и м е р 6 .5 . Решим уравнение Л х = b, в к отором матри­ ца Л такая же, как и в предыдущем примере, а вектор b равен
6.3. Решение линейных матричных уравнений 189 (110). Элементарные преобразования над матрицей А и векто­ ром b будем выполнять одновременно, добавив вектор b к стол б­ цам матрицы A . Выполняя такие ж е преобразования, как и в примере 6.1, видим, что Следовательно, ж = (201). □ Рассмотренный выше алгоритм нахождения базиса ор т ого­ нального пространства матрицы позволяет показать, что лю бое подпространство линейного пространства является в некотором смы сле аналогом нормальных подгрупп и идеалов, а лю бой ли­ нейный оператор — аналогом гом оморф изма. Точнее, справед­ ливо следующ ее утверждение. Т е о р е м а 6 .3 . Д л я любого подпространства U конечномер­ ного пространства V найдется такой линейный оператор A : V ^ V , что U = Ker A . Д о к а з а т е л ь с т в о . Зафиксируем в n -мерном пространстве V базис V . П усть k = dim U , векторы u i , . . . , ид обр азую т базис в U и являю тся строками матрицы U . П усть, далее, векторы v i , . . . , v n - k обр азую т базис ортогонального пространства мат­ рицы U и являю тся строками матрицы U ; . Так как строки мат­ рицы U обр азую т базис ортогонального пространства матрицы U ', то подпространство U будет ядром оператора A , матрицей которого в базисе V является U ; . Теорема доказана. 3. О б щ и й с л у ч а й . Теперь приведем алгоритм нахождения ре­ шения согласованного уравнения А ж = b в общ ем случае с нену­ левой правой частью . Для этого сначала найдем частное реше­ ние этого уравнения в случае, когда матрица A = (E m B ) си­ стематическая. Такое решение находится легко. Например, из равенств
Глава 6. Пространства с операторами 190 E mb + BO = b следует, что вектор будет частным решением рассматрива- емого уравнения A x = b. Далее рассм отрим уравнение с несистематической (m , n )матрицей A ранга m, в которой первые m столбцов линейно независимы. Л егко видеть, что при помощи только элементар­ ных преобразований стр ок матрица A м ож ет бы ть преобразо­ вана в эквивалентную ей систем атическую матрицу B . Ранее бы ло показано (с. 182), что выполнение л ю бого элементарного преобразования стр ок квадратной матрицы сводится к умнож е­ нию этой матрицы слева на некоторую матрицу определенного вида. А налогичное утверж дение справедливо и для матриц про­ извольных размеров. Например, легко видеть, что умножение произвольной (m , ^ -м а т р и ц ы A слева на квадратную матрицу порядка m, получаю щ ую ся из единичной матрицы того ж е по­ рядка добавлением единицы на пересечение i-й строки и j -го столбца, соответствует добавлению к i-й строке матрицы A ее j -й строки. Следовательно, для любой (m , ^ -м а т р и ц ы A ранга m, в которой первые m столбцов линейно независимы, найдется квадратная матрица C порядка m, умножение на к оторую сле­ ва преобразует матрицу A в эквивалентную ей систематическую матрицу B . Так как B x = C A x = C b, то одновременное выполнение над строками матрицы A и над координатами вектора b элементарных преобразований, пере­ водящ их A в B , преобразует уравнение A x = b в уравнение Вш = C b, решения которого совпадаю т с решениями исходно­ го уравнения. Так как матрица B систематическая, то векторстолбец (b', O), где b' = C b, будет частным решением уравнения A x = b. Очевидным образом приведенный алгоритм м ож но ис­ пользовать и для решений уравнений с произвольными матри­ цами.
6.3. Решение линейных матричных уравнений 191 П р и м е р 6 .6 . Найдем все решения уравнения /1 2 1 0 11 01 1 0 0\ ( жЛ 1 Х2 1 2 0 V0 1 1 0 1 2 2 2 12 2 / \ xej 1 (6.6) 1 Решения однородного уравнения с такой ж е матрицей, как и в (6.6), были найдены в примере 6.3, где, в частности, был най­ ден ранг этой матрицы, равный трем. П оэтом у для определе­ ния всех решений уравнения (6.6) надо определить, будет ли это уравнение согласованным, и если оно согласовано, то найти какое-нибудь его частное решение. Сделаем это описанным вы­ ше способом . Элементарные преобразования над строками мат­ рицы и координатами вектора будем выполнять одновременно, добавив в матрицу коэф ф ициентов в качестве дополнительного столбца вектор свободны х членов. Из двух следую щ их преобра­ зований 1 0 0 1 0 1 1 0 2 2 1 2 1 2 1 1 0 0 1 0 1 0 1 2 1 1 0 1 1 2 2 1 0 2 1 0 0 1 1 1 0 1 0 1 1 2 1 1 2 0 1 0 1 2 2 2 1/ 1 1 0 1 1 2 1 1 0 1 0 0 0 0 2 0 0 2 1\ 0 2 0 1 0 1 0 1 которы е аналогичны двум первым преобразованиям из приме­ ра 6.2, видно, что ранг расширенной матрицы равен четырем. Таким образом, система (6.6) решений не имеет. □ П р и м е р 6 .7 . Поменяем вектор в правой части (6.6) и найдем все решения нового уравнения 1 1 0 1 1 0 2 0 1 1 0 1 0 1 1 0 1 2 0 2 2 1 2 2 ( жЛ Х2 w 1 1 1 1 (6.7)
192 Глава 6. Пространства с операторами Д ля этого над расширенной матрицей системы (6.7) выполним первые четыре преобразования из примера 6.2. Эти преобра­ зования состоя т в следую щ ем : 1) первую стр ок у расширенной матрицы прибавим к ее второй строке; 2) втор ую стр ок у новой матрицы прибавим к удвоенной третьей и четвертой строкам ; 3) третью строк у матрицы удвоим и прибавим ко второй стр о­ ке; 4) к первой строке прибавим удвоенные втор ую и третью строки. В результате этих преобразований получим последова­ тельность эквивалентных матриц 1 2 0 0 r^J 1 0 1 2 1 0 1 1 1 1 0 1 1 0 1 1 2 1 1 0 1 1 2 2 2 1 0 0 1 2 0 1 1 2 2 2 1 1 1 2 1 2 1 1 1 0 1 1 1 0 1 1 1\ 1 0 0 0 1 0 2 0 1 2 0 1 1 1 1 2 0 1 0 1 2 1 1 1 2 r^ j V 1 0 0 1 0 1 0 0 2 0 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0^ 1 0 0 1 2 1 0 1 0 2 1\ 1 0 0 0 0 0 0 0 1 0 0 1 2 0 0 0 0 r^J последняя из к оторы х с точ н остью д о перестановки двух стол б­ цов является систематической. Л егко видеть, что ранг матрицы нового уравнения /1 0 0 2 00 0\ 1 1 0 1 2 1 1 0 V0 0 0 0 0 2 10 00 1 0/ 0 равен рангу расширенной матрицы. Следовательно, решение су ­ ществует. В матрице нового уравнения сум м а первого, второго и удвоенного четвертого столбцов равна вектору, стоящ ему в правой части этого уравнения. П оэтом у вектор (110200) будет частным решением последнего уравнения, а следовательно, и
6.3. Решение линейных матричных уравнений 193 уравнения (6.7). Наконец каж дое решение этих уравнений яв­ ляется суммой найденного частного решения и н екоторого век­ тора из ортогонального пространства матрицы из (6.6), которое бы ло найдено в примере 6.3. Следовательно, каж дое решение уравнения (6.7) представляется в виде суммы (110200) + Ai (121000) + Л2(020010) + Аз(010201), где Ai, Л2 и Аз — произвольные константы из Z 3 . □ 4 . Ф о р м у л ы К р а м е р а . Снова рассм отрим уравнение Аж = b с невырожденной квадратной матрицей А . Из (5.37) следует, что для его решения х = A - 1b справедливо равенство / жД det A 11 A ,1 det A &k det A\ / М ж, A ij det A Ai det A det A A in \det A A in det A A nn det A / /E " = ib idAk\ A nj = 1 г det A n. A i , n i=1 b bi det A/ (6.8 С другой стороны , пусть A j — матрица, полученная из матрицы А заменой ее j -го столбца столбцом свободны х членов b. Так \Жп/ \bn/ как det А = E n = i аг, А г ,, то, разложив det А , по j -у столбцу, получим <! t e d t e d ^ ац .. . bi . . a 1n^ аг1 .. . Ьг . . an ьгА г,. (6.9) г=1 Vani ... bn . . ann/ Сравнивая (6.8) с (6.9), видим, что det А , ж, = , j det А j = 1 , 2 , . . . , n. (6.10) Таким образом, для нахождения i-й компоненты решения урав­ нения А х = b с невырожденной квадратной матрицей А сле­ дует: 1) в матрице А заменить i-й столбец вектором b; 2) вы­ числить определитель новой матрицы; 3) разделить найденный определитель на определитель матрицы А .
194 Глава 6. Пространства с операторами Формулы (6.10) называются формулами Крамера. В ы чис­ ление определителей даж е для матриц относительно неболь­ ших порядков достаточн о трудоемкая задача. П оэтом у формулы Крамера имею т более теоретическое, нежели прикладное значе­ ние. 6.4. Инвариантные подпространства 1. Ц и к л и ч е с к и е п о д п р о с т р а н с т в а . Будем рассматривать nмерное линейное пространство V над полем F вместе с опреде­ ленным на этом пространстве линейным оператором A : V ^ V. П одпространство U С V называется инвариантным от носи­ т ельно оператора A , если A (U ) С U. Если v £ Ker A , то A ( v ) = 0 £ Ker A . Следовательно, ядро оператора является его инвариантным пространством. Так как A (v ) £ Im A для л ю бого v, то образ оператора такж е будет его инвариантным простран­ ством . П усть v — вектор из V . Найдем минимальное инвариантное подпространство U, содерж ащ ее v. Д ействуя на v оператором A , получим последовательность векторов v, A ( v ) , . . . , A i ( v ) , . . . . Если в этой последовательности первые к векторов линейно независимы, а вектор A k(v ) является линейной комбинацией A k(v ) = а ^_1 A k -1 (v ) + afc_2A fc_ 2(v ) +--------+ а 1A ( v ) + аov (6.11) предыдущ их, то векторы v , A ( v ) , . . . , A k-1 ( v) обр азую т базис инвариантного пространства, так как они линейно независимы и для лю бой линейной комбинации v o v + V 1A ( v ) + - ■•+Vfc_1A k_ 1(v ) этих векторов их образ A (v o v + V1A(v) +---------+ Vfc_1Afc-1(v )) = = v o A (v ) + V1A 2(v ) +-------- + vfc_ 2A fc_ 1(v ) + v fc_1 A k(v ) = = vfc_1aov + (vo + Vfc_1a1)A(v) + (v1 + vfc_1 a 2 )A 2(v ) + . . . ------+ (vk _2 + v fc_1 afc_ 1) A fc_ 1(v )) такж е является их линейной комбинацией. В ектор v называет­ ся циклическим вектором, порож дающ им пространство U. П ро­
6.4. Инвариантные подпространства 195 стран ство с циклическим вектором называется циклическим пространством. П р и м е р 6 .8 . В примере 4.18 на с. 122 бы ло построено поле F из 27 элементов — поле Жз[х]/(х 3 + 2х + 1) вы четов по м о­ дулю неприводимого над Z 3 многочлена х 3 + 2х + 1. Нетрудно показать, что элементы f (х ) этого поля составл яю т трехмерное линейное пространство V над полем Z 3 с базисом 1, х, х 2, а от об­ ражение A : f (х) ^ x f (х) будет линейным оператором. Так как A (1 ) = х, А (х ) = х 2 и А ( х 2) = х + 2 , то V с действую щ им на нем оператором A будет циклическим пространством, порож денным циклическим вектором 1 . □ В циклическом пространстве U с циклическим вектором v, для которого справедливо ( 6 . 11 ), матрицей оператора A в базисе V = { v , A ( v ) , . . . , A k -1 ( v ) } будет матрица 0 •• ■ 0 0 0 1 •• ■ 0 •• ■ 0 0 0 •• ■ 1 0 1 Ау = ao 'N a1 a2 . (6. a k -1 / В справедливости (6.12) легко убедиться, последовательно ум но­ ж ив матрицу А у на базисные векторы -столбцы : v = ( 1 , 0 , 0 , . . . , 0 , 0 ), A ( v ) = (0,1, 0 , . . . , 0, 0), A k- 1 ( v) = (0, 0, 0 , . . . , 0, 1). Далее будем рассматривать многочлены из F[t], в которы е вместо переменной t будем подставлять оператор A . Л егко ви­ деть, что значение f (A ) многочлена f (t) на операторе A также будет линейным оператором . Так как степени л ю бого оператора A коммутируют, A mA n = A m+ n = A nA m, то нетрудно пока­ зать, что комм утирует и произведение произвольных многочле­ нов f (t) и h (t), т. е. что выполняется равенство f (A )h (A ) = h ( A ) f (A ). (6.13)
Глава 6. Пространства с операторами 196 Д ействительно, если f (t) = f •tk, где f е F, то равенство (6.13) очевидно: f A k(h „ A n + •••+ hoE) = f A kh „ A n + •••+ f A khoE = = h „ A n f A k + •••+ hoE f A k = (h „ A n + •••+ hoE ) f A k. Теперь для произвольного f (t) имеем (fm A m + •••+ foE )h (A ) = fm A m h (A ) + •••+ foE h (A ) = = h (A )fm A m + •••+ h (A )fo E = h (A )(fm A m + •••+ foE ). Равенство (6.13) доказано. О тметим еще одно п ростое свойство рассматриваемых мно­ гочленов: если пространство U инвариантно относительно опе­ ратора A , то оно такж е инвариантно и относительно оператора f (A ) при лю бом многочлене f . 2. А н н у л я т о р ы и м и н и м а л ь н ы е м н о г о ч л е н ы в е к т о р о в . Ненулевой многочлен f (t) называется аннулятором вектора v (говорим, что f (t) аннулирует v ), если f ( A ) ( v ) = 0. Из (6.11) следует, что многочлен tk —afc_itk -i — ••• —a it —ao будет аннуля­ тором вектора v. О тметим, что аннулятор вектора v аннулирует и вектор A ( v ) . Нормированный аннулятор вектора и минимальной степе­ ни называется минимальным многочленом этого вектора. Так как в конечномерном пространстве любой ненулевой вектор по­ рож дает циклическое подпространство, то в силу предыдущ их рассуж дений у каж дого вектора найдется минимальный м ного­ член. Более того, справедливо следую щ ее утверждение. Л е м м а 6 .4 . В конечномерном пространстве каж дый вектор обладает единст венным минимальным многочленом. Д о к а з а т е л ь с т в о . Сущ ествование минимального многочле­ на показано выше. Д опустим , что у н екоторого вектора и есть два различных минимальных многочлена f и h. Тогда разность f — h этих многочленов будет ненулевым многочленом меньшей степени, который аннулирует вектор и. П ротиворечие. Лемма доказана.
6.4. Инвариантные подпространства 197 Л е м м а 6 .5 . М инимальный многочлен вектора u делит каж ­ дый аннулятор эт ого вектора. Д о к а з а т е л ь с т в о . Д опустим, что минимальный многочлен m вектора и не делит его аннулятор f . Тогда, разделив с остат­ ком f на m, видим, что f ( A ) ( u ) = q ( A ) (m (A )( u )) + r ( A ) ( u ) = = q (A )(0 ) + r ( A ) ( u ) = r ( A ) ( u ) = O, где степень r меньше степени m и r аннулирует u . П ротиворе­ чие. Лемма доказана. Л е м м а 6 .6 . Если взаимно простые многочлены р и q одно­ временно аннулируют вектор u , то u — нулевой вектор. Д о к а з а т е л ь с т в о . Из взаимной простоты p и q следует су ­ ществование таких f и h, что 1 = f (t)p (t) + h (t)q (t). Тогда E (u ) = ( f (A )p (A ) + h (A )q ( A )) (u ) = = f ( A ) ( P( A ) ( u ) ) + h ( A ) ( q( A ) ( u ) ) = = f (A )(0 ) + h (A )(0 ) = 0, т. е. u = O. Лемма доказана. Л е м м а 6 .7 . Если произведение P 1P 2 взаимно прост ых м ного­ членов p 1 и p 2 аннулирует вектор u , то u м ож н о представить в виде сум м ы u® + u 2, где многочлен р® аннулирует вектор u®, а многочлен р 2 — вектор u 2 . Д о к а з а т е л ь с т в о . С ущ ествую т такие многочлены q® и q2 , что 1 = q i(t)p i(t) + q2 (t)P 2 (t). Тогда u = qi ( A ) p i ( A ) ( u ) + q2 (A )p 2 (A )(u ) и в силу предыдущей леммы P 2 (A )(q i (A )p i (A ) ( u ) ) = q i (A ) (p i (A )p 2 (A ) ( u ) ) = qi (A )(0 ) = 0, Pi (A )(q 2 (A )p 2 (A ) ( u ) ) = q2(A ) ( p i ( A ) p 2 (A ) ( u ) ) = q 2 (A )(0 ) = 0. П олож им u® = q2 (A )p 2 ( A ) (u ) и u 2 = qi ( A ) p i ( A ) ( u ) . Лемма д о ­ казана.
Глава 6. Пространства с операторами 198 Покажем, что имеет место и «обратн ое» утверждение. Л е м м а 6 .8 . Если м инимальный многочлен p i вектора П\ и минимальный многочлен р 2 вектора u взаимно просты, то произведение Р 1Р 2 будет м инимальным многочленом сум ­ м ы Ui + U 2 Д о к а з а т е л ь с т в о . П усть q — минимальный многочлен сум ­ мы u i + U 2 . Тогда 0 = p iq ( A ) ( u i + U 2) = q p i(A )( u i) + p i q ( A ) ( u 2) = = q ( A ) ( p i ( A ) ( u i ) ) + p i q ( A ) ( u 2) = = q (A )(0 ) + p i q ( A ) ( u 2) = P iq (A )(u 2). Следовательно, p 2 делит произведение piq и п оэтом у в силу вза­ имной п ростоты p i и р 2 делит q. Аналогично устанавливается делим ость q на p i. Так как q — многочлен минимальной степе­ ни, делящийся на взаимно просты е pi и p 2 , то q = p ip 2. Лемма доказана. Индукцией по числу взаимно п росты х многочленов нетруд­ но установить справедливость следую щ их обобщений лемм 6.7 и 6.8. Л е м м а 6 .9 . Если произведение m=i p* взаимно прост ых многочленов p* аннулирует вектор u , то u м ож н о предста­ вит ь в виде сум м ы ^ ™i u*, в которой многочлен p* аннулиру­ ет вектор щ . Л е м м а 6 .1 0 . Если м инимальные многочлены p* векторов u* взаимно просты, i = 1, . . . , m , то произведение П m=ip* будет m i=i u i. E 3. А н н у л я т о р ы и м и н и м а л ь н ы е м н о г о ч л е н ы п р о с т р а н с т в . Ненулевой многочлен f называется аннулятором пространства U относительно действую щ его на нем оператора A , а такж е ан­ нулят ором оператора A на пространстве U, если f аннулиру­ ет все векторы этого пространства. Нормированный аннулятор
6-4- Инвариантные подпространства 199 пространства U минимальной степени называется м иним аль­ ным м ногочленом этого пространства или минимальным м ного­ членом оператора A на пространстве U. Из доказательства лем­ мы 6.4 легко следует единственность минимального многочлена л ю бого конечномерного пространства, а из доказательства лем­ мы 6.5 — делим ость всех аннуляторов пространства на его мини­ мальный многочлен. Н етрудно видеть, что минимальный много­ член л ю бого конечномерного пространства должен делиться на минимальный многочлен каж дого вектора пространства и по­ этом у будет наименьшим общ им кратным минимальных много­ членов векторов произвольного базиса этого пространства. О т­ сю да легко следует, что минимальный многочлен циклического пространства равен минимальному многочлену его циклическо­ го вектора, а минимальный многочлен л ю бого подпространства делит минимальный многочлен всего пространства. Будем говорить, что пространство V является сум м ой V = = S m i Ui своих подпространств U i , . . . , Um, если каж дый век­ т о р v из V м ож но представить в виде суммы v = Wi +-------- + Wm векторов u i (6.14) £ U i , . . . , u m £ Um. Если каж дый вектор v из V представляется в виде суммы (6.14) единственным образом, то говорят, что пространство V разлагается в прямую сум м у V = e m 1 Ui своих подпространств U i , . . . , U m. Из единствен­ ности представления (6.14) следует, что объединение базисов Ui = { u i i , . . . , Wife.} прямых слагаемых Ui будет базисом V про­ странства V. О тметим следующ ий простой, но важный факт: если все прямые слагаемые Ui являю тся инвариантными под­ пространствами, то матрица A y оператора A в базисе V будет иметь блочно-диагональный вид /A i 0 0 A2 ■■■ 0 \ ■■■ 0 Ay (6.15) 0 0 Am где A i , . . . , A m — матрицы оператора A на инвариантных про­ странствах U i , . . . , Um в базисах U i , . . . , Um. Такое представле-
200 Глава 6. Пространства с операторами ние оператора A в базисе V позволяет сводить изучение опе­ ратора A на пространстве V к нескольким более просты м за­ дачам — изучению этого оператора на пространствах Ui мень­ шей размерности. В связи с этим выясним, при каких условиях пространство с оператором разлагается в прямую сум м у сво­ их инвариантных подпространств. Оказывается, такое разлож е­ ние тесно связано с видом минимального многочлена простран­ ства. В частности, из перечисленных выше свойств минималь­ ных многочленов следует, что минимальный многочлен прямой суммы подпространств равен наименьшему общ ему кратному минимальных многочленов прямых слагаемых. Имеет место и «обратн ое» утверждение. Т е о р е м а 6 .4 . П уст ь ™ i pi — разлож ение на взаимно про­ стые м нож ит ели минимального многочлена p пространства U с оператором A . Тогда U единст венным с т очност ью до по­ im = рядка слагаемых образом разлагается в прямую сум м у -ЛUi, где Ui — инвариантное подпространство с минимальным м но­ гочленом pi. Д о к а з а т е л ь с т в о . В силу леммы 6.9 каж дый вектор и про­ странства U мож но представить в виде суммы и = U i +-------- + и +-------- + и т , (6.16) в которой многочлен pi аннулирует вектор Ui. Очевидно, что для каж дого i = 1, 2 , . . . , m вектор Ui леж ит в ядре оператора p i(A ), ядро является инвариантным пространством и его мини­ мальным многочленом будет делитель многочлена pi. Покажем, что представление (6.16) единственно для каж до­ го и из U. Для этого достаточн о установить, что любая сум ­ ма (6.16), в которой не все слагаемые нулевые, не равна ну­ левому вектору. П редположим, что это не так и такая сумма Ui1 + •••+ Uik = 0 из k ненулевых векторов нашлась. Тогда ми­ нимальным многочленом такой суммы , с одной стороны , будет тож дественная единица, а с другой — произведение минималь­ ных многочленов векторов U j (в силу леммы 6.10). Полученное противоречие доказы вает единственность представления (6.16),
6.4. Инвариантные подпространства 201 из которого в свою очередь немедленно следует разложение U в прямую сум м у 1 Ker p i(A ). Е динственность установленного разложения следует из однозначности определения ядер опера­ торов P i(A ). Теперь заметим, что pi аннулирует пространство K erP i(A ) и п оэтом у обязан бы ть минимальным многочленом m i этого про­ странства, так как в противном случае делитель mi I I j= i Pj мно­ гочлена Л ; =1 p j будет аннулятором пространства U. Теорема д о ­ казана. П ространство с минимальным многочленом равным степени неприводимого многочлена называется примарным простран­ ством . Теорема 6.4 утверж дает, что каж дое пространство од­ нозначно раскладывается в прямую сум м у своих инвариантных примарных подпространств. В свою очередь каж дое примарное пространство мож но представить в виде прямой суммы примарных циклических пространств, и в общ ем случае такое представ­ ление не единственно. Т е о р е м а 6 .5 . Примарное пространство м ож н о предста­ вит ь в виде прямой сум м ы примарных циклических подпро­ странств. Д о к а з а т е л ь с т в о . Теорему докаж ем индукцией по размер­ ности пространства. В основание индукции положим одномер­ ные пространства, для к оторы х утверж дение теоремы тривиаль­ но. Д опустим, что теорема справедлива для каж дого примарного пространства размерности не больш е n — 1. П усть p — неприводимый многочлен степени г. В примарном пространстве V размерности n с минимальным многочле­ ном pm найдем вектор U 1, минимальный многочлен которого совпадает с минимальным многочленом pm пространства V, т. е. pm( A ) ( u 1) = 0 и pm_ 1( A ) ( u 1) = 0. П усть U 1 — порож денное этим вектором примарное циклическое подпространство в V . Е с­ ли U 1 = V , то V — циклическое пространство, и в этом случае теорема доказана. П усть теперь U 1 не совпадает с V . По предполож ению индук­ ции, ф актор-п ростран ство V пространства V по подпростран­
202 Глава 6. Пространства с операторами ству U 1 мож но представить в виде прямой суммы ф k= 2 Ui примарных циклических подпространств. Будем полагать, что для каж дого i £ { 2 , . . . , к } подпространство Ui порож дается цикли­ ческим вектором Ui + U 1 и их минимальный многочлен (вектора и подпространства) равен pmi , где mi ^ m. Так как deg p = r, то dim Ui = m ir. Покажем, что в каж дом смеж ном классе Ui найдется вектор щ + vi, где vi £ U 1, минимальный многочлен которого такж е равен pmi. Так как pmi ( A ) ( u 1) £ U 1, то этот вектор является ли­ нейной комбинацией векторов A j (U 1) и п оэтом у найдется та­ кой многочлен fi, что pmi( A ) ( u 1) = f i ( A ) ( u 1). Из равенства pm -m ipmi( A ) ( u 1) = 0 , следует, что многочлен pm-mi аннулиру­ ет вектор f i ( A ) ( u 1). П оэтом у многочлен fi должен делиться на pmi, т. е. его м ож но представить в виде произведения fi = pmifi. П олож им v i = —f i ( A ) ( u 1). Тогда pmi ( A )(u i + v i) = pmi ( A )(u i) + pmi (A )(v i) = = f i ( A ) ( u 1) + pmi ( A ) ( —.fi ( A ) ( u 1)) = = f i ( A ) ( u 1) — fi ( A ) ( u 1) = 0. Таким образом, pmi аннулирует вектор u i + vi. Теперь убедимся в том, что pmi будет минимальным многочленом этого вектора. Если это не так, то из равенства pmi-1 ( A ) ( u + v i) = 0 легко следует, что pmi - 1 ( A )(u i + v ) £ U 1 для л ю бого v из U 1. Но в этом случае многочлен pmi-1 аннулирует подпространство Ui, что противоречит минимальности многочлена pmi для Ui. Та­ ким образом, каж дый вектор u i + v i порож дает в пространстве V инвариантное циклическое подпространство Ui размерности m ir. По предполож ению индукции, каж дый элемент ф ак тор-п ро­ странства V однозначно представляется в виде сум м ы (u 2 + U 1) + + ■■■ + (uk + U 1) векторов подпространств U 2 , . . . , Uk. О тсю да легко следует, что каждый вектор w из V мож но представить в виде сумы векторов Wi из Ui. П оэтом у для доказательства тео­ ремы д остаточн о показать, что для лю бы х одновременно нерав­ ных нулю векторов Wi £ Ui сум м а ^ k=1 Wi не равна нулевому
6-4- Инвариантные подпространства вектору. Д ействительно, если ^ k= i w 203 = 0, то из предполож е­ ния индукции и равенств k k k £ ( W i + U i) = ^ Wi + ^ U i = - W i + U i = U i i=2 i=2 i=2 следует, что все Wi равны нулю. Теорема доказана. О бъединяя теоремы 6.4 и 6.5, видим, что справедливо сле­ дую щ ее утверждение. Т е о р е м а 6 .6 . Пространство с дейст вую щ им на нем опера­ тором м ож н о предст авит ь в виде прямой сумм ы примарных циклических подпространств. 4 . Т е о р е м а Г а м и л ь т о н а — К э л и . Рассмотрим вопрос о на­ хождении инвариантных примарных подпространств в простран­ ствах с операторами. П усть в пространстве V с базисом v i , . . . , v n действует оператор A с матрицей A . П реж де всего заметим, ес­ ли f — минимальный многочлен оператора A , то матрица A бу­ д ет корнем f , и этот многочлен мож но назвать минимальным многочленом матрицы A . П оэтом у если минимальный много­ член f = Л m=i pi, где ( p i,p j) = 1 , известен, то в соответствии с теоремой 6.4 для нахождения инвариантных пространств Ui достаточн о найти ортогональные пространства матриц p i(A ). Таким образом, задачу нахождения инвариантных примарных подпространств в общ ем случае мож но свести к нахождению ми­ нимального многочлена пространства и разложению этого мно­ гочлена на взаимно просты е множители. Найти минимальный многочлен мож но с помощ ью алгоритма, рассм атриваем ого в двух следую щ их примерах. П р и м е р 6 .9 . П усть в трехмерном пространстве V над полем Z 3 действует оператор A с матрицей A = 21 0 0 0 2 ( 0 2 . Найдем минимальный многочлен пространства V. Так как степень ми­ нимального многочлена циклического пространства равна раз­ мерности пространства, то в силу теоремы 6.6 степень мини­ мального многочлена л ю бого пространства не превосходит его
204 Глава 6. Пространства с операторами размерности. П оэтом у минимальный многочлен пространства V будем искать в виде многочлена ao + a ^ + a 2t2 + азt3 с неизвест­ ными коэффициентами ai. Так как эт от многочлен аннулирует матрицу A , 1 1 0 2 0 0 A 2 = (0 1 0 ,0 0 1. A3 0 2 0 0 0 2 то справедливо матричное равенство '1 ao 0 2 1 0 0N 0 1 0 0 0 1 + a1 + a2 0 2 0 0 0 2 + 2 0 0 '1 1 0^ 0 1 0 + аз I 0 2 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 которое, очевидно, эквивалентно системе из девяти линейных уравнений 1 2 1 2 0 1 1 0 0 0 0 0 1 2 1 2 /a o \ а1 а2 а3 0 0 0 (6.17) 0 Н етрудно видеть, что для матрицы из системы (6.17) справед­ ливы эквивалентности 1 2 1 2 0 1 1 0 0 0 0 0 1 2 1 2 1 0 2 2 0 0 1 1 0 1 1 0 1 2 1 2 П оэтом у фундаментальная система решений системы (6.17) со ­ стои т из векторов ( 1 2 1 0 ) и ( 1 0 0 1 ) , соответствую щ их многочле­ нам 1 + 2 t + 12 и 1 + 13, первый из которы х и будет минимальным многочленом оператора A . □
6-4- Инвариантные подпространства 205 П р и м е р 6 .1 0 . П усть в трехмерном пространстве V над полем Z 3 действует оператор A с матрицей A = 1 1 0 10 1 2 0 0 2 Найдем минимальный многочлен m y (t) пространства V . Мини­ мальный многочлен будем искать как наименьшее общ ее крат­ ное минимальных многочленов стандартного базиса этого про­ странства. П усть m y (t) = ao + a it + a 2t 2 + аз£3. Тогда матрица m y ( A ) = ao E + ai A + a 2A 2 + a 3A 3 аннулирует пространство V и, в частности, вектор (1 0 0) этого пространства. Подставляя 1 2 2 A2 0 ,0 1 0 2 A3 1 0 0 1, 0 1 2 0 0 2 в m y ( A ) и умнож ая получивш ую ся матрицу на вектор (1 0 0), видим, что '1 0 ao 0 1 0 0 0 1 1 1 0 1 0 0 0 1 2 1 1 2 2 + a2 0 1 0 0 0 1 0| + 0 0 0 + a3 0 2 0 1 2 0 0 2 Последнее равенство эквивалентно уравнению 1 1 1 1 0 0 0 0 0 0 0 0 ao ai 0 0 a2 0 | a3 0 ф ундаментальная система решений которого состои т из векто­ ров ( 2 1 0 0 ), (2 0 1 0 ) и (2 0 0 1 ), соответствую щ и х многочленам 2 + t, 2 + t 2 и 2 + t3, первый из которы х будет минимальным многочленом оператора вектора (10 0 ). Выполнив аналогичные вычисления для векторов ( 0 1 0 ) и (0 0 1 ), найдем их минимальные многочлены 1 + t + t 2 и 1 + t.
206 Глава 6. Пространства с операторами Таким образом, m V(t) = H O K (2 + t , 1 + t + t2, 1 + t) = = (1 + t + t2)(1 + t) = (t — 1)2(t — 2). □ Если в двух рассм отренны х выше примерах продолж ить вы­ числения и найти инвариантные подпространства, то окаж ется, что в обои х пространствах есть одномерные инвариантные под­ пространства. В первом примере такое подпространство задает­ ся вектором (0 0 1), а во втором — вектором ( 1 1 1 ) . Нахождение одномерны х инвариантных подпространств — важная практи­ ческая задача1). П оэтом у рассм отрим ее подробнее. Найдем од­ номерные инвариантные подпространства (в том случае, когда такие подпространства сущ ествую т). Если U — одномерное ин­ вариантное подпространство, то оно состои т из всех векторов вида a u , где u — некоторый вектор из V , а a — произвольный элемент поля F. Очевидно, что A ( u ) = Au для некоторого Л из поля F. В ектор u называется собст венным вектором операто­ ра A , а элемент Л — собст венным значением этого оператора, отвечающ им собственном у вектору u . Так как (AE — A ) u = A Eu — A u = Au — Au = 0, (6.18) то вектор u леж ит в ортогональном пространстве матрицы AE — A , и, следовательно, эта матрица вырож дена, а ее опре­ делитель det (AE — A ) равен нулю. Если t — независимая пере­ менная, то определитель det (tE — A ) будет элементом кольца F[t], корни которого в силу равенства (6.18) будут собственны ­ ми значениями оператора A . М ногочлен det (tE — A ) называ­ ется характеристическим м ногочленом матрицы A , а так как определитель матрицы оператора не зависит от вы бора базиса (см. (5.24)), то многочлен det (tE — A ) такж е называется ха­ рактеристическим м ногочленом оператора A . Вычислив корни Ai характеристического уравнения и найдя ортогональны е про­ странства матриц AiE — A , мож но найти все одномерные инва­ риантные пространства. 1) Особое значение она имеет в пространствах над полями комплексных и действительных чисел.
6.4. Инвариантные подпространства 207 П р и м е р 6 .1 1 . Рассмотрим двумерное пространство над по­ лем Z 3 . П усть в этом пространстве зафиксирован базис E = { e i , e 2 } и действует оператор A с матрицей А выбранном базисе. Тогда его характеристический многочлен имеет два корня Ai = 1 и А2 = 2. Так как то у оператора A в базисе E будет два собственны х вектора: u i = ( 12) с собственны м значением 1 , и U 2 = ( 10) с собственны м значением 2. Л егко видеть, что двучлен t — 1 будет минималь­ ным многочленом вектора u i , а двучлен t — 2 — минимальным многочленом вектора U2 . П оэтом у в силу леммы 6.8 характери­ стический многочлен (t — 1)(t — 2) будет и минимальным много­ членом A . Матрицей оператора A в базисе U = { u i , U 2 } будет диаго- то матрица А и будет корнем своего характеристического мно­ гочлена. □ П р и м е р 6 .1 2 . Рассмотрим трехмерное линейное простран­ ство V из примера 6 .8 . Э то пространство состои т из элементов поля Zз[ж ]/(ж 3 + 2ж + 1), и на нем действует линейный оператор A умножения на ж. Н етрудно видеть, что A (1 ) = ж, A 2(1) = ж2 и A 3(1) = A ^ 2) = ж + 2. П оэтом у (t3 + 2t + 1 )(A )(1 ) = A 3(1) + 2A (1) + E (1) = 0.
Глава 6. Пространства с операторами 208 Следовательно, многочлен t3 + 2t + 1 аннулирует вектор 1. Далее видим, что (t3 + 2t + 1 )(A )(x ) = (t3 + 2t + 1 )(A )(A (1 )) = = t(t3 + 2t + 1 )(A )(1 ) = 0, (t3 + 2t + 1 ) ( A ) ( x 2) = (t3 + 2t + 1 )( A ) ( A 2(1)) = = t2(t3 + 2t + 1 )(A )(1 ) = 0 , т. е. t3 + 2t + 1 аннулирует базис { 1 , x , x 2} пространства V и, следовательно, все V . Так как многочлен t3 + 2t + 1 неприводим, то он будет минимальным многочленом V. В соответствии с (6.12) матрицей A y оператора A в базисе V из векторов-столбцов 1 = (1 0 0 ),x = (010), x 2 = (001) будет мат0 0 2 рица 11 0 1 I , и, следовательно, эта матрица будет корнем 0 1 0 многочлена t3 + 2t + 1. Вычисляя характеристический многочлен det (tE — A y ) = det (( 2t 0 t 1|I = t3+ 2 t + 1 2 \0 2 t) матрицы A y , видим, что он совпадает с минимальным много­ членом A , и п оэтом у матрица A y будет корнем своего характе­ ристического многочлена. □ В двух последних примерах минимальные и характеристи­ ческие многочлены совпадали. В n -мерном пространстве тож д е­ ственный оператор E с характеристическим многочленом (t —1)n и минимальным многочленом t — 1 показывает, что эти много­ члены совпадаю т не всегда. В общ ем случае характеристический многочлен делится на минимальный. Э то следует из доказы ва­ емой далее теоремы Гамильтона — Кэли. Т е о р е м а 6 .7 (Гамильтон — К эл и). М инимальный м ного­ член линейного оператора делит его характеристический м но­ гочлен.
6.4. Инвариантные подпространства 209 Д о к а з а т е л ь с т в о . В силу теорем 6.4 и 6.5 пространство V с действую щ им на нем оператором A мож но представить в ви­ де прямой суммы ф ™ 1 Ui инвариантных примарных цикличе­ ских подпространств Ui. Из (6.15) следует сущ ествование ба­ зиса V , в котором матрица оператора A будет иметь блочно­ диагональный вид: A1 0 0 0 0 A2 A 0 0 A mJ где A 1, . . . , A m — матрицы этого оператора на инвариантных п ространствах U 1, . . . , Um. Следовательно, определитель ( tE — A 1 0 0 tE — A 2 0 0 \ det (tE — A V) = det 0 0 tE — Am будет характеристическим многочленом / д оператора A . Из по­ следнего равенства немедленно следует, что m /A (t ) = det (tE — A V) = ^ det (tE — A i). i=1 (6.19) Покажем, что характеристический многочлен / оператора A на каж дом циклическом подпространстве U равен минимально­ му многочлену этого подпространства. П усть v — циклический вектор в U. Д опустим, что векторы v, A ( v ) , . . . , A k_ 1(v ) линейно независимы и A k(v ) = afc_ 1A fc_ 1(v ) + afc_ 2A fc_ 2(v ) +--+ a 1A (v ) + aov. Тогда m (t) = tk — ak_ 1tk 1 — ak_ 2tk 2 — ■■■ — a 1t — ao — мини­ мальный многочлен U. Возьмем матрицу оператора A в базисе
210 Глава 6. Пространства с операторами v, A ( v ) , . . . , A k 1( v) и найдем характеристический многочлен 0 0 t —1 0 0 t —1 f (t) = det (tE — A ) = det ■■■ 0 ■■■ 0 ■■■ 0 ■■■ —ao —a 1 \ —a 2 —1 t — ak - 1 Д ля вычисления определителя к его первой строке прибавим вторую , умнож енную на t, затем третью , умнож енную на t2, и т. д. В конце прибавим последню ю строку, умнож енную на tk-1 . В результате получим определитель 0 0 t —1 0 0 0 —1 det ■■■ 0 ■■■ 0 ■■■ 0 ■■■ m (t) —a 1 \ —a2 —1 t — ak - 1 раскладывая которы й по первой строке видим, что f (t) = ( —1)k+ 1( —1)k -1m (t) = m (t). Таким образом, если m ^ — минимальный многочлен A на пространстве V , m i — минимальный многочлен подпространства Ui, то из свойств минимальных многочленов и (6.19) следую т равенства m A = H O K ( m 1 , . . . , mm), . а = m1 x . . . x mm, из которы х в свою очередь легко следует делим ость . а на mAТеорема доказана. Теорему Гамильтона — Кэли мож но переформулировать в терминах матриц и их характеристических многочленов. Н етруд­ но видеть, что на этом языке она превращ ается в следующ ее утверждение. Т е о р е м а 6 .8 (Гамильтон — К эл и). К аж дая квадратная м ат ­ рица являет ся корнем своего характеристического многочлена.
211 6-4- Инвариантные подпространства Д окаж ем теорем у Гамильтона — Кэли еще раз. В новом пря­ мом доказательстве не будем использовать теорем у о разлож е­ нии пространства в прямую сум м у инвариантных примарных циклических подпространств. В м есто этого воспользуемся ра­ венством (5.36), утверж даю щ им, что произведение произволь­ ной матрицы M и ее присоединенной матрицы M равно еди­ M. ничной матрице, умноженной на det Д о к а з а т е л ь с т в о . П усть A — квадратная матрица поряд­ ка n с элементами из поля F, t — независимая переменная, B — присоединенная матрица матрицы t E —A . Определитель матри­ цы t E —A является многочленом n -й степени из F[t], а элементы матрицы B — минорами (n — 1)-го порядка матрицы t E — A и, следовательно, многочленами (n — 1)-й степени из F[t]. П оэтом у det (t E — A ) = tn + dn—l tn—1 + dn—2tn—2 + ■■■+ d l t + do, B = B„ —itn—1 + Bn—2tn—2 + ■■■+ B it + Bo, где Bn—i, Bn—2 , . . . , B i, B o — матрицы с элементами из поля F. В силу равенства (5.36) B (t E — A ) = (det (t E — A ) ) E . Тогда ( Bn—itn—1 + Bn—2tn—2 + ■■■+ B it + B o) (t E — A ) = = (tn + dn—itn 1 + dn—2tn о + ■■■+ d it + do) E . (6.20) Приравнивая коэф ф ициенты при одинаковых степенях t в пра­ вой и левой частях (6.20) приходим к равенствам Bn—l = E Bn—2 Bn—l A = dn —l , Bn—3 — Bn—2A = dn—2E , B o — B i A — d iE , —B o A = doE.
212 Глава 6. Пространства с операторами У м нож ив первое из этих равенств справа на A n , второе на A n i и т. д., получим новые равенства B n -i A n = A n, B n -2 A n -i - B n - iA n = d n -iA n - i , B n - 3 A n-2 - B n - 2 A n - i = d n - 2A n - 2, BoA - B i A 2 = d i A , - Bo A = do E , слож ив которы е получим равенство 0 = A n + dn- 1A n i + dn- 2A n 2 + ■■■+ di A + do E, в правой части которого видим характеристический многочлен матрицы A , где вместо переменной t стои т сама матрица Теорема доказана. A. Д ополним теорем у Гамильтона — Кэли следующ им просты м утверж дением. Л е м м а 6 .1 1 . П уст ь n m i p k , n ™ i Pl-i — разлож ения на неприводимые м нож ит ели характеристического и м иним аль­ ного многочленов оператора A . Тогда K e rp ki (A ) = Ker p^ (A ) для каж дого i. Д о к а з а т е л ь с т в о . Если ki = li для каж дого i, то утверж де­ ние леммы тривиально. П оэтом у далее без ограничения общ но­ сти будем полагать, что ki > li. Если Ker p^1(A ) = Ker pi1(A ), то сущ ествует такой вектор v, что его аннулирует p^1 и не аннули­ рует pi1. При m = 1 сущ ествование v противоречит минимально­ сти многочлена pi1. При m > 1 ненулевой вектор u = pi1( A )(v ) &1—11 аннулируется двум я взаимно простыми многочленами p i 1 1 и im =2 pi.. Следовательно, в силу леммы 6.6 u = Л емма доказана. 0 . П ротиворечие. Теорема Гамильтона — Кэли и лемма 6.11 показывают, что для нахождения инвариантных примарных подпространств не
6.4. Инвариантные подпространства 213 обязательно находить минимальный многочлен пространства. В м есто него мож но воспользоваться характеристическим мно­ гочленом, которы й относительно легко вычисляется в простран­ ствах небольшой размерности. П р и м е р 6 .1 3 . Рассмотрим трехмерное пространство V над полем Z 3 . П усть в этом пространстве зафиксирован базис E = 1 2 1 2 2 = { е®, e 2 е з } и действует оператор A с матрицей A = 1 0 V2 2 1 в выбранном базисе. Тогда у его характеристического многочле­ на t— 1 det I 0 1 1 2 t —2 1 1 t — 1/ I = (t — 1 ) 2(t — 2 ) есть корень A1 = 1 кратности два Вычисляя (t — 1) 2 ( A ) , видим, что /0 A2 = 2 . и простой корень 2 1\ /0 2 1\ /2 ( A — E )2 = I 0 1 2II 0 1 2I = 2 2 0 2 2 0 1 1\ I 1 2 2 I - (1 2 I1 1 04 2) . 0 0 0 Следовательно, столбцы ортогональной матрицы об- 0 1 разую т базис {u®, u 2 } двум ерного инвариантного подпростран­ ства. Вычислив аналогичным образом <t — 2 ) ( A ) = A - 2E = ^ 2 - (J J J находим одномерное инвариантное подпространство, порож ден­ ное собственны м вектором u 3 = (1 2 0). Так как Au® = 1 0 2 2j Ilj = | 2 j = 2 |1 j + | 0 j = 2 u i + u 2 ,
214 Глава 6. Пространства с операторами 1 2 1 Аи2 0 2 2 2 2 1 2u1 2 2 0 и А и 3 = 2 u 3 , то матрица 11 0 0 1 будет матрицей оператора 0 0 2 A в базисе { u i , U 2, U 3 }. □ 5. Ц и к л и ч е с к и е п р о с т р а н с т в а . Далее будем рассматривать циклические пространства и их минимальные многочлены. Из доказательства теоремы Гамильтона — Кэли следует, что сте­ пень минимального многочлена циклического пространства сов­ падает с его размерностью. Дадим простое независимое доказа­ тельство этого факта. Л е м м а 6 .1 2 . Если U — циклическое пространство, то ст е­ пень его минимального многочлена равна его размерности. Д о к а з а т е л ь с т в о . П усть u — циклический вектор, п орож ­ дающий U. Д опустим , что степень минимального многочлена m пространства U меньше его размерности n, т. е. m (A ) — a n - i A n 1 + a n - 2A n 2 + ■■■+ a i A + aoE. Т огда для каж дого вектора из пространства U, в том числе и для циклического вектора u , справедливо равенство a n - i A n - 1 (u ) + a n - 2A n -2 (u ) +-+ a i A (u ) + aou = 0, из которого немедленно следует линейная зависим ость векторов A n - 1 ( u ) , . . . , A ( u ) , u , что, очевидно, противоречит цикличности вектора u . Следовательно, степень m равна n. Л емма доказана. Заметим, что степень минимального многочлена простран­ ства не превосходит степени характеристического многочлена, и, следовательно, размерности пространства. В трех следую щ их леммах покажем, что верно обращение леммы 6.12 — пространство будет циклическим, если его раз­ мерность равна степени его минимального многочлена.
6.4. Инвариантные подпространства 215 Л е м м а 6 .1 3 . Если в пространстве U найдется такой век­ тор u , что ст епень его минимального многочлена равна раз­ м ерност и U, то u — циклический вектор и U — циклическое пространство. Д о к а з а т е л ь с т в о . П усть k = d im U и степень минимального многочлена u равна k. Если векторы u , A ( u ) , . . . , A k - i (u ) ли­ нейно зависимы, то найдутся такие не равные одновременно ну­ лю элементы ао, a i , . . . , ak_i, что ak - i A fc - i(u ) + ak -2A k -2 (u ) + ■■■+ a i A ( u ) + aou = 0. (6.21) В этом случае (afc_itfc-i + afc- 2tfc-2 +-------- + ai t + a o )(A )(u ) = 0, т. е. многочлен степени меньшей k аннулирует вектор u . П роти­ воречие. Следовательно векторы u , A ( u ) , . . . , A k - i (u ) линейно независимы и U порож дается вектором u . Лемма доказана. Л е м м а 6 .1 4 . Если размерност ь примарного пространства U равна ст епени его минимального многочлена, то U — цикли­ ческое пространство. Д о к а з а т е л ь с т в о . П усть p k — минимальный многочлен U. В силу леммы 6.13 пространство U будет циклическим, если най­ дется такой вектор u , что его минимальным многочленом будет многочлен p k. Д опустим, что такого вектора нет. Тогда из лем­ мы 6.5 следует, что каж дый вектор в U аннулируется многочле­ ном p k - i , т.е. p k - i будет аннулятором U. П ротиворечие. Лемма доказана. Л е м м а 6 .1 5 . Если разм ерност ь пространства U равна ст е­ пени его минимального многочлена, то U — циклическое про­ странство. Д о к а з а т е л ь с т в о . Л емму докаж ем индукцией по размер­ ности пространства. В основание индукции положим очевид­ ный случай пространства единичной размерности. П редполо­ ж им, что лемма верна для всех пространств размерности не
216 Глава 6. Пространства с операторами более n. П усть p — минимальный многочлен (n + 1)-мерного пространства U. Если p является степенью неприводимого мно­ гочлена, то в силу леммы 6.14 пространство U будет цикличе­ ским. Если p разлагается в произведение p 1p 2 взаимно просты х многочленов меньшей степени, то в силу теоремы 6.4 простран­ ство U разлагается в прямую сум м у подпространств U 1 и U 2 , сумма размерностей к оторы х равна n + 1 и, очевидно, совпа­ дает с суммой степеней их минимальных многочленов р 1 и p 2 . Так как степень минимального многочлена подпространства не превосходит его размерности, то deg pi = dim Ui для i = 1, 2. П оэтом у из предположения индукции следует, что в U 1 и U2 найдутся циклические векторы u 1 и u 2 с минимальными мно­ гочленами p 1 и p 2 . В свою очередь из леммы 6.10 следует, что минимальным многочленом суммы u 1 + u 2 будет произведение Р 1Р 2. А так как d e g Р 1Р 2 = dim U , то в силу леммы 6.13 вектор u 1 + u 2 будет циклическим вектором в U. Л емма доказана. О бъединяя утверж дения лемм 6.12 и 6.15, получаем следу­ ю щ ую полезную теорему. Т е о р е м а 6 .9 . П уст ь A — линейный оператор в конечномер­ ном пространстве U. Пространство U будет циклическим от­ носит ельно A тогда и только тогда, когда его размерност ь равна ст епени его м инимального многочлена. Нетрудно видеть, что утверж дение теоремы 6.9 м ож но пере­ ф орм улировать следую щ им образом. Т е о р е м а 6 .1 0 . Пространство с оператором будет цикличе­ ским тогда и только тогда, когда его м инимальный и харак­ т еристический многочлены совпадают. П р и м е р 6 .1 4 . Вернемся к трехмерном у пространству V с действую щ им на нем оператором A из примера 6.13. Так как A ( u 1) = 2 u 1 + u 2 , то подпространство ( u 1, u 2 ) будет цикличе­ ским с циклическим вектором u 1 и минимальным многочленом (t — 1)2. П оэтом у V такж е будет циклическим пространством с циклическим вектором u 1 + u 3 и минимальным многочленом (t — 1)2(t — 2). □
Задачи 217 Задачи 6.1. Найти все идеалы кольца верхнетреугольных матриц размера 2 х 2 с элементами из: 1) Z; 2) Zp. 6.2. Доказать, что квадратные матрицы размера n х n, в каждой строке и каждом столбце которых одна единица, а остальные элемен­ ты — нули, с операцией умножения образуют группу, изоморфную группе Sn. 6.3. Решить над полем Z 5 систему уравнений 0 2 3 4 1 3 2 2 0 1 0 2 4 3 1 4 1 4 0 1 2 3 4 3 \ / 6.4. Решить систему уравнений над полем Z 5 [x]/(x 2 + x + 2): (3x + 2)а + (4x + 1)в = 2x + 3, 1 (2x + 4)а + (3x + 4)в = x + 4. j 6.5. Даны матрицы над полем Z 3 : A В C 2 1 0 0 1 2 2 1 Найти их определители и ранги. Найти присоединенные и обратные к ним матрицы (если они обратимы). Вычислить det C 2015. Выяс­ нить, коммутируют ли матрицы A и B . Решить матричное уравне­ ние A X B = В 3. 6.6. Найти все целые решения уравнения: 1) 10xi+ 2x 2+ 12x 3+ 8x 4+ 14x 5 = 2; 2) 3xi + 5x 2+ 7x 3 + 9x 4+ 11x 5 = 15. 6.7. Привести пример линейного оператора над полем Z 3 , ядром которого является линейная оболочка векторов 12011 и 21102 . 6.8. Найти какой-либо базис пространства, ортогонального про­ странству V = (12011,21102} С Z3. 6.9. Известно, что линейный оператор f над полем Z 3 переводит векторы стандартного базиса ei = 10000 , . . . , е 5 = 00001 в векторы 121, 022, 221, 101, 212 соответственно. Найти ядро и образ операто­ ра f . Найти образ вектора f (20112) и полный прообраз вектора 210.
Глава 6. Пространства с операторами 218 6.10. Пусть A — подмножество, не обязательно являющееся под­ пространством, в некотором линейном пространстве V. Будем назы­ вать множество A 1- = { x € V : x ± A }, состоящее из векторов, орто­ гональных каждому вектору из A, ортогональным к A. Является ли А^ подпространством в V? 6.11. Оценить сложность метода Гаусса (в худшем случае) для системы линейных уравнений с квадратной матрицей размера n х n. 6.12. Показать, что линейный оператор невырожден тогда и толь­ ко тогда, когда свободный член его минимального многочлена отличен от нуля. 6.13. Пусть многочлен pi аннулирует вектор Vj, i = 1 , . . . , k. По­ казать, что многочлен HOK( pi , . . . ,pk) аннулирует любую линейную комбинацию векторов v i , . . . , Vk. 6.14. Оператор A действует в k-мерном пространстве и имеет k собственных векторов v i , . . . , Vk с попарно различными собственными значениями. Показать, что собственные векторы линейно независимы и в базисе v i , . . . , Vk матрица оператора A диагональна. 6.15. В пространстве Z 3 действует линейныйоператор A с мат- 0 0Л . Указатьдва различных разложения Z 3в 3прямую рицей ( 2 0 2 0 0 2 3 сумму циклических подпространств. 6.16. Пусть A — линейный оператор и f ( t ) — многочлен. Пока­ зать на примере, что инвариантное относительно оператора f ( A ) про­ странство не обязательно инвариантно относительно A. Доказать, что пространство Ker f (A ) инвариантно относительно A при любом f (t). 6.17. Доказать, что минимальный многочлен циклического про­ странства совпадает с минимальным многочленом его циклического вектора. 6.18. Пусть V — примарное циклическое пространство с мини­ мальным многочленом p k. Найти все инвариантные подпространства в V. 6.19. Используя примеры 6.9 и 6.10, сформулировать и обосновать алгоритм вычисления минимального многочлена пространства. Оце­ нить число операций над элементами поля, выполняемых при работе этого алгоритма. 6.20. Пусть D — оператор дифференцирования в пространстве V многочленов над R степени не выше трех. Показать, что этот опера­ тор линейный. Найти его ранг, минимальный и характеристический
Задачи 219 многочлены. Разложить V в прямую сумму инвариантных примарных циклических подпространств. 6.21. Решить предыдущую задачу для оператора дифференциро­ вания в пространстве многочленов над R степени не выше n. 6.22. Пусть A — оператор умножения на ж в пространстве мно­ гочленов из Z 2 [ж]/(ж4 + ж + 1 ) . Показать, что этот оператор линей­ ный. Найти его ранг, минимальный и характеристический многочле­ ны. Разложить пространство в прямую сумму инвариантных примарных циклических подпространств. 6.23. Решить предыдущую задачу для оператора умножения на ж в пространстве многочленов из: 1) Z 2 [ж]/(ж5 + ж2 + 1); 2) Z 2 [ж]/(ж5 + ж3 + 1); 3) Z 2 [ж]/(жn — 1). 6.24. Пусть оператор A действует в пространстве многочленов над Z 5 степени не выше четырех и отображает многочлен f в набор его остатков от деления на многочлены ж, ж + 1, ж + 2, ж + 3. Будет ли этот оператор линейным? Если будет, то найти его ранг и ядро. 6.25. Пусть оператор A : Ztj ^ Z5 отображает коэффициенты многочлена f над Z 5 степени не выше четырех в набор его остатков от деления на многочлены ж, ж + 1, ж + 2, ж + 3, ж + 4. Будет ли этот оператор линейным? Если будет, то найти его ранг, минимальный и характеристический многочлены. Разложить пространство Z 5 в пря­ мую сумму инвариантных примарных циклических подпространств и выяснить, единственно ли полученное разложение. Указать базис пространства, в котором матрица оператора имеет наиболее простой вид. 6.26. Пусть степень минимального многочлена примарного про­ странства V равна его размерности. Доказать, что V нельзя предста­ вить в виде прямой суммы двух инвариантных подпространств.
Глава 7 Структура конечных групп В этой главе для произвольной конечной группы устанавлива­ ю тся критерии сущ ествования в этой группе подгруппы данного порядка. Затем на основе полученных результатов показывает­ ся, что конечная группа является прямым произведением своих подгрупп специального вида. В конце главы подробно изучается структура мультипликативной группы кольца Z m. 7.1. Действие группы на множестве Будем говорить, что группа G дейст вует на м нож ест ве X , если каж дом у элементу g группы G поставлено в соответстви е взаимно однозначное отображ ение p (g ) множ ества X в себя так, что p (g ig2 ) = p ( g i ) p ( g 2) для лю бы х g i и g 2 из G. Иначе говоря, группа G действует на множ естве X , если определен гом ом ор­ ф изм р группы G в м нож ество взаимно однозначных отображ е­ ний множ ества X в себя. Рассматривая далее действие группы G на множ естве X , будем опускать символ гом ом орф изм а и будем рассматривать элементы группы G непосредственно как преоб­ разования множ ества X : результат действия элемента g группы G на элементе x множ ества X будем обозначать через g (x ). П усть группа G действует на множ естве X . Стабилизато­ ром, элемента xo из X называется множ ество St(xo) = {g £ £ G |g (xo) = x o }. Орбитой элемента xo из X называется мно­ ж ество O r(xo) = { x £ X |x = g (x o ), где g £ G }, число элементов орбиты называется ее длиной. О рбита единичной длины назы­ вается неподвиж ной (или стационарной) точкой.
7.1. Действие группы на множестве 221 П р и м е р 7 .1 . G — произвольная конечная группа, H — ее подгруппа. П усть подгруппа H действует сдвигами на множ е­ стве элементов группы G, т. е. элемент h подгруппы H преоб­ разует элемент g группы G в произведение hg. В этом случае элементы группы G обр азую т |G|/|H| орбит, каж дая из к ото­ ры х является смеж ным классом группы G по подгруппе H , и для каж дого g £ G его стабилизатор состои т только из единич­ ного элемента. □ П р и м е р 7 .2 . Рассмотрим действие сопряжениями подгруп­ пы ( ( 12 )) группы S 3 на множ естве всех элементов этой группы. Напомним, что при сопряж ениях элемент h подгруппы H пре­ образует элемент g группы G в произведение h g h _ 1. Так как (12)(12)(1 2) = (12), (12)(13)(12) = (23), (12)(23)(12) = (13) (12)(123)(12) = (132), (12)(132)(12) = (123), (12)e(12) = e, то множ ество элементов группы S 3 распадается на две непо­ движ ны е точки { e } и { ( 12 ) } и две двухэлементные орбиты {(1 3 ), (2 3 )} и {(1 2 3 ), (1 3 2 )}. Стабилизатором элементов e и (12) будет подгруппа ( ( 12 )), а стабилизаторы остальны х элементов состоя т из одного единичного элемента. □ Покажем, что при действии группы G на множ естве X ста­ билизатор л ю бого элемента x является подгруппой в группе G. Д ля этого достаточн о установить, что м нож ество S t(x) замкнуто относительно групповой операции, единичный элемент группы G принадлежит S t(x) и вместе с лю бым элементом g £ St(x) элемент g _ 1 такж е принадлежит S t(x ). Замкнутость множ ества S t(x) следует из того, что если g 1 и g 2 принадлежат S t(x ), то g 1g 2 (x ) = g 1(g 2 (x )) = g 1(x) = x, и п оэтом у произведение g 1g 2 такж е принадлежит S t(x ). Принад­ леж ность единичного элемента группы G стабилизатору элемен­ та x очевидна, так как единичный элемент оставляет на месте все элементы множ ества X . Таким образом осталось показать, что если элемент g принадлежит стабилизатору x, то вместе с ним в стабилизаторе x присутствует и его обратный элемент g _ 1.
222 Глава 7. Структура конечных групп Д ействительно, так как для л ю бого х £ X и лю бого g £ St(x) справедливы равенства х = # - 1 # (х ) = # - 1 (# (х )) = # - 1 (х ), то g —1 £ S t(x ). Таким образом, St(x) — подгруппа группы G. Т е о р е м а 7 .1 . П уст ь конечная группа G дейст вует на ко­ нечном м нож ест ве X . Тогда для любого х из X |Or(x)| ■ |St(x)| = |G|. Д о к а з а т е л ь с т в о . Покажем, что длина орбиты произволь­ ного элемента х из X равна числу см еж ны х классов группы G по подгруппе S t(x ). Для этого достаточн о показать, что элементы из одного см еж н ого класса переводят х в один и т о т ж е эле­ мент множ ества X , а элементы из разных см еж ны х классов — в разные элементы множ ества X . Если g 1 и g 2 леж ат в одном и том ж е смеж ном классе группы G по подгруппе S t(x ), то g 2 = g 1s, где s £ S t(x ). П оэтом у g 2(x ) = g 1s (x ) = g 1(s (x )) = gl ( x) , т. е. элементы из одного и того ж е см еж ного класса группы G по подгруппе S t(x) отображ аю т х в один и т о т ж е элемент мно­ ж ества X . Теперь покажем, что элементы из разных смеж ны х классов группы G по подгруппе S t(x) отображ аю т х в разные элементы множ ества X . Д опустим, что g 1(x ) = g 2 (x ), тогда х = g - 1g1(x ) = g - 1(g1(x )) = g - 1(g2(x )) = g —1g2(x ), и, следовательно, g —1g 2 £ S t(x ). Но тогда в S t(x) найдется такой элемент s, что g 2 = g 1S и п оэтом у g 1 и g 2 леж ат в одном и том ж е смеж ном классе группы G по подгруппе S t(x ). Так как число см еж ны х классов группы G по подгруп­ пе St(x) равно |G|/|St(x)|, а длина орбиты элемента х рав­ на числу смеж ны х классов группы G по подгруппе S t(x ), то |Or(x)| ■ |St(x)| = |G|. Теорема доказана.
7.1. Действие группы на множестве П рим ер 223 7 .3 . П усть G — произвольная конечная группа, {Н * } — м нож ество всех ее подгрупп. Будем говорить, что группа G действует сопряжениями на {H *}, если элемент g группы G преобразует подгруппу H в g H g _ i . П реж де всего заметим, что поскольку в каж дой группе G для лю бы х элементов hi, h j и h из ее подгруппы Н ghig i ■g h jg i = g h ih jg i , geg - i = e, ghg -i gh 1g 1 = e, то множ ество g H g i такж е будет подгруппой в G. К ром е того, если hi е Н* и £ H j , то gh ig_ i е gH*g _ i и g h ig _ i £ g H jg _ i , т. е. сопряжение элементом g является инъективным преобразовани­ ем конечного множ ества подгрупп группы G в себя, и, следова­ тельно, является подстановкой на этом множ естве. Таким об­ разом, действие группы сопряжениями на множ естве подгрупп определено корректно. Рассмотрим группу S 3 и действие этой группы сопряж ени­ ями на множ естве всех ее несобст венных (отличных от { e } и самой группы) подгрупп. Таких подгрупп в S 3 ровно четыре — три подгруппы H i = {e , (1 2 )}, H 2 = {e, (1 3 )} и H 3 = {e, (2 3 )} по­ рядка два и одна подгруппа H 4 = {e, (123), (1 3 2 )} порядка три. Так как сопряжения оставляю т единичный элемент на месте и (12)(12 )(12 ) = (12), (13)(12)(13) = (23), (23)(12)(23) = (13) (12)(13 )(12 ) = (23), (13)(13)(13) = (13), (23)(13)(23) = (12) (12)(23 )(12 ) = (13), (13)(23)(13) = (12), (23)(23)(23) = (23), (12)H 1(12) = H1, (1 3 )H i(1 3 ) = H 3 , (23)H 1(23) = H2 ( 12 )H 2 ( 12 ) = H 3 , (13)H 2(13) = H 2 , (23)H 2(23) = H i (12)H 3(12) = H 2 , (13)H 3(13) = H i, (23)H 3(23) = H 3 . то легко видеть, что О ткуда в свою очередь видно, что подгруппы H i, H 2 и H 3 обра­ зу ю т орбиту длины три, а стабилизатором каж дой подгруппы является сама подгруппа. Подгруппа H 4 является единственной подгруппой порядка три. П оэтом у она образует сам остоятель­ ную орбиту, а ее стабилизатором будет вся группа S 3 . □
224 Глава 7. Структура конечных групп П р и м е р 7 .4 . Рассмотрим действие сопряжениями подгруп­ пы H i на множ естве нетривиальных подгрупп группы S 3 . Из предыдущ его примера видно, что это множ ество разбивается на две орбиты { H i } и { H 4 } единичной длины и одну орбиту длины два из подгрупп H 2 и H 3 . Стабилизатором подгрупп H i и H 4 будет подгруппа H i, а стабилизатор подгрупп H 2 и H 3 состои т только из единичного элемента. □ Нормализатором, N ( H ) подгруппы H группы G называется стабилизатор этой подгруппы при действии группы G сопряж е­ ниями на множ естве своих подгрупп, т. е. N ( H ) = {g е G |g H g -1 с H }. Очевидно, что нормализатор является подгруппой группы G и подгруппа H является нормальной подгруппой в своем норма­ лизаторе. Цент ром Z группы G называется множ ество таких ее эле­ ментов, каж дый из которы х комм утирует со всеми элементами G, т. е. Z (G ) = { z е G |gz = zg Vg е G }. Л егко видеть, что центр является коммутативной нормальной подгруппой группы G и состои т из неподвижных точек дей­ ствия группы G сопряжениями на множ естве ее элементов: Z (G ) = { z е G |g z g -1 = z Vg е G }. Н еформально мож но сказать, что размер центра является мерой «ком м утативности» группы — чем больш е центр, тем больш е в группе ком м утирую ­ щих элементов, например Z (G ) = G для лю бой абелевой группы G. Элементы a, b группы G называются сопряж енными, если они леж ат в одной орбите при действии G на себя сопряж ени­ ями, т. е. если найдется такой элемент g е G, что a = gbg- 1 . Элемент g в этом случае называется сопрягающ им a с b, а орби­ та — классом сопряж енност и. Нетрудно убедиться, что сопря­ ж енность является отнош ением эквивалентности на элементах группы G. П р и м е р 7 .5 . Группа подстановок S 2 коммутативна, п оэто­ му Z ( S 2) = S 2 . Найдем центр некоммутативной группы S 3. В
7.1. Действие группы на множестве 225 примере 7.3 были вычислены произведения вида g z g -1 для всех транспозиций g, z из S 3 , откуда видно, что для любой транс­ позиции z найдется такая транспозиция g, что g z g -1 = z, т. е. g z = zg. Иными словами, никакая транспозиция из S 3 не комму­ тирует со всеми элементами группы. Л егко видеть, что это верно и для циклов длины 3, например (12)(123)(12) = (132) = (123). Таким образом, Z (S 3) = { e } . Из двух следую щ их примеров сле­ дует, что Z ( S n) = { e } при всех n ^ 3. □ П р и м е р 7 .6 . Рассмотрим подстановку f = g h g - 1 , сопряж ен­ ную в группе Sn с подстановкой h. Результат ее применения f ( x ) = g ( h ( g - 1( x ) ) ) к элементу x G { 1 , . . . , n } мож но предста­ вить коммутативной диаграммой, приведенной ниже на рисунке слева. П одобные диаграммы уж е встречались нам ранее при исghg 1 x ghg 1 ghg 1(x) К g (y ) g (z ) * > 1 1 g -1 g g i1 g 1 1 1 1 g - 1 (x) h hg 1(x) У z h следовании композиции отображ ений (см. диаграмму на с. 15). О тображ ения g , h , g - 1 являю тся биекциями, п оэтом у элементы y = g - 1 (x) и z = h (y) определяются по x, g и h однозначно. Перерисуем нашу диаграмму с использованием новых обозна­ чений y, z и того ф акта, что равенство y = g - 1 (x ) равносильно x = g (y ) (на рисунке справа). Пунктирное ребро соответствует подстановке g = (g - 1 ) - 1 , обратной к g - 1 . Полученная на рисунке справа диаграмма такж е является коммутативной. Она показывает, что если подстановка h пере­ водит элемент y в некоторый элемент z (не обязательно отлич­ ный о т y ), то подстановка g h g -1 переводит элемент g (y ) в g (z ). О тсю да следует, что сопряж енная подстановка g h g -1 получа­ ет ся применением сопрягающ ей ее с h подстановки g ко всем числам из разлож ения подстановки h на независимые циклы.
Глава 7. Структура конечных групп 226 Например, если g = (1234567) и h = (12)(34)(567), то для нахождения разложения g h g - i на независимые циклы не обя­ зательно искать подстановку g i и находить ее композицию с g и h: так как g(1) = 2, g (2) = 3, . . . , g(7) = 1, то g h g - i = = (2 3 )(45)(671). □ П усть разложение подстановки g из симметрической группы Sn на независимые циклы состои т из ki циклов длины i, где i = = 1 , . . . , n и ki + 2k 2 + . . . + nkn = n. Назовем упорядоченный набор tg = (ki, k 2 , . . . , kn) типом подстановки g. К аж дая транс­ позиция имеет тип (0 ,1 , 0 , . . . , 0), а тож дественная подстановка является единственной подстановкой типа (n, 0 , . . . , 0) в Sn . П одстановка g = (12)(345) £ S5 имеет тип ( 0, 1, 1, 0, 0). К а ж ­ дое из 5! произведений ( i i i 2) ( i 3i 4i 5) , где ij — попарно различные числа о т 1 д о 5, определяет некоторую подстановку h того же типа, что и g. Так как ( i i i 2) = ( i 2i i ) и ( i 3i 4 i 5) = (i 4i 5i 3) = (i 5i 3i 4), то име­ ется всего 2 3 = 6 различных сп особов записи подстановки h. П оэтом у группа S 5 содерж ит всего 5 !/6 = 20 подстановок, тип которы х совпадает с типом подстановки g. Аналогичные рассуж дения позволяю т получить общ ую ф о р ­ мулу I I n! |{g £ Sn : tg = (ki, k 2 , . . . , kn)}| = т=т -k-1, \ H i=o i - ki ! (7.1) для числа подстановок типа (ki, k2 , . . . , kn) в Sn . Действительно, каж дый цикл длины i мож ет бы ть записан i способами независи­ мо о т остальны х циклов той ж е длины, причем ki независимых циклов одинаковой длины мож но переставить ki! способами, не изменяя их произведения. П р и м е р 7 .7 . Рассмотрим действие группы Sn сопряжениями на множ естве всех своих элементов. Тогда стабилизатором St(h) подстановки h будет множ ество всех таких g из Sn , что g h g - i = = h (что равносильно gh = hg), т. е. множ ество всех подстано­ вок, ком м утирую щ их с h. Орбита O r(h) подстановки h состои т из всех сопряж енны х с ней подстановок. Пример 7.6 показывает, что сопряженными в группе Sn м о­ гут бы ть только подстановки с одинаковой цикловой стр у к ту ­
7.1. Действие группы на множестве 227 рой, т. е. подстановки одного типа. Более того, лю бые две под­ становки одного типа действительно сопряж ены, так как для лю бы х двух упорядоченны х наборов, состоящ их из n различ­ ных чисел множ ества {1, 2 , . . . , n } , найдется подстановка, пере­ водящ ая один из них в другой. Например, последовательность 351462 является образом последовательности 123456 при подста­ новке g = (1 3 )(4)(2 56 ), п оэтом у g h g _ 1 = (351)(462) = (135)(246) при h = (123)(456). Таким образом, орбита O r(h) содерж ит все подстановки того ж е типа, что и h. П оэтом у по теореме 7.1 с учетом (7.1) получаем, что чис­ ло всех подстановок, ком м утирую щ их с подстановкой h типа (к 1, к2, . . . , kn), равно ! n |St ( h ) i= 1оПж= п w - (7-2) О тсю да следует, что комм утировать с h будут все возмож ные произведения независимых циклов, входящих в ее разложение, и только они. Заметим также, что |or(h)| = 1 только когда под­ становка h тождественная. Во всех остальны х случаях выраж е­ ние (7.2) стр ого меньше, чем n!, п оэтом у h комм утирует не со всеми подстановками из Sn . Таким образом, число орбит (классов сопряж енны х элемен­ т ов), на которы е распадается группа Sn при действии сопряж е­ нием на своих элементах, равно числу различных типов подста­ новок, т. е. числу неотрицательных решений (к 1, к 2, . . . , kn) урав­ нения к 1 + 2к2 + . . . + n ^ = n. В частности, группа S 4 состои т из пяти орбит: орбита тож дественной подстановки с длиной 1, ор ­ бита подстановки (1 )(2 )(3 4 ) длины 4 !/(2 ! ■2) = 6, орбита подста­ новки (12)(34) длины 4 !/(2 !-2 2) = 3, орбита подстановки (1)(234) длины 4 !/3 = 8 и орбита подстановки (1234) длины 4 !/4 = 6. □ П р и м е р 7 .8 . Покажем, что в каж дой группе G порядка pn , где p — п ростое и n ^ 1, центр Z (G ) будет нетривиальной (Z (G ) = { e } ) подгруппой. Для этого рассм отрим действие груп­ пы G сопряжениями на множ естве ее элементов. При таком дей­ ствии pn элементов группы распадаю тся на орбиты , сумма длин которы х равна pn . Из теоремы 7.1 следует, что длины всех орбит
228 Глава 7. Структура конечных групп делят порядок группы и п оэтом у являю тся степенями p. Следо­ вательно, число неподвижных точек (это число больш е нуля, так как неподвижной точкой будет единичный элемент) кратно p, т. е. центр группы состои т не менее чем из p элементов. □ П р и м е р 7 .9 . Воспользуемся предыдущим примером и пока­ ж ем, что любая группа G порядка p 2 абелева. К аж дая такая группа имеет нетривиальный центр Z , порядок которого равен либо p 2, либо p. Если |Z| = p 2, то G совпадает со своим центром и является абелевой. Если ж е |Z| = p, то ф актор-группа G / Z будет циклической. П усть a Z — порож дающ ий элемент этой ф актор-группы . Тогда произвольный элемент группы G пред­ ставляется в виде произведения akz, где z € Z и ap = e. В этом случае для лю бы х akzi и a1Z2 из равенств a k / k / / k I k zi •a Z2 = a a ziZ 2 = a a Z2Z1 = a Z2 •a zi следует перестановочность этих элементов и, следовательно, комм утативность всей группы G, что, очевидно, противоречит рассматриваемому случаю |Z| = p. □ 7.2. Теоремы Силова П усть группа G состои т из pnm элементов, где p — простое и (p, m ) = 1. П одгруппа из pn элементов называется силовской p-подгруппой группы G. Т е о р е м а 7 .2 (первая теорема Силова). П уст ь группа G со­ ст оит из pnm элементов, где p — простое и (p, m ) = 1. Тогда в G сущ ест вует силовская p -подгруппа. Д о к а з а т е л ь с т в о . Рассмотрим множ ество M , состоящ ее из всех p”'-элементных подмнож еств группы G. Э то м нож ество со ­ стои т из (7.3) различных подмножеств. Покажем, что ни одна из дробей в пра­ вой части (7.3) не делится на p. Д ля этого заметим, что если
7.2. Теоремы Силова 229 числитель дроби ррП—_^ делится на pr , то на pr обязательно де­ лится и число к. В этом случае положим к = prк', где к' на p не делится. Тогда pnm — к pn — к pnm — pr к' = pn — pr к' pn—r m — к' = pn—r — к' , и так как r < n, то легко видеть, что рассматриваемая дробь действительно не делится на p. Следовательно не делится на p и произведение дробей — число элементов множ ества M . Теперь рассм отрим действие группы G на множ естве M , при к отором каж дый элемент g группы G преобразует подмнож ество { g 1,g 2 , . . . ,gpn} в подм нож ество {g g 1,g g 2 , . . . ,ggpn}. В результа­ те такого действия группы G множ ество M разобьется на орби­ ты , сумма длин к оторы х равна (ppm) . Так как (ppm ) не делится на p, то среди орбит обязательно найдется по крайней мере одна, число элементов в которой такж е не делится на p. Далее заме­ тим, что каж дая орбита множ ества M состои т не менее чем из m элементов. Э то следует из того, что в объединении всех подмно­ ж еств, составляю щ их одну орбиту, обязательно п ри сутствую т все элементы группы G, в то время как каж дое подмнож ество состои т ровно из pn элементов. Наконец рассм отрим подмнож ество х из M , длина орбиты которого не делится на p. В силу теоремы 7.1 для х справедливо равенство |Or(x)| ■|St(x)| = pnm. Т ак как в левой части этого равенства первый множ итель не меньше m и при этом не делится на p, то второй множ итель равен pn . Таким образом, стабилизатор подмнож ества х с о ст о ­ ит ровно из pn элементов и, следовательно, является искомой подгруппой группы G. Теорема доказана. Т е о р е м а 7 .3 (вторая теорема Силова). П уст ь группа G со­ ст оит из pnm элементов, где p — простое и (p, m ) = 1. Тогда все силовские p -подгруппы группы G сопряж ены. Д о к а з а т е л ь с т в о . П усть группа G состои т из pnm элемен­ тов, где (p, m ) = 1. П редположим, что S и S ' — две силовские
230 Глава 7. Структура конечных групп р-подгруппы группы G. Рассмотрим действие подгруппы S' на ф актор-м н ож естве G / S , при котором элемент g подгруппы S ' преобразует смеж ный класс {g i, g 2, . . . , gpn} в смеж ный класс { g g i , g g 2 , . . . ,g g pn }. П орядок подгруппы S ' равен pn , п оэтом у в силу теоремы 7.1 длины всех орбит в G /S являю тся степенями числа р. Ф актор-м нож ество G / S состои т из m см еж ны х классов, и так как m не делится на р, то среди орби т долж на найтись хотя бы одна неподвижная точка (длина орбиты равна р0 = 1). П усть смеж ный класс aS является такой неподвижной точкой. Тогда g a S = aS для л ю бого g из S '. Д омнож ив правую и левую части последнего равенства на a - 1 , получим, что g a S a -1 = a S a -1 для л ю бого g из S '. Так как a S a -1 является подгруппой группы G и умножение этой подгруппы на элементы S ' не выводит за пре­ делы a S a - 1 , то S ' С a S a - 1 . Теперь, учитывая, что S и S ' имею т один и т о т ж е порядок, заключаем, что S ' = a S a - 1 . Теорема доказана. Т е о р е м а 7 .4 (третья теорема Силова). П уст ь группа G со­ ст оит из pnm элементов, где р — простое и (р, m ) = 1. Тогда число силовских р-подгрупп группы G сравнимо с единицей по м одулю р . Д о к а з а т е л ь с т в о . П усть M — множ ество всех силовских р-подгрупп группы G. Все силовские р-подгруппы группы G сопряж ены в силу теоремы 7.3, и п оэтом у лю бую силовскую р-подгруппу S ' мож но представить в виде a S a - 1 , где S — неко­ торая фиксированная силовская р-подгруппа, а a — элемент группы G. Рассмотрим действие подгруппы S на множ естве M , при котором элемент a подгруппы S преобразует подгруп­ пу S ' = { g i , g 2 , . . . , gpn} в сопряж енную подгруппу a S 'a -1 = = { a g ia - 1 , ag 2a - 1 , . . . , agpna- 1 }. Покажем, что при таком дей­ ствии в M сущ ествует единственная неподвижная точка — под­ группа S. Д опустим, что некоторая подгруппа S ' является неподвиж ­ ной точкой рассм атриваем ого действия. Тогда g S 'g -1 С S ' для л ю бого g е S. Следовательно, подгруппа S содерж ится в нор­ мализаторе подгруппы S '. Очевидно, что и подгруппа S ' также содерж ится в своем нормализаторе. П оэтом у S и S ' являю тся
7.2. Теоремы С'илова 231 силовскими p-подгруппами нормализатора подгруппы S ', и, сле­ довательно, эти подгруппы сопряж ены в силу теоремы 7.3, т. е. в нормализаторе S ' найдется такой элемент а, что a S 'a _ i = S . Теперь заметим, что S' — нормальная подгруппа в своем норма­ лизаторе, т. е. g S 'g _ i = S ' для л ю бого элемента g из нормали­ затора S ', в том числе и для элемента а из предыдущ его равен­ ства. Таким образом, из двух последних равенств заключаем, что S = S '. Следовательно, при рассматриваемом действии под­ группы S на множ естве M в этом множ естве сущ ествует един­ ственная неподвижная точка — подгруппа S. П орядок подгруппы S равен pn , и п оэтом у в силу теоремы 7.1 длины всех орбит в M являю тся степенями числа p. Так как среди этих орбит есть только одна орбита длины p0 = 1, то число элементов в M сравнимо с единицей по модулю p. Теорема доказана. Т е о р е м а 7 .5 . П уст ь группа G сост оит из pnm элементов, где p — прост ое и (p, m ) = 1. Число силовских p -подгрупп груп­ пы G делит порядок эт ой группы. Д о к а з а т е л ь с т в о . Рассмотрим действие группы G сопряж е­ ниями на множ естве всех ее силовских p-подгрупп. Так как все силовские p-подгруппы сопряж ены, то все они попадаю т в одну орбиту, длина которой в силу теоремы 7.1 является делителем порядка группы G. Таким образом, число силовских p-подгрупп является делителем порядка группы. Теорема доказана. П р и м е р 7 .1 0 . Рассмотрим группу G из 15 элементов. Из пер­ вой теоремы Силова следует, что в этой группе есть подгруппы из трех и пяти элементов. Так как три и пять — п росты е числа, то все эти подгруппы будут циклическими. Из третьей теоремы Силова следует, что количество трехэлементных подгрупп рав­ но одному из чисел 1, 4, 7, 10, 13 и при этом в силу теоремы 7.5 делит 15, т. е. совпадает с одним из чисел 1, 3, 5. Очевидно, что в G есть ровно одна подгруппа A = (а) порядка три. А на­ логичным образом м ож но показать, что в G содерж ится ровно одна подгруппа B = (b) порядка пять. Из второй теоремы Силова следует, что эти подгруппы нормальные. Так как порядки
232 Глава 7. Структура конечных групп подгрупп A и B взаимно просты , то эти подгруппы пересека­ ю тся только по единичному элементу. Покажем, что элементы таких подгрупп A и B коммутируют. Так как akbma —k = bs и bma —kb—m = a*, то ak+* = ak(bma —kb—m) = (a kbma —k)b—m = bs—m ^ ^ akbma —kb—m = e ^ akbm = bm ak. П оэтому, начиная с тривиального тож дества (ab)1 = a ! b! и пред­ полагая справедливость равенства (ab)k—1 = a k—! bk—! , из цепоч­ ки равенств (ab)k = (ab)k—! ab = ak—! bk—! ab = ak—! abk—! b = akbk индукцией по k заключаем, что (ab)k = akbk. Следовательно, (ab)3 = a3b3 = b3 = e и (ab)5 = a5b5 = a2 = e. Произведение ab = e леж ит в группе из 15 элементов, и п оэтом у его порядок d должен бы ть отличным о т единицы делителем 15. Но d = 3, 5. Т огда d = 1 5 и G — циклическая группа. Таким образом, любая группа порядка 15 является циклической. □ 7.3. Прямые произведения групп Напомним, что для групп G i , . . . , G k их внешним прямым произведением G i х •••х Gk называется м нож ество всех упорядо­ ченных наборов ( g i , . . . ,gk) длины k, где gi € Gi, с определенной на этом множ естве покомпонентной операцией умножения (g i , . . . , gk ) ( g i , . . . , gk) = (g ig l , . . . , gkgk ^ в которой умножение по i-й компоненте является умножением в группе G i. Будем говорить, что группа G является внут ренним пря­ м ым произведением H 1H 2 ••• H n своих нормальных подгрупп H i, H 2 , . . . , H n , если лю бой элемент g € G единственным обра­ зом представляется в виде g = h ih 2 •••hn , где hi € H i.
7.3. Прямые произведения групп 233 П р и м е р 7 .1 1 . В абелевой группе Z| есть две циклические подгруппы (2) = {1, 2, 4 } и (6) = {1 , 6 }. Так как в Z7 1 = 1 ■1, 2 = 2 ■1, 3 = 4 ■6, 4 = 4 ■1, 5 = 2 ■6, 6 = 1 ■6, то все шесть произведений ab, где a £ (2) и b £ (6) различны и представляю т все элементы Z£. Следовательно, группа Z^ яв­ ляется внутренним прямым произведением своих нормальных подгрупп (2) и (6). □ П р и м е р 7 .1 2 . Рассмотрим циклическую группу G = (а) по­ рядка pq, где p и q — просты е числа. В G есть две подгруп­ пы порядков p и q — это подгруппа G q = (aq) и подгруппа G p = (ap), которы е пересекаются только по единичному элемен­ ту. Покажем, что лю бой элемент g £ G единственным образом представляется в виде произведения (aq) k(ap)m, где 0 ^ к < p и 0 ^ m < q. Так как таких произведений ровно pq, то д оста­ точн о показать, что все они различны. Д опустим, это не так и два произведения равны: (aq) kl (ap)mi = (aq) k2 (ap) m2. Тогда из этого равенства и коммутативности группы G следует, что (aq) kl_ k2 = (ap)m2_ m i, |к1 — к2| < p и |m2 — m 1| < q. Последнее равенство возм ож но только в том случае, когда (aq) kl_ k2 = e, т. е. разность к1 —к2 долж на бы ть кратна p, что, очевидно, невоз­ м ож но в силу неравенства |к1 — к 2 1 < p. Таким образом, группа G является внутренним прямым произведением своих нормаль­ ных подгрупп G q и G p. □ Из примеров 3.31 и 7.12 следует, что при п росты х p и q цик­ лическая группа порядка pq является внутренним прямым про­ изведением подгрупп порядка p и q и изоморф на внешнему пря­ мом у произведению этих подгрупп. В следующ ей теореме пока­ ж ем, что это частный случай более общей ситуации. Т е о р е м а 7 .6 . П уст ь группа G являет ся внут ренним пря­ м ым произведением H 1H 2 ■■■H n своих нормальных подгрупп H 1, H 2, . . . , H n . Тогда G ^ H1 х H2 х
234 Глава 7. Структура конечных групп Д о к а з а т е л ь с т в о . Покажем, что Hi П H j = e для всех i и j . Если это не так и g G Hi П H j , то элемент g мож но представить двум я разными способами в виде произведений элементов нор­ мальных подгрупп. Рассматривая g как элемент подгруппы Hi, получим произведение g = e 1 ■■■e i - 1gei +1 ■■■ej ■■■e „, (7.4) где et = e — элемент подгруппы H t. Рассматривая g как элемент подгруппы H j , получим второе произведение g — e 1 ■■■ei " " " ej - 1gej+1 " " " era, (7.5) где et = e — элемент подгруппы H t. Если g = e, то равенства (7.4) и (7.5) противоречат единственности представления каж ­ д ого элемента группы G в виде произведения h 1 ■■■hi ■■■hn , где hi G H i. Следовательно, Hi П H j = e для всех i и j . Теперь легко видеть, что для лю бы х hi G Hi и hj G H j h i h jh - 1h -1 = h i(h jh “ 1h “ 1) = hihi G Hi, h ih jh “ 1h “ 1 = (h ih jh “ 1)h “ 1 = h jh - 1 G H j . Следовательно, hih j h - 1h -1 = e и hih j = h jh i , т. е. элемен­ ты из разных нормальных подгрупп коммутируют. И спользуя это свойство, нетрудно показать, что для умножения произведе­ ний h 1 ■■■hi ■■■hn и h1 ■■■hi ■■■h^, состоящ их из элементов hi, hi, попарно пересекающихся только по единичному элементу нор­ мальных подгрупп H i , мож но воспользоваться равенством (h1 ■■■hi ■■■h „)(h 1 ■■■hi ■■■hn) = h ^ ■■■hihi ■■■h„h^. (7.6) Зададим отображ ение (p группы G = H 1H 2 ■■■H n в прямое произведение H 1 x H 2 x ■■■ x H n ее нормальных подгрупп ра­ венством p(h1h2 ■■■h „) = (h1, h 2 , . . . , h „). (7.7) Взаимная однозначность этого отображ ения следует из един­ ственности представления каж дого элемента группы G в виде
7.3. Прямые произведения групп 235 произведения h i h 2 ■■■hn . П усть g = h i h2 ■■■hn и g' = h^h^ ■■■hn — произвольные элементы группы G. Тогда в силу свойства (7.6) p (g g ') = p ((h ih 2 ■■■hn)(hih2 ■■■hn)) = = p (h ih /Lh2h/2 ■■■hnhn) = ( hi hi , h2h2, . . . , hn hn) = = ( hl , h 2, . . . , hn)(h/l , h/2, . . . , hn)) = P (g M g '^ т. е. р сохраняет групповую операцию и, следовательно, являет­ ся изоморф изм ом. Теорема доказана. Говоря далее о разложении группы в прямое произведение ее нормальных подгрупп, как правило, не будем различать внеш­ ние и внутренние произведения, так как эти произведения изо­ морф ны , а использованный в доказательстве теоремы 7.6 изо­ морф изм (7.7) позволяет все технические действия во внешних и внутренних произведениях проводить совершенно идентичным образом. Т е о р е м а 7 .7 . Группа G порядка p j1 ■■-p^" являет ся прямым произведением свои х силовских p i-подгрупп тогда и только то­ гда, когда эти подгруппы нормальны в G. Д о к а з а т е л ь с т в о . Н еобходим ость следует из того п ростого ф акта, что любой множитель в прямом произведении является нормальной подгруппой произведения. Для группы G = H i х х ■■■ х H n и ее прямого множ ителя Hi это следует из равенств ( h i , . . ., hi, . . . , hn)(ei,. . . , H i , . . . , en)(h-i , . . . , h - i , . . ., h - i) = = ( h i h - i , . . . , h i H i h - i , . . . , h n h - i ) = ( e i , . . . , H i , . . . , en), где ht £ H t и et — единичный элемент H t. Д окаж ем достаточн ость. Сначала покажем, что каж дый эле­ мент g группы G единственным образом представляется в виде g = h ih 2 ■■■hn , где hi £ Hi и Hi — нормальная силовская под­ группа порядка p ki. Если это не так, то в силу того, что в G есть ровно p i 1 ■■-p^" произведений вида h ih 2 ■■■hn , в G найдется та­ кой элемент g, что hi . . . h i - - - h n = g = h i . . . h i ' . . - h n ,
236 Глава 7. Структура конечных групп где hi, hi' е Hi и hj = hj' хотя бы для одного j . Так как Hi Р| H j = = e (если g е H if| H j и g = e, то порядок элемента g будет кратен p ip j, что, очевидно, невозмож но), то в силу (7.6) e = h i'h i-1 ■■■hi' hi- 1 ■■■hn h - 1 = h 1 ■■■hi ■■■hn , причем среди элементов hi = hi'hi-1 есть хотя бы один нееди­ ничный элемент h j . Так как hi е Hi, то его порядок di равен р ™ . П олож им d = П i= j di . Тогда (см. (7.6)) e = ( h i . . . hi ■■■hj ■■■hn)d = h f . . . h f ■■■h f ■■■hn = hf. С другой стороны , d и dj взаимно просты , и п оэтом у h f = e. Пришли к противоречию , из которого следует, что все р^1 ■■■р Пп произведений вида hi ■■■hn , где hi е Hi, представляю т различ­ ные элементы группы G. Следовательно, G является внутрен­ ним прямым произведением своих силовских pi-подгрупп. Те­ перь достаточн ость условия теоремы легко следует из теоре­ мы 7.6. Теорема доказана. 7.4. Конечные абелевы группы К ом м утативность накладывает сильные ограничения на воз­ м ож ную стр у к ту р у группы. Одно из таких ограничений состои т в том, что любая подгруппа абелевой группы является нормаль­ ной. Из этого ф акта и теоремы 7.7 легко извлекается следующ ая простая теорем а1). Т е о р е м а 7 .8 . К аж дая конечная абелева группа являет ся прямым произведением своих силовских р -подгрупп. П р и м е р 7 .1 3 . Рассмотрим абелеву G группу порядка n = = p i ■■■pfc, где pi — различные просты е числа. Из теоремы 7.8 и п ростоты порядков всех силовских подгрупп группы G следует, что G является прямым произведением циклических подгрупп ^Полезно сравнить эту и следующую теоремы с теоремами о строении конечномерных линейных пространств из раздела 6.4.
7.4. Конечные абелевы группы 237 с взаимно просты ми порядками: G = (gi) х ■■■х (gk), где |(gi)| = = p*. П олож им n* = n/p*. Покажем, что порядок произведения g = g i ■■■gk равен n. Для этого достаточн о убедиться в том , что g ni = e при i = 1 , . . . , k. Покажем, что это так для i = 1. В этом случае n i = p 2 ■■■pk и g” 1 = e при i = 2 , . . . , k так как g p = e и pi делит n i, и gn1 = e, так как n i и p i взаимно просты . Тогда в силу коммутативности группы G gn1 = gn1gn1 ■■■ gn1 = gn1 = e. Таким образом, порядок элемента g совпадает с порядком груп­ пы, т. е. G — циклическая группа. Следовательно, циклическая группа порядка n = p i ■■■pk, где p* — различные просты е числа, является единственной, с точн остью д о изоморфизма, коммута­ тивной группой данного порядка. □ Группу порядка pn , где p — простое, будем называть примарной группой, или p -группой. Далее рассм отрим абелевы p-группы, в прямое произведение которы х разлагается произвольная абелева группа. Оказывает­ ся, каж дая такая группа имеет достаточн о ж естк ую внутрен­ ню ю структуру. Э ту стр у к ту р у опишем в следующ ей теореме. Т е о р е м а 7 .9 . К аж дая конечная абелева p -группа являет ся прямым произведением циклических групп. Д о к а з а т е л ь с т в о . Покажем, что любая абелева группа по­ рядка pn является прямым произведением своих циклических подгрупп. Сделаем это индукцией по n. В основание индук­ ции положим очевидный случай n = 1. Д опустим, что при всех n < m утверж дение теоремы справедливо. Рассмотрим произ­ вольную абелеву группу G порядка pm и выберем в ней эле­ мент g максимального порядка. Если порядок g равен pm, то утверж дение теоремы очевидно, так как в этом случае G будет циклической группой. Далее полагаем, что порядок элемента g равен p k, где k < m. Ф актор-группа H = G /( g ) состои т из pm_ k элементов и по предполож ению индукции является прямым про­ изведением H = H i х ■■■ х Hi х ■■■ х Hr (7.8)
238 Глава 7. Структура конечных групп циклических подгрупп k. Л Hi = (h i(g )) = { ( g) , h i ( g ) , . . . , hj <g ) , . . . , h? 1—1(g)}, где hi £ G, |Hi |= p ki, ki ^ к и к 1 +-+ kr = m —к. Из равенства (7.8) и теоремы 7.6 следует, что лю бой элемент h (g) группы H м ож но единственным образом представить в виде произведения h (g) = h*1<g) ■■■h** <g) ■■■h^r <g) = h*1 ■■■h** ■■■h^r <g), (7.9) где 0 ^ ti < p ki. k• k• Так как h? * <g) = <g), то найдется такое s i, что h? * = g s*. П орядок элемента hi в группе G не превосходит p k. П оэтом у из равенств g?k = e = h f = h f ^ = g si-Pk-fci следует, что произведение sipk—ki кратно p k. Значит, сущ ествует такое li , что sip k—ki = lip k или si = lip ki. П олож им gi = hig —'l*. Н етрудно видеть, что <hi<g)) = <gi<g)), и п оэтом у gi £ <g) при 0 < l < p ki. А так как kgp'* = (h ig - 'li) ? * = h?kig —lipki = g sig — = e, то каж дая циклическая группа Gi = <gi) будет в группе G такой подгруппой порядка p k*, которая пересекается с <g) только по единичному элементу. Заметим, что равенство g*1 ■■■g f ■■■g£r = g* (или g*1 ■■■g** ■■■g jrg —* = e) (7.10) возм ож но только в том случае, когда t и все ti равны нулю. Д ействительно, из (7.10) и определения элементов gi следует соотнош ение h 1 ■■■h f ■■■h1' = (g1 g l1)!l ■■■(gigl*)** ■■■(grglr)tr = = g11 ■■■g** ■■■g£rg 11*1^ " ^ ^ = g*+l1t1+ - + lrtr £ <g), которое в силу (7.9) возм ож но только тогда, когда все ti равны нулю. Но g 0 ■■■g 0 ■■■g0 = e, т. е. t такж е равно нулю. О тсю да
7.4. Конечные абелевы группы следует, что все p kl+ 239 +kr+fc = pm произведений g*1 ■■■g*4 ■■■g£rg* являю тся различными элементами G, т. е. каж дый элемент G единственным образом представляется в виде такого произведе­ ния. Следовательно, G = G 1 х ■■■ х G i х ■■■ х G r х (g). Теорема доказана. П р и м е р 7 .1 4 . Воспользуемся доказанной теоремой и пока­ ж ем, что в любой абелевой группе порядка pn для л ю бого m < n найдется подгруппа из pm элементов. Заметим, что это верно для циклических групп. В циклической группе G с п орож даю ­ щим элементом g требуем ую подгруппу будет порож дать эле­ мент gpn m. П усть теперь G — произвольная абелева группа по­ рядка pn . Тогда G = G 1 х - - - х С г , где |Gi |= pni и n 1+■ ■-+ n r = n. Очевидно, что сущ ествую т такие m 1, . . . , m r , что mi ^ ni и m 1 + ■■■+ m r = m. Выбирая в группах Gi подгруппы Hi поряд­ ка pmi, видим, что произведение H 1 х ■■■х H r будет подгруппой порядка pm в группе G. □ Т е о р е м а 7 .1 0 . Если конечная абелева p -группа G разлага­ ет ся двум я способами в прямое произведение циклических под­ групп G = А 1 х ■■■ х A r = B 1 х ■■■ где |A 1 1 ^ |A 2 1 ^ х B s, ^ |Ar | и |B 11 ^ |B 2 1 ^ ^ |B s |, то r = s и |Ai| = |Bi| для всех i £ {1, 2 , . . . , r } . Д о к а з а т е л ь с т в о . Д ля группы из p элементов утверж дение теоремы очевидно. Д опустим , что при всех n < m утверж де­ ние теоремы такж е справедливо. Рассмотрим абелеву группу G порядка pm, которая разлагается двумя способами G = (а 1) х ■■■ х (ar ) = (b1) х ■■■ х (bs) (7.11) в прямое произведение циклических подгрупп (ai) и (b j), где |(ai)| = p ki, к 1 ^ к 2 ^ ••• ^ ки > ки+1 = ••• = кг = 1, i(bj)| = pn j, n1 ^ n2 ^ ■■■ = n = 1. ^ n > nv+1 = (7 1 2 )
240 Глава 7. Структура конечных групп Л егко видеть, что м нож ество Gp = {g p | g € G } является под­ группой группы G. Из (7.11), (7.12) и теоремы 7.6 следует, что произвольный элемент g группы G мож но представить в виде двух произведений a !1 •••a*‘ •••aj.r = g = bf1 •••bfj •••bfs, где 0 ^ ti < p ki и 0 ^ dj < (7.13) , причем для каж дого g сущ ествует единственный набор показателей t i , . . . , tr и единственный набор показателей d i , . . . , ds, для которы х справедливо (7.13). В свою очередь из (7.12) и (7.13) следует, что произвольный элемент gp подгруппы Gp такж е м ож но представить в виде двух произве­ дений (a?)*1 •••(a ?)* •••(aU)tu = gp = (b?)d1 •••(b?)dj •••(b?)dv, где 0 ^ ti < p ki—! , 0 ^ dj < (7.14) —! , и для каж дого gp сущ ествует единственный набор показателей t i , . . . , tr и единственный набор показателей d i , . . . , ds, для которы х справедливо (7.14). О тсю да при помощи теоремы 7.6 немедленно получаем, что G p = (a !) х ••• х (aU) = (b?) х ••• х (6£), где |(ai )| = p ki—1 и |(bj)| = р П —! . Так как |GP| = pm—r+ u = = pm—s+ v ^ pm—! , то по предполож ению индукции u = v, ki —1 = = ni — 1 для i € { 1 , . . . , u } и, следовательно, r = s и ki = ni для i € { 1 , . . . , r } . Теорема доказана. Если конечная абелева р-группа G разлагается в прямое про­ изведение своих циклических подгрупп G i х •••х G r , то порядки p k1, . . . , p kr этих подгрупп называются инвариантами, или инва­ риантными делителями группы G. В следующ ей теореме пока­ ж ем, что любая конечная абелева р-группа определяется своими инвариантами с точн остью д о изоморфизма. Т е о р е м а 7 .1 1 . К онечные абелевы р-группы изоморфны тогда и только тогда, когда они имеют одинаковые инварианты.
241 7.4. Конечные абелевы группы Д о к а з а т е л ь с т в о . П усть A = ( ai ) х ■■■ х (ar ), |(a*)| = p ki, A = B и p : A ^ B — изоморф изм A в B . Так как каж ­ дый элемент A однозначно представляется в виде произведения a ^1a 22 ■■■ аГг , то очевидно, что и каж дый элемент B однознач­ но представляется в виде произведения p (a i)* 1p ( a 2)*2 ■■■p (a r)tr, и, следовательно, B = ( p( a i ) ) х ■■■ х (p (a r)). Таким образом, p k1, . . . ,p kr — инварианты группы B , т. е. инварианты групп A и B совпадают. П усть теперь абелевы группы A и B имею т одинаковые ин­ варианты. Тогда A = (ai ) х ■■■ х (ar ), B = (bi) х ■■■ х (br ) и (a*) = (bi). Если отображ ение p* : (a*) ^ (bi) — изоморфизм (a*) в (bi), то легко видеть, что отображ ение p ( x i , . . . , x r) = = ( p i ( x i ) , . . . , p r (x r)) будет изоморф изм ом группы A в группу B . Теорема доказана. П р и м е р 7 .1 5 . Найдем все неизоморф ны е абелевы группы по­ рядка 16. Так как 16 = 8 ■2 = 4 ■4 = 4 ■2 ■2 = 2 ■2 ■2 ■2, то любая абелева группа порядка 16 изоморф на одной из следую ­ щих групп: Z i 6, Z х Z 2, Z 4 х Z 2 х Z 2, Z 4 х Z 4, Z 2 х Z 2 х Z 2 х Z 2. □ О бъединяя теоремы 7.8 и 7.10, видим, что справедливо сле­ дую щ ее утверж дение, д остаточн о точно описывающ ее стр у к ту ­ ру конечной абелевой группы. Т е о р е м а 7 .1 2 . К аж дая конечная абелева группа являет ­ ся прямым произведением циклических p -подгрупп. Любые два произведения сост оят из одинакового числа м нож ит елей одно­ го порядка. К ак и в случае p-групп, порядки множителей в разлож е­ нии конечной абелевой группы G в произведение циклических p-подгрупп называются инвариантами группы G. Нетрудно ви­ деть, что имеет место следую щ ая теорема, доказательство ко­ торой почти дословно повторяет доказательство теоремы 7.11. Т е о р е м а 7 .1 3 . Конечные абелевы группы изоморфны тогда и только тогда, когда они имеют одинаковые инварианты.
242 Глава 7. Структура конечных групп П р и м е р 7 .1 6 . Ч астный случай теоремы 7.13 был рассмотрен выше в примере 7.13, где бы ло показано, что все абелевы группы с простыми несовпадающими инвариантами p i , . . . ,р^ изом орф ­ ны. □ П р и м е р 7 .1 7 . Рассмотрим абелеву группу G порядка 3 ■103 с инвариантами 52, 5, 3, 22, 2. Э ту группу м ож но представить в виде произведения G 25 х G 5 х G 3 х G 4 х G 2, где Gi — циклическая подгруппа порядка i. Так как G 25 х G 5 х G 3 х G 4 х G 2 = (G 25 х G 3 х G 4) х (G 5 х G 2), то, повторяя рассуж дения примера 7.13, мож но показать, что G является прямым произведением двух циклических подгрупп, чьи порядки равны 300 и 10. □ П р и м е р 7 .1 8 . Перечислим все неизоморфные абелевы груп­ пы порядка 100. Так как 100 = 25 ■4 = 25 ■2 ■2 = 5 ■5 ■4 = 5 ■5 ■2 ■2, то лю бая абелева группа порядка 100 изоморф на одной из сле­ дую щ их групп: Z 25 х Z 4 ,Z 25 х Z 2 х Z 2 ,Z 5 х Z 5 х Z 4 , Z 5 х Z 5 х Z 2 х Z 2. (7.15) Заметим, что Z 25 х Z 4 = Zioo, Z 25 х Z 2 х Z 2 = Z 5o х Z 2 , Z 5 х Z 5 х Z 4 = Z 20 х Z 5 , Z 5 х Z 5 х Z 2 х Z 2 = Z io х Zio, т. е. каж дую из групп в (7.15) мож но представить в виде произ­ ведения меньшего числа циклических сомнож ителей. □ Обобщ им рассуж дения из примера 7.17 на произвольную абелеву группу G с инвариантами nk m k nk1 k1 nk2 k2 nk3 k3 p k , p k, p k , . . . , p k
7.4. Конечные абелевы группы 243 П олож им m = m a x (m 1, . . . , ). М ож но считать, что все mi рав­ ны m. Если это не так, то к инвариантам с основанием pi д оба­ вим m —mi единиц. Группа G разлагается в прямое произведение G 11 x G 12 X ■■■ x G 1m x ■■■ x Gfc! x Gfc2 x ■■■ x G fcm (7.16) своих циклических pi-подгрупп G ij порядка pn j (подгруппы, соответствую щ ие добавленным к инвариантам единицам, будут тривиальными единичными подгруппами). Объединяя в (7.16) подгруппы с одинаковыми вторыми индексами, получим новое представление ( G 11 x G 21 x ■■■ x Gfc!) x ■■■ x (G 1m x G 2m x ■■■ x Gfcm) группы G. Так как при s = t порядки подгрупп G si и G ti взаимно просты , то для каж дого i = 1, 2 , . . . , m произведение G 1i x G 2i x ■■■ x Gfci будет циклической подгруппой Gi порядка qi = p®14рП24 ■■■Pfcfei, причем qi+1 будет делить qi для i = 1 , . . . , m — 1. Таким образом, произвольную абелеву группу G мож но пред­ ставить в виде произведения G = G 1 x G 2 x ■■■ x G m ее циклических подгрупп Gi, где порядок подгруппы G i +1 делит порядок подгруппы G i. П орядок подгруппы G 1 называется по­ казателем группы G. В группе с показателем q максимальный порядок элемента равен q, и порядок каж дого элемента группы делит q. Л егко видеть, что абелева группа является циклической тогда и только тогда, когда ее порядок и показатель равны. Следующ ая теорема является обращением теоремы Л агран­ ж а для абелевых групп и обобщением примера 7.14. Т е о р е м а 7 .1 4 . П уст ь m делит п. В абелевой группе порядка п сущ ест вует подгруппа порядка m.
244 Глава 7. Структура конечных групп Д о к а з а т е л ь с т в о . Рассмотрим абелеву группу G порядка n = pn 1 ■■■pnk. Эта группа является прямым произведением G i х ■■■ х Gk своих силовских pi-подгрупп Gi. К аж ды й де­ литель m порядка группы n представим в виде произведения p ™ 1 ' ' 'p™fc, где m i £ { 0 , 1 , . . . , n i } и m i ^ n i . Из разобранного выше примера 7.14 следует, что в каж дой подгруппе Gi порядка pn- найдется подгруппа Hi порядка p™- . П оэтом у прямое произ­ ведение H 1 х х H k этих подгрупп будет подгруппой порядка m в группе G. Теорема доказана. Теперь покажем, что утверж дение теоремы 7.14 нельзя обоб­ щить на неабелевы группы. Для этого рассм отрим симметри­ ческую группу S 5 . П орядок этой группы равен 120, а макси­ мальный порядок ее элемента равен шести. Таким элементом, например, будет произведение двух циклов (123)(45). Ранее в примере 7.10 на с. 231 было показано, что любая группа поряд­ ка 15 является циклической. Следовательно, в S 5 нет подгруппы порядка 15, хотя 120 = 15- 8. 7.5. Группа Zn Из доказанной в главе 3 теоремы 3.17 следует, что группа Zn при n = pj 1p(k2 ■■■p™1, где все pi различные простые, изоморфна прямому произведению Z \ х Z *fc2 х ■■■ х Z*fcm. p/ p22 Pmm (7.17) V 7 В приводимых далее леммах перечисляются все циклические группы Zn. Эти леммы позволят полностью описать стр у к ту ­ ру всех множителей в (7.17). Л е м м а 7 .1 . При каж дом простом p группа Zp — цикличе­ ская. Д о к а з а т е л ь с т в о . П усть m — показатель группы Zp. Так как порядок каж дого элемента группы делит ее показатель, то каж дый элемент Zp является корнем двучлена x m - 1. С другой стороны , двучлен x m - 1 в поле Z p имеет не более m корней.
7.5. Группа Z*n 245 Следовательно, m = p — 1 и Z* — циклическая группа. Лемма доказана. Л е м м а 7 .2 . При любом простом p группа Z * 2 — цикличе­ ская. Более того, среди порож даю щ их ее элементов сущ ест ву­ ет элемент h, удовлет воряющ ий равенст ву hp— 1 = 1 + np, где целое n не делится на p . Д о к а з а т е л ь с т в о . Покажем, что в качестве требуем ого эле­ мента h мож но взять либо порож дающ ий элемент g группы Z?, либо элемент g + p. Рассмотрим элемент g + tp , где t £ { 0 ,1 } , и пусть d — порядок этого элемента в группе Z**2. Нетрудно видеть, что (g + tp)d = = g d (m od p). К ром е того, из равенства (g + tp)d = 1 (m od p 2) следует, что (g + tp)d = 1 (m od p). П оэтом у g d = 1 (m od p), и, следовательно, d дол ж н о делится на p — 1 , т. е. либо d = p — 1 , либо d = p(p — 1) в силу того, что |Z?21 = p(p — 1). Таким образом для того, чтобы показать, что g + tp является порож дающ им элементом в группе Z ?2, д остаточн о показать, что d = p — 1. Так как g — порож дающ ий элемент группы Z**, то найдется целое m, для которого g p— 1 = 1 + mp. Тогда p — 1V tpg - -Р — 22 + + E V 1 f( p (g + tp )p— 1 = g p— 1 + ( p 1 ^ p— p — k Л ^ (tp) kgP—1—k = = 1 + p (m — tgp—2) + p 2tg p— 2 + ] T (^p — ^ ( t p ) kgp—1—k К аж дое произведение, стоящ ее под знаком суммы в последнем равенстве, делится на p 2. Следовательно, найдется такое целое к, что (g + tp )p— 1 = 1 + p (m — tgp—2) + kp 2 = 1 + p (m — tg p— 2 + kp). Теперь покажем, что по крайней мере при одном из двух возм ож ны х значений t величина n = m — tg p— 2 + kp не делится на p. Если m не делится на p, то полагаем t = 0. Тогда n = m + k p и легко видеть, что n не делится на p. Если ж е m делится на p,
Глава 7. Структура конечных групп 246 то полагаем t = 1. В этом случае n = m — gp_ 2 + kp. Так как g и p взаимно простые, то gp_ 2 не делится на p. П оэтом у n также не делится на p. Таким образом, найдется t, равное нулю или единице, при к отором n = m — tgp_ 2 + kp не делится на p, и, следовательно, произведение pn не делится на p 2. П оэтом у (g + tp)p_ i = 1 + np = 1 (m od p 2), т. е. h = g + tp является порож даю щ им элементом в группе Zp 2 и hp_ i = 1 + pn, где n не делится на p. Лемма доказана. Л е м м а 7 .3 . Если p — простое нечетное, то при каж дом натуральном k группа Z*fc — циклическая. Д о к а з а т е л ь с т в о . Покажем, что при k > 2 порож дающ им элементом в группе Zpk будет порож дающ ий элемент h группы Zp2, указанный в лемме 7.2. П усть d — порядок элемента h в группе Z*fc. Тогда из равенства hd = 1 (m od p k) следует, что hd = 1 (m od p 2). П оэтом у d дол ж н о делиться на p(p — 1), т.е. d равно произведению p s(p — 1). Покажем, что это равенство возм ож но только при s = k — 1 . Из леммы 7.2 следует, что hp_ i = 1 + np, где n не делится на p. Тогда, учитывая, что (р) делится на p при i = 0, p, hp(p_ i) = (1 + np)p = 1 + Q np + ^ Q (np)* = 2 3 2 2 = 1 + np + n p = 1 + p ( n + n p ) = 1 + p n i , где очевидно n i на p не делится^. Возводя аналогичным об­ разом получившееся равенство hp(p _ i) = 1 + p 2n i в степени p , p 2, . . . , легко видеть, что для лю бого натурального s справед­ ливо равенство hpS(p_ i) = 1 + p s+ in s, ^Последнее равенство со свойством p { n 1 справедливо только при p > 2, поэтому и лемма 7.3 неверна для единственного четного простого числа p = 2, — см. далее лемму 7.5 и ср. с леммой 7.2.
7.5. Группа Z*n 247 где n s не делится на р. Следовательно, hpk- 2(p- i ) = 1 (mod p k). Таким образом порядок h в группе Z *k равен pk- 1(p — 1), т. е. эт о т элемент является порож даю щ им элементом группы. Лемма доказана. П р и м е р 7 .1 9 . Рассмотрим группу Z J. В Z3 порож дающ им элементом является 2. Так как 22 = 4 (m od 9), то 2 — порож да­ ющий элемент в Z J. □ П р и м е р 7 .2 0 . Найдем порож дающ ий элемент в группе Z Jg2. Т ак как 26 — 1 и 2 9 —1 не делятся на 19, то 2 будет порож дающ им элементом в Z J9. Теперь проверим, выполняется ли равенство 2 18 = 1 (m od 192). Так как 192 = 361 и 2 18 — 1 = (2 9 — 1)(2 9 + 1) = 511 ■513, то легко видеть, что ни 511, ни 513 не делятся на 361. Такж е лег­ ко видеть, что 511 и 513 не м огут одновременно делиться на 19. Следовательно, 2 18 = 1 (m od 192), и 2 является порож дающ им элементом в Z Jg2. □ Л е м м а 7 .4 . Если р — простое нечетное, то при каж дом натуральном k группа Z J k — циклическая. 2р Д о к а з а т е л ь с т в о . П реж де всего заметим, что группа Z2pk состои т из (р — 1 )pk- i натуральных чисел, каж дое из которы х нечетно, не делится на р и меньше, чем 2p k. П усть g — порож дающ ий элемент группы Z *k. Если g нечет­ ное число, то g принадлеж ит группе Z Jpk. Его порядок в этой группе обозначим через d. Тогда из равенства g f = 1 (m od 2pk) следует, что g f = 1 + 2pk ■n = 1 + p k ■2 n = 1 (m od pk). Таким образом, d = (p — 1)pk- i , и, следовательно, g будет по­ рож даю щ им элементом в группе Z 2pk.
248 Глава 7. Структура конечных групп Если g — четное, то нечетным будет число g + p k, вычет которого по четному модулю 2pk очевидно принадлежит группе Z*pfc. П усть d — порядок этого вычета в группе Z*pfc. Тогда из равенства (g + p k)d = 1 (m od 2p k) и четности g следует, что 1 + 2p k ■n = (g + pk)d = g d + ^ f ^ p fcig d_ i = g d + 2p k ■m, i=1 т. е. g d = 1 (m od pk). Таким образом, d = (p — 1)pk_ 1, и, следова­ тельно, вычет числа g + p k по модулю 2p k будет порож дающ им элементом в группе Z*pfc. В ообщ е говоря, утверж дение леммы 7.4 сразу следует из раз­ ложения (7.17) и леммы 7.3, так как при нечетном p Z 2pfc = z 2 х z ; fc ^ { 1 } х Z ; fc = Zpfc. Однако доказательство с явным указанием п орож даю щ его эле­ мента группы Z 2pk, как это бы ло сделано в предыдущ их леммах, дает дополнительную полезную инф ормацию об этой группе. Л емма доказана. Л е м м а 7 .5 . При к ^ 3 группа Z*fc не являет ся циклической и изоморфна прямому произведению группы порядка 2 и цикли­ ческой группы порядка 2 k_ 2 . Д о к а з а т е л ь с т в о . П реобразуя разность 5 2k 2 —1 по формуле разности квадратов, приходим к равенству 5 2" -2 — 1 = (5 2° — 1) П ( 5 2' + 1) = 4 ■ П ( 5 2' + 1), i=o i=o в правой части которого первый множ итель равен 4, а остальные к — 2 четные. Таким образом, разность 52 — 1 делится на 2k, и, следовательно, 5 2 = 1 (m od 2k). Теперь рассм отрим разность 5 2 3 —1. Так как 5 = 1 (m od 4), то и 5n = 1 (m od 4) при лю бом натуральном n. П оэтом у в пра­ вой части равенства 52k-3 — 1 = 4 ] ] [ V i=o + 1)
7.5. Группа Z*n 249 ни один из сомнож ителей вида (5 2 + 1) не делится на 4, и, сле­ довательно, все произведение не делится на 2к. Таким образом, порядок 5 в группе Z*fc больше, чем 2k-3 и, следовательно, равен 2 k -2 . Далее заметим, что 5n = —5 (m od 2k) ни при каком п, так как в этом случае такж е справедливо равенство 5n = —5 (m od 4), которое, очевидно, противоречит равенствам 5n = 1 (m od 4) и —5 = 3 (m od 4). П оэтом у все числа вида ( —1)i 5j , где i = 0,1 и j = 1 , . . . , 2 k -2 , различны по модулю 2 k, и так как все эти числа нечетные, то они обр азую т группу Z*fc. Теперь легко видеть, что отображ ение p : Z2k ^ Z 2 x %2к - 2 , преобразующ ее число ( —1)i 5j в пару чисел (i, j ), является изо­ морф измом , т. е. Z2k = Z 2 x Z 2k - 2 . Лемма доказана. Л е м м а 7 .6 . П уст ь n = m 1m 2, где m 1 и m 2 взаимно простые и не равные 2. Тогда группа Z® не являет ся циклической. Д о к а з а т е л ь с т в о . П реж де всего заметим, что в силу тео­ ремы 3.17 группа Zm im2 изоморф на прямому произведению Zm i x Zm 2 . Так как m 1,m 2 > 2 , то группы Z j^ и Zm 2 с о ст о ­ я т из четного числа элементов, и п оэтом у каж дая из этих групп имеет элемент порядка 2. Следовательно, в Z j^ x Zm 2 найдут­ ся два различных элемента второго порядка, что невозмож но в циклической группе. Лемма доказана. Собирая вместе результаты доказанных лемм 7.1—7.6, полу­ чаем следую щ ую теорему, позволяю щ ую с учетом (7.17) исчер­ пывающ е описать стр у к ту р у мультипликативной группы кольца вы четов по модулю n. Т е о р е м а 7 .1 5 . Группа Z® являет ся циклической тогда и только тогда, когда п = 2, 4, или n = p k, или n = 2pk, где p — нечет ное простое, k — произвольное натуральное. При k ^ 3 группа Z 2k не являет ся циклической, однако Z 2k = Z 2 x Z 2k - 2 . П р и м е р 7 .2 1 . Теорема 7.12 показывает, что абелева группа Z 63000 разлагается в прямое произведение своих циклических
Глава 7. Структура конечных групп 250 р-подгрупп. Воспользуемся результатами этого раздела и най­ дем явный вид этого произведения. Так как 63000 = 23 ■3 2 ■5 3 ■7, то Z 63000 = Z 23 х z ;2 х Z 53 х Z ;. (7.18) Имеем Z2 3 = Z 2 х Z 2 , Z ;2 ^ Z£ = Z 6 ^ Z 2 х Z 3 и Z ;3 = Z l00 = = Z 4 х Z 25 по леммам 7.1—7.5. Таким образом, Z 63000 = Z 22 х Z 2 х Z 2 х Z 2 х Z 2 х Z 3 х Z 3 х Z 52, (7.19) и инвариантами группы Z 63000 являю тся 52, 3, 3, 22, 2, 2, 2, 2. Сле­ довательно, максимальный порядок ее элементов (показатель группы ), совпадающ ий с наименьшим общ им кратным ее инва­ риантов, равен 5 2 ■3 ■2 2 = 300. Найти лю бой конкретный элемент, порядок которого де­ лит 300, мож но с помощ ью п орож даю щ их элементов цикличе­ ских разложений групп Z23, Z ; 2, Z53, Z ; и китайской теоремы об остатках. □ П р и м е р 7 .2 2 . И зом орф измы (7.18) и (7.19) п ом огаю т и ре­ шать уравнения в Z ;3000, и легко находить число их корней, не решая явно. Например, сравнение х 2 = 1 (m od 63000) име­ ет 2 5 = 32 корня, так как в циклических группах порядка 2 и 4 уравнение х 2 = 1 имеет по 2 корня, а в циклических группах по­ рядка 3 и 25 только один (единицу группы). Одним из искомых корней будет, например, вычет х, равный 5 по модулю 23 и ( —1) по модулям 3 2, 5 3 и 7. Его явный вид х = 15749 (m od 63000) м ож но найти по формуле теоремы 2.11 (стр. 45). □ Задачи 7.1. Почему мощность любого класса сопряженных элементов ко­ нечной группы делит ее порядок? Перечислить все группы, имеющие ровно три класса сопряженных элементов. 7.2. Пусть подстановки f , h € Sn имеют тип (ki, k2, . . . , kn). Найти число сопрягающих их подстановок, то есть число таких g, что f = = ghg- 1.
Задачи 251 7.3. Пусть подстановка п £ Sn имеет тип (ki, k2, . . . , kn) и пусть m = ki + k2 + ... + kn. Доказать, что sgn (п) = ( - 1)n -m . 7.4. Привести пример двух четных подстановок, сопряженных в группе Sn и не сопряженных в группе An. 7.5. Найти число орбит в группах S5 , А 5, S 6, Аб, S 7 и А 7 при их действии сопряжением на себя. 7.6. Найти число неизоморфных групп порядков 2, 3,4, 5, 6 , 7, 8 . 7.7. Найти число неизоморфных групп порядков 35, 65, 77,175. 7.8. Пусть группа G имеет порядок pip 2, где p i,p 2 — различные простые числа, такие, что pi = 1 (mod p 2). Доказать, что G = (а, 6), где порядки элементов а и 6 равны pi и p 2 соответственно, причем 6а 6-1 = с, где с — образующий элемент подгруппы (а). 7.9. При каких значениях m, n группа (a)m х (6)n — циклическая? 7.10. Пусть G = (а)i 2 х (6) 30. Найти максимальный порядок эле­ мента в G. Сколько различных подгрупп в G имеет порядок 6? Найти число различных гомоморфизмов р : G ^ (с) is и ф : (с) i 8 ^ G. 7.11. Пусть Z (G ) — центр некоммутативной группы G. Доказать, что фактор-группа G /Z (G ) не может быть циклической. 7.12. Пусть G — произвольная группа. Доказать, что группа G /Z (G ) изоморфна группе всех сопряжений G. 7.13. Показать, что в группе порядка p k, где p — простое, сущеk—1. 1 ствует нормальная подгруппа порядка p k 7.14. Найти все нормальные подгруппы в симметрической груп­ пе S4 и построить все гомоморфизмы р : S 4 ^ S4 . 7.15. Найти число неизоморфных абелевых групп порядков 8, 9, 48, 60, 900,1000. 7.16. Доказать теорему Коши: если порядок конечной группы G делится на простое число p, то в G существует элемент порядка p. 7.17. Показать, что в группе порядка p k, где p — простое, для любого m < k существует подгруппа порядка pm. 7.18. Найти число силовских 2-подгрупп и 3-подгрупп в группе S4 . 7.19. Для простого p найти порядок силовской p-подгруппы в группе Sn.
252 Глава 7. Структура конечных групп 7.20. Для простого p найти число силовских p-подгрупп в Sp. 7.21. Пусть p, q — простые, p < q и q —1 не делится на p. Доказать, что любая группа порядка pq коммутативна. 7.22. Для простого p в некоммутативной группе порядка p 3 най­ ти число классов сопряженности и число элементов в каждом таком классе. 7.23. Доказать, что центр прямого произведения групп G и H равен произведению центров, т. е. Z (G х H ) = Z (G ) х Z ( H ). 7.24. В группе G найти максимальный порядок элемента и число элементов максимального порядка, если: 1) G = Z^56; 2) G = Z ^ g ; 3) G = Z 40000. 7.25. Решить уравнение х 95 = 1 в кольце Z 30030. 7.26. Доказать, что показатель любой абелевой группы равен мак­ симальному порядку ее элементов. 7.27. Разложить в прямое произведение циклических p-подгрупп циклическую группу порядка: 1) 12; 2) 24; 3) 60; 4) 900. 7.28. Пусть T — множество всех элементов максимального поряд­ ка конечной абелевой группы G. Доказать, что G = <T). 7.29. Показать, что если в конечной коммутативной группе поря­ док каждого неединичного элемента равен p, p — простое, то группа изоморфна группе Z^. 7.30. Пусть A — подмножество элементов группы G. Множество N (A) всех элементов g £ G таких, что gAg -1 = A, называется норма­ лизатором множества A. Показать, что N (A) — подгруппа в G. 7.31. Найти нормализатор N (H ) подгруппы H в группе S4, если: 1) H = <(12)); 2) H = <(1234)); 3) H = {e, (12)(34), (13)(24), (14)(23)}.
Глава 8 Конечные поля В этой главе подробно изучаю тся конечные поля, их основные свойства, внутренняя структура. Рассмотрены особенности вы­ полнения вычислений с элементами конечных полей. 8.1. Мультипликативная группа поля Из доказанной в предыдущей главе леммы 7.1 следует цик­ личность мультипликативной группы поля Zp. Ниже покажем, что циклической будет мультипликативная группа л ю бого ко­ нечного поля. Сделаем это, в отличии о т доказательства лем­ мы 7.1, не используя понятие показателя группы. Л е м м а 8 .1 . В группе G порядка n, где n = р^1 .. .р^г — разло­ ж ен и е числа n на простые м нож ит ели, элемент h е G имеет порядок n, т.е. являет ся порож дающ им в G, тогда и только тогда, когда выполнено условие hn/pi = 1 для в сех i = 1 , . . . , r. (8 .1) Д о к а з а т е л ь с т в о . Н еобходимость. Если хотя бы для одного значения i неравенство ( 8 . 1) превращ ается в равенство, то по­ рядок элемента h стр ого меньше, чем n, так как из hn/pi = 1 следует, что порядок h делит n /p i. Для доказательства достаточн ости воспользуемся теоремой Л агранжа. Заметим, что порядок элемента h является делите­ лем числа n = |G|, а значит имеет вид р^1 .. . pXr , где 0 ^ X ^ ki при всех i. Из условия (8.1) следует, что при каж дом i = 1 , . . . , r
254 Глава 8. Конечные поля порядок h не делит p ^1 .. .p ^ 1p ^ V ^ Y .. . p^8, откуда x i = ki . Следовательно, |h| = n и элемент h — порож дающ ий в G. Лемма доказана. Т е о р е м а 8 .1 . М ультипликативная группа конечного поля циклическая. Д о к а з а т е л ь с т в о . Рассмотрим поле F ? , состоящ ее из q эле­ ментов. П усть q — 1 = p1 1 ■■■p k — разложение числа q — 1 = |F^ | на просты е множители. При каж дом i многочлен x (q_ 1)/pi — 1 имеет в мультипликативной группе поля F? не более (q — 1)/p i корней, п оэтом у для каж дого i в этой группе найдется элемент gi такой, что g (q_ 1)/p = 1 . ( 8 .2 ) ( 1)/ ki П олож им hi = g( )/ 4 , h = n r= 1 hi и покажем, что h будет по­ рож даю щ им элементом в F^. По лемме 8.1 для этого достаточн о доказать, что h (q_ 1)/pi = 1 для каж дого i. Сделаем это только для i = 1 , так как легко видеть, что доказательства для разных значений i аналогичны. Так как группа F^ абелева, то h (q_ 1)/p1 = П [ = h (q 1)/p1. Д а­ лее заметим, что произведение ((q — 1) / p ki) ■ (q — 1 ) / p 1 кратно q — 1, если i = 1. П оэтом у h (q_ 1)/p1 = 1 при i = 1. (8.3) k Теперь найдем порядок элемента h 1. Так как hp1 = g? 1 = 1, то порядок элемента h 1 равен p1, где s ^ к ь Н о из неравенства (8.2) следует, что hpi1- = gi? 1)/p1 = 1. П оэтом у порядок элемента h 1 равен p^1. Учиты вая, что (q — 1) / p 1 не делится на p^1, то заключаем, что h 1q_ 1)/p1 = 1 . ( 8 .4 ) Из (8.3) и (8.4) следует, что h (q_ 1)/p1 = 1. Теорема доказана. П р и м е р 8 .1 . Покажем, что в поле Z a [x ]/(x 3 + 2x + 1) из при­ мера 4.18 порож даю щ им элементом мультипликативной группы
8.1. Мультипликативная группа поля 255 будет элемент х = (010). И спользуя равенство^ х 3 = х + 2, легко находим все степени х: х 0 = ( 0 0 1 ), х 7 = ( 122 ), x i4 = ( 0 2 0 ), x 2i = ( 101 ), x i = ( 0 1 0 ), х 8 = ( 20 2 ), x i5 = ( 2 0 0 ), х 22 = ( 022 ), х 2 = ( 100 ), х 9 = ( 01 1 ), x i6 = ( 0 2 1 ), х 23 = ( 220 ), х 3 = ( 0 1 2 ), x i0 = ( 110 ), x i7 = ( 2 1 0 ), x 24 = ( 221 ), х 4 = ( 120 ), x ii = ( 112 ), x i8 = ( 121 ), х 25 = ( 201 ). □ х 5 = ( 2 1 2 ), x i2 = ( 102 ), x i9 = ( 2 2 2 ), х 6 = ( 111 ), x i3 = ( 00 2 ), x 20 = ( 2 1 1 ), О бразующ ий элемент мультипликативной группы поля F q (т. е. имеющий порядок q — 1 = |F*|) называется примитивным элементом этого поля. Теорема 8.1 утверж дает, что примитив­ ный элемент есть в лю бом конечном поле. Более того, поле по­ рядка q содерж ит ровно p (q — 1) примитивных элементов, т. к. циклическая группа порядка (q — 1) имеет ровно p (q — 1) обра­ зую щ их (см. теорем у 3.14). П усть а — примитивный элемент поля F q и в — ненулевой элемент этого поля. Минимальное неотрицательное число i, для которого в = а*, называется индексом или дискретным лога­ рифмом элемента в по основанию а и обозначается i = loga в . В примере 8.1 ф актически построена таблица логариф мов по­ ля F 27 = Z 3 [ x ] /( x 3 + 2х + 1) по основанию а = х. Из нее, напри­ мер, следует, что log ^ ^ 2 + а ) = 10 . Все примитивные элементы поля м ож но легко получить, зная один из них. Д ействительно, по теореме 3.16 в группе, об­ разованной элементом а порядка n, порядок элемента а х ра­ вен n /( n , х ) и, следовательно, совпадает с порядком а тогда и только тогда, когда n и x взаимно просты . Например, зная, что вы чет а = 2 является примитивным в поле Z i 3 , получаем, что 1)Строго говоря, надо было написать [ж]3 = [ж] + [2], так как это равен­ ство вычетов, но мы, начиная с этого момента, опускаем лишние скобки, чтобы они не загромождали запись. Равенство ж4 ( 120) следует из того, ж3 + 2ж2 что ж ж4 = ж ж•ж3 = ж(ж+ 2) ж2 + 2ж, откуда ж5 = ж(ж2 + 2ж) 2ж22 + ж+ 2 = (212), и т.д.
256 Глава 8. Конечные поля вычеты 25 = 6, 27 = 11 и 2 11 = 7 такж е являю тся примитивны­ ми, и други х примитивных элементов в Z 13 нет. П р и м е р 8 .2 . В поле F 128 любой элемент а = 0,1 является примитивным, так как порядок его мультипликативной группы |F*281 = 127 — п ростое число (см. пример 3.21). □ Указать конкретный примитивный элемент в конечном по­ ле F q часто помогает проверка неравенств леммы 8.1 в груп­ пе G = F *. Так, для доказательства примитивности элемента x G Z 3 [ x ]/(x 3 + 2x + 1) из примера 8.1 достаточн о было прове­ рить, что x 2 = 1 и x 13 = 1. Д ля этого, вообщ е говоря, не нуж но строи ть всю таблицу логарифмов. П рим ер 8 .3 . Найдем какой-либо примитивный элемент в Z 113. Ч исло 113 является просты м (оно не делится ни на од­ но из п росты х чисел 2, 3, 5, 7, меньших \ /П 3 ), п оэтом у Z 113 — конечное поле и по этой причине содерж ит примитивные эле­ менты. Разлож им на просты е множители порядок его мульти­ пликативной группы 113 — 1 = 112 = 24 ■7 и проверим выпол­ нение условия (8.1). Претендентов на примитивность а G Z ^ будем перебирать в порядке возрастания1). О тметим, что при наших вычислениях мож но легко обойтись без калькулятора и компьютера. Д ействительно, возьмем вычет в = 2 и возведем его в степень 112/2 = 56: 2 2^ 7 = 1288 = 158 = (152)4 = 2254 = ( —1)4 = 1 (m od 113). Следовательно, вычет в = 2 не примитивен. П опутно мы нашли, 1)Один из результатов аналитической теории чисел, выходящий за рам­ ки данного курса, гласит, что если справедлива расширенная гипотеза Римана, то наименьший примитивный корень из Zp при всяком простом p не превосходит величины a log p, где а и b — некоторые константы, не зависящие от p. Значит, в предположении, что гипотеза верна, перебор малых вычетов из Zp должен дать положительный результат. Расширен­ ная гипотеза Римана утверждает, что все комплексные нули z0 функции Lx (z) = ^ 2 5^L1 x (n )/n z, называемой рядом Дирихле, которые находятся в полосе 0 < Re zo < 1 комплексной плоскости C, должны лежать на пря­ мой Re z0 = 1 .Гипотеза в настоящий момент не доказана, но нули функций Lx (z) численно проверены для астрономически больших значений Im z0.
8.1. Мультипликативная группа поля 257 что его порядок равен 28, так как 24 = 1 (m od 113) и 2 14 = 1 (m od 113). Перейдем к следую щ ем у вы чету а = 3. Д ействуя аналогич­ ным образом, видим, что 3 23-7 = (3 7)23 = (2 43 ■3 2)8 = (17 ■9 )8 = 1538= 408 = = (402)4 = 16004 = 184 = 3242 = 982 = = 225 = —1 = 1 ( —15)2 = 152= (m od 113). При этом честно поделить с остатком нам пришлось всего один раз на шаге, отмеченном значком = (а мож но было заметить, что 1600 = 1130 + 470 = 470 = 18 (m od 113)). Все остальные приведения по модулю 113, которы е мы выполняли на каж дом шаге, свелись к одному-двум вычитаниям числа 113 из текущ е­ го результата. Указанный сп особ !) значительно проще честно­ го возведения в степень с последующ им взятием остатка, так как 3 56 = 523 347633 027 360 537213 511 521. Наконец, 3 24 = (3 4)4 = 8 14 = ( —32)4 = (2 ■16)4 = (4 ■256)2 = = (4 ■30)2 = 72 = 49 = 1 (m od 113). Таким образом, мы доказали, что вы чет 3 примитивен. □ П р и м е р 8 .4 . В силу взаимной п ростоты чисел 7 и 26 = |F271 элемент а 7, так ж е как и элемент а , будет примитивным в по­ ле F 27 из примера 8.1. Найдем дискретный логарифм элемента а 10 = а 2 + а по основанию а 7. Э то нетрудно сделать, зная, что loga а 10 = 10. Д ействительно, равенство ( а 7) 2, = а 10 равносиль­ но сравнению 7i = 10 (m od 26). Его наименьшим полож итель­ ным решением будет i = 10 ■7 — 1 = 10 ■15 = 20 (m od 26), поэтом у log a 7 а 10 = 20 . □ О бобщ ая это простое наблюдение на произвольное конечное поле F q и его примитивные элементы а , Y, получим равенство log 7 в = 1 ^ , Y 1oga Y ^Модификация бинарного возведения в степень, см. [16]. (8.5)
Глава 8. Конечные поля 258 где в — произвольный элемент из F*, а под делением понима­ ется умножение на обратный вычет по модулю q - 1. Равен­ ство (8.5) является дискретны м аналогом известной ф орм улы перехода под знаком логариф ма к другом у основанию над по­ лем R. Оно показывает, что, зная логарифм по одному прими­ тивному основанию, его нетрудно найти и по всем остальным. Вычислению дискретны х логариф мов посвящен раздел 9.3. 8.2. Разложение х рП — х на множители При изучении конечных полей особу ю роль играет двучлен х рП — х. Ниже в теореме 8.2 найдено разложение этого двучлена на неприводимые над Z p множители. Далее это разложение поз­ волит легко установить стр у к ту р у и основные свойства лю бого конечного поля. Л е м м а 8 .2 . П уст ь p — простое, g (x ) — произвольный м но­ гочлен над полем Z p . Тогда (g (x ))p = g (x p). Д о к а з а т е л ь с т в о . Так как p простое, то в правой части равенства все коэф ф ициенты (^) при k = 0 ,p делятся на p. П оэтом у (а + b)p = аР + b? ( 8 .6 ) для лю бы х а и b из Z p. Используя равенство ( 8 .6 ) в качестве основания индукции, индукцией по числу слагаемых нетрудно показать, что (а 1 + ■■■+ ага)? — а1 + ■■■+ аП (8.7)
8.2. Разложение x p - x на множители 259 для л ю бого n и лю бы х a i , . . . , an £ Z p. Так как ap = а для каж дого а из Z p, то для л ю бого многочлена g (x ) ( g (x ))p = (gnxn +-------- + g ix + go)p = = (gnxp)n + ■■■+ (g ix )p + (go)p = = gn (xp)n +-+ g ix p + go = g (x p). Л емма доказана. С л е д с т в и е 8 .1 . Д л я всех целых неот рицат ельных n, про­ ст ы х p и любого многочлена g (x ) £ Z p [x] выполнено равенство ( g ( x ) ) pn = g(xpn). Формальной производной многочлена f (x) = а ^ ”- + ■■■+ + a lX + ao называется многочлен f '( x ) = nanx n - 1 + ■■■+ a l . За­ метим, что преобразование многочлена в его ф орм альную про­ изводную является линейным преобразованием. И спользуя это свойство, нетрудно показать, что для формальной производной произведения двух многочленов справедлива ф орм ула Лейбни­ ца ( ) ( f ( x ) h (x ) ) ' = f '(x )h (x ) + f (x )h '(x ). ( 8 .8 ) Д ействительно, для одночленов f (x) = axn и h (x ) = 6xm ра­ венство ( 8 .8 ) очевидно, п оэтом у по линейности оно верно и для случая f (x ) = anx n + . . . + а ^ + a 0 и h (x ) = 6xm, откуда следует его справедливость для многочленов f (x) и h (x ) общ его вида. По индукции из ( 8 .8 ) получаем следующ ий сп особ вычисле­ ния производной произведения m многочленов: m (fi - . . . ' f m ) ' = Е fi - П f j , i= i j= i откуда следует равенство ( f m) ' = m f m -i ■f '. Т е о р е м а 8 .2 . Д ля всех прост ых p и целых неот рицат ель­ ны х n x pn - x = П h (x ), (8.9) где произведение берет ся по всем нормированным неприводи­ м ым над Z p многочленам из Z p [x], ст епени которых делят n.
260 Глава 8. Конечные поля Д о к а з а т е л ь с т в о . П усть h (x ) — неприводимый многочлен степени m. Так как Z p [x ]/h (x ) является полем, к оторое состои т из pm элементов, то в мультипликативной группе этого поля порядок л ю бого элемента, в том числе и одночлена x, является делителем числа pm — 1 , и, следовательно, x pm = x (m od h (x )). ( 8 . 10 ) П редставим n в виде n = km + r, где 0 ^ r < m. Тогда, учиты вая равенство ( 8 . 10 ), имеем x pn = x pkm+r = ( x pkmj pr = x pr (m od h (x )). ( 8 . 11 ) Если n делится на m, т. е. r = 0, то в силу предыдущ его равен­ ства x pn — x = 0 (m od h (x )), и, следовательно, двучлен x pn — x делится на многочлен h (x ). Теперь предполож им, что двучлен x pn — x делится на h (x ) и n не делится на m, т. е. r > 0. В этом случае x pn — x = 0 (m od h (x )), и из ( 8 . 11 ) следует равенство xpr = x (m od h (x )). Далее заметим, что в силу леммы 8.2 для лю бого элемента g поля Z p [x ]/h (x ) из предыдущ его равенства следует, что (g (x ))pr = g (x pr) = g (x ) (m od h (x )). Таким образом, порядок л ю бого элемента поля Z p [x ]/h (x ) не превосходит pr — 1. Так как r < m, то в этом поле нет порож да­ ю щ его элемента, что противоречит теореме 8 . 1 . П оэтом у двучлен x pn —x является произведением всех непри­ водимых многочленов, степени к оторы х делят n. П усть h (x ) — один из таких многочленов. Покажем, что x pn — x не делится на
8.2. Разложение х р —х на множители 261 (h (x ))2 . Для этого рассм отрим ф орм альную производную произ­ ведения квадрата h (x ) и произвольного многочлена g (x ). Л егко видеть, что (h ( x ) 2g ( x ) ) ; = 2 h (x )h /(x )g (x ) + h (x ) 2g '(x ) = = h (x ) ( 2 h /(x )g (x ) + h (x )g '(x )). П оэтом у производная произведения ( h ( x )) 2g (x ) либо делится на h (x ), либо равна нулю (если 2 h /(x )g (x ) + h (x )g '(х) = 0). Д иф ф еpn ренцируя х? —х, легко находим, что производная этого двучле­ на равна минус единице. Таким образом, в разложении х?" — х на неприводимые многочлены нет кратны х множителей. Следо­ вательно, х ?" — х = ^ ^ х ), где произведение берется по всем неприводимым многочленам, степени к оторы х делят n. Теорема доказана. П р и м е р 8 .5 . В Z 2 [х] при n = 3 равенство (8.9) принимает вид х 23 — х = х (х + 1) ( х 3 + х 2 + 1) ( х 3 + х + 1). □ Из теоремы 8.2 легко извлекается доказанное на с. 116 с ис­ пользованием метода производящ их функций рекуррентное ра­ венство для числа N (p, m ) неприводимых над Z ? многочленов степени m: Pn = m N (p , m ). m |n П р и м е р 8 . 6 . Ч тобы проиллю стрировать это утверж дение, найдем число неприводимых многочленов степени 15 над Z 2 с пом ощ ью теоремы 8.2, независимо от результатов раздела 4.6. Обозначим через —г(х) произведение всех различных неприво­ дим ы х над Z 2 многочленов, степень которы х равна i. Тогда, со ­ гласно (8.9), х о15 — х = —1 (х )—3 (х )—5 (х )—15 (х ), причем —! ( х ) —3 (х ) = х 23 — х и —! (х ) —5 (х ) = х 25 — х. О тсю да 215 х2 х 215 х2 х —■5(х) = (— —Щ —! —5) ■—■ = (х23 — х)(х25 — х ) ■(х2 — х ) .
262 Глава 8. Конечные поля Следовательно, степень многочлена F i 5(x ) равна 2 i5 — 2 3 — 2 5 + + 2 = 32730. Зная эту степень, м ож но найти число сомнож ителей в F i 5 , не выписывая сам многочлен F 15 явно. Очевидно, что оно равно 32730/15 = 2182. Таким образом, N (2 ,1 5 ) = 2182 при p = 2 . □ Теорема 8.2 исключительно важна для теории конечных по­ лей и многочленов над конечными полями. Приведем еще один пример ее применения. П р и м е р 8 .7 . И спользуем двучлены x pm — х для проверки неприводимости. П усть f = f (х ) G Z p [x] — многочлен, к ото­ рый мы хотим проверить на неприводимость, и пусть n = deg f . Очевидно, что f приводим в том и только в том случае, когда он имеет неприводимый делитель g = g (x ) степени r ^ |_n/2j . С другой стороны , как мы убедились выше, каж дый неприво­ димый над Z p многочлен степени r является делителем двучле­ на х рГ — х. О тсю да получаем простой тест (не)приводимости: многочлен f приводим, если он не взаимно п рост с одним из двучленов х рГ — х при 1 ^ r ^ _ n /2 j. В противном случае f неприводим. На рис. 8.1 представлена возмож ная реализация этого алго­ ритма на псевдокоде. Она использует подпрограм му gcd вычис­ ления Н О Д двух многочленов, подпрограмму deg, определяю ­ щ ую степень многочлена, и две вспомогательные переменные — целочисленную r и переменную D типа «многочлен». 1. D = х ; 2. f o r ( r = 1 ; r ^ _ n / 2 j ; r++ ) { 3. D = D p (m od f ) ; 4. i f ( deg g c d ( D — x , f ) > 0 ) p r i n t « f п ри вод и м »;} 5. p r i n t « f неприводим» Р и с. 8.1 В обоснование ее корректности отметим, что (g, h) равен (g m od h, h) для всех g, h G Z p [x], п оэтом у для сокращ ения вы­ числений переменная D на очередном шаге цикла 2—4 вместо
8.2. Разложение xp —x на множители 263 сам ого одночлена x pr содерж ит его остаток о т деления на f . П оэтом у на каж дом шаге цикла происходит проверка взаимной п ростоты многочлена f с многочленом x pr — x, то есть со всеми неприводимыми многочленами степени r (и, возмож но, некото­ ры х меньших степеней, а именно остальны х делителей числа r). Оценим сл ож ность предложенного алгоритма. Самым тр у ­ доемким является вычисление Н О Д в строке 4. «Ш кольная» реализация алгоритма Евклида требует для нахождения Н ОД двух многочленов степени не выше n около n 2 операций в поле их коэф ф ициентов. При использовании эф ф ективны х алгорит­ мов деления многочленов и «бы стр ой » реализации алгоритма Е вклида1) их число сниж ается д о O (n log2 n ). Ш аги 3 и 4 будут повторены не более |_n/2j раз. Таким образом, общ ая слож ность алгоритма даж е при «наивной» реализации составляет не более O (n 3) операций в Z p и м ож ет бы ть снижена до O (n 2 log2 n ). Для больш их n это сущ ественно лучше, чем последовательное деле­ ние f (x) на все неприводимые многочлены степеней д о |_n/2 j включительно: уж е только размер таблицы неприводимых мно­ гочленов растет не медленнее, чем cn для некоторой констан­ ты с > 1 (см. пример 4.17), а значит табличный сп особ экспонен­ циален. Тем не менее он удобен тем, что однаж ды построенную таблицу мож но использовать многократно. В заключение заметим, что данный алгоритм легко мож ет бы ть улучшен: вычислять Н О Д в строке 4 м ож но не при всех r, а только начиная с r = |_n/4j + 1. Например, для многочлена f степени 20 достаточн о проверить его взаимную п ростоту только с двучленами x pr — x для r = 6 , 7, 8 , 9,10, так как, например, двучлен x p — x делит x p — x. □ З а м е ч а н и е 8 .1 . К оличество неприводимых над Z p много­ членов степени n асимптотически равно pn/n , как бы ло показа­ но в разделе 4.7. О тсю да следует, что доля неприводимых сре­ ди всех нормированных многочленов степени n примерно рав­ на 1 /n . Э то наблюдение дает простой вероятностный алгоритм построения неприводимого многочлена заданной степени n: вы­ брать его наугад из pn нормированных многочленов степени n 1}См. [5, 9, 29, 30].
264 Глава 8. Конечные поля и проверить на неприводимость, используя, скажем, м етод при­ мера 8.7. Если выбранный многочлен окаж ется приводимым, то проверить другой случайный многочлен и т.д. Среднее число итераций при этом равно n, и п оэтом у данный вероятностный метод полиномиален, но в худшем случае оно м ож ет оказаться и больш им. Д етерминированные полиномиальные алгоритмы для этой задачи появились только в 80-х годах X X века. На данный момент лучшим из них является метод Ш оупа. Самый бы стры й вероятностный алгоритм принадлежит ему ж е 1). Теперь сформулируем два просты х, но важ ны х свойства ф ормальной производной многочлена над конечным полем, на которы е будем опираться в дальнейшем в разделах 8.5 и 9.1. Л е м м а 8 .3 . П уст ь f (х ) £ Z?[x]. Тогда f ' (х ) = 0 в том и только в том случае, когда найдется такой многочлен g (x ) £ £ Z ?[x], что f (х ) = g (x ? ). Д о к а з а т е л ь с т в о . П редположим, что f (х ) = g (x ? ) = (g (x ))? (лемма 8 .2 ), тогда многочлен имеет вид f (х) = ^ n =0 а*х?г, где n = deg g, а^ £ Z ?. О тсю да имеем n n f ' (x ) = E а» •p* •x ?i - 1 = E а* •0 •x ?i - 1 = 0 , i=1 i=1 так как в кольце Z?[x] сумма лю бы х p одинаковых слагаемых равна нулю. С другой стороны , если f (х ) = ^ П= 0 Ь*х* и f ' (х) = 0, то все коэф фициенты многочлена f ' (х ) нулевые. Согласно опреде­ лению производной, коэф ф ициент при х*- 1 в f ' (х) равен i •b*. Н етрудно убедиться, что i •b = 0 при i ^ 0 и b £ Z ? тогда и только тогда, когда i = 0 m od p или b = 0. П оэтом у b* = 0 при всех i = 0 , . . . , n, не кратных p. Следовательно, f (х ) = g (x ? ) для н екоторого g (x ) £ Z?[x]. Лемма доказана. Л е м м а 8 .4 . П уст ь f (х ) £ Z?[x]. Тогда в разлож ении м ного­ члена f (х) в произведение неприводим ых над Z ? делителей от­ сут ст вую т кратные м нож ит ели тогда и только тогда, когда он взаимно прост со своей производной. х)Эти алгоритмы см. в [31] и [32].
8.3. Структура конечного поля 265 Д о к а з а т е л ь с т в о . В одну сторон у утверж дение бы ло уж е получено при доказательстве теоремы 8 .2 : если ( / , / ' ) = 1 , то в разложении / от су т ств у ю т кратные множители. П редположим теперь, что ( / , / ' ) = 1. В этом случае сущ е­ ствует неприводимый многочлен h, делящий одновременно и / , и / ' . П оэтом у / = ah, / ' = bh, где a, b е Z p [x]. Д ифференцируя / = ah, получаем / ' = (a h )' = a'h + ah' = bh, откуда следует, что h делит произведение ah'. При этом не м о­ ж ет случиться так, что ah' = 0, иначе h' = 0 и по лемме 8.3 мно­ гочлен h является степенью некоторого д ругого многочлена, что противоречит его неприводимости. К ром е того, deg h' < deg h и п оэтом у h f h'. Но h | ah', следовательно, h | a, откуда a = ah и / = ah = ah2, т. е. в разложении / п ри сутствую т кратные множители. Л емма доказана. 8.3. Структура конечного поля 1. Х а р а к т е р и с т и к а п о л я . С ум м у k одинаковых элементов x поля F будем обозначать через k ■x. Характеристикой поля F называется минимальное натуральное число m, для к оторого m ■ 1 = 0 , а если такого числа нет, то говорят, что характери­ стика поля равна нулю. Х арактеристика л ю бого конечного поля является просты м числом. Д ействительно, если это не так и су ­ щ ествует конечное поле F характеристики m = ks, то в силу дистрибутивности (k ■1)(s ■1) = ( 1 + •••+ k единиц = (1 + 1) ( 1 + •••+ 1) = s единиц .......... + 1) = (ks) ■1 = k X s единиц 0, откуда следует, что в F есть делители нуля, что, как бы ло пока­ зано выше (с. 91), невозмож но. П одмнож ество F' элементов поля F называется подполем по­ ля F, если F ' зам кнуто и является полем относительно операций
266 Глава 8. Конечные поля поля F. Если F; — подполе поля F, то F называется расширени­ ем поля F ;. Поле называется простым, если оно не имеет соб­ ственного подполя. Очевидно, что при лю бом п ростом p поле Z p будет просты м, и порядок л ю бого п ростого поля будет про­ сты м числом. Такж е нетрудно видеть, что в лю бом конечном поле сущ ествует простое подполе, порож денное его единичным элементом, и других п росты х подполей в нем нет. П р и м е р 8 . 8 . В рассмотренном выше поле Z 3 [ x ]/( x 3 + 2x + 1) из примера 8.1 его единица порож дает поле Z 3 , которое и будет просты м подполем исходного поля. □ Д ва поля F и F; называются изоморфными, если сущ ествует такое взаимно однозначное отображ ение p поля F в поле F; , что p(ab ) = p (a )p (b ) и p (a + b) = p (a ) + p (b) для лю бы х элементов а и b поля F. Л е м м а 8 .5 . П уст ь p — простое. Любое конечное поле F из p элемент ов изоморфно полю Z p . Д о к а з а т е л ь с т в о . П усть 1 — единица поля F. Л ю бой эле­ мент поля F мож но представить в виде k1 — суммы k единиц этого поля. Очевидно, что n1 = [n]p1 при лю бом n из N. Тогда для отображ ения p из F в Z p, заданного равенством p (n 1 ) = n, и для лю бы х k и m из { 0 , 1 , . . . , p — 1 } справедливо равенство p ( k 1 + m 1 ) = p ((k + m ) 1 ) = p ([k + m]p 1 ) = = [k + m]p = [k]p + [m]p = p ( k 1 ) + p ( m 1 ). Аналогичное равенство имеет место для умножения: p ( k 1 ■m 1 ) = p ((k ■m ) 1 ) = p ([k ■m]p 1 ) = = [k ■m]p = [k]p ■ [m]p = p ( k 1 ) ■p ( m 1 ). Следовательно, p — изоморф изм. Лемма доказана. 2. К о р н и н е п р и в о д и м ы х м н о г о ч л е н о в . Далее будем вычис­ лять значения многочленов из Z p [x] на элементах полей характе­ ристики p, рассматривая одночлены a x k, где a G Z p, как сум м у а одночленов x k. В свете леммы 8.5 будем такж е отож дествлять просты е подполя полей характеристики p с полем Z p.
8.3. Структура конечного поля 267 Т е о р е м а 8 .3 . Любое конечное поле F характеристики p со­ ст оит из pn элементов, где n — целое неотрицательное, и xpn - x = П (x - а ). aGF ( 8 . 12 ) Д о к а з а т е л ь с т в о . В поле F характеристики p сущ ествует п ростое подполе F ' из p элементов, порож денное единичным элементом. Л егко проверить, что поле F будет линейным ко­ нечномерным пространством над своим просты м подполем F', и п оэтом у число элементов в поле F будет натуральной степенью числа элементов в его п ростом подполе F'. Теперь равенство (8.12) легко следует из единственности раз­ ложения многочлена над полем на множители, леммы 4.5 и того, что каж дый ненулевой элемент поля F в степени, равной по­ рядку мультипликативной группы, равен единице, т. е. является корнем двучлена x p" - i - 1. Теорема доказана. П р и м е р 8 .9 . Поле F из примера 8.1 является трехмерным линейным пространством над полем Z 3 . Его элементы 1 = = (0 0 1 ),x = ( 0 1 0 ) и x 2 = ( 100 ) обр азую т базис. К аж ды й эле­ мент из F является просты м корнем двучлена x 27 - x, а каждый элемент из F* — корнем x 26 - 1. □ Т е о р е м а 8 .4 . В любом поле F из pn элементов каж дый эле­ м ент поля являет ся простым корнем неприводимого над Z p многочлена, ст епень которого делит n. Д о к а з а т е л ь с т в о . К аж ды й элемент поля F является корнем двучлена x p" - x, который в силу теоремы 8.2 разлагается в про­ изведение всех нормированных неприводимых над Z p многочле­ нов, степени которы х делят n. Так как x p" - x не имеет кратных множителей, то каж дый элемент поля F будет п росты м корнем одного из этих неприводимых над Zp многочленов. Теорема д о ­ казана. П р и м е р 8 .1 0 . Рассмотрим произвольное поле F из 27 элемен­ тов. По крайней мере одно такое поле характеристики 3 сущ е­ ствует, оно бы ло рассм отрено в примере 8.1. В F найдутся изо­ м орф ное Z 3 простое подполе F ' и элемент а — корень неприво­ дим ого над Z 3 многочлена x 3 + 2x + 1. Поле F будет трехмерным
Глава 8. Конечные поля 268 линейным пространством над подполем F ; , элементы которого м ож но обозначить 0,1, 2. Здесь 0 и 1 являю тся нейтральными по слож ению и умнож ению элементами в F ; , а значит, и в F; элемент 2 = 1 + 1 является третьим в п ростом подполе. Так как а 3 = а + 2 , то, повторяя вычисления примера 8 . 1 , находим все степени а (ниже выписаны наборы коэф ф ициентов (a, b, с) ли­ нейных комбинаций а а 2 + Ьа + с над полем F ; , представляющ их элементы а к £ F*): а° = а1 = а2 = а3 = (001), а 7 = (122), (010), а 8 = (202), (100), (012), а 4 = (120), а 5 = (212), а 6 = (111), а 9 = (011), а 1() = а 11 = а 12 = а 13 = (110), (112), (102), (002), а 14 а 15 а 16 а 17 а 18 а 19 = (020), = (200), = (021), = (210), = (121), а 21 а 22 а 23 а 24 а 25 = (101), = (022), = (220), = (221), = (201). = (222), а 21) = (211), (8.13) Из этой таблицы нетрудно видеть, что элементы а 2, а и 1 о бр азую т базис пространства F над F; , и каж дый элемент по­ ля F мож но однозначно представить набором координат в этом базисе. Сравнивая таблицы (8.13) и (8.1), несложно показать, что F — произвольное поле из 27 элементов, — изоморф но полю Z 3 [ x ] /( x 3 + 2x + 1). Э то не случайный факт, а частный случай общей ситуации, рассматриваемой ниже в теореме 8 .8 . □ Т е о р е м а 8 .5 . П уст ь поле F сост оит из pn элементов, а его элемент а — корень неприводимого над Z p многочлена ст епени n. Тогда любой элемент поля F единст венным образом пред­ ст авляет ся линейной комбинацией элементов 1 , а , . . . , а п_ 1 с коэффициентами из его простого подполя. Д о к а з а т е л ь с т в о . П реж де всего заметим, что сущ ествует ровно pn различных линейных комбинаций из элементов 1 , а , . . . , а п_ 1 с коэффициентами из п ростого подполя, и каж дая линей­ ная комбинация является элементом поля F. Более того, среди этих линейных комбинаций нет двух, равных одному и том у же
8.3. Структура конечного поля 269 элементу поля F, так как в противном случае разность двух равных линейных комбинаций будет ненулевой линейной ком­ бинацией, равной нулевому элементу поля. Н етрудно показать, что сущ ествование такой линейной комбинации равносильно т о ­ му, что а будет корнем многочлена степени не больш е n — 1 , что, очевидно, противоречит тому, что а является корнем неприво­ дим ого многочлена степени n. Теорема доказана. Теорема 8.5 показывает, что поле F из pn элементов с про­ сты м подполем Fp мож но представить как множ ество многочле­ нов F p ^ ], где а — корень неприводимого над Z p многочлена h (x) степени n, со сложением и умножением по модулю многочлена Л,(а). П р и м е р 8 .1 1 . П остроим поле Z 2 [а] из 16 элементов, добавив к полю Z 2 корень а неприводимого над Z 2 многочлена х 4 + х + 1 и все те элементы, которы е мож но получить из 0 , 1 и а при по­ мощи операций сложения и умножения. Л егко видеть, что Z 2 ^ ] состои т из различных многочленов f от а с коэффициентами из Z 2. А так как а 4 = а + 1 , то каждая степень а больш ая трех бу­ дет линейной комбинацией первых четы рех степеней. Таким об­ разом, Z 2 ^ ] содерж ит ровно 16 элементов и является линейным п ространством над Z 2, порож денны м элементами а 3, а 2, а, 1. Е с­ ли произведение f (а ) ■g ^ ) разделить с остатком на а 4 + а + 1 , то f (а ) ■g ^ ) = ( а 4 + а + 1 ) ■q ^ ) + ^ а ) = ^ а ) для лю бы х f (а ) и g ^ ) . П оэтом у умножение в Z 2 ^ ] определим как умножение многочленов по модулю многочлена а 4 + а + 1 . Про поле Z 2 ^ ] будем говорить, что оно получено расшире­ нием поля Z 2 элементом а. Покажем, что Z 2 ^ ] действитель­ но будет полем. Д ля этого проверим единственное нетривиаль­ ное в данном случае свойство поля — установим сущ ествова­ ние обратного по умнож ению для каж дого ненулевого элемен­ та f (а ). Так как а 4 + а + 1 и f (а ) взаимно простые, то в си­ лу теоремы 4.10 найдутся такие многочлены s ^ ) и ^ а ) , что 1 = s ^ ) ^ 4 + а + 1) + t ^ ) f (а ), причем степени s ^ ) и ^ а ) не превосходят трех (если это не так, то вместо многочленов s ^ ) и
Глава 8. Конечные поля 270 ^ а ) мож но взять их остатки от деления на а 4 + а + 1). П оэтом у t ^ ) f (а ) = 1 + з ( а ) ( а 4 + а + 1) = 1 + з (а ) ■0 = 1 , и ^ а ) будет обратны м элементом по умнож ению для f (а ). Та­ ким образом, Z 2 ^ ] — поле из 16 элементов. Так как а 3 = 1 и а 5 = а 2 + а = 1, то а будет порож да­ ющим элементом мультипликативной группы поля. П редстав­ ляя элементы поля Z 2 [а] наборами их коэф ф ициентов в базисе ( а 3, а 2, а , 1) , видим, что степени а в этом поле выглядят следу­ ющим образом: а 0 = (0 0 0 1 ) а 5 = (0 1 1 0 ) а 10 = ( 0111 ), а 1 = (0 0 1 0 ) а 6 = ( 1100 ) а 11 = ( 1110 ), ( 1011 ) а 12 = ( 1111 ), а (0 1 0 0 ) а а ( 1000 ) а (0 1 0 1 ) а а (0 0 1 1 ) а ( 1010 ) а 13 ( 1101 ), 14 ( 1001 ). (8.14) □ Т е о р е м а 8 . 6 . В любом поле F из pn элементов для любого m, являю щ егося делителем n , сущ ест вует единст венное подполе из pm элементов. Д р у ги х подполей в поле F нет. Д о к а з а т е л ь с т в о . Если F ' — подполе поля F, то F будет ли­ нейным пространством над своим подполем F ;. В этом случае найдется натуральное k такое, что pn = |F/ |k. Очевидно, что по­ следнее равенство возм ож но только в том случае, когда n = km. Теперь покажем, что если m делит n, то в F сущ ествует под­ поле из pm элементов. Рассмотрим м нож ество N элементов поля F, являющихся корнями всех неприводимых многочленов, сте­ пени которы х равны m или делят m. Из теоремы 8.4 следует, что каж дый из этих элементов является корнем двучлена x p — x. Покажем, что сумма и произведение лю бы х двух элементов из N такж е принадлежат этом у множеству. Если apm — a = 0 и bpm — b = 0 , то в силу равенства ( 8 .6 ), справедливого, очевидно,
8.3. Структура конечного поля 271 в лю бом поле характеристики p, (а + 6)pm - (а + 6) = (арт + 6Рт ) - (а + 6) = = (арт - а) + (6Рт - 6) = 0 , т. е. сумма а + 6 принадлежит N . Аналогичная цепочка равенств имеет место и для произведения а 6: ✓ -.х n~m (а 6)Р , ,v.m , - а 6 = аР 6Р - а 6 = а 6 - а 6 = 0 . Таким образом множ ество N зам кнуто относительно сложения и умножения. Такж е нетрудно видеть, что если а является корнем двучлена x pm - x, то и его обратны е элементы по слож ению и умнож ению будут корнями этого двучлена. Следовательно, N является полем. Наконец заметим, что мультипликативная группа подполя будет подгруппой мультипликативной группы поля. П оэтом у единственность подполя из pm элементов в поле из pn элементов легко следует из теоремы 3.13. Теорема доказана. П р и м е р 8 .1 2 . В поле Z 2 [a] из предыдущ его примера есть два нетривиальных подполя — простое подполе Z 2 и подполе из че­ ты рех элементов, состоящ ее из нуля, единицы и элементов а 5 и a io . Из таблицы 8.14 степеней а видно, что ненулевые элементы втор ого подполя связаны равенством а ^ + а 5 = 1 . □ 3. И з о м о р ф н ы е п о л я . П усть а — произвольный элемент поля из pn элементов. Элементы а Р, а Р , . . . , а Р , где а Р = а , на­ зы ваю тся сопряж енным и с а . Так как в поле из pn элементов а Р" = а , то а имеет не более n - 1 сопряж енны х элементов. Т е о р е м а 8 .7 . Если а — корень неприводимого над Z p м ного­ члена h (x ) ст епени k , то корнями эт ого многочлена являют ­ ся все элементы, сопряж енны е с а , и других корней многочлен h (x ) не имеет. Д о к а з а т е л ь с т в о . Так как ( h ( x )^ = h ^ ), то очевидно, что лю бой элемент, сопряженный с а , будет корнем многочлена h (x ). П оэтом у для доказательства теоремы достаточн о показать, что все элементы а , а Р, а Р , . . . , а Р различны. Д опустим , что это
272 Глава 8. Конечные поля не так и a pm = a при m < k. Тогда a будет корнем многочлена x pm — x и, в силу теоремы 8 .2 , будет такж е корнем неприводи­ мого многочлена g (x ) степени t, где t является делителем m. Разделив неприводимый многочлен h (x ) на g (x ), получим, что h (x ) = g ( x ) / ( x ) + r (x ), где r (x ) = 0 и deg r (x ) < t ^ m < k. Так как h (a ) = 0 и g (a ) = 0, то очевидно, что и r ( a ) = 0. Вместе с a корнями многочлена r(x ) долж н ы бы ть и все элементы, со ­ пряженные с a , т. е. число корней многочлена r (x ) не меньше m, что, очевидно, невозмож но, так как его степень стр ого меньше m. Таким образом, сделанное предположение лож но и m = k. Теорема доказана. П усть F — поле из pn элементов, a — элемент этого поля. Нормированный многочлен / (x) из Z p [x] называется м иним аль­ ным многочленом элемента a , если / (a ) = 0 и степень мно­ гочлена / минимальна среди всех многочленов положительной степени из Z p [x], для которы х a является корнем. Из леммы 8.2 и доказательства теоремы 8.5 легко следует, что для лю бого a сущ ествует единственный минимальный многочлен, этот много­ член является неприводимым над Z p [x], и его корнями в F явля­ ю тся вместе с a все элементы, сопряженные с a. Минимальный многочлен элемента a обозначается m a (x ). П рим ер 8 .1 3 . Найдем минимальный многочлен элемента (212) поля F из примера 8.10. Так как элемент (212) являет­ ся пятой степенью примитивного элемента a , то с ( 212 ) = a 5 будут сопряж ены два элемента ( a 5)3 = a 15 и ( a 5)9 = a 45 = a 19. П оэтом у m ( 212)(x ) = (x — a 5)(x — a 15)(x — a 19). Раскры вая скобки и приводя подобные слагаемые при помощи таблицы (8.13), находим минимальный многочлен: m ( 212)(x ) = (x — a 5)(x — a 15)(x — a 19) = = x 3 — ( a 5 + a 15 + a 19) x 2 + ( a 20 + a 24 + a 8)x — a 13 = = x 3 — x 2 + x — 2 = x 3 + 2x 2 + x + 1 . □
8.3. Структура конечного поля 273 П р и м е р 8 .1 4 . Покажем, что мультипликативные порядки всех корней неприводимого многочлена совпадают. Д ействительно, согласно теореме 8.7, все корни неприводи­ мого многочлена f (х) £ Z?[x] сопряж ены. В частности, ес­ ли в , Y — корни f (х) в поле F?n, то найдется такое целое k, k что Y = в ? . В циклической группе (в ), образованной элеменk 7 том в , порядок элемента в ? равен |в|/(|в|,pk), где |в| — порядок k элемента в . Одновременно порядки элементов в и в ? долж ны бы ть делителями порядка pn — 1 мультипликативной группы F?n. Но лю бой делитель числа pn — 1 взаимно п рост с числом p k. П о­ этом у (|в|^к) = 1 и |в^| = |в|. □ Т е о р е м а 8 . 8 . Любые два конечных поля, сост оящ ие из од­ ного и того ж е числа элементов, изоморфны. Д о к а з а т е л ь с т в о . П усть p — простое, h (x ) — нормирован­ ный неприводимый над Z ? многочлен степени n из Z?[x]. Пока­ жем, что произвольное поле из pn элементов изом орф но полю Z ? [x ]/h (x ). В силу леммы 8.5 далее без ограничения общ ности будем полагать, что п ростое подполе поля F совпадает с полем Z?. В поле F выберем элемент а, являющийся корнем многочлена h (x ). Покажем, что отображ ение р : П—1 П—1 *=0 *=0 Е а*а* ^ Е а*х* поля F в поле Z ? [x ]/h (x ) будет искомым изоморф изм ом. Оче­ видно, что р взаимнооднозначно, линейно и в силу своей линей­ ности сохраняет операцию сложения. П оэтом у для доказатель­ ства теоремы достаточн о показать, что р сохраняет умножение. К аж ды й элемент а = ^ П —0 а*а* поля F будем рассматривать как многочлен а (а ) относительно а. В силу законов дистрибутивно­ сти умножение элементов а = ^ П —)1 а*а* и b = ^ П —0 ^ а* поля F производится так же, как и умножение многочленов. П оэтом у справедливо равенство ab = а ( а ) ^ а ) = c (a )h (a ) + г (а ),
274 Глава 8. Конечные поля где г (а ) — оста ток от деления многочлена а (а )Ь (а ) на многочлен ^ а ) . Так как ^ а ) = 0, то ab = г (а ). П оэтом у р (а (а ))р (Ь (а )) = а(х)Ь (х) = г (х ) = р ( г ( а ) ) , т. е. р действительно сохраняет умножение. Теорема доказана. Конечные поля, отличные о т полей Z ?, впервые появились в работе ф ранцузского математика Эвариста Галуа в 1830 г. в виде множ ества корней двучлена х ?" —х. Сейчас лю бое конечное поле называется полем Галуа, и для поля из pn элементов часто используется единое обозначение G —(pn). 4 . П р и м и т и в н ы е м н о г о ч л е н ы . М ногочлен ^ х ) из Z ? ^ ] назы­ вается примитивным многочленом, если он является минималь­ ным многочленом примитивного элемента поля из pn элементов. Из примера 8.14 следует примитивность всех корней примитив­ ного многочлена. П оэтом у в силу теорем 8.7 и 3.14 справедливо следую щ ее утверждение. Т е о р е м а 8 .9 . В кольце Z ? ^ ] , где p — простое, сущ ест вует ровно p (p n — 1 ) / n примит ивных многочленов ст епени п. П р и м е р 8 .1 5 . Так как р (1 5 ) = 8 , то в Z 2 ^] сущ ествует ровно два примитивных многочлена четвертой степени. В то ж е время из теоремы 4.13 следует сущ ествование в Z 2 ^] трех неприводи­ мы х многочленов четвертой степени. Таким образом, один из этих трех неприводимых многочленов не является примитив­ ным. Найдем такой многочлен. Д ля этого воспользуемся полем Z 2 ^ ] из примера 8 . 11 , где а — корень неприводимого многочле­ на х 4 + х + 1. Среди 15 ненулевых элементов поля Z 2 ^ ] неприми­ тивными будут следующ ие степени а : 0, 3, 5, 6 , 9 ,1 0 ,1 2 . Из этих степеней 5-я и 10-я будут корнями единственного неприводимо­ го многочлена второй степени х 2 + х + 1 , а нулевая степень — корнем х + 1. Следовательно, четыре оставш иеся степени 3, 6 , 9, 12 — корни иском ого многочлена / (х ) = х 4 + / 3 х 3 + / 2 х 2 + / ! х + / 0 . (8.15)
8.3. Структура конечного поля 275 Подставив в (8.15) вместо переменной x его корни а 3, а 6, а 9 и а 12 12, получим систем у из четырех линейных уравнений с четы рь­ мя неизвестными: ( а3) 4 + /з ( а3) 3 + f2 ( а3) 2+ f i ( а3) + f o = 0 , ( а6) 4 + f3 ( а6) 3 + f2 ( а6) 2+ f i ( а6) + f o = 0 , ( а9) 4 + f3 ( а9) 3 + f2 ( а9) 2+ f i ( а9) + f o = 0 , ( а 12) 4 + / 3( р 12)3 + / 2 ( р 12)2+ / 1( р 12) + /о = 0 . (8.16) Так как многочлен / (x) неприводим над Z 2 , то его свободный член равен единице. П оэтом у в (8.16) вместо /о подставим еди­ ницу, после чего из системы удалим последнее уравнение — для нахождения трех оставш ихся коэф ф ициентов достаточн о трех уравнений. В результате получим (учитывая, что 1 = —1 в поле Z 2) новую систему / 3а9 + / 2а6+ / 3а3 + / 2 а 12 + / 1 а 6 = 1 + а 9 = а7 , / 2а3+ = а 13. / 3 а 12 + / 1 а 3 = 1 + а 12 = а 11, / 1а 9 = 1 + а 6 Для решения последней системы воспользуемся формулами Крамера. Вычислив необходимые для этого определители 1а а12 2 а3 а3 асо а12 а 11 а а 6 | = det а9 а а3 а 12 а3 а7 а а6 а 1а 9 9а = det а3 асо 9 а det а6 = det а а6 а а а а 11 а а 12 а 12 а3 а а3 а 11 и подставив найденные значения в ( 6 . 10 ), видим, что все к оэф ­ фициенты иском ого многочлена равны единице. Таким образом, / (x ) = x 4 + x 3 + x 2 + x + 1 . □ 5. Н о р м а л ь н ы й б а з и с . Покажем, что в поле G F (p n) найдется такой элемент а , что все элементы а , а р, . . . , а рП , сопряж ен­ ные с ним, обр азую т базис поля G F (p n), рассматриваемого как линейное пространство Fn над его просты м подполем F. Такой базис называется нормальным базисом поля.
Глава 8. Конечные поля 276 Т е о р е м а 8 .1 0 . В поле G F (p n) сущ ест вует нормальный ба­ зис. Д о к а з а т е л ь с т в о . В пространстве Fn рассм отрим линейный оператор A : а ^ а ^ линейность которого является просты м следствием справедливых для лю бы х а , в из Fn и л ю бого а из F равенств А (а + в ) = А (а ) + А (в ), А (а а ) = а А (а ), которы е в св ою очередь легко следую т из леммы 8 .2 . Заметим, что А п (а ) = а ^ = а. П оэтом у (x n — 1 )(А )(а ) = 0 для каж дого а. Таким образом, двучлен x n — 1 является аннулятором каж дого элемента из Fn , а следовательно, и всего про­ странства Fn с действую щ им на нем оператором A . Если ока­ ж ется, что x n — 1 не только аннулятор, но еще и минимальный многочлен n -мерного пространства F” , то в силу теоремы 6.9 это пространство будет циклическим, т. е. в нем найдется базис а , А ( а ) , А 2 ( а ) , . . . , A n_ 1(а ), порож даемый некоторым вектором а . Так как (8.17) A k(а ) = а ^ , то базис (8.17) будет нормальным базисом поля G F (p n). Таким образом, для доказательства теоремы достаточн о уста­ новить, что двучлен x n — 1 будет минимальным многочленом пространства Fn . В св ою очередь x n — 1 будет минимальным многочленом, если для л ю бого многочлена a (x ) = ao + a 1x + + ■■■+ an_ 1x n_ 1 меньшей степени в поле G F (p n) найдется такой элемент а , что n—1 a ( x ) ( A ) ^ ) = a0a + а 1а p + ••• + an_ 1а p = 0. Д опустим, что это не так, и в поле G F (p ) (8.18) найдутся такие одновременно не равные нулю bo, . . . , bn _ 1, что n—1 boe + b1e p + ■■■+ bn_ 1e p = 0 для каж дого в £ G F (p n). (8.19)
8.4. Арифметика в конечных полях 277 П усть а 0 — порож дающ ий элемент мультипликативной группы поля G F (p n). Из предположения (8.19) следует, что равенство 0 = Ь0ак + Ь1(ак )p + ■■■+ bn- 1(а 0° ) p"— 1 = ( 8 .20 ) + b n - 1(а£" 1) 0 = Ь0а0 + Ь1(а 0 )к + справедливо при k = 0, 1, . . . , n — 1. Переписывая равенства ( 8 .20 ) в матричной ф орм е, видим, что они эквивалентны равен­ ству / 1 1 а0 op \ап 1 n—1 1 b0 n —1 К )n- v b1 = ybra—1У 0 0 ( 8 .21 ) 0 с матрицей Вандермонда. Так как а0 = а при 0 ^ i = j ^ ^ n — 1, то в силу леммы 5.5 матрица Вандермонда невы рож де­ на, и, следовательно, ( 8 .21 ) справедливо только если все bi = 0 . П олученное противоречие гарантирует, что в поле G F (p n) для л ю бого многочлена, степень которого меньше n, найдется эле­ мент а , удовлетворяющ ий неравенству (8.18). Следовательно, — 1 будет минимальным многочленом Fn . Теорема доказана. П р и м е р 8 .1 6 . П усть F — рассмотренное в примере 8.10 на с. 267 поле из 27 элементов с примитивным элементом а. Так как а 1 = ( 010 ), а 3 = ( 0 1 2 ), а 9 = ( 011 ), а 2 = ( 100 ), а6 = ( 111 ), а 18 = ( 121 ), то легко видеть, что элементы а , а 3, а 32 не обр азую т нормаль­ ный базис в F, в то время как элементы а 2, ( а 2) 3, ( а 2)3 такой базис образуют. □ 8.4. Арифметика в конечных полях В практических приложениях теории конечных полей прихо­ дится производить вычисления в конкретном поле, обы чно пред­ ставленном как поле вы четов по какому-либо модулю. Первые
278 Глава 8. Конечные поля примеры данного раздела посвящ ены развитию навыков подоб­ ных вычислений в простейш их случаях и м огут бы ть без ущ ерба пропущ ены подготовленным читателем. Еще несколько приме­ ров иллю стрирую т полученные в предыдущ их разделах общие свойства полей и многочленов над ними, которы е часто помога­ ю т такие вычисления значительно упростить. Разберем сначала вопросы о примитивных многочленах и примитивных элементах в полях-расш ирениях. П р и м е р 8 .1 7 . Неприводимый над Z 3 многочлен / (x ) = x (x + 1)(x + 2 ) + 1 = x 3 + 2 x + 1 из примера 4.18 является примитивным, и, как показывает при­ мер 8.1 и замечание 4.2, любой ненулевой элемент поля F 27 = = Z 3 [ x ] / / (x ) представляется степенью вычета a = x (порядок которого в группе F 27 равен 26) и a — корень многочлена / (x ). Полученная при этом таблица, сопоставляю щ ая каж дом у нену­ левому вы чету его логарифм по «основан и ю » a , называется таблицей дискрет ных логарифмов поля Z 3 [ x ] / / ( x ) . О тметим, что для доказательства примитивности элемента a = x и, как следствие, многочлена / (x ), не обязательно бы ло строи ть всю таблицу целиком: по лемме 8.1 достаточн о бы ло лишь проверить, что x 2 = 1 (m od / ) и что x 13 = 1 (m od / ) . П ервое из этих неравенств очевидно. В торое м ож но проверить, например, поделив x 13 на / (x ) в столбик: x 13 = 2 (m od / ) . □ Корень многочлена больш ой степени имеет, вообщ е говоря, больш ой порядок. В таком случае деление в столбик или состав­ ление таблицы логариф мов слиш ком громоздки и значительно проще произвести несколько приведений по модулю, как в при­ мере 8.3. П р и м е р 8 .1 8 . Покажем, что многочлен / (x) = x 9+ x 4 + 1 при­ митивен над Z 2 . Он неприводим (см. пример 4.15 на с. 114). Такж е это следует из его взаимной простоты с двучленами x 23 2 —x и x 2 —x (пример 8.7), в чем нетрудно убедиться непосредственно. Так как 2 9 — 1 = 511 = 7 ■ 73, где 7 и 73 — просты е числа, и очевидно x 7 = 1 (m od / ) , то достаточн о проверить, что x 73 = 1
8.4. Арифметика в конечных полях 279 (m od f ). Вычислим оста ток x 73: x 73 = (x 9) 8 ■x = (x 4 + 1 ) 8 ■x = ( x i6 + 1) 4 ■x = = (x 9 ■x 7 + 1) 4 ■x = ((x 4 + 1) ■x 7 + 1) 4 ■x = = ( x 11 + x 7 + 1) 4 ■x = (x 7 + x 6 + x 2 + 1) 4 ■x = = ( x 14 + x 12 + x 4 + 1) 2 ■x = = (x 5(x 4 + 1) + x 3(x 4 + 1) + x 4 + 1 ) 2 ■x = = (x 9 + x 5 + x 7 + x 3 + x 4 + 1) 2 ■x = = (x 4 + 1 + x 5 + x 7 + x 3 + x 4 + 1) 2 ■x = = (x 7 + x 5 + x 3) 2 ■x = ( x 14 + x io + x 6) ■x = = (x 5(x 4 + 1) + (x 5 + x ) + x 6) ■x = = (x 6 + x 4 + x + 1) ■x = = x7 + x5 + x2 + x = 1 (m od (x 9 + x 4 + 1)). Здесь мы неоднократно воспользовались тем, что x 9 = x 4 + 1 (m od f ), а такж е леммой 8.2. Таким образом, многочлен f при­ митивен. □ Пример 8.18 наглядно показывает, что число битовы х опе­ раций (в общ ем случае операций в поле коэф ф ициентов) по м о­ дулю многочлена f пропорционально числу его ненулевых ко­ эфф ициентов. П оэтом у с точки зрения слож ности вычислений в поле остатков по модулю f выгоднее т о т многочлен, у которого больш е нулевых членов. Таблицы таких многочленов составле­ ны для весьма значительных степеней и м огут бы ть найдены в специальной литературе. Перейдем теперь к арифметическим операциям в поляхрасширениях. П р и м е р 8 .1 9 . Найдем обратный к вы чету g (x ) = x 7 + x 6+ + x 3 + x + 1 по модулю многочлена f (x) = x 9 + x 4 + 1 £ Z 2[x]. Мы уж е доказали примитивность многочлена f (x) в примере 8.18, следовательно, вычет g (x ) = 0 обратим по модулю f (x ). Ч то­ бы найти g - 1 (m od f ), воспользуемся расширенным алгорит­ мом Евклида из леммы 4.6 (ниже многочлены представлены в
Глава 8. Конечные поля 280 векторной записи, а таблица алгоритма, приведенная в конце примера, транспонирована). В этой таблице первые два столбца отведены под коэф ф ициенты Безу, третий — столбец остатков, четвертый — неполные частные очередного шага. На последнем шаге получаем, что ( 1101011 ) ■/ + ( 100100110 ) ■g = ( 1 ), или, в алгебраической форме, (x 6 + x 5 + x 3 + x + 1) ■/ + (x 8 + x 5 + x 2 + x ) ■g = 1 . Рассм отрев остатки о т деления на / обеих частей этого равен­ ства, находим, что (x 8 + x 5 + x 2 + x ) ■g = 1 (m od / ), то есть g - 1(x) = x 8 + x 5 + x 2 + x (m od / (x )). 1 0 0 1 1000010001 11001011 1 10 11101 1101011 111 1111 1011101 100100110 1100000 1011 10 1 111 10 1110 101 А налогично находятся обратны е и к другим элементам рассм ат­ риваемого поля Z 2 [ x ] / / ( x ) . □ В случае, когда поле Z p [ x ] / / ( x ) относительно небольшое, а количество вычислений с его элементами велико, операции по модулю многочлена / удобно осущ ествлять не непосредственно, как в предыдущем примере, а сводить их к поиску по вспом ога­ тельной таблице. Таблица Кэли для этих целей подходит плохо, так как ее размер, равный квадрату порядка группы, требует относительно больш ого объема памяти. К ом промиссны м реше­ нием является таблица логариф мов (или ее часть), построен­ ная на основе свойства цикличности мультипликативной груп­ пы (Z p [ x ] //) * и имеющая линейный, относительно ее порядка, размер. П роиллюстрируем этот подход несколькими примера­ ми.
8.4. Арифметика в конечных полях 281 П р и м е р 8 .2 0 . П остроим таблицу дискретны х логариф мов поля F 8 = Z 2 [ x ]/(x 3 + x + 1). М ногочлен f ( x ) = x 3 + x + 1 неприводим над Z 2 (см. с. 113). П оэтом у группа F 8 = ( Z 2 [x ] /f )* — циклическая, то есть сущ е­ ствует такой вычет а £ F 8 , что Fg = ( а ) 7 . В силу того что |F8 | = 7 — простое число, многочлен f ( x ) примитивен. П оэтом у для удобства будем считать, что а является его корнем x в F 8 , хотя в F 8 есть и другие примитивные элементы. К аж ды й эле­ мент в нашего поля имеет как минимум три представления — он является вычетом по модулю f , вектором линейного векторно­ го пространства F 8 размерности 3 над просты м подполем Z 2 , и, наконец, если в = 0 , то он является некоторой степенью элемен­ та а: сущ ествует такое число k = loga в , 0 ^ k ^ 6 , что в = а к. Первые два представления связаны очевидным образом: векто­ ром, представляющ им какой-либо элемент поля, является на­ бор коэф ф ициентов соответствую щ его многочлена как вычета по модулю f (старшие коэф ф ициенты записываются, как обы ч­ но, слева). В частности, а = [x] = ( 01 0 ) и а 0 = [1] = ( 001 ). Найдем представления остальны х элементов поля F 8 . Для этого будем последовательно рассматривать подряд идущие сте­ пени а и вычислять их остатки по модулю f . Так, очевидно, а 2 = [x2] = ( 100 ). Однако при k = 3 многочлен x 3 не является вы четом по модулю f , и необходимо найти его остаток. Вместо деления с остатком м ож но заметить, что а 3 + а + 1 = 0 (так как а — корень f ), откуда а 3 = а + 1. ( 8 .22 ) Следовательно, а 3 = [x3] = [x + 1] = а + 1 = ( 011 ). Далее, а 4 = а ■а 3 = а ( а + 1) = а 2 + а = ( 110 ). Здесь мы слож или ранее найденные векторные представления а 2 = ( 100 ) и а = ( 010 ). Применяя тож д ество (8.22), такж е на­ ходим а 5 = а ■а 4 = а ( а 2 + а ) = а 3 + а 2 = = а 2 + а + 1 = ( 111 ) = [x 2 + x + 1].
282 Глава 8. Конечные поля Наконец, а 6 = а ■а 5 = а ( а 2 + а + 1 ) = а 3 + а 2 + а = = а + 1 + а 2 + а = а 2 + 1 = ( 101 ) = [х 2 + 1]. В заключение мож но произвести проверку того, что а 7 = 1. Д ействительно, а 7 = а ( а 2 + 1) = а 3 + а = 1. Результаты наших вычислений занесем в таблицу: F8 = F 2 ^ / ( х 3 + х + 1) - 1 а а2 а3 а4 а5 а6 000 001 010 100 011 110 111 101 [0 ] [1] [х] [х2] [х + 1] [х2 + х] [х2 + х + 1] [х2 + 1] Нулевой вычет, не являющийся элементом группы F 8 и не имеющий дискретного логариф ма по основанию а , включен в таблицу для полноты картины (вместо его мультипликативно­ го представления стои т прочерк). Третий столбец нашей таб­ лицы — столбец вы четов — не несет никакой дополнительной информации по сравнению со вторым, и п оэтом у в дальнейшем будем его отбрасы вать (однако отметим, что он иллюстрирует теорем у 8.5). Чем полезна такая таблица? При осуществлении аддитив­ ных операций удобно пользоваться векторны м представлением элемента поля, а мультипликативных — его дискретны м лога­ риф мом , так как а г ■а -7 = а г + 7 и а г/ а 7 = а г—7. Иначе говоря, вместо умножения двух элементов мож но просто слож ить их ло­ гарифмы, а вместо деления — вы честь (и привести по модулю порядка группы). Таблица ж е позволяет бы стр о переходить от одного представления к другому. П усть, например, надо вычислить а 3 + а 4. По таблице уста­ навливаем, что а 3 = ( 011 ) и а 4 = ( 110 ). Складывая соответ­ ствую щ ие векторы, получаем ( 0 1 1 ) + ( 110 ) = ( 101 ). Из таблицы
8.4. Арифметика в конечных полях 283 видим, что вектор ( 101 ) представляет элемент а 6. Таким обра­ з о м 1) , а 3 + а 4 = а 6. Д ругой пример. П редположим, что нам требуется найти век­ торное представление произведения ( 0 1 1 ) ■ ( 111 ). Из таблицы следует, что ( 0 1 1 ) = а 3 и ( 111 ) = а 5, поэтом у ( 011 ) ■( 111 ) = а 3 - а 5 = а 8 = а ■а 7 = а и а = ( 0 1 0 ). Следовательно, ( 0 1 1 ) ■( 111 ) = ( 01 0 ). П усть, наконец, нам надо найти обратный вычет (1 1 0 ) - 1. Тогда опять-таки по таблице устанавливаем, что ( 110 ) - 1 = = ( а 4) = а - 4 = а 7- 4 = а 3 = ( 0 1 1 ). А лгоритм Евклида не потребовался! □ З а м е ч а н и е 8 .2 . Тех ж е самы х результатов мож но бы ло д о ­ стичь, выписывая остатки от деления одночленов x k, 0 ^ k ^ 6 , на неприводимый многочлен x 3 + x + 1. Однако при больш их значениях степени неприводимого многочлена наш подход оп­ тимальнее, т. к. при таком подходе используется меньше опера­ ций над элементами поля. П роизведенные выше вычисления а к м ож но рассм атривать и как доказательство (неоптимальное) примитивности многочлена x 3 + x + 1 . В примере 8.11 на с. 269 бы ло построено поле из 16 элемен­ тов путем расширения поля Z 2 корнем а неприводимого над Z 2 примитивного многочлена x 4 + x + 1. Там ж е для всех ненулевых элементов этого поля были найдены логариф мы по основанию элемента а . Приведем эти логариф мы здесь в более компактной ф орме: 1 а а 2 а 3 а 4 а 5 а 6 а 7 а 8 а 9 а 1С 1 а 11 а 12 а 13 а 14 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 1 1 0 1 1 0 0 1 0 1 1 0 1 0 1 1 0 1 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 0 1 1 0 0 1 . (8.23) х)Это можно было установить, и просто умножив обе части равен­ ства (8.22) на а 3.
284 Глава 8. Конечные поля Д ля построения поля из 16 элементов мож но бы ло выбрать и другой примитивный многочлен четвертой степени х 4 + х 3 + 1 из Z 2 [х] и аналогично построить таблицу логариф мов в поле Z 2[x ] /( x 4 + х 3 + 1) по основанию его корня — вычета а . К ак нетрудно убедиться, она будет отличаться от приведенной вы­ ше таблицы. П оэтом у при вычислениях в конечном поле необ­ ходимо указывать сп особ его построения (примитивный много­ член и примитивный элемент). Выш е бы ло доказано, что поля Z 2[x ] /( x 4 + х + 1) и Z 2[ x ]/(x 4 + х 3 + 1) изоморф ны ; читателю ре­ комендуется построить этот изоморф изм явно, основы ваясь на доказательстве теоремы 8.8. П р и м е р 8 .2 1 . Вычислим значение выражения 8 +I а 14 14 \ 2015 а4 4 +I а '7 +I а 8 3 --------------------------------- + а 3 а 2 + а 10 + а 5 •а 6 где а — примитивный элемент поля F 16 = Z 2 [x ] /(x 4 + х + 1). Для этого воспользуемся приведенной выше таблицей (8.23). Сначала вычислим числитель и знаменатель дроби, заменяя 4 а 7', а 8 11 = а 5 •а 6 их векторныэлементы а 4, 8, а 14 14 и а 2 2, а 10 ми представлениями: 0011 1011 0101 1001 = а4 = а7 0100 = а 2, = а8 = а 14 0100 0111 1110 = а2 = а 10 1101 = а 13. = а 11 О тсю да а 4 + а 7 + а 8 + а 14 = а 2 и а 2 + а 10 + а 11 = а 13. Таким образом, значение дроби равно а 2/ а 13 = а -11 = а 4. Далее, а 4 + а 3 = а 7. Наконец, возведем а 7 в степень 2015 = = 15 •134 + 5 и получим ответ а 7^2015 = ( а 15) 7а34 •( а 7) 5 = 1 •а 5 = = а 5. □ П р и м е р 8 .2 2 . Для элемента а 5 из поля Z 2[x ]/( x 4 + х + 1) найдем минимальный многочлен над просты м подполем. П росты м подполем поля F 16 является поле F 2 , его характе­ ристика равна p = 2. Воспользуемся теоремой 8.7 и свойствами
8-4- Арифметика в конечных полях 285 сопряж енны х элементов. Найдем все сопряж енные с а 5 элемен­ ты . Для этого рассм отрим последовательность а 5^ , i = 0 , 1, . . . . Прямым вычислением убеж даемся, что она содерж ит всего два различных члена, а 5 и а 10, так как а 20 = а 5 (период последова­ тельности равен двум ). Следовательно, искомый многочлен не имеет други х корней, кроме а 5 и а 10. О тсю да т а 5 (x ) = т а 10 (x ) = (x — а 5)(х — а 10) = = x 2 + ( а 5 + а 10)х + а 5а 10 = x 2 + x + 1 . В последнем вычислении мы воспользовались таблицей (8.23), чтобы найти а 5 + а 10 = 1 . □ П р и м е р 8 .2 3 . Найдем минимальный многочлен m a 5 (x ) из предыдущ его примера другим сп особом — применим метод не­ определенных коэф фициентов. Из теорем 8.2 и 8.7 следует, что степень минимального многочлена л ю бого элемента поля F 24 не превосходит четырех, п оэтом у искомый многочлен имеет вид т а 5 (x ) = a 0 + a 1x + a 2x 2 + a 3x 3 + a 4x 4 , ai e Z 2 . Подставив вместо аргумента в m a 5 (x ) его корень x = а 5, полу­ чим m a 5 ( а 5) = a 0 + a ^ 5 + a ^ 10 + a за 0 + a 4а 5 = 0 . Последнее равенство мож но переписать в векторном виде, ис­ пользуя векторное представление элементов поля F 16 над про­ сты м подполем (см. таблицу (8.23)): a0 0 0 0 1 + a1 0 1 1 0 1 1 + a2 0 + a3 1 0 0 0 + a4 1 0 1 1 0 — 0 0 0 0 Получаем однородную систем у линейных уравнений над про­ сты м подполем: / 0 0 0 0 0 0 \ 0 0 V 1 1 1 0 1 1 1 0 0 1 1 1 0 0 0 0 )
Глава 8. Конечные поля 286 откуда находим 0 0 0 1 0 1 1 0 0 1 1 1 0 0 0 1 0 1 1 0 0 ^ 0 0 / 1 0 1 1 0 V 0 1 1 0 1 I 0 0 0 / применяя метод раздела 6.2. Последняя матрица систематиче­ ская, п оэтом у общ ее решение системы имеет вид а3 1 1 1 0 a4 0 ao a1 а2 = А1 + А2 1 0 0 1 + A3 0 0 1 0 0 (8.24) 1 где А1, Л2 , A3 £ Z 2 — произвольны. Последнее равенство задает целое семейство многочленов над Z 2 , корнем которы х являет­ ся а 5. Ненулевым многочленом наименьшей степени среди них, очевидно, является многочлен с коэффициентами А1 = 1, А2 = = А3 = 0. Заметим, что это мож но бы ло сказать заранее, не выписывая общее решение (8.24), из-за того, что свободная пе­ ременная Ai с меньшим номером отвечает за меньш ую степень одночлена в (x ). Таким образом, искомым ответом является первый базисный вектор ( 11100 ) найденной фундаментальной системы решений, кодирующ ий многочлен 1 + x + x 2. □ Подчеркнем, что метод решения примера 8.23 является д о ­ статочно общ им и удобным: чтобы найти минимальный много­ член (x ) элемента в £ Fpn над просты м подполем Fp, д о ­ статочно решить систем у линейных уравнений над Fp, которая получается из уравнения с неопределенными коэффициентами ш д (в ) = 0 , если заменить в нем все множители из Fpn их вектор­ ными представлениями над Fp. При этом набор коэф ф ициентов многочлена ш ^ (x) автоматически получится равным первому из базисных векторов в ортогональном пространстве этой системы, если элементарные преобразования при ее решении производить так, чтобы в конце главными оказались те переменные, к ото­ рые соответств у ю т младшим коэффициентам ш^ (x ), а свобод­ ными — те, которы е соответств у ю т старшим.
8.4. Арифметика в конечных полях 287 П р и м е р 8 .2 4 . Нам уж е известны все неприводимые много­ члены небольшой степени над полем Z 2 (см. с. 113). На основа­ нии этого запишем равенства х4 + х = х ■(х + 1 ) ( х 2 + х + 1) = ]^[ (х — в ), х8 + х = х ■(х + 1 ) ( х 3 + х + 1) ( х 3 + х 2 + 1 ) = ]^[ (х — в ), х !6 + х = х ■(х + 1) ( х 2 + х + 1) ( х 4 + х + 1) ■ ■(х 4 + х 3 + 1) ( х 4 + х 3 + х 2 + х + 1) = = (х — 0 )(х — 1) ( х — а ) ( х — а 2) (х — а 3) . . . (х — а 14), являющиеся частным случаем равенств (8.9) и (8.12). Д ействуя аналогичным примеру 8.22 или примеру 8.23 образом, нетруд­ но найти минимальные многочлены для всех элементов по­ ля F i 6 = Z 2 [х] / (х 4 + х + 1). В результате м ож но составить таб­ лицу элементов этого поля с указанием их минимальных много­ членов: 0 1 а а 2 а 3 а 4 а 5 а 6 а 7 а 8 а 9 а 10 а 11 а 12 а 13 а 14 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 х 1 0 0 0 0 0 1 1 0 1 1 0 1 1 0 0 1 0 1 1 0 1 0 1 1 0 1 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 0 1 1 0 0 1 m l m 3 m 3 m 5 m 3 m 2 m5 m 4 m 3 m 5 m 2 m 4 m 5 m 4 m 4 Минимальные многочлены в последней строке данной таблицы для компактности записи занумерованы следую щ им образом: m1(ж) m2(x) m3(x) (х + 1 ) (х 2 + х + 1 ) (х 4 + х + 1) m4(x) / т 5(ж) S / S (х 4 + х 3 + 1 ) (х 4 + х 3 + х 2 + х + 1 ), а сама таблица наглядно дем онстрирует разбиение циклической
Глава 8. Конечные поля 288 группы F 16 на классы сопряж енны х элементов: (а ) = { 1 } U { а 5, а 10} и { а , а 2, а 4, а 8} и mi(x) m2(x) тз(х) U { а 7, а 11, а 13, а 14} U { а 3, а 6, а 9, а 12} . т^(х) Шб(ж) Заметим также, что Ш1(ж) ■m 2 (ж) ■. . . ■Ш5 (ж) = ж15 + 1. □ П р и м е р 8 .2 5 . Согласно теореме 8.6, поле F 16 = F 24 содер­ ж и т подполя F 2 и F 22 и не содерж ит други х собственны х подполей. Ее доказательство указывает возмож ный сп особ нахож ­ дения элементов, лежащих в F 2 и F 22. Так, подполе F 22 со ст о ­ ит из корней уравнения ж4 + ж = 0 , а F 2 — из корней урав­ нения ж2 + ж = 0. Иными словами, F 4 и F 2 состоя т из корней неприводимых делителей двучленов ж4 + ж и ж2 + ж, которы е са­ ми являю тся делителями двучлена ж16 + ж. О тсю да с учетом уж е найденных минимальных многочленов для элементов F 16 нахо­ дим, что F 4 = { 0 , 1 , а 5, а 10} и F 2 = { 0 , 1 } (последнее очевидно). Альтернативный и значительно более удобный сп особ осн о­ ван на строении группы F ^ = (а ). К ак циклическая группа 15-го порядка, она содерж ит единственную подгруппу поряд­ ка 3 = |F^|, и это подгруппа ( а 5). Значит, F4 = ( а 5), откуда F 4 = { 0 } U F4 = { 0, 1, а 5, а 10}. □ Вернемся к вопросу нахождения числа неприводимых мно­ гочленов над просты м полем. Ранее уж е были предложены два подхода к решению этой задачи (теорема 4.13 и пример 8 .6 ). Разберем третий метод, основанный на строении конечного по­ ля, похожий на них, но имеющий немного другое обоснование. П р и м е р 8 .2 6 . Найдем число неприводимых многочленов сте­ пени 12 над Z 2 . Заметим, что каж дый неприводимый над Z 2 многочлен сте­ пени n является минимальным для некоторы х n элементов по­ ля F 2n согласно результатам раздела 8.2. Эти n элементов со ­ пряжены, имею т одинаковый порядок и не леж ат ни в каком собственном подполе поля F 2" . Таким образом, все элементы
8.4. Арифметика в конечных полях 289 поля F 2" , не входящие в подполя, разбиваю тся на непересекающиеся равномощ ные подмнож ества D i, каж дое из к оторы х явля­ ется множ еством корней одного неприводимого многочлена сте­ пени n (корни минимальных многочленов меньших степеней ле­ ж ат в подполях). Следовательно, число элементов M = ^ i |Di|, не входящ их в подполя поля F 2" , и число N неприводимых мноАТ M гочленов степени n связаны равенством N = — . О сталось найти число M . Напомним, что F 2« С F 2^ тогда и только тогда, когда а |b (теорема 8 .6 ). На рис. 8.2 слева приведе­ на так называемая решет ка подполей поля F 212. Она представ­ ляет собой граф, вершины которого соответств у ю т подполям, а ребра — отнош ению F 2« С F 2b (транзитивные ребра опущ ены). По теореме 8.6 решетка подполей поля Fpn всегда совпадает с реш еткой делителей числа n. Р и с. Справа на этом ж е рисунке приведена диаграмма макси­ мальных подполей в F 212. О тсю да, применяя принцип вклю че­ ний и исключений, находим M = 2 12 — 2 4 — 2 6 + 2 2 = 4020, п оэтом у сущ ествует ровно 4020 = 3о5 двоичны х неприводимых многочленов степени 12 . □ П р и м е р 8 .2 7 . На с. 275 бы ло введено понятие нормального базиса поля и доказано его сущ ествование в лю бом конечном по­ ле. О дно из основны х применений нормальных базисов — упро­ щение вычислений в конечных полях. В частности, возведение элемента в степень, равную характеристике поля, в нормальном
Глава 8. Конечные поля 290 базисе равносильно циклическому сдвигу вектора координат этого элемента в нем. Д ействительно, пусть а , а Р, . . . , а Р" нормальный базис поля Fpn и 2 в = 6oa + 6 1а Р + 62а Р + . . . + 6n -1 а p — n—1 , где 6i £ Fp, — разложение элемента в по этом у базису. Тогда, учиты вая, что а РП Р = а , имеем в Р = (6oa + 6 1аР + . . . + 6n - i a p" - 1) Р = = 6oa p + 6 1аР' + . . . + 6n -2 a p" - 1 + 6n - i a p" = 2 n—1 = 6n - i a + 6oa p + 6 1аР + . . . + 6n -2 a p . Таким образом, координаты p-й степени элемента с координа­ тами (6o, 61, . . . , 6n - i) равны ( 6n - i, 6o , 6i , . . . , 6n - 2). На больш ин­ стве современных процессоров для подобного преобразования вектора, умещ ающ егося в одно машинное слово, достаточн о все­ го одного такта работы, а схемная реализация циклического сдвига вообщ е не требует функциональных элементов. Таким 2 образом, вычисление степеней в Р, в Р , . . . — очень эф ф ективная операция в нормальном базисе. Остальные степени мож но вы­ числить по формулам в Р = (в*)Р и e pi+j = в Р*в^' при j < p, хотя умножение в нормальном базисе — уж е не столь простая операция. □ П р и м е р 8 .2 8 . В примере 8.16 был рассмотрен нормальный базис B поля F 27 = Z 3 [ x ]/(x 3 + 2x + 1 ) , состоящ ий из элементов а 2, а 6, а 18. Согласно предыдущ ему примеру, если элемент в имеет в ба­ зисе B координаты ( 012 ), то в 3 = ( 201 ). Ч тобы найти координа­ ты элементов в и в 3 в стандартном базисе В ; , то есть в базисе а 2, а , 1, м ож но воспользоваться матрицей перехода A от В ' к В , введенной на с. 154. Обратная к ней матрица A -1 будет матри­ цей перехода о т В к В ; , она позволяет по координатам вектора в базисе В найти его координаты в базисе В ;. У читы вая, что
8.4. Арифметика в конечных полях 291 а 2 = ( 100 ), а 6 = ( 111 ) и а 18 = ( 121 ) (это устанавливается лег­ ко), имеем Л A = 10 1 1 Л 2 1, A 0 1 1 1 1 0 2 0 2 2 0 1 2 применив метод раздела 6.2. Следовательно, в стандартном ба­ зисе в = A (0 1 2 )T = (020)T и в 3 = A (2 0 1 )T = (021)T . П од­ черкнем, что при вычислениях нам не потребовалась таблица дискретны х логариф мов из примера 8.10. При ее наличии зада­ ча становится тривиальной, так как в = а 14 и в 3 = а 14^3 = а 16. Т акж е заметим, что матрицы A и A — 1 вы числяются единож ды, а применять их для возведения различных элементов в степени 3 и 9 мож но многократно. □ П р и м е р 8 .2 9 . Рассмотрим ф актор-кольцо K = Z 2 [x ]/(h ), где h (x ) = (х 3 + х + 1 )(х 4 + х + 1) £ Z 2 [x]. Очевидно, что |K| = 2 7 = 128. Исследуем стр у к ту р у мультипликативной груп­ пы K * . Д ля этого воспользуемся китайской теоремой об остат­ ках (теорема 4.17): кольцо K изом орф но прямой сумме колец K1 = Z 2 [ x ]/(x 3 + х + 1) и K 2 = Z 2 [ x ]/(x 4 + х + 1). В си­ лу неприводимости над Z 2 многочленов f (х ) = х 3 + х + 1 и g (x ) = х 4 + х + 1 , кольца K 1 и K 2 являю тся полями, состоя ­ щими из 2 3 = 8 и 24 = 16 элементов соответственно. Следова­ тельно, их мультипликативные группы — циклические с поряд­ ками 8 — 1 = 7 и 16 — 1 = 15. Из изоморф изм а колец следует изоморф изм их мультипликативных групп: K = К 1 ® К 2^ K* ^ KJ х К£. В частности, мультипликативная группа K* — циклическая как прямое произведение двух циклических групп K 1, К£ взаимно п росты х порядков, и |K*| = |KJ|•|K2| = 7 1 5 = 105. Образующ им элементом группы K* будет элемент прямого произведения а = = ( а 1, а 2), где а 1, а 2 — примитивные элементы полей K 1 и K 2 . Нетрудно видеть, что f и g — примитивные многочлены. Следовательно, а 1 = х (m od f ) и а 2 = х (m od g ). П редстав­ ление остатками из китайской теоремы дает нам равенство х =
292 Глава 8. Конечные поля = [x ,x ]f,g . П оэтом у корень x G K многочлена h (x ) является об­ разующ им элементом в K*. Таким образом, получен пример приводимого и заведомо непримитивного многочлена h, корень которого тем не менее яв­ ляется образую щ им в мультипликативной группе ( Z 2 [x ]/(h ))* . □ М ногие важ ные задачи теории конечных полей реш аются практически без вычислений в них. Так, в приложениях встре­ чаю тся задачи, в которы х требуется оценить или найти точное число решений н екоторого уравнения, не решая его, или по эле­ менту поля-расширения необходимо установить степень его ми­ нимального многочлена, не находя сам этот многочлен, или вы­ яснить, сопряж ены ли два каких-то элемента поля. Разберем несколько примеров на эту тему. П р и м е р 8 .3 0 . Найдем корни многочлена f (x ) = x 3 + x 2 + x + 1 в поле F 39. Выясним сначала, приводим или нет этот многочлен над просты м подполем F 3 . При проверке сразу убеж даемся, что 0,1 G F 3 — не корни f (x ), а двойка является корнем. Значит, f (x ) приводим и делится на x — 2 = x + 1 G F 3 [x]. Поделив, например, в столбик, находим x 3 + x 2 + x + 1 = (x 2 + 1 ) ■(x + 1). Квадратичный множ итель x 2 + 1 не имеет корней в F 3 и, следо­ вательно, неприводим. Перебором найдены все решения (а именно x = 2) данного уравнения в п ростом подполе. К ром е поля F 3 и поля F 33 в поле F 39 нет други х собственны х подполей (1, 3, 9 — это все делители числа 9). Следовательно, элементы из F 39 \ F 3 являю тся корня­ ми всевозм ож ны х неприводимых многочленов 3-й и 9-й степе­ ни из F 3 [x] и только их. Так как ни один из этих многочленов не делится на многочлен x 2 + 1 , то f (x) не имеет корней сре­ ди элементов множ ества F 39 \ F 3 . Таким образом, единственным решением уравнения является x = 2 . □ П р и м е р 8 .3 1 . Найдем число решений уравнения x 7 + x 5 + + x 3 + x 2 + 1 = 0 в поле F 26 .
8.4. Арифметика в конечных полях 293 Заметим, что ответ зависит о т разложения левой части урав­ нения на неприводимые множители. Д ействительно, если мно­ гочлен f (x) = x 7 + x 5 + x 3 + x 2 + 1 неприводим, то решений нет, так как никакой неприводимый над Z 2 многочлен 7-й степени не делит двучлен x 2 — x, а каж дый элемент поля F 26 является корнем этого двучлена. Если ж е f делится на некоторый неприводимый многочлен g степени k, где k — делитель числа 6 , то каждый из k корней многочлена g одновременно и является корнем многочлена f , и леж ит в поле F 26. Н етрудно видеть, что данный многочлен f является произведением двух неприводимых многочленов g 1,g 2 , таких, что deg g 1 = 3 и deg g 2 = 4. Таким образом, данное урав­ нение имеет три решения. О бобщ ая вышесказанное, получаем, что число различных решений уравнения f ( x ) = 0 в поле Fpn равно степени наиболь­ шего общ его делителя многочленов f ( x ) и x pn — x над Z p (без учета их кратности). Из условия задачи нетрудно установить, что ( f , x 26 — x ) = x 3 + x + 1 . □ П р и м е р 8 .3 2 . П усть а — примитивный элемент поля F 212. Найдем степень минимального многочлена элемента а 546 над просты м подполем F 2 , не вычисляя сам многочлен явно. Мы уж е пользовались следствием теоремы о строении полярасширения (см. пример 8.26): если элемент а к леж ит в поле Fpm и не леж ит ни в каком его собственном подполе, то степень мини­ мального многочлена ш ак(x) £ Z p [x] равна ш . О сталось узнать, в какое подполе попал данный элемент. Оказывается, что это легко мож но установить по его порядку. Д ействительно, согласно теореме 3.16, , ,546| |а |а| 2 12 — 1 1 = (|а|, 546) = (2 12 — 1, 546) = (4095, 546) = 40954095 273 = . Следовательно, элемент а 546 образует циклическую подгруппу 15-го порядка в Fg12. Эта подгруппа является группой F24, так как иных подгрупп порядка 15 в поле F 212 нет в силу циклич­ ности его мультипликативной группы. Следовательно, элемент
294 Глава 8. Конечные поля а 546 леж ит в поле F 24 С F 212 и не леж ит ни в каком его подпо­ ле (порядки элементов подполей поля F 24 являю тся делителями числа 3 = |F22 1). П оэтом у d e g m a546 = 4 . □ П р и м е р 8 .3 3 . Выясним, являю тся ли сопряженными эле­ мент в = а 546 из предыдущ его примера и элемент 7 = а 273 в поле F 212. Сделать это мож но по определению: если найдется такое i, что в 2* = Y, то в и 7 сопряж ены. Равенство в 2* = Y равносильно сравнению 546 ■2* = 273 m od 212 — 1. Реш ению уравнений такого типа посвящен раздел 9.3. Однако в данном случае применять никакие специальные алгоримы не требуется, т. к. по теореме о строении поля F 212 неизвестное i не превосходит числа 12 и потом у м ож ет бы ть найдено полным перебором (более того, i долж н о делить 12 ). В м есто перебора мож но применить еще одну хитрость. П ред­ ставим дискретный логарифм b элемента в = а ь из поля F 2" в позиционной двоичной системе счисления: b= b0 + 2 bi + 2 2b2 + . . . + 2n ! bra—i, Ьг G { 0 , 1 }. Заметим, что в 2 = а 2Ь = а 2Ьо+ 22б1+ --+ 2ПЬп- 1 = а 6п- 1+ 2Ьо+22ь1+---+2n 1bn - 2 в силу того, что |а| = 2n — 1. Иными словами, двоичная за­ пись (bn—i, b0 , b i , . . . , bn —2) 2 логариф ма элемента в 2 оказалась равна циклическому сдвигу двоичной записи (b0 , b i , . . . , bn —1) 2 логариф ма элемента в на один разряд (ср. с примером 8.27). То 22 ж е самое верно и для элемента в 2 , и т. д. О тсю да следует п ростое правило: в поле характеристики 2 сопряж ены те и только те элементы, двоичны е записи логариф ­ мов к оторы х по основанию примитивного элемента поля пере­ ходят д руг в друга циклическими сдвигами. М нож ества таких чисел принято называть циклотомическими классами. В част­ ности, легко видеть, что 546 = (001000100010)2, 273 = (000100010001)2,
8.5. Порядки многочленов 295 откуда заключаем, что в и Y сопряж ены, причем i = 3. В цик­ лотомическом классе числа 546 всего четыре числа (включая его сам о), п оэтом у а 546 сопряж ен с четырьмя элементами по­ ля F 212. Следовательно, его минимальный многочлен имеет сте­ пень 4 (доказали независимо о т предыдущ его примера). □ П р и м е р 8 .3 4 . Разбиение (8.25) мультипликативной группы поля F i 6 на классы сопряж енны х элементов равносильно сле­ дую щ ем у разбиению множ ества всех целых чисел от 0 д о 14 на циклотомические классы: { 0 } U {5 ,1 0 } U {1 , 2, 4, 8 } U {7 ,1 1 ,1 3 ,1 4 } U {3, 6 , 9 ,1 2 }, или, более наглядно, в двоичной системе: {0 0 0 0 } U {0 1 0 1 ,1 0 1 0 } U {0001, 0010, 0100,1000} U U {0 1 1 1 ,1 0 1 1 ,1 1 0 1 ,1 1 1 0 }U {0 0 1 1 ,0 1 1 0 ,1 1 0 0 ,1 0 0 1 }. □ П р и м е р 8 .3 5 . Ц иклотомический класс числа 9 по основанию 2 6 - 1 = 63 состо и т всего из трех чисел: 9 2o = 9, 9 2 = 18 и 9 ■ 2 2 = 36, так как 9 ■ 2 3 = 9 m od 63. П оэтом у элемент а 9, где а — примитивный элемент поля F 26, леж ит в подполе F 23. Следовательно, deg m a9(x) = 3. □ 8.5. Порядки многочленов П усть f (x) £ Z p [x] и пусть f (0) = 0, т. е. свободный член у многочлена f (x ) не равен нулю. Тогда наименьшее натуральное число n, при котором двучлен x n - 1 делится на f (x ), называется порядком 1) многочлена f (x ) (а такж е иногда его периодом, или экспонент ой) и обозначается ord f : ord f = m in { n £ N : f (x) |x n - 1 }. 1)В теории регистров сдвига с линейной обратной связью над конечным полем (Linear Feedback Shift Register, LFSR) рассматриваются также поряд­ ки многочленов с нулевым свободным членом. Если f (0) = 0, то многочлен f (x) однозначно представим в виде f (x) = x rg(x), где r > 1 и g( 0) = 0. Тогда порядком многочлена f по определению является порядок многочле­ на g. Далее такие многочлены рассматривать не будем.
296 Глава 8. Конечные поля П р и м е р 8 .3 6 . П орядок многочлена f (x ) = x 2 + x + 1 e Z 2 [x] равен трем, так как x 2 + x + 1 \ x — 1 , x 2 — 1 и x 2 + x + 1 |x 3 — 1 . □ Нетрудно заметить, что данное выше определение порядка многочлена равносильно следующ ему: порядок многочлена f ( x ) совпадает с порядком его корня x в мультипликативной группе кольца Z p [ x ] / f (x ). Д ействительно, x n = 1 (m od f (x )) тогда и только тогда, когда f (x ) |x n — 1 . Из предположения f (0) = 0 следует, что f (x) и его корень x взаимно просты , п оэтом у x e (Z p [ x ] /f (x ) ) * . О тсю да следует корректность определения порядка многочлена: обратимый вы­ чет x имеет конечный мультипликативный порядок, который к том у ж е является делителем порядка группы (Z p [ x ] /f ( x ) ) * по теореме Лагранжа. Далее, как и раньше, порядок элемента a в конечной группе будем обозначать |a| . В случае, когда многочлен f (x) неприводим над Z p, ф акторкольцо Z p [ x ] / f (x) является полем F из pm элементов, где m = = deg f . В этом поле многочлен f (x ) имеет m различных со ­ пряженных корней, причем вычет x является одним из них при условии m > 1. Порядки всех корней одинаковы, как бы ло уста­ новлено в примере 8.14, и потом у равны ord f . Д ля неприводи­ мого многочлена степени m = 1 с одним ненулевым корнем это очевидно. Выш е мы убедились, что все конечные поля одинакового по­ рядка изоморф ны м еж ду собой. Таким образом, получаем сле­ д ую щ ую теорему. Т е о р е м а 8 .1 1 . П уст ь F — поле из pm элементов, m ^ 1, и f (x ) = x — неприводимый над Zp многочлен ст епени m . Тогда ord f = |в| для любого корня в из сопряж енн ы х в поле F корней многочлена f . О тметим, что в этом утверж дении важна неприводимость многочлена f (x ). Оно остается верным и для л ю бого поля F ; , содерж ащ его поле F = Fpm. С л е д с т в и е 8 .2 . Порядок любого неприводимого над Zp м но­ гочлена ст епени m являет ся делителем числа pm — 1 .
8.5. Порядки многочленов С л едстви е 297 8 .3 . М ногочлен ст епени m над Zp являет ся примитивным тогда и только тогда, когда его порядок ра­ вен pm — 1 . Последнее следствие мож но считать эквивалентным опреде­ лением примитивного многочлена. П р и м е р 8 .3 7 . К ак бы ло установлено выше, имею тся всего три неприводимых многочлена 4-й степени над Z 2 . Э то много­ члены ж4 + ж + 1, ж4 + ж3 + 1 и ж4 + ж3 + ж2 + ж + 1. Из таблицы минимальных многочленов элементов поля F 16 на с. 287 имеем, что первые два из них являю тся примитивными, так как поря­ д о к их корней равен 15. У последнего ж е многочлена порядок корня а 3 равен 5, п оэтом у огё(ж 4 + ж3 + ж2 + ж + 1) = 5 (см. также пример 8.15). □ П р и м е р 8 .3 8 . Воспользовавш ись разложением на множ ите­ ли числа 2 10 — 1 = 1023 = 3 ■11 ■31, м ож но найти количество неприводимых многочленов f степе­ ни 10 над Z 2 , имеющих конкретный порядок. При этом ord f де­ лит 2 10 — 1. У числа 2 10 — 1, как и у всякого числа, являющ егося произведением трех различных п росты х чисел, имеется восемь делителей, два из которы х тривиальны. В данном случае де­ лители составл яю т множ ество A = { 1 , 3,11, 31, 33, 93, 341,1023}, причем ord f G A. Для всякого d G A в поле F 210 содерж ится ^>(d) элемен­ тов порядка d, каж дый из которы х является корнем некоторого неприводимого многочлена. П орядок этого многочлена совпа­ дает с порядком корня, а степень — с порядком расширения т ого подполя поля F 210, в котором леж ит его корень, т. е. яв­ ляется делителем числа 10. Поле F 210 содерж ит подполя F 2 , F 22 и F 25. Д ругих собственны х подполей в нем нет. Порядки мультипликативных групп подполей F 2 , F 22, F 25 равны 1, 3, 31 соответственно. П оэтом у многочлены с порядками 1, 3, 31 (и их нетривиальными делителями, если бы они были) имею т степе­ ни 1, 2, 5. Все остальные многочлены с порядками из множ ества A \ { 1 , 3, 31} = {11, 33, 93, 341,1023} имею т степень 10.
Глава 8. Конечные поля 298 Итак, многочлен порядка d и степени ш имеет ш корней (по­ рядка d каж ды й), поле-расширение содерж ит всего p (d ) таких элементов, и каж дый из них является корнем одного многочле­ на, следовательно, число различных неприводимых многочле­ нов порядка d равно (сравните с примером 8.26). П оэтом у сущ ествует ^Л 11 = 1 многочлен порядка 11 и Р(33) = 2 10 р (9 3 ) = 6 , 10 р(341) = 30 , 10 р(1023) = 60 , 10 многочленов степени 10 порядка 33, 93, 341,1023 соответствен ­ но. □ Заметим, что из рассм отренного только что примера следует п ростое комбинаторное объяснение интересного ф акта из теории чисел: если p — п ростое и ш — наименьшее натуральное число, при котором число d является делителем числа pm — 1 , то p (d ) нацело делится на ш. Выш е в примере 8.37 мы воспользовались готовой таблицей дискретны х логариф мов и минимальных многочленов поля F 16. Если ж е такой таблицы нет или ее построение слиш ком гро­ моздко, то порядок неприводимого многочлена мож но найти тем ж е способом , что и порядок элемента x произвольной конечной группы G в случае, когда известно разложение числа |G| на про­ сты е множители, а для возведения x в степень в группе G име­ ется эф ф ективны й алгоритм. (См. такж е посвященный идейно близкому м етоду раздел 9.4.) Д ействительно, если f £ Z p[x] — неприводим, n = ord f и ш = deg f , то n делит число pm — 1 (следствие 8.2). Разложим число pm — 1 на просты е множители (это наиболее трудный при больш их ш этап метода; для его облегчения для чисел такого вида составлены специальные таблицы делителей): pm — 1 = Р11 .. .pkk, ri ^ 1 . Т огда n = Р11 .. .pkk, где 0 ^ si ^ ri . Д ля каж дого i = 1 , . . . , к найдем вычеты x (pm- 1)/pi по модулю f ( x ) . Если при этом ока­ ж ется, что x (pm- 1)/pi = 1 (m od f ( x ) ) ,
8.5. Порядки многочленов 299 то число n делится на p ^ , а значит Si = r (см. доказательство леммы 8.1 и теоремы 8.1). Иначе Si < ri. В последнем случае, чтобы найти Si, надо выяснить, будет ли делиться число n на Vi —1 Vi —2 r-Ч числа p i 1 , p i 1 , . . . , pi. Э то мож но сделать, вычисляя вычеты x (pm- 1)/p2 , x (pm- 1)/p3 , ..., x (pm- 1)/prri (m od f ( x ) ) и сравнивая их с единицей. П роизводя такие действия для каж ­ д ого п ростого делителя pi числа pm — 1 , найдем все неизвест­ ные Si и искомое число n. Для иллюстрации этого метода приведем пример. П р и м е р 8 .3 9 . Н етрудно убедиться в том , что многочлен f ( x ) = x 4 + x 2 + 2x + 1 взаимно п рост с двучленом x 32 — x и, следовательно, неприводим над Z 3 . Найдем его порядок. П усть n — порядок многочлена f . Тогда n является делите­ лем числа pm — 1 = 34 — 1 = 80 = 5 ■24 и, следовательно, имеет вид n = 5s1 ■2s2 . Д ля нахождения S1 и S2 нам необходимо вы­ числить x 80/ 5 = x 16 (m od f ) и x 80/ 2 = x 40 (m od f ). Вычисления будем производить в поле F = F 81 = Z 3 [ x ] / f (x ). Очевидно, что x 4 = 2 x 2 + x + 2 = 0212 (m od f ). Тогда x 16 = (x 4)3x 4 = (2x 2 + x + 2)3x 4 = (2x 6 + x 3 + 2 ) x 4 = = (2x 2 ■x 4 + x 3 + 2 ) x 4 = (2x 2(2x 2 + x + 2 ) + x 3 + 2 ) x 4 = = (x 4 + 2 x 3 + x 2 + x 3 + 2 ) x 4 = (x 4 + x 2 + 2 ) x 4 = = (2x 2 + x + 2 + x 2 + 2 )x 4 = (x + 1) x 4 = = (x + 1)(2x 2 + x + 2 ) = 2 x 3 + 2 (m od f ( x ) ) . Т ак как x 16 = 1 (m od f ), то n делится на 5, т. е. S1 = 1. Далее, x 40 = (x 20) 2, где x 20 = x 16x 4 = (2x 3 + 2)(2x 2 + x + 2 ) = = x 5 + 2x 4 + x 3 + x 2 + 2 x + 1 = = (2x 3 + x 2 + 2 x ) + 2(2x 2 + x + 2 ) + x 3 + x 2 + 2x + 1 = = (2 + 1) x 3 + (1 + 1 + 1) x 2 + (2 + 2 + 2 )x + (1 + 1) = = 2 (m od f ( x ) ) .
Глава 8. Конечные поля 300 Имеем х 20 = 2 = 1 (m od f ) и х 40 = 2 2 = 1 (m od f ). Следова­ тельно, n делится на 8 и не делится на 16, т. е. S2 = 3. Таким образом, ord f = 5 •8 = 40. □ Теперь рассм отрим ряд утверж дений, позволяю щ их нахо­ дить порядки приводимых многочленов. Л е м м а 8 . 6 . П уст ь многочлены f ( x ) , g ( x ) £ Z p [x] взаимно просты. Тогда по'рядок их произведения равен наим еньш ем у об­ щ ем у кратному их порядков: o r d (fg ) = Н О К (ord f , ord g ). Д о к а з а т е л ь с т в о . Величина o r d ( f •g) равна порядку выче­ та х в кольце Z p[ x ] / ( f •g). Из условия ( f , g ) = 1 по китайской теореме об остатках (теорема 4.17 на с. 127) следует, что это кольцо является прямой суммой: Z P[ x ] /( f g ) = Z p [ x ] / f ® Z p [x]/g. В частности, вычет х (m od ( f g ) ) представляется парой выче­ тов [x ,x ]f,g . Следовательно, его порядок в группе обратим ы х по модулю f g вычетов равен порядку этой пары [х, х] в группе ( Z p [ x ] /f <g> Z p [x ]/g )* = ( Z p [ x ] /f )* х (Z p [x ]/g )* , которы й в свою очередь равен наименьшему общ ему кратному порядков вы четов х (m od f ) и х (m od g) по лемме 3.2. Лемма доказана. С л е д с т в и е 8 .4 . П уст ь Д ( х ) , . . . , f (х ) £ Zp[x] и (fi, f ) = 1 при i = j . Тогда o r d ( f 1 •. . . •fk ) = Н О К (ord f 1, . . . , ord f ). Л е м м а 8 .7 . Д вучлен x a — 1 делит двучлен x b — 1 тогда и только тогда, когда а делит b. Это справедливо над любым полем.
8.5. Порядки многочленов 301 Д о к а з а т е л ь с т в о . Н еобходимость. Воспользуемся формулой сум м ы геометрической прогрессии y c — 1 = (y — 1)(y c—1 + . . . + + y + 1 ). П усть a |b. Тогда найдется такое с, что b = ac, и поэтом у х ь — 1 = (х “ ) с — 1 = (х “ — 1 ) ( х (с—l)a + х (с— 2)a + . . . + х 2“ + х “ + 1), то есть х “ — 1 |х ь — 1 . Д остаточн ость. П усть х “ — 1 | х ь — 1. Следовательно, b ^ a. Рассмотрим деление с остатком двучлена х ь —1 на двучлен х “ —1: х ь — 1 = (х “ — 1) х ь— a + х ь— a —1 = = (х ° — 1) ( х ь— a + х ь—2a) + х ь— 2a — 1 = = (х ° — 1) ( х ь— a + х ь—2a + х ь— 3a) + х ь— 3a — 1 = . . . = S = (х ° — 1) ( ^ х ь— - ) i= l + х ь— sa — 1 . П роцесс деления закончится на таком шаге s, что 0 ^ b —sa < a. Из условия х “ — 1 | х ь — 1 следует, что остаток равен нулю, то есть х ь—sa — 1 = 0. О тсю да имеем b — sa = 0. Значит, a |b. Лемма доказана. Л е м м а 8 . 8 . П уст ь f (х ) G Z p ^ ], f (0) = 0 и a G N. Д вучлен х “ — 1 без остатка делится на многочлен f (х ) тогда и только тогда, когда число a делится на его порядок ord f . Д о к а з а т е л ь с т в о . Обозначим n = ord f . П усть n | a. Тогда х п — 1 | х “ — 1 согласно лемме 8.7. К ром е того, f | х п — 1 по определению порядка. О тсю да следует, что f |х “ — 1. Теперь предполож им, что f | х “ — 1. Тогда из определения порядка n = ord f следует, что n ^ a. Разделим a на n с остат­ ком: a = qn + r, где 0 ^ r < n. Двучлен х “ — 1 мож но тогда представить в виде х ° — 1 = х 9га+г — 1 = (х 9га — 1) х г + (х г — 1 ). Из последнего равенства с учетом того, что многочлен f делит двучлены х “ — 1 и х 9” — 1, следует, что f делит х г — 1. В случае, когда r > 0 , это противоречит определению n в силу неравенства r < n. Значит, r = 0. Лемма доказана.
302 Глава 8. Конечные поля О тметим, что многочлены f , g в лемме 8.6 и многочлен f в лемме 8.8 м огут бы ть любыми — как приводимыми, так и неприводимыми. П р и м е р 8 .4 0 . Рассмотрим многочлен f (x ) = x 4 + x 3 + x 2+ + x + 1 e Z 2 [x]. Ранее бы ло установлено, что ord f = 5. Найдем теперь порядок многочлена f 3. П усть n = ord f 3. Так как x n — 1 делится на f 3, а значит и на f , то n делится на 5 по лемме 8.8. К ром е того, так как x 5 — 1 делится на f , то многочлен (x 5 — 1)4 = x 20 — 1 делится на f 4, а значит и на f 3 (здесь мы воспользовались леммой 8.2). Применив лемму 8.8 теперь к многочленам f 3 и x 20 —1, получим, что n является делителем числа 20 = 22 ■5. Так как 5 | n и n | 22 ■5, то искомое n имеет вид n = 2k ■5, где 0 ^ к ^ 2. Если к < 2, например, к = 1, то двучлен x 10 — 1 = = (x 5 — 1)2 должен делиться на f 3. Однако это невозмож но в силу неприводимости f : двучлен x 5 —1 делится на f и не делится на f 2. Альтернативный аргумент: многочлен f не имеет кратных корней в поле F 16 = Z 2 [ x ] / f , значит кратность каж дого корня многочлена f 3 в этом поле равна трем ; однако кратность корней двучлена x 2 ^5 — 1 = (x 5 — 1)2 не превосходит 2 к, и поэтом у f 3 \ x 2k^5 — 1 при к < 2. Таким образом, ord f 3 = 20. □ Обобщение метода предыдущ его примера с многочленов над полем Z 2 на многочлены над Z p позволяет получить следую щ ую полезную ф орм улу для порядка такого многочлена, который яв­ ляется степенью неприводимого. Л е м м а 8 .9 . П уст ь f (x ) e Z p [x] — неприводимый многочлен, отличный от x , и пуст ь m e N. Тогда o r d ( f m) = p s ■o r d ( f ), где s — наим еньш ее целое число, удовлет воряющ ее неравенству p s ^ m. Д о к а з а т е л ь с т в о . Обозначим n = ord f и N = o r d ( f m). Ч ис­ ло N делится на n по лемме 8 .8 , так как f m |x N — 1, а значит и f | x N — 1. Далее, двучлен x n — 1 делится на f (x ), и потом у (x n —1 ) m делится на f m(x ). А значит, двучлен (x n —1)pS = x npS —1 такж е будет делиться на многочлен f m(x ) при условии, что p s ^ m.
8.5. Порядки многочленов жпр 303 П олож им s = [logp m ] . По лемме 8.8 из того, что f m делит — 1 получаем, что N делит nps. В силу того, что n | N и N | nps, число N имеет вид N = npk, где 0 ^ k ^ s. Осталось выяснить, чему равно k. Рассмотрим теперь ф актор-кольцо F = Z p ^ ] / f (ж), которое в силу неприводимости f является полем. М ногочлен f имеет столько корней в F, какова его степень, причем кратность каж ­ д ого его корня равна единице. Заметим, что по следствию 8.2 число n = ord f не делится на p. Следовательно, двучлен жп — 1 не имеет кратных делителей, как следует из леммы 8.4. П оэтом у все его корни из поля F простые, так ж е как простыми являю тся и все корни многочлена f . Более того, так как n делит число |F* |, то двучлен жп — 1 имеет именно столько корней в поле F, какова его степень, то есть n. Значит, кратность каж дого корня мно­ гочлена f m и каж дого корня многочлена (жп — 1) m в этом поле равна m. Итак, двучлен (жп —1)р = жпр —1 имеет корни кратности p k. к М ногочлен f m делит жпр — 1 и имеет корни кратности m. Срав­ нивая кратности корней, получаем, что m ^ p k. П оэтом у k = s и N = nps. Лемма доказана. В кольце Z p ^ j всякий многочлен f (ж) положительной степе­ ни единственным с точн остью до порядка множителей образом раскладывается в произведение степеней неприводимых много­ членов (см. теорему 4.11, такое разложение по аналогии с раз­ ложением целых чисел в произведение степеней п росты х часто назы ваю т каноническим): f (ж) = fm 1(ж) ■. . . ■f m (ж). (8.26) Если f (0) = 0, то в разложении (8.26) отсутств у ет неприво­ димый многочлен ж. П орядок каж дого неприводимого делите­ ля ^ (ж ) мож но найти методом, аналогичным методу из приме­ ра 8.39. Зная ord fi, мож но определить ord f m по лемме 8.9. Наfm; конец, применяя по индукции к взаимно просты м делителям fi лемму 8 .6 , получим ord f . Все вместе это дает следую щ ее выра­ жение для порядка произвольного многочлена над полем Z p.
304 Глава 8. Конечные поля Т е о р е м а 8 .1 2 . П уст ь многочлен f ( x ) £ Z p [x] имеет поло­ ж и т ел ьную ст епень и ненулевой свободный член. Рассмот рим его каноническое разлож ение (8.26) в кольце Z p [x], где £ N, а f i ( x ) , . . . , fk (x) — различные нормированные неприводимые над Z p многочлены, отличные от x . Тогда ord f = p s ■Н О К (ord f 1, . . . , ord f k), (8.27) где s — наим еньш ее целое число, удовлет воряющ ее неравенству p s ^ m a x ( m 1, . . . , m k). П р и м е р 8 .4 1 . Найдем порядок многочлена f (x ) = (x 2 + x + 1 )(x 4 + x + 1 )(x 4 + x 3 + x 2 + x + 1)3£ Z 2 [x]. В рассм отренны х выше примерах бы ло установлено, что o r d (x 2 + x + 1) = 3, o rd (x 4 + x + 1) = 15, o r d (x 4 + x 3 + x 2 + x + 1) = 5, o r d (x 4 + x 3 + x 2 + x + 1)3 = 20 . По теореме 8.12 получаем, что порядок многочлена f равен Н О К (3 ,15, 20) = 2 2 ■Н О К (3 ,15, 5) = 60. О тметим, что ord f не делит число 2deg f - 1 = 2 18 - 1 . Э то означает, что в общ ем случае для приводимых многочленов следствие 8.2 не выполняется. □ П р и м е р 8 .4 2 . Рассмотрим последовательность {a n }^=o над полем Z 3 , заданную линейным рекуррентным равенством fln+3 = fln+i + 2an, an £ Z 3, n ^ 0, (8.28) с начальными условиями ao = ai = 0, a 2 = 1. Эта последо­ вательность является периодической, так как при лю бом ф и к­ сированном n тремя ее членами an ,a n+ i ,a n +2 все последующ ие ее члены определяются однозначно по формуле (8.28), а чис­ ло различных наборов (an , an+ i, an+ 2) над конечным полем ко­ нечно. Найдем период последовательности T , для чего рассм от­ рим последовательность a n £ Z 3 [ x ] /f ( x ) вычетов по модулю f ( x ) = x 3 + 2 x + 1 , такую , что a n+ 1(x ) = x a n (x ) (m od (x 3 + 2x + 1)).
8.5. Порядки многочленов 305 Заметим, что x 3a (x ) = x a (x ) + 2 a (x ) (m od (x 3 + 2x + 1)) при лю бом a (x ), п оэтом у x 3a n (x ) = x a n (x ) + 2 a n (x ), что равносиль­ но an + 3 (x) = an + 1 (x ) + 2 a n (x ). П олож ив a n (x ) = bnx 2 + Cnx+ dn = (bn, Cn, dn), где bn,Cn, dn GZ 3 , перепишем последнее равенство в векторном виде / bn+^\ / bn+^\ / bn\ ( Cn+3 1 = ( Cn+1 1 + 2 ( Cn 1 . \dn+3/ \dn+1/ \dn / Сравнивая компоненты векторов этого равенства с (8.28), у беж ­ даемся, что an = bn для всех n, если совпадаю т начальные члены последовательностей { a n } и {bn }. К ак нетрудно видеть, послед­ нее выполняется при a o (x ) = 1. Более того, период последова­ тельности {a n } совпадает с периодом последовательности { a n }. В силу того, что a n = x n (m od f (x )), период последовательно­ сти { a n } равен порядку многочлена f ( x ) . В примере 8.1 была доказана его примитивность, п оэтом у T = ord f = 26. М ногочлен, вектор коэф ф ициентов которого совпадает с век­ тором коэф ф ициентов линейного рекуррентного уравнения (по­ сле перенесения всех его членов в левую часть), называется его характеристическим многочленом. Так, многочлен f (x) = = x 3 + 2 x + 1 является характеристическим для уравнения (8.28). Применяя аналогичные рассуж дения к уравнению an+4 + an+2 + 2 an+1 + an = 0 (8.29) с начальными условиями a 0 = a 1 = a 2 = 0 , a 3 = 1 и его харак­ теристическом у многочлену x 4 + x 2 + 2 x + 1 и учитывая, что в примере 8.39 уж е был найден его порядок, устанавливаем, что период последовательности (8.29) равен 40. Очевидно, что пе­ риод линейной рекуррентной последовательности максимален тогда и только тогда, когда ее характеристический многочлен примитивен. □ П орядок многочлена является важ ным понятием теории цик­ лических помехоустойчивы х кодов и теории псевдослучайных
306 Глава 8. Конечные поля последовательностей над конечным полем. Формула (8.27) сво­ д и т вычисление порядка многочлена к его разложению на непри­ водимые множители. В начале следующ ей главы будет показа­ но, как это мож но сделать достаточн о эф ф ективно. Задачи 8.1. Выяснить, какие из перечисленных колец являются полями: Z, Q, R, C, Z6, Z 7, Zg, Z 9, Z 7[x], Z 7 [x]/(x + 1), Z r[x ]/(x 2 + 1), множе­ ство матриц вида ( _“ь ъ а ) с коэффициентами из R, множество матриц такого же вида, но с коэффициентами из Z 5 , Z 7. 8.2. Привести пример бесконечного поля конечной характеристи­ ки. (Указание: рассмотреть множество рациональных дробей над ко­ нечным полем F.) 8.3. Пусть x, у и z — линейно независимые векторы линейного векторного пространства над конечным полем Fq, состоящим из q эле­ ментов. Найти все значения q, при которых векторы x + у, x + z и у + z будут линейно зависимы. 8.4. Доказать, что неприводимый над полем GF(q) многочлен сте­ пени n остается неприводимым над его расширением G F(qm) тогда и только тогда, когда n и m взаимно просты. 8.5. Пусть многочлен f (x) неприводим над GF(q) и deg f = n. Доказать, что над полем G F(qm), m > 1 многочлен f (x) разлагается на (n, m) неприводимых сомножителей одинаковой степени (nnm) . 8.6. Разложить многочлен x 256 + x 12g + 1 e Z 2 [x] на неприводимые множители. 8.7. Определить, является ли многочлен x 6 + x4 + x 2+ x + 1 e Z 2 [x] примитивным. Найти какой-либо примитивный многочлен степени 7 над полем Z 2 . 8.8. Пусть m, n e N. Найти наибольший общий делитель много­ членов x p —x и x p — x. 8.9. Найти наибольший общий делитель двучленов x “ —x и x b —x, где a, b e N. 8.10. Построить решетки подполей в полях F24, F26, F28, F 218, F 230. Сколько элементов каждого такого поля не лежит ни в одном из его подполей? Как связано это число с числом неприводимых многочле­ нов степени 4, 6, 8,18, 30 над полем Z 2?
Задачи 307 8.11. Описать все конечные поля, решетка подполей которых яв­ ляется деревом. 8.12. Построить таблицы дискретных логарифмов в полях F4, Fs, F 9, F 16, F25, F 27. Указать все примитивные элементы и подполя. Для всех элементов найти их минимальные многочлены над простыми подполями. 8.13. Найти минимальное поле характеристики 3 , в котором мно­ гочлен f (х) £ Z 3 [x] раскладывается на линейные множители, если: 1) f (х) = х 3 + х + 2 ; 2 ) f (х) = х 4 + 2х 3 + х + 2 ; 3) f (х) = х 5 + х 2 + 2х + 1 . В каждом случае указать все корни многочлена f (х) в этом поле и их кратности. 8.14. Выяснить, в каких подполях поля F212 лежит элемент а 260, где а — примитивный элемент поля F 212. Найти степень его мини­ мального многочлена т а2во (х) £ Z 2 [х], не вычисляя сам многочлен явно. 8.15. Пусть а £ F64 — корень многочлена f (х)= х 6 + х 4+ х 2+ + х + 1 £ Z 2[x]. Найти минимальный многочлен элемента а 18 разными способами. 8.16. Построить поле G F (16) двумя способами: используя прими­ тивный многочлен степени 4 над полем G F (2) и используя примитив­ ный многочлен степени 2 над полем G F (4). Установить изоморфизм между двумя полученными полями. 8.17. Пусть F — конечное поле и F' — подполе в F. Нормиро­ ванный многочлен m(x) с коэффициентами из F' называется мини­ мальным многочленом элемента а £ F, если т ( а ) = 0 и степень многочлена т ( х ) минимальна среди всех многочленов положитель­ ной степени над F', для которых а является корнем. Это определе­ ние является естественным обобщением понятия минимального мно­ гочлена над простым подполем (см. с. 272) на произвольное подполе. Воспользовавшись решением предыдущей задачи, найти минималь­ ные над G F (4) многочлены для всех элементов поля G F (16) и срав­ нить полученный результат с примерами 8.24, 8.34 и теоремой 8.2. 8.18. Найти порядок многочлена над полем Z 2: 1) х 2 + х + 1; 2) (х 2 + х + 1)2; 3) (х 2 + х + 1)2(х 4 + х + 1 ). 8.19. Найти количество и степени неприводимых множителей в разложении следующих двучленов над полем Z 2: 1) х 21 + 1; 2) х 23 + 1; 3) х 45 + 1; 4) х 63 + 1; 5) х 84 + 1. Для каждого из них указать минимальное поле характеристики 2, над которым он разлагается на линейные множители.
308 Глава 8. Конечные поля 8.20. Найти а н а *2а *з, гДе а ъ- £ G F (53 )8.21. Пусть p и r — различные простые числа. Доказать, что мно­ гочлен XX- 1 раскладывается над Z p на различные неприводимые мно­ гочлены, каждый из которых имеет степень, равную порядку вычета p (mod r) в группе Z*. 8.22. Пусть а и в — примитивные элементы поля G F(p” ). Будет ли их произведение примитивным элементом? 8.23. Пусть xp = x mod f (x), где f (x) — многочлен степени n над полем Zp. Является ли f (x) неприводимым? 8.24. Найти период последовательности |an}^= 0 над полем Z 3, если an+5 + an+4 + an+3 + 2an 0, где a0 . . . a3 0, a4 1. 8.25. Пусть k — делитель p” — 1. Многочлен Qk (x) = П a . (x —а*), где произведение берется по всем корням k-й степени из единицы в по­ ле G F (p” ), имеющим порядок к, называется к-круговым многочленом над G F (p” ). Доказать, что Q k(x) £ GF(p)[x]. 8.26. Доказать, что x k — 1 = П т |к Qm(x). 8.27. Доказать, что Q k(x) = n m|k(xm — 1)M(k/m). 8.28. Доказать, что Qkp(x) = Qk(xp) при всех натуральных k и простых p. 8.29. Доказать, что круговые многочлены Q 19 (x) и Q 2r(x) непри­ водимы над полем G F (2). Совпадают ли они? 8.30. Показать, что многочлен f (x) степени n неприводим над Z p тогда и только тогда, когда f (x) делит x p — x и при этом взаимvn/pi но прост с каждым из двучленов вида xp— x, где p* — простой делитель числа n (см. пример 8.7). n—1 8.31. Доказать, что элементы а, а р, . . . , а р образуют нормаль­ ный базис поля G F (p” ) тогда и только тогда, когда многочлены x ” —1 и a x n - 1 + а ^ ” - 2 + ... + ар x + ар взаимно просты.
Глава 9 Алгоритмы Эта глава является небольшим введением в современные при­ ложения конечной алгебры. В ней рассм атриваю тся примеры алгоритмов, находящих решения алгебраических задач разной природы. Эти задачи условно м ож но отнести к одному из трех видов. Задачи первого вида естественным образом возникают в самой алгебре, такова задача разложения многочлена на непри­ водимые множители, и затем появляются в качестве состав­ ных частей решений многочисленных прикладных задач. За­ дачи второго вида леж ат на сты ке алгебры и ее приложений. Я рким примером такой задачи является задача логариф миро­ вания в конечном поле, которая интересна и как чисто матема­ тическая, и как криптографическая задача. Наконец, к третье­ му виду мож но отнести задачи, в которы х алгебраические кон­ струкции являю тся средством для решения практических задач, возникающ их за пределами математики. К таким задачам отн о­ сится задача передачи информации при наличии помех, в основе решения которой леж ат коды, исправляющие ошибки. 9.1. Свободные от квадратов многочлены С помощ ью алгоритма Берлекемпа мож но эф ф ективно рас­ кладывать многочлен на неприводимые множители над неболь­ шим конечным полем. В основе этого метода леж ит китайская теорема об остатках для кольца многочленов (см. теорему 4.17 на с. 127) и ее очевидное следствие, которое сформулируем в виде следующ ей теоремы.
310 Глава 9. Алгоритмы Т е о р е м а 9 .1 . П уст ь p — простое число и f ( x ) = fin1 (x) ■ . . . ■ f n ( x ) (9.1) — разлож ение многочлена f (x) £ Z p [x] в произведение ст епеней различных многочленов f i ( x ) , неприводим ых над Z p. Тогда Z p [ x ] /f (x) ^ Z p [x ]/fin1 (x) ® ■■■ ® Z p [ x ] /f n (x ). Нам такж е потребуется обозначение a — [а^ . . . , ak] — [а^ . . . , ak] fn1 f1 fnk k (9.2) для системы остатков, представляющей элемент a (x ) ф акторкольца Z p[ x ] / f (x ) так, что a (x ) = a 1(x ) (m od f n 1(x )) a (x ) = ak(x) (m od f ^ ( x ) ) введенное нами ранее в разделе 4.8. Р ассм отрим вначале многочлены f ( x ) одного частного вида, у к оторы х все показатели степеней т в разложении (9.1) рав­ ны единице. Они называются свободными от квадратов. Иными словами, многочлен свободен от квадратов, если квадрат лю бого его нетривиального делителя не является его делителем. Итак, предполож им, что f (x ) = f i (x) ■ . . . ■fk (x ), и устано­ вим сп особ нахождения всех неприводимых над Z p делителей fi. Согласно теореме 9.1 и теореме 4.14 (с. 119), в разложении Z p [ x ] /f (x ) = Z p [ x ] /f i (x ) ® ® Z p [x ]/fk (x ) (9.3) каж дое из ф актор-колец Z p[ x ] / f является полем. М нож ество вы четов-констант {h £ Z p [ x ] / f | d e g h = 0 } является его един­ ственным п росты м подполем, изоморф ны м полю Z p. При д о ­ казательстве теоремы 8.6 (с. 270) было отмечено, что элемент поля-расширения леж ит в подполе порядка pm тогда и только тогда, когда он является корнем двучлена x pm - x. О тсю да следу­ ет важное наблюдение, что принадлеж ность вычета h простом у подполю поля Z p [ x ]/fi эквивалентна условию hp = h.
9.1. Свободные от квадратов многочлены 311 В разложении (9.3) неизвестны и число множителей к, и сами множители f*. Найдем сначала к. Рассмотрим множ ество V = { g G Z p M / f |g = [0 i , . . . , 0fcL где deg g* = 0 для всех g* G Z p ^ / f * } , состоящ ее из тех многочленов g, остатки которы х о т деления на все неприводимые делители f* являю тся константами! ) . Из свойств представления g = [gi, . . . , g k ] (см. с. 127) следует, что множ ество V С Z p ^ ] / f является линейным векторны м про­ странством размерности к над Z p (оно часто называется про­ странством или алгеброй Берлекемпа): а G Zp, g ,g G V ^ g + g G V, аg G V, g ■g G V. К ром е того, degg* = 0 тогда и только тогда, когда gP = g*. П о­ этом у система вычетов [ g p , . . . , g p = [ g i , . . . , g k ], представляю ­ щая gp в случае, когда deg(g (m od f*)) = 0, одновременно пред­ ставляет и g. Значит, g GV ^ gp = g ^ gp — g = 0. П усть n = deg f . Тогда произвольный вы чет имеет вид g ^ ) = a0 + a ^ + a2x 2 + ■■■+ an—l х п—! , g G Zp^ ] / f a* G Z p. Следовательно, в силу леммы 8.2 (см. с. 258) gp(х) = g ^ p) = = a 0 + a i х р + a 2X2p + ■■■+ an—i х (” —l)p . Приводя подобные слага­ емые при неизвестных a j , получим равносильное условию g G V равенство gp — g = a0 ■0 + a l ^ p — х ) + a2^ 2p — х 2) + . . . . . . + a „ —! ( х (п—l)p — х п—! ) = 0 (m od f ). (9.5) 1)Из того, что все остатки некоторого многочлена при делении на f t, i = 1,... , к являются константами, не следует, что сам многочлен являет­ ся константой по модулю f . Это справедливо только в случае, когда все остатки одинаковы.
312 Глава 9. Алгоритмы Обозначим через г? (ж) остаток о т деления двучлена ж№ — ж? на f (ж): г?(ж) = Г0,? + п ? ж +-+ Гп—1,jжп , r ? G Zp. Т огда уравнение (9.5) мож но переписать как ^ ” — 0 aj r?(ж) = 0, или, перегруппировав члены, в виде (a0 ■0 + а1Г0,1 + а2Г0,2 +-------- + ап —1Г0,п—1)+ + ж(а0 ■0 + а1Г1,1 + а2П,2 +-------- + ап—1Г1,п—1) + . . . . . . + ж^а0 ■0 + а ^ д + a2ri,2 +-------- + ап —lri,n —1) + . . . = 0. Приравнивая каж дый коэф ф ициент многочлена в левой части этого равенства к нулю, получим однородную систем у линейных уравнений над Z p: 0 0 \0 r0,1 r 1,1 r0,2 r 1,2 гп—1,1 гп—1,2 ... г0,п—1 \ r 1,п 1 а0 а1 0 0 гп—1,п—1/ \ап—1 / \0/ (9.6) Обозначим ее матрицу размера n х n, состоя щ ую из коэф ф ици­ ентов r i,j, через R . О тметим, что матрица R однозначно опре­ деляется многочленом f . Л е м м а 9 .1 . Число неприводимых делителей k свободного от квадратов многочлена f ст епени n удовлет воряет равенству k = n — rank R , где R = И,п хп — матрица, j -й столбец которой являет ся столбцом коэффициентов остатка г?(ж) = ж^ —ж? (m od f (ж)), j = 0 , 1 , . . . , n — 1. Д о к а з а т е л ь с т в о . Из определения пространства V и китай­ ской теоремы об остатках следует, что k = dim V . Ранее мы убедились, что g G V тогда и только тогда, когда R a = 0, где a = (а 0 , а 1, . . . , ап—1) — вектор коэф ф ициентов вычета g. Иначе
9.1. Свободные от квадратов многочлены 313 говоря, подпространство V является ортогональны м простран­ ством матрицы R . П оэтом у к равно размерности пространства решений системы (9.6) и искомое утверж дение является триви­ альным следствием теоремы 5.3 (с. 146) об образе и ядре линей­ ного оператора. Лемма доказана. Таким образом, получен еще один способ проверки неприво­ дим ости свободного о т квадратов многочлена над конечным по­ лем: многочлен неприводим, если его матрица остатков R имеет ранг n — 1. Э то условие эквивалентно линейной независимости многочленов п , . . . , rn - 1. Найти ранг матрицы R мож но, например, методом Гаусса из раздела 6.2. П опутно с рангом метод Гаусса позволяет най­ ти еще и некоторую фундаментальную систем у решений (Ф С Р ) однородной системы R a = 0, т. е. базис подпространства V . П о­ кажем, что лю бую Ф СР систем ы (9.6) мож но использовать для разложения f (x ) на множители. Д ействительно, пусть k > 1, а B = { e 1, e 2 , . . . , } — какойлибо базис в ортогональном пространстве V матрицы R . К а ж ­ дый базисный многочлен e j = e j (x) имеет два представления. Во-первых, n- 1 e j = Y I bj,lx1 = j 1=0 bj,b . . . , bj,n -1 ) как вы чет кольца Z p[ x ] / f , где bj,j G Z p и младшие коэф ф ици­ енты векторной записи многочлена, как и везде выше в этом разделе, расположены слева. В о-вторы х, как элемент прямого произведения (9.3) он представляется такж е системой остатков e j = [е1, . . . , 4 ] = [е1, . . . , 4 ]/1,...,/fc по неприводимым делителям, где ej G Z p [x ]/fi. Первое представ­ ление нам известно после решения систем ы (9.6), второе — нет, как неизвестны и сами fi. Однако известно, что все остатки ej по каж дом у модулю f i имею т нулевую степень, т. е. являю тся константами из Zp в силу того, что e j G V.
314 Глава 9. Алгоритмы Заметим также, что вне зависимости о т многочлена f пер­ вый столбец матрицы R = R ( f ) всегда нулевой. Э то означает, что пространство V обязательно содерж ит все вычеты нулевой степени из Z p [ x ] / f , что следует непосредственно из определе­ ния V . П оэтом у без ограничения общ ности рассуж дений мож но считать, что первый среди найденных методом Гаусса базисных многочленов e 1, . . . , будет единичным: e 1 (x ) = 1 = (1, 0, 0 , . . . , 0) = [ 1 , 1 , . . . , 1 / ,/2, . . . / . Данное решение (как и любая другая константа кольца Z p[ x ] / f , в чем убедимся далее) не дает никаких сведений о делителях f и отбрасы вается. Все остальные решения e 2, . . . , e^ при k > 1 линейно независимы с e 1 и являю тся нетривиальными много­ членами. Д ля дальнейшей работы м ож ет понадобиться каждый из них. П усть g e Z p [ x ] /f и пусть g = 0. Тогда ( f , g ) = f , так как deg g < deg f . В силу неприводимости f i многочлены g и f = f 1f 2 . . . f k м огут бы ть не взаимно просты тогда и только тогда, когда g делится на некоторые из многочленов f . Рас­ см отрим систем у остатков многочлена g = [g1, . . . ,g k ]/b ...,/fc. П о­ лучаем, что ( f , g) = 1 тогда и только тогда, когда сущ ествует такое i, что gi = 0. В силу ( f , g) = f долж н о такж е сущ ество­ вать такое j , что gj = 0 . М ногочлен g называется в этом случае f -разлагающим, так как он позволяет разлож ить f на множ и­ тели d = ( f , g) и f / d , причем d = 1 и f / d = 1. Очевидно, что d = П i:gi=0 f i и f / d = П ед = 0 f i . Клю чевым является наблюдение, что в V содерж ится много f -разлагающ их многочленов. Д ействительно, пусть a e Z p. Т о­ гда константе a соответствует вычет a e V С Z p [ x ] / f , который м ож но представить системой остатков [ a, . . . , a ]/b ...;/ fc. При раз­ личных многочленах g (x ) из Z p[ x ] / f неприводимый делитель fi м ож ет делить как d (x ) = ( f ( x ) , g ( x ) — a), так и f ( x ) / d ( x ) . Рас­ см отрим разность g (x ) — a и ее систем у остатков: g (x ) — a = [g^ . . . , g k] — [ a, . . . , a] = [g1 — a , . . . , gk — a]. Если g e V , то для каж дого остатка gi сущ ествует такое a e Z p,
9.1. Свободные от квадратов многочлены 315 зависящее о т i, что gi = а. При таком (и только таком) значе­ нии а разность gi — а равна нулю, и, следовательно, многочлен g (x ) —а делится на fi. П оэтом у разность g (x ) —а является f -раз­ лагающим многочленом при условии, что g (x ) = а. Э то заведомо так, например, в случае, когда g (x ) £ B \ { e 1} в силу линейной независимости многочленов e 1, . . . , ek . Линейная независимость векторов базиса B оказалась, та­ ким образом, полезным свойством . Следующ ее утверж дение о с­ новано на втором свойстве базиса — линейной полноте. Оно по­ казывает, что лю бы е два неприводимых делителя м огут бы ть отделены друг о т друга вычислением Н О Д многочленов f (х ) и e (x ) — а при подходящем вы боре базисного многочлена e (x ) и константы а: один из них войдет в НОД, а другой — нет. Л е м м а 9 .2 . П уст ь i , j £ {1, . . . , k } , i = j — произвольные индексы. Тогда найдется такое s, 2 ^ s ^ к, что ef = es. Ины­ м и словами, фундаментальная система реш ений B содерж ит нетривиальный вектор e s, остатки которого по м одулю f i и по м одулю f j различны. Д о к а з а т е л ь с т в о . Д окаж ем лемму от противного. Ф иксиру­ ем i, j и предполож им, что ef = ef для всех s = 1 , . . . , k (базис­ ный вектор e 1 такж е обладает этим свойством ). Тогда и остат­ ки любой линейной комбинации А^ 1 + . . . + Akek при делении на fi и f j такж е совпадают. Однако из (9.3) следует, что про­ стран ство V содерж ит вычеты с разными остатками. Получили противоречие с тем, что V — линейная оболочка B . Лемма д о ­ казана. Итак, для лю бы х i = j найдется хотя бы одно s = s(i, j ), такое, что константы e s (m od fi) и e s (m od f j ) различны. П усть e s = а (m od f i ), где а £ Z p. Тогда пара многочленов f (х) и e s(x ) — а имеет нетривиальный общий делитель d = ( f , e s — а), которы й делится на fi и не делится на f j . В озм ож но, впрочем, что d делится и на некоторый многочлен f m такой, что m = = i, j , но для пары i, m по доказанному утверж дению найдется свой индекс s' и своя константа а'. Следовательно, перебирая константы а £ Z p с индексами s = 2 , . . . , к и вычисляя ( f , e s —а),
316 Глава 9. Алгоритмы м ож но отделить все множители f д руг от друга. При этом на следую щ ем шаге разложения вместо f удобно использовать его делители d и f / d , найденные ранее. Резюмируя все сказанное выше, полученный метод нахож ­ дения неприводимых множителей мож но условно разделить на три этапа (см. рис. 9.1). Алгоритм Берлекемпа Вход: свободный от квадратов многочлен f ( x ) £ Z p [x] Выход: список е го неприводимых делителей f i , . . . , fk 1. Найти матрицу оста тк ов R = R ( f ). 2 . Найти базис B = { e i , . . . , ek} ортогон ал ьн ого п ростран ства матрицы R . 3 . Используя базис B , разложить f на множители вычислением НОД с многочленами e s - a. Р и с. 9.1 Реализация первых двух этапов очевидна и предоставляется читателю в качестве упражнения. Они использую т вычисление остатков по модулю f (например, делением «в стол би к ») и метод Гаусса. П севдокод одной из возм ож ны х реализаций последнего эта­ па приведен на рис. 9.2. Поясним работу этой подпрограммы. На каж дом ее шаге множ ество найденных нетривиальных дели­ телей f объединено в список S. С писок выбран в качестве осн ов­ ной структуры данных потому, что сл ож ность добавления (или выбрасывания) нового члена списка независима о т его длины. Вначале (строка 1) список делителей S содерж ит только сам многочлен f . Еще потребуется вспомогательный список Stmp п ром еж уточн ы х делителей текущ его шага. П рограмма перебирает базисные векторы e 2 , . . . , ek . Фик­ сируем очередной вектор e s (строка 2). Пока вспомогательный
9.1. Свободные от квадратов многочлены Вспомогательная процедура: разложить / 317 с помощью B Вход / е Z p [ X , базис B = { e i , . . . , } в V Вспомогательная память: списки делителей S и Stmp Выход: S = { / i , . 5. 6. {}/ 3. 4. = S 1. 2. . , / f c } , где / i неприводимы, Пгк=1 / i = / f o r ( s = 2 ; s ^ k ; s++ ) Stmp = S > w h ile ( Stmp = 0 ) 7. F (x) = Очередной множитель(Stmp) 8. 9. Stmp — Stmp \ { F (ж)} ; a = 0 ; w h ile ( a ^ p — 1 ) 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. d(x) = Н ОД^(ж), e s(x) — a) i f ( d = 1 ) a++ ; else if( d = F ) a = p ; else S = S \ { F (ж)} ; S = SU{d(x),F(x)/d(x)} ; i f ( |S| = k ) r e tu r n S ; else 23. 24. 25. 26. 27. ; a++ ; F ( x ) = F ( x ) /d ( x ) } 28. 29. Р и с. 9.2 ; ;
318 Глава 9. Алгоритмы список ранее найденных нетривиальных делителей f непуст, возьмем очередной делитель F и выбросим его из Stmp (стр о­ ки 7—8). Начнем перебирать всевозмож ные константы а из о с­ новного поля (цикл в строке 10). Для данных e s, F и а вычислим Н О Д d многочленов e s — а и F (строка 12). В зависимости от значения d возмож ны следующ ие варианты. Л ибо e s — а и F взаимно просты — это означает, что многочлен e s —а не является F -разлагающим, но, возмож но, будет им при другом значении а. Л ибо d = F — такое возмож но, когда все остатки многочлена e s по модулю всех неприводимых делителей F одинаковы и рав­ ны а. В этом случае дальнейший перебор констант а бесполезен («неудачны й» e s), и надо перейти к следую щ ем у делителю или даж е к следую щ ем у базисному вектору, если список делителей исчерпан, — возмож но, с ним повезет больше. Этой цели слу­ ж и т присваивание а = p в строке 15, которое вы водит из цикла строки 10. Во всех остальны х случаях многочлен e s — а будет F -разла­ гающим, и мы переходим к строкам 18—24. Здесь мы имеем два нетривиальных делителя d и F /d , которы е добавим к списку S , и при этом вы бросим F из S . С писок Stmp играет роль списка стары х делителей, а список S — вновь найденных, причем Stmp обновляется всякий раз при смене вектора базиса. После увели­ чения списка S необходимо проверить, совпадает ли его длина |S| с к (строка 20). Если да, т.е. число делителей f равно раз­ мерности пространства V , то все они различны и неприводимы (лемма 9.1). Следовательно, получен искомый ответ. Если |S| < к, то следует продолж ить вычисления со следу­ ю щ его значения а. При этом для всех значений b > а остатки многочлена e s — b по модулю всех неприводимых делителей F , входящ их в d, будут заведомо не равны нулю (но только для данного e s). П оэтом у имеет смы сл упрости ть вычисления НОД, понизив степень многочлена F делением на d (строка 24). Здесь мы пользуемся очевидным свойством : остатки многочлена e s —b по модулю неприводимых делителей многочлена F / d совпадаю т с остатками по модулю тех неприводимых делителей F , которы е не входят в d, но входят в F /d .
9.1. Свободные от квадратов многочлены 319 Таким образом, данная подпрограмма всегда заканчивает св ою работу и вы ходит из цикла в строке 20. Ее корректность следует из леммы 9.2. По ее окончании список S содерж ит все неприводимые делители многочлена f . П р и м е р 9 .1 . М ногочлен f (ж) = ж7+ ж6+2ж 5+ж 4 +2ж 2 + 2ж+ 2 с коэффициентами из поля Z 3 разложим в произведение непри­ водимых над этим полем многочленов. При помощи алгоритма Евклида нетрудно убедиться, что многочлен f (ж) взаимно прост со своей производной ^ (ж ) = ж6 + ж4 + ж 3 + ж + 2 , и следовательно, свободен о т квадратов. П оэтом у для разложения f (ж) на неприводимые множители м ож но воспользоваться изложенным выше алгоритмом Берлекемпа. В соответствии с этим алгоритмом сначала найдем мно­ гочлены г? (ж): Г0(ж) = 0; = ж3 — ж = 0001020 (m od f ), Г2(ж) = ж6 — ж2 = 1000200 (m od f ), ж3 = 2022212 Г3(ж) = ж9 — (m od f ), = ж12 — ж4 = 2122010 (m od f ), Г5(ж) = ж15 — ж5 = 2001120 (m od f ), Г6(ж) = ж18 — ж6 = 0211120 (m od f ). г 1( ж) г 4( ж) При этом удобно использовать вспомогательный многочлен у (ж) для вычета ж?^ по модулю f и вычислять ж ? ^ 1^ = ж?^ ■жp как у(ж) ■жp по модулю f . Из коэф ф ициентов ri,j найденных много­ членов составим матрицу 0 0 1 2 2 2 0 0 0 0 0 1 0 2 R 0 0 0 2 2 0 1 0 1 0 2 2 1 1 0 0 2 2 0 1 1 0 2 0 1 1 2 2 0 0 0 2 0 0 0
320 Глава 9. Алгоритмы и найдем базис ее ортогонального пространства. Для этого эле­ ментарными преобразованиями стр ок преобразуем ее в матрицу /0 0 0 \0 1 0 0 0 0 0 0 1 0\ 1 0 0 2 2 0 1 0 0 0 , 0 0 1 0 2 / которая перестановочно эквивалентна систематической. П ослед­ няя матрица имеет полный ранг, п оэтом у rank R = 4 и к = = n rank R = 7 4 = 3. Следовательно, исходный много­ член f ( x ) разлагается в произведение трех различных неприво­ дим ы х над Z 3 многочленов. Воспользовавш ись последней мат­ рицей, находим такж е базис B в V = Ker R : 1000000 , 0210010, 0010101. Д ля дальнейшей работы (деление многочленов с остатком ) ко­ эф ф ициенты этих векторов удобнее переписать в обратном по­ рядке, чтобы старш ие разряды оказались слева: e 1 = 0000001 = 1 , e 2 = 0100120 = x 5 + x 2 + 2 x, e 3 = 1010100 = x 6 + x 4 + x 2 . Найдя базис B = { e i , e 2 , e 3 } в V , переходим к финальной стадии алгоритма. С писок делителей многочлена f вначале по­ лож им состоящ им только из него самого, т. е. S = { f }. Будем вычислять наибольшие общ ие делители f и ei - a для всех a £ Z 3 и всех базисных многочленов ei, начиная со второго. Имеем a = 0 и ( f , e 2) = 1. Но уж е на следующ ем шаге, при a = 1, получаем общий делитель d = ( f , e 2 - 1) = x 2 + x + 2 = 112 , откуда f / d = 100121 и S = { F 1,F 2 }, где F 1(x ) = x 2 + x + 2 , F2 (x ) = x 5 + x 2 + 2 x + 1 — нетривиальный список делителей многочлена f (x). Ч исло делителей |S| пока еще меньше к, по­ этом у продолжаем вычисления. Так как (F i, e 2 - 2) и (F 2 , e 2 - 2) тривиальны, то переходим к следующему, последнему базисному вектору e 3 . Вы числяя наи­ больш ие общ ие делители e 3 - a с очередны м членом списка S,
9.1. Свободные от квадратов многочлены имеем (F 1, e 3) = (F 2, e 3) = 321 1, но (F 2, e 3 — 1) = x 3 + 2x + 1, ^ 2/ ( ^ 2 , e 3 — 1) = x 2 + 1. П осле этого шага список делителей f содерж ит многочлены x 2 + x + 2, x 2 + 1 и x 3 + 2x + 1. Сравни­ вая их количество с найденным ранее числом делителей k = 3, убеж даемся, что получен окончательный ответ: f (x ) = (x 2 + x + 2 )(x 2 + 1 )(x 3 + 2x + 1) или 11210222 = 112 ■ 101 ■ 1021 в векторной записи. Нетрудно проверить, что каждый из найденных множителей неприводим. □ З а м е ч а н и е 9 .1 . С лож ность последней части алгоритма су ­ щественно зависит о т найденного базиса. Базис в свою очередь зависит о т способа решения системы R a = 0 . Так, в нашем при­ мере, как нетрудно убедиться, мы получили e 2 = [1, 2, 2 ]/1,/2,/3 и e 3 = [2, 2 , 1]/1 ,/ 2,/з , где f = 112, f 2 = 101, f 3 = 1021. «К и ­ тайские» векторные представления [1, 2, 2] и [2, 2,1] содерж ат много совпадаю щ их координат и совсем не содерж ат нулей, по­ этом у нами бы ло произведено д остаточн о много вычитаний и делений. При другой последовательности элементарных преоб­ разований стр ок матрицы R мож но бы ло получить, например, базис e^ = [0,1, 2], e^ = [0,1, 0]. В этом базисе уж е первые три шага алгоритма ( f e 2) = f 1, ( f e 2 — 1) = f 2, ( f , e 2 — 2) = f 3 д а д ут полное разложение, и другой базисный вектор даж е не потребуется. Л е м м а 9 .3 . С лож ност ь предлож енного алгоритма разло­ ж ен и я свободного от квадратов многочлена над Z p на неприво­ димые м нож ит ели сост авляет O (n 3 + pk n 2) арифметических операций в поле Z p . Д о к а з а т е л ь с т в о . На первом шаге (см. рис. 9.1) требуется вычислить n —1 остатков по модулю многочлена степени n. Если вычисления проводить независимо делением в столбик, то на это потребуется (n — 1) ■O (n 2) = O (n 3) операций, хотя возмож ны и другие сп особ ы 1). Решение однородной системы с нахождением ^См. [23, 29, 30].
322 Глава 9. Алгоритмы базиса на втором шаге такж е имеет сл ож ность O (n 3), если при­ менить метод Гаусса. Наконец, в худшем случае на последнем шаге мы переберем все k — 1 нетривиальных базисных векторов e s и для каж дого из них все p констант а из поля Z p (рис. 9.2). Д ля каж дой из (k — 1)p таких пар (e s, а) состои тся менее к вы­ числений Н О Д с делителями F (х ), причем ^ deg F (х ) = n. С лож ность этого равна O (n 2), откуда получаем искомое. В ы чис­ лительные эксперименты1) показывают, что в среднем k ~ log n. И з-за перебора констант а £ Z p на третьем шаге алгоритм будет эф ф ективен лишь для сравнительно небольших значений p, т. е. только для небольших полей. Лемма доказана. 9.2. Алгоритм Берлекемпа. Общий случай О сталось выяснить, что делать с несвободным о т квадратов многочленом. В этом разделе мы покажем, как нахождение раз­ ложения многочлена f (х) = f n 1(х) ■. . . ■fknk(х ) (9.7) сводится к нахождению разложения некоторого многочлена, не имеющ его кратных неприводимых множителей. П усть а (х ) | b(x). П од кратн остью делителя а (х ) будем по­ нимать такое натуральное число r, что аг |b и аг+1 f b. Л е м м а 9 .4 . П уст ь h (x ) — неприводимый делитель м ного­ члена f (х ) £ Zp[x], имею щ ий кратность r > 0 в разлож е­ нии (9.7). Тогда кратность h (x ) как делителя Н О Д f (х) и его производной f ' (х) равна r — 1 в случае, когда p f r, и равна r, когда p |r. Д о к а з а т е л ь с т в о . Если r — кратность h как делителя мно­ гочлена f , то f = hr ■g и (g, h) = 1. Тогда f ' = rh r -1 g + hr g' = hr - 1 (rg + h g'), откуда hr-1 |f '. ^См. [16].
9.2. Алгоритм Берлекемпа. Общий случай 323 П е р в ы й с л у ч а й . Если p |r, то rg = 0 и f ' = hrg '. П оэтом у hr делит ( f , f '), а hr+1 не делит ( f , f '), так как не делит f . О т­ метим, что, вообщ е говоря, кратность h как делителя f ' мож ет оказаться больш е его кратности как делителя f . В т о р о й с л у ч а й . Если p \ r, то rg = 0 и h \ rg. П оэтом у h \ (rg + h g '), и, следовательно, hr не делит f ', откуда hr \ ( f , f '). Л емма доказана. П усть A = {г | p делит n i } — множ ества номеров тех непри­ водимых делителей f i ( x ) , кратности к оторы х в разложении (9.7) делятся на p, B = {г 1 p не делит n i } — множ ества номеров тех неприводимых делителей f i (x ) , кратности к оторы х в разлож е­ нии (9.7) не делятся на p. П олож им a (x ) = П Л“ (x ), ieA b(x) = П fini(x ). ieB Т огда f (x) = a (x )b (x ). Так как степени всех неприводимых дели­ телей a (x ) кратны p, то a (x ) = (g (x ))p = g (x p), где g (x ) e Z p[x]. Значит, a '(x ) = 0, откуда f '( x ) = (a (x ) ■b (x ))' = a '(x )b (x ) + a (x )b '(x ) = a (x )b '(x ). Если f '(x ) = 0, то B = 0 и f (x ) = a (x ). В этом случае задача разложения многочлена f (x ) = (g (x ))p сводится к нахождению разложения многочлена g( x) , имеющего меньш ую степень. Если f '( x ) = 0, то из леммы 9.4 следует, что ( f , f ') = (ab, ab') = a(b, b') = a (x ) ■ П / T - 1 (x ). ieB П оэтом у многочлен ( / / / у = П ^ев fi( x ) свободен от квадратов, и к нему мож но применить метод разложения на множители из предыдущ его раздела. Э то позволит найти неприводимые дели­ тели f i( x ) для всех г e B . После этого их кратности ni мож но определить пробными делениями, и в результате мы получим многочлен b(x). По частному a (x ) = f ( x ) /b (x ) легко находит­ ся такой многочлен g( x) , что a (x ) = g (x p). Если g (x ) отличен
324 Глава 9. Алгоритмы о т константы, то, применив к нему и его производной преды­ дущ ие рассуж дения, по индукции получим все неприводимые делители ^ (ж ), i G A. К ратн ость каж дого такого делителя мно­ гочлена g ^ ) умнож им на p и получим его кратность как делите­ ля f (ж). С учетом уж е найденного разложения многочлена Ь(ж) это д аст нам искомое представление (9.7) целиком. Факторизация многочлена (рекурсивный алгоритм Берлекемпа) Вход: f G Z p ^ ] Выход: (S, N ) , гд е S = { f b . . . , f fc} , где Дп1 . f N = { щ , . . . , n fc} , = f 1. S = { f 1, . . . fm } = ДелителиСвобОтКв 2. f o r ( j = 1 ; j ^ m ; j ++ 3. { n? = 1 ; 4. 5. 6. w h ile ( ? +1 |f N = { n 1, . . . , n m} ; ( f / ( f , f ' )) ; ) ) n? ++ ; } S' = 0 ; N' = 0; g = ( f / а п 1 . . . f m m) ) 1/p; 7. i f (deg g > 0) th en 8 . (S ' , N ') = Факторизация многочлена (g) ; 9. r e tu r n (S U S ' , N U p ■N ' ) ; Р и с. 9.3 На рис. 9.3 представлена схема этого рекурсивного алгорит­ ма. Результатом его работы с произвольным многочленом f над Z p будет список S всех неприводимых делителей f и список их кратностей N . Т е о р е м а 9 .2 . Алгорит м Берлекемпа (рис. 9.3) работает корректно и находит полное разлож ение произвольного м но­ гочлена f (ж) G Z p ^ ] на множ ит ели. Д о к а з а т е л ь с т в о . Вначале (строка 1) вычисляется произ­ водная f ', наибольший общий делитель ( f , f ') и частное f / ( f , f ').
9.2. Алгоритм Берлекемпа. Общий случай 325 К свободн ом у о т квадратов многочлену f / ( f , f ' ) применяется описанный выше м етод разложения на множители (см. рис. 9.1). Если f ' = 0, то f / ( f , f /) = 1, S = N = 0 , ш = 0 и м ож но сра­ зу переходить к строке 7 при g (x ) = ( f ( x ) ) 1/p. В строках 2 —4 пробным делением f вы числяю тся кратности его неприводимых делителей. В строке 6 не требуется извлечение корня степени p, так как коэф ф ициенты многочлена g (x ) содерж атся среди к оэф ­ фициентов многочлена а ^ ) = f / ( f ”1 . . . fm™). С трока 8 содер­ ж и т рекурсивный вызов процедуры поиска неприводимых де­ лителей и их кратностей у многочлена g( x) . О тветом являю тся объединения списков делителей и списков кратностей, при этом каж дый элемент списка N ' надо ум нож ить на p. Таким образом, искомое утверж дение следует из корректно­ сти процедуры разложения свободного о т квадратов многочле­ на, т. е. из лемм 9.1 и 9.2. Теорема доказана. З а м е ч а н и е 9 .2 . Лемма 9.3 показывает, что при небольших p алгоритм Берлекемпа полиномиален. Таким образом, кольцо це­ лых чисел и кольцо многочленов над малым конечным полем имею т фундаментальное различие: многочлены мож но сравни­ тельно легко разлагать на множители, в то время как для целых чисел никаких полиномиальных алгоритмов разложения неиз­ вестно до сих пор, хотя детерминированный полиномиальный сп особ проверки п ростоты числа недавно был обнаруж ен11. П р и м е р 9 .2 . Применим рекурсивный алгоритм Берлекемпа к разложению над полем Z 3 многочлена f (x ) = x 17 + 2 x 16 + 2 x 15 + 2 x 14+ + x 12 + 2 x 11 + x 9 + 2 x 7 + x 4 + x 2 + x + 2 = = 1 2 2201201020010112 . Т ак как f '( x ) = 2 x 16 + 2 x 15 + x 13 + x 10 + 2 x 6 + x 3 + 2x + 1 и ( f , f ' ) = 101101101202101 = = x 14 + x 12 + x 11 + x 9 + x 8 + x 6 + 2 x 5 + 2 x 3 + x 2 + 1, 1)См. , например, [9].
Глава 9. Алгоритмы 326 то = 1212 = ж3 + 2ж2 + ж + 2. (/,/О Раскладывая последний (заведомо свободный о т квадратов) мно­ гочлен на неприводимые множители, получаем ж3 +2ж 2 + ж + 2 = = (ж + 2)(ж2 + 1). Найдем кратность ж + 2 и ж2 + 1 как делителей многочлена / . Д ля двучлена ж + 2 = ж — 1 удобно воспользовать­ ся схемой Горнера (в конце очередной строки остаток от деления на этот двучлен выделен ж ирным ш риф том ): 1 2 2 2 0 1 2 0 1 0 2 0 0 1 0 1 1 2 1 1 0 2 1 1 2 1 1 2 2 1 1 1 2 2 0 1 0 1 1 1 0 1 2 1 2 0 2 1 2 0 1 0 2 2 0 1 1 2 2 0 2 0 2 2 1 2 1 1 2 2 1 0 1 1 0 2 2 1 1 0 2 0 2 0 1 0 2 0 1 1 1 0 2 0 1 1 0 0 2 2 0 0 2 Из этой таблицы следует, что искомая кратность равна 4 и что / (ж) (ж + 2 )4 10221102020102 = ж13 + 2ж11 + 2ж10 + ж9 + ж8 + 2ж6 + 2ж4 + ж2 + 2. Делением последнего многочлена на ж2 + 1 убеж даемся, что его кратность равна двум, и получаем многочлен / ( ж) (ж + 2)4(ж2 + 1)2 = 1002000002 = ж9 + 2ж6 + 2. Его производная равна нулю, п оэтом у он является полным ку­ бом: ______ / (ж)______ = (ж3 + 2ж2 + 2 )3 (ж + 2)4(ж2 + 1)2 (ж + + 2) . Разлагая стоящ ее в скобках выражение на множители, получим ж3 + 2ж2 + 2 = (ж + 1)(ж2 + ж + 2). О тсю да окончательно имеем 3 2 / (ж) = (ж2 + 1)2(ж + 1)3(ж2 + ж + 2 )3(ж + 2)4. □
9.3. Логарифмирование. Метод согласования 327 З а м е ч а н и е 9 .3 . Данный пример приведен исключительно для иллюстрации алгоритма разложения на множители. На практике все делители небольшой степени проще находить схе­ мой Горнера и пробным делением на многочлены из таблицы неприводимых многочленов. Минимальная степень, начиная с которой алгоритм Берлекемпа становится выгоднее полного пе­ ребора неприводимых делителей, зависит о т его реализации. Эта тема выходит за рамки данного курса, интересующ ийся вопро­ сами оптимизации читатель найдет все необходимое в энцикло­ педических библиограф иях книг, приведенных в списке литера­ т у р ы 1). 9.3. Логарифмирование. Метод согласования П усть а — примитивный элемент поля F q, q = pn , и в — нену­ левой элемент этого поля. Теорема 8.1 показывает, что уравне­ ние ах = в (9.8) имеет решение при всех таких а, в . Напомним, что минимальное неотрицательное решение уравнения (9.8) называется индексом, или дискретным логарифмом элемента в по основанию а , и об о­ значается loga в . Такой x фактически является вы четом из Z q - i. Задача нахождения loga в называется задачей дискретного ло­ гарифмирования в поле Fq. В полях действительны х и комплексных чисел известны мно­ гочисленные эф ф ективны е сп особы вычисления логариф мов по произвольному основанию, базирующ иеся в основном на методе последовательных приближений (деление отрезка, метод Н ью ­ тона, разложение специальных функций в ряды и т.п.). Они поз­ воляю т вычислить логариф м с лю бой наперед заданной точн о­ стью и небольшим числом операций в поле. В случае конечного поля ситуация принципиально иная. М етод последовательных приближений неприменим в нем из-за отсутстви я аксиомы А р ­ химеда и невозмож ности определить антисимметричное, транх)См. , например, [7, 20, 30].
Глава 9. Алгоритмы 328 зитивное и связное бинарное отношение, согласованное с какойнибудь операцией. Н есмотря на многолетние усилия многих спе­ циалистов, полиномиальные алгоритмы для задачи дискретного логариф мирования д о сих пор неизвестны. Э то привело к ши­ роком у использованию функции в различных криптограф и­ ческих протоколах и схемах. Тем не менее известно немало методов, позволяю щ их най­ ти loga в значительно бы стрее, чем полным перебором. Наи­ более сильные из них, основанные на решете числового поля, имею т субэкспоненциальную слож ность, но требую т глубокой подготовки в области аналитической теории чисел и вы ходят за рамки данного к ур са 1). Здесь мы изложим только два особенно п росты х для реализации метода. Первый алгоритм называется м ет одом согласования. Рас­ см отрим решение x уравнения (9.8) как целое неотрицательное число, меньшее q — 1. П олож им a = [ y/q — 1] и рассм отрим две последовательности элементов поля F q: A = |a ai | 0 ^ i < a j и B = |в ■a - j | 0 ^ j < a j . Л е м м а 9 .5 . М нож ест ва A и B имею т непуст ое пересече­ ние. Д о к а з а т е л ь с т в о . Равенство = в выполнено при неко­ тором x, где 0 ^ x < q — 1. Л ю бое число x из промеж утка 0 ^ x < q — 1, разделив с остатком на a, мож но представить в виде x = ai + j , где 0 ^ i, j < a. Э то следует из того, что a2 = |"^q — 1 2 Из (9.9) имеем (9.9) ^ q — 1. a ai+j = в, откуда ( a a) i = в ® - -7. О тметим, что по теореме о делении целых чисел с остатком представление x ^ ( i , j ) однозначно. Лемма доказана. 1)Обзор таких методов можно найти в [9].
9.3. Логарифмирование. Метод согласования 329 С практической точки зрения положительные степени а удобнее для расчетов, чем отрицательные. П оэтом у о т представ­ ления (9.9) перейдем к представлению х = а^ — j ' с помощ ью биекции i' = i + 1, j ' = а — j . О тсю да ( а “ ^ = ва-7 , а значит и пересечение множ еств A ' = { а “ ^ | 1 ^ i' ^ а } и B ' = { в ■а j/ | 1 ^ j ' ^ а } такж е непусто. Резю мируя сказанное, получаем следующ ий ал­ горитм (см. рис. 9.4). Алгоритм согласования В ход: а , в £ Выход: х £ Z q- 1, гд е а х = в 1. Присвоить а = \л/q — 1 и найти а “ 2 . С оставить таблицу A ' = { (i, а “ ) : 1 ^ i^ а } 3 . О тсортировать A ' по ключу а “ 4 . f o r ( j = 1; j ^ а; j ++ ) i f ( ва-^ = а " ) b rea k ; 5. r e tu r n x = аi — j (m od q — 1 ); Р и с. 9.4 Л е м м а 9 .6 . С лож ност ь мет ода согласования не превосхо­ дит O ( / q log q). Д о к а з а т е л ь с т в о . Таблица A ' шага 2 имеет размер O (^ q ). Все степени а “ элемента а “ мож но последовательно вычислить за а умножений в поле F q, используя равенство а “ ^+1) = а™ ■а “ . П оэтом у общ ая сл ож ность шагов инициализации не превосходит по порядку величины ^fq. На шаге 3 применяется алгоритм бы строй сортировки мас­ сива A ' длины а со сл ож н остью 0 ( а log а). На шаге 4 мы переби­ раем элементы последовательности B ' , проверяя, входит ли оче­ редной элемент в A ' . П оиск элемента в упорядоченном массиве
Глава 9. Алгоритмы 330 длины а требует по порядку не более log a операций (в отли­ чие о т а операций в неупорядоченном). В худшем случае потре­ буется а попы ток, п оэтом у общ ая сл ож ность есть O (a log a) = = O (^fq log q). Ш аг 4 м ож ет бы ть заменен построением и сор ­ тировкой таблицы Б ' с последующ им поиском коллизий в ней и A '. Таким образом, наиболее ресурсоемкими частями метода яв­ ляю тся сортировка и поиск (при использовании медленных ал­ горитм ов сортировки, например пузырьковой сортировки, ме­ тод согласования м ож ет оказаться даж е хуж е полного перебо­ ра). Объем дополнительной памяти, требуемой алгоритму, не превыш ает O (^ q ) элементов поля F q. Лемма доказана. М етод согласования был предложен советским математиком А . О. Гельфондом в 1962 г. В зарубеж ной литературе он более известен как метод Ш енкса. П р и м е р 9 .3 . Рассмотрим поле F 81 = Z 3[x ]/(x 4 + x + 2). К о ­ рень а многочлена f (x) = x 4 + x + 2 является его примитивным элементом. Для элементов поля будем, как обы чно, использо­ вать следующ ие обозначения: а3а3 + а2а 2 + a i a + ao = [a3x3 + a 2x 2 + ai + ao]f (x) = (a 3a.2a.1a 0), где ai £ Z 3 , опуская иногда лишние скобки. Найдем логарифм элемента в = 2 а 2 + 1 = 0201 методом согласования. Имеем a = |"^80 = 9 и а 9 = а 3 + а 2 + а = 1110. Здесь и далее при вычислении степеней применяется модификация би­ нарного алгоритма и тож д ество а 4 = 2 а + 1 = 0021. Составим таблицу A/: а 9 = 1110, а 18 = 1110 ■1110 = 1020 а 27 = 1020 ■1110 = 1210 а 36 = 1210 ■1110 = 2221 а 45 = 2221 ■1110 = 0120
9.3. Логарифмирование. Метод согласования а 54 = 0 120 ■1110 = 0110, а 63 = 0110 ■1110 = 2022, а 72 = 2022 ■1110 = 2101, а 81 = а = 0010. 331 При этом использовались полезные тож дества а 5 = 2 а 2 + а = = 0210 и а 6 = 2 а 3 + а 2 = 2100. П осле лексикографической сортировки по втором у столбцу получаем модифицированную таблицу А ': а9 1110 а 81 0010 а 18 1020 а 54 0110 а 27 1210 5 4 а 0120 а 36 2221 а 18 1020 а 45 0120 а9 1110 4 5 а 0110 а 27 1210 а 63 2022 а 63 2022 а 72 2101 а 72 2101 а 81 0010 а 36 2221 — ^ Перейдем к вычислению элементов последовательности B ' = = { в ■ а-7}. Вначале убеж даемся, что в = 0201 */ А ', поэтом у значение j = а не подходит. При j = 1 получаем в ■а = 0201 х Х0010 = 2010 (/ А '. При j = 2 нас такж е ж д ет неудача, ибо в ■а 2 = ( в а ) а = 2010 ■ 0010 = 0112 </ А '. Далее продолжаем аналогично: в ■а 3 = 0112 ■0010 = 1120 / А ', в ■а 4 = 1120 ■0010 = 1221 / А ', в ■а 5 = 1221 ■0010 = 2201 / А ', в ■а 6 = 2201 ■0010 = 2022 е А '. Получили совпадение: в а 6 = а 63. О тсю да в = а 63-6 = а 57, значит, искомый логариф м loga в = !° ё а (2 а 2 + 1) равен 57. □
Глава 9. Алгоритмы 332 9.4. Метод Полига — Хеллмана — Нечаева Снова рассм отрим уравнение (9.8) в поле Fq. Д опустим, что q — 1 = p kn, где (p, n) = 1. Так как p делит q — 1, то элемент Y = a (q- 1)/p порож дает подгруппу C = C (Р) = { 1 , 7 , 7 2 , . . . , 7p- 1} = (7 ), — м нож ество решений уравнения жр = 1 в поле F q. Если p неве­ лико и элемент ж содерж ится в C , то показатель z G Z p, для которого выполняется ж = Yz, легко м ож ет бы ть найден, на­ пример, с помощ ью перебора или поиска в таблице C . На этом свойстве и основан наш следующ ий алгоритм. Представим решение уравнения (9.8), взятое по модулю p k, в виде ж = loga в = ж0 + ж ^ + . . . + ж ^ ^ - 1 (m od p k), (9.10) где ж^ G Z p. Такое представление однозначно, так как ф актиче­ ски является записью остатка целого числа ж, взятого по моду­ лю p k, в позиционной системе счисления с основанием p. Разряды ж^ представления (9.10) мож но последовательно оп­ ределить, сочетая возведение обеих частей уравнения = в в подходящ ую степень с поиском логариф ма в сравнительно ма­ лой подгруппе C (p ). Д ействительно, заметим, что в силу равенk ства a np = 1 (Q,x)rapfc-1 = a(x°+xi P+...+Xfc_iPfc-1)-rapfc-1 = (0*° )™pfc-1 О тсю да, вспоминая, что = в , получаем уравнение e^pk-1 (a rapk-1 ) x° решение которого жо находим перебором жо = 0 , 1 , . . . , p — 1 или с пом ощ ью таблицы логариф мов группы C (p ) = ( a (q- 1)/p). Далее, ( a x - x° )npk 2 = a x1npk 1, откуда k-2 М ’ a x° у fc- Л x1 = I a np
9-4- Метод Полига — Хеллмана — Нечаева 333 Из последнего уравнения, зная жо, находим ж1, и т .д . Значение ж^+1 находим из уравнения в V pk-i-2 / „pk-1 )X i+1 = а Х0+X1p+...+^;p; , (9.11) которое справедливо в силу того, что в = = a ^0+X1p+...+®ip; •a ^i+1pi+1+...+^k-1pk-1 Наши вычисления ф актически сводятся к пош аговом у нахож ­ дению остатков ж (m od p), ж (m od p 2), . . . , ж (m od pl) дискрет­ ного логариф ма ж. Основная работа при этом заклю чается в де­ лении п ром еж уточн ого числа e / a X0+X1p+...+Xi-1pi на a x;pi, где значение ж^ найдено на предыдущем шаге, с последующ им воз­ ведением результата в степень. На последнем шаге мы узнаем, чему равен оста ток ж (m od p 1). Так как умножение, деление и возведение степень в конечном поле осущ ествляю тся достаточно просто, то алгоритм эфф ективен. П овторив указанные действия со всеми простыми делителя­ ми pi числа q — 1 = p i1 . . . p ^ , получим систем у сравнений ж = z1 (m od p k1 11), (9.12) ж = zr (m od p 1 ) где Zj удовлетворяет сравнению (9.10) при p = p ?, j = 1 , . . . , r. О стается применить к полученной системе ф орм улу (2.21) ки­ тайской теоремы об остатках и получить ж. Схема алгоритма приведена ниже на рис. 9.5. В следующ ей лемме оценим слож ность приведенного алго­ ритма. Л е м м а 9 .7 . Если q — 1 = p 1 . . . p ^ , то число операций в поле F q, которые потратит алгоритм, Полига — Хеллмана —
334 Глава 9. Алгоритмы Нечаева, по порядку не превысит величины r (log q + P j) . j= i Д о к а з а т е л ь с т в о . С лож ность шага 1 очевидно не превосхо­ д и т по порядку ^ r = i (io g q + p j ). На шаге 2 для нахождения очередного разряда числа Zj тре­ буется возвести в степень (вычислить а - х ®р*), умнож ить на про­ м еж уточное значение величины в а -Х ° -Х1Р-'" -Х ®-1 p , снова воз­ вести в степень npk -i-2 и пройти по таблице C (p ). Возведение в степень s < q требует O (log s) = O (log q) умножений и д ол ж ­ но бы ть повторено k раз. П оиск в таблице размера p имеет в среднем сл ож ность O (p) (простой перебор), при специальном упорядочении таблицы сл ож ность м ож ет бы ть еще уменьшена. При фиксированном j имеем всего O (fcj(log q + p j )) операций. На последнем, третьем шаге арифметика поля F q не исполь­ зуется. Для решения системы (9.12) в целых числах достаточн о выполнить O ( r 2) операций. Лемма доказана. Алгоритм Полига—Хеллмана—Нечаева Вход: а , в е Fq , q - 1 = p^1 . . . p k r Выход: x е Z q- 1, гд е а х = в 1. С оставить таблицы логарифмов C ( p j) в подгруппах порядков (q — 1)/ p j , j = 1,...,r. 2. Для каждого j = 1 , . . . , r с помощью C ( p j) найти разряды числа Zj = x (m od p kj), применяя по индукции формулу (9.11). 3. Решить систем у (9.12). Р и с. 9.5
9.4. Метод Полига — Хеллмана — Нечаева 335 З а м е ч а н и е 9 .4 . К недостаткам алгоритма Полига — Х елл­ мана — Нечаева мож но отнести необходимость разложения q — 1 на множители. Однако в случае, когда каж дый простой дели­ тель числа q — 1 не превосходит величины logO(1) q, — такие q иногда назы ваю т гладкими (sm ooth) числами, — слож ность ал­ горитма оказывается полиномиальной по длине записи q. Если ж е q — 1 имеет больш ой простой делитель, то сл ож ность экспо­ ненциальна. Такж е отметим , что алгоритм эф ф ективно распа­ раллеливается. П р и м е р 9 .4 . П роиллюстрируем метод Полига — Хеллмана — Нечаева вычислением того ж е дискретного логарифма, что был ранее получен методом согласования в примере 9.3. Возьмем в = 0201 в поле F 81 = Z 3[x ]/(x 4 + x + 2). Так как |Fg1 1 = 80 = 24 ■5, то нам потребую тся таблицы подгрупп поряд­ ков 2 и 5 в F 81. Они образованы соответственно элементами а 40 и а 16, причем а 40 леж ит в простом подполе. Получаем C ( 2 ) = Z 3 = { 1 , 2 } = {0001, 0002}. Далее находим 7 = а 16 = 2 а 3 + а + 2 = 2012 и элементы цикли­ ческой подгруппы (7 ): C (5) = {1 = 0001, Y = 2012, Y2 = 1202, 7 3 = 0222, 7 4 = 0 2 0 2 }. Рассмотрим простой делитель 2 и вычислим остаток лога­ риф ма x = loga в по модулю 2 4 = 16. Имеем x = (x 3x 2x 1x 0)2 = = 8 x 3 + 4x 2 + 2x 1 + xo, где xi G { 0 , 1 } , и находим младший раз­ ряд x 0 из уравнения в 5-23 = в 40 = а 40х0. Д ля этого вычисляем в 40 = (2 а 2 + 1)40 = 0002, откуда заклю ­ чаем, что x 0 = 1 . Формула (9.11) показывает, что для наших вычислений м о­ ж ет потребоваться деление на величину а ^ * , если xi = 0. П о­ этом у заранее найдем а 1 и несколько первых его квадратов: а4 + а + 2 — 0 1 — а4 + а а 1 — а 3 + 1 — 1001,
Глава 9. Алгоритмы 336 а -2 = 1001 ■1001 = 1101, а -4 = 1101 •1101 = 1112. Теперь из (9.11) при i = 0 получим уравнение для следую ­ щего разряда х 1: Л У " ' 2 = ( в У 2” = (а Т \а, 1. (9.13) ча Жо/ Вычислим в / а = в ' а -1 = 0201 ■ 1001 = 1021, затем ( в / а ) 20 = = 0001. Тогда из (9.13) получаем ( а 40) Х1 = 1, откуда х 1 = 0. Переходим к разряду х 2 , учитывая, что х = х 3 ■23 + х 2 ■22 + 1: в \ 40/22 в \ а хо+2х^ ( в \ 10 в \ _ / 40'\Х2 = ^а ]= Из ( в / а ) 10 = 0001 следует х 2 = 0. Наконец, ( в у 40/ 23 ( - Х 0 е т ) = ( в / а ) 5 = ( а 40) х 3 , откуда х 3 = 1, поскольку ( в / а ) 5 = ( а 3 + 2 а + 1)5 = 0002. И тогом всех этих вычислений является равенство х = (1001)2 = 9 (m od 16). Теперь переходим к п ростом у делителю p = 5. Формула в 24 = (2 а 2 + 1 )16 = а 16^ (mod5) вместе с таблицей C (5) дает х = 2 (m od 5), так как в 16 = 1202 = = Y2. Решая систему х = 9 (m od 16) 1 х = 2 (m od 5) ( ’ находим х = 9 ■5 ■(5 -1 = 9 ■5 ■13 + (m od 16)) + 2 ■16 ■(16-1 (m od 5)) = 2 ■16 ■1= 617 = 57 (m od 80). Таким образом, мы подтвердили полученный ранее ответ. □
9.5. Коды, исправляющее ошибки 337 З а м е ч а н и е 9 .5 . Оба изложенных метода логарифмирования (Гельфонда и Полига — Хеллмана — Нечаева) являю тся универ­ сальными в том смысле, что они применимы не только в муль­ типликативной группе конечного поля, но и вообщ е в лю бой ко­ нечной группе. Идея метода согласования находит еще более широкое применение, например в декодировании линейных ко­ дов, криптоанализе (атака «встречей посередине») и пр. 9.5. Коды, исправляющие ошибки Рассмотрим следую щ ую задачу. По каналу связи из пункта А в пункт В передается информация в виде последовательности слов длины n из символов поля F q. Под воздействием внешних ф ак торов в каж дом передаваемом слове v произвольным обра­ зом м огут измениться не более t символов. Такое изменение сл о­ ва v мож но рассматривать как его покомпонентное сложение со словом с, содерж ащ им не более t ненулевых компонент и назы­ ваемым вектором ошибок. Д ля безош ибочной передачи инф ор­ мации мож но поступить следую щ им образом. Надо ограничить множ ество передаваемых слов так, чтобы лю бые два передавае­ мы х слова Vi и Vj отличались д руг от друга не менее чем в 2t + 1 компонентах. Такое множ ество слов называется кодом длины n с минимальным расстоянием 2t + 1. В этом случае в пункте В для извлечения переданной информации из полученного слова и достаточн о найти кодовое слово, отличающ ееся о т и в мини­ мальном числе компонент. П оиск такого слова называется де­ кодированием. В теории кодирования рассм атриваю тся задачи построения и декодирования кодов. Основная трудн ость с о ст о ­ ит в том, что по ряду причин необходимо использовать коды больш ой длины и с больш им минимальным расстоянием, и по­ этом у для декодирования таких кодов нужен простой алгоритм, сл ож ность которого не превосходит полинома небольшой степе­ ни о т n и t. Очевидно, что сущ ествую т тривиальные алгоритмы построения кода и его декодирования. Для построения кода G с расстоянием 2t + 1 достаточн о начать с одноэлементного кода и последовательно добавлять в него элементы так, чтобы новый
338 Глава 9. Алгоритмы добавляемый элемент отличался о т уж е принадлежащих коду не менее чем в 2t + 1 компонентах. Для декодирования получен­ ного слова имож но последовательным перебором элементов G (или перебором векторов ош ибок с не более чем t ненулевыми компонентами, если их меньше, чем число элементов в G ) найти ближайший к иэлемент кода. Л егко видеть, что оба этих алго­ ритма в общ ем случае имею т экспоненциальную относительно n слож ность. И если с такой сл ож н остью построения кода мож но смириться — один раз перебрать и затем много раз использо­ вать, — то для декодирования это неприемлемо. Э ф ф ективное решение указанных задач, построение и деко­ дирование кодов при больш их длинах и расстояниях, оказалось возмож ны м благодаря использованию алгебраических стр у к ­ т ур — конечных полей и линейных пространств. Далее рассм ат­ риваются алгоритмы построения и декодирования примитив­ ных Б Ч Х -кодов, составляю щ их основу современной алгебраи­ ческой теории кодирования. Эти коды были откры ты в 1959 г. А . Х оквингем ом и независимо о т него в 1960 г. Р. К. Боузом и Д. К. Рой-Ч оудхури. Они предложили п ростую и эф ф ективную конструкцию, позволяю щ ую строи ть коды с различными мини­ мальными расстояниями. Впоследствии эта конструкция была обобщ ена, и построенные на ее основе коды стали называться ко­ дами Боуза — Ч оудхури — Х оквингем а или кратко Б Ч Х -кодам и. П усть ^ п — линейное n -мерное пространство над полем Fq из q элементов. Расстоянием, Х ем м инга d (x , у ) м еж ду векторами x и у из ^ п называется число компонент, в которы х эти векто­ ры не совпадают. В есом ||х|| вектора x из называется число ненулевых координат этого вектора. Нетрудно видеть, что d (x , у ) = llx — у (9.14) П одмнож ество G = { g i , . . . , g m} множ ества векторов из FJ^ называется q-ичным кодом длины n с м инимальным расст оя­ нием d, если для лю бы х двух его элементов gi и g? расстояние Хемминга м еж ду ними не меньше d и найдутся два элемента, расстояние м еж ду которыми равно d. М нож ество = {с £ G FJ^ | ||с|| ^ t } называется множ еством ош ибок веса не более t,
9.5. Коды, исправляющие ошибки 339 а его элементы — векторами ош ибок или ошибками. Ненулевые компоненты вектора с из C t указы ваю т положение ош ибок, а их величины называются значениями ошибок. Будем говорить, что код G исправляет t независимых ошибок, если для суммы v = = g + с л ю бого g G G и л ю бого с G C t d(v, g ) < d (v , g i) для всех g i G G, таких, что g i = g. Л егко видеть, что код G исправляет t ош ибок тогда и только тогда, когда его минимальное расстояние d не меньше 2t + 1. Если v = g + с и вес с равен k, то будем говорить, что в векторе g произош ло k ош ибок. Отображ ение D : v = g + с ^ g называется декодированием кода G, или исправлением ош ибок в векторе v. К од G называется линейным (n, k )-кодом, если он является k-мерным подпространством в F^. Т е о р е м а 9 .3 . В каж дом линейном коде G м инимальное рас­ ст ояние d равно м инимальном у весу его ненулевого элемента: d = min ||g||. g=0,g€G Д о к а з а т е л ь с т в о . Так как нулевой набор всегда принадле­ ж и т линейному коду, то очевидно, что минимальное расстояние не превосходит веса минимального ненулевого элемента. Д оп у­ стим, что d < min |g| . В этом случае в G найдутся два элемента g 1 и g 2, расстояние м еж ду которыми меньше d. Следовательно, I|g1 — g 2 || = d(g1, g2) < d. С другой стороны , разность g 1 — g 2 обязательно принадлежит G. П оэтом у ||g1 — g 2 1 ^ d. Пришли к противоречию . Теорема доказана. П ространство многочленов степени не выше n — 1 над полем F q изом орф но п ространству F^. Задающее такой изоморфизм отображ ение ф ставит в соответстви е многочлену v вектор его коэф ф ициентов v. Э тот изоморф изм позволяет при конструи­ ровании кодов использовать развитую теорию многочленов над конечными полями. К од G называется полиномиальным кодом
340 Глава 9. Алгоритмы длины n с порож дающ им многочленом h (x ), если м нож ество многочленов, соответствую щ и х элементам кода G, состои т из всех тех многочленов степени не выше n — 1, каждый из ко­ торы х без остатка делится на многочлен h (x ). Такими кодами являю тся рассматриваемые ниже примитивные коды Боуза — Ч оудхури — Хоквингема. П усть n = qm — 1, а — примитивный элемент поля G F (q m), h (x ) — наименьшее общее кратное минимальных многочленов элементов а, а 2, . . . , а 2* поля G F (q m). Примитивным Б Ч Х -кодом G длины n с конструктивным расстоянием 2t + 1 и порож да­ ющим многочленом h (x ) будем называть идеал h (x )F q[x ]/(x n —1) кольца F q [x ]/(x n — 1). Т е о р е м а 9 .4 . М инимальное расстояние примитивного Б Ч Х кода не м ен ьш е его конструктивного расстояния. Д о к а з а т е л ь с т в о . П усть G — примитивный Б Ч Х -к од дли­ ны n = qm — 1 с конструктивны м расстоянием 2t + 1, h (x ) — его порож дающ ий многочлен. Для доказательства теоремы д оста­ точн о показать, что никакой многочлен из F q[x ]/(x n — 1) с не более чем 2t ненулевыми коэффициентами не делится на h (x ). Д опустим , что утверж дение теоремы не верно, и такой много­ член g (x ) = h (x )g (x ) = 5^2=i g jx ij существует. Тогда среди его корней будут элементы а , а 2, . . . , а 2*, и, следовательно, имеет место система уравнений g*1 а*1 + g *1 ( а 2)*1 + g*2 а*2 + . . . g *2 ( а 2)*2 + . . . + + gi2t а*24 g*2t ( а 2)*24 g *1 ( а 2*)*1 + g *2 ( а 2*)*2 + . . . + g*2t ( а 2*)*24 которая в матричной записи выглядит следую щ им образом : ( а*1 а*г2 \ а‘1 г•2* а .*2 а*' а*24 \ а *2Г2 а*2^2* а •2*у /g * A g*2 \g*2t У 0 0 0. (9.15)
341 9.5. Коды, исправляющие ошибки Т ак как det / а*1 а*1'2 а*2 а^2 ... ... а*2* \ а*2г2 = уагг2* а ^ 2* ... а *24-2у 1 1 а*1 = а*1а*2 ■■■а*2*det а*2 . . . . . 1 \ а*2* = 0, уагг(2*--1) а М 2*- 1) . . а*2^ 2*- 1)/ то в силу леммы 5.5 матрица в (9.15) невырож дена и, следова­ тельно, это уравнение не имеет ненулевых решений. П ротиворе­ чие. Теорема доказана. П р и м е р 9 .5 . Найдем порож дающ ий многочлен h (x ) трои ч­ ного примитивного Б Ч Х -к од а длины 26, исправляющ его три ошибки. В качестве поля из 27 элементов возьмем построенное в примере 8.10 поле 2 э[а ], где а — корень примитивного много­ члена x 3 + 2x + 1. Напомним, что в этом поле степени а выглядят следую щ им образом : а0 = а1 = а2 = а3 = а4 = а5 = а6 = (001), (010), (100), (012), (120), (212), (111), а 7 = (122), а 8 = (202), а9 = а 10 = а 11 = а 12 = а 13 = (011), (110), (112), (102), (002), а 14 а 15 а 16 а 17 а 18 а 19 а 20 = (020), = (200), = (021), = (210), = (121), а 21 а 22 а 23 = (101), = (022), = (220), а 24 = (221), а 25 = (201). = (222), = (211), (9.16) Т ак как x 3 + 2x + 1 является минимальным многочленом для 3 2 6 а и а 3, а минимальные многочлены а 2 и а 6 совпадают, то для нахождения h (x ) надо найти минимальные многочлены элемен­ тов а 2, а 4 и а 5. И спользуя равенства (9.16), последовательно находим эти многочлены:
342 Глава 9. Алгоритмы m a 2 (ж) = (ж — а 2)(ж — а 6)(ж — а 18) = = ж3 — ( а 2 + а 6 + а 18)ж2 + ( а 8 + а 20 + а 24)ж — а 26 = = ж3 — 2ж2 + ж — 1 = ж3 + ж2 + ж + 2; т а4 (ж) = (ж — а 4)(ж — а 12)(ж — а 10) = = ж3 — ( а 4 + а 10 + а 12)ж2 + ( а 14 + а 16 + а 22)ж — а 26 = = ж3 — 2ж2 — 1 = ж3 + ж2 + 2; ш аб (ж) = (ж — а 5)(ж — а 15)(ж — а 19) = = ж3 — ( а 5 + а 15 + а 19)ж2 + ( а 20 + а 24 + а 28)ж — а 13 = = ж3 — ж2 + ж — 2 = ж3 + 2ж2 + ж + 1. У множ ая ж3 + 2ж + 1 на найденные минимальные многочлены ж3 + ж2+ ж + 2 , ж3+ ж 2+ 2 и ж3+ 2 ж 2+ж + 1, находим порож дающ ий многочлен Л,(ж) = ж12 + ж11 + 2ж6 + ж3 + 2ж2 + 2ж + 1 (9.17) трои чн ого примитивного Б Ч Х -кода длины 26, исправляющ его три ошибки. □ П остроим алгоритм исправления ош ибок в примитивных Б Ч Х -кодах. Для этого найдем вектор ош ибок с, если известна сум м а v = g + с. П реж де всего заметим, что так как $(а*) = 0 для 1 ^ i ^ 2t, то ■и(аг) = д(а*) + с(а*) = с(а*), и, следовательно, значение многочлена v на а* зависит только о т многочлена ош ибок с. Для 1 ^ i ^ 2t положим v ^ * ) = S*. Н абор S = (S 1, S 2 , . . . , S 2t) называется синдромом многочлена v (или синдром ом вектора v ). Д опустим, что многочлен ош ибок с содерж ит ровно r ^ t ненулевых слагаемых и равен ^ [=1 с^.ж-74. Для i = 1 , . . . , r введем локаторы ошибок X* = а 74, при этом величину c7i ошибки, со о т ­ ветствую щ ей локатору X * , обозначим через Y*. Н етрудно видеть, что первые r компонент синдрома S многочлена v вы раж аю тся
9.5. Коды, исправляющие ошибки 343 через локаторы и величины ош ибок следующ им образом: /X х 2 X2 X 22 х д X 2 / У 1Х 1 + ••• + Yr Х Д У 1X 2 + ••• + Yr X r2 /S A S2 \ S rJ (9.18) К ак и в (9.15), матрица в левой части равенства (9.18) невырож ­ дена. П оэтом у если известны локаторы ош ибок X j, то величины \х хг • x ;/ /УЛ Y2 \ y j VY x r + ••• + У x ; / ош ибок У м ож но найти из (9.18). Для нахождения локаторов ош ибок воспользуемся м ногочле­ ном локаторов ошибок Л ( ж) = (1 — ж Х 1)(1 — ж Х 2) . . . (1 — x X r) = = Л ; Ж; + Л ; —1Ж; 1 + ••• + Л 1Ж+ 1. Если многочлен Л ( ж) известен, то, вычислив его корни, м ож ­ но определить позиции ош ибок. Так как переменная ж мож ет принимать не более чем n различных значений, то корни Л ( ж) м ож но найти, последовательно вычисляя значения Л(Ж) на всех элементах поля G F (q m). Для этого достаточн о выполнить в об­ щей слож ности O (tn ) действий над элементами поля G F (qm). Сначала для каж дого i = 1 , . . . , r и каж дого j = 1 , . . . , r умнож им многочлен локаторов ош ибок на произведение y x ; + j и подставим вместо переменной ж его корень X - 1 . В результате получим систем у равенств Л ;Y jX j + Л ;-1 У гХ / +1 + ••• + Л1УгХ [ + -1 + Y X [ + j = О, (9.19) где i = 1 , . . . , r и j = 1 , . . . , r. С уммируя при фиксированном j равенства из (9.19) по всем i о т 1 д о r, получим, что для каж дого j = 1,...,r ^ ( Л г Y jX j + Лг- 1УгХ ^ +1 + ••• + Y jX ;+ j ) i=1 Л ; ^ УгХ / + Л ;-1 ^ УгХ / + 1 + ••• + ^ У Х i=1 i=1 i=1 О
344 Глава 9. Алгоритмы Т ак как суммы , умнож аемые в последнем равенстве на коэф ф и ­ циенты Л^ являю тся компонентами синдрома, то ЛгSj + Лг — 1S j +1 + ■■■+ Л lS r + j — 1 + Sr+j = 0, j = 1 , . . . , r. (9.20) Из равенств (9.20) составим систем у уравнений относительно коэф ф ициентов Л^ В матричной ф орм е эта система имеет сле­ дую щ ий вид: 51 S2 Sr 52 S3 Sr + 1 Sr + 1 S 2 r -1 / \Sr Mr \ \ / —Sr+ Л —Sr+2 Л-r—1 (9.21) \ Л 1 / \ —S2r ) П усть Sr — матрица из (9.21) и r ^ l ^ t. Покажем, что матрица Si невырождена, если l = r, и вырож дена, если l > r. Для того чтобы убедиться в этом, достаточн о представить матрицу виде произведения 51 S2 Si 52 S3 Si+1 \S| Sji+1 . Si в \ S 2I - 1/ / Y 1X 1 Y2X 2 Y 1X? \Y 1X 1 A Y2X 22 YX \ YX2 Y2X 2 Y X / \1 1 X1 x j -1 \ X2 x Xi X 1-1 - 1/ в котором левый множ итель такж е мож но представить в виде произведения / Y 1X 1 Y 1X 2 Y2X 2 Y2X 22 VY1X1 Y2X2 / 1 X1 Y ХЛ Y lX l2 YlXll . 1 ... 1 \ / Y 1X 1 0 X2 ... Xl 0 Y2X 2 X 1-1 X 2-1 X l -1 0 0 00...YlX l
9.5. Коды, исправляюши-е ошибки Таким образом, видим, что матрица 345 Si является произведением трех квадратны х матриц, две из которы х невырож дены тогда и только тогда, когда различны все X i, а третья — диагональ­ ная матрица, невырож дена тогда и только тогда, когда все X i и Y отличны от нуля1). Следовательно, матрица Si невырождена тогда и только тогда, когда все X i различны и все Yi отличны о т нуля, т. е. когда l = r. Теперь мож но сф орм улировать алгоритм декодирования при­ митивного Б Ч Х -кода. П усть Б Ч Х -к од длины n = qm — 1 исправ­ ляет t ош ибок. Тогда для декодирования вектора v выполняем следующ ие действия. 1. Вычисляя значения v ^ ) , v ^ 2) , . . . , v ^ 2*), находим компо­ ненты синдрома $ 1, $ 2 , . . . , $2* и полагаем r = t. 2. Составляем матрицу „ Sr /$ 1 $2 _ $2 ... $3. . . Sr+1 V$r $r+1 ... \ $ 2 r -1/ и определяем, вырож дена эта матрица или нет. 3. Если матрица Sr вырож дена, то уменьшаем r на единицу и возвращаемся к п. 2. Если матрица Sr невырождена, то опре­ деляем, что число ош ибок равно r, и переходим к следующ ему пункту. 4. Решая матричное уравнение ($ $2 $2 $3 \5r $ r+1 ... ... $ \ $ r+1 ( Лг \ Лгr— _ 1 $2 r - 1/ \ Л1 / ( —Я + Д r+2 \ —$2 r / находим коэф ф ициенты Лi многочлена локаторов ош ибок. 5. П оследовательно вычисляя на всех элементах поля G F (q m) значения многочлена Л (x) = Лг x r + Л ^ ^ - 1 + ■■■+ Л ^ + 1, 1)Для выполнения при t ^ l > r указанных матричных равенств поло­ жим Y = 0 при r < i ^ t, а индексы позиций фиктивных ошибок j для r < i ^ t выберем произвольными.
Глава 9. Алгоритмы 346 находим его корни ж1, . . . , ж; , обращ ая которые, находим лока- х ; ••• х ;/ \yJ \ s rJ находим величины ош ибок Y 1, . . . , Y . 7. П усть, как и ранее, е? — j -й базисный вектор стандартного базиса. В ы числяя разность r i=1 находим кодовый вектор g. Приведенный алгоритм декодирования называется алгорит­ мом Питерсона — Горенстейна — Цирлера. Нетрудно видеть, что для реализации этого алгоритма достаточн о выполнить O (t4 + nt) действий над элементами поля G F (q m). П р и м е р 9 .6 . Рассмотрим работу алгоритма на примере ис­ правления ош ибок в векторе v = (01222222222222222222222222) троичны м Б Ч Х -к од ом длины 26 с построенным в предыдущем примере порож даю щ им многочленом (9.17). 1. В ы числяя при помощи (9.16) значения многочлена ^(ж) = ж24 + 2ж23 + 2ж22 +-+ 2ж2 + 2ж + 2 2 4 5 на элементах а, а 2, а 4 и а 5, найдем первую, вторую , четвертую и пятую компоненты синдром а:
9.5. Коды, исправляющие ошибки 347 Далее находим S 3 = ( S i ) 3 = а 3 и S 6 = (S 2) 3 = а 24. 2—3. П олож им r = 3. Так как а S3 S4 S5 , det | а 8 а3 а 14 а8 а3 а3 а 25 5 2 а det Si S2 | S2 S3 .S 3 S 4 а 10 + а 10 + а 10 — а 9 0 24 то заключаем, что произош ло не более двух ош ибок. Полож им r = 2. Так как Si det S2 U J s = det а а а8 а ( = а 4 — а 16 = 0 то заключаем, что произош ло две ошибки. 4. Найдем коэф ф ициенты многочлена локаторов ош ибок. Д ля этого решим матричное уравнение 51 S2 52 S3 Л2 Л1 —S3 —S4 преобразуя левую часть расширенной матрицы уравнения в еди­ ничную. Так как —а а 25 I 0 а а8 а а а 16 12 а а 15 а 21 а 4 0 2 а а I а7 а а 0 а3 а 21 — а 7 а 4 а 15 а 7 а 15 I 0 а 15 а I I I ~ (о ~ (о аю о а а а8 а 0 I то Л2 = а 23 и Л 1 = а 20. 5. Вычисляя значения многочлена Л(ж) = а 23ж2 + а 20ж + I на всех ненулевых элементах поля 2^[а], найдем его корни Ж1 = а и Ж2 = а 2. Обращая корни, находим локаторы ош ибок = = а 25 и X 2 = а 24, которы е, очевидно, соответств у ю т двум левым позициям.
Глава 9. Алгоритмы 348 6. Для определения значений ош ибок Yi и Y2 решим матрич- Л 'X i х2 ное уравнение х х 22 25 1 24 а 1 а а 25 а 1 0 1 ю 2 2 3 3 4 2 ю2 0 1 У . Так как (£ S2 Y2 а а 10 а а 10 - а 2 /1 а 13у ~ 10 )~ 0 а2 1 1 а 25 а 24 0 а 14 а , а 12И 1 ) ~ \0 то Yi = 1 и Y2 = 2. Следовательно, в векторе ош ибок с последние 24 компоненты равны нулю, первая компонента равна двум, а вторая — единице. 7. Вычитая из полученного вектора v найденный вектор ош ибок с : v - с = (01222222222222222222222222)­ - (12000000000000000000000000) = = (22222222222222222222222222), находим искомый элемент кода g, у которого каж дая компонен­ та равна 2. □ Задачи 9.1. Показать, что если Fq — конечное поле нечетной характиристики, то элемент а G F* имеет в Fq квадратный корень в, т. е. такой элемент, что в 2 = а, тогда и только тогда, когда а (з-1)/2 = 1. Как можно его вычислить? 9.2. Доказать, что а = 2 является примитивным элементом по­ ля Z 101 и найти логарифм вычета 59 по основанию а. 9.3. Найти логарифм элемента а 3 + а 2 + 1 по основанию прими­ тивного элемента а поля Fsi = F3 [x]/(x4 + x + 2)из примера 9.3. 9.4. Решить уравнение 2х = 195 (mod 192). 9.5. Решить уравнение 3х = 132 (mod 257).
Задачи 349 9.6. Пусть q — 1 = p kl . . . p kr. Построить алгоритм, решающий задачу дискретного логарифмирования в поле Fq, число операций ко­ торого по порядку не превосходит У~]Г=1 kj (log q + ^ p j log 2 p j ). 9.7. Многочлены x 8 + x 6 + x 4 + x 3 + 1 и x 12 + x 7 + x 5 + x 4 + x 3 + x 2+ + 1 разложить на неприводимые множители над полем Z 2 с помощью алгоритма Берлекемпа. 9.8. Доказать неприводимость над Z 3 многочлена x 3 + 2x 2 + x + 1 с помощью алгоритма Берлекемпа. 9.9. Доказать, что число /-разлагающих многочленов в опреде­ ленном на с. 311 пространстве V равно p k — (p — 1)k — 1. Получить отсюда, что взятая наугад линейная комбинация векторов базиса B в V будет / -разлагающей с вероятностью не менее 1/p. 9.10. Пусть многочлен / G Zp [x] свободен от квадратов и g(x) G G Zp[ x ] / / , причем degg ^ 1. Пусть gp = g (mod / ) . Доказать, что / (x ) = П (/ ( x ) , g ( x ) — ^ причем правая часть этого равенства является нетривиальным раз­ ложением / (x) на взаимно простые множители. Останется ли верным это утверждение, если / не свободен от квадратов? 9.11. Пусть / = /1 ■■■ / — свободный от квадратов многочлен степени n над полем Zp, множители / неприводимы и щ = deg /j. Положим M = НОК(щ1, ... , n k) и T (x) = x + x p + x p2 + ... + xpM. Пусть Tj(x) = T (x j ) (mod / (x)). Показать, что по крайней мере один из многочленов T i ( x ) , ... ,T n - i(x ) является /-разлагающим. 9.12. Пусть G — линейный (n, к)-код. Матрица из n — k строк и n столбцов называется проверочной матрицей кода G, если ее строки образуют базис ортогонального пространства кода G. Показать, что матрица H будет проверочной матрицей линейного кода с минималь­ ным расстоянием не меньшим d тогда и только тогда, когда ее любые d — 1 столбцов линейно независимы. 9.13. Написать проверочную матрицу двоичного БЧХ-кода длины 15, исправляющего две ошибки. 9.14. Найти порождающий многочлен и размерность двоичного БЧХ-кода длины 15, исправляющего три ошибки. 9.15. Пусть qm —1 = ab, а — порождающий элемент поля G F(qm). Показать, что минимальное расстояние полиномиального кода длины b, порожденного многочленом HOK(mao (x), ma2o ( x ) , . . . , ma2to (x)), не меньше, чем 2t + 1 .
350 Глава 9. Алгоритмы 9.16. Код G называется циклическим, если вместе с каждым сво­ им элементом (gi, д2, дз, . . . , gn) код G содержит и его циклический сдвиг (д2,дз, . . . , g n,gi). Показать, что любой примитивный БЧХкод — циклический. 9.17. Найти порождающий многочлен двоичного (21,11)-кода, ис­ правляющего две ошибки. 9.18. Показать, что существует исправляющий шесть ошибок дво­ ичный полиномиальный (80,40)-код. Для этого кода описать алго­ ритм построения порождающего многочлена и алгоритм исправления ошибок. 9.19. При передаче по каналу с помехами кодового слова дво­ ичного кода БЧХ длины 15 с корнями в поле Z 2[ж]/(ж4 + ж3 + 1), исправляющего три ошибки, получено слово v = (011000000111101). Декодировать его. 9.20. Пусть G — примитивный двоичный БЧХ-код. Доказать, что если g G G, то и g G G, где вектор g отличается от g во всех разрядах. 9.21. Привести пример примитивного двоичного кода БЧХ, ис­ тинное минимальное расстояние которого строго больше конструк­ тивного. 9.22. Пусть V (g) = g + Ct. Показать, что множества V (g) и V (g') не пересекаются при различных g, g ' G G, если G — примитивный двоичный код БЧХ длины n = 2m — 1, иправляющий одну (t = 1) ошибку. Показать, что У geG V (g) = Z 2 - i . 9.23. Найти максимальное n, для которого существует двоичный линейный код длины n, исправляющий одну ошибку, проверочная матрица которого содержит ровно три строки. 9.24. Пусть G — линейный (n, к)-код. Матрица A = A k Xn назы­ вается его порождающей матрицей, если ее строки образуют базис в G. Найти число различных порождающих матриц (n, к)-кода. 9.25. Показать, что у всякого линейного (n, к)-кода найдется си­ стематическая порождающая матрица. Используя это, доказать, что для любого (n, к)-кода с минимальным расстоянием d выполнено нера­ венство d ^ n — k + 1, называемое неравенством Синглтона.
Литература 1. Абрамов С. А. Лекции о слож ности алгоритмов. М ос­ ква: М Ц Н М О , 2009. 256 с. 2. Айерлэнд К ., Р оузен М. Классическое введение в современ­ ную теорию чисел. М осква: Мир, 1987. 416 с. 3. Андерсон Д ж . А. Д искретная математика и комбинаторика. М осква: Вильямс, 2004. 960 с. 4. Алексеев В. Б. Теорема Абеля в задачах и решениях. М ос­ ква: М Ц Н М О, 2001. 192 с. 5. А х о А ., Хопкрофт Д ж ., Ульман Д ж . П остроение и анализ вычислительных алгоритмов. М осква: Мир, 1979. 536 с. 6. Берлекэмп Э. А лгебраическая теория кодирования. М ос­ ква: Мир, 1971. 479 с. 7. Болотов А . А ., Гашков С .Б., Фролов A. Б., Часовских А. А. Элементарное введение в эллиптическую криптограф ию . Алгебраические и алгоритмические основы . М осква: К ом книга, 2011. 328 с. 8. Б лейхут Р. Теория и практика кодов, контролирую щ их ошибки. М осква: Мир, 1986. 576 с. 9. Василенко О. Н. Теоретико-числовы е алгоритмы в крипто­ графии. М осква: М Ц Н М О, 2003. 328 с. 10. Винберг Э. Б. Начала алгебры. М осква: М Ц Н М О , 1998. 192 с. 11. Винберг Э. Б. К урс алгебры. М осква: Факториал, 2002. 544 с. 12. Виноградов И. М. О сновы теории чисел. М осква — Ижевск: НИЦ «Регулярная и хаотическая динамика», 2003. 176 с.
Литература 352 13. Гашков С. Б. Современная элементарная алгебра в задачах и решениях. М осква: М Ц Н М О, 2006. 328 с. 14. Гельфанд И. М. Лекции по линейной алгебре. М осква: М Ц Н М О , 1998. 320 с. 15. Зорич В. А . М атематический анализ. Т. 1. М осква: М Ц Н М О, 2002. 664 с. 16. К нут Д . И скусство программирования. Т. 2. М осква: Ви­ льямс, 2001. 788 с. 17. Коблиц Н. К урс теории ква: Т В П , 2001. 254 с. чисел и криптографии. М ос­ 18. Кост рикин А. И. Введение в алгебру. Ч. 3. Основные стр у к ­ туры алгебры. М осква: Физматлит, 2001. 272 с. 19. С борник задач по алгебре: учеб. пособие под ред. А . И. К острикина. М осква: Факториал, 1995. 454 с. 20. Лидл Р., Нидеррайтер Г. Конечные поля. М осква: Мир, 1988. 822 с. 21. М ендельсон Э. Введение в матем атическую логику. М ос­ ква: Наука, 1984. 320 с. 22. Нечаев В. И. Элементы криптографии (основы теории защи­ ты информации). М осква: Высш ая школа, 1999. 109 с. 23. Ноден П., Кит т е К. Алгебраическая алгоритмика. М ос­ ква: Мир, 1999. 720 с. 24. Пит ерсон У., Уэлдон Э. К оды , М осква: Мир, 1976. 594 с. исправляющие ошибки. 25. Проскуряков И. В. С борник задач по линейной алгебре. М осква: Л аборатория базовы х знаний, 2003. 384 с. 26. Фаддеев Д . К. Лекции по алгебре. М осква: Наука, 1984. 416 с. 27. Фрид Э. Элементарное введение в абстрактную алгебру. М осква: Мир, 1979. 261 с. 28. Чашкин А. В. Д искретная математика. М осква: Академия, 2012. 352 с. 29. Cohen H. A course in com putational algebraic number theory. Berlin: Springer-Verlag, 1993. 534 p. 30. von zur Gathen J., Gerhard J. M odern com puter algebra. 3rd ed. Cambridge University Press, 2013. 808 p.
Литература 353 31. Shoup V. New algorithms for finding irreducible polynomials over finite fields / / Math. Com p. 54, 1990, pp. 435-447. 32. Shoup V. Fast construction o f irreducible polynom ials over finite fields / / J. Sym bolic Com put. 17, 1994, pp. 371-391.
П р и л ож ен и е A . П р и м и ти вн ы е эл ем ен ты поля Таблица первых 195 п росты х чисел. Во втором столбце перечис­ лены просты е числа р, в третьем — минимальные примитивные корни а т 1П из Zp. а n 31 32 Pn 127 131 3 2 33 34 137 139 35 36 n a 61 62 Pn 283 293 3 2 63 64 307 311 5 17 149 151 2 65 66 313 317 10 2 37 38 39 157 163 167 5 2 67 68 69 331 337 347 3 10 2 40 41 173 179 349 353 2 42 181 191 70 71 72 19 359 367 45 193 197 5 2 46 47 199 211 48 49 50 51 52 43 44 53 54 6 5 2 2 2 3 2 3 75 373 379 7 6 2 2 3 2 76 77 383 389 5 2 223 227 229 3 2 6 78 79 80 397 401 409 5 3 21 233 239 241 3 7 81 82 419 421 2 2 7 6 83 84 431 433 7 5 3 5 2 85 86 439 443 15 2 6 87 88 449 457 5 3 89 90 461 463 3 13 2 251 55 56 257 263 57 58 269 271 59 60 277 281 73 74 3
Приложение A. Примитивные элементы поля Z p а n а n 126 127 Pn 701 709 2 13 2 2 487 491 3 2 128 129 719 727 11 95 96 499 503 7 5 2 130 131 132 97 98 509 521 99 100 101 102 523 541 133 134 547 3 2 2 2 135 136 757 761 769 6 11 557 563 2 2 137 138 773 787 2 2 105 569 571 3 3 797 809 106 107 577 587 5 2 139 140 141 142 108 109 593 599 3 7 110 111 112 601 607 613 113 114 355 а 161 162 Pn 947 953 5 163 164 967 971 5 6 733 739 6 3 165 166 977 983 3 5 743 751 5 3 2 167 168 991 997 169 170 171 172 1009 1013 1019 1021 6 7 11 1031 2 173 174 10 14 3 175 1033 1039 5 3 811 821 3 2 176 177 1049 1051 143 144 823 827 3 2 178 179 1061 1063 3 7 2 7 3 2 145 146 147 829 839 853 2 11 2 180 181 182 1069 1087 1091 6 3 2 617 619 3 2 148 149 857 859 3 2 183 184 1093 1097 5 3 115 116 631 641 5 2 185 186 1103 1109 5 2 643 647 150 151 152 863 877 117 118 3 3 11 3 2 187 188 1117 1123 2 2 653 659 153 154 881 883 119 120 121 122 5 2 2 887 907 5 2 189 190 1129 1151 11 155 661 673 677 2 5 2 156 157 158 911 919 929 17 7 3 191 192 1153 1163 1171 5 5 2 683 691 5 3 159 160 937 941 5 2 1181 1187 7 2 n 91 92 Pn 467 479 93 94 103 104 123 124 125 193 194 195 2 3 3 2 3 17
П ри л ож ен и е B . Р азл ож ен и е на п р осты е м н ож и тел и чи сел ви да p n — 1 22 — 1 23 — 1 = 3 = 7 24 — 1 25 — 1 = 15 = 31 26 - 1 27 — 1 = 28 — 1 29 — 1 2 10 — 1 2 11 — 1 2 12 — 1 2 13 — 1 2 14 — 1 2 15 — 1 2 16 — 1 2 17 — 1 2 18 — 1 = = = = = 3 ■5 63 127 = 32 ■7 255 = 3 ■5 ■17 511 1023 2047 = = 7 ■73 3 ■11 ■31 = = 23 ■89 32 ■5 ■7 ■13 4095 8191 = = 16383 32767 = = 3 ■43 ■127 7 ■31 ■151 = = 65535 131071 262143 524287 = 3 ■5 ■17 ■257 = 33 ■7 ■19 ■73 1048575 2097151 4194303 = = 3 ■52 ■11 ■31 ■41 72 ■127■337 3 ■23 ■89 ■683 47■178481 32 ■5 ■7 ■13 ■17 ■241 = = = = = 8388607 16777215 = = = = = 33554431 67108863 = = 31 ■601 ■1801 3 ■2731 ■8191 to = = = = 134217727 268435455 = = 7 ■73 ■262657 3 ■5 ■29 ■43 ■113 ■127 toсо 2 19 — 1 220 — 1 221 — 1 222 — 1 223 — 1 = = = = = 536870911 1073741823 = = 233 ■1103 ■2089 32 ■7 ■11 ■31 ■151 ■331 = = 2147483647 4294967295 = 3 ■5 ■17 ■257 ■65537 = = = 8589934591 17179869183 34359738367 = = = 7 ■23 ■89 ■599479 3 ■131071■43691 31 •71 •127 •122921 4 2 2 —1 225 — 1 ю 00 6 2 2 —1 227 — 1 О —1 229 — 1 —1 231 — 1 toсо toсо со 2 3 2 235 —1 —1 —1 — 1
Приложение B. Разложение на простые pn — 1 357 236 — 1 237 — 1 68719476735 137438953471 33 ■5 ■7 ■13 ■19 ■37 ■73 ■109 223 ■616318177 238 — 1 239 — 1 274877906943 549755813887 3 ■174763■524287 7 ■79 ■121369 ■8191 240 — 1 241 — 1 242 — 1 1099511627775 2199023255551 3 ■52 ■11 ■17 ■31 ■41 ■61681 164511353 ■13367 4398046511103 8796093022207 32 ■72 ■43 ■127 ■337 ■5419 431 ■2099863 ■9719 243 — 1 244 — 1 245 — 1 246 — 1 247 1 17592186044415 35184372088831 3 ■5 ■23 ■89 ■397 ■683 ■2113 7 ■31 ■73 ■151 ■631 ■23311 70368744177663 140737...355327 3 ■47■178481■2796203 2351 4513 13264529 32 — 1 33 — 1 8 26 34 — 1 35 — 1 80 242 36 — 1 37 — 1 728 2186 38 — 1 6560 19682 39 — 1 3 10— 1 3 11 — 1 3 12— 1 3 13 — 1 3 14 — 1 3 15 — 1 3 16 — 1 3 17— 1 3 18— 1 3 19 — 1 320 — 1 321 — 1 322 — 1 323 — 1 324 — 1 325 1 59048 177146 531440 1594322 4782968 14348906 43046720 129140162 387420488 23 2 ■13 24 ■5 2 ■112 23 ■7■13 2 ■1093 25 ■5 ■41 2 ■13■757 23 ■112 ■61 2 ■23 ■3851 24 ■5 ■7 ■13 73 2 ■797161 23 ■547 ■1093 2 ■112 ■13 ■4561 26 ■5 ■17 ■41 ■193 2 ■1871 ■34511 23 ■7 ■13 ■19 ■37 ■757 1162261466 3486784400 2 ■1597■363889 24 ■52 ■112 ■61 ■1181 10460353202 2 ■13 ■1093 ■368089 23 ■23 ■67 ■661 ■3851 31381059608 94143178826 282429536480 847288609442 2 ■47■1001523179 25 ■5 ■7 ■13 ■41 ■73 ■6481 2 •112 •8951 •391151
Приложение B. Разложение на простые pn — 1 24 = = = 124 624 = = 22 ■31 = = = 3124 15624 78124 = = = 58 — 1 59 — 1 510 — 1 511 — 1 512 — 1 513 — 1 = = 390624 1953124 = = 25 ■3 ■13 ■313 22 ■19 ■31 ■829 = = = 9765624 48828124 = = 244140624 1220703124 = = 23 ■3 ■11 ■71 ■521 22 ■12207031 24 ■32 ■7 ■13 ■31 ■601 —1 —1 = = 6103515624 = = 23 ■3 ■29 ■449 ■19531 30517578124 —1 —1 518 — 1 = = 152587890624 762939453124 381469...65624 = = 26 ■3 ■13 ■17 ■313 ■11489 22 ■409 ■466344409 = 519 — 1 520 — 1 = 190734...28124 953674...40624 = 23 ■33 ■7 ■19 ■31 ■829 ■5167 22 ■191 ■6271 ■3981071 = 24 ■3■11■13■41■71■521 9161 72 — 1 73 — 1 = 48 342 2400 = 24 ■3 = = 2 ■32 ■19 25 ■3 ■52 16806 117648 823542 = = 2 ■3 ■2801 24 ■32 ■19 ■43 = 2 ■3 ■29 ■4733 5764800 40353606 282475248 1977326742 = = 26 ■3 ■52 ■1201 2 ■33 ■19 ■37 ■1063 = = 24 ■3 ■11 ■191 ■2801 2 ■3 ■1123 ■293459 = = 25 ■32 ■52 ■13 ■19 ■43 ■181 2 ■3 ■16148168401 = = 24 ■3 ■29 ■113 ■911 ■4733 2 ■32 ■19 ■31 ■2801 ■159871 = = = 27 ■3 ■52 ■17 ■1201 ■169553 2 ■3 ■14009 ■2767631689 52 — 1 53 — 1 54 — 1 55 — 1 56 — 1 57 — 1 514 515 516 517 74 — 1 75 — 1 76 — 1 77 — 1 78 — 1 79 — 1 710 — 1 711 — 1 712 — 1 713 — 1 714 — 1 715 — 1 716 — 1 717 — 1 718 — 1 = = = = = = = = = = = = = 13841287200 = = 96889010406 678223072848 474756...09942 = = = 332329...69600 232630...87206 162841...10448 = 3 = 2со 358 24 ■3 ■13 22 ■11 ■71 23 ■32 ■7 ■31 22 ■19531 22 ■305175781 22 ■11 ■31 ■71 ■181 ■1741 24 -33■19■37■43■1063-117307
П ри л ож ен и е C . Н еп ри води м ы е и при м и ти вны е м н огочл ен ы Ниже приведены векторы коэф ф ициентов неприводимых много­ членов над Z 2 , Z 3 и Z 5 . Непримитивные многочлены обозначены курсивом. Старшие разряды располож ены слева. 9 8 , 7 , 6 , 5 , 4 , М н о г о ч л е н ы н а д Z 2 с т е п е н и n = 2, 3, n = 2 111 n = 3 1011 1101 n = 4 11001 11111 101001 111101 101111 110111 1001001 1100111 1010111 1101101 1011011 1110011 10001001 10001111 10101011 11001011 11101111 10010001 10111001 10111111 11010101 10100111 11000001 11100101 11110111 11111101 10011 n = 5 100101 111011 n = 6 1000011 1100001 1110101 n = 7 10000011 10011101 11010011 11110001 n = 8 100011011 100011101 100111111 101100101 100101011 101001101 101101001 100101101 100111001 101100011 101110111 110001101 101111011 110011111 110000111 110100011 110110001 111010111 111110101 110111101 111011101 111111001 111000011 111100111 110001011 110101001 111001111 101011111 101110001 111110011
360 Приложение C. Неприводимые многочлены n = 9 1000000011 1000010001 1000101101 1000010111 1000110011 1000011011 1001001011 1001011111 1001110111 1010011001 1010110111 1011011011 1001100101 1001111101 1010100011 1001101001 1010000111 1010100101 1010111101 1011110101 1100000001 1100100011 1101001111 1101101101 1100010011 1100110001 1100010101 1011001111 1011111001 1100011111 1100111011 1101001001 1101011011 1101110011 1101101011 1110000101 1110001111 1111000111 1110100001 1111001011 1101100001 1101111111 1110110101 1111001101 1111011001 1111100011 1111101001 1111111011 1000100001 1001011001 1001101111 1010010101 1010101111 1011010001 1110111001 1111010101 М н о г о ч л е н ы н а д Z 3 с т е п е н и n = 2 , 3, 4 , 5 , 6 n = 2 101 112 122 1022 1222 1102 1112 1121 1201 10022 10102 11101 12101 10111 11111 12112 10121 11122 12121 10202 11222 12212 100112 101201 102211 110111 100211 101221 101011 102101 101012 102112 102221 110122 110002 111011 110012 111121 112022 120011 121111 112102 120022 120202 121112 122201 121222 122212 n = 3 1021 1211 n = 4 10012 11002 12002 11021 12011 n = 5 100021 101102 100022 101122 102122 110021 102202 110101 111211 111212 112202 120221 112201 120212 122002 122021 112001 120001 121012 122101 122102 112111
Приложение C. Неприводимые многочлены 361 n= 6 1000012 1001012 1002011 1010201 1011022 1012112 1021021 1022102 1100111 1101212 1102202 1110221 1111222 1120121 1121212 1122202 1201001 1202002 1210001 1211021 1212121 1220212 1221211 1222222 1000111 1001101 1000121 1001021 1002022 1010212 1011122 1000022 1002101 1010222 1012001 1002112 1011001 1012012 1020001 1021102 1020101 1021112 1022111 1101002 1022122 1021121 1100002 1101011 1101101 1100012 1101112 1102111 1110011 1102121 1110122 1102201 1110202 1111021 1112201 1121012 1111111 1112222 1111112 1120102 1121102 1122001 1200002 1122002 1200022 1201121 1202101 1210112 1211212 1201201 1202122 1121122 1122122 1200121 1201202 1202222 1102001 1110001 1111012 1112011 1120222 1121221 1122221 1201111 1202021 1210021 1211201 1212122 1212212 1221001 1222022 1221002 1222102 1001122 1020112 1210202 1212011 1220102 1000201 1001221 1002211 1011011 1012021 1020122 1022011 1210211 1212022 1221112 1220111 1221202 1222112 1222211 М н о г о ч л е н ы н а д Z 5 с т е п е н и n = 2, 3, 4 n = 2 111 112 141 142 123 4 2 1 103 4 3 1 102 133 n = 3 1011 1042 1014 1021 1101 1024 1043 1102 1032 1113 1114 1033 1131 1213 1134 1141 1214 1222 1302 1304 1311 1143 1223 1312 1201 1242 1322 1203 1244 1323
362 Приложение C. Неприводимые многочлены 1341 1343 1431 1434 1403 1442 1404 1444 1411 1412 10024 10034 10044 n = 4 10002 10102 10003 10111 10014 10122 10123 10132 10133 10141 10303 10412 10203 10311 10413 10221 10313 10223 10341 10421 10431 10233 104 02 10443 11004 11013 11023 11024 10231 10343 10442 11032 11042 11101 11202 11113 11212 11114 11124 11213 11221 11234 11344 11244 11301 11303 11321 11133 11222 11342 1 1 402 11411 11414 11441 11443 12004 12013 12014 12022 12042 12102 12203 12121 12211 12021 12123 12222 12224 12033 12134 12302 12324 12332 12433 12333 12434 12344 12443 13004 12312 12414 13012 13102 13032 13131 13043 13133 13201 13314 13203 13322 13023 13121 13232 13031 13044 13334 13241 13341 13302 13342 13401 13413 14004 14011 13323 13423 14012 13432 14033 13444 14034 14043 14101 14 112 14123 14144 14202 14243 14214 14301 14224 14242 14134 14231 14312 14331 1 4 402 14411 14143 14232 14314 14444 111 4 2 12201 12311 12401 12 422 13124 13234 13424 14022 14303 14413 12131 14441 11041
Предметный указатель А Автоморфизм группы 74 Алгебраическое дополнение 165 Алгоритм — Берлекемпа — — для свободных от квадра­ тов многочленов 316 ------общий 324 — Гаусса 180 — Евклида 27 ------расширенный 31, 110 — Питерсона — Горенстейна — Цирлера 346 — Полига — Хеллмана — Неча­ ева 332 — согласования 329 Аннулятор — вектора 196 — оператора 198 — пространства 198 Асимптотический закон распре­ деления простых чисел 36 — собственный 206 — -столбец 149 — циклический 194 Векторы — линейно зависимые 136 — линейно независимые 136 — ортогональные 135 Взаимно простые — многочлены 100 — числа 26 Вычет 42 — обратный 43 Г Базис — линейного пространства 137 — нормальный 275 — стандартный 137 Бином Ньютона 20 Гомоморфизм — групп 80 — колец 94 Группа 53 — абелева (коммутативная) 54 — автоморфизмов 74 — аддитивная поля 91 — знакопеременная 65 — конечная 54 — мультипликативная кольца 91 — мультипликативная поля 91 — примарная 237 — симметрическая (подстановок) 55, 59 — циклическая 68, 75 В Д Вектор 134 — нулевой 134 — ошибок 339 Действие группы — на множестве 220 — сопряжениями 223 Б
364 Предметный указатель Делитель нуля (в кольце) 89 Дискретный логарифм 255 З Знак подстановки 63 И Идеал 95 — главный 95 Изоморфизм — групп 71 — колец 93 — линейных пространств 140 — полей 266 Инварианты (инвариантные де­ лители) группы 240 Индекс элемента поля 255 К Класс — вычетов 41 — смежный 66 — сопряженности 224 — циклотомический 294 — эквивалентности 13 Код — БЧХ примитивный 340 — линейный 339 — полиномиальный 339 — с расстоянием d 338 — циклический 350 Кольцо 87 — без делителей нуля (целост­ ное) 89 — главных идеалов 95 — евклидово 105 — коммутативное 88 — многочленов 99 — с единицей 88 — факториальное 105 Коммутативная диаграмма 15, 225 Композиция — операторов 144 — отношений 12 — отображений 14 Компонента оператора 144 Координаты вектора в базисе 139 Корень — многочлена 98, 121 — примитивный 274 Коэффициенты Безу 30, 110 Крамера формулы 194 Л Линейная — комбинация векторов 135 — оболочка векторов 135 Линейного пространства — базис 137 — размерность 138 Линейное подпространство 142 Линейные пространства — изоморфные 139 М Матрица — Вандермонда 172 — единичная 148 — кососимметрическая 148 — невырожденная 180 — обратная 155, 172, 183 — оператора 147 — перехода 154 — порождающая кода 350 — присоединенная 170 — проверочная кода 349 — расширенная 178 — симметрическая 148 — систематическая 184 — транспонированная 148 Матрицы эквивалентные 152 — перестановочно 184
Предметный указатель Минор 165 Многочлен 98 — f -разлагающий 314 — круговой 308 — локаторов ошибок 343 — минимальный — — вектора 196 ------матрицы 203 ------ оператора 199 ------ пространства 199 ------элемента поля 272, 307 — неприводимый 101 — нормированный 100 — порождающий 340 — примитивный 274, 297 — свободный от квадратов 310 — характеристический — — матрицы 206 — — оператора 206 — — последовательности 305 Многочлены взаимно простые 100 Н Наибольший общий делитель 26 — многочленов 100 Наименьшее общее кратное 33 Неподвижная точка 220 Нормализатор 224, 252 О Образ оператора 146 Оператор — линейный 143 — невырожденный 145 — обратимый 145 — обратный 145 — тождественный 145 Операция бинарная 52 — ассоциативная 53 Определитель — матрицы 161 365 — оператора 163 — системы векторов 160 Орбита 220 Отношение 11 — антисимметричное 23 — линейного порядка 23 — обратное 12 — рефлексивное 12 — симметричное 12 — транзитивное 12 — частичного порядка 23 — эквивалентности 12 Отображение 13 — биективное (взаимно однознач­ ное) 14 — инъективное 14 — обратимое 16 — обратное 16 — — левое 16 — — правое 16 — сюрьективное 14 П Перестановка 18 Подгруппа 57 — несобственная 223 — нормальная 69 — силовская 228 Подкольцо 88 Подпространство — инвариантное 194 Подстановка 55, 59 — нечетная 65 — четная 65 Показатель группы 243 Поле 91 — Галуа 274 — конечное 91 — простое 266 Полная система вычетов 42 Полугруппа 59
366 Предметный указатель — с единицей (моноид) 59 Поля — подполе 265 — расширение 266, 269 — характеристика 265 Порядок — группы 54 — многочлена 295 — элемента 68 Представление системой остат­ ков 128 Производная формальная 259 Пространство — линейное 134 — — бесконечномерное 135 конечномерное 135 — ортогональное 151 — порожденное системой век­ торов 137 — примарное 201 — столбцов матрицы 151 — строк матрицы 151 — циклическое 195 Прямая сумма — колец 93 — подпространств 199 Прямое произведение — внешнее 78, 232 — внутреннее 232 — множеств 11 — нормальных подгрупп 235 Р Разложение — многочлена на неприводимые сомножители 102 — определителя по столбцу 165 — — по строке 167 — числа на простые сомножи­ тели 34 Размещение 18 Ранг — матрицы 153 — оператора 146 Расстояние Хемминга 338 Решение частное 179 С Синдром вектора 342 Система — вычетов приведенная 49 — линейных сравнений 44 — линейных уравнений 177 однородная 180 ------ согласованная 178 — образующих (порождающих) 65 — решений фундаментальная 180 Собственное значение 206 Сопряжение 74 Сопряженные элементы — в группе 224 — в поле 271 Сочетание 19 — с повторениями 19 Сравнение 39 Стабилизатор 220 Сумма — подпространств 199 Схема Горнера 107 Т Таблица Кэли 55 Теорема — Безу 103 — Гамильтона — Кэли 208 — Евклида 26 — Китайская об остатках 45 — — для многочленов 123 — Кронекера — Капелли 178 — Кэли 74 — Лагранжа 67
Предметный указатель — Лагранжа интеполяционная 130 — Ламе 30 — о делении с остатком 25, 99 — о нормальном базисе 276 — о подполях в G F (pn) 270 — о разложении xp — x 259 — о разложении в прямую сум­ му циклических подпространств 203 — о разложении конечной абе­ левой группы 241 — о строении группы 1 п (кри­ терий цикличности) 249 — о цикличности мультиплика­ тивной группы поля 254 — о числе неприводимых мно­ гочленов 118 — об изоморфизме полей 273 — Силова вторая 229 — Силова первая 228 — Силова третья 230 — Ферма малая 49 — Чебышёва 36 — Эйлера 49 Тип подстановки 226 Транспозиция 60 У Уравнение — однородное 180 — согласованное 178 Ф Фактор-группа 69 Фактор-кольцо 96 Фактор-множество 66 Фактор-пространство 143 Формула — включений и исключений 21 — Крамера 194 367 — Лагранжа интерполяционная 130 — обращения Мёбиуса 118 Функция 13 — кососимметрическая 156 — Мёбиуса 117 — полилинейная 156 — характеристическая 14 — Эйлера 47 Ц Центр группы 224 Цикл в симметрической группе 60 Циклотомический класс 294 Циклы непересекающиеся (неза­ висимые) 60 Ч Число — обратимое по модулю 43 — простое 33 — Фибоначчи 51 Э Элемент — единичный (в группе) 53 — единичный (в поле) 91 — нулевой (в поле) 91 — обратный (в группе) 53 — порождающий (в группе) 68 — примитивный 255 — простой 105 Элементарные преобразования матриц 152 Элементы поля сопряженные 271 Я Ядро — гомоморфизма 80, 94 — оператора 145