/
Author: Тышкевич Р.И. Милованов М.В. Феденко А.С. Толкачев М.М.
Tags: алгебра геометрия топология математика аналитическая геометрия
Year: 1987
Text
М. В. МИЛОВАНОВ,
М. М. ТОЛКАЧЕВ,
Р. И. ТЫШКЕВИЧ,
А. С. ФЕДЕНКО
АЛГЕБРА
И АНАЛИТИЧЕСКАЯ
ГЕОМЕТРИЯ
В 2-Х ЧАСТЯХ
Часть 2
Допущено Министерством высшего
и среднего специального образования БССР
в качестве учебного пособия для студентов
математических специальностей универси-
университетов и педагогических институтов
Минск
Издательство «Вышэйшая школа»
1987
ББК 22.151.5я73
А45
УДК 512 + 514] @75.8)
Рецензенты: кафедра высшей алгебры и теории чисел Ленинград-
Ленинградского государственного университета им. А. А. Жданова; А. М. Васильев,
доктор физико-математических наук, профессор кафедры высшей геометрии
и топологии Московского государственного университета им. М. В. Ломоносова
1702010000—125
А 18—87
М 304@3)—87
Издательство «Вышэйшая школа», 1987
ПРЕДИСЛОВИЕ
Данная книга является второй частью учебного по-
пособия «Алгебра и аналитическая геометрия». Первая часть
(авторы — М. В. Милованов, Р. И. Тышкевич, А. С. Фе-
денко) была издана в 1984 г.
Книга начинается с третьего раздела — «Теория ли-
линейных пространств». Изложение основных тем линей-
линейной алгебры проводится в строгом соответствии с про-
программой. При изучении линейных операторов широко
используется их матричная запись, что приводит к сокра-
сокращению доказательств и позволяет использовать теорию
систем линейных уравнений. Несколько полнее обычного
трактуется вопрос о нормальных формах матриц. По-
Поскольку жорданова нормальная форма не всегда сущест-
существует, наряду с ней рассматривается фробениусова нор-
нормальная форма, существующая при любом основном поле.
Билинейная и квадратичная формы определяются как
соответствующие многочлены. Б главе «Евклидовы и уни-
унитарные пространства» подчеркнута тесная связь били-
билинейных форм с билинейными функциями. В главе «Ли-
«Линейные операторы евклидовых и унитарных пространств»
подробные доказательства всех утверждений даны только
для случая евклидова пространства, а в случае унитар-
унитарного пространства отмечены лишь особенности этих до-
доказательств.
В четвертом разделе — «Геометрия я-мерного прост-
пространства» — наиболее ярко проявляются идеи, положен-
положенные в основу пособия, а именно: при изучении всех основ-
основных вопросов используются понятия и методы, описанные
в первых трех разделах. По существу, рассматривая
аффинные и проективные пространства, мы продолжаем
изучать линейные пространства с несколько иной, геомет-
геометрической точки зрения. То же относится и к евклидовым
линейным и точечным пространствам. Системы линейных
уравнений истолковываются в аффинном пространстве
полнее, чем в линейном. Теория квадрик является есте-
естественным обобщением и завершением теории фигур вто-
второго порядка. В то же время она служит геометрической
интерпретацией теории квадратичных форм. Последняя
глава книги посвящена тензорам. Из различных возмож-
ных определений тензора выбрано наиболее простое. На
его основе естественно описываются тензоры, встречаю-
встречающиеся в этой книге. Рассматриваются основные опера-
операции над ними.
Нумерация разделов, глав, параграфов и рисунков
во второй части пособия продолжает соответствующую
нумерацию в первой части. Начало доказательства теорем,
предложений, лемм, следствий и свойств обозначено
символом > , а конец — ^ .
Авторы выражают искреннюю благодарность рецен-
рецензентам: заведующему кафедрой высшей алгебры и теории
чисел Ленинградского государственного университета
им. А. А. Жданова профессору 3. И. Боревичу и сотруд-
сотруднику этой кафедры доценту Р. А. Шмидту, а также
А. М. Васильеву — профессору кафедры высшей геомет-
геометрии и топологии Московского государственного универ-
университета им. М. В. Ломоносова — за ценные замечания и
советы, способствовавшие улучшению книги.
Все отзывы и пожелания просим присылать по адресу:
220048, Минск, проспект Машерова, 11, издательство
«Вышэйшая школа».
Авторы
Раздел 3
ТЕОРИЯ ЛИНЕЙНЫХ ПРОСТРАНСТВ
17. ЛИНЕЙНЫЕ ПРОСТРАНСТВА
Понятие линейного (векторного) пространства является основ-
основным в линейной алгебре и одним из важнейших в математике.
В этой главе излагаются основы теории линейных пространств.
17.1. Определение линейного пространства
Рассмотрим множество всех свободных векторов (классов экви-
эквивалентных направленных отрезков). Среди операций, которые мы
умеем производить над векторами, выделим две: сложение векторов
и умножение вектора на действительное число. Мы знаем, что отно-
относительно сложения множество векторов является абелевой группой.
Кроме того, эти операции обладают следующими свойствами:
1) ot(|$v) = (ot|$)v для любых действительных чисел а и $ и любого
вектора v;
2) lv=v для любого вектора v;
3) (a + p)v=av + pv и a(u + v)=au + av для любых действи-
действительных чисел а и р и любых векторов и и v, т. е. выполняется ди-
дистрибутивный закон.
Аналогичная картина характерна и для многих других математи-
математических объектов. Это множества, элементы которых можно склады-
складывать, причем относительно сложения такие множества являются абе-
левыми группами. Можно также умножить элементы этих множеств
на «числа». Операции сложения и умножения обладают свойствами,
идентичными приведенным выше свойствам 1—3. Примерами таких
множеств являются множество Р[х] многочленов над произвольным
полем Р (относительно сложения многочленов и умножения мно-
многочлена на элемент поля Р), множество Pm>n m X я-матриц над
полем Р.
Предположим теперь, что нас интересуют только свойства, об-
общие для всех таких объектов (множеств), т. е. не связанные с при-
природой элементов, составляющих эти объекты (например, с тем, что
это именно свободные векторы или многочлены), и конкретным
определением операций. Такие свойства должны следовать из су-
существования операций сложения и умножения с указанными выше
формальными законами. Подобные свойства разумно изучать с
единой точки зрения. Поэтому естественно возникает следующее
Определение 17.1. Пусть V — аддитивная абелева группа,
а Р — произвольное поле. Пусть, далее, определено умножение эле-
элементов группы V на элементы поля Р со значениями в V. Более
точно: каждой паре а, а, где а?Р, a?V, поставлен в соответствие
определенный элемент множества V, который называется произве-
произведением элемента а на а и обозначается символом аа. Группа V,
рассматриваемая вместе с этим умножением, называется линейным
пространством над полем Р, если выполняются следующие условия
(аксиомы):
1) а(ра) = (сф)а для любых а, р ? Р и a 6 V\
2) la=a, где 1 — единица поля Р и a 6 V\
3) (а + p)a = аа + pa, a(a + b) = аа + ab для любых а, р ? Р
и a, b е V.
Часто вместо слова «линейное» говорят «векторное» (простран-
(пространство) .
Условимся элементы пространства V называть векторами и обо-
обозначать их строчными буквами латинского алфавита, выделенными
жирным шрифтом. Элементы поля Р, кроме нуля и единицы, будем
называть числами и обозначать строчными буквами греческого
или латинского алфавита. Для обозначения последних будем исполь-
использовать символы 0 и 1 соответственно. Поле Р назовем основным
полем.
Для нас наиболее важны линейные пространства над полями
действительных и комплексных чисел. Ниже эти пространства назы-
называются действительным и комплексным линейными пространствами
соответственно.
Приведем примеры линейных пространств. Читателю рекоменду-
рекомендуется доказать самостоятельно, что в каждом из приведенных ниже
случаев мы действительно имеем дело с линейным пространством.
Пример 17.1. Множество всех свободных векторов относительно обычных опера-
операций сложения векторов и умножения вектора на действительное число является
действительным линейным пространством. Аналогично линейными пространствами
являются множество всех векторов плоскости и множество всех векторов прямой.
Пример 17.2. Пусть Р—произвольное поле. Множество Рт<п всех тхя-матриц
над полем Р относительно сложения матриц и умножения матрицы на элемент поля
Р является линейным пространством над Р. В частности, множество Р\,п всех я-член-
ных строк (аь а2, ..., а„) и множество Pn,i всех я-членных столбцов
A)
являются линейными пространствами над полем Р. Эти пространства часто называют
арифметическими или координатными п-мерными пространствами и обозначают Рп.
В частности, R" — действительное /г-мерное арифметическое пространство.
Далее столбец A) будем записывать в транспонированном виде:
[а1 а2 -• апУ-
Пример 17.3. Множество Р[х\ многочленов над полем Р относительно операций
сложения многочленов и умножения многочлена на элемент поля Р является линей-
линейным пространством над Р.
Пример 17.4. Множество всех функций вида /: R->-R является действительным
линейным пространством. Сложение векторов и умножение их на числа задаются
формулами:
(f + g)W = f(x) + g(x), (а/)(х)=а(/(х)), B)
где /, g — функции; а, x?R.
Пусть V — линейное пространство над полем Р. Непосредственно
из определения вытекают следующие свойства пространства V.
1. Так как относительно сложения векторов V является абелевой
группой, то в К лишь один нулевой вектор — нейтральный отно-
относительно сложения элемент. Этот вектор ниже обозначается сим-
символом 0. Для любого вектора а а + 0 = а. По той же причине для
каждого вектора а. в V существует единственный противоположный
вектор —а, такой, что — а + а=0. Для любых векторов а и Ь урав-
уравнение а + х=Ь имеет в V единственное решение х=Ь — а, которое
называется разностью векторов b и а и обозначается b — а. Для
любого вектора а а — а = 0. Если а, Ь, с — векторы, то из равенства
а + b = а + с следует b = с. Можно говорить о сумме нескольких
векторов, причем порядок слагаемых роли не играет.
2. Дистрибутивный закон выполняется и для вычитания, т. е.
если а, р 6 Р, a, b 6 V, то а(а — Ь) = аа — ab, (а — Р)а = аа — ра.
^ Действительно, а(а — b) + ab = а((а — Ь) + Ь)=а(а — b + b)=
= аа. Первое из равенств следует теперь из определения разности.
Второе получается аналогично: (а — р)а + ра = ((а — Р) + Р)а =
= аа. 4
3. Если а 6 V, а 6 Р> то аа = 0 тогда и только тогда, когда а = 0
или a == 0.
^ В самом деле, 0а = (оь — а)а = аа — аа = 0, аО = а(а — а) =
= аа_аа=0. Пусть, далее, афО и верно равенство аа=0. Умно-
Умножая обе части этого равенства на а, получаем а~1(аа) = а~!0,
1а = 0, а = 0. <
4. Если 2l 6 V, agP, то ( — а)а = оь( — а) = — (аа).
> Действительно, так как (—а)а + аа=(—а + а)а=0а=0, то
(— а)а = — (аа). Аналогично а( — а) + аа = оь( — а + а) = аО = 0,
поэтому а( — а)= — (оьа).«^
Упражнения
1. Пусть а, Р 6 R» С\а, р]— множество всех функций вида /: [a, Pj-^R, непре-
непрерывных на отрезке [а, р]. Докажите, что если сложение функций и умножение
функции на действительное число задаются формулами B), то С [а, р] — действи-
действительное линейное пространство.
2. Докажите, что множество всех бесконечных последовательностей, составлен-
составленных из элементов поля Р, превратится в линейное пространство над Я, если опреде-
определить сложение последовательностей и умножение последовательности на элемент
поля Р с помощью формул:
(а„ а2, ... , а„, ...) + (Ph P2, ... , р„, ...) =
=(а1 + р1, а2+р2, ... , а„ + ря, ...),
7(а„ а2, ... , а„, ...)==(yu,, уа2, ... , уал, ...).
3. Докажите, что произвольное расширение поля Р можно рассматривать как
линейное пространство над Р.
17.2. Линейная зависимость
Пусть задана конечная система векторов
линейного пространства V над полем Р. Мы употребляем слово
«система» вместо «подмножество», когда хотим отметить, что среди
рассматриваемых векторов не исключены повторения (например,
а! = а2). Кроме того, мы считаем, что система упорядочена, т. е.
указано, какой из векторов является первым, какой вторым и т. д.
Определение 17.2. Система векторов A) называется линейно
зависимой, если в поле Р существуют числа а1у а2, ... , ат, не равные
одновременно нулю и такие, что
ахъх + а2а2 +... + атат = 0. B)
В противном случае (когда таких чисел не существует) система
A) называется линейно независимой. Другими словами, система A)
называется линейно независимой, если из равенства B) следуют ра-
равенства:
а!=0, а2 = 0, ... , ат = 0.
Такие же определения линейных зависимости и независимости
систем свободных векторов приведены в § 12.5.
Пример 17.5. В пространстве Rli3 строк длины 3 система векторов а, =A, 4, 6),
а2 = A — 1, 1), а3 = A, 1,3) линейно зависима, так как 2а, -f- За2 — 5а3 = 0.
Пример 17.6. Система строк
е,=A, 0, ... , 0), е2 = @, 1, 0, ... , 0), ... , ея = @, ... , 0, 1) C)
пространства строк Р\п линейно независима, так как из равенства оце, + а2е2-Ь ••• +
-j- але„ = 0 следует (он, а2, ... , ая) = 0, ои = а2 = ... = а„ = 0.
При тп=\ определение линейной зависимости приводит к сле-
следующему утверждению.
Предложение 17.1. Система, содержащая лишь один вектор, ли-
линейно зависима тогда и только тогда, когда этот вектор нулевой.
Определение 17.3. Если
Pi, Р2, .», Рт D)
являются элементами поля Р, то вектор
2 + ... + pmam E)
называется линейной комбинацией векторов A), а числа D) —
коэффициентами этой линейной комбинации.
Линейная комбинация E) называется тривиальной, если все ее
коэффициенты равны нулю, и нетривиальной в противном случае.
Тривиальная линейная комбинация любых векторов равна нулевому
вектору.
Очевидно, что определения линейных зависимости и независи-
независимости можно сформулировать в следующем виде: конечная система
векторов называется линейно зависимой, если существует нетриви-
нетривиальная линейная комбинация этих векторов, равная нулевому век-
вектору. Конечная система векторов называется линейно независимой,
если только тривиальная линейная комбинация этих векторов равна
нулевому вектору.
Предложение 17.2. При т>\ система векторов A) линейно
зависима, если и только если какой-либо из векторов этой системы
является линейной комбинацией остальных.
Для пространства свободных векторов это утверждение доказано
в § 12.5, причем приведенное там доказательство дословно пере-
переносится на общий случай.
Предложение 17.3. Система векторов A), в которой а.хФ§ и
m>ly линейно зависима тогда и только тогда, когда какой-либо из
ее векторов является линейной комбинацией предыдущих.
> Пусть система векторов A) линейно зависима, т. е. верно ра-
равенство
a1a1 + a2a2 + --- + amam = 0, F)
в котором есть ненулевые коэффициенты, и as — последний из них
(т. е. а8ф0 и для /=s-|-l, ... , m a? = 0). Перепишем равенство F)
в виде
а,а, + <*2а2 + ••• + asas = 0. G)
При s=l мы имели бы aiai=0, а\ф0, а.\ = 0, что противо-
противоречит условию. Следовательно, s> 1. Умножив обе части равенства
G) на аГ1 и перенеся все слагаемые, кроме последнего, в правую
часть, получим представление вектора as в виде линейной комбинации
предыдущих векторов аь аг, ..., as_i.
Обратное утверждение очевидно. <4
Следствие 17.1. Если система векторов A) линейно незави-
независима, а система а,, а2, ... , am, b линейно зависима, то вектор Ъ явля-
является линейной комбинацией векторов A).
Отметим еще три свойства линейной зависимости.
1. Система, содержащая нулевой вектор, линейно зависима.
> Пусть, например, в системе A) aj = O. Тогда 1а, + 0а2 + ...+
ат = 0.^
2. Система, содержащая равные векторы, линейно зависима.
> Пусть, например, в системе A) 2lx=2l2. Тогда (—l)a.j-|- 1 а2Ч~
0 0 (Ы
+ 3
3. Если какая-либо подсистема (часть) системы векторов линей-
линейно зависима, то и вся система линейно зависима.
> Пусть, например, подсистема a.lf а2, ... , а/, /<Ст, системы
векторов A) линейно зависима. Тогда существует нетривиальная
линейная комбинация этих векторов, равная нулевому вектору:
otiai + а2&2 + ••• + а/а/ = 0.
Из последнего равенства следует
0a/+i +••• +0am = 0.
Итак, получена нетривиальная линейная комбинация
векторов системы A), равная нулевому вектору, следовательно,
система A) линейно зависима. ^
2. Зак. 6466 9
Можно говорить о линейной зависимости и линейной независи-
независимости бесконечных систем векторов. Свойство 3 подсказывает сле-
следующее
Определение 17.4. Бесконечная система векторов называется
линейно независимой, если линейно независима каждая ее конечная
подсистема, и линейно зависимой, если какая-либо ее конечная
подсистема линейно зависима.
Определение 17.5. Пусть А — система векторов простран-
пространства V и Ь 6 V. Если вектор Ь является линейной комбинацией векто-
векторов из А, то будем говорить, что Ь линейно выражается через А.
Если каждый вектор системы В линейно выражается через А, то
система векторов В линейно выражается через А.
Пример 17.7. Действительное линейное пространство свободных векторов ли-
линейно выражается через произвольную систему трех некомпланарных векторов.
Линейное пространство свободных векторов фиксированной плоскости линейно выра-
выражается через любую пару неколлинеарных векторов этой плоскости. Линейное про-
пространство векторов прямой линейно выражается через любой ненулевой вектор этой
прямой.
Пример 17.8. Пространство Р\,п линейно выражается через систему строк C).
Заметим, что если А — подсистема системы В, то А линейно
выражается через В.
> В самом деле, пусть а 6 Л. Вектор а запишем в виде а= 1а.
Последнее равенство есть линейное выражение произвольного векто-
вектора а системы А через векторы системы Ву поскольку а ? В. А
Очевидна транзитивность линейной выражаемости, а именно:
если система А линейно выражается через систему В, а система В —
через систему С, то система А линейно выражается через систему С.
Определение 17.6. Системы векторов А и В называются
эквивалентными, если А линейно выражается через В, а В — через А.
Из транзитивности линейной выражаемости следует транзитив-
транзитивность эквивалентности систем векторов: если А, В и С — такие
системы векторов, что А и В эквивалентны и В и С эквивалентны,
то А и С также эквивалентны.
Предложение 17.4. Если какой-либо вектор b системы А линейно
выражается через другие векторы этой системы, то система Л\{Ь}
эквивалентна системе А.
> Пусть С — система векторов, полученная из системы А в ре-
результате исключения вектора Ь. Тогда всякий вектор системы С со-
содержится в Л и поэтому линейно выражается через А. Точно так же
каждый отличный от b вектор системы А линейно выражается через
систему С. По условию вектор b также линейно выражается через
систему С. Следовательно, системы А и С эквивалентны.^
Теорема 17.1. Если система векторов
Ь]у Ь2, ... , bm (8)
линейно независима и линейно выражается через систему
а}, а2, ... , а/, (9)
10
> Рассмотрим систему векторов
Ь„ а,, а2, ... , а/. A0)
По условию вектор Ь, линейно выражается через остальные векторы
системы A0), поэтому система A0) линейно зависима. Согласно
предложению 17.3, какой-либо из векторов а; линейно выражается
через предыдущие. Например, пусть это будет вектор а/. Исключив
а/ из системы A0), получим систему
bi, аь а2, ..., a/_i, A1)
эквивалентную, согласно предложению 17.4, системе A0), а следо-
следовательно, и системе (9). Взяв вместо системы (9) систему A1) и
повторив аналогичные рассуждения, придем к системе векторов
Ьь Ьг, ai, а2, ..., а/_ 2»
эквивалентной системе (9). При т>1 через / аналогичных шагов
мы получили бы систему
Ь1У Ь2, ... ,Ь/, A2)
вовсе не содержащую векторов а/, являющуюся подсистемой систе-
системы (8) и эквивалентную системе (9). Но тогда вектор Ьт линейно
выражался бы через систему A2), что противоречит линейной неза-
независимости системы (8). А
Замечание. Теорему 17.1 удобно формулировать в следующем виде: если
«большая» система векторов линейно выражается через «меньшую», то «большая»
система линейно зависима.
Очевидно
Следствие 17.2. Две конечные эквивалентные линейно неза-
независимые системы векторов содержат одно и то же число векторов.
Упражнения
1. Докажите, что в пространстве Р[х\ система многочленов 1, х, х2, ... , хп, ...
линейно независима.
2. Докажите, что функции 1, (sin xJ, (cos xJ линейно зависимы над R.
17.3. Базис. Размерность
Определение 17.7. Система векторов линейного простран-
пространства V называется базисом, если она линейно независима и все
пространство V линейно выражается через нее. Линейное простран-
пространство, имеющее конечный базис, называется конечномерным. Линей-
Линейное пространство, состоящее только из одного нулевого вектора
(нулевое линейное пространство), также называется конечномерным.
Ненулевое линейное пространство называется бесконечномерным,
если в нем нет конечного базиса.
В курсе линейной алгебры изучаются конечномерные линейные
пространства.
11
Предложение 17.5. Если в линейном пространстве V существует
базис, состоящий из п векторов, то каждый базис этого простран-
пространства состоит из п векторов.
> Пусть в пространстве V существует базис, состоящий из п
векторов. Всякий вектор пространства линейно выражается через
базис. Поэтому, согласно теореме 17.1, любая система, в которой
число векторов больше л, линейно зависима. Если бы в простран-
пространстве V существовал еще «меньший» базис, состоящий, скажем, из пг
векторов, где m<Z.ny то, аналогично предыдущему, всякая система
векторов этого пространства, в которой число векторов больше т,
в частности исходный базис, была бы линейно зависима. <4
Определение 17.8. Линейное пространство, в котором суще-
существует базис, состоящий из п векторов, называется я-мерным. Ну-
Нулевое линейное пространство называется нульмерным. Если прост-
пространство V п-мерно, то число п называют размерностью простран-
пространства V и пишут n=d\m V.
Пример 17.9. Пространство свободных векторов трехмерно, его базис составляет
любая тройка некомпланарных векторов. Пространство всех векторов плоскости
двумерно, а пространство всех векторов прямой одномерно.
Пример 17.10. В пространстве Pi „ система строк
е,=A, 0, ... , 0), е2 = @, 1, 0, ... , 0), ... , е„ = @, ...,0, 1) A)
линейно независима. Произвольная строка a = (alf a2, ... , ап) линейно выражается
через систему A): a = a,ej-f-a2e24-... ~h а„е„. Поэтому система строк A) является
базисом пространства строк Р\%п.
Теорема 17.2. Для произвольного п-мерного линейного прост-
пространства верны следующие три утверждения:
1) всякая система векторов, в которой число векторов больше
п, линейно зависима;
2) всякая линейно независимая система п векторов является
базисом;
3) всякая линейно независимая система векторов, число векто-
векторов в которой меньше п, может быть дополнена до базиса.
> 1. Первое утверждение непосредственно следует из теоре-
теоремы 17.1.
2. Пусть
а1? а2, ..., а„ B)
является линейно независимой системой векторов я-мерного линей-
линейного пространства V, b — произвольный вектор этого пространства.
Согласно первому утверждению теоремы, система векторов а^ а2, ... ,
ап, b линейно зависима. В силу следствия 17.1 вектор b линейно вы-
выражается через систему B). Итак, система B) является базисом
пространства V.
3. Пусть заданы линейно независимая система векторов
al9 а2, ... , ат, C)
базис
Ь„ Ь2, ... , Ъп D)
12
пространства V и пусть т<п. Система
clj, а2, •••> ^m» Dj, Ь2, •••» "« V^J
линейно зависима. Последовательно исключим из системы E) все
векторы, являющиеся линейными комбинациями предыдущих. Так
как векторы C) линейно независимы, то все они останутся в системе,
и полученная система примет вид
а„ а2, ... , ат, Ь,,, Ь,2, ... , Ь„. F)
Согласно предложению 17.3, система F) линейно независима.
Всякий вектор пространства V линейно выражается через базис
D) и, следовательно, через эквивалентную этому базису систему
F). Итак, система векторов F) —базис пространства Vy полу-
полученный в результате дополнения системы векторов C).^
Упражнения
1. Найдите какой-либо базис пространства многочленов Р[х].
2. Какова размерность поля С как линейного пространства над полем R?
3. Докажите, что если поле Р состоит из т элементов, то в «-мерном линейном
пространстве над Р имеется ровно
(тп — 1) (тп — т) (тп — т2) • • • (тп — тп~1)
базисов.
4. Пусть а — корень неприводимого над полем Р многочлена степени п. Дока-
Докажите, что минимальное расширение Я(а) (см. § 11.1) является линейным простран-
пространством над Р. Какова его размерность?
17.4. Координаты вектора
Пусть V — я-мерное линейное пространство над полем Р, система
векторов
ь„ ь2, ..., ъп A)
является базисом пространства I/, a — произвольный вектор этого
пространства. Тогда а линейно выражается через базис A), т. е.
а = aibi + a2b2 + ... + апЪп, a/ 6 Р- B)
Определение 17.9. Представление вектора а в виде B) на-
называется разложением по базисным векторам A), а коэффициенты
сц, а2, ... , ап C)
называются координатами вектора а в базисе A). Столбец
[а, а2 ... ап]т
называется координатным столбцом вектора а в базисе A).
Важно отметить, что последовательность векторов в базисе всегда
предполагается заданной. Например, базисы A) и b2, bb ... , Ъп
считаются разными.
Теорема 17.3. Координаты вектора в заданном базисе определены
однозначно.
13
> Пусть наряду с координатами C) вектор а имеет в том же
базисе A) еще и координаты р1э р2, ... , р„. Тогда
Вычитая почленно второе равенство из первого, получаем
(оы - Pi)bi + (оь2 - Р2)Ь2 + ... + (ая - ря)Ь„ = 0.
Но базис — линейно независимая система, поэтому \из последнего
равенства следует, что все его коэффициенты равны нулю. Итак,
а,—р,-=0, а|-=р,-, /=1, 2, ... , п.А
Запишем базис A) в виде матрицы-строки
[Ь, Ь2 ... Ь„],
а разложение B) вектора а по базисным векторам A) —в виде
матричного равенства
a=[b, b2 ... Ьп\[ах а2 ... anf. D)
Положив [b, b2 ... Ь„] = В, [а! а2 ... а„]г=Л, перепишем равен-
равенство D) в виде а=ВЛ. Итак, вектор а можно представить в виде
произведения базисной строки В и его координатного столбца А.
Поскольку координаты вектора в фиксированном базисе опре-
определены однозначно, то верно следующее
Предложение 17.6. Если а — вектор, В — базисная строка, со-
составленная из векторов A), С — матрица-столбец и а=ВС, то С —
координатный столбец вектора а в базисе A).
В дальнейшем нам понадобится следующее утверждение: если
сложение матриц над пространством V или умножение матрицы
над полем Р на матрицу над V выполнять по тем же правилам, что и
соответствующие действия с матрицами над полем, то останутся
справедливыми все формальные свойства сложения и умножения
матриц. Доказательства, приведенные в § 2.4 для матриц над полем,
сохраняются и в этом случае.
Теорема 17.4. Координатный столбец суммы векторов равен сум-
сумме координатных столбцов слагаемых. При умножении вектора на
число его координатный столбец умножается на это число. Коорди-
Координатный столбец линейной комбинации векторов равен линейной
комбинации координатных столбцов этих векторов с теми же коэф-
коэффициентами.
!> Пусть В — базисная строка, составленная из векторов A),
Л, С— координатные столбцы векторов а, с в базисе A). Тогда
а = БА, с = ВС, а + с = ВЛ + ВС = В(Л + С). Следовательно, (А +
+ С) — координатный столбец вектора (а + с) в базисе A). Далее,
если а?Р, то аа = ос(ВЛ) = В(аЛ), следовательно, аА — координат-
координатный столбец вектора аа. Последнее утверждение теоремы доказы-
доказывается индукцией по числу векторов. А
Следствие 17.3. Система векторов линейно независима, если
и только если линейно независима система их координатных столб-
столбцов.
14
Упражнения
1. Пусть V— я-мерное линейное пространство над конечным полем из т эле-
элементов. Сколько векторов входит в V?
2. Сколько векторов входит в линейное пространство Рт> п матриц над конечным
полем Р из q элементов?
17.5. Ранг системы векторов
Определение 17.10. Пусть А — какая-либо система векторов
линейного пространства, а В — ее подсистема. Система В назы-
называется базисом системы А, если выполняются следующие два
условия:
1) система В линейно независима;
2) система А линейно выражается через подсистему В.
Теорема 17.5. В каждой конечной системе векторов, содержащей
хотя бы один ненулевой вектор, имеется базис. Все базисы системы
состоят из одного и того же числа векторов-.
> Пусть А — конечная система векторов, хотя бы один из кото-
которых ненулевой. Последовательно исключив из системы А все векто-
векторы, линейно выражающиеся через оставшиеся векторы этой систе-
системы, получим, согласно предложениям 17.3 и 17.4, линейно незави-
независимую систему, эквивалентную системе Л, т. е. базис системы А.
Любые два базиса системы эквивалентны и, согласно следствию
17.2, состоят из одного и того же числа векторов. ^
Определение 17.11. Число векторов, составляющих базис
системы векторов, называется рангом этой системы. Если каждый
вектор системы нулевой, то ее ранг по определению равен нулю.
Предложение 17.7. Пусть А и В — конечные системы векторов,
причем А линейно выражается через В. Тогда ранг системы А не
превосходит ранга системы В.
> Это утверждение очевидно, если все векторы системы А нуле-
нулевые. В противном случае базис системы векторов А линейно выра-
выражается через базис системы векторов В, и на основании теоремы
17.1 предложение доказано.^
Следствие 17.4. Ранги эквивалентных систем векторов равны.
Ниже окажется полезной
Лемма 17.1. Вектор b линейно выражается через систему векто-
векторов
а1? а2, ... , а„, A)
если и только если ранги системы A) и системы
а„ а2, ... , а„, b B)
равны.
> Если вектор b линейно выражается через систему A), то
системы A) и B) эквивалентны и, следовательно, их ранги равны.
Обратно, пусть ранги систем A) и B) равны г. Тогда любая
линейно независимая подсистема системы A), состоящая из г век-
векторов, является базисом как системы A), так и системы B). Век-
15
тор Ь, линейно выражаясь через этот базис, выражается через
систему A).^
Мы уже рассматривали элементарные преобразование строк и
столбцов матрицы (см. § 2.2). Повторим здесь определение элемен-
элементарных преобразований для более общего случая, а именно: вместо
строк или столбцов матрицы возьмем любую систему векторов про-
произвольного линейного пространства.
Определение 17.12. Элементарными преобразованиями
системы векторов называются:
1) умножение какого-либо вектора этой системы на отличное от
нуля число из основного поля;
2) прибавление к одному вектору системы другого ее вектора,
умноженного на произвольное число из основного поля.
Предложение 17.8. Элементарные преобразования системы векто-
векторов не изменяют ее ранга.
р> Пусть дана система векторов A). Какой-либо ее вектор, на-
например аь умножим на отличное от нуля число а. Полученная в ре-
результате система векторов
аа^ а2, ..., а„ C)
линейно выражается через систему A), которая в свою очередь
линейно выражается через систему C), поскольку а1 = а~1(аа1).
Итак, эти системы эквивалентны, и потому их ранги равны.
Прибавив к какому-либо вектору системы A), например а^ дру-
другой ее вектор, скажем а2, умноженный на число р, получим систему
а! + ра2, а2, ..., а„. D)
Она линейно выражается через систему A), которая в свою очередь
линейно выражается через систему D), так как а1=(а1 + ра2) —
— |3а2. Следовательно, системы A) и D) эквивалентны, и их ранги
равны.<4
17.6. Ранг матрицы
Пусть дана матрица
А =
12 ••• "l/i
22 ... а2п
0)
над произвольным полем Р. Будем рассматривать ее столбцы как
векторы пространства РтЛ m-членных столбцов.
Определение 17.13. Ранг системы столбцов матрицы А назы-
называется рангом матрицы А и обозначается символом rank Л.
Пример 17.11. rankOm, „ = 0, rank [1 2 3]=1,
j
16
В § 4.4 для квадратных матриц было введено понятие минора,
Будем употреблять это понятие и в том случае, когда матрица не
квадратная. Нас интересуют порядки тех миноров матриц, которые
отличны от нуля, а именно — максимальные среди таких порядков.
Определение 17.14. Минор М порядка г матрицы А назы-
называется базисным минором матрицы А, если выполняются следую-
следующие два условия:
1) МФО;
2) все миноры матрицы А, порядки которых больше г, равны
нулц).
Теорема 17.6. (теорема о ранге матрицы). Ранг матрицы равен
порядку ее базисных миноров.
В доказательстве этой теоремы используются следующие две
леммы.
Лемма 17.2. Если столбцы (строки) квадратной матрицы ли-
линейно зависимы, то ее определитель равен нулю.
> Пусть А — квадратная матрица порядка я, система столбцов
которой линейно зависима. При п=\ Л = 0. При п>\ какой-либо
из столбцов матрицы А линейно выражается через остальные, поэ-
поэтому ее определитель равен нулю.«4
Лемма 17.3. Пусть для /=1, 2, ... , k
а/ = [ан a2i ... art ar + u ... ami]Ty bi = [au a2i ari]Ty
т. е. столбец b, получается из столбца а, после исключения всех
элементов, начиная с (г-\-1)-го. Если система столбцов
а,, а2, ..., а* B)
линейно зависима, то линейно зависима и система столбцов
Ьь Ь2, ..., Ь*. C)
> Рассмотрим нетривиальную линейную комбинацию столбцов
B), равную нулевому столбцу:
р1а1 + р2а2 + - + Р*а* = 0. D)
Равенство D) равносильно системе равенств
Р1а/1Н-р2а/2Н-... + рла/л=0, /=1, 2, ..., m,
а система первых г этих равенств (/=1, 2, ... , г) равносильна ра-
равенству
Последнее означает линейную зависимость системы столбцов C).<4
Перейдем к доказательству непосредственно теоремы о ранге
матрицы.
> Для нулевых матриц теорема очевидна, для ненулевых доста-
достаточно доказать, что именно те г столбцов, в которых расположен
базисный минор, составляют базис системы столбцов рассматри-
рассматриваемой матрицы.
17
Пусть Л — ненулевая матрица вида (l)> M — ее базисный минор
порядка г. Для упрощения обозначений будем считать, что минор М
занимает левый верхний угол матрицы Л, т. е. расположен в ее
строках и столбцах с номерами 1, 2, ... , г. Согласно лемме 17.2,
столбцы минора М линейно независимы, а поэтому в силу леммы
17.3 линейно независимы и первые г столбцов матрицы Л. Остается
доказать, что при п>г для / = r-fl, ... , п каждый 1-й столбец мат-
матрицы А линейно выражается через г первых столбцов. С этой целью
для каждого /=1, 2, ... , т рассмотрим вспомогательный опреде-
определитель
п\\ ... п\г пи
аг\
arr
aiX ... air аи
получающийся «окаймлением» минора М соответствующими эле-
элементами /-й строки и /-го столбца. При любом / <^=0. В самом деле,
если /^г, то di содержит две равные строки. Если же />г, то dt —
минор матрицы Л, порядок которого больше, чем порядок базисного
минора.
Заметим, что алгебраические дополнения элементов последней
строки в определителе di не зависят от выбора номера /, и обозначим
эти дополнения Ль Л2, ..., Лг, Аг+\. Имеем АГ+\=М. Разложив
определитель di по элементам последней строки, получим
-\-A2ai2-\-...
или (МФО)
аи= —
==Oy /=1, 2, ..., т,
/=1, 2, ..., т.
Последняя система равенств означает, что /-й столбец матрицы А
есть линейная комбинация ее первых г столбцов. ^
Обратимся еще раз к доказательству теоремы о ранге матрицы и
заметим, что в нем не использовалось равенство нулю всех миноров
матрицы Л, порядки которых больше г. Мы рассматривали только те
миноры, которые имеют порядок г + 1 и «окаймляют» минор М,
т. е. содержат его целиком. Уже из равенства нулю только этих ми-
миноров следует, что каждый столбец матрицы А линейно выражается
через те ее столбцы, в которых расположен минор М. Поэтому из
доказательства теоремы о ранге матрицы вытекает следующее пра-
правило отыскания базисного минора: при отыскании базисного минора
следует переходить от миноров меньших порядков к минорам боль-
больших порядков. Если минор М порядка г не равен нулю, а все окайм-
окаймляющие его миноры порядка г + 1 равны нулю, то М — базисный
минор.
Пример 17.12. Вычислить ранг матрицы
18
0
4
10
1
4
8
18
7
10
18
40
17
1
7
17
3
Решение. Вначале найдем один из базисных миноров матрицы А. Начнем
О 4
с какого-либо минора второго порядка. Например, . ф 0.
Далее рассмотрим миноры третьего порядка, окаймляющие взятый минор:
О 4 10
4 8 18
10 18 40
0 4 10
4 4 8
10 18 40
0 4 2
4 0 0
10 8 4
= 0,
0
4
10
4
8
18
1
7
17
0 0 1
4 -20 7
10 -50 17
0 4 10
4 8 18
1 7 17
0 4 10
0 -20 -50
1 7 17
Все эти миноры равны нулю,
0 4
4 8
= 0,
0 4 1
4 8 7
1 7 3
0 4 1
0 —20 —5
1 7 3
= 0.
— базисный минор, rank А =2.
Отметим ряд важных следствий из теоремы о ранге матрицы.
Следствие 17.5. Ранг матрицы не меняется при ее транспони-
транспонировании, т. е. ранг матрицы равен рангу системы ее строк.
> При транспонировании матрицы транспонируются и все ее ми-
миноры, точнее ее «подматрицы», определителями которых являются
эти миноры. Но определитель не меняется при транспонировании. <4
Следствие 17.6. Если определитель квадратной матрицы равен
нулю, то ее строки (столбцы) линейно зависимы.
^ Пусть А — квадратная матрица порядка п и det A = 0. Тогда
порядок ее базисного минора меньше п и, следовательно, rank A <.
Объединив это следствие и лемму 17.1, получим следующую
теорему.
Теорема 17.7 (критерий равенства определителя нулю). Опре-
Определитель квадратной матрицы равен нулю тогда и только тогда,
когда ее строки (столбцы) линейно зависимы.
Следствие 17.7. Пусть в п-мерном линейном пространстве V
зафиксирован базис и векторы
я я я (*Л
d I do, ... , <xb \ *J ;
имеют в этом базисе координатные столбцы
Ai = [a\i a2l ... ani]T> i== 1, 2, ..., k.
Тогда:
1) ранг системы векторов E) равен рангу матрицы
= [А{А2 ... Ak} =
а
12
#21 #22
ап\
столбцами которой служат координатные столбцы этих векторов;
2) система векторов E) линейно независима, если и только если
гапкЛ = k\
3) система векторов E) является базисом пространства V тог-
тогда и только тогда, когда k = п и det А Ф 0;
4) векторы а,и а,2, ..., а,г составляют базис системы E) тогда
19
и только тогда, когда столбцы с номерами ix, /2, ..., ir содержат ба-
базисный минор порядка г матрицы А.
Доказательство следует непосредственно из вышесказанного.
Отметим еще два утверждения о ранге матрицы. Напомним, что
элементарными преобразованиями матрицы называются элементар-
элементарные преобразования ее строк или столбцов. Из предложения 17.8
и следствия 17.5 можно вывести
Следствие 17.8. Элементарные преобразования матрицы не
изменяют ее ранга.
Последнее утверждение упрощает вычисление ранга матрицы:
элементарными преобразованиями матрица приводится к столь про-
простому виду, что уже ясно, чему равен ее ранг.
Пример 17.13. Вычислить ранг матрицы
А =
25 31 17 43
75 94 54 134
75 94 53 132
25 32 20 48
Решение. Применим к матрице А элементарные преобразования:
25 31 17 43
0 13 5
0 0—1—2
0 0 0 0
Последняя матрица содержит отличный от нуля минор
25
75
75
25
31
94
94
32
17
54
53
20
43'
134
132
48
25
0
0
0
31
1
1
1
17
3
2
3
43
5
3
25
0
0
31
1
0
17
3
— 1
третьего порядка, а ее определитель равен нулю. Следовательно, rank А = 3.
Предложение 17.9. Ранг произведения двух матриц не выше
ранга каждого из сомножителей. Если один из сомножителей —
невырожденная матрица, то ранг произведения равен рангу второго
сомножителя.
> Из определения произведения матриц АВ (см. § 2.4) видно,
что строки матрицы АВ линейно выражаются через строки матри-
матрицы Ву а столбцы матрицы АВ линейно выражаются через столбцы
матрицы А. На основании предложения 17.7
rankAB < rank?, rankAB < гапкЛ.
Пусть теперь Л — квадратная невырожденная матрица. Согласно
доказанному выше, rank АВ ^ rank В. С другой стороны, В =
= А~1(АВ), поэтому rank В < rank А В. Следовательно, rankAB =
k
17.7. Связь между базисами
Пусть заданы я-мерное линейное пространство У, его базис
bj, b2, ..., Ъп
A)
20
и произвольная система п векторов
Ci, c2, ..., с„. B)
Пусть, далее,
#w, a2i> ..., ani C)
являются координатами вектора а в базисе (Г). Запишем матрицу
"#и #12 ••• а\пЛ
w #21 #22 ••• #2л
ап\ #п2 ••• d
/-й столбец которой есть столбец координат C), /= 1, 2, ..., п. Мы
уже знаем, что система векторов B) является базисом простран-
пространства V, если и только если det МФО (см. следствие 17.7). Матри-
Матрица М называется матрицей перехода от базиса A) к системе векто-
векторов B).
Введя строки [Ь{ Ь2 ... Ья] и [с, с2 ... ся], получим
[с, с2 ... Cn] = [bi b2 ... Ъп]М. D)
Формула D) с невырожденной матрицей М выражает связь меж-
между любыми двумя базисами пространства: если базис A) считать
исходным, то любой другой базис получается по формуле D) при
подходящем выборе матрицы перехода М. Обратно, взяв в качестве
М произвольную невырожденную матрицу порядка п над основным
полем, получим по формуле D) некоторый базис с,, с2, ... , сп.
17.8. Преобразование координат
Задача преобразования координат состоит в установлении связи
между координатами вектора в разных базисах. Связь между этими
базисами предполагается известной. Мы уже решали эту задачу
для пространства свободных векторов (см. § 12.9). Пусть теперь
у — ^-мерное линейное пространство, его базисы —
ЬХУ Ь2, ..., Ьп A)
и
сь с2, ..., сп, B)
М — матрица перехода от базиса A) к базису B). Пусть, далее,
X и Y — координатные столбцы вектора а в базисах A) и B)
соответственно, В — строка векторов A), С — строка векторов B).
Тогда а=ВХ = СУ. Но С=ВМ, поэтому BX = (BM)Y = В (Л! У),
В (Л" — MY) = 0. Последнее равенство указывает на то, что X —
— MY—координатный столбец нулевого вектора в базисе A).
Однако координаты вектора в фиксированном базисе определены
однозначно и, в частности, все координаты нулевого вектора равны
нулю. Поэтому X — MY — нулевой столбец, и
X = MY. C)
21
Формула C) выражает зависимость между координатами век-
вектора а в базисах A) и B): координатный столбец вектора а в ба-
базисе A) получается из координатного столбца в базисе B) умноже-
умножением слева на матрицу перехода от базиса A) к базису B).
Отметим, что detiW^=O, поскольку М — матрица перехода от
одного базиса к другому.
Если
Х =
х2
у
У2
.У п.
, м =
'п\\ п\2 ... п\п
а<1\ #22 • • • #2/г
ап\ ап2 ... апп_
то равенство C) равносильно следующей системе равенств:
хх = аиух-
Ч = п2\У\ + Я22#2 + -• + (*2пУп,
хп = ап\У\ +ап2у2-
Обратно, пусть М — произвольная квадратная матрица порядка
п с определителем, отличным от нуля, система векторов A) —ба-
—базис пространства V, ВМ = [сх с2 ... ся]. Тогда система векторов с|?
с2, •- , сп также является базисом, и формула C) выражает зави-
зависимость между координатами произвольного вектора в этих двух
базисах.
Итак, всякая формула вида C) с произвольной невырожденной
матрицей М может использоваться как формула преобразования
координат вектора при переходе к новому базису.
17.9. Подпространство
Определение 17.15. Пусть V — линейное пространство над по-
полем Р. Непустое подмножество U пространства V называется под-
подпространством пространства V, если оно удовлетворяет следующим
двум условиям:
1) a + b? U для любых векторов a, b 6 U {U замкнуто относи-
относительно сложения);
2) aa^U для любого вектора a?f/ и любого числа а?Р (U
замкнуто относительно умножения векторов на числа).
Очевидно, что совокупность условий 1 и 2 равносильна следую-
следующему условию: оса + (ЗЬ 6 U для любых векторов a, b 6 U и любых
чисел ее, р ? Р.
Из определения подпространства следует, что всякое подпро-
подпространство U линейного пространства V над полем Р само является
линейным пространством над этим полем, если выполнять операции
сложения векторов из (У и умножения их на числа из Р по правилам,
определенным для пространства V.
Множество {0}, содержащее только нулевой вектор пространства
1/, удовлетворяет условиям 1 и 2 и, следовательно, является под-
22
пространством пространства V. Это подпространство называется
нулевым. С другой стороны, все пространство V является своим
подпространством.
Общий способ получения подпространств заключается в следую-
следующем. Возьмем в пространстве V произвольные векторы
а„ а2, ..., а*. A)
Так как сумма линейных комбинаций векторов A) и произве-
произведение линейной комбинации этих векторов на число также являются
линейными комбинациями векторов A), то множество всех линей-
линейных комбинаций векторов A) является подпространством простран-
пространства V. Это подпространство называют линейной оболочкой векто-
векторов A) и обозначают L(a,, a2, ..., а*). Векторы A) называют
системой образующих подпространства L = L(a.u a2, ..., а*).
Очевидно, что базис системы векторов A) является базисом
пространства L, и, следовательно, размерность пространства L равна
рангу системы векторов A).
Предложение 17.10. Каждое подпространство U п-мерного ли-
линейного пространства V конечномерно, причем dim U ^ л. Если
dim U = п, то U = V.
> Пусть а, — ненулевой вектор из пространства U. Тогда
L(a,)czf/. Если L(a1)=f/, то а, — базис пространства U. В про-
противном случае в U существует вектор а2, такой, что ЗгбЦа,).
Согласно предложению 17.3, система аь а2 линейно независима.
Имеем L(a,, a2)czf/. Если L(a,, a2)=(/, то а,, а2 — базис прост-
пространства U. В противном случае в U существует такой вектор а3, что
азбЦаь аг), и система векторов а,, а2, а3 линейно независима.
Повторяя аналогичные рассуждения достаточное число раз, мы
получим базис а,, а2, ..., а^ пространства U. Для этого потребуется
не более п шагов, поскольку любая система п + 1 векторов в прост-
пространстве V линейно зависима. Итак, k ^ п. Если же k = n, то постро-
построенная система а,, а2, ..., а& является базисом пространства 1/, поэ-
поэтому Vr = L(a1, a2, ..., &k)=U.<4
17.10. Сумма и пересечение подпространств
ПуСТЬ Ut,U2,...,Uk A)
являются подпространствами линейного пространства V.
Определение 17.16. Пересечением подпространств A) назы-
называется множество всех векторов, принадлежащих каждому из этих
подпространств. Суммой подпространств A) называется множество
всех векторов а пространства V, представимых в виде
а = а, + а2+ ••• + аЛ, а(- 6 ?Л, /== 1, 2, ..., &.
Обозначим пересечение подпространств A)
Ux[\U2{\...[\Uk или П Uи
/=1
23
а их сумму
?/, + U2 + ... + Uk или 2 Ui.
Предложение 17J1. Сумма и пересечение подпространств ли-
линейного пространства являются его подпространствами.
> Пусть A) — подпространства пространства 1/, U — их сумма.
Заметим, что U Ф 0, поскольку О ? U. Пусть a, b ? ?/, а, р — числа
из основного поля. Векторы а и b можно записать в виде
а = а, + а2 + ... + a*, b = b, + b2 + ... + Ь*,
где а/, Ь/6 Ui9 i= I, 2, ..., /г, поэтому
аа + pb = (аа, + pb,) + (аа2 + pb2) + ... + (оса* + pb*)-
Поскольку Ui — подпространство, то аа( + pb; g t/(, аа + pb g ?/,
т. е. t/ — подпространство.
Доказательство того, что пересечение подпространств линейного
пространства является его подпространством, мы оставляем чита-
читателю. <4
Теорема 17.8. Размерность суммы двух конечномерных под-
подпространств линейного пространства равна сумме их размерностей
минус размерность пересечения.
> Если какое-либо из подпространств нулевое, теорема очевидна.
Пусть Ux и U2 — ненулевые конечномерные подпространства
линейного пространства V, А = Uх + U2i В = Ux f| U2. Пространство
В конечномерно, поскольку является подпространством конечно-
конечномерного пространства (/,. Пусть
Ь„ ..., Ьк B)
есть базис пространства В (в случае В = {0) система B) —пустое
множество). Дополним систему B) до базиса
Ь„ ..., ЬЛ, а„ ..., а/ C)
пространства U\ и до базиса
Ь„ ..., Ъку с,, ..., ст D)
пространства U2 (в случае В = {0) системы C) и D) —произволь-
—произвольные базисы пространств (/, и U2 соответственно) и рассмотрим
систему векторов
Ь„ ..., bky a,, ..., а/, с„ ..., ст. E)
Теорема будет доказана, если мы покажем, что система E) является
базисом пространства А.
Пусть а 6 Л. Тогда а = а, + а2, а/6 (У/, /=1, 2. Так как C) —
базис пространства ?/,, то а! линейно выражается через векторы C).
Аналогично а2 линейно выражается через систему D). Следова-
24
тельно, произвольный вектор а из пространства А линейно выра-
выражается через систему E).
Остается доказать, что система E) линейно независима. Пусть
о^Ь, + ... + оь*Ьл + Mi + - + М/ + YiC, + ... +УтСт = 0. F)
Перепишем равенство F) в виде
р,а, + ... + РА = - (y,c, + ... + YmCw) G)
и обозначим буквой с правую часть этого равенства. Далее имеем
с? ?/, П ^2у и> следовательно,
С = — (YiC, + ... + УтСт) ? В.
Итак, вектор с линейно выражается через базис B) простран-
пространства В:
Сравнивая два разложения вектора с, получаем Yi = ••• = Y^ = 0,
поскольку координаты вектора в заданном базисе определены одно-
однозначно. Из равенства G) теперь находим ах = ... = а* = $х = ...==
= |3/ = 0. Итак, из равенства F) следует равенство нулю всех коэф-
коэффициентов, так что система E) линейно независима. А
17.11. Прямая сумма подпространств
Пусть S — сумма ненулевых подпространств
Ub U2y ..., (Д A)
линейного пространства V. По определению 5 — множество всех
векторов а пространства 1/, которые представимы в виде суммы
слагаемых, взятых по одному из каждого подпространства [/,-:
a = u1 + u2 + ,., + m, UitUi, /=1, 2, ..., k. B)
Определение 17.17. Сумма S подпространств называется
прямой суммой, если каждый ее вектор а лишь одним способом
может быть представлен в виде B). Иными словами, сумма S пря-
прямая, если из каждого равенства вида
Ul + U2 + ... + Uk = V! + V2 + ... + V*,
где u(, v( ? Vl} следует равенство соответствующих слагаемых: и,- =
= v/, /=1, 2, ..., k.
Если сумма 5 прямая, то будем писать:
S = Ux®U2®..-®Uk. C)
Пусть 5 — прямая сумма C). Тогда по определению из условия
Ul + u2 + ... + u^ = 0, meUi, /=l, 2, ..., Л, D)
25
для всех слагаемых и, следуют равенства:
и, = 0, /=1, 2, ..., к. E)
Важно заметить, что последнее условие является и достаточным
для того, чтобы сумма S была прямой, а именно, верно
Предложение 17.12. Пусть из всякого условия вида D) следуют
равенства E). Тогда сумма подпространств A) прямая.
> Пусть
U, + 112 + ... + U* = V, + V2 + ... + V*,
где u,-, v/ 6 Ui. Тогда
(и, — v,) + (и2 — v2) + ... + (и* — V*) = О,
Предложение 17.13. Для того чтобы сумма подпространств была
прямой, необходимо и достаточно, чтобы каждое из этих подпрост-
подпространств пересекалось с суммой всех остальных слагаемых только
по нулевому подпространству.
> Пусть S — прямая сумма подпространств A). Возьмем про-
произвольный вектор v, принадлежащий пересечению какого-либо из
подпространств A), например подпространства (/,, с суммой всех
остальных подпространств A). Имеем:
v = u2 + ...+ u*, Ui?Ui, / = 2, ..., k,
или, если v = —иь
Ul + u2 + ... + u* = 0, U/б^Л, «=1, 2, ..., к.
Но сумма S прямая, поэтому из последнего равенства следует ра-
равенство нулю каждого слагаемого и(. В частности, ^ = 0, v =
= —u, =0,
Пусть, обратно, условие предложения 17.13 выполняется, и пусть
верно равенство D). Перепишем это равенство в виде
— Ul =U2+ ...+ U*.
Левая часть последнего равенства представляет собой вектор из
подпространства U\y правая — вектор из подпространства ?/2 + ... +
+ Uk. Но это один и тот же вектор, следовательно, он входит в пе-
пересечение Ul (](U2 + ... + Uk). Имеем: — u,=0, u,=0. Аналогично
доказывается, что и2 = 0, ..., u^ = 0.^
Предложение 17.14. Пусть S — прямая сумма подпространств
A), b;i, Ь/2, ..., bin. — базис подпространства Ui, /=1,2, ..., k. Тогда
система векторов
ьп, ь1П), ъ21, ..., ь2п2, ..., ьЛ1, ..., bknk
26
является базисом пространства S. Размерность прямой суммы ко-
конечномерных подпространств равна сумме их размерностей.
> При k = 2 это утверждение следует из доказательства теоремы
17.8, при k>2 доказывается по индукции. 4|
Упражнения
1. Сравните определения прямой суммы подпространств и прямой суммы абе-
левых групп.
2. Приведите примеры прямой суммы подпространств в трехмерном простран-
пространстве свободных векторов.
18. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
В первой части данного пособия рассматривались системы ли-
линейных уравнений, матрицы и определители над полем действитель-
действительных чисел. Отмечалось, что все введенные понятия и полученные
результаты сохраняются и в случае произвольного поля. В частности,
метод Гаусса решения систем линейных уравнений, теория опре-
определителей и правило Крамера дословно переносятся на случай про-
произвольного основного поля. Это касается не только приведенных
результатов, но и их доказательств. В новом доказательстве нужда-
нуждается только утверждение о равенстве нулю определителя, содержа-
содержащего две одинаковые строки.
В этой главе излагается теория систем линейных уравнений
над произвольным полем. Приводится критерий совместности си-
системы. Обсуждается вопрос о числе ее решений.
18.1. Критерий совместности системы линейных уравнений
Пусть Р — произвольное поле. Рассмотрим, как это делалось
ранее для поля действительных чисел, совокупность k уравнений:
[
dknXn = bk, )
[ о)
ak\X\ + + b )
где dij, bi — элементы поля P\ x{, x2> ..., xn — неизвестные. Эта со-
совокупность называется системой линейных уравнений над полем
Реп неизвестными, ац — коэффициентами системы, bi — свобод-
свободными членами.
Последовательность (A,i, A,2, ..., К) элементов поля Р называется
решением системы A), если верны равенства
\n^n = bl, I
knK = bky )
а11^1 .
¦
~\~ ak.2^2 ~\~ ••• ~\~ '
т. е. если после подстановки в каждое из уравнений A) вместо не-
неизвестных Xi соответствующих чисел А,;, /= 1, 2, ..., я, это уравнение
превращается в верное равенство.
Система называется совместной, если она имеет хотя бы одно
решение, и несовместной в противном случае.
27
Системы линейных уравнений называются эквивалентными, если
множества их решений совпадают.
Матрица
А =
а\\
составленная из коэффициентов системы A), называется матрицей
(основной) системы A). Если к матрице А приписать справа стол-
столбец свободных членов системы A), то получится матрица
А =
а\\ 012 ... ai/i b
... akn bk
которая называется расширенной матрицей системы A).
Систему уравнений A) можно записать в виде одного матрич-
матричного уравнения АХ = В, где X и В— столбцы неизвестных и сво-
свободных членов соответственно:
Х = \хх х2 ... хп}\ В = \ЬХ Ь2 ... Ьп]т.
Решения системы уравнений A) удобно интерпретировать как
векторы пространства Рп столбцов (или строк): столбец AJ =
= [А,1 А,2 ... kn]T (или строка Л) есть решение системы A), если
А\т =В.
Как отмечалось выше, все решения системы линейных уравне-
уравнений можно найти методом Гаусса. Однако часто бывает важно не
решить саму систему, а выяснить, есть ли у нее решения и сколько
их. К ответу на такие вопросы мы и приступаем.
Теорема 18.1 (критерий Кронекера — Капелли совместности
системы линейных уравнений). Система линейных уравнений сов-
совместна тогда и только тогда, когда ранг матрицы этой системы ра-
равен рангу ее расширенной матрицы.
> Система A) совместна тогда и только тогда, когда в поле Р
существуют такие числа А,1э А,2, ..., А,„, что верны равенства B).
Обозначив столбцы матрицы А через Л,, А2, ..., Ап, заметим, что
совокупность равенств B) равносильна равенству
которое означает, что последний столбец матрицы А линейно вы-
выражается через столбцы матрицы А. Следовательно, система A)
совместна тогда и только тогда, когда последний столбец матрицы
А линейно выражается через столбцы матрицы А. Согласно лемме
17.1, это имеет место тогда и лишь тогда, когда ранг системы
столбцов матрицы А равен рангу системы столбцов матрицы Л,
т. е. ранги этих матриц равны. ^
28
18.2. Однородные системы линейных уравнений
Система линейных уравнений называется однородной, если все
ее свободные члены равны нулю. Такая система всегда совместна:
она имеет нулевое решение. Если истолковывать ее решения как
векторы пространства Рп строк над основным полем Р (п — число
неизвестных), то обнаруживается прямая связь между подпростран-
подпространствами этого пространства и системами линейных уравнений. Подоб-
Подобно тому как плоскость и прямая в декартовой системе координат за-
задаются линейным уравнением или двумя линейными уравнениями,
подпространства описываются однородными системами линейных
уравнений.
Теорема 18.2. 1. Множество всех решений однородной системы
линейных уравнений с п неизвестными является подпространством
размерности п — г, где г — ранг матрицы системы.
2. Для любого подпространства U пространства Рп существует
такая однородная система линейных уравнений с п неизвестными,
множество всех решений которой совпадает с U. Если U Ф Рп, то
минимальное число уравнений в такой системе равно п — dim U.
> 1. Пусть
АХ = О A)
есть однородная система линейных уравнений над полем Реп не-
неизвестными, А — ненулевая матрица, U — множество всех решений
системы A), a, b ? U, а, р?Р. Тогда Л(аа + РЬ) = а(Ла) + Р(ЛЬ).
Но Ла = ЛЬ = 0, поэтому Л(аа+рЬ) = 0, aa + pb??/, (У — под-
подпространство в Рп.
В § 2.3 было доказано, что система A) эквивалентна (воз-
(возможно, после перенумерации неизвестных) некоторой системе сту-
ступенчатого вида:
а\\Х\ + a 12*2 + • • • + a i rx,
B)
1
J
Дтг*г + #r г-+-1а:г_j-1 + ... -f-arnXn -
где r = rank Л; a^ =^= 0, / = 1, 2, ... , г. Если r = я, система B) имеет
единственное решение, следовательно, U = {0}.
Пусть г<п. Неизвестные *r+i» -••, *п считаем свободными.
Придавая свободным неизвестным произвольные значения из по-
поля Р и вычисляя с помощью уравнений B) значения остальных
неизвестных, находим подпространство U всех решений системы
B) и, следовательно, системы A). Для того чтобы построить базис
подпространства (У, будем поочередно придавать свободным неиз-
неизвестным следующие значения:
Аг-|_1 — и, лг-|_2 — 1 , *г + 3 — ••• — Хп — U,
%г 4¦ ! =...== #я — 1 =0, Xrt = 1 .
29
Пусть
К 0...0 1 0 ... О],
где /= 1, 2, ... , п — г,— соответствующие этим значениям свобод-
свободных неизвестных решения системы B). Покажем, что векторы
составляют базис подпространства U. Во-первых, они линейно не-
независимы, так как ранг матрицы
А/ц A,i2 ... A,ir 1 0 ... О
А/21 А,22 ••• А,2г 0 1 ... О
f^n — г
1 — г 2
К-г г О О
1
строками которой они являются, равен г. Пусть, во-вторых, строка
b = [aj a2 ••• ап] является решением системы B). Положим
d = b — ar+ {cx — ... — ancn-r.
Так как векторы с,, с2, ..., сп_г, b принадлежат подпространству U,
то и d б U, т. е. А — решение системы B). Все координаты вектора d,
начиная с (г+1)-й, равны нулю, т. е. d получается при нулевых
значениях свободных неизвестных. Но решение однородной системы,
соответствующее нулевым значениям свободных неизвестных, яв-
является нулевым, т. е.
d = 0, b = оьг + iCi + ar+2C2 + ... + ancn_r.
Итак, C) —базис подпространства U. Следовательно, dim(/ =
= п — г, т. е. первое утверждение теоремы доказано.
2. Как отмечалось выше, нулевое подпространство совпадает с
множеством решений однородной системы, ранг матрицы которой
равен п. С другой стороны, Рп — множество решений однородной
системы, все коэффициенты которой — нули. Пусть теперь U —
подпространство в Pn, dim(/ = m, ОФ тф п. Возьмем в U какой-
либо базис
b2,
D)
и рассмотрим матрицу
В =
Ь<1\ Ь22
т\
Ьт2
Ь,
ь2
составленную из строк bf. Ее ранг равен т. Для определенности
будем считать, что базисный минор этой матрицы расположен в
последних т столбцах. Как показано в § 4.8, матрицу В с помощью
элементарных преобразований строк можно привести к виду
30
'аи
_am\
an ...
a22 ...
am2 ...
a\
a2
am
n
n
n
— m
— m
— m
l
0
0
0
1
0
... 0
... 0
... 1
Запишем теперь систему уравнений:
dm \Xn = X i,
ат2Хп = Х2,
E)
л — т^п — т + 2 "]~ ••• "г
и покажем, что она искомая, т. е. множество ее решений совпа-
совпадает с подпространством U. В самом деле, система т строк матри-
матрицы С эквивалентна базису D) подпространства U и, следовательно,
сама является в U базисом. Поэтому U есть линейная оболочка
строк матрицы С, т. е. множество всех строк вида
^Ajfljl ~~\~ А/2^21 ~~Г~ ••* ~~Г~ ^/п^/п!» ••• ) Ajflj п — т ~\~ •*• ~Т~
I ^т^пг п — ту ™\i ™2* ••• * *^т)*
С другой стороны, очевидно, что множество всех решений систе-
системы E) такое же (кх, А,2, ... , Кт — значения свободных неизвестных
Хп — т-f-1) Хц — ffi-\-2y •••) Xfij.
Для завершения доказательства теоремы остается заметить, что
число г линейно независимых строк в матрице однородной системы
линейных уравнений, задающей m-мерное подпространство, должно
быть равным п — т, поскольку т = п — г. 4
Замечание. Очевидно, что при построении однородной системы линейных
уравнений, задающей подпространство U, вместо базиса D) можно брать произ-
произвольную конечную систему образующих этого пространства.
Следствие 18.1. Однородная система линейных уравнений
имеет ненулевое решение тогда и лишь тогда, когда ранг ее матрицы
меньше числа неизвестных. В частности, однородная система п
линейных уравнений с п неизвестными имеет ненулевое решение,
если и только если ее определитель равен нулю.
Базис пространства решений однородной системы линейных урав-
уравнений называют также ее фундаментальной системой решений.
Пример 18.1. Найти фундаментальную систему решений однородной системы
линейных уравнений:
2
Ъх2
х
4*,
*4 = 0, ^
*4 = 0, I
*4 = 0, f
х4 = 0. )
Решение. Выпишем матрицу системы и с помощью элементарных преобра-
преобразований строк приведем ее к ступенчатому виду:
" 1 2 4 -31 Г 1 2 4-3
3 5 6—4 0—1—6 5
4 5—2 3 ""* 0 — 3 —18 15
3 8 24—19 0 2 12—10
[12 4 -3]
Т.0 -1-6 5J
31
Заметим, что последняя матрица эквивалентна матрице
[10—8 '
[О 1 6 —{
Следовательно, исходная система эквивалентна системе
х2 -\~ бл^з — ЬхА — 0.
Неизвестные хъ, хА считаем свободными и записываем систем>¦ F) в виде
х2 = —
F)
G)
Положим сначала *3=1, *4 = ° и найдем из системы G) значения *,, х2:
х, =8, х2 = —6. Затем положим хъ = 0, х4 = 1 и снова найдем из системы G) зна-
значения хх = — 7, х2 = 5. Заметим, что при этом удобно пользоваться следующей
схемой:
хх
8
— 7
х2
-6
5
*з
1
0
*4
0
1
Итак, решения (8, —6, 1, 0) и ( — 7, 5, 0, 1) составляют искомую фундаменталь-
фундаментальную систему решений.
Пример 18.2. Найти однородную систему линейных уравнений, задающую ли-
линейную оболочку L(bi, b2, b3), где bi =A, — 1, 1, 0); Ь2 = A, 1, 0, 1); Ь3 = B, 0, 1, 1).
Решение. Рассмотрим матрицу, составленную из строк Ь,, и преобразуем ее
р „1 1 (Л Г1 -1 1 0] V {__{ { 0]
1 1 о 1 U 1 1 1 oN
L2 о 1 1J Lo о о оJ L J
Следовательно, искомая система имеет вид
*4 = *1. 1
Х4 = Х2- J
Упражнения
1. Докажите, что однородная система линейных уравнений с действительными
коэффициентами, имеющая ненулевое комплексное решение, имеет и ненулевое дейст-
действительное решение.
2. Докажите, что фундаментальная система действительных решений однород-
однородной системы линейных уравнений с действительными коэффициентами является
фундаментальной системой решений этой же однородной системы уравнений, рас-
рассматриваемой над полем комплексных чисел.
3. Докажите, что если суммы элементов в каждой строке и каждом столбце
квадратной матрицы равны нулю, то алгебраические дополнения всех ее элементов
равны.
18.3. Связь между решениями произвольной и соответствующей
однородной систем линейных уравнений
Пусть задана произвольная система линейных уравнений
АХ = В. A)
32
Однородная система
АХ = О B)
с той же матрицей А называется приведенной для системы A).
Между решениями этих двух систем существует тесная связь, ко-
которую раскрывает
Теорема 18.3. Если столбец а является решением системы A),
а подпространство U пространства Рп столбцов — множеством всех
решений приведенной системы B), то множество всех решений
системы A) совпадает с множеством a-\-U = {a.-\-u\u?U).
Доказательство этой теоремы основано на следующих двух
леммах.
Лемма 18.1. Если а — решение системы A), и — решение си-
системы B), го а + и — решение системы A).
> Л(а + и) = Ла + Ли = 5 + 0 = 5.<Ц
Аналогично доказывается
Лемма 18.2. Если а и b — решения системы (I), то & — b — ре-
решение системы B).
Перейдем к доказательству теоремы 18.3.
> Пусть система A) совместна, а — одно из ее решений, W —
множество всех решений системы. Согласно лемме 18.1, а+ U^W.
С другой стороны, если w ? W, то по лемме 18.2 w — a = u??/,
w = a + u6a+?/, W^a+U. Следовательно, W = a+ U.A
Следствие 18.2. Система линейных уравнений имеет един-
единственное решение, если и только если ранги ее основной и рас-
расширенной матриц равны числу неизвестных.
19. ЛИНЕЙНЫЕ ОПЕРАТОРЫ
В этой главе изучаются линейные операторы линейных прост-
пространств. Раскрывается тесная связь теории линейных операторов с
теорией матриц.
19.1. Определение и простейшие свойства линейных операторов
Определение 19.1. Пусть V и W — линейные пространства
над одним и тем же полем Р. Отображение /: V-*~ W называется
линейным оператором пространства V в пространство W, если оно
удовлетворяет следующим двум условиям:
1) /(а + Ь) = /(а) + /(Ь) для любых векторов a, b 6 V\
2) /(оьа) = а/(а) для любого вектора а 6 V и любого числа а?Р.
Очевидно, что совокупность условий 1 и 2 равносильна следую-
следующему условию: /(оьа + pb) = а/(а) + Р/(Ь) для любых векторов a, b 6 V
и любых чисел а, р 6 Р-
Линейный оператор пространства V в себя называется линей-
линейным оператором (или линейным преобразованием) пространства V.
Пример 19.1. Для произвольного линейного пространства тождественное отоб-
отображение является линейным оператором.
3. Зак. 6466 33
Пример 19.2. Пусть V и W — линейные пространства над одним и тем же полем.
Отображение 0: V-+W, ставящее в соответствие каждому вектору пространства V
нулевой вектор пространства W, является линейным оператором пространства V
в пространство W. Этот оператор называется нулевым.
Пример 19.3. Пусть Р — поле, V = Р[х]. Отображение пространства V в себя,
ставящее в соответствие каждому многочлену из Р[х] его производную, является
линейным оператором пространства V. Этот оператор называется дифференциро-
дифференцированием пространства Р[х\.
Пример 19.4. Пусть V = Ul ф U<2 — прямая сумма подпространств. Любой вектор
а? V однозначно представляется в виде а = a, -f- а2, а, ? Ui, / = 1, 2. Назовем вектор
а.\ проекцией вектора а на подпространство U\ параллельно подпространству ?/2.
Отображение V-*U\, ставящее в соответствие каждому вектору а его проекцию at,
является линейным оператором пространства V. Назовем этот оператор проектором
пространства V на подпространство U{ параллельно подпространству U2. Анало-
Аналогично определяется проектор на подпространство U2.
Отметим простейшие свойства линейных операторов. Пусть V,
W — линейные пространства над одним и тем же полем Р, 0v, 0w —
нулевые векторы в пространствах V и W соответственно, /: V-+W —
линейный оператор.
1. /@ ) = 0 Для любого вектора а пространства V /( — а) =
= -f(a).
> Полагая в равенстве /(аа) = а/(а) а = 0 и а— — 1, получаем
требуемое.-^
2. Для любых векторов аь а2, ..., а^ пространства V и любых
чисел хи х2, ..., Xk из поля Р
xj(b{) + x2f(a2) + ... + xkf(ak).
> Достаточно применить индукцию по k.4
Свойство 2 иногда удобно формулировать в следующем виде: если
х = [а, а2 ...
где Х = [х\, х2 ... xk]T — матрица-столбец, то
nx) = \f{*x) /(a2) ... f(ak)]X.
3. Если система векторов
а,, а2, .... а* A)
пространства V линейно зависима, то и система векторов
Да,), /(а2), ..., /(а*) B)
пространства W линейно зависима.
> Если а,а, + а2а2 + ••• + а-kbk = 0у, то
а,/(а,) + а2/(а2) +
= /(а,а, + а2а2 + ...
4. Если U — подпространство пространства V, то f(U) — под-
подпространство пространства W. В частности, f(V) — подпростран-
подпространство пространства W.
> Так как U ф 0, то и f(U) ф 0. Далее, пусть v, и v2 — векторы
из /(?/). Тогда v/ = /(Ui), u, 6 U3 i= 1, 2. Для любых а, Р?Я
34
«v, + 0v2 = о/(и,) + p/(u2) =-/(ou, + pu2).
Поскольку U — подпространство, aui + eu26?/. Но тогда f(au, +
+ puNf(uH
5. Если A) — система образующих подпространства U прост-
пространства V, то B) — система образующих подпространства f(U) и
dim/(?/)< dim ?/. C)
> Если b ?/(?/), то Ь = /(а) для некоторого вектора а??Л
Так как A) —система образующих подпространства (У, то а =
= [ai аг ... 3.k]Xy X^Pkj. Следовательно (согласно свойству 2),
b = /(a) = [/(a,) f(a2) ... f(ak)]X.
Доказано, что B) — система образующих подпространства f(U).
В частности, если A) —базис подпространства ?/, то B) —систе-
—система образующих для f(U) и либо все ее векторы нулевые, а следова-
следовательно, /(?/) = {ОД либо она содержит базис пространства f(U).
В любом случае верно неравенство C).^
Следующая теорема указывает на тот факт, что линейный опе-
оператор пространства V в пространство W однозначно определяется
образами векторов какого-либо базиса пространства V, причем
этими образами могут быть произвольные векторы пространства W.
Теорема 19.1. Пусть даны линейные пространства V и W над
полем Р, базис пространства V
v,, v2, ..., \п D)
и произвольная система векторов
w,, w2, ..., wn E)
пространства W. Тогда существует единственный линейный опера-
оператор f: V-+- W, при котором
/(v<) = w(, i=l, 2, ..., п. F)
> Сначала докажем существование этого линейного оператора.
Определим отображение /: V-^W с помощью формулы /(x) = wX,
где х — произвольный вектор пространства V; X — его координат-
координатный столбец в базисе D); w = [wj w2 ... wn]. Так как в базисе D)
/-я координата вектора vf равна 1, а все остальные — 0, то
/(v,-) = [wi w2 ... wn] [0 ... 1 ... Of = w/,
т. е. верны равенства F).
Покажем, что / — линейный оператор. Пусть у ? V, Y — коорди-
координатный столбец вектора у в базисе D), а, р 6 Р- Координатным
столбцом вектора ax-f Ру в том же базисе служит aX+fiY, сле-
следовательно,
/(ах + ру) = w(aX + рУ) - a(wX) + p(wF) =
/() + Р/()
35
Итак, / — искомый линейный оператор.
Теперь докажем единственность оператора /. Если g: V-+W—
такой линейный оператор, что g(v?-) = w,-, /= 1, 2, ..., я, и х— про-
произвольный вектор из V с координатным столбцом X в базисе D), то
x = [vi v2 ... vn]X, a
*T(x) = fe(v1) g(v2) ... g(vn)]X = [vi w2 ... wJX = /(x).
Следовательно, g = f.<4
19.2. Действия с линейными операторами
Пусть V и W — линейные пространства над полем Р. Множество
всех линейных операторов пространства V в пространство W обоз-
обозначим символом L(Vj W). Введем на этом множестве алгебраиче-
алгебраическую операцию — сложение. Определим также операцию умноже-
умножения элементов множества L(V, W) на числа из поля Р.
Пусть /, g?L(V, W). Поставим в соответствие каждому вектору
а пространства V вектор /(a)-fg(a) пространства W. Тем самым
мы определим отображение h: V-+W, при котором А(а) = /(а) +
+ g(a) для любого вектора а 6 V. Отображение h называется сум-
суммой линейных операторов f и g.
Пусть теперь f?L(V, W), к?Р. Поставим в соответствие каждо-
каждому вектору а пространства V вектор Х/(а) пространства W. Этим
мы определили отображение /: V-+W, при котором /(а) = Х/(а) для
любого вектора a?V. Отображение / называется произведением
линейного оператора f на число X и обозначается Xf.
Предложение 19.1. Если fug — линейные операторы прост-
пространства V в пространство W, Х?Р, то f -f g и Xf — также линейные
операторы пространства V в пространство W.
> Докажем, что f + g?L(Vf W). Пусть a, b 6 V, а, р 6 Я. Тогда
(/ + g) («а + РЬ) = /(аа + pb) + g(aa + pb) =
= а/(а) + P/(b) + ag(a) + Pg(b) = a(/(a) + g(s)) + p(/(b) + g(b)) -
Второе утверждение доказывается аналогично. ^
Отметим некоторые другие свойства сложения линейных опера-
операторов и умножения линейного оператора на число. Для любых ли-
линейных операторов /, g, h и чисел а, р верны следующие равенства:
1) f + g = g + h
2) (f + g) + h = f + (g + h)',
3) / + 0 = /;
4) / + (-1)/ = 0.
Таким образом, множество L(V, W) является абелевой группой
относительно сложения.
5) (ор)/ = о(р/);
6) 1/ = /;
7) a(f + g) = af + ag;
8) (а + P)f = of + р/.
36
Следовательно, множество L(V, W) является линейным прост-
пространством над полем Р относительно сложения линейных опера-
операторов и умножения линейного оператора на число.
Доказательства равенств 1—8 следуют непосредственно из опре-
определения равенства отображений, поэтому мы оставляем их читателю.
Умножение линейных операторов будем понимать как умножение
отображений. Тогда верно
Предложение 19.2. Если f — линейный оператор пространства V
в пространство W, g — линейный оператор пространства W в про-
пространство U, то gf — линейный оператор пространства V в прост-
пространство U.
> Пусть а, Ь?1Л а, 0 6 Р. Тогда gf(a& + pb) = g(f(a& + 0b)) =
= g(af(&) + P/(b)) = ccg(/(a)) + Рг(ДЬ)) - a(gf) (a) + p(gfl (b) 6 U. <
Для нас наиболее важны такие линейные операторы /: V-+W,
когда первое и второе пространства совпадают, т. е. линейные опера-
операторы пространства V. Множество всех линейных операторов прост-
пространства V обозначается L(V). Очевидно, что если f, g 6 L(V)9 а 6 Р,
rofg, f + g, aft L(V).
19.3. Матрица линейного оператора
Пусть в пространстве V заданы линейный оператор / и базис
V!, V2, ... , У„. A)
Согласно теореме 19.1, оператор / однозначно определяется
векторами /(vi), /(v2), ..., /(vn), которые, в свою очередь, определяются
своими координатами в базисе A). Пусть Ai = \au an ... am]T, i=U
2, ..., пу — координатный столбец вектора /(v;), в базисе A). Соста-
Составим п Xя-матрицу
^11 CL\2 ••• а\п
АЛ] =
.а>п\ Оя2 ... апп
столбцами которой являются координатные столбцы векторов /(v;),
i=\9 2, ..., пу в базисе A). Из вышеизложенного следует, что
оператор / однозначно определяется матрицей А. Матрица А назы-
называется матрицей линейного оператора f в базисе A).
Пример 19.5. Тождественный оператор в любом базисе имеет единичную мат-
матрицу. Аналогично при любом выборе базиса матрица нулевого оператора нулевая.
Пример 19.6. Пусть П — плоскость, V2 — пространство всех свободных векторов
плоскости П, О — фиксированная точка плоскости П, а 6 R. Пусть, далее, х —
произвольный вектор пространства V2. Отложим вектор х от точки О, т. е. построим
такой отрезок ОМ, что OAf = x. Повернем отрезок ОМ в плоскости П вокруг
точки О на угол |а| против часовой стрелки при ос^О и по часовой стрелке при
а < 0. Полученный в результате отрезок обозначим ОМ'.
Рассмотрим теперь отображение /: V2-^^2> х-»-ОМ'. Читатель легко проверит,
используя рис. 19.1, что f не зависит от выбора начальной точки О и является
линейным оператором пространства V2. Этот оператор ниже будем называть опера-
оператором поворота плоскости на угол а.
37
О
Рис. 19.2
Найдем матрицу оператора поворота плоскости на угол а в базисе е1? е2, векторы
которого — единичные и взаимно ортогональные. В этом случае, как видно из
рис. 19.2,
f (e,) = cos a • в! + sin а • е2,
Дег) = — sin а • ei -f- c°s а • ег.
Следовательно, искомой матрицей является
[cos a —sin а
sin а cos а
Предложение 19.3. Пусть f — линейный оператор пространства
I/, А — п X п-матрица над основным полем. Матрица А является
матрицей оператора f в базисе (I), если и только если для любого
вектора х из пространства V с координатным столбцом X в базисе
A) образ /(х) этого вектора имеет в том же базисе координатный
столбец АХ.
> Пусть X — координатный столбец вектора х в базисе A),
А — матрица линейного оператора / в этом базисе.
V =
f(v2) ... f(vn)].
Тогда х = \Х и, следовательно, f(x) = v/X (см. § 19.1, свойство 2).
Но f(\i) = vAiy где Ai — столбец матрицы А с номером /, и, следова-
следовательно, w = wl. Поэтому /(х) = v/X = (\А)Х = \(АХ\ АХ — коорди-
координатный столбец вектора /(х) в базисе A).
Перейдем к доказательству достаточности нашего утверждения.
Так как для /=1, 2, ..., п координатный столбец /-го базисного
вектора V/ в базисе A) равен [0... 1 ...0}тУ где 1 стоит на /-м месте,
то координатный столбец вектора /(v;) в базисе A)
ап а
12
а\п
а2п
ап\
апп
¦р"
i
0
=
аи
а?
а,„
Следовательно, А — матрица линейного оператора / в бази-
базиAЫ
се
Важно заметить, что возможность задания с помощью матриц
характерна именно для линейных операторов, т. е. верна следующая
Теорема 19.2. Пусть /: V-+V — некоторое преобразование п-
мерного линейного пространства V над полем Р, A) — произволь-
38
ный базис в V. Преобразование f является линейным тогда и только
тогда, когда над полем Р существует такая п X п-матрица А, что
для любого вектора х с координатным столбцом X в базисе A) его
образ f(x) имеет координатный столбец АХ. Если это условие вы-
выполняется, то А — матрица оператора f в базисе A).
> Для линейного оператора / доказываемое утверждение следует
из предложения 19.3.
Обратно, пусть такая матрица А существует, X н Y — коорди-
координатные столбцы векторов х и у в базисе A), а, Р 6 Р. Тогда вектор
ах + Ру имеет в том же базисе координатный столбец aX-\-$Y, и,
следовательно, координатным столбцом вектора f (ах + Ру) служит
A(aX + $Y) = a(AX)-{-$(AY). Так как вектор однозначно опреде-
определяется своим координатным столбцом и правая часть последнего
равенства — координатный столбец вектора а/(х) + Р/(у), то /(ах+
+ Ру) = af(х) + pf(у); следовательно, / — линейный оператор. Со-
Согласно предложению 19.3, А — матрица оператора / в базисе A). ^
Важно подчеркнуть, что из двух предыдущих теорем вытекает,
в частности, следующее: если / — линейный оператор линейного
пространства I/, А — его матрица в базисе A), х— произвольный
вектор пространства I/, X и Y — координатные столбцы векторов х
и /(х) соответственно в том же базисе, то
C)
Обратно: всякая формула вида C), где
Х = [Х{ Х2 ... Xnf, У=\УХ У2 '" Уп?
и А — квадратная матрица порядка п над основным полем, задает
некоторый линейный оператор /, а именно, если координатный
столбец произвольного вектора х в базисе A) равен Ху то Y = АХ —
координатный столбец вектора /(х), А — матрица оператора f в том
же базисе.
Теорема 19.3. Пусть fy g — линейные операторы линейного про-
пространства V над полем Р, а?РУ А, В — матрицы операторов со-
соответственно f и g в базисе A). Тогда матрицами операторов
fey f + ё и af ^ том же базисе являются АВУ А + В и аА.
^ Докажем, что матрица произведения линейных операторов
равна произведению матриц сомножителей. Пусть X — координат-
координатный столбец произвольного вектора хв базисе A). Тогда вектор
g(x) имеет в том же базисе координатный столбец ВХУ а вектор
fg(x) = f(g(*)) — координатный столбец А (ВХ) = (АВ)Х. Согласно
предложению 19.3, АВ — матрица линейного оператора fg.
Случаи f-fgHaf рассматриваются аналогично.^
Введем еще понятия многочлена от матрицы и многочлена от
линейного оператора.
Пусть g(x) = a0 + axx + ... + amxm — многочлен с коэффициен-
коэффициентами из поля Р, А — квадратная матрица над этим полем. Значе-
Значением многочлена g(x) при х = А или просто многочленом g(A) на-
называется матрица а0Е + ахА + ... + аотЛт, где Е — единичная мат-
матрица того же порядка, что и А.
39
Предложение 19.4. Если g(x) и s(x) — многочлены над полем Ру
g(x)s(x) = h(x)y g(x) + s(x) = t(x)y A — квадратная матрица над по-
полем Р, то верны следующие равенства:
1) h(A) = g(A)s(A);
2) t(A) = g(A) + s(A).
> Докажем первое из этих равенств. Пусть
g(x) = ао + ахх + ... + amxmy s(x) = ро + fax + ... + fax1.
Тогда
h{) + + + m + ly yk = 2 а,ру,
где k = 0y 1, ..., m + L Далее:
g(A) = а0Е + ахА + ... + amAm, s(A) =
g(A) s(A) = осоро? + (осоР, + а1р0И
E + A + + Al
Второе равенство предлагаем читателю доказать самостоя-
самостоятельно.^
Следствие 19.1. Многочлены от одной матрицы перестано-
перестановочны, т. е. g(A)s(A) = s(A)g(A).
> Доказательство этого утверждения непосредственно следует
из предложения 19.4 и свойства перестановочности многочленов
от х. <4
Пусть теперь V — линейное пространство над полем Ру f —
линейный оператор пространства V. Значением многочлена g(x)
при x = f или просто многочленом g(f) называется линейный оператор
где е — тождественный оператор пространства V.
Из вышесказанного следует
Предложение 19.5. Если в некотором базисе оператор f имеет
матрицу Ау a g(x) — многочлен, то матрицей оператора f(g) в этом
же базисе является f(A).
Из предыдущего предложения и следствия 19.1 вытекает, что
многочлены от одного линейного оператора перестановочны.
Упражнения
1. Докажите, что если g(x)— многочлен и Л = diag [Л,, Л2, ... , Ап\ то g(A) =
= diag[gO4,), g(A2) g(An)\.
2. Докажите, что множество L(V) всех линейных операторов я-мерного про-
пространства V над полем Р является относительно сложения и умножения линейных
операторов кольцом, изоморфным кольцу всех квадратных матриц порядка п над
полем Р.
19.4. Изоморфизмы линейных пространств
В определении линейного пространства речь идет о свойствах
операций над векторами, но ничего не говорится о свойствах самих
векторов. Не исключено, что, хотя векторы некоторых линейных
40
пространств по своей природе совершенно различны, эти прост-
пространства с точки зрения свойств операций идентичны или, как
говорят в алгебре, изоморфны. Точное определение таково.
Определение 19.2. Пусть V и W — линейные пространства
над одним и тем же полем Р. Биективный линейный оператор про-
пространства V на пространство W называется изоморфизмом линей-
линейных пространств V и W. Если такой изоморфизм существует,
то говорят, что пространство V изоморфно пространству W, и пишут
Отметим простейшие свойства изоморфизмов линейных прост-
пространств.
1. Тождественное отображение е: V-+V является изоморфиз-
изоморфизмом, так что V ?ё V.
2. Если /: V^*W — изоморфизм линейных пространств, то и
f~l: W-+V— изоморфизм. Поэтому если V ^ W, то и W ^ V. В этой
ситуации просто говорят, что пространства V и W изоморфны.
> Существование отображения /~1 и его биективность следуют
из биективности оператора /. Покажем, что для любых векторов
v,, v2 пространства W и любых чисел а и р из основного поля
r1(av1 + Pv2) = oc/-1(v1)+Pr1(v2). A)
Так как / инъективно, то равенство A) равносильно равенству
/(/-1(ccv1 + pv2)) = /(ar1(v1)+P/-1(v2)). B)
Но
Это доказывает равенство B), а вместе с ним и равенство A).^
3. Если f: V-+Wy g: W-+U — изоморфизмы линейных прост-
пространств, то и их произведение gf: V-+U есть изоморфизм. Следова-
Следовательно, из V ^W и W ?ё U вытекает V ^ U.
> Действительно, gf есть биекция как произведение биекций.
Согласно предложению 19.2, gf — линейный оператор. ^
Совокупность свойств 1—3 означает, что отношение изомор-
изоморфизма линейных пространств на множестве всех линейных прост-
пространств над одним и тем же полем есть отношение эквивалентности
и потому разбивает это множество на непересекающиеся классы
изоморфных линейных пространств. Ниже мы установим критерий
изоморфизма линейных пространств.
Пусть снова /: V-+W — изоморфизм линейных пространств.
4. Если система векторов
а1э а2, ..., а* C)
пространства V линейно независима, то система
Ка,),/(а2), ...,/(а*) D)
также линейно независима.
4. Зак. 6466 41
^ Если бы векторы D) были линейно зависимы, то их образы
при изоморфизме /"', т. е. векторы C), также были бы линейно
зависимы.^
5. Если C) — базис пространства V, то D) — базис простран-
пространства W. Следовательно, размерности изоморфных пространств равны.
> Это следует из предыдущего утверждения и свойства 2 ли-
линейных операторов. 4
6. Пусть 0 Ф U си V. Тогда:
1) U является подпространством в V е^ли и только если f(U) —
подпространство в W;
2) если U — подпространство, то dim U = dim f(U).
> Если U — подпространство в I/, то f(U) является подпрост-
подпространством, согласно свойству 4 из § 19.1. Если же f(U)— подпрост-
подпространство в W, то /~1 (/({/))= U — подпространство в V. Далее, учи-
учитывая свойство 5 из § 19.1 и свойство 4, получаем требуемое. ^|
Лемма 19.1. 'Пусть V и W — линейные пространства над по-
полем Р, f: V->- W — линейный оператор, переводящий какой-либо
базис
у и v2, ..., vn E)
пространства V в базис
f(v,), f(V2), ... , f(Vn) F)
пространства W. Тогда f — изоморфизм линейных пространств.
> Нужно доказать, что отображение / биективно. Вначале до-
докажем его инъективность. Пусть х и у — векторы из пространства
V с координатными столбцами соответственно X и Y в базисе E).
Пусть, далее,
[Vl v2 ••• v,]==v, \f(y{) ftv2) ... f(vn)]=w-
Тогда x = vXy y = vK, f(x) = wX, /(y) = w)/. Если теперь f(x) = f(y)y
то wA = wy и, поскольку F) —базис, X=Y, x = y. Итак, из ра-
равенства образов f(x) — f(y) следует равенство х = у, т. е. / инъек-
тивно.
Докажем теперь сюръективность оператора f. Пусть z — произ-
произвольный вектор из Wy Z — его координатный столбец в базисе F).
Тогда х = vZ ? Vy f(x) = wZ = z. ^
Следствие 19.2. Конечномерные линейные пространства над
одним и тем же полем изоморфны тогда и только тогда, когда равны
их размерности.
> Для нулевых пространств теорема очевидна. Поэтому будем
рассматривать ненулевые пространства. Выше уже доказывалось,
что размерности изоморфных пространств равны. Пусть теперь V и
W — линейные пространства над полем Р одной и той же размер-
размерности пу система E) — базис пространства V,
w,, w2, ..., wn G)
является базисом пространства W. По теореме 19.1 существует
линейный оператор f пространства V в пространство Wy при кото-
42
ром /(v/) = w/, /= 1, 2, ..., п. Так как системы векторов E) и G) —
базисы пространств V и Wy то / — изоморфизм.^
Следствие 19.3. Л/ш фиксированных поле Р и размерности п
существует единственное с точностью до изоморфизма п-мерное
линейное пространство над полем Р. В частности, всякое п-мерное
линейное пространство над полем Р изоморфно пространству Рп
п-членных столбцов (строк) над полем Р (п> 0).
Предложение 19.6. Пусть V — п-мерное линейное пространство
над полем Р. Тогда линейное пространство L(V) (всех линейных
операторов пространства V) изоморфно линейному пространству
Рп,п всех п X п-матриц над полем Р.
> Зафиксировав в пространстве V базис и поставив в соответ-
соответствие каждому линейному оператору его матрицу в этом базисе
получим нужный изоморфизм. М
Сделаем некоторые важные выводы. В этой книге мы рассматри-
рассматриваем не столько линейные операторы одного пространства в другое,
сколько линейные операторы пространства в себя. Вводя коорди-
координаты, мы можем действия над векторами или линейными операто-
операторами пространства превратить в одноименные действия над матри-
матрицами. Конкретизируем это. Пусть V — я-мерное линейное прост-
пространство над полем Р. Зафиксируем в V какой-либо базис и поставим
в соответствие каждому вектору его координатный столбец, а каж-
каждому линейному оператору пространства V — его матрицу в этом
базисе. Как показано выше, тем самым мы установим изоморфизм
пространства V на пространство я-членных столбцов Рп и прост-
пространства линейных операторов L(V) на пространство Рпя квадрат-
квадратных матриц порядка п над полем Р. Отождествим теперь объекты,
соответствующие друг другу при этих изоморфизмах, т. е. векторы
пространства V будем рассматривать как соответствующие коор-
координатные столбцы, а линейные операторы — как матрицы. Тогда
сложение и умножение векторов или линейных операторов на числа,
а также умножение линейных операторов заменяются одноименными
операциями над матрицами; действие линейного оператора на век-
вектор означает умножение столбца на матрицу слева. При вычисле-
вычислениях эта точка зрения весьма удобна.
Учитывая сказанное выше, мы можем сформулировать более
общий вариант теоремы 18.2 о задании подпространств системами
линейных уравнений.
Теорема 19.4. Пусть в п-мерном линейном пространстве V над
полем Р фиксирован произвольный базис. Тогда:
1) множество всех векторов из V', координаты которых удовлет-
удовлетворяют однородной системе линейных уравнений с п неизвестными,
является в V подпространством размерности п — г, где г — ранг
матрицы этой системы;
2) любое подпространство в V совпадает с множеством всех
векторов, координаты которых в заданном базисе удовлетворяют
некоторой однородной системе линейных уравнений над полем Р
с п неизвестными.
43
19.5. Ранг и дефект линейного оператора
Пусть / — линейный оператор линейного пространства V над
полем Р. Как было показано ранее, множество f(V) = {f(v)\ v ? V)
является подпространством пространства V. Размерность этого
подпространства называется рангом оператора / и обозначается
rank/.
Предложение 19.7. Ранг линейного оператора совпадает с ран-
рангом его матрицы.
> Пусть
V!, V2, ..., Vn A)
является базисом пространства К, / — линейный оператор, А —
матрица оператора / в этом базисе. Тогда
/(v,), /(v2), ..., f(vn) B)
является системой образующих пространства /A/), а столбцы мат-
матрицы А — координатными столбцами векторов B) в базисе A).
Поэтому ранг оператора / равен рангу системы B), а ранг послед-
последней — рангу матрицы А.<4
Определение 19.3. Пусть /— линейный оператор простран-
пространства V. Множество всех векторов а пространства V, таких, что
Да) = 0, называется ядром оператора /.
Ядро линейного оператора / обозначается Кег/. Итак, Кег/ =
НабК|/(а) = 0}.
Теорема 19.5. Множество Кег / — подпространство простран-
пространства V. Кроме того, dim Кег / = dim V — rank /.
> Пусть х — произвольный вектор пространства V. Условие
х?Кег/ равносильно равенству
/(х) = 0. C)
Если А — матрица оператора / в базисе A), X — координатный
столбец вектора х в этом базисе, то равенство C) равносильно
матричному равенству
АХ = О, D)
где О — нулевой столбец. Равенство D) можно рассматривать
как однородную систему линейных уравнений относительно неиз-
неизвестных координат вектора х с матрицей А. Итак, Кег/ совпадает
с множеством всех векторов, координаты которых удовлетворяют
системе D). Но мы знаем, что последнее множество является
подпространством пространства V размерности dim К — rank Л.
Учитывая, что rank A = rank/, получаем требуемое.^
Определение 19.4. Размерность пространства Кег/ назы-
называется дефектом оператора /.
Дефект оператора / обозначается def/.
Предложение 19.8. Линейный оператор инъективен тогда и только
тогда, когда его ядро нулевое.
^ Пусть / — линейный оператор пространства К, a, b 6 V. Рас-
44
смотрим цепочку равносильных равенств: f(a) = f(b\ /(а) — /(Ь) = О,
/(а — Ь) = 0. Последнее означает, что а —Ь^Кег/. Итак, f(a) = f(b)
тогда и только тогда, когда а — b = k, а = b + к> где к ? Кег /. Если
теперь Кег/^{0}, k 6 Кег/ и к Ф О, то /(b + k) = /(b), b-f к Ф Ь,
и, следовательно, / не инъективно. Если же Кег/ = {0} и /(а) = /(Ь),
то а = b и / инъективно. ^
Следствие 19.4. Для линейного оператора f равносильны
следующие утверждения:
1) / — инъекция;
2) def/ = O;
3) rank / = dim V\
4) / — биекция.
Доказательство следует непосредственно из теоремы 19.5 и пре-
предыдущего предложения 19.8.
Замечание. Читатель, знакомый с понятием гомоморфизма групп, легко
поймет, что линейный оператор /: V-+W является гомоморфизмом аддитивных групп
пространств V и W, а Кег / — ядром этого гомоморфизма. Следовательно, адди-
аддитивная группа f(V) изоморфна фактор-группе К/Кег /.
19.6. Автоморфизмы линейного пространства
Определение 19.5. Изоморфизм линейного пространства на
себя называется автоморфизмом этого пространства.
Теорема 19.6. Для линейного оператора f п-мерного линейного
пространства равносильны следующие утверждения:
1) / — автоморфизм;
2) / — инъекция;
3) / сюръекция;
4) матрица оператора f в любом базисе невырожденная.
> Равносильность первых трех утверждений вытекает из следст-
следствия 19.4. Далее, невырожденность матрицы оператора / равно-
равносильна тому, что ее ранг равен я, а последнее утверждение, в свою
очередь, равносильно равенству гапк/ = я, т. е. сюръективности
оператора /. <4
Множество всех автоморфизмов линейного пространства V обо-
обозначается Aut V. Если /: V-+V и g: V-+V — два автоморфизма,
то определено их произведение fg: V->V> также являющееся авто-
автоморфизмом (почему?). Таким образом, композиция отображений
определяет на Aut V алгебраическую операцию. Она ассоциативна
(почему?). Тождественное отображение е является нейтральным
элементом относительно этой операции. Для каждого автоморфизма
/ обратное отображение /~* также является автоморфизмом (по-
(почему?). Итак, Aut V есть группа относительно умножения автомор-
автоморфизмов.
Покажем теперь, что группа Aut V изоморфна группе GL(ny P)
всех невырожденных квадратных матриц порядка п над основным
полем Р. Для этого фиксируем в пространстве V базис и поставим
в соответствие каждому автоморфизму пространства V его мат-
матрицу в отмеченном базисе. Матрица автоморфизма всегда невы-
45
рожденная. Следовательно, определено отображение Aut V-*GL(ny
Р). Читателю нетрудно будет закончить доказательство самостоя-
самостоятельно.
Упражнения
1. Найдите порядок группы автоморфизмов я-мерного линейного пространства
над конечным полем из q элементов.
2. Найдите число базисов в я-мерном линейном пространстве над конечным
полем из q элементов.
19.7. Изменение матрицы линейного оператора при замене базиса
Лемма 19.2. Пусть А— пХп-матрица над полем Р. Если для
любого столбца X из Рп
АХ = ВХУ A)
то А =В.
> Полагая в равенстве A) последовательно
Х = \1 О ... Of, Х = [0 1 О ... Of, ..., Х = [0 ... О If,
получим требуемое. ^
Пусть / — линейный оператор пространства V над полем Я,
А и В — его матрицы в базисах
Vi, v2, ..., vn B)
Up U2, ..., \Xn C)
соответственно, М — матрица перехода от базиса B) к базису C).
Найдем связь между матрицами А и В.
Пусть X и Y — координатные столбцы произвольного вектора х в
базисах B) и C) соответственно. Тогда координатные столбцы
вектора /(х) в базисах B) и C) равны АХ и BY соответственно.
Согласно формулам преобразования координат вектора при переходе
от базиса B) к базису C), имеем: АХ = M(BY) = (MB)Yy X = MYy
откуда
(AM)Y = (MB)Y. D)
Так как Y — произвольный координатный столбец, то, согласно лем-
лемме 19.2, из равенства D) следует AM = MB, откуда
В = М~1АМ. E)
Обратно, пусть А — матрица линейного оператора / простран-
пространства V в базисе B), М — произвольная невырожденная матрица
порядка п над полем Я, В — матрица, удовлетворяющая условию
E). Если C) —базис пространства К, такой, что М — матрица
перехода от базиса B) к базису C), то В — матрица оператора f
в базисе C).
46
Определение 19.6. Матрица В называется подобной матрице
А над полем Р, если существует невырожденная матрица М над
этим полем, удовлетворяющая равенству E).
Из равенства E) следует
A=MBM~l =(M-ylB(M-1).
Итак, если матрица В подобна матрице А, то и матрица А по-
подобна матрице В. Поэтому можно просто говорить, что матрицы
А и В подобны.
Таким образом, доказана следующая
Теорема 19.7. Две квадратные матрицы порядка п над полем
Р являются матрицами одного линейного оператора п-мерного ли-
линейного пространства над Р тогда и только тогда, когда они по-
подобны над Р.
Отметим еще два свойства подобных матриц.
1. Всякая матрица подобна себе.
> В самом деле, А = Е~ХАЕ.А
2. Если матрица С подобна матрице В, а матрица В подобна
матрице А, то матрица С подобна матрице А.
> Из C = N~lBNy B = M~XAM следует
С = N~l(M~lAM)N = (N-lM-l)A(MN) = (MN)-lA(MN).<
Указанные выше свойства в совокупности с утверждением о том,
что если матрица А подобна матрице В, то и В подобна Л, означают,
что отношение подобия матриц является отношением эквивалент-
эквивалентности на множестве всех квадратных матриц порядка п над полем
Р. Следовательно, это множество матриц разбивается на попарно
непересекающиеся классы подобных матриц. Матрицы входят в один
класс тогда и только тогда, когда они являются матрицами одного
линейного оператора (в разных базисах). Поэтому очень важной
является классификация матриц с точностью до подобия, заклю-
заключающаяся в распознавании подобия матриц и приведении матрицы
с помощью выбора подходящего базиса к наиболее простой форме.
По виду этой простой формы можно судить о геометрических
свойствах соответствующего линейного оператора. Эта ситуация
аналогична случаю, когда уравнение фигуры второго порядка с
помощью удачного выбора системы координат приводят к канони-
каноническому виду, а затем по этому уравнению судят о форме фигуры.
Такая задача решается в гл. 20 и 21.
Упражнения
1. Пусть Л —diagl^j, ... , Am\, ^ = diag [^i, ... , Bm\, причем для каждого
/= 1, ... , m клетки At и Bt подобны. Докажите, что матрицы А и В тоже подобны.
2. Докажите, что матрица сс?, где а — число, подобна только себе.
19.8. Инвариантное подпространство
Определение 19.7. Пусть f — линейный оператор линейного
пространства V над полем Р. Если U — подпространство прост-
пространства V, такое, что f(U)aUt то U называют инвариантным от-
относительно f подпространством.
47
Пример 19.7. Тривиальные подпространства инвариантны относительно любого
линейного оператора.
Пример 19.8. Всякое подпространство пространства V инвариантно относи-
относительно произведения Хе тождественного оператора е на число к.
Предложение 19.9. Для любого линейного оператора f прост-
пространства V f(V) и Кег / — инвариантные относительно f подпрост-
подпространства.
> Очевидно, что /(/(а)) ? f{V) для а 6 Vy так как /(а) 6 V. Далее,
/() 0 6Ker/ для ЬбКег/.^
Предложение 19.10. Сумма и пересечение подпространств прост-
пространства V', инвариантных относительно линейного оператора ff
также инвариантны относительно f.
> Докажем утверждение теоремы о сумме подпространств. Пусть
(Jiy i=\y 2, ..., ky— подпространства пространства V, инвариант-
инвариантные относительно линейного оператора /, U = Ux -\- U2-\-...-]- Uk.
Для а 6 U имеем а = а} + а2 + ... + а$, а, 6 Ui- Так как /(а,) 6 ?/;, то
Утверждение теоремы о пересечении подпространств читатель
легко докажет самостоятельно.^
Предложение 19.11. Пусть fug — линейные операторы про-
пространства Vy U — инвариантное относительно каждого из них под-
подпространство, а — число. Тогда подпространство U инвариантно
относительно f + gt fgy a/.
> Для a 6 U /(a) и g(a) принадлежат {/, поэтому
Инвариантность подпространства {/ относительно линейного опера-
оператора f + g доказана. Доказательство инвариантности подпростран-
подпространства U относительно произведений fg и а) читателю предлагается
провести самостоятельно.^
Очевидно
Следствие 19.5. Если подпространство U инвариантно от-
относительно линейного оператора /, a g(x) — многочлен, то U инва-
инвариантно и относительно g(f).
Если подпространство U инвариантно относительно линейного
оператора /, то можно определить отображение /| U: U-+Uy такое,
что (/| (У)(а) = /(а) для а??/. Ясно, что /1 U — линейный оператор
пространства U. Назовем f\U индуцированным на подпростран-
подпространстве U оператором или ограничением оператора f на подпростран-
подпространство U.
19.9. Линейный оператор с клеточно-диагональной матрицей
Посмотрим, как влияет на матрицу линейного оператора / про-
пространства V наличие нетривиального инвариантного относительно /
подпространства U. Пусть базис пространства V
Vi, ..., Vm, Ui, ..., Uk A)
48
такой, что
и„ .... и* B)
является базисом подпространства U. Рассмотрим матрицу линей-
линейного оператора / в базисе A). Так как подпространство U инва-
инвариантно относительно /, то вектор /(и,) является линейной комби-
комбинацией векторов B), поэтому можно записать:
т k
f(vi)= 2 a/;V/+ 2 P//U/, /= 1, 2, ..., га,
i=l, 2, ...,
C)
Согласно формулам (З), матрица линейного оператора / в ба-
базисе A) имеет вид
an
p.7
... a.™
... CCmm
• •• P*m
0
0
... 0
... 0
... Y**
D)
т. е. ее правый верхний угол — нулевой. Матрица
Ы, ', /=1, 2, ..., *, E)
расположенная в правом нижнем углу матрицы D), является,
согласно формулам C), матрицей индуцированного на подпрост-
подпространстве U оператора в базисе B).
Обратно, пусть система A) —произвольный базис простран-
пространства V, а / — линейный оператор этого пространства, имеющий в
базисе A) матрицу D) с нулевым углом. Тогда очевидно, что
верны формулы C), а следовательно, подпространство U = L(ux, ...,
iu) инвариантно относительно оператора / и матрица E) есть
матрица индуцированного на подпространстве U оператора в ба-
базисе B).
Пусть теперь пространство V есть прямая сумма инвариантных
относительно оператора / подпространств W и U: V = W ф U. За-
Запишем матрицу оператора / в базисе A), где
v,, ..., vm F)
является базисом подпространства W, а система B) — базисом
подпространства U. Очевидно, что
т
f(v;)=y a-/v-, /=1, 2,..., га,
/(Ui)= S Y//U/, i=l, 2, ..., k,
G)
49
поэтому матрицей оператора / в базисе A) является клеточно-
диагональная матрица
diag[[«4 [Yi/J], (8)
где матрицы E) и
Ы <*> /=1, .», т, (9)
являются матрицами индуцированных на подпространствах U и W
операторов в базисах B) и F) соответственно.
Обратно, пусть оператор / в базисе A) имеет клеточно-диаго-
нальную матрицу (8). Тогда верны формулы G) и, следовательно,
подпространства W = L(\ly ... , vm) и t/ = L(u,, ... , щ) инвариантны
относительно /, E) — матрица индуцированного на подпростран-
подпространстве U оператора f\U в базисе B), а (9) — матрица индуцирован-
индуцированного на подпространстве W оператора f\W в базисе F). Очевидно,
что W®U=V.
Итак, доказана
Теорема 19.8. Пусть f — линейный оператор пространства V.
Пространство V есть прямая сумма двух своих инвариантных от-
относительно оператора f подпространств тогда и лишь тогда, когда
в каком-либо базисе матрицей этого оператора является клеточно-
диагональная матрица вида (8).
Очевидно, что аналогичное утверждение верно и в том случае,
когда пространство V является прямой суммой трех и более инва-
инвариантных относительно оператора / подпространств. В частности,
если dim V = n и в этой сумме п слагаемых (прямых), то каждое из
них одномерно, и верна
Теорема 19.9. Линейное пространство является прямой суммой
одномерных инвариантных относительно линейного оператора под-
подпространств тогда и лишь тогда, когда в каком-либо базисе матрица
этого оператора диагональна.
19.10. Характеристический многочлен
Определение 19.8. Пусть А = [ац] — квадратная матрица по-
порядка п над полем Р, а х — переменная. Матрицу
х ап а12 ... п\п
х? А= °21 X а22 ••- а2«
— ап\ —аП2 ... х — апп
называют характеристической матрицей матрицы А, а ее определи-
определитель det(xE — А) — характеристическим многочленом матрицы А.
Очевидно, что det(xE — А) — многочлен от х п-й степени, стар-
старший коэффициент которого равен 1. Свободный член многочлена
det(xE — А) совпадает с его значением при х = 0 и поэтому равен
— ап —а
12
-а
21
-ап\ —ап2 ... —апп
50
Так как произведение всех корней многочлена может отличать-
отличаться от его свободного члена лишь знаком, то верно
Предложение 19.12. Квадратная матрица невырождена тогда
и только тогда, когда нуль не является корнем ее характеристи-
характеристического многочлена.
Сумма всех элементов главной диагонали квадратной матрицы
А называется ее следом и обозначается tr А.
Очевидно, что коэффициент многочлена det(x? — А) при хп~х
равен следу матрицы Л, взятому с противоположным знаком.
Предложение 19.13. Характеристические многочлены подобных
матриц равны.
^ Пусть В = М~ХАМ. Тогда
хЕ - В = хЕ - М~ХАМ = М~х(хЕ)М - М~ХАМ = М~\хЕ - А)М.
Поэтому
det(x? — В) = (detM)~x det(xE — A)detM = det(x? — А).Л
Обратное утверждение: если характеристические многочлены
матриц равны, то эти матрицы подобны,— неверно. Например, мат-
матрицы
1 01 л П
имеют один и тот же характеристический многочлен (х— IJ, одна-
однако матрица Е2 подобна лишь себе.
Следствие 19.6. Следы подобных матриц равны. Опреде-
Определители подобных матриц равны.
Характеристическим многочленом линейного оператора называют
характеристический многочлен его матрицы. Поскольку матрицы
линейного оператора пространства в разных базисах подобны, ха-
характеристический многочлен линейного оператора не зависит от
выбора базиса пространства.
Следом tr/ линейного оператора / называется след его матрицы,
а определителем det/ линейного оператора / — определитель его
матрицы. Как и характеристический многочлен, след и определи-
определитель линейного оператора не зависят от выбора базиса простран-
пространства.
Упражнения
1. Если номера строк и столбцов матрицы, в которых расположен минор, сов-
совпадают, то такой минор называется главным. Докажите, что коэффициент при хк
характеристического многочлена матрицы порядка п равен сумме всех главных
миг. ров порядка п — к этой матрицы, умноженной на (— \)п~к.
2. Докажите, что характеристический многочлен клеточно-диагональной матри-
матрицы равен произведению характеристических многочленов ее диагональных клеток.
3. Докажите, что для линейных операторов f и g
tr(/ + g) = trf + trg, tr(fe) = tv(gf).
51
19.11. Собственные векторы линейного оператора
Определение 19.9. Пусть f — линейный оператор линейного
пространства V над полем Р, а — ненулевой вектор пространства
V. Если
f'(a) = Xa, Х?Р, A)
то число X называется собственным значением оператора f, а век-
вектор а — собственным вектором, относящимся к собственному значе-
значению X.
Пример 19.9. Все ненулевые векторы пространства Кег / — собственные векторы
оператора /, относящиеся к нулевому собственному значению.
Пример 19.10. При тождественном автоморфизме все ненулевые векторы про-
пространства — собственные, с собственным значением, равным единице.
Пример 19.11. Оператор поворота плоскости на угол а не имеет собственных
векторов при а Ф kn, /г ? Z.
Сформулируем условие существования собственных векторов и
найдем эти векторы.
Ненулевой вектор а ? 1/ является собственным вектором линей-
линейного оператора /, если он удовлетворяет условию A). Поскольку
Ха. = Хе(&I то условия A) и
(^-/)(а) = 0 B)
равносильны. Множество всех векторов, удовлетворяющих условию
B), является инвариантным относительно линейного оператора
Хе— / подпространством К^(Хе — /). Так как f = Xe — (Хе — /), то
это подпространство инвариантно и относительно оператора /. Далее,
Кег(А,е — /)=^{0} тогда и лишь тогда, когда det(A,e — /) = 0.
В пространстве V фиксируем какой-либо базис. Если в этом
базисе оператор / имеет матрицу Л, то матрицей оператора Хе— /
в этом же базисе служит ХЕ — А. Поэтому необходимым и доста-
достаточным условием существования собственных векторов оператора /,
относящихся к собственному значению X, является равенство
det(XE — А) = 0. Это равенство верно тогда, когда X—корень ха-
характеристического многочлена матрицы А.
Итак, доказана
Теорема 19.10. Собственными значениями линейного оператора
являются все принадлежащие основному полю корни характери-
характеристического многочлена этого оператора, и только они. Если X —
собственное значение оператора f, то все относящиеся к нему соб-
собственные векторы и нулевой вектор составляют подпространство
Кег(А,е — /), инвариантное относительно f.
Как отмечалось выше, вектор а с координатами р,, р2, ... , р„
в заданном базисе принадлежит подпространству Кег(Хе — /) тогда
и только тогда, когда (р,, р2, ... , ря) — решение системы уравнений
(X
— апХх\ — а2пх2 — ...
52
где [uij] = A — матрица оператора / в том же базисе. Следовательно,
собственными векторами оператора f, относящимися к собственному
значению X, являются все ненулевые решения этой системы, и
только они.
Рассмотрим следующие три задачи. Для каких линейных опера-
операторов / пространства V существуют инвариантные относительно /
одномерные подпространства? Если такие подпространства сущест-
существуют, то как их все найти? В каких случаях пространство V есть
прямая сумма одномерных подпространств, инвариантных относи-
относительно /?
Пусть U — одномерное подпространство пространства V над по-
полем Р. Если а — ненулевой вектор из U, то очевидно, что U есть
множество L(a) всех векторов, кратных а. Если U — инвариантное
относительно оператора / подпространство, то /(а) = Ха, X ? Р,
Даа) = а/(а) = а(А,а) = А,(аа), так что все ненулевые векторы под-
подпространства U являются собственными векторами оператора /,
относящимися к собственному значению X.
Обратно, если а — собственный вектор оператора /, относя-
относящийся к собственному значению X, а а ? Р, то /(аа) = А,(аа), и, зна-
значит, L(a) — инвариантное относительно / подпространство.
Таким образом, в пространстве V тогда и лишь тогда существуют
одномерные инвариантные относительно оператора f подпростран-
подпространства, когда f имеет собственные векторы. Если а — произвольный
собственный вектор оператора f, то L(a) — инвариантное отно-
относительно f одномерное подпространство и все одномерные инва-
инвариантные относительно f подпространства пространства V имеют
такую структуру.
В частности, если V — комплексное линейное пространство, то,
согласно основной теореме алгебры комплексных чисел, характе-
характеристический многочлен любого линейного оператора пространства V
имеет комплексные корни, поэтому в комплексном пространстве
всегда есть одномерное инвариантное относительно оператора f
подпространство.
Обратимся снова к случаю линейного пространства V над про-
произвольным полем Р. Пространство V является прямой суммой под-
подпространств L(at), /= 1, ... , я, т. е.
тогда и лишь тогда, когда at, а2, ... , а„ — базис пространства V.
Поэтому верна следующая
Теорема 19.11. Линейное п-мерное пространство V является
прямой суммой своих одномерных инвариантных относительно ли-
линейного оператора f подпространств тогда и только тогда, когда
в V есть п линейно независимых собственных векторов оператора /.
Предложение 19.14. Собственные векторы линейного оператора,
относящиеся к попарно различным собственным значениям, линейно
независимы.
> Пусть Х{у А,2, ... , Xk — попарно различные собственные зна-
53
чения линейного оператора /, а соответствующие им собственные
векторы
аь а2, ..., а*. C)
Возьмем какой-нибудь базис системы C). Для определенности
пусть это будет
alf a2, ..., а/. D)
Если системы C) и D) не совпадают, то вектор а/+, линейно
выражается через векторы D):
E)
Поэтому
A,/+ia/+i = A,/+iaiai + ... + A,/+iot/a/. F)
Применяя к обеим частям равенства E) оператор f, получаем
Сопоставляя последнее равенство и равенство F), имеем:
Так как система D) линейно независима, то в последнем ра-
равенстве все коэффициенты — нули:
(ki+i-ki)ai = 0, i=l, 2, ..., /. G)
Но А,/+|^?Л,|, поэтому из формул G) следует at = 0, /=1, 2, ..., /.
Тогда из равенства E) получаем a/+i=0, что противоречит опре-
определению собственного вектора. Значит, системы векторов C) и D)
совпадают. А
Следствие 19.7. Если линейный оператор f п-мерного линей-
линейного пространства имеет п различных собственных значений, то это
пространство есть прямая сумма одномерных инвариантных отно-
относительно f подпространств. Если все корни характеристического
многочлена принадлежат основному полю Р (например, Р — поле
комплексных чисел), то для этого достаточно, чтобы характеристи-
характеристический многочлен не имел кратных корней.
Упражнения
1. Найдите все линейные операторы линейного пространства, для которых каж-
каждый ненулевой вектор этого пространства является собственным.
2. Найдите все собственные значения и собственные векторы линейного опера-
оператора дифференцирования пространства многочленов R[jcJ.
20. МАТРИЦЫ НАД КОЛЬЦОМ МНОГОЧЛЕНОВ
Как отмечалось выше, квадратные матрицы являются матрицами
одного и того же линейного оператора в различных базисах, если
они подобны над основным полем. Поэтому очень важной является
54
проблема классификации матриц с точностью до подобия. Суть
этой проблемы заключается в следующем. Требуется, с одной сто-
стороны, установить критерий подобия матриц, позволяющий опреде-
определить, подобны ли данные матрицы. С другой стороны, нужно в каж-
каждом классе подобных матриц выбрать одну, имеющую наиболее
простой вид. Решение этих важных вопросов связано с исследо-
исследованием свойств характеристической матрицы, элементами которой
являются многочлены. В связи с этим мы вначале изучим некото-
некоторые свойства матриц над кольцом многочленов Р[х] (т. е. матриц,
элементами которых являются произвольные многочлены).
Мы будем рассматривать квадратные матрицы над Р[х\. В коль-
кольце многочленов операции сложения и умножения имеют те же
формальные свойства (ассоциативность, коммутативность, дистри-
дистрибутивность), что и соответствующие операции в поле. Это обстоя-
обстоятельство приводит к тому, что многие свойства матриц над полем
сохраняются для матриц над кольцом многочленов Р[х\, где Р —
поле, в частности теория определителей, алгебра матриц. При этом
речь идет не только о результатах, но и об их доказательствах.
(Уточнения требуют только факты, связанные с понятием линей-
линейной зависимости, но этого мы не будем касаться.)
20.1. Каноническая форма матрицы над кольцом многочленов
Модифицируем определение элементарных преобразований при-
применительно к рассматриваемой ситуации.
Определение 20.1. Элементарными преобразованиями строк
матрицы над Р[х] называются следующие две операции:
1) умножение строки матрицы на произвольный отличный от
нуля элемент поля Р;
2) прибавление к одной строке матрицы другой ее строки, умно-
умноженной на произвольный многочлен f(x)?P[x].
Элементарные преобразования столбцов определяются анало-
аналогично.
Если матрица А(х) получается из матрицы В(х) в результате
применения одного или нескольких элементарных преобразований,
то будем писать А(х)~В(х). Очевидно следующее:
1) А(х)~А{х)\
2) если А(х)~В(х), то В(х)~А{х)\
3) если А{х) ~ В(х) и В{х) ~ С{х\ то А{х) ~ С(х).
Таким образом, на множестве всех квадратных матриц одного
и того же порядка над Р[х] определено отношение эквивалентно-
эквивалентности ~. Если А(х)~В(х), то будем называть матрицы А(х) и В(х)
эквивалентными.
Предложение 20.1. Если две матрицы различаются лишь по-
порядком строк и (или) столбцов, то они эквивалентны.
Доказательство этого предложения мы оставляем читателю (см.
предложение 2.1).
Определение 20.2. Диагональная матрица
K(x)=dlag[fl(x\ f2(x), ..., fn(x)}
55
над Р[х] называется канонической, если она удовлетворяет следую-
следующим условиям:
1) каждый диагональный элемент /,-(*), где i < п, является дели-
делителем следующего диагонального элемента fi+\(x):
2) старший коэффициент каждого из ненулевых многочленов
fi(x) равен 1.
Многочлены
f (у\ f (у\ f ( Y\
I 1W» /2\ЛЛ ••• » ln\X)
называются инвариантными множителями канонической матрицы
К(х).
Если среди ненулевых инвариантных множителей есть элементы
поля Р, то, согласно условию 2, они равны единице и по условию 1
расположены на диагонали матрицы первыми. Нули, если они есть
среди инвариантных множителей, стоят на диагонали последними.
Определение 20.3. Пусть А(х) — произвольная матрица над
Р[х]. Любая каноническая матрица, эквивалентная матрице А(х),
называется канонической формой матрицы А(х). Инвариантными
множителями матрицы А(х) называются инвариантные множители
ее канонической формы.
Теорема 20.1. Для любой квадратной матрицы над Р[х] суще-
существует единственная каноническая форма.
^ Здесь мы докажем только существование канонической формы.
Доказательство единственности проведем в следующем параграфе.
Пусть А(х) — квадратная матрица порядка п над Р[х]. Если
А(х) — нулевая матрица, то она является канонической. Пусть мат-
матрица А(х) — ненулевая. При п = 1 теорема очевидна. В этом случае
А(х) = }(х)ФО. Умножив f(x) на подходящий ненулевой элемент
поля Р, получим многочлен со старшим коэффициентом 1.
Пусть теперь п> 1. Сделаем следующее индуктивное предполо-
предположение: для любой матрицы порядка п — 1 над Р[х] существует кано-
каноническая форма. Обозначим буквой 5 класс матриц, эквивалентных
матрице А(х\ а буквой Т — множество всех ненулевых элементов
матриц из 5. Если f(x)?Tt agP и афО, то af(x)?T (почему?).
Следовательно, в множестве Т есть многочлен fx(x), отличный от
нуля и удовлетворяющий следующим двум условиям: 1) fx(x) имеет
минимальную степень среди всех ненулевых элементов множества
Т\ 2) старший коэффициент fx(x) равен 1.
Упорядочив соответствующим образом строки и столбцы матрицы
из 5, элементом которой является /,(*), можно поместить этот мно-
многочлен на позицию A,1). Итак, в классе 5 есть матрица В(х) вида
Л (*) Лг(*) - Ля(. ,
[21(Х) [22(Х) ... f2n(x)
jn\{x) fn2(x) ... fnn(x)_
Легко доказать, что все элементы первых строки и столбца
матрицы В(х) делятся на fx(x). В самом деле, пусть, например,
fu(x) = fx(x)q(x) + r(x), где г(х) = 0 или degr(x)< deg/,(x). К i-му
56
столбцу матрицы В(х) прибавим ее первый столбец, умноженный
на — q(x). Тогда первым элементом /-го столбца станет г{х\ следо-
следовательно, г(х)?Т. Согласно выбору многочлена /,(*), имеем г(х) =
= 0, т. е. fu(x) делится на f\(x).
Все элементы первой строки матрицы В(х), кроме первого, за-
заменим нулями, прибавив к каждому столбцу подходящее кратное
первого столбца. Аналогично поступим со строками. Поэтому в
классе 5 найдется матрица С(х) вида
С(х) =
Л(*)
0
о ... о
- gin(x)
0
... gnn(x)
A)
Рассмотрим теперь матрицу
g2n(x)
gnn(X)
B)
порядка п — 1. По индуктивному предположению, эта матрица с по-
помощью элементарных преобразований строк и столбцов может быть
приведена к каноническому виду
diag[/2(*), ..., /„(*)].
Если те же элементарные преобразования применить к матрице
С(х), не затрагивая ее первые строку и столбец, получится матрица
D(x) = diag[fl(x\ f2(x), ..., /„(*)]¦
Заметим, что каждый из многочленов /,¦(*) делится на fx(x). Действи-
Действительно, прибавив к первой строке матрицы D(x) ее /-ю строку, мы
получим fi(x) в первой строке. Но выше было показано, что в этом
случае (матрица вида В(х)) fi(x) делится на fx(x). Итак, D(x)~ A(x)
и D(x) — каноническая матрица. Существование канонической
формы матрицы доказано.^
Процесс, описанный в доказательстве теоремы 20.1, можно осу-
осуществить практически. Пусть А(х) — ненулевая матрица порядка п
над Р[х]. Среди ее ненулевых элементов найдем многочлен мини-
минимальной степени /л, пусть это будет f(x). Если не каждый элемент
матрицы А(х) делится на /(*), то с помощью подходящих элементар-
элементарных преобразований получим матрицу В(х), среди ненулевых эле-
элементов которой есть многочлен степени, меньшей т. Аналогично
поступим с матрицей В(х). Этот процесс будем повторять до тех пор,
пока це получим матрицу, все элементы которой делятся на какой-
либо один из них. Умножив последний элемент (т. е. содержащую
его строку) на подходящий элемент поля Р, получим многочлен
f{(x) со старшим коэффициентом 1, делящий все элементы последней
матрицы. Упорядочив соответствующим образом строки и столбцы,
поставим /,(*) на позицию A.1). Теперь можно привести получен-
57
ную матрицу к виду A) и применить описанное построение к матри-
матрице B).
Пример 20.1. Привести к канонической форме матрицу
х х+\ 0
+ 2 х—\ х
— 1 х — 1 х
Решение. Вычитая из первого и второго столбцов третий, получаем матрицу
Г х х+\ 0
В{х) = \ 2 -1 х
1~\ -1 х
Переставим первую и третью строки и затем умножим новую первую строку на —1:
1 1 —х]
2 -1 x\,f](x)=\.
х х+\ Oj
Далее, очевидно, что
— х\ \\ 0 0| [1 0 0] [1 0 0
0 -3 Зх ~ 0 -3 Зх U 0 1 —х ~ 0 1 —х
0 1 х2] [О 1 х2\ L0 1 х2] [О 0 х2-\-х
1 0 0
0 1 О
О 0 х2 + х
Итак, diag[l, 1, х'г -\- х]—каноническая форма матрицы А(х).
Упражнения
1. Каноническую форму можно определить и для случая, когда число строк
матрицы не равно числу столбцов. Например, в случае 2ХЗ-матриц каноническая
форма имеет вид
I7.W о о|
L о h(x) о]'
Дайте определение канонической формы матрицы в общем случае и докажите теорему
о существовании канонической формы.
2. Вы знаете о замечательной аналогии между кольцами Р[х] и Z, первопричиной
которой является теорема о делении с остатком. Оказывается, эту аналогию можно
распространить на матрицы, т. е. определить инвариантные множители и каноническую
форму матрицы над Z. При этом вместо равенства единице старшего коэффициента
ненулевого инвариантного множителя требуется, чтобы этот множитель был положи-
положительным. Полученная каноническая форма называется нормальной формой Смита
целочисленной матрицы. Дайте определение инвариантных множителей целочислен-
целочисленной матрицы и докажите теорему о существовании нормальной формы Смита.
3. Докажите, что система линейных уравнений, все коэффициенты и свободные
члены которых — целые числа, разрешима в целых числах тогда и только тогда,
когда нормальная форма Смита ее расширенной матрицы получается из нормальной
формы Смита основной матрицы приписыванием нулевого столбца.
20.2. Однозначность канонической формы
Пусть А(х)—квадратная матрица порядка п над кольцом Р[х] и
г — максимальный порядок ее отличных от нуля миноров. Тогда для
любого k = 1, 2, ..., г в матрице А(х) есть минор порядка /г, не равный
нулю (почему?). Обозначим через dk(x) наибольший общий делитель
всех миноров /г-ro порядка матрицы А(х), k = 1, 2, ..., г, со старшим
58
коэффициентом 1. При г < п положим di(x) = 0, / = г+1, ..., п.
Систему многочленов
dx{x\ d2(x\ ..., dn(x) A)
назовем системой наибольших общих делителей миноров матри-
матрицы А(х).
Лемма 20.1. Система наибольших общих делителей миноров
матрицы над Р[х] не изменяется при элементарных преобразованиях.
> Рассмотрим, например, элементарные преобразования строк.
Пусть строка матрицы А(х) умножается на отличный от нуля эле-
элемент а поля Р. Тогда те миноры, через которые проходит эта строка,
умножаются на а, а остальные не меняются. Но наибольший общий
делитель системы многочленов не изменится, если некоторые из них
умножить на отличное от нуля число.
Пусть теперь к первой, например, строке матрицы А(х) прибавля-
прибавляется ее вторая строка, умноженная на многочлен g(x). В результате
могут измениться лишь те миноры, через которые проходит первая
строка матрицы А(х), но не проходит вторая. Именно: к каждому
такому минору порядка k прибавится другой минор того же порядка
(через который проходит вторая строка, но не проходит первая),
умноженный на g(x). Но наибольший общий делитель системы
многочленов не изменится, если к одному из этих многочленов при-
прибавить другой, умноженный на произвольный многочлен. <4
Лемма 20.2. Инвариантные множители матрицы над Р[х] одно-
однозначно определяются системой наибольших общих делителей мино-
миноров этой матрицы.
> Пусть А(х) — квадратная матрица над Р[х], A)—система
наибольших общих делителей ее миноров и К(х) = diag[f\ {x\ U(x\ ...,
fn(x)} — ее каноническая форма. Тогда, согласно предыдущей лемме,
система многочленов A) является системой наибольших общих
делителей миноров и для матрицы К(х). Но старший коэффициент
многочлена fx(x) равен 1, и этот многочлен делит каждый из мно-
многочленов fi(x). Поэтому d\(x) = fi(x). Аналогично d2(x) = f\(x)f2(x), ...,
dn(x) = fi(x)f2(x)-"fn(x). Итак, инвариантные множители матрицы
А(х) однозначно определяются системой наибольших общих делите-
делителей ее миноров:
/i(*) = di(*), fi(x) = d?(x)/di-l(x), / = 2, ..., г,
/,+ ,(*)=... =/„(*) = ().<* B)
Из лемм 20.1 и 20.2 следует единственность канонической формы
матрицы, т. е. теорема 20.1 полностью доказана.
Пример 20.2. Привести к канонической форме матрицу
Г х х+\ 0
А(х)= х + 2 х—\ х .
,Х—\ X— \ X
Решение. Вначале вычислим систему наибольших общих делителей миноров
матрицы А(х). Начнем с ее определителя:
X
X
X
4-
2
1
X
X
X
4-
—
1
1
1
0
X
X
X
х 4- 2
— 3
X
X
4-1
— 1
0
0
X
0
Следовательно, dz(x) = х(х-\-\). Многочлен d'z{x) является делителем многочлена
d3(x), поэтому d2(x)= 1, х, х + 1, х(х + 1). Рассмотрим минор
х х "Т" И
х + 2 х-\\-
Многочлен М(х) не делится ни на х, ни на х -\- 1, поскольку М@) = — 2 ^ 0 и М(— 1) =
= 2^0. Следовательно, d2(x)=\. Тогда и d\(x)=\. По формулам B) получаем
fl(x) = f2(x)=\, h(x) = x(x+\).
Следовательно, матрица diag[l, 1, х(х + 1)] является канонической формой матри-
матрицы А(х).
20.3. Матрицы, обратимые над кольцом многочленов
Пусть К— произвольное кольцо с единицей. Рассмотрим мно-
множество Кп.п всех квадратных матриц над К. Будем складывать и
умножать матрицы над К по тем же правилам, что и матрицы над
полем.
Предложение 20.2. Множество Кп,п относительно сложения и ум-
умножения матриц является кольцом с единицей.
^ Приведенные ранее доказательства свойств сложения и умно-
умножения матриц над R (см. § 2.4) дословно переносятся на рассматри-
рассматриваемые матрицы. ^
Нас интересует сейчас мультипликативная группа кольца Кп,п —
множество матриц, для которых существуют над К обратные
матрицы.
«Лемма 20.3. Квадратная матрица А над кольцом К с единицей
имеет обратную над К тогда и только тогда, когда detA является
обратимым элементом кольца К.
> Приведенное в § 4.6 доказательство для случая матриц над R
сохраняется и здесь. Надо только иметь в виду, что отличные от нуля
числа и есть обратимые элементы R.^
Ниже нам понадобится вспомогательное понятие элементарной
матрицы. В § 4.8 мы уже имели с ним дело. Модифицируем это
понятие применительно к матрицам над Р[х].
Определение 20.4. Квадратная матрица А(х) над Р[х) называ-
называется элементарной, если она является матрицей одного из следующих
двух видов:
1) А(х) — диагональная матрица, одним из диагональных элемен-
элементов которой является произвольное, отличное от нуля число из поля Р,
а все другие диагональные элементы равны 1;
2) все диагональные элементы матрицы А(х) равны I, а все
остальные ее элементы—0, кроме одного, равного произвольному
многочлену.
Предложение 20.3. Применение к строкам (столбцам) матрицы
элементарного преобразования равносильно умножению ее слева
(справа) на подходящую элементарную матрицу.
> Доказательство аналогично доказательству предложения 4.2. А
Теорема 20.2 (критерий обратимости матрицы над кольцом мно-
многочленов). Для квадратной матрицы А (х) над Р[х] равносильны
следующие утверждения:
60
1) существует матрица А(х) 1 над Р[х\;
2) det Л(лг) — ненулевой элемент поля Р;
3) А(х) эквивалентна единичной матрице;
4) А(х) есть произведение элементарных матриц.
> Непосредственно из определения умножения многочленов сле-
следует, что обратимыми элементами кольца Р[х] являются все отличные
от нуля элементы поля Р, и только они. Поэтому равносильность
утверждений 1 и 2 теоремы вытекает из леммы 20.3.
Далее, пусть А(х) — квадратная матрица порядка п над Р[х].
Условие
det A(x)?P, detA(x)=?0 A)
равносильно условию dn(x)= 1. Но
где f\(x), /2ОО, •••, fn(x)—инвариантные множители матрицы А(х).
Следовательно, условие A) равносильно условию //(jt)=l, /=1,
2, ..., /г, т. е. ? = diag[l, ..., 1] — каноническая форма матрицы А(х).
Доказана равносильность утверждений 2 и 3.
Эквивалентность А(х) ~ Е означает, что матрица А(х) получается
из ? с помощью элементарных преобразований строк и столбцов.
С учетом предложения 20.3 имеем:
где Л, Qj — подходящие элементарные матрицы. Доказана эквива-
эквивалентность утверждений 3 и4.^
Следствие 20.1 (критерий эквивалентности матриц). Пусть
А(х) и В(х) — квадратные матрицы порядка п над Р[х\. Для того чтобы
матрицы А(х) и В(х) были эквивалентны, необходимо и достаточно
существование двух матриц С(х) и D(x) порядка п, обратимых над
Р[х] и удовлетворяющих равенству
B(x)=C(x)A(x)D(x). B)
> По определению В(х)~ А(х) означает, что матрица В(х)
получается из матрицы А{х) в результате применения подходящих
элементарных преобразований, т. е. умножения на элементарные
матрицы:
B{x) = Pr.-PxA(x)Qx...Qm. C)
Но матрица обратима над Р[х] тогда и только тогда, когда она явля-
является произведением элементарных матриц. Поэтому существование
элементарных матриц Pt, Qy, удовлетворяющих равенству C), как раз
и означает существование обратимых над Р[х] матриц С(х) и D(x\
удовлетворяющих равенству B):
61
20.4. Элементарные делители матрицы
Определение 20.5. Пусть f(x) — многочлен ненулевой сте-
степени над полем Р, старший коэффициент которого равен 1, f(x) =
= px(x)^p2(x)k* • • • pt(x)k< — каноническое разложение. Многочлены
pi(x)k\ /= 1, 2, ..., /, называются элементарными делителями много-
многочлена f(x). Пусть А(х) — квадратная матрица над Р[х\. Системой
элементарных делителей матрицы А(х) называется набор элемен-
элементарных делителей всех инвариантных множителей этой матрицы.
Каждый элементарный делитель включается в этот набор столько
раз, во сколько инвариантных множителей он входит.
Напомним, что многочлены p-t(x) неприводимы над Р, их старшие
коэффициенты равны 1 и р^х)Ф pj(x) при 1ф\.
Замечание 1. Только непостоянные инвариантные множители (т. е. отличные
от 0 и 1) имеют элементарные делители.
Замечание 2. Инвариантные множители матрицы не изменяются при рас-
расширении основного поля (почему?), а система ее элементарных делителей может при
этом измениться.
Пример 20.3. Найти системы элементарных делителей над Q и R матрицы
Решение. Вначале вычисляем наибольшие делители миноров матрицы А(х):
) = *+ 1, d2(x) =
х2 — 1 х + 1
* + 1 х2 + 2х 4
= (х+\J(х2-2).
Теперь находим инвариантные множители:
/,(*) = dl(x) = x+\, f2(x) = а2(х)/с1{(х) = (х+\) (х2-2).
Многочлен х2—2 неприводим над Q, следовательно, матрица А(х) имеет над Q
три элементарных делителя: х-\- 1, х -j- 1, х2 — 2. Над R многочлен х2 — 2 приводим:
х2 — 2 = (х — -у 2) (х -f у 2), значит, матрица А(х) над R имеет четыре элементарных
делителя: х -\- 1, х -j- 1, х — ~\2, х -j- y2.
Эквивалентные матрицы имеют совпадающие системы элементар-
элементарных делителей (почему?). Верно утверждение, в определенном
смысле обратное.
Предложение 20.4. Пусть заданы порядок квадратной матрицы
над Р[х\ максимальный порядок ее отличных от нуля миноров и си-
система ее элементарных делителей. Тогда однозначно определяются
инвариантные множители этой матрицы и, следовательно, сама
она определяется с точностью до эквивалентности.
> Пусть известны п — порядок некоторой матрицы А(х) над
Р[х\ г — максимальный порядок ее не равных нулю миноров и S —
система элементарных делителей. Обозначим
/,(*), Ux), ..., /„(*) A)
инвариантные множители этой матрицы. При г<я имеем /;(х) = 0,
/ = г + 1, ... , п. Нам известны элементарные делители матрицы
А(х). Это степени неприводимых над Р многочленов
62
рх(х), р2(х\ ..., рт(х). B)
Так как многочлен fr(x) делится на каждый из предыдущих много-
многочленов fi(x), то в каноническое разложение fr(x) каждый из много-
многочленов B) входит в максимальной степени среди имеющихся в си-
системе S. Итак, fr(x) определен.
Удалив из системы S (только по одному разу) элементарные
делители, вошедшие в />(лг), получим систему S{. Инвариантный мно-
множитель fr-i(x) восстанавливается с помощью S, так же, как fr(x),
исходя из S, и т. д. Так как произведение f\(x)f2(x)---fr(x) совпа-
совпадает с произведением всех элементарных делителей, входящих в S,
то возможно одно из двух: либо мы определим f{(x\ одновремен-
одновременно исчерпав всю систему S, либо S исчерпывается ранее, при
определении, скажем, многочлена fi(x) с 1>\. Тогда fl(x) = ...=
= /,_,(*)= Ы
В следующей главе используется определенная связь, сущест-
существующая между системами элементарных делителей клеточно-диа-
гональных матриц.
Предложение 20.5. Система элементарных делителей диаго-
диагональной матрицы над Р[х] есть объединение систем элементарных
делителей ее диагональных элементов. При этом каждый элемен-
элементарный делитель учитывается столько раз, во сколько диагональных
элементов он входит.
^ Пусть Л (л:)—диагональная матрица порядка п над Р[х\ не-
ненулевые диагональные элементы которой
В\(х\ ?2(*)> •••> ёг(х). C)
Пусть, далее, A) —система инвариантных множителей матрицы
А(х). Очевидно, что максимальный порядок отличных от нуля ми-
миноров этой матрицы равен г, поэтому fi(x) = O при i> r. Далее
имеем:
где dr(x) — наибольший общий делитель миноров r-го порядка мат-
матрицы А(х), и
gi(x)g2(x)---gr(x) = 0Ldr(x), а 6Л а=^О.
Пусть pi(x\ /=1, 2, ..., 5,— все различные неприводимые над по-
полем Р делители многочленов C) со старшим коэффициентом 1. Из
последних двух равенств следует, что эти же многочлены, и только
они, являются неприводимыми над полем Р делителями многочле-
многочленов A) со старшим коэффициентом 1. Поэтому элементарные дели-
делители матрицы А{х) имеют вид Pi(xf. Для каждого из многочленов C)
выделим максимальную степень многочлена рх(х\ на которую он
делится, т. е. представим gk(r) в виде
63
где qk{x) не делится на рх(х). Мы получим систему многочленов
р,(х)\ *=1, 2, ..., г. D)
Если не считать тех значений /г, при которых а* = 0, система D) по
построению есть система всех элементарных делителей многочле-
многочленов C), относящихся к многочлену рх{х\ т. е. имеющих вид рх(х)ь.
Будем считать многочлены C) занумерованными таким образом,
что а\ < п2 ^ ... ^ аг. Рассмотрим максимальную степень много-
многочлена Р\{х\ на которую делится dk{x) — наибольший общий делитель
миноров k-то порядка матрицы А(х). Очевидно, что при k^r она
равна рх(ху* + а* + + a*. Так как
/1(JC) = d1(jc), fk(x)=dk(x)/dk-i(x), fe = 2, ..., ry
то px{xfk есть максимальная степень многочлена рх(х), делящая dk(x).
Если а*=И=0, то многочлен px(xfk—единственный элементарный де-
делитель многочлена /л(лс), делящийся на рх(х). При ак = 0 fk{x) не имеет
элементарных делителей, делящихся на рх(х). Таким образом, мно-
многочлены D) с пкфО, и только они, составляют систему элемен-
элементарных делителей матрицы А(х) вида рх(х)ь. Аналогично разбирают-
разбираются случаи / = 2, ..., г. Доказано, что системы элементарных делите-
делителей многочленов C) и матрицы А(х) совпадают.^
Следствие 20.2. Система элементарных делителей клеточно-
диагональной матрицы есть объединение систем элементарных де-
делителей ее диагональных клеток.
> Пусть А(х) = d\ag[A{(x)y А2(х\ ..., Лш(дс)]—клеточно-диаго-
нальная матрица, где Л/(дс) — квадратная матрица над Р[х]. Эле-
Элементарными преобразованиями приведем каждую клетку Л/(дс) к ка-
канонической форме:
A{x)~d\ag\fn(x), fi2(x\ ..., Unix)].
Элементарные делители клетки Ai(x) есть по определению элемен-
элементарные делители многочленов fn(x), fi2(x\ ..., fin.(x). Элементарные
преобразования клетки Ai(x) можно рассматривать как элементар-
элементарные преобразования матрицы А(х)у не затрагивающие строк и столб-
столбцов, которые не проходят через клетку Ai(x). Поэтому матрица А(х)
эквивалентна диагональной матрице
BW = diag[/nW, .... /1я1(х), ..., fjx), ...,fmjx)}.
Система элементарных делителей матрицы В(х) есть, согласно
предложению 20.5, объединение систем элементарных делителей
ее диагональных элементов. Следовательно, она совпадает с объ-
объединением систем элементарных делителей клеток Л/(дс). Матрица
А(х) как эквивалентная матрице В(х) имеет те же элементарные
делители. Ч
64
Упражнения
1. Докажите, что одного только совпадения размерностей матриц и систем
элементарных делителей недостаточно для их эквивалентности.
2. Докажите, что утверждение следствия 20.2 перестанет быть верным, если
вместо элементарных делителей взять инвариантные множители.
20.5. Матричные многочлены
Матрицу над Р[х] можно представить в виде многочлена от х,
коэффициенты которого — матрицы над Р. В самом деле, пусть
А(х) — ненулевая матрица порядка п над Р[х\ т — максимальная
степень ее элементов. Тогда очевидно, что матрицу А{х) можно
однозначно представить в виде суммы
А(Х) = Вт{х) + Вт-\(Х) + ... + Вх(х) + В 0,
где для / = 0, 1, ..., т каждый элемент матрицы Bi{x) имеет вид щх\
<Xi?P (jc°=1). Представив каждую из матриц Bi(x) в виде произ-
произведения
где At— постоянная матрица, т. е. Л,-?/>„,„, получим
А (х) = Amxm + Am- ixm~' + ... + А хх + Ло.
Определение 20.6. Матрица
Amxm + Am-\xm~x + ... + Ахх + Ло, Л,- 6 Рп,п, A)
называется матричным многочленом от х порядка п. Матрицы Л/,
/ = 0, 1, ..., т, называются коэффициентами этого многочлена. Если
Ат — ненулевая матрица, то m называется степенью многочлена
A), Amxm — его старшим членом.
Пример
го
= О
О
20.4.
2
0
0
01
о *Ч
0
|
[1 0
Jo о
L0 2
Г л:3
0
_*2
01
1 ;
0
2х4
2х
2х"
Г
-[_
0
0
1
-1
2
-2
0
0
0
X*
X
0
0
X
+
|
V2
X
1.
-(-
=
0
0
0
2
0
1
1
1
П Г0 -1 01
1 *+ 0 2 0
1J L0 -2 1J
Это матричный многочлен четвертой степени.
Из определения равенства матриц следует условие равенства
матричных многочленов одинаковых порядков: матричные многочле-
многочлены равны, если их степени одинаковы и коэффициенты при равных
степенях х равны.
Существует теория делимости матричных многочленов, аналогич-
аналогичная теории делимости в кольце Р[х]. Конечно, в этом случае возника-
возникают дополнительные трудности, связанные с наличием в кольце матриц
делителей нуля и некоммутативностью умножения матриц. Мы не
станем развивать эту теорию, но получим утверждение, необходимое
5. За к. 6466 65
для доказательства критерия эквивалентности характеристических
матриц.
Теорема 20.3. Пусть А(х) и В(х) — матричные многочлены поряд-
порядка п над полем. Р, А(х) — произвольный, В(х) — хЕ—С, где С —
постоянная матрица. Тогда существует единственная пара Qi(x), R\
матриц порядка п над Р\х\ таких, что
A(x) = B(x)Ql(x) + Rl B)
и R\ — постоянная матрица. Аналогично существует единственная
пара Q2(x)y Ri матриц порядка п над Р[х\, таких, что
и /?2 — постоянная матрица.
Матрицы Q\{x) (Q2W) и /?, (/?2) называются соответственно
частным и остатком, при делении матрицы А(х) наВ(х) слева (справа).
> Докажем существование и единственность только левых част-
частного и остатка, так как второе утверждение теоремы (для правых
частного и остатка) получается аналогично.
Прежде всего заметим, что если
является произвольным матричным многочленом степени р (т. е.
Qp-фО) и порядка п, то произведение B(x)Q(x) имеет степень р+ 1.
Пусть теперь существуют нужные нам матрицы Q\(x) и R\.
Из сказанного выше следует, что если А(х) = А — постоянная мат-
матрица, то Q\(x) = 0 и Ri=A. Если же
A(x) = Amxm + Am-xxm-{ + ... + A0, Arn^Q, m > О,
то матричный многочлен Q\(x) степени т— 1 имеет вид
Ql(x) = Dm__lxm~1+Dm-.2jcw + ... + ?)o- C)
Перепишем условие B):
-\X -j- Um — 4X -f ••• ~Г UO) ~Г Д1-
Приравнивая коэффициенты при одинаковых степенях х, получаем:
Г)
т — *-/ гп — 1»
—3
0 U
Ao =RX ~CD0.
D)
Из последней системы равенств еднозначно определяются коэф-
коэффициенты многочлена Q\(x) и остаток R\ (сравните со схемой Горнера
в § 9.4). Итак, доказано, что существует не более одной пары Qi(x),
R\, удовлетворяющей равенству B). С другой стороны, если m > О
66
и коэффициенты Д- матричного многочлена C) определяются из
системы D), то верно условие B). Если же А(х) = А (т = 0), то
Qi(x) = O и R\ =A удовлетворяют условию B).<4
20.6. Критерий подобия матриц над полем
Мы приступаем к формулированию и доказательству основной
теоремы этой главы — критерия подобия матриц над полем. Сначала
докажем следующую лемму.
Лемма 20.4. Пусть А и В — квадратные матрицы порядка п над
полем Р. Их характеристические матрицы хЕ — А и хЕ — В экви-
эквивалентны над Р[х] тогда и только тогда, когда над полем Р есть
невырожденная матрица Q порядка п, удовлетворяющая равенству
> Достаточность условия леммы вытекает непосредственно из
следствия 20.1, поскольку матрицы Q и Q обратимы над Р[х].
Докажем необходимость условия леммы. Пусть хЕ — А ~ хЕ — В.
Согласно следствию 20.1, существуют обратимые над Р[х] матрицы
С(х) и D(x), удовлетворяющие равенству
. B)
Положив С(х)~[ = F(x), из равенства B) получим
F(x)(xE-B) = (xE-A)D(x). C)
Разделим F(x) слева на хЕ — Л, a D(x) справа на хЕ — В:
F(x) = (xE-A)Qi(x) + Ru D(x)= Q2(x)(xE- В) + R2. D)
Здесь /?i и /?2— постоянные матрицы. Из равенств C) и D) получим
или
(хЕ - A) (Q, (х) - Q2(x)) (хЕ ~В) = (хЕ - A)R2 - /?, (хЕ - В). E)
Если
QiW-Q2(x)^0, F)
то левая часть равенства E) — матричный многочлен степени не
меньше второй. Правая же часть этого равенства — многочлен степе-
степени не больше первой. Поэтому неравенство F) невозможно, Q\(x) —
— Q2(x) = 0, и из формулы E) следует
(xE-A)R2 = Ri(xE-B). G)
Сравнивая коэффициенты при х в обеих частях равенства G),
получаем R2 = R\.
Докажем, что R{ — невырожденная матрица. Для этого матрицу
С(х) разделим слева на хЕ — В:
67
где Rs — постоянная матрица. Теперь имеем:
Еп = F(x)C(x) = F(x)((xE - B)Q3(
= F(x)(xE-B)Q3(x) + F(x
С учетом равенств C) и D), из формулы (8) получаем
Еп = F(x)C(x) = F(x)((xE - B)Q3(x) + Ra) =
= F(x)(xE-B)Q3(x) + F(x)R3. (8)
Итак,
En = (xE-A)(D(x)Qs(x)+Qi(x)) + RlR3. (9)
Если D(x)Qs(x)-\- С}\(х)Ф0, то правая часть равенства (9)—мат-
(9)—матричный многочлен степени не меньше первой. Последнее невозмож-
невозможно, ибо левая часть равенства (9) — постоянная матрица. Следо-
Следовательно,
D(x)Qb(x)+Qi(x) = O, En = RlR3i R3 = Rrl.
Умножая обе части равенства G) слева на /?з, получаем
Дадэе( полагая /?з = Я, /?2 = Q, имеем Р(хЕ — A)Q = хЕ — В. Срав-
Сравнивая коэффициенты при х в обеих частях последнего равенства,
получаем PQ = En, P = Q~\ и из формулы (9) следует равен-
равенство A).«
Теорема 20.4 (критерий подобия матриц над полем). Матрицы
одного и того же порядка подобны над полем Р тогда и только тогда,
когда их характеристические матрицы эквивалентны над Р[х].
> Пусть А и В — подобные матрицы. Тогда
Но Q~l(xE)Q = xE, поэтому
хЕ - В = Q~lxEQ -Q-i AQ = Q (хЕ - A)Q,
и характеристические матрицы хЕ — А и хЕ — В эквивалентны.
Обратно, пусть хЕ — А ~ хЕ — В. Тогда, согласно лемме 20.4,
верно равенство A), из которого следует
B = Q~lAQ.< A0)
Следствие 20.3. Пусть А и В — квадратные матрицы одного
и того же порядка над полем Р. Тогда равносильны следующие
утверждения:
1) А и В подобны над Р;
2) системы наибольших общих делителей миноров матриц хЕ — А
и хЕ-—В совпадают;
3) системы инвариантных множителей матриц хЕ — А и хЕ — В
совпадают;
4) системы элементарных делителей матриц хЕ — А и хЕ — В
совпадают.
68
> Пусть А и В подобны. Тогда их характеристические матрицы
эквивалентны. Поскольку наибольшие общие делители миноров
матрицы не изменяются при элементарных преобразованиях, то
утверждение 2 верно. Инвариантные множители однозначно опре-
определяются системами наибольших общих делителей миноров, поэтому
утверждение 3 справедливо. Элементарные делители матрицы опреде-
определяются ее инвариантными множителями, следовательно, утвержде-
утверждение 4 верно.
Обратно, пусть системы элементарных делителей матриц хЕ — А
и хЕ — В совпадают. Определитель характеристической матрицы
отличен от нуля, следовательно, максимальные порядки не равных
нулю миноров матриц хЕ — А и хЕ — В равны. Но тогда совпадают
их системы инвариантных множителей, следовательно, эти матрицы
имеют одну и ту же каноническую форму. Две матрицы, эквивалент-
эквивалентные третьей, эквивалентны друг другу. Итак, хЕ — А ~ хЕ — В,
а тогда А и В подобны, т. е. утверждение 1 верно. ^
Если матрицы А и В подобны и верно равенство A0), говорят,
что матрица Q трансформирует А в В, к называют ее трансформи-
трансформирующей матрицей. Часто важно не только установить подобие матриц
А и В, но и найти трансформирующую матрицу Q. Это можно сделать
следующим образом. Пусть A=[aij]1 B = [ft(/], Q = [*,•,•]. Перепишем
равенство A0) в виде
Перемножив соответствующие матрицы и сравнив затем элемен-
элементы, занимающие одну и ту же позицию в левой и правой частях
равенства, получим систему линейных уравнений с неизвестными
Хц. Найдя одно из ее решений, составим матрицу Q. Если det Q Ф 0,
то матрица Q — трансформирующая.
Приведем еще один способ построения трансформирующей
матрицы. Пусть А и В подобны. Тогда их характеристические матри-
матрицы эквивалентны и имеют, следовательно, одну и ту же каноническую
форму К(х). Далее,
К(х) = С, (х) (хЕ - A)DX (х) = С2(х) (хЕ - B)D2{x), A1)
где Ci(x), Di(x), /=1, 2,— обратимые над кольцом Р[х] матрицы,
способ построения которых известен (они являются произведениями
элементарных матриц, соответствующих элементарным преобразова-
преобразованиям). Из формул A1), положив С(х)= C2(x)~~l Ci(jt), D(x) =
= D\(x)D2(x)~\ получим равенство B). Как доказано выше, из
равенства B) следует равенство A0), где Q~! — остаток при делении
матрицы С(х) слева на хЕ — В.
Упражнения
1. Пусть Л и В — квадратные матрицы над полем Р. Докажите, что если Л и В
подобны над каким-либо расширением поля Р, то они подобны и над Р.
2. Докажите, что если две диагональные матрицы различаются лишь порядком
расположения элементов на диагонали, то они подобны.
69
21. НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ НАД ПОЛЕМ
В этой главе рассматривается следующая задача: в классе по-
подобных матриц выбрать матрицу, имеющую по возможности более
простой вид. Самым простым видом представляется диагональный,
однако не каждая матрица подобна диагональной. Существует
несколько вариантов решения этой задачи. Мы рассмотрим два из
них: жорданову и фробениусову нормальные формы.
21.1. Определение и построение жордановой нормальной формы
Определение 21.1. Пусть Р — произвольное поле, а?Р. Квад-
Квадратная матрица
а
0
0
0
0
1
а
0
0
0
0
1
а
0
0
... 0
... 0
... о
а
... о
0
0
0
1
а
порядка п называется клеткой Жордана Jn(a), соответствующей
собственному значению а.
Все диагональные элементы клетки Jn(a) равны а, выше диагонали
параллельно ей расположена полоса 1, ..., 1, все другие элементы
клетки равны 0. Например,
2 1
2
Определение 21.2. Клеточно-диагональная матрица
/ = diag[4,, Л2, ..., Ат\
где для /=1, 2, ... , m A[ — произвольная клетка Жордана, на-
называется матрицей Жордана. Если А — произвольная квадратная
матрица и J — подобная ей матрица Жордана, то J называется
жордановой нормальной формой матрицы А.
Теорема 21.1. Для существования жордановой нормальной формы
квадратной матрицы порядка п над полем Р необходимо и доста-
достаточно, чтобы характеристический многочлен этой матрицы имел
в поле Р п корней (с учетом их кратностей), т. е. был разложим над
этим полем в произведение многочленов первой степени. Жорданова
нормальная форма матрицы определена однозначно с точностью
до порядка следования клеток Жордана на главной «диагонали».
Доказательство этой теоремы опирается на следующую лемму.
Лемма 21.1. Пусть
/ = diag[/IIl(aI), /я,(а2), .... /nm(am)]. A)
Тогда элементарными делителями характеристической матрицы
являются многочлены
70
(x-a,-)"', /=1, 2, ..., m, B)
w только они. При этом учитываются все повторения многочленов B).
> Поскольку система элементарных делителей клеточно-диаго-
нальной матрицы является объединением систем элементарных де-
делителей ее диагональных клеток и при этом учитываются все повто-
повторения элементарных делителей, то достаточно доказать лемму для
случая пг==\. Итак, пусть J — Jn(a), тогда
х — а _j 0 ... О О
xEn-J =
0
0
0
0
х — а
0
0
0
|
х — а
0
0
... 0
... о
• •• х — а
... о
0
0
-1
х — а.
C)
Вначале найдем систему di{x\ /=1,2, ..., п, наибольших общих
делителей миноров. Очевидно, что dn(x) = (x — а)п. Далее рассмот-
рассмотрим минор М порядка п— 1 матрицы C), остающийся после уда-
удаления первого столбца и последней строки: М = (—l)"". Поэтому
dn-\(x)= 1, откуда di(x)= I, i = 1, 2, ..., п — 1. По формулам
fx(x) = dx{x\ fi(x) = di(x)/di-i(x), i = % ..., /i,
находим инвариантные множители матрицы C):
/,(*) = ...=/„_,(*)= 1, Цх) = (х-а)п. D)
Из равенств D) следует, что матрица C) имеет единственный
элементарный делитель (х — а)п.<4
Перейдем непосредственно к доказательству теоремы 21.1.
> Вначале рассмотрим условия существования жордановой
нормальной формы. Пусть А — квадратная матрица порядка я,
для которой существует жорданова нормальная форма / над по-
полем Р. На диагонали матрицы / расположены корни ее характери-
характеристического многочлена с(х)у и только они. Следовательно, с(х) имеет
п корней в поле Р. Матрица Л, будучи подобной матрице /, имеет
тот же характеристический многочлен.
Пусть, обратно, характеристический многочлен с(х) матрицы А
имеет п корней в поле Р и, следовательно, может быть разложим
над Р на множители первой степени. Каждый элементарный делитель
матрицы хЕ — А делит многочлен с(х) и является степенью неприво-
неприводимого над Р многочлена. Значит, этот делитель имеет вид (х — a)k.
Пусть B)—система элементарных делителей матрицы хЕ — А,
J — матрица Жордана A), соответствующая системе B). Порядок
матрицы / равен сумме степеней элементарных делителей B), т. е.
степени их произведения. Но это произведение равно произведению
всех инвариантных множителей матрицы хЕ — Л, т. е. многочлену
dn(x). Следовательно, / — матрица порядка п. Системы элементарных
делителей матриц хЕ — А и хЕ — J совпадают. Значит, матрицы А и
/ подобны, J — жорданова нормальная форма матрицы А.
Теперь обсудим вопрос об однозначности жордановой нормальной
формы. Последовательность расположения клеток Жордана на
71
диагонали матрицы A) произвольная, так что жорданова нормаль-
нормальная форма матрицы, вообще говоря, определена неоднозначно. Дело
только в расположении диагональных клеток. Действительно, пусть
матрицы Жордана подобны. Тогда их характеристические матрицы
эквивалентны и, следовательно, имеют совпадающие системы эле-
элементарных делителей. Но система элементарных делителей определя-
определяет матрицу Жордана с точностью до последовательности распо-
расположения «диагональных клеток»: число этих клеток равно числу
элементарных делителей, каждому элементарному делителю вида
(х — а)т соответствует клетка Jm(a).4
Следствие 21.1. Для любой квадратной матрицы над полем
комплексных чисел существует жорданова нормальная форма.
> Доказательство вытекает из предыдущей теоремы и основной
теоремы алгебры комплексных чисел (см. § 6.4).
В доказательстве теоремы 21.1 содержится алгоритм построения
жордановой нормальной формы произвольной матрицы А. Нужно
найти систему элементарных делителей матрицы хЕ — А. Если
хотя бы один из них не является многочленом вида (х — а)*, то жорда-
жордановой нормальной формы не существует (над фиксированным по-
полем). В противном случае для каждого элементарного делителя вида
(х — df нужно записать клетку Жордана /*(а). Клеточно-диагональ-
ная матрица, составленная из этих клеток (расположенных на
«диагонали» в произвольной последовательности), является жорда-
жордановой нормальной формой матрицы А.
Пример 21.1. Найти жорданову нормальную форму матрицы
ГЗ -1 0]
А=\6 -3 2 .
1_8 -6 5J
Решение. Вычислим систему наибольших общих делителей миноров характе-
характеристической матрицы
[х-3 1 0 1
_6 * + 3 -2 •
-8 6 *-5J
Очевидно, что d\(x) = d2(x)= 1. Вычислим d3(x):
[х-3 1 0 1
_6 х + 3 -2 = *3 - 5*2 + 9* - 5.
-8 6 *-5j
Далее,
fl(x) = dl{x)= I, f2(x) = d2(x)/di(x)=\,
fs(x) = d3{x)/d2(x) = x3-5x2 + 9x-b = (x- \){x2 - 4x + 5).
В поле R многочлен х2 — 4x -f- 5 корней не имеет. Следовательно, над R не сущест-
существует жордановой нормальной формы матрицы А. Если же основным полем служит
поле С комплексных чисел, то жорданова нормальная форма существует. В этом
случае
/з(х) = (х - 1) (х - 2 - /) (х - 2 + /).
Итак, хЕ — А имеет три элементарных делителя: х—\, х — B -f- /), х — B — /).
Следовательно, diagjl, 2 -j- U 2 — /]—жорданова нормальная форма матрицы А.
72
21.2. Еще один способ построения жордановои нормальной формы
Жорданова нормальная форма матрицы часто используется как в
самой алгебре, так и в ее приложениях. Идея способа построения
жордановои нормальной формы, изложенного в § 21.1, проста, но его
реализация связана с трудностями вычислительного характера. Одно
только нахождение системы инвариантных множителей требует
большого объема вычислений, а дальнейшее построение канони-
канонического разложения инвариантных множителей, как правило, крайне
трудно.
Здесь мы рассмотрим другой способ построения жордановои
нормальной формы, не требующий предварительного вычисления
инвариантных множителей и элементарных делителей. Если известны
все корни характеристического многочлена матрицы, то для постро-
построения ее жордановои нормальной формы этим способом нужно вычис-
вычислить ранги еще нескольких матриц. При таком способе построения
жордановои нормальной формы часто требуется меньший объем
вычислений, чем при предыдущем. Однако он связан с другими
трудностями, обсуждение которых не входит в задачи нашей книги.
Теорема 21.2. Пусть А — квадратная матрица порядка п над
произвольным полем Р, J — ее жорданова нормальная форма, с(х) —
характеристический многочлен матрицы А. Тогда:
1) диагональными элементами матрицы J служат все корни мно-
многочлена с(х) (с учетом их кратностей), и только они;
2) если а — корень многочлена с(х) кратности k и \г (а) — одна
из клеток Жордана, составляющих матрицу J, то г ^ k;
3) если U (а) — число клеток Jr(a), 1 < г < k, среди составляю-
составляющих матрицу J клеток Жордана, В = А — аЕп, то
1Г (а) = rank Вг+' - 2 rank Br + rank Br~¦ A)
(no определению В° = Еп);
4) если l(a) — общее число всех клеток Jr(a), r— 1, 2, ..., k, то
l(a) = n — rank В. B)
При доказательстве теоремы нам понадобится следующая
Лемма 21.2. Пусть I — матрица Жордана порядка п, составлен-
составленная из клеток Жордана, соответствующих собственному значению
О, / — число составляющих ее клеток, 1Г — число клеток порядка г,
г = 1, 2, ..., п. Тогда:
1) 1 = п — rank/;
2) /r = rank.T+1-2rank.r + rank.r-1.
> Ранг клеточно-диагональной матрицы / равен сумме рангов
составляющих ее клеток Жордана. Ранг каждой из этих клеток на
единицу меньше ее порядка. Поэтому rank J — п — /и, следовательно,
верно утверждение 1.
Теперь вычислим rank .Г. Если
/ = diag [Л 1, Л2, ..., As],
то
Ar% ..., Ars\
6. Зак. 6466 73
поэтому ранг матрицы V равен сумме рангов r-х степеней жордано-
вых клеток, составляющих /. Как показывают непосредственные
вычисления,
О 1 О
О 0 1
о о
о о
О 0 0 ... О 1 О О О О
О О О ... О 0] [О 0 0 0
0 0 10
0 0 0 1
о о
о о
О 1
о о
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
... 0
... 0
... 0
... 0
... 0
... 0
0
0
1
0
0
0
При увеличении показателя степени на единицу полоса 1, ..., 1
становится на единицу короче и перемещается вправо вверх, на
т-ы шаге получается нулевая матрица: /m@)w = О. Теперь очевидно,
что
если О ^ г <С т,
если г^ т.
Следовательно,
rank V = (п - гIп + ... + 2/г + 2 + 1г+и
и поэтому
гапк/г+1 — 2rank/r + rank/' = (п - г -~ \Iп + ... + 2/г+3 + /г+2 -
т. е. верно утверждение 2.^
Перейдем к доказательству теоремы 21.2.
> Поскольку матрицы Ли/ подобны, а характеристические
многочлены подобных матриц равны, то с(х) является характеристи-
характеристическим многочленом матрицы /. Но тогда утверждения 1 и 2 теоремы
очевидны.
Перейдем к доказательству утверждений 3 и 4. Матрицы В и
/ — аЕп = С подобны (почему?), следовательно, подобны матрицы Вг
и Сг (почему?). Ранги подобных матриц равны. Поэтому достаточно
доказать утверждения 3 и 4 для случая, когда Л=/, В = С.
Сравним матрицы J и С. Вторая матрица получается из первой
в результате вычитания числа а из каждого собственного значения,
так что клеткам матрицы / с собственным значением а соответствуют
клетки матрицы С с собственным значением 0. Числа 1(а) и /г(а),
связанные с матрицей /, совпадают с соответствующими числами,
связанными с матрицей С. Итак, нужные нам равенства A) и B)
можно теперь переписать в виде:
/г@) = rank Cr+1 — 2 rank С + rank Cr~\
1@) = n —rank С.
C)
D)
74
Если все собственные значения матрицы С равны 0, то эти равен-
равенства верны согласно лемме 21.2. Пусть среди собственных значений
матрицы С есть ненулевые. Представим С в виде C = diag[Ci, C2],
где С\ — матрица Жордана, составленная из клеток Жордана матри-
матрицы С с нулевым собственным значением; С2 — матрица Жордана,
составленная из всех оставшихся клеток. Матрица Сг не имеет
нулевых собственных значений, поэтому числа /г@) и /@) для матри-
матрицы С совпадают с аналогичными числами для матрицы С\. Но тогда
равенства
/г@) = rank C[+1 — 2 rank C\ + rank C\~' E)
и
/@) = лг — т — rankCi, F)
где т—'порядок матрицы Сг, верны согласно лемме 21.2. Очевидно,
что Сг — невырожденная матрица, и поэтому rank С|= тп при любом
натуральном 5. Далее имеем rank Cs = rank C\ + m, поэтому из
равенств E) и F) следуют соответственно равенства C) и D).^
Для построения жордановой нормальной формы / матрицы А на
основании теоремы 21.2 необходимо выполнить следующие действия.
1. Найти все корни характеристического многочлена с(х) мат-
матрицы А. Если не все они принадлежат основному полю, то жордано-
жордановой нормальной формы матрицы А над этим полем не существует.
2. Пусть все корни многочлена с(х) принадлежат основному
полю и а — один из них. С помощью формул A) и B) найти все
клетки Жордана, соответствующие собственному значению а. Вы-
Выполнить это для всех корней многочлена с(х).
3. Из всех полученных клеток Жордана, расположив их в про-
произвольной последовательности, составить матрицу Жордана /.
Пример 21.2. Найти жорданову нормальную форму матрицы
А =
2 0—1
0 2 1
0 0 2
0
0
0
0
0 0
0 0
0 0
0 0
-1
1
2
1
— 1
0
0
— 1
1
1
2
— 1
0
0
Решение. Запишем характеристическую матрицу:
хЕ-А =
х — 2
0
0
о
о
о
о
о
х — 2
о
о
о
о
о
-1 -1
х — 2 -2
О х— 1
О 1
О О
О О
— 1
— 1
о
2
-2
х+\
0
0
1
— 1
о
— 1
1
х— 1
1
1
-1
о
— 2
1
-2
х+\
Теперь вычислим характеристический многочлен с(х) матрицы А:
с(х) = det {хЕ — А) = (х — 2K (х2 + IJ.
Так как многочлен х2 -f 1 неприводим над R, то над R не существует жордановой
нормальной формы матрицы А.
75
Рассмотрим каноническое разложение многочлена с(х) над полем комплексных
чисел С:
с(х) = (х - 2K (х + О2 {х - О2-
Теперь последовательно определим число клеток Жордана, соответствующих
собственным значениям 2, / и — /.
1. Если собственное значение равно 2, то
, rank B]
По формуле B) определяем общее число /B) клеток Жордана, соответствующих
собственному значению 2:
/B) = 7 — rank ?,=7 — 5 = 2.
Так как кратность корня 2 многочлена с(х) равна трем, то очевидно, что одной
из этих клеток является /iB), другой служит /гB).
2. Если собственное значение равно /, то
В2 = А - 1Е7 =
0
0
0
0
0
0
0
0
0
0
0
0
0
0
— 1
1
0
0
0
0
0
-1
1
2
1
1
0
0
— 1
1
1
2
-3
0
0
— 1
1
0
1
1
J
J
1
-1
0
2
-1
2
-3.
—
/(/) = 7-5
2-i
0
0
0
0
0
0
==2.
0
2-i
0
0
0
0
0
Искомыми являются
3. Если
Итак,
собственное
diag
f[2, /2B
\
1
2-i
0
0
0
0
-1
1
2
1—/
1
0
0
две клетки Jx(i).
значение равно
), /, /,
—/, —1] =
2
1—1
0
0
— /,
2
0
0
0
0
0
0
1
то
0
2
0
0
0
0
0
-1
1
0
1
-1
—/
— 1
имеем
0
1
2
0
0
0
0
0
0
0
/
0
0
0
— 1
— 1
0
2
-I
2
-1-4
, rank
две клетки
0
0
0
0
?
0 -
0
0
0
0
0
0
— i
0
/
i(-0
о"
0
0
0
0
0
/ i
является жордановой нормальной формой матрицы А.
21.3. Минимальный многочлен
Определение 21.3. Пусть А — квадратная матрица над по-
полем Ру }(х) 6 Р[х\. Если f(A) = 0 — нулевая матрица, то f(x) называет-
называется аннулирующим матрицу А многочленом.
Предложение 21.1. Для любой квадратной матрицы существует
аннулирующий ее ненулевой многочлен.
> Пусть А — матрица порядка п над полем Р. Множество Рп>п
всех матриц порядка п над полем Р является я2-мерным линейным
пространством. Следовательно, п2-\- 1 степеней матрицы А
° = ЕУ Л, А\
А
76
составляют линейно зависимую систему. Поэтому в поле Р есть
такие числа сс0, alf a2, ..., ап2уие все равные нулю, что
а0Е + ахА + а2А2 +... + ая^4п'= О.
Положим
f(x) = а0 + с^х + а2*2 + ••• + <V*.
Итак, f(x) — аннулирующий матрицу А ненулевой многочлен. 4
Определение 21.4. Пусть А — квадратная матрица над по-
полем Р. Ненулевой многочлен пг(х), аннулирующий матрицу А, на-
называется минимальным многочленом этой матрицы, если он удов-
удовлетворяет следующим двум условиям:
1) степень многочлена пг(х) минимальна среди степеней всех
аннулирующих матрицу А ненулевых многочленов;
2) старший коэффициент многочлена пг(х) равен 1.
Отметим простейшие свойства минимального многочлена.
1. Минимальный многочлен матрицы определен однозначно.
> Пусть пг(х) и 1{х)— минимальные многочлены матрицы Л,
k(x) = m(x) - t(x). Так как k(A) = m(A) - I (A) = О - 0 = 0, то k(x) —
аннулирующий матрицу А многочлен. Если многочлен k(x) — не-
ненулевой, то его степень ниже степени пг(х)у поскольку старшие
члены многочленов пг(х) и 1(х) равны. Но это противоречит опреде-
определению минимального многочлена, следовательно, k(x) = 0, m(x) =
= l(x).<
2. Если матрицы А и В подобны, то множество многочленов,
аннулирующих матрицу А, совпадает с множеством многочленов,
аннулирующих матрицу В. В частности, минимальные многочлены
подобных матриц равны.
> Пусть
B = C~lACy f(x) = ao + alx + a2x2 + ... + amxrn, f(A) = O.
Тогда
f(B) = а0Е + ахВ + а2В2 + ... + amBm =
0 l 2
= С~{а0ЕС + С-{ахАС + C~la2A2C +... + C-lamAmC =
= С~1(а0Е + ахА + а2А2 + ... + атАт)С = С~1!(А)С = С~1ОС = О А
3. Произвольный многочлен является аннулирующим для неко-
некоторой матрицы, если и только если он делится на минимальный
многочлен этой матрицы.
> Пусть А — квадратная матрица над полем Р, пг(х) — ее мини-
минимальный многочлен, f(x)?P[x]. Представив f(x) в виде /(*) =
= m(x)q(x)-\- г(х), где г(х) — остаток от деления на пг(х\ получим
f(A) = m(A)q(A) + г (А) = Oq{A) + г (А) - г (А).
77
Итак, равенства f(A)=O и г(А) = О равносильны. Поэтому
Дх) = 0, если и только если г(х) = 0, т. е. f(x) делится на т(х).
4. Минимальный многочлен клеточно-диагональной матрицы ра-
равен наименьшему общему кратному* минимальных многочленов ее
диагональных клеток.
> Если
A = diag[y4lf A2, ..., Ak\
a f(x) — многочлен, то
f(A) = diag\f{Al), f(A2), ..., f(Ak)}.
Следовательно, f(x) — аннулирующий матрицу А многочлен, если
и только если он является аннулирующим для каждой из клеток Д,
т. е. делится на ее минимальный многочлен. -4
Теорема 21.3. Минимальный многочлен матрицы равен послед-
последнему инвариантному множителю ее характеристической матрицы.
Докажем вначале следующую лемму.
Лемма 21.3. Минимальный многочлен клетки Жордана Jп(а)
равен (х — а)п.
> Если J = Jn(a) — ?"„, то / = /rt@) и, как показано в §21.1,
Jn = O. Следовательно, (х — а)п—аннулирующий матрицу Jn(o)
многочлен. Минимальный многочлен пг(х) матрицы 1п{р) делит
(х — а)п и поэтому имеет вид (х — a)k, k^.n. Но ]кф0 при k<Cn
(см. доказательство теоремы 21.2), т. е. (х — df не является анну-
аннулирующим клетку Jn(a) многочленом при k<Cn. Итак, пг(х) =
= {х-а)п.<
Перейдем к доказательству теоремы 21.3.
> Пусть А — квадратная матрица над полем Р. Вначале пред-
предположим, что ее характеристический многочлен с(х) имеет в Р
столько корней, какова его степень. Как известно, над этим полем
существует жорданова матрица /, подобная матрице А. Мини-
Минимальные многочлены подобных матриц равны. Остается найти ми-
минимальный многочлен матрицы /.
Если
/ = diag[/lti(aI)f /Й2(а2), ..., JПк{ак)\
то ее минимальный многочлен пг(х) равен наименьшему общему
кратному минимальных многочленов клеток, т. е. многочленов
(х-а,)"', (х-а2)\ ..., (x-aky. A)
Согласно лемме 21.1, многочлены A), и только они, являются
элементарными делителями характеристической матрицы хЕ — /.
* Наименьшим общим кратным системы ненулевых многочленов называется
многочлен минимальной степени со старшим коэффициентом 1, делящийся на
каждый из данных многочленов.
78
Но тогда их наименьшее общее кратное — последний инвариант-
инвариантный множитель матрицы хЕ— /. Он также является последним
инвариантным множителем матрицы хЕ— Л, поскольку эти две
матрицы эквивалентны.
Теперь перейдем к общему случаю. Пусть А — квадратная мат-
матрица над произвольным полем Р, Р' — расширение поля Р, содер-
содержащее все корни характеристического многочлена матрицы А. Мат-
Матрица А является матрицей над полем Р'. Как уже доказано, ее
минимальный многочлен над Р' равен последнему инвариантному
множителю характеристической матрицы хЕ — А. Следовательно,
все его коэффициенты принадлежат полю Р. С другой стороны,
всякий многочлен над Р является и многочленом над Р'. Поэтому
минимальный многочлен матрицы А не зависит от того, рассмат-
рассматривается ли она над полем Р или над полем Р'. <4
Следствие 21.2 (теорема Гамильтона — Кэли). Характеристи-
Характеристический многочлен матрицы является аннулирующим эту матрицу
многочленом.
> Характеристический многочлен матрицы А равен произведению
всех инвариантных множителей характеристической матрицы хЕ — А
и поэтому делится на минимальный многочлен матрицы А.Л
Очевидно
Следствие 21.3. Всякий корень характеристического много-
многочлена матрицы является корнем ее минимального многочлена (воз-
(возможно, другой кратности).
Упражнения
1. Пусть характеристические многочлены матриц А и В равны и минимальные
многочлены этих матриц равны. Могут ли матрицы А и В не быть подобными?
2. Пусть А — квадратная матрица над полем Р, f(x), g(x) ? Р\х\. Докажите,
что f(A) — g(A), если и только если разность f(x) — g(x) делится на минимальный
многочлен матрицы А.
3. Пусть А — квадратная матрица порядка п над полем Р. Докажите, что мно-
множество Р[А\ всех многочленов от А является подпространством пространства Рпп
всех матриц и размерность подпространства Р[А\ равна степени минимального
многочлена матрицы А.
4. Докажите, что множество Р[А\ относительно сложения и умножения матриц
является полем, если и только если минимальный многочлен матрицы А непри-
неприводим над полем Р.
21.4. Критерий диагонализируемости матрицы над полем
Квадратная матрица А называется диагонализируемой над по-
полем Р, если над этим полем существует диагональная матрица,
подобная А. Отметим, что диагонализируемость матрицы А над по-
полем Р означает, что в линейном пространстве соответствующей
размерности над этим полем существует базис, составленный из
собственных векторов линейного оператора с матрицей А.
Теорема 21.4. Для диагонализируемости квадратной матрицы
над полем Р необходимо и достаточно, чтобы минимальный много-
многочлен этой матрицы имел в поле Р столько корней, какова его сте-
степень, и среди них не было кратных.
79
> Пусть матрица А подобна над полем Р диагональной мат-
матрице
D = diag[dlf d2> ..., dn\
Минимальный многочлен клетки dt совпадает с многочленом
x — d[. Минимальный многочлен матрицы D равен наименьшему
общему кратному многочленов
х — di, /= 1, 2, ..., /г,
A)
т. е. произведению всех попарно различных многочленов A). Сле-
Следовательно, он имеет в поле Р столько корней, какова его степень,
и среди них нет кратных. Поскольку матрицы А и D подобны, ми-
минимальный многочлен матрицы А совпадает с минимальным много-
многочленом матрицы D.
Пусть, обратно, минимальный многочлен т(х) матрицы А удов-
удовлетворяет условию теоремы. Тогда все его элементарные делители
имеют первую степень. Но т(х) совпадает с последним инвари-
инвариантным множителем fn(x) характеристической матрицы хЕ — Л,
а любой другой ее инвариантный множитель делит т(х). Следова-
Следовательно, все элементарные делители матрицы хЕ — А имеют первую
степень, все клетки Жордана матрицы А первого порядка, жорда-
нова нормальная форма матрицы А диагональная
21.5. Фробениусова нормальная форма
Жордановой нормальной формой очень удобно пользоваться,
однако она не всегда существует. Здесь мы определим еще одну
нормальную форму матрицы, существующую при любом основном
поле.
Определение 21.5. Пусть Р — произвольное поле, a g(x) —
= а0 + о>\х + ••• + ап-\хп~х + хп — многочлен ненулевой степени
п над полем Р, старший коэффициент которого равен 1. Мат-
Матрица
F =
называется клеткой Фробениуса, сопровождающей многочлен g(x).
В последнем столбце клетки Фробениуса расположены коэффи-
коэффициенты многочлена g(x\ взятые с противоположным знаком. Ниже
80
0
1
0
0
0
0
0
1
0
0
... 0
... 0
... 0
... 0
... 1
— а0
— а,
-а2
— ап
— ап
-2
— 1
главной диагонали параллельно ей идет полоса 1, ..., 1. Все осталь-
остальные элементы равны 0. Например, матрицы
0 0"
1 0 0
-0 1 0-
являются клетками Фробениуса, сопровождающими соответственно
многочлены х— 1, х2— 1, х3.
Определение 21.6. Пусть
ё\(Х)> ё2{Х\ "•> 8т(х) A)
есть система многочленов ненулевых степеней над полем Р, такая,
что для 1= 1, 2, ..., m — 1 многочлен gi{x) является делителем сле-
следующего многочлена gi+l(x) и старший коэффициент каждого из
них равен 1. Пусть, далее, для k=\y 2, ..., m Fk—клетка Фро-
Фробениуса, сопровождающая многочлен gk(x). Клеточно-диагональная
матрица
= diag[flf F,
2>
B)
называется матрицей Фробениуса, сопровождающей систему мно-
многочленов A). Если А — произвольная матрица, F — подобная ей
матрица Фробениуса, то F называется фробениусовой нормальной
формой матрицы А.
Теорема 21.5. Для любой квадратной матрицы над произволь-
произвольным полем существует единственная фробениусова нормальная
форма.
Доказательство теоремы опирается на следующую лемму.
Лемма 21.4. Если B) —матрица Фробениуса порядка п, сопро-
сопровождающая систему многочленов A), то
\ ..., gm(x),
C)
где число единиц равно п — пг,— система инвариантных множи-
множителей характеристической матрицы хЕ — F.
> Пусть пг=\. Рассмотрим систему
d{(x\ d2(x), .... dn(x)
наибольших общих делителей миноров характеристической матрицы
где
X
— 1
0
0
0
+ а
0 ...
х ...
-1 ...
0 ...
0 ...
0
0
0
X
— 1
ап-^
а0
а{
а2
ап-2
х + ап-\
g\(x); dn(x) =
81
= \хЕ—F\. Разложив этот определитель по элементам последнего
столбца, получим
f() + ( + )
... + an-2xn 2 + ап.-1хп l + хп = g\(x).
Минор порядка п—1, остающийся после вычеркивания первой
строки и последнего столбца матрицы хЕ — F, равен (—1)п~\ по-
поэтому dn-\(x)= I. Следовательно, di(x)=l, /=1, ..., п—1. Те-
Теперь по формулам
получаем инвариантные множители матрицы хЕ — F:
Итак, для случая т= 1 лемма доказана.
Пусть теперь т>\. Рассмотрим характеристическую матрицу
хЕ — F = d\ag[xEn/— Fu xEn2 — F2, ..., хЕПт —Fm\
где П[ — степень многочлена gi(x). С помощью элементарных преобра-
преобразований строк и столбцов приведем каждую из клеток хЕП1 — Ft
к канонической форме /С/. Из доказанного выше следует, что /0 =
= diag[l, ..., 1, gi(x)]. Но элементарные преобразования каждой
клетки xErh — Ft можно рассматривать как элементарные преобразо-
преобразования матрицы хЕ — F, которые не затрагивают строк и столбцов,
не проходящих через эту клетку. Поэтому матрица хЕ — F эквива-
эквивалентна матрице
diag[/Ci, /C2, .... Кт\ =
= diag[l, ..., 1, ?,(*), 1, ..., 1, g2(x), ..., 1, ..., 1, gm(x)\ = L.
Изменив порядок строк и столбцов матрицы L, приведем ее к виду
/C = diag[l, ..., 1, g{(x), g2{x\ ..., gm{x)\
Итак, К — каноническая форма матрицы хЕ — F с многочленами
C) на диагонали.<4
Перейдем непосредственно к доказательству теоремы 21.5.
> Докажем сначала существование фробениусовой нормальной
формы. Пусть А — квадратная матрица порядка п над полем Р,
система инвариантных множителей ее характеристической матрицы
1, ..., 1, ft(x), ..., fn(x), D)
где ft(x)=^l. Так как определитель характеристической матрицы
отличен от нуля, то [п(х)Ф0, Д(х) — делитель многочлена fi+\(x).
Следовательно, существует матрица Фробениуса F, сопровож-
сопровождающая систему многочленов
№, .... и*)- E)
82
Порядок матрицы F равен сумме степеней многочленов E), т. е.
степени их произведения, которое, в свою очередь, равно произведе-
произведению всех многочленов D). Последнее представляет собой \хЕ — А\,
т. е. характеристический многочлен матрицы Л, и имеет степень п.
Следовательно, F—матрица порядка п. Согласно предыдущей лем-
лемме, D) — система инвариантных множителей матрицы хЕ — F. Таким
образом, хЕ — А ~ хЕ — F, матрицы А и F подобны, F — фробе-
ниусова нормальная форма матрицы А.
Теперь докажем единственность фробениусовой нормальной фор-
формы. Пусть F\ и F2— подобные матрицы Фробениуса. Тогда харак-
характеристические матрицы хЕ — F\ и хЕ — F2 эквивалентны и, следова-
следовательно, имеют совпадающие системы инвариантных множителей.
Но тогда F] и F2 сопровождают одну и ту же систему многочленов
и поэтому совпадают. ^
Пример 21.3. Найти фробениусову нормальную форму матрицы
ГЗ -1 О
Л=6 -3 2
|_8 -6 5
Решение. В § 21.1 вычислены инвариантные множители матрицы хЕ — А:
fl(x) = f2(x)=i, /зМ = — 5 + 9jc — Ъх2 -{-х3. Клетка Фробениуса, сопровождающая
многочлен — 5 + 9* — Бх2 -{- х3, т. е. матрица
0 0 5
1 0 —9
0 1 5
является фробениусовой нормальной формой матрицы А.
22. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ
В этой главе вводятся фундаментальные понятия квадратичной
и билинейной форм, которые понадобятся нам в дальнейшем.
22.1. Линейные преобразования переменных
Определение 22.1. Пусть даны произвольное поле Р и пере-
переменные
Переход от переменных A) к переменным
У\, #2> •••> Уп B)
с помощью формул
х\ =а\\У\ + ^12^2+ ••• +а\пУп, Л
Х2 = а2\У\ + а22У2 + ••• + 0<2пУпу I /3)
Хп = пп\У\ + пп2У2 + ••• + пппУп, )
83
где ац — произвольные элементы поля Р, называется линейным
преобразованием переменных над полем Р. Матрица
А =
Х2 ... а\п
ап\ аП2 • •• апп
называется матрицей преобразования C).
Очевидно, что если
Х = [х\ х2 ... хп]т, Y = [yi y2 ... уп]т,
то система равенств C) равносильна матричному равенству
X = AY. D)
Рассмотрим последовательное применение двух линейных преоб-
преобразований переменных. Преобразуем переменные A) в переменные
B) по формуле D), а переменные B) в переменные
Z,, 22, ..., Zn E)
по формуле
K = BZ, F)
где В — квадратная матрица порядка п\
Z=[Z\ Z2 ... Zn]T.
Из формул D) и F) получим
X = A{BZ) = {AB)Z. G)
Итак, если переменные A) линейно выражаются через пере-
переменные B), а последние линейно выражаются через переменные
E), то существует линейное преобразование, выражающее пере-
переменные A) через E). Это преобразование задается формулой G)
и называется произведением преобразований D) и F).
Очевидно, что матрица произведения линейных преобразований
переменных есть произведение матриц сомножителей.
Так как линейное преобразование переменных определяется
своей матрицей, то из ассоциативности умножения матриц следует
ассоциативность умножения линейных преобразований переменных.
Линейное преобразование переменных с невырожденной матри-
матрицей называется невырожденным.
Если D) — невырожденное преобразование, то можно выразить
переменные B) через переменные A). В самом деле, умножая
слева обе части равенства D) на матрицу А~[, получаем
Y = A~lX. (8)
Преобразование (8) называется обратным преобразованию D).
Так как определитель произведения квадратных матриц равен
произведению их определителей, а матрица произведения линейных
84
преобразований переменных есть произведение матриц сомножи-
сомножителей, то произведение невырожденных линейных преобразований
переменных также является невырожденным.
С учетом связи, существующей между координатами одного
и того же вектора в разных базисах (см. § 17.8, формула C)), ста-
становится очевидным следующее. При переходе к новому базису с мат-
матрицей перехода А координаты всех векторов пространства подвер-
подвергаются невырожденному линейному преобразованию переменных
с той же матрицей Л, т. е. изменяются по формуле C) (или D)).
Здесь X и Y — координатные столбцы произвольного вектора х в
старом и новом базисах соответственно.
22.2. Квадратичные формы
Здесь и далее мы будем полагать, что характеристика поля Р
отлична от 2. Читатель, не знакомый с понятием характеристики
поля, может считать, что основное поле является числовым, т. е.
подполем поля комплексных чисел.
Определение 22.2. Квадратичной формой от п переменных
Х\у Х2У ..., Хп A)
над полем Р называется многочлен от этих переменных с коэффи-
коэффициентами из поля Р, каждое слагаемое которого второй степени.
Каждая квадратичная форма от переменных A) может быть
записана в следующем симметричном виде:
ап\ХпХ\ + аП2ХпХ2 + ... + аппх1,
= F(x\, X2, ..., хп)= 2 aijXiXj =
х\Хп +
+ ...+ B)
где все коэффициенты удовлетворяют условию
ац = ап. C)
Если в первоначальной записи квадратичной формы коэффициенты
при xiXj и XjXi различны, то можно сложить их и, разделив сумму
на 2, получить равные.
Пример 22.1. Квадратичная форма
F(xlt х2) = х\ + Ьххх2 — Зх2х{
записывается в симметричном виде так:
Х\ Т Х\Х2 -г Х2Х\-
Определение 22.3. Матрица А = [#//], /, / = 1, 2, ..., я, назы-
называется матрицей квадратичной формы B), а ранг матрицы А —
рангом формы B).
В силу равенства C) матрица квадратичной формы всегда сим-
симметрическая.
85
Если X1 =[х\ х<2 ... хп\ — строка переменных, то
XTAX = F(x\ D)
в чем просто убедиться, перемножив соответствующие матрицы.
Применим к переменным A), входящим в квадратичную форму
D), невырожденное линейное преобразование
X = CY, E)
где С—квадратная матрица с ненулевым определителем; YT =
= \у\ \j2 ... уп]т — строка новых переменных
У\, #2> '•- Уп, F)
т. е. подставим в формулу D) вместо столбца X выражение E):
F(x) = ХТАХ = (CY)TA(CY) = YT{CTAC)Y= G{y).
Мы получили новую квадратичную форму G(y). Это приводит
к следующему определению.
Определение 22.4. Две квадратичные формы от одного и
того же числа переменных называются эквивалентными, если одна
из них превращается в другую в результате применения к входя-
входящим в нее переменным невырожденного линейного преобразования
над основным полем.
Очевидно, что две квадратичные формы, эквивалентные третьей,
эквивалентны друг другу.
Для установления связи между матрицами эквивалентных квад-
квадратичных форм нам потребуются следующие две леммы.
Лемма 22.1. Пусть даны квадратные матрицы
А = [ач1 В = [Ьц] G)
порядка п над полем Р. Если для любых п-членных столбцов X и
Y над Р
XTBY, (8)
то А = В.
> В качестве X возьмем столбец, k-й элемент которого равен
единице, а остальные — нулю, в качестве Y — столбец, 1-й элемент
которого равен единице, остальные — нулю. Тогда ХМ У = а*/,
XTBY—bki. Следовательно, аы = Ьы, k, 1= 1, 2, ..., /г, А = В.Ч
Лемма 22.2. Пусть G) — симметрические квадратные матрицы
порядка п над полем Р. Если для любого п-членного столбца X над Р
ХТАХ = ХТВХ, (9)
то А = В.
> Пусть X и Y — произвольные n-членные столбцы над Р. Тогда
(X + Y)TA (X+Y) = ХТАХ + ХТА Y + YTAX + YTA Y.
Но А — симметрическая матрица, и поэтому
86
= {YTAX)T = XTAY.
Следовательно,
(X + YfA (X+Y) = XTAX +YTAY + 2XTA Y.
С учетом равенства (9) теперь имеем равенство (8). Согласно
предыдущей лемме, А=В.М
Пусть теперь квадратичная форма G(y)=YTBY с матрицей В
эквивалентна квадратичной форме D), т. е. получается из нее в
результате применения невырожденного линейного преобразования
E) с матрицей С. Мы видели, что
F(x) = XTAX = YT(CTAC)Y.
Так как преобразование E) переводит форму F(x) в форму
G(x), то
YT(CTAC)Y=YTBY,
и, согласно предыдущей лемме, СТАС = В.
Итак, если переменные A) квадратичной формы с матрицей А
подвергнуть невырожденному линейному преобразованию E), то
эта форма превратится в квадратичную форму от переменных F)
с матрицей СТАС.
Обратно, пусть
F(x) = XTAX, G(y)=YTBY
суть квадратичные формы от переменных A) и F) соответственно.
Пусть, далее,
В = СТАС, A0)
где С — невырожденная матрица порядка п над основным полем.
Тогда квадратичные формы F(x) и G(y) эквивалентны.
Действительно, применив к переменным A) невырожденное ли-
линейное преобразование E), переведем первую из рассматриваемых
квадратичных форм во вторую.
Итак, доказана
Теорема 22.1. Квадратичные формы F(x), G(y) эквивалентны
тогда и лишь тогда, когда их матрицы А и В связаны соотноше-
соотношением вида A0), где С — невырожденная матрица над основным
полем.
Так как ранг матрицы не меняется от умножения ее на невы-
невырожденную матрицу, то верно
Следствие 22.1. Ранги эквивалентных квадратичных форм
равны.
22.3. Приведение квадратичной формы к каноническому виду
Определение 22.5. Квадратичная форма называется канони-
канонической, если ее матрица диагональна. Каноническим видом квадра-
квадратичной формы называется любая эквивалентная ей каноническая
форма.
87
Теорема 22.2. Всякая квадратичная форма эквивалентна над
основным полем некоторой канонической квадратичной форме.
Иными словами, всякую квадратичную форму можно с помощью
невырожденного линейного преобразования переменных над основ-
основным полем привести к каноническому виду.
> Пусть
п
F(x)= 2 atjXiXj, ац = аПу A)
есть квадратичная форма над полем Р. Если /2=1, то форма A)
является канонической.
Пусть п>\. Будем считать утверждение теоремы верным для
квадратичных форм от меньшего, чем /2, количества переменных.
Рассмотрим три случая:
1) все коэффициенты формы A) равны нулю;
2) среди коэффициентов ац есть отличный от нуля;
3) среди коэффициентов формы есть отличный от нуля, но все
аи = 0.
В первом случае форма A) —нулевая, значит, она является
канонической.
Рассмотрим второй случай. Пусть, например, аиф0. Тогда
п
а\\ [а,\ \Х\ -f- а\2х2 -\-... -{- а\пхп) = а\\Х\ -\- z 2j a\iX\Xi -\- /i, \l)
1 = 2
где буквой А обозначается сумма слагаемых, не зависящих от хх.
Сравнивая равенства A) и B), получаем
F(x) = a^x(anxx + а12х2-\- ... + а\пхпJ + G(x2y ..., хп),
где G(x2f •-., хп) — квадратичная форма от п — 1 переменных
*2, •., хп. По индуктивному предположению существует линейное
невырожденное преобразование переменных
yi = bi2x2 + ... + binXn, i = 2, ..., /2,
приводящее форму G(jc2, ..., хп) к каноническому виду. Преобразо-
Преобразование
у\ = а\ \х\ + аХ2х2 + ... + а1пхп,
У1 = bi2X2 + ... + binXn, i = 2, ... , /2,
также является невырожденным, ибо определитель его матрицы
а 11 <212 ... ain
0 &22 ... Ь2п
0 Ьп2 ... Ьп
Применив это преобразование к переменным формы F(x), получим
ее канонический вид: a^]y2{ + с2у\-\- ••• + спу2п. Для второго случая
теорема доказана.
88
Рассмотрим третий случай. Пусть, например, а12:
линейное преобразование переменных
*-1=У\+У2> )
>2 = У\—У21 \
1 = уц / = 3, ..-, п. )
¦ 0. Возьмем
C)
Определитель матрицы преобразования C):
1 1 0 ... О
1 -1 0 ... О
О 0 1 ... 0 =
О 0 0
1
1
— 1
Применяя это преобразование к переменным формы F(x), получаем
F(x) = 2аХ2у\ + ... D)
Правая часть равенства D) — квадратичная форма, рассмотрен-
рассмотренная во втором случае. С помощью некоторого невырожденного
линейного преобразования переменных эта форма приводится к ка-
каноническому виду. Так как произведение невырожденных линейных
преобразований переменных есть невырожденное линейное преоб-
преобразование переменных, то аналогичное утверждение верно для
формы A).^
Описанный в доказательстве теоремы алгоритм приведения квад-
квадратичной формы к каноническому виду носит название алгоритма
Лагранжа.
Пример 22.2. Найти канонический вид над полем действительных чисел квад-
квадратичной формы F(x) = ххх2 + х2хъ + хъхх.
Решение. Положим
Тогда
где
*i =У\ +У2А
*2 = 01 — У2> >
h = Уъ- )
F(x) = у\-
2у1Уз -
у3J -у\-у\ =
¦-У\ + Уъ = у х\ + у
+ хз>
%ъ — Уъ ~ хъ-
Итак, z\ — z\ — z\ — канонический вид формы F(x).
22.4. Нормальный вид квадратичной формы над полями
действительных и комплексных чисел
Очевидно, что канонический вид квадратичной формы не опре-
определен однозначно, т. е. различные канонические квадратичные
формы могут оказаться эквивалентными. Например, квадратичные
формы х\-\-х\ и у\
у\
эквивалентны над полем комплексных
89
чисел, поскольку невырожденное линейное преобразование пере-
переменных
переводит первую из этих форм во вторую. Иногда удается среди
канонических видов квадратичной формы выбрать наиболее простой.
В частности, это всегда возможно, если основным полем является
поле комплексных или действительных чисел. Квадратичную форму
над полем комплексных чисел называют также комплексной квад-
квадратичной формой, а над полем действительных — действительной.
Пусть F(x) — квадратичная форма над полем С, ее канони-
канонический вид
а\У2\ + а2У% +•••- + а>пУ2п- A)
Рассмотрим линейное преобразование переменных:
lyakyk, если акф0\
k у yk, если ak = 0.
Очевидно, что оно невырождено. Применив его к форме A), по-
получим гхг\ -f- г2г\ -+-•••+ enzin где е^ = 1 или Вк = 0.
Определение 22.6. Канонический вид комплексной квадра-
квадратичной формы называется нормальным, если все его ненулевые
коэффициенты равны 1.
Итак, нами доказано
Предложение 22.1. Всякая комплексная квадратичная форма
эквивалентна некоторой нормальной квадратичной форме. При этом
число единиц среди коэффициентов соответствующей нормальной
формы равно рангу исходной формы, так что нормальный вид комп-
комплексной квадратичной формы определен однозначно с точностью
до наименования переменных.
Из следствия 22.1 и предложения 22.1 вытекает
Следствие 22.2 (критерий эквивалентности комплексных
квадратичных форм). Комплексные квадратичные формы эквива-
эквивалентны тогда и лишь тогда, когда равны их ранги.
> Необходимость этого условия доказана в § 22.2 (см. следствие
22.1), достаточность следует из того, что в данном случае обе формы
приводятся к одному и тому же нормальному виду.^
Перейдем к квадратичным формам над полем действительных
чисел. Пусть F(x) — действительная квадратичная форма, ее кано-
канонический вид
а{у2-\- а2у\ -{- ... -f- anyl. B)
Применив к форме B) действительное невырожденное линейное
преобразование переменных
если ak ф 0;
если ak = 0,
приведем ее к виду e,z? + г2г\ -f ... -f гпг19 где ek = 0; 1; —1.
90
Определение 22.7. Канонический вид действительной квадра-
квадратичной формы, каждый ненулевой коэффициент которого равен
1 или —1, называется нормальным.
Итак, нами доказано
Предложение 22.2. Всякая действительная квадратичная форма
с помощью невырожденного линейного преобразования перемен-
переменных над полем действительных чисел может быть приведена к
нормальному виду.
Число ненулевых коэффициентов в нормальном виде действи-
действительной квадратичной формы не зависит от выбора невырожден-
невырожденного линейного преобразования переменных, приводящего ее к нор-
нормальному виду; оно равно рангу этой формы. Оказывается, что
число положительных и число отрицательных коэффициентов в
нормальном виде действительной квадратичной формы также явля-
являются инвариантами формы, т. е. ее нормальный вид определен
однозначно с точностью до наименования переменных.
Теорема 22.3 (закон инерции действительных квадратичных
форм). Число положительных и число отрицательных коэффициентов
в нормальном виде действительной квадратичной формы не зави-
зависит от выбора невырожденного линейного преобразования пере-
переменных, приводящего эту форму к нормальному виду.
>Пусть невырожденное линейное преобразование переменных
приводит квадратичную форму F(x) к нормальному виду
2 | | 2 2 2 / о \
yi + ... + ys — yi+1 — ... — у;, C)
а невырожденное линейное преобразование переменных
Zi = Di\X\ -f- Di2X2 -f- ... ~|- 0{пХп, 1=1, Z, •••, П, y^t)
приводит ее к виду
2 I i_ 2 2 2 /r\
Нужно доказать равенство s = tf и тем самым теорема будет
доказана. Предположим, что 5 <С /, и рассмотрим систему линейных
уравнений
ЯцХ1 +
F)
bt+\ \X\-\-bt-\-\ 2х2-\- ...
Ьп\Х\-\- Ьп2х2 -\- ...-f- bnnxn =0. j
Это однородная система п — t -\- s <п линейных уравнений с п
неизвестными, поэтому она имеет ненулевые решения. Пусть одно
из них
91
Вычислим F(cx, c2i ..., cn). Из нормального вида E) с учетом того,
что G) —решение системы F), получим
п
Z}(CX, С2, ..., Сп)= 2 bjid = O, j = t+l, •••, /2,
« = 1
откуда
F(cx, с2у ..., ся)= (Я Ьис<У+...+( % bud)*. (8)
В правой части равенства (8) каждое слагаемое неотрица-
неотрицательно, поэтому
F(cl9 с2, ..., ся)>0. (9)
Аналогично из нормального вида C), учитывая, что
п
yi(cu с2, ..., Сп)= 2а/7с/ = 0, /=1, 2, ..., s,
f= i
получаем
F(c,, c2,... , Сп)<0. (Ю)
Сопоставляя неравенства (9) и A0), имеем
Теперь из равенства (8) следует, что каждая, отдельно взятая
сумма равна нулю. Итак,
bixcx + bi2c2 + ...+blncn = 0, /=l, 2, ..., t. A1)
Для / = /+1» **•> Л равенство A1) также верно, ибо G) —
решение системы F). Итак, G) —ненулевое решение системы
уравнений:
biXxx + bi2x2+ ... + binXn = 0, /=l, 2, ..., п.
Матрицей этой системы является невырожденная матрица линейного
преобразования D), так что система не имеет ненулевых ре-
решений. Полученное противоречие доказывает, что неравенство s <C /
не выполняется. По аналогичным причинам невозможно и нера-
неравенство t<Cs. Следовательно, равенство s = t верно. <4
Определение 22.8. Число положительных коэффициентов в
нормальном виде действительной квадратичной формы называется
положительным индексом инерции этой формы, а число отрица-
отрицательных коэффициентов — ее отрицательным индексом инерции.
Если заданы ранг и положительный индекс инерции квадратич-
квадратичной формы, можно найти ее отрицательный индекс. Поэтому из
закона инерции вытекает
Следствие 22.3 (критерий эквивалентности действительных
квадратичных форм). Совпадение рангов и равенство положитель-
92
ных индексов инерции является необходимым и достаточным усло-
условием эквивалентности действительных квадратичных форм.
Доказательство мы оставляем читателю.
Упражнения
1. Докажите, что множество классов эквивалентных квадратичных форм (от
п переменных) над С и R конечно, а над Q — бесконечно.
2. Найдите число классов эквивалентных квадратичных форм (от п перемен-
переменных) над R, имеющих заданную разность между положительным и отрицательным
индексами инерции.
3. Найдите необходимое и достаточное условие для того, чтобы действительные
квадратичные формы F(x) и —F(x) были эквивалентными.
22.5. Знакоопределенные действительные квадратичные формы
Пусть задана действительная квадратичная форма
F(xx, х2у ..., хп) A)
и переменные
х1у х2у ...ухп B)
принимают лишь действительные значения. Тогда при любом наборе
значений переменных B) значение формы A) —действительное
число.
Определение 22.9. Квадратичную форму A) называют по-
положительно-определенной, если для любых .значений
Ьи Ъ2у ...УЬП C)
входящих в нее переменных B), среди которых хотя бы одно от-
отлично от нуля,
F{bly Ь2У ..., Ья)>0,
отрицательно-определенной, если для любых значений C) входя-
входящих в нее переменных, среди которых хотя бы одно отлично от нуля,
F{bx, b2, ..., Ьп)<0.
Пример 22.3. Очевидно, что квадратичная форма F(xlt x2) — x\-\-x\ является
положительно-определенной. Квадратичные формы G(xu х2) = х\ — х\ и #(*,, х2) —
— х] не являются положительно-определенными, так как G@,l)=— 1, Я@,1) = 0.
Предложение 22.3. Если квадратичная форма является поло-
положительно-определенной, то и любая эквивалентная ей квадратичная
форма также положительно-определенная.
^ Пусть A) и
b y2, ..., уп) D)
есть эквивалентные квадратичные формы. Это значит, что
F(xx, x2y ..., xn)=G(yx, у2У ..., уп\ E)
где yi = Ci\Xi+Ci2X2 + ...+CinXn9 /=1, 2, ..., пу det[c/i]=^O.
93
Если форма D) не является положительно-определенной, то
существует такой набор C) действительных чисел, что хотя бы
одно из них не равно нулю и G(bu 62, ..., 6п)^0. Система урав-
уравнений
Ci\X\-\-Ci2X2+...+cinxn = bi, /=1, 2, ..., /г,
имеет ненулевое решение 8j, б2, ..., 8П. Согласно равенству E),
X, б2, ..., 6n)=G(bx, Ь2, ..., М<0,
т. е. форма A) не является положительно-определенной. 4
Найдем нормальный вид знакоопределенных квадратичных форм.
Если квадратичная форма A) имеет нормальный вид
у! + у1+...+у1 F)
то она является положительно-определенной, так как F) — поло-
положительно-определенная квадратичная форма. Если же нормальный
вид
•-• + ?пУ2п G)
квадратичной формы A) отличен от нормального вида F), то она
не является положительно-определенной, так как в этом случае
форма G) не является положительно-определенной. Действительно,
пусть, для определенности, г{ф1 (т. е. 8!=—1 или в! = 0). По-
Положим Ь\ = 1, &2 = ... = Ьп = 0. Тогда G(b\y b-2, ..., bn)^0. Итак,
доказана
Теорема 22.4. Квадратичная форма является положительно-опре-
положительно-определенной, если и только если ее нормальный вид имеет единичную
матрицу.
Опишем теперь эффективный способ распознавания положитель-
положительной определенности квадратичной формы, не требующий приведе-
приведения ее к каноническому виду.
Лемма 22.3. Знак определителя матрицы действительной квадра-
квадратичной формы не меняется при применении к этой форме невы-
невырожденного действительного линейного преобразования переменных.
> Если А и В — матрицы эквивалентных квадратичных форм, то
В = СТАС, det С Ф 0. Далее,
det В = (det С7) (det A) (det С) =
= (det Су (det A), (det СJ > 0. <
Следствие 22.4. Определитель матрицы положительно-опре-
положительно-определенной квадратичной формы — положительное число.
> Нормальный вид такой формы имеет единичную матрицу. ^
Определение 22.10. Пусть А =\ац\ /, / = 1, 2, ..., /г,— квад-
квадратная матрица. Угловыми минорами матрицы А называются все ее
миноры, расположенные в левом верхнем углу:
а„>> а" , ..., det Л.
\а2\ 2
94
Теорема 22.5 (критерий положительной определенности действи-
действительной квадратичной формы). Действительная квадратичная форма
является положительно-определенной тогда и только тогда, когда
все угловые миноры ее матрицы строго положительны.
> Пусть задана действительная квадратичная форма
п
F(x) = 2 а^х,. (8)
Обозначим через А ее матрицу. Воспользуемся индукцией по п.
Если /1 = 1, то форма (8) имеет вид F(x) = aux\ и является положи-
положительно-определенной только при условии ап;>0, где ап — един-
единственный угловой минор ее матрицы. Следовательно, при п = 1
теорема верна. Положим п > 1 и будем считать утверждение теоремы
верным для квадратичных форм от меньшего, чем /г, количества
переменных. Квадратичную форму (8) запишем в виде
п-\ п-\
F(x)= 2 dijXiXj + 22 ainXiXn + annxl. (9)
/,/=i 1 = 1
Положим
л-1
2 aijXiXj=G(x{, x2, ..., хп-\). A0)
Это квадратичная форма от п — 1 переменных, матрица В которой
получается из матрицы А в результате вычеркивания ее последних
строки и столбца.
Докажем сейчас необходимость условия теоремы. Пусть (8) —
положительно-определенная квадратичная форма. Легко видеть, что
тогда и форма A0) является положительно-определенной. Если бы
это было не так, существовал бы набор Ь\у йг, ..., Ьп-\ действитель-
действительных чисел, среди которых не все равны нулю, такой, что G(blf b2, ...,
bn-\)^0. Тогда из формулы (9) следовало бы
что противоречит положительной определенности формы (8). Итак,
по индуктивному предположению все угловые миноры матрицы В
положительны и по предыдущему следствию det А > 0, т. е. доказана
положительность всех угловых миноров матрицы А.
Перейдем к доказательству достаточности. Пусть все угловые
миноры матрицы А положительны. Следовательно, положительны все
угловые миноры матрицы S и по индуктивному предположению
A0) —положительно-определенная квадратичная форма. Сущест-
Существует линейное невырожденное преобразование переменных
yi=bi\X\+bi2X2+ ... + bi п-\Хп-\, /=1, 2, ..., П— 1,
приводящее эту форму к нормальному виду у\ + У2 + ... + f/«-i-
Преобразование
--'¦}
1=1 2
j
95
также является невырожденным. Применив его к форме (9), получим
л—1 п—\
F(x) = 2 у?+ 2 2 сту,уя + сппу1 A1)
/ =¦ 1 / = 1
Рассмотрим линейное преобразование переменных:
ZZnZyyn+C>nyn' '-1' 2' ¦"' "~1'}
Очевидно, что оно невырожденное. Применив его к квадратичной
форме A1), получим ее канонический вид:
F(*) = .2 z? + 8zl A2)
Определитель матрицы квадратичной формы, стоящей в правой
части равенства A2), равен б. Согласно лемме 22.3, он отличается от
det Л лишь положительным множителем. Так как deM>0, то и
6>0,и A2) —положительно-определенная квадратичная форма. <4
Квадратичная форма F(x) — отрицательно-определенная тогда
и лишь тогда, когда —F(x) является положительно-определенной
квадратичной формой. Матрицы этих двух форм отличаются друг
от друга только множителем — 1. Следовательно, их угловые миноры
одинакового и четного порядка равны и различаются лишь знаком,
если этот порядок нечетный.
Итак, имеет место
Следствие 22.5 (критерий отрицательной определенности дей-
действительной квадратичной формы). Действительная квадратичная
форма является отрицательно-определенной тогда и только тогда,
когда все угловые миноры нечетного порядка ее матрицы отрицатель-
отрицательны, а все угловые миноры четного порядка положительны.
22.6. Условия разложимости действительной и комплексной
квадратичных форм
Определение 22.11. Пусть задана квадратичная форма
*2, ..-, ХЛ) A)
над полем Р. Будем говорить, что эта форма разложима над Р, если ее
можно представить в виде следующего произведения:
F(x) = {аххх + ... + апхп) {Ьххх + ... + Ьпхп\ B)
где а„ bj e Р.
Найдем необходимые и достаточные условия разложимости квад-
квадратичной формы над полями действительных и комплексных чисел.
Пусть форма A) представима в виде B). Рассмотрим матрицу
а, а2
96
... аЛ
... ьау
Ранг этой матрицы не больше, чем 2. Если он равен нулю, то это
нулевая матрица и форма A)—нулевая, следовательно, ранг ее
равен нулю.
Пусть A) —ненулевая форма, ранг матрицы C) равен 1 и, для
определенности, а\Ф0. Тогда из разложения B) имеем
. + апхпJу сфО. D)
E)
F(x) = с(а,\Х\ + а2Х2 + .
Рассмотрим линейное преобразование переменных:
У\ = CL\xx + а2х2 + ... + апхпу)
yi = xiy i = 2, ..., п. J
Определитель его матрицы
а\ а2
О 1
ап
О
О О
1
так что E) — невырожденное преобразование. Применив его к фор-
форме A), получим в силу формулы D) F(x) = cy2\. Значит, ранг
формы A) равен 1.
Пусть, наконец, ранг матрицы C) равен 2 и пусть, для опре-
определенности,
ах а2
ФО.
Рассмотрим линейное преобразование переменных:
ух = ахх\ + а2х2 + ... + йпХп,
у2 = Ь\Х\ -\- Ь2х2 -f-... -f- ЬпхПу
yt = xly i = 3, ..., п.
Это невырожденное преобразование, так как
6.
0
0
а2
ь2
0
0
Ьъ
1
0
... ап
... Ьп
... 0
... 1
Применив его к форме A), мы, согласно формуле C), получим
F)
Ранг формы F) равен 2.
Если Р — поле действительных чисел, то, положив
Ух =z, +z2y Л
yi=ziy / = 3, ..., пу )
7. Зак. 6466
97
из равенства F) получим F(x) — z2— z\. Значит, положительный
индекс инерции этой формы равен 1.
Таким образом, мы доказали, что если квадратичная форма раз-
разложима над полем Я, то ее ранг не больше, чем 2. Если при этом
Р— поле действительных чисел, а ранг формы равен 2, то ее положи-
положительный индекс инерции равен 1.
Пусть, обратно, ранг квадратичной формы A) равен 1. С по-
помощью подходящего невырожденного линейного преобразования
переменных
У1 = Щ\Х\ + ai2X2 + ... + ainxny /=1, 2, ..., п, G)
приведем эту форму к каноническому виду
Итак, A) —разложимая квадратичная форма.
Пусть сейчас Р — поле комплексных или действительных чисел,
A) —квадратичная форма над Я, ранг которой равен 2, и, если Р —
поле действительных чисел, положительный индекс инерции равен 1.
С помощью невырожденного линейного преобразования перемен-
переменных G) приведем форму A) к виду
F(x) = у\ — у\ = (ух + у2)(у, - у2) =
= (С\Х\ +С2Х2 + .•• + CnXn)(8lXl +62X2 + .» + $Л).
Значит, A) —разложимая квадратичная форма.
Очевидно, что если ранг формы F(x) равен 0, то она также
разложима:
F(x) = 0(a,xi + a<2x2 + ... + апхпJ.
Итак, доказана
Теорема 22.6. Комплексная квадратичная форма разложима над
полем комплексных чисел тогда и лишь тогда, когда ее ранг
не больше, чем 2. Действительная квадратичная форма разложима
над полем действительных чисел тогда и лишь тогда, когда ее ранг не
больше, чем 2, и, если он равен 2, положительный индекс инерции
должен быть равен 1.
22.7. Билинейные формы
Определение 22.12. Многочлен
F{XXJ Х2, .", Хп\ У\, 02, ..-, Уп) A)
от двух систем переменных
хи х2, ..., хп B)
и
Уи Уч, -.., Уп C)
называется билинейной формой порядка п, если каждое его слага-
слагаемое имеет первую степень относительно переменных B) и пере-
переменных C) в отдельности.
98
Краткая запись билинейной формы A): F(x; у).
Итак, билинейная форма F(x; у) над полем Р от систем пере-
переменных B) и C) имеет вид
п
F(x; (/) = ^ aijXiyh ац ? Р. D)
Определение 22.13. Матрица
#12 ... п\п
А =
#21 #22 .•• #2«
#«1 #«2
называется матрицей билинейной формы D), а ранг этой матрицы —
рангом формы D).
Легко проверить, перемножив соответствующие матрицы, что
F(x; y) = xTAYy где X и Y — столбцы, составленные из переменных
B) и C) соответственно.
Пусть G(uy v) — еще одна билинейная форма порядка п. Если
она может быть получена из формы D) в результате применения
к каждой из систем переменных B) и C) одного и того же невы-
невырожденного линейного преобразования над основным полем, то
форма G(uy v) называется эквивалентной форме F(x\ у).
Пример 22.4. Билинейная форма
эквивалентна билинейной форме
г (Х|, х2\ у\, У2)===Х\у\ -J- х2у2 E)
над полем Q, ибо, положив в равенстве E)
Х\ — U]
получим F(x\ y)=G(u; v).
Очевидны следующие утверждения.
1. Каждая билинейная форма эквивалентна сама себе.
2. Если билинейная форма F(x; у) эквивалентна билинейной
форме G(u; v)t то и G(u; v) эквивалентна F(x; у).
3. Две билинейные формы, эквивалентные третьей, эквивалентны
друг другу.
Следовательно, эквивалентность билинейных форм есть отноше-
отношение эквивалентности на множестве всех билинейных форм порядка п
над полем Р.
Рассмотрим, как связаны матрицы билинейных форм, экви-
эквивалентных друг другу.
Теорема 22.7. Билинейные формы порядка п с матрицами А и В
эквивалентны, если и только если над основным полем существует
такая невырожденная матрица С пЬрядка п, что В = СТАС.
99
Доказательство этой теоремы аналогично доказательству теоре-
теоремы 22.1, поэтому мы предлагаем его читателю в качестве упражнения.
Определение 22.14. Билинейная форма называется симмет-
симметрической, если ее матрица А — симметрическая, т. е. АТ = А.
Предложение 22.4. Если билинейная форма F является симмет-
симметрической, то и всякая эквивалентная ей билинейная форма также
симметрическая.
> Пусть А — матрица билинейной формы F. Тогда Ат — А. Мат-
Матрица любой эквивалентной билинейной формы G имеет вид CMC.
Далее,
{СТАС)Т = СТАТ(СТ)Т = СТАС.
Следовательно, форма G является симметрической.4
Ниже рассматриваются только симметрические билинейные фор-
формы. При этом характеристика основного поля предполагается отлич-
отличной от 2.
Пусть
F{x- y) = XTAY F)
есть симметрическая билинейная форма порядка п. Положив в ра-
равенстве F) X=Yy получим квадратичную форму F(x) = F{x; x) =
= ХТАХ с той же матрицей А. Эти две формы называются полярными
по отношению друг к другу.
Предложение 22.5. Для каждой квадратичной формы существует
единственная симметрическая билинейная полярная форма.
• >Пусть две билинейные формы—F) и G(x; y) = XTBY — по-
порождают одну и ту же квадратичную форму F(x). Тогда
F(x) = F(x; x) = XTAX=G(x; х) = ХтВХу
откуда, согласно лемме 22.2, Л=В, значит, F(x\ y)=G(x; у). 4
Итак, соответствие между квадратичными и полярными им
симметрическими билинейными формами является взаимно одно-
однозначным. При этом матрицы полярных квадратичной и билинейной
форм совпадают и при невырожденных линейных преобразованиях
переменных изменяются одинаково. Это дает возможность опреде-
определить канонический и нормальный виды симметрической билинейной
формы и сформулировать теоремы, аналогичные соответствующим
теоремам для квадратичных форм.
Определение 22.15. Симметрическая билинейная форма на-
называется канонической, если ее матрица диагональна. Каноническим
видом симметрической билинейной формы называется любая эквива-
эквивалентная ей каноническая форма.
Теорема 22.8. Всякая симметрическая билинейная форма экви-
эквивалентна над основным полем некоторой канонической билинейной
форме.
Определение 22.16. Канонический вид симметрической били-
билинейной формы над полем С называется нормальным, если все его
ненулевые коэффициенты равны 1. Канонический вид симметрической
100
билинейной формы над полем R называется нормальным, если
каждый его ненулевой коэффициент равен 1 или —1.
Предложение 22.6. Всякая симметрическая билинейная форма
над C(R) с помощью невырожденного линейного преобразования
переменных может быть приведена к нормальному виду. Число
ненулевых коэффициентов в нормальном виде симметрической
билинейной формы над С, а также число положительных и число
отрицательных коэффициентов в нормальном виде симметрической
билинейной формы над R не зависят от выбора невырожденного
линейного преобразования переменных, приводящего эту форму к
нормальному виду.
Теорема 22.8 и предложение 22.6 верны по той же причине, что и
аналогичные утверждения для квадратичных форм.
Пример 22.5. Привести к каноническому виду с помощью невырожденного
линейного преобразования переменных над полем R билинейную форму
F(xu х2, х3; уи Уч, Уз)— у хху2 + уЗД+ у х3у2 + у х{уз + у *зУ\.
Решение. Рассмотрим полярную квадратичную форму
F(x) = х\х2 + х2х3 + х3х\.
Как было показано выше (см. пример 22.1), невырожденное линейное лреобра-
зование переменных
Z\ = уХ, + у
1 1
22= у*'" у
приводит эту форму к каноническому виду
F(x) = z\-zl- zl
Следовательно, невырожденное линейное преобразование двух систем переменных:
Zl = у XI + у Х2 + Х3, | У, = у уХ + у i/2 + УЗ,
11
22= уXi — у*2,
23 = Х3, ) V3 = УЗ
приводит билинейную форму F(x\ у) к каноническому виду
F{x\ у) = ZiV\ — z2v2 — Z3V3.
Определение 22.17. Симметрическая билинейная форма
над R называется положительно-определенной, если положительно-
определенна полярная ей квадратичная форма.
Предложение 22.7. Нормальным видом положительно-определен-
положительно-определенной симметрической билинейной формы порядка п является
F(X\, ..., Хп\ Уи .-, Уп) = Х\у\ + ...+Хпуп.
101
22.8. Эрмитово-сопряженная матрица
Если имеется т X я-матрица над С:
A = [ajk], / = 1, 2, ..., т, *=1, 2, ..., л, A)
то наряду с транспонированной матрицей АТ рассматривают еще
эрмитово-транспонированную матрицу А*. По определению
Л* = [Ы /=1, 2, ..., л, *=1, 2, ..., m, bik = akh
где черта означает замену комплексного числа сопряженным:
а-\- Ы = а — Ыу a, ft 6 R.
Верны следующие утверждения.
1. Если А и В — такие матрицы, что определено произведение
АВ, то определено также произведение В*А* и верно равенство
2. Если А и В — матрицы одинаковых размеров, то
(А+В)* = А* + В*.
3. Если А — матрица, а X — комплексное число, то
Доказательства этих утверждений аналогичны приведенным
в § 2.4 доказательствам свойств операции транспонирования, поэтому
мы предлагаем их читателю в качестве упражнения.
Определение 22.18. Квадратная матрица А над полем комп-
комплексных чисел называется эрмитовой, если А* —А. _
Очевидно, что для эрмитовой матрицы А вида A) а;* —а*./,
поэтому все диагональные элементы эрмитовой матрицы действи-
действительны.
Заметим еще, что определитель эрмитовой матрицы — действи-
действительное число.
> В самом деле, пусть А — матрица вида A). Перейти к матрице
А* можно, последовательно выполнив две операции — транспони-
транспонирование и замену каждого элемента матрицы сопряженным числом.
Следовательно, det(y4*) = detА. Если А* — Ау то detЛ* = detЛ,
поэтому для эрмитовой матрицы det A = det А, т. е. det A — действи-
действительное число. <4
22.9. Эрмитовы билинейные и квадратичные формы
Если основное поле совпадает с полем комплексных чисел, то
наряду с билинейными и квадратичными формами рассматривают
эрмитовы билинейные и квадратичные формы.
Определение 22.19. Эрмитовой билинейной формой F(x; у)
порядка п от систем переменных
Х\, Х2, ..-, Хп A)
102
и
Уи 1/2, -., Уп B)
называется билинейная форма от систем переменных
Х\у Х2 , ..., Хп C)
и B):
F{x\ y)= 2 a*7^it//, al76C. D)
Черта означает переход к комплексному сопряженному числу: если
переменным A) придаются значения Ь\, Ь<2, ..., Ьп, то переменные
C) принимают значения b\t 62, • ••, 6Я.
Аналогично эрмитовой квадратичной формой F(x) от перемен-
переменных A) называется билинейная форма от систем переменных C)
и A), матрица которой — эрмитова. Иными словами, эрмитова
квадратичная форма F от переменных A)—это многочлен вида
п
F(x)= 2 ацх1х] =
i/1
= О, \X\X\ + 012^1^2 + .-. + CL\nX\Xn +
+ a2\x2xi_+ a22X2X2j+-... + a2nX2xw_+ ... -f
+ an\XnX\ + ^rt2^«^2 + ... + annXnXn,
где все коэффициенты a,-/ являются комплексными числами и удов-
удовлетворяют условию a// = uji. Матрицы и ранги эрмитовых билинейной
и квадратичной форм определяются так же, как в случае обычных
(не эрмитовых) форм.
Если А — матрица формы, то:
для эрмитовых билинейных форм
F(x; y) = X*AY; E)
для эрмитовых квадратичных форм
F(x) = X*AX. F)
Равенства E) и F) проверяются прямыми вычислениями.
Эрмитова билинейная форма называется симметрической, если
ее матрица А эрмитова, т. е. А* = А.
В этой книге рассматриваются только симметрические эрмитовы
билинейные формы.
Так же, как и в случае обычных (не эрмитовых) билинейных
и квадратичных форм, определяются эквивалентные эрмитовы били-
билинейные и квадратичные формы и полярные формы. Остается верным
все, что было сказано выше об эквивалентности форм. Необходимо
только, учитывая равенства E) и F), во всех формулах заменять
операцию транспонирования матрицы операцией перехода к эрми-
тово-транспонированной матрице. В частности, матрицы А и В экви-
эквивалентных эрмитовых билинейных или квадратичных форм связаны
соотношением В — С*АСУ где С — матрица соответствующего пре-
преобразования переменных.
юз
Все доказательства аналогичны приведенным выше, поэтому
мы оставляем их читателю.
Эрмитова билинейная или квадратичная форма называется
канонической, если ее матрица диагональна.
Теорема 22.9. Всякая эрмитова квадратичная форма эквива-
эквивалентна некоторой канонической эрмитовой форме. Аналогичное ут-
утверждение верно и для симметрических эрмитовых билинейных форм.
> Основная часть доказательства теоремы такая же, как и для
случая обычных (не эрмитовых) форм.
Пусть дана эрмитова квадратичная форма
п
F(jc) = .2 а17х*,. G)
Вместо трех случаев, приведенных в § 22.3, здесь рассмотрим сле-
следующие четыре:
1) все коэффициенты формы G) равны нулю;
2) среди коэффициентов аи хотя бы один отличен от нуля;
3) все коэффициенты аи равны нулю, среди других коэффи-
коэффициентов есть не равный нулю и не являющийся чисто мнимым числом;
4) все коэффициенты аи равны нулю, и все ненулевые коэффи-
коэффициенты формы G) —чисто мнимые числа.
Для первых трех случаев рассуждения те же, что и в § 22.3.
Рассмотрим четвертый случай. Пусть, например, а\2ф0. Запишем
квадратичную форму A) в виде
п -\
^2anXi/
G(x2, ..., хп)
и рассмотрим линейное преобразование переменных
yt =xiy i= 1, 3, ..., п,
t/2 = ai2*2 + a 1з*з + ... + a\nXn.
Очевидно, что оно невырожденное. Применив его к форме G), по-
получим _ _
F{) + + HB, ..., уп\
где //Q/2, ..., уп) не зависит от у\. Мы привели форму G) к уже
рассмотренному виду. <4
Эрмитова квадратичная форма от п переменных, имеющая вид
?\У\У\ + е2#2#2 + ... + &пУпУп> где ef- = 1; — 1; 0, а также полярная ей
билинейная форма называются нормальными эрмитовыми формами.
Следующие две теоремы доказываются точно так же, как и в слу-
случае действительных квадратичных форм.
Теорема 22.10. Всякая эрмитова квадратичная (симметрическая
билинейная) форма эквивалентна некоторой нормальной форме.
Теорема 22.11. Число положительных и число отрицательных
коэффициентов в нормальном виде эрмитовой квадратичной формы
не зависит от выбора невырожденного линейного преобразования
переменных, приводящего ее к нормальному виду.
Лемма 22.4. Пусть A) — эрмитова квадратичная форма, а
104
biy &2, ••-, bn — комплексные числа. Тогда F(b\y b2, .., bn) — действи-
действительное число.
> Нужно доказать, что
F(bu b2y ..., bn) = F(bu b2, »., bn).
В самом деле,
F(b
u b2, ..., bn) = \ I> aijbibj) =
= 2 ajjijbi = F(b\, b2, ..., ft«). ^ -
Доказанная лемма позволяет сформулировать определение зна-
коопределенных эрмитовых форм.
Определение 22.20. Эрмитова квадратичная форма G) назы-
называется положительно-определенной, если для любых значений
Ьи Ь2, -.., Ья (8)
входящих в нее переменных, среди которых хотя бы одно отлично
от нуля,
F(bu Ь2, .», 6я)>0,
и отрицательно-определенной, если для любых значений (8) входя-
входящих в нее переменных, среди которых хотя бы одно отлично от нуля,
F(bu Ь2, ..., 6я)<0.
Симметрическую эрмитову билинейную форму, полярную положи-
положительно-определенной эрмитовой квадратичной форме, также назы-
называют положительно-определенной.
Так же, как и в случае квадратичных форм, доказываются
следующие две теоремы.
Теорема 22.12. Эрмитова квадратичная форма A) является поло-
положительно-определенной тогда и только тогда, когда
У\У\ +У2У2 + ...+УпУп
является ее нормальным видом.
Теорема 22.13. Эрмитова квадратичная форма является положи-
положительно-определенной тогда и только тогда, когда все угловые миноры
ее матрицы положительны.
23. ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА
В элементарной геометрии длина |а| вектора а и условие орто-
ортогональности векторов выражаются в терминах скалярного произ-
произведения:
8. Зак. 6466 105
векторы а и b ортогональны тогда и только тогда, когда их скалярное
произведение равно нулю:
В этой главе мы введем понятие скалярного произведения в произ-
произвольном действительном или комплексном линейном пространстве,
а затем определим длину вектора а с помощью формулы | а | = \а. • а,
а ортогональность векторов — с помощью равенства а • b = 0.
23.1. Линейные функции
Определение 23.1. Пусть V — линейное пространство над
полем Р. Отображение f: V-+P называется линейной функцией на
пространстве V, если оно удовлетворяет следующим двум условиям:
1) для любых векторов a, b 6 V
2) для любого вектора а 6 V и любого числа а 6 Р
Другими словами, линейный оператор пространства V в поле Р
(которое рассматривается как линейное пространство над самим
собой) называется линейной функцией на пространстве V.
Пример 23.1. Отображение о: V-+P, определяемое равенством o(v) = 0 для
любого v ? У, является, очевидно, линейной функцией на пространстве V. Эта
функция называется нулевой.
Пример 23.2. Скалярное умножение каждого вектора х на фиксированный
вектор а задает линейную функцию х->-х- а на пространстве Уз свободных векторов.
Пример 23.3. На пространстве С [а, Р] функций, непрерывных на отрезке [а, 0],
линейной функцией является отображение
f: C[a, p]-*R. x(t)^\x(t)l(t)dt,
а
где /(/)—фиксированная функция из С[а, 0].
Пример 23.4. Пусть У — линейное пространство над полем Р, vi, V2, ..., \п —
базис пространства У, ои, аг, ..., ап?.Р. Тогда отображение
где х\, ..., хп — координаты вектора х, является линейной функцией.
Читателю рекомендуется доказать самостоятельно, что в каждом
из приведенных примеров мы действительно имеем дело с линейной
функцией.
Пример 23.4 является самым общим. Действительно, если / —
произвольная линейная функция на n-мерном пространстве I/, базис
которого
Vi, V2, ..-, V,, A)
= OLk, k=l, 2, ..., Л,
106
то для любого вектора х с координатами х\у х2у ..., хп имеем
f(x) = f(xi\\ + ... + XnVn) = x\f(vi) + ... + xnf(vn) = a{x{ + ... + anxn.
Как было отмечено в § 19.2, множество всех линейных функций
на я-мерном линейном пространстве над полем Р само является
линейным пространством над этим полем. Это пространство называ-
называется сопряженным пространству V и обозначается V*.
В § 19.4 доказано, что пространство V* изоморфно пространству
Р\уп матриц. Следовательно, dim V* = dim V = п.
Пусть A)—базис пространства Vy х\у х2у ..., хп — координаты
произвольного вектора х в этом базисе. Рассмотрим п линейных
функций
/., h .... U, B)
определяемых равенствами
fjx\ = x.^ j _ i? 2, ..., п.
Теорема 23.1. Система B) — базис пространства V*. Для про-
произвольной линейной функции f ее i-я координата в базисе B) рав-
равна f(\i).
> Пусть a\f\ -\-'<z2f2 -+-... -+- anfn = 0— нулевая функция, ось а2у ...,
ап?Р. Тогда для /=1, 2, ..., п имеем:
(a\f\ + ... + a>nfn)(yi) = OL\f\(Vi)+ ... + anfw(v() = 0.
Но
' *, если / = /,
если / Ф'ьу
поэтому (ai/i + ... + anfn)(vi) = a/, а,= 0. Доказано, что система
функций B) линейно независима. Так как число этих функций
равно размерности пространства 1/*, то они составляют базис.
Далее, для любой линейной функции f и вектора х, имеющего
в базисе A) координаты х\у х2у ..., хПу
f(x) = f(X\V\ + ... + XnVn) = Xif(\i)+ ... + Xnf(vn) =
т. е. f = f() )
Базис B) называется дуальным относительно базиса A).
23.2. Билинейные функции
Пусть V — линейное пространство над полем Я, характеристика
которого отлична от 2. Будем рассматривать числовые функции двух
переменных, определенные в пространстве Vy т. е. отображения
вида V2-+P.
Определение 23.2. Функция f двух переменных называется:
1) линейной относительно первой переменной, если для любых
векторов аь аг, b и чисел а\у а2 из основного поля
+ос2а2, b) = ai/(ai, b) + a2f(a2, b); A)
107
2) линейной относительно второй переменной, если для любых
векторов a, blt b2 и чисел рь Р2 из основного поля
Да, р,Ь, + РгЬ2) = Pi Да, bi) + р2Да, b2); B)
3) билинейной, если она линейна относительно каждой пере-
переменной в отдельности.
Очевидно, что совокупность условий A) и B) равносильна
следующему условию:
... + amam, Pibi + ... + р„Ь„) =
= .2 Да/Р/Да,-, by) C)
для любых векторов а/, by и чисел а*, Р/, /= 1, 2, ..., m, j = 1, 2, ..., я,
из основного поля.
Если основное поле Р является полем комплексных чисел, то
наряду с билинейными функциями рассматриваются еще эрмитовы
билинейные функции.
Определение 23.3. Функция f двух переменных называется:
1) косолинейной относительно первой переменной, если для лю-
любых векторов аь a2, b и комплексных чисел ai, осг
, b)= а^(аР b) + ofe/(a2, b), D)
где черта означает замену комплексного числа сопряженным;
2) эрмитовой билинейной, если она косолинейна относительно
первой переменной и линейна относительно второй.
Совокупность условий B) и D) равносильна условию
/(ociai + ... + ocmam, Pibi + ... + р„Ь„) =
m n
= 22 OfP/f(a*, b;) E)
для любых векторов a/, b/ и чисел а,, Ру, / = 1, 2, ..., т, / = 1, 2, ..., п.
Очевидно, что для любой билинейной (эрмитовой билинейной)
функции f и каждого вектора a
Да, 0) = /@, а) = 0.
> В самом деле, Да, 0) = Да, 0a) = 0f(a, a) = 0.4
Далее будем считать пространство V конечномерным. Пусть
в базисе
Ui, U2, ..., Un, F)
пространства V векторы а и b записываются в виде:
а = XiUi + Х?М2 + ... + *nU,u Ь = f/iUi + У2П2 + ... + УпПп.
Тогда
Да, b) =
108
Отсюда с учетом равенств C) и E), получаем:
для билинейной функции
f(a, b) = .|/,y/f(u,-, uy);
для эрмитовой билинейной функции
Да, Ь)= 2 xtyrfiut, u/).
G)
(8)
Положим
/(u/, u/) = al7, Л =
CL\\ CL\2 ... a|n
#21 #22 ••• #2«
ani aw2 ... ann
Матрица А называется матрицей функции f в базисе F). Зная
матрицу А, можно, пользуясь формулой G) (или (8)), вычислять
значение /(а, Ь) билинейной (эрмитовой билинейной) функции f
для любых векторов з.иЪ. Очевидно, что9взяв в качестве А произволь-
произвольную квадратную матрицу порядка п над основным полем, можно
с помощью формулы G) (или (8)) определить билинейную (эрми-
(эрмитову билинейную) функцию f.
Из формул G) и (8) получаем:
для билинейной функции
Да, Ь)= 2 аИХ1У1 = ХтАУ; (9)
для эрмитовой билинейной функции
п
/(a, b)= S о„од = ХМК. A0)
Здесь _ _ _
Х = [х\ х2 ... хп]т, Y = {yx y2 ... уп]т, Х* = [х\ х2 ... хп].
Пусть С — матрица перехода от базиса F) к новому базису
Vi, V2, .-., V,,, (И)
В и D — соответственно координатные столбцы векторов а и b в ба-
базисе A1). Тогда Х = СВ, Y=CD. Из формул (9) и A0) получаем:
в случае, когда / — билинейная функция,
в случае, когда / — эрмитова билинейная функция,
Да, b) = (CB)*A(CD) = B*(C*AC)D.
Итак, при фиксированном базисе значение /(а, Ь) билинейной
(эрмитовой билинейной) функции f выражается билинейной (эрми-
(эрмитовой билинейной) формой от координат векторов а и Ъ, имеющей
109
ту же матрицу, что и матрица функции f в данном базисе. При этом
переход к новому базису вызывает замену соответствующей били-
билинейной формы эквивалентной ей формой, поэтому эквивалентные
билинейные формы можно рассматривать как билинейные формы,
соответствующие одной и той же билинейной функции в разных
базисах.
23.3. Симметрические билинейные функции
Определение 23.4. Билинейная функция f называется сим-
симметрической, если f (а, Ь) = / (Ъ, а) для любых векторов а и Ъ.
Эрмитова билинейная функция f называется симметрической, если
f (а, Ь) = / (Ъ, а) для любых векторов а и Ъ.
Пример 23.5. В пространстве С [а, 0] функций, непрерывных на отрезке [а, 0],
определим функцию / двух переменных с помощью формулы
f(g, A)=\ g(x)h(x)dx.
а
Так как интеграл суммы функций равен сумме интегралов этих функций, а посто-
постоянный множитель можно выносить за знак интеграла, то /—билинейная функция.
Очевидно, что она является симметрической.
Для конечномерных пространств очевидно, что билинейная
(эрмитова билинейная) функция является симметрической тогда и
только тогда, когда соответствующая билинейная (эрмитова били-
билинейная) форма — симметрическая. Поэтому, зафиксировав в прост-
пространстве некоторый базис и взяв произвольную симметрическую
(эрмитову) матрицу в качестве матрицы билинейной (эрмитовой
билинейной) функции в этом базисе, мы получим симметрическую
функцию, причем все симметрические билинейные (эрмитовы били-
билинейные) функции получаются таким образом.
Так как в разных базисах значения билинейной (эрмитовой
билинейной) функции выражаются эквивалентными билинейными
(эрмитовыми билинейными) формами и всякая симметрическая
билинейная (эрмитова билинейная) форма эквивалентна некоторой
канонической форме, причем и в случае эрмитовых форм диагональ-
диагональные элементы матрицы формы — действительные числа, то верна
Теорема 23.2. Для любой симметрической билинейной функции,
определенной в конечномерном пространстве, существует такой базис
пространства, в котором матрица этой функции диагональна. Для
любой симметрической эрмитовой билинейной функции, определен-
определенной в конечномерном пространстве, существует такой базис прост-
пространства, в котором матрица этой функции диагональна и дейст-
действительна.
Очевидно, что для любой симметрической эрмитовой билинейной
функции все значения f (а, а) — действительные.
110
23.4. Скалярное произведение
Определение 23.5. Пусть V — действительное линейное про-
пространство, в котором задана функция двух переменных. Образ пары
векторов а и b будем обозначать а • Ь. Эта функция называется
скалярным произведением, если она удовлетворяет следующим
трем условиям:
1) (оса + pb) • с = а(а • с) + Р(Ь • с) для любых векторов а, Ь, с
и действительных чисел а и р;
2) а • b = b • а для любых векторов а и Ь;
3) а • а >> О для любого ненулевого вектора а.
Очевидно, что из условий 1 и 2 следует условие
4) с-(аа + pb) = а(с • а) + р(с • Ь) для любых векторов а, Ь, с и
действительных чисел а и р, поэтому можно сказать, что скалярным
произведением в линейном пространстве V над полем действитель-
действительных чисел называется билинейная симметрическая функция, удов-
удовлетворяющая условию 3.
Легко проверить, что из условий 1—3 следует условие
m n m n
5) ( 21 а,а/)( 21 РуЬ/)= 21 21 а,Р/(агЬу) для любых векторов а,, Ь/
/=1 /=1 i=\ j = \
и чисел а/, р/, /=1, 2, ..., т, / = 1, 2, ..., п.
Пример 23.6. Скалярное произведение векторов, введенное в § 12.11, удовлетво-
удовлетворяет, как уже отмечалось, условиям 1—3.
Пример 23.7. В пространстве я-членных действительных столбцов можно
определить скалярное произведение столбцов с помощью формулы
АВ= S сх/рг,
/=1
где А =[а, а2 ... ап]т\ Д = [Р, Р2 - P«F-
Доказательство мы оставляем читателю.
Пример 23.8. В пространстве С [а, Р] функций, непрерывных на отрезке [а, Р],
определим скалярное произведение функций / и g с помощью формулы
fg = \f(x)g(x)dx. A)
а
Читателю предлагается убедиться самостоятельно в том, что формула A)
определяет скалярное произведение.
Определение 23.6. Пусть V — комплексное линейное про-
пространство, на котором задана функция двух переменных. Образ
пары векторов aub будем обозначать а • Ь. Эта функция называ-
называется скалярным произведением, если она удовлетворяет следующим
трем условиям: _ _
1) (оса + РЬ) • с = а(а • с) + Р(Ь • с) для любых векторов а, Ь, с и
комплексных чисел а, Р;
2) a • b = (b • а) для любых векторов aub;
3) a • a — положительное действительное число для любого
ненулевого вектора а.
Очевидно, что из условий 1 и 2 следует условие
ill
4) с • (aa +pb) = a(c • а)+р(с • b) для любых векторов а, Ь, с
и комплексных чисел а, р, поэтому можно сказать, что скалярным
произведением в линейном пространстве V над полем комплексных
чисел называется симметрическая эрмитова билинейная функция,
удовлетворяющая условию 3.
Пример 23.9. В пространстве я-членных столбцов над полем комплексных чисел
скалярное произведение столбцов можно определить с помощью формулы
где Л = [а, а2 ... ап]т\ В =[р, р2 ... finf.
Определение 23.7. Действительное линейное пространство с
определенным в нем скалярным произведением называется евкли-
евклидовым линейным пространством. Комплексное линейное простран-
пространство с определенным в нем скалярным произведением называется
унитарным линейным пространством.
Очевидно, что любое подпространство U евклидова (унитар-
(унитарного) пространства V также евклидово (унитарно), причем скаляр-
скалярное произведение в нем — сужение скалярного произведения, опре-
определенного в V, т. е. скалярное произведение векторов подпростран-
подпространства U определяется так же, как и скалярное произведение этих
векторов в V.
Теорема 23.3. Всякое конечномерное действительное (комплекс-
(комплексное) линейное пространство может быть превращено в евклидово
(унитарное).
> Пусть V — п-мерное действительное пространство, a v,, v, ...,
vn — его базис. Для произвольных векторов a, b 6 V положим
п
а. b = 2 xiyiy B)
где а = 2 хм; Ъ = 2 y/V/.
Покажем, что равенство B) определяет скалярное произведе-
п
ние. Если с= 2 2,'V,, a, p — действительные числа, то
п п
(оса + РЬ) • с = 2 (axi + $y-)zi = a 2 XiZi +
Далее,
n n
b • a = 2 tjiXi = 2 Xitfi = a • b.
112
Наконец, если а ф О, то х( ф О для некоторого i, и, следовательно,
а • а = S *? > 0.
Доказательство теоремы для случая комплексного пространства
мы оставляем читателю. ^
23.5. Длина вектора
Определение 23.8. Длиной вектора а евклидова (унитар-
(унитарного) пространства называется число У а • а.
Длину вектора а будем обозначать |а|.
Отметим некоторые свойства длины вектора:
1) | а | > 0, | а | = 0 только при а = 0;
2) | аа | = |а | | a I (I a | — модуль числа а) для любого комп-
комплексного (в случае евклидова пространства — действительного)
числа а
> В самом деле,
I аа| = У(аа)-(аа) = Уосос(а- a) = ~VaaУа- а= I a I I а|.<4
Теорема 23А (неравенство Коши — Буняковского). Для любых
векторов а. и Ъ евклидова (унитарного) пространства
|а.Ь|<|а| |Ь|, A)
причем равенство имеет место тогда и только тогда, когда векторы
г. и Ъ линейно зависимы.
> При Ь = 0 неравенство A) очевидно. Если же b ф 0, рас-
рассмотрим квадрат длины вектора а + jcb, где х — произвольное число
из основного поля:
(а + хЬ) • (а + хЬ) = а • а + Ф • а) + *(а • Ь) + хх(Ь • Ь) > 0. B)
Положив в выражении B) х= — b • а/(Ь - Ь), получим
ИЛИ
(а-а)(Ь-Ь)>(а-Ь)(Ь-а), C)
так как b • b >> 0. Перепишем неравенство C) в виде
|а|2|Ь|2>|а.Ь|2. D)
Остается извлечь из обеих частей неравенства D) положитель-
положительные квадратные корни, после чего мы получим неравенство A).
Если векторы а и b линейно независимы, то а.-\-хЪф0 при
любом значении ху значит, D) — строгое неравенство.
Если же а и b — линейно зависимые векторы, то положим для
определенности b = аа. Тогда
|а.Ь| = | а.(сса)| = I ее | |а|2=|а| |Ь|.«
из
Пусть a, b — ненулевые векторы евклидова пространства. В силу
неравенства Коши — Буняковского
поэтому существует единственный угол ф, О^ф^я, такой, что
ab
Этот угол называется углом между векторами а и Ь.
Рассмотрим равенство
(а + Ь) • (а + Ь) = а • а + b • а + а • b + b • Ь. E)
Отметим, что b-a + a-b = a-b + (a-b) = 2 Re(a • b), где Re a —
действительная часть числа а. Очевидно, что Reoc^C |а|, поэтому
из равенства E) следует
или в силу неравенства Коши — Буняковского
|а + Ь|2<|а|2 + 2|а| | Ь| + I b |2 = (| а| + I b IJ,
т. е. |а + Ы < |а| + 1Ь|.
Итак, доказана
Теорема 23.5 (неравенство треугольника). Длина суммы двух
векторов евклидова (унитарного) пространства не превосходит
суммы длин слагаемых.
Пример 23.10. Для пространства V3 свободных векторов теорема 23.5 означает,
что длина стороны треугольника меньше суммы длин двух других его сторон.
Пример 23.11. В комплексном линейном пространстве я-членных столбцов мы
определили скалярное произведение с помощью равенства
п
ЛВ = 2 afil9
где Л=[а, a2 ... ап?\ ? = [p, p2 - P«]7-
В силу неравенства Коши — Буняковского
IPJ2)- F)
1
Неравенство F) верно для любых наборов а,, а2, ... , ап и р,, р2, ... , р„ комплексных
чисел. Из неравенства треугольника следует
2 lo, + p,|'<( Л/Z 1«.12 + Л/ 2 1Э.12 ¦ G)
Пример 23.12. В пространстве С [a, P] мы определили скалярное произведение
с помощью равенства
114
Следовательно, неравенства
Р Р Р
(\f(x)g(x)dx)*<\f(xfdx\g(xfdx,
верны для любых функций / и g из С [а, 0].
23.6. Ортогональные векторы
В § 12.11 приведено необходимое и достаточное условие орто-
ортогональности двух векторов — равенство нулю их скалярного произ-
произведения. Аналогично определим ортогональность векторов в произ-
произвольном евклидовом (унитарном) пространстве.
Определение 23.9. Будем говорить, что вектор а ортогона-
ортогонален вектору Ъ, и писать а _1_ Ь, если а • b = 0.
Очевидно, что если a_Lb, то и b _l_ а. Следовательно, можно
сказать, что векторы а и Ь ортогональны.
Укажем некоторые свойства ортогональных векторов.
1. а_1_а тогда и только тогда, когда а = 0; 0 _1_ а для любого
вектора а.
2. Если вектор а ортогонален каждому вектору пространства,
то а = 0, ибо в этом случае а _1_ а.
3. Очевидно, что верна «теорема Пифагора»: если а = Ь + с и
bi-c, то |a|2=|b|2+lc|2.
>В самом деле, | а |2 = (Ь + с) • (Ь + с)= |b|2+ 1с|2.^
4. Если
а,, а2, ... , ат A)
есть конечная система векторов евклидова (унитарного) простран-
пространства, а Ъ — вектор этого пространства, ортогональный каждому
вектору а,, то Ъ ортогонален и любой их линейной комбинации, так как
m m
b( 2 а/а,-) = 2 a«(ba,-) = 0.
/ = 1 i: = 1
Предложение 23.1. Ортогональное множество (множество по-
попарно ортогональных векторов), не содержащее нулевых векторов,
линейно независимо.
> Пусть A) —конечное ортогональное множество, не содержа-
содержащее нулевых векторов. Если
ахъх + а2а2+ ... + czmam = 0, B)
где а/, /=1, 2, ..., т,— комплексные (действительные) числа, то,
умножив обе части равенства B) слева на вектор а/, получим
в силу ортогональности множества A) a«(aia,-) = 0, а,- = 0, / =
= 1, 2, ..., т. Таким образом, система векторов A) линейно не-
независима.
115
Бесконечное ортогональное множество, не содержащее нулевых
векторов, также линейно независимо, поскольку линейно независи-
независимо каждое его конечное подмножество.^
Теорема 23.6. Пусть A) — конечная система векторов евклидова
или унитарного пространства. Тогда в этом пространстве сущест-
существует ортогональная система векторов
ь„ ь2, ..., ьт> C)
такая, что для &= 1, 2, ..., m системы
аь а2, ..., а* D)
Ь„ Ь2, ..., Ь* E)
эквивалентны.
> Систему C) будем строить последовательно, с помощью так
называемого процесса ортогонализации. Положим Ь1=а1. Далее
воспользуемся индукцией. Если ортогональная система E), экви-
эквивалентная системе D), уже построена и k < m, то положим
Ь*+1 = а*+1 + aibi + ... + oLkhk, F)
где af, /= 1, 2, ..., ky— неизвестные пока числа из основного поля.
Легко видеть, что системы векторов
а,-, /=1, 2, ..., *+1, G)
Ь/, /=1, 2, ... , *+1, (8)
эквивалентны при любом наборе коэффициентов (а,-, /= 1, 2, ..., Л).
В самом деле, система E) линейно выражается через систему
D), а вектор Ък + \ — через систему G), значит, система (8) ли-
линейно выражается через систему G). В свою очередь система D)
линейно выражается через систему E), а вектор a*+i, согласно
равенству F),— через систему (8). Значит, система G) линейно
выражается через систему (8), следовательно, эти системы экви-
эквивалентны.
Попытаемся теперь подобрать коэффициенты а( в равенстве
F) таким образом, чтобы система (8) была ортогональной. Так как
E) — ортогональная система, то нужно только, чтобы равенства
Ь,-•!>,•+,= О (9)
выполнялись при /= 1, 2, ..., k. С учетом формулы F) из равенств
(9) получим систему уравнений для определения коэффициентов щ\
al-+I.b/ + al-(bl-.b0 = O, /=1, 2, ..., k. A0)
Если Ь( ф 0, то а/ определяется из системы A0). Если же Ь( = 0, то
система A0) имеет место при любом а,- и выбор а( в равенстве F)
несуществен. ^
Следствие 23.1. Если система векторов A) линейно незави-
116
сима, то и построенная с помощью процесса ортогонализации систе-
система C) также линейно независима.
> Ранги эквивалентных систем векторов равны. Поэтому в си-
системе C) нет нулевого вектора. Если же A) —линейно зависимая
система, то 0 входит в систему C), в противном случае она была бы
линейно независимой, согласно предложению 23.1 .^
Следствие 23.2. Если в системе A) а,, / = 1, 2, ..., ky k ^ m,—
ненулевые попарно ортогональные векторы, то в системе C), по-
полученной из системы A) с помощью процесса ортогонализации,
bi = Ri. (И)
> В самом деле, при пг= 1 равенство (И) верно. Воспользуемся
индукцией по т. Пусть т>1 и равенство (И) верно для всех
i^.m—1. Согласно формуле F),
Ъщ = Ят + «lb, + ••• + Otm-lbm-l.
Из равенства Ь/ • Ь; = 0, 1 ^ / < т — 1, следует а,-(Ь/ • Ь/) = О,
а,- = 0.
Итак, равенство (И) доказано.^
Очевидно, что из следствий 23.1 и 23.2 вытекает
Теорема 23.7. Любая ортогональная система ненулевых векто-
векторов конечномерного евклидова (унитарного) пространства либо
является базисом, либо может быть дополнена до ортогонального
базиса.
Определение 23.10. Система векторов называется ортонор-
мированной, если любые два ее вектора ортогональны друг другу
и длина каждого из них равна 1.
Из предыдущей теоремы вытекает
Следствие 23.3. В ненулевом конечномерном евклидовом
(унитарном) пространстве V существует ортонормированный базис.
Любая ортонормированная система векторов пространства V либо
является базисом, либо может быть дополнена до ортонормиро-
ванного базиса.
Ортогональный базис можно построить, применяя процесс орто-
ортогонализации к любому базису пространства. Умножая затем каждый
вектор ортогонального базиса на число, обратное его длине, полу-
получаем ортонормированный базис.
Пусть
u,, u2, ... , un A2)
есть базис евклидова (унитарного) пространства V, А=[ац\ /, / =
= 1, 2, ..., п — матрица скалярного произведения в этом базисе.
Так как af/ = u/-U/, то базис A2) является ортонормированным
тогда и лишь тогда, когда А = Е.
Если A2) — ортонормированный базис пространства V, а ко-
координатные столбцы векторов а и Ь соответственно:
Х = [хх х2 ... хп]т, Y = \yx у2 ... Уп]ту
117
то
i=\
(в случае евклидова пространства х = хь). Условие ортогонально-
ортогональности векторов а и b в ортонормированном базисе принимает вид
++ + О
Таким образом, в ортонормированном базисе упрощаются многие
вычисления.
23.7. Связь между ортонормированными базисами
Пусть заданы два базиса евклидова (унитарного) пространства:
е,, е2, ... , е„ A)
и
u,, u2, ... , un, B)
причем система A) —ортонормированный базис. Пусть, далее,
С— матрица перехода от базиса A) к базису B). Тогда, как было
показано в § 23.4, в базисе B) скалярное произведение имеет
матрицу С*ЕС = С*С (в случае евклидова пространства С* = Ст).
Для того чтобы базис B) был ортонормирован, необходимо и до-
достаточно, чтобы в этом базисе скалярное произведение имело еди-
единичную матрицу. Следовательно, верна
Теорема 23.8. Пусть A) — ортонормированный базис евкли-
евклидова (унитарного) пространства, С — матрица перехода от базиса
A) к базису B). Базис B) ортонормирован тогда и лишь тогда,
когда матрица С удовлетворяет условиям:
СТС = Е C)
в случае евклидова пространства и
С*С = Е D)
в случае унитарного пространства.
Определение 23.11. Действительная матрица С, удовлетво-
удовлетворяющая равенству C), называется ортогональной. Комплексная
матрица С, удовлетворяющая условию D), называется унитарной.
Из равенства C) вытекает условие ортогональности действи-
действительной матрицы: действительная матрица
С = [ац], /, /=1, 2, ..., л, E)
ортогональна тогда и только тогда, когда имеют место следующие
равенства:
п
2 aijaik = bik, U *=1. 2, ..., az,
-* « _Я' еСЛИ 1 = ^у
г е ik |д если 1фк
118
Пример 23.13. Матрицы
[cos ф — sin ф"| П 01
sin ф cos (pj и L0 — 1J
ортогональны.
Аналогично формулируется условие унитарности комплексной
матрицы: комплексная матрица E) унитарна тогда и только тогда,
когда верны следующие равенства:
п
2 а|7а,-* = 6,-*, /, k=l, 2, ..., п.
i= I
Доказательства этих утверждений мы предлагаем читателю в
качестве упражнения.
Упражнения
1. Докажите, что множество ортогональных (унитарных) матриц фиксирован-
фиксированного порядка является группой относительно умножения матриц.
2. Найдите все ортогональные матрицы четвертого порядка с первой строкой
/1111)
V 2 2 2 2 /'
23.8. Ортогональное дополнение подпространства
Определение 23.12. Пусть U — подпространство евклидова
(унитарного) пространства V. Множество U1- всех векторов про-
пространства V', ортогональных каждому вектору из подпространства
U, называется ортогональным дополнением подпространства U.
Теорема 23.9. Для любого подпространства U пространства V
множество U±также является подпространством. Если U — нетри-
нетривиальное подпространство и V — конечномерное, то
±. A)
>Множество U1- — непустое, так как 0 6 ?/L. Далее, пусть а,
b 6 U±, а, Р — числа из основного поля. Для любого вектора и из (У
и • (аа + pb) = а(и • а) + Р(и • Ь) = 0. Следовательно, аа + РЬ 6 U±-
Доказано, что U1- — подпространство пространства V.
Пусть теперь U — нетривиальное подпространство простран-
пространства V и V конечномерно. В подпространстве U выберем ортого-
ортогональный базис u,, u2, ..., Пщ и дополним его до ортогонального ба-
базиса ui, u2, ..., um, vm + i, ..., vn пространства V. Ясно, что V ==
= ?/®L(vm + i, ..., vn). Остается доказать равенство
L(vw + I, -., vn)=U±. B)
Очевидно, что каждый вектор линейной оболочки B) ортогона-
ортогонален подпространству U. Пусть теперь
V = Cb1U1 +••• +amUm+ pm+lVw+i + ... + PnVn 6 U±-
Тогда
U/.v = 0, /= 1, 2, ... , m. C)
119
Из равенства C) следует а«(и« • и,-) = 0, а/ = О, /=1, 2, ... , т,
v?L(vm + b •••> v«)- Равенство B) доказано.^
Следствие 23.4. dim(t/-L) = dim V — dim U.
Определение 23.13. Каждый вектор а? К, согласно формуле
A), однозначно представляется в виде a = b-f-c, b 6 U, c^t/-1.
Вектор b называется ортогональной проекцией вектора а на под-
подпространство U.
Упражнения
1. Пусть Ux, U2—подпространства я-мерного евклидова (унитарного) прост-
пространства V. Докажите, что: a) (U^I- = Uх\ б) (Ux -f б^)-1 = U^ П ^г1; в) (U\ f) ^)х =
= U^ + UJ-; г) V-L ={0); д) {OJ-L = К.
2. Подпространство (У задано системой линейных уравнений
х 2 + з — *4 = 0,
Зл:, + 2х2 2
3*! + х2-\- 9х3
— *4 = 0, ^
— 2х4 = 0, [
— х4 = 0. )
Найдите систему линейных уравнений, задающую ортогональное дополнение
24. ЛИНЕЙНЫЕ ОПЕРАТОРЫ ЕВКЛИДОВЫХ И УНИТАРНЫХ
ПРОСТРАНСТВ
В этой главе изучаются некоторые важные классы линейных
операторов евклидова и унитарного пространств.
24.1. Изоморфизмы евклидовых пространств
В § 19.4 было введено понятие изоморфизма линейных прост-
пространств над одним и тем же полем. Пусть V и V — два таких
пространства. Биективное отображение f: V-+V называется изо-
изоморфизмом линейного пространства V на линейное пространство
V, если / сохраняет операции сложения векторов и умножения
вектора на число. Это означает, что для любых векторов а и b про-
пространства V и любого числа а из основного поля
/(a + b) = f(a) + /(b), f(aa) = cc/(a).
Пусть теперь V и V — евклидовы пространства, т. е. линейные
пространства над полем действительных чисел R, на каждом из
которых определено соответствующее скалярное произведение.
Определение 24.1. Изоморфизм линейных пространств f:
V-+V называется изоморфизмом евклидова пространства V на
евклидово пространство V', если он сохраняет скалярное произ-
произведение векторов, т. е. для любых a, b 6 V верно равенство Да)/(Ь) =
= ab.
Легко проверить, что отношение изоморфизма евклидовых про-
пространств есть отношение эквивалентности на множестве всех евкли-
евклидовых пространств, а именно:
1) всякое евклидово пространство изоморфно самому себе;
2) если f: V-+V' — изоморфизм евклидовых пространств, то и
/-1: V-+V — изоморфизм евклидовых пространств;
120
3) если /: V-+V и g: V-+V" — изоморфизмы евклидовых про-
пространств, то и gf\ V-+V" — изоморфизм евклидовых пространств.
Понятие изоморфизма евклидовых пространств позволяет вы-
выделять одинаково «устроенные» евклидовы пространства. С точки
зрения аксиоматической теории, изоморфные пространства разли-
различаются лишь обозначениями и названиями своих элементов.
Следующая принципиально важная теорема утверждает изо-
изоморфизм любых двух евклидовых пространств одинаковой раз-
размерности.
Теорема 24.1. Два евклидовых пространства изоморфны тогда
и только тогда, когда их размерности совпадают.
^ Пусть V и V — изоморфные евклидовы пространства, тогда
они изоморфны и как линейные пространства. Поэтому, согласно
следствию 19.2, их размерности совпадают.
Пусть, обратно, V и V — евклидовы пространства одинаковой
размерности п. Необходимо построить изоморфизм евклидовых
Пространств /: V-+V. Для этого выберем в пространствах V и V
какие-либо ортонормированные базисы
е„ е2, ..., е„ A)
е{, е?, ..., е;. B)
Каждому вектору а 6 V с координатами а{, а2, ... , ап в базисе A)
поставим в соответствие вектор а' 6 V' с такими же координатами
в базисе B). Полученное отображение /: V-+V является изомор-
изоморфизмом линейных пространств, согласно теореме 19.1 и лемме
19.1. Итак, если
а = а,е, + а2е2 + ••• + апеп,
то
/(a) = a,ef + а2е'2 +... + апе'п.
Проверим, сохраняет ли f скалярное произведение векторов.
Пусть
ъ = ахех +а2е2 + ... + апеп, Ъ = Ь1е1 + Ь2е2 + - + Ьп*п-
Тогда
/(а) = ахе\ + а^2 + ... + апе'п, f(b) = Ьхе[ + Ъ2*'2 + ... + Ьпе'п,
и с учетом ортонормированности базисов A) и B) имеем:
Да)ДЬ) = axbx + a2b2 + ...+ anbn = ab.^
Так как при изоморфизмах евклидовых пространств сохраняется
скалярное произведение, то должны сохраняться длины векторов
и их ортогональность. Поэтому изоморфизм евклидовых пространств
f: V-+V переводит любой ортонормированный базис пространства
V в ортонормированный базис пространства V'.
Обратно, справедлива
Теорема 24.2. Пусть f: V-+V — линейный оператор евклидова
пространства V в евклидово пространство V. Если образы всех
121
векторов какого-либо ортоноржированного базиса пространства V
составляют ортонормированный базис пространства V, то f —
изоморфизм евклидовых пространств.
> Пусть заданы ортонормированный базис пространства V
еь е2, ... , е„ C)
и ортонормированный базис пространства V
/(е,), /(е2), ..., f(en). D)
Так как / — линейный оператор, переводящий базис V в базис
V', то /: V-+V — изоморфизм линейных пространств. Остается про-
проверить, что / сохраняет скалярное произведение.
Пусть а и b — произвольные векторы пространства V. Тогда если
а = а1е1 + а2е2+ ... + а„е„, Ъ = Ь1е1 + Ь2е2 + ... + 6лел,
то в силу линейности /
/(а) = а, Де,) + a2f (е2) + ... + anf(en\
Из условия ортонормированности базисов C) и D) следует, что
= axbx + a2b2 + ... + anbn = ab. ^
Здесь и далее произвольное /г-мерное евклидово пространство
будем обозначать Еп
Упражнения
1. Покажите, что если V и V — евклидовы пространства и отображение /: V-+- V
сюръективно и сохраняет скалярное произведение, то оно является изоморфизмом
линейных пространств, а следовательно, изоморфизмом евклидовых пространств.
2. Докажите, что если V и V — евклидовы пространства и линейный оператор
f- у-+у сюръективен и сохраняет длины векторов, то он является изоморфизмом
евклидовых пространств. Покажите на примере, что в этом случае условием линей-
линейности f нельзя пренебречь.
24.2. Сопряженный оператор
Сопряженный оператор играет важную роль при изучении ли-
линейных операторов евклидовых пространств.
Напомним некоторые сведения о линейных функциях на прост-
пространстве Еп, при этом будем рассматривать его как линейное прост-
пространство (см. § 23.1). Каждая такая функция а есть отображение
a: ?"~^R, для которого а(а + Ь) = а(а) + а(Ь), а(А,а) = Ал(а) при
любых at b 6 Еп и любом А,? R. Множество всех линейных функций
на Еп превращается в линейное пространство над полем R, если опре-
определить сумму функций с помощью формулы (а + р)(а) = а(а) +
+ р(а), а умножение функции на число — с помощью формулы
(Я,а)(а) = А,а(а). Это линейное пространство также имеет размер-
размерность п. Оно называется сопряженным пространству Еп и обозна-
обозначается (?")*. Таким образом, dim(Z:")* = dim En.
122
Наличие скалярного произведения на линейном пространстве
позволяет сопоставить каждому вектору а.?Еп некоторую вполне
определенную линейную функцию а?(Еп)*, а именно: a(b) = ab
для любого Ъ?Еп. Проверим линейность функции а, пользуясь
свойствами скалярного произведения:
a(b, + b2) = a(b, + b2) = ab, + ab2 = а(Ь,) + а(Ь2),
= ЦзЬ) =
Обратно, справедливо
Предложение 24.1. Для всякой линейной функции а ? (?"")* су-
существует единственный вектор &?Еп, такой, что a(b) = ab при лю-
любом b 6 Еп.
> Рассмотрим отображение ср: Еп-*(Еп)*, которое переводит лю-
любой вектор г.?Еп в соответствующую ему линейную функцию а,
т. е. ф(а)(Ь) = ab для любого b ? Еп. Покажем, что ф — изоморфизм
линейных пространств.
Проверим линейность ф. Для любого Ь?Еп
Ф(а! + а2) (Ь) = (а, + a2)b = a}b + a2b =
= Ф(а,) (Ь) + Ф(а2) (Ь) = (ф(а,) + Ф(а2)) (Ь).
Это означает, что ф(а, + а2)= ф(а!) + ф(а2). Далее, при любом
ъеЕп
) (Ь) = (Ла)Ь = Л(аЬ) = Хф) (Ь) = (Лф(а)) (Ь),
так что ф(А,а) = ()
Для проверки инъективности отображения ф достаточно пока-
показать, что Кег ф = {0}.
Пусть а 6 Кег ф, т. е. ф(а) — нулевая линейная функция. Тогда
ф(а)(а) = 0. С другой стороны, ф(а)(а) = аа. Так как аа>>0 при
а^О, то а = 0. Это и означает, что Кегф = {0}.
Мы видим, что ф: Еп-*(Еп)* — инъективный линейный оператор.
Поэтому ф(?л) — n-мерное подпространство в (?")*, следовательно,
ц)(Еп) = (Еп)*. Это означает, что ф сюръективен и является изомор-
изоморфизмом линейных пространств. Наше предложение вытекает теперь
из биективности ф, так как в этом случае для линейной функции а
существует единственный вектор а??", такой, что ф(а) = а, и ра-
равенство ф(а)(Ь) = аЬ записывается в виде a(b) = ab. ^
Пусть / — некоторый линейный оператор пространства Еп. За-
Зафиксируем вектор а??" и рассмотрим функцию a: ?"->R, такую,
что a(b) = a/(b) для любого b 6 Еп. Ясно, что а зависит от выбора а.
Из линейности / и свойств скалярного произведения следует, что
а — линейная функция (проверьте!). Поэтому, согласно предложе-
предложению 24.1, существует единственный вектор ъ'?Еп, для которого
a(b) = a'b при любом b 6 Еп. Следовательно, каждому вектору а 6 Еп
соответствует единственный вектор а' 6 Епу т. е. определено некото-
некоторое преобразование /*: Еп-*Еп, такое, что /*(а) = а/. Преобразова-
Преобразования / и /* связаны соотношением
A)
123
Покажем, что /* — линейный оператор. Для любого Ъ?Еп
На, + а2)Ь = (а, + а2)/(Ь) = а,/(Ь) + a2f (b) =
= /*(а,)Ь + /*(а2)Ь = (/• (а,) + f*(a2))b.
Мы видим, что линейные функции, соответствующие векторам
/*(а! + а2) и /*(ai) +/*(аг)> совпадают. Поэтому, согласно предло-
предложению 24.1, /*(а1 + а2) = /*(а1) + /*(а2).
Аналогично
/•(Ла)Ь = (Ла)/(Ь) = Л(а/(Ь)) = М/*(а)Ь) = (Л/*(а))Ь,
откуда /*(А,а) = А,/*(а).
Приведенные рассуждения доказывают
Предложение 24.2. Для каждого линейного оператора f: Еп-*Еп
существует единственное преобразование /*: Еп-+Еп, удовлетворяю-
удовлетворяющее условию A) при любых a, b 6 Еп. При этом f* — тоже линейный
оператор.
Оператор /* называется сопряженным оператору /.
Предложение 24.3. Для любых линейных операторов fug
пространства Еп
= g*f*, (f*)* = f.
> Для любых векторов а, Ъ?Еп
()() /(())
= g*(Ha))b = (g*f*) (a)b.
Это означает, что (/^)*(a) = (g*/*)(a) для любого а??п, т. е. (fg)* =
=g*t*.
Аналогично
(/*)*(a)b = а/*(Ь) = /*(Ь)а = Ь/(а) = /(а)Ь,
откуда (/*)*(а) = /(а) для любого a?F\ т. е. (/*)* = /.^
Следующая теорема играет в дальнейшем важную роль.
Теорема 24.3. Пусть /: Еп-+Еп — линейный оператор и W —
подпространство пространства Еп. Если W инвариантно относи-
относительно \, то его ортогональное дополнение W1^ инвариантно отно-
относительно /*.
> Пусть W инвариантно относительно /. Покажем, что /*(№-L)cz
с= W-1. Рассмотрим произвольный вектор а 6 W±. При любом b С W
/*(а)Ь = а/(Ь) = 0,так как /(bN W.3to и означает, что /*(а)? WXA
В заключение выясним, как связаны между собой матрицы опе-
операторов / и /* в одном и том же ортонормированном базисе про-
пространства Еп.
Теорема 24.4. Пусть А и В — матрицы линейных операторов f и
f* в произвольном ортонормированном базисе пространства Еп. Тогда
В получается из А с помощью операции транспонирования, т. е.
В = АТ.
> Пусть еь е2, ..., еп — ортонормированный базис Епу в котором
124
преобразования f к f* имеют матрицы А = [а<7] и В = [bi}]. Это озна-
п п
чает, что f(tj)= 2 а/уе,-, /*(е,-)= 2 6,-е,-.
/=1 *'=1
п
Заметим, что если а = 2 а,е,, то а, = ае,. Поэтому
Ъц = /*(е/)е/ = еу/(ес) = /(е,-)е, = а/7,
т. е. В = АТ.<4
Упражнения
1. Докажите предложение 24.3, пользуясь теоремой 24.4 и свойствами операции
транспонирования.
2. Докажите, что (/""')* = (/*)"' для любого невырожденного линейного опера-
оператора f.
3. Пусть / и g — линейные операторы пространства Еп. Докажите, что (f + g)* —
24.3. Ортогональные операторы
В .этом параграфе изучается важнейший класс операторов евкли-
евклидовых пространств — ортогональные операторы.
Понятие ортогонального оператора является частным случаем
более общего понятия изоморфизма евклидовых пространств.
Определение 24.2. Изоморфизм евклидова пространства Еп
на себя называется ортогональным оператором пространства Еп.
Ясно, что ортогональный оператор является линейным и сохраняет
скалярное произведение. Верно и обратное.
Предложение 24.4. Линейный оператор f: En-*En является орто-
ортогональным оператором пространства Еп тогда и только тогда, когда
f сохраняет скалярное произведение, т. е. /(a)/(b) = ab для любых
векторов a, b 6 Еп.
> Пусть линейный оператор /: Еп-*Еп сохраняет скалярное про-
произведение. Покажем, что / имеет нулевое ядро. Действительно, если
Да) = 0, то аа = /(а)/(а) = 00 = 0, откуда а = О. Это означает, что
/ — невырожденный линейный оператор. Так как он сохраняет ска-
скалярное произведение, то / — изоморфизм евклидова пространства
Еп на себя, т. е. ортогональный оператор.-^
Следующее предложение вытекает из свойств изоморфизмов
евклидовых пространств (см. § 24.1).
Предложение 24.5. Ортогональный оператор f: En-+En перево-
переводит любой ортонормированный базис пространства Еп в ортонор-
ортонормированный базис. Обратно, если линейный оператор f: En-+En
переводит некоторый ортонормированный базис пространства Еп в
ортонормированный базис, то f ортогонален.
Теорема 24.5. Линейный оператор f: En-+En является ортого-
ортогональным тогда и только тогда, когда f*f = еу где е — тождественное
преобразование.
^Согласно предложению 24.4, ортогональность преобразования
125
равносильна сохранению им скалярного произведения: для любых
ИЬ аЬ. A)
Так как /(a)/(b)==/*(/(a))b ==(/*/)(а)Ь, то равенство A) равно-
равносильно условию (/*/)(a)b = ab для любых аи Ь. Последнее условие
в свою очередь выполняется тогда и лишь тогда, когда (/*/)(а) = а
для каждого а ? Еп, т. е. /*/ = е. ^
Из теоремы 24.5 в качестве простого следствия вытекает
Теорема 24.6. Линейный оператор евклидова пространства яв-
является ортогональным тогда и только тогда, когда его матрица в
ортонормированном базисе ортогональна.
>По теореме 24.5 ортогональность линейного оператора /: Еп->
->Еп равносильна условию
f*f = e. B)
Если А — матрица оператора / в ортонормированном базисе Еп,
то /* в этом же базисе имеет матрицу Ат (см. теорему 24.4). Усло-
Условие B) можно переписать в матричной форме:
АТА=Е. C)
Остается заметить, что равенство C) означает ортогональность
матрицы Л.^
Теорема 24.7. Множество всех ортогональных операторов евкли-
евклидова пространства Еп образует группу преобразований простран-
пространства Еп, изоморфную группе всех ортогональных матриц порядка п.
^Пусть / и g— произвольные ортогональные операторы про-
пространства Еп. Тогда по определению / и g— изоморфизмы евклидова
пространства Еп на себя, следовательно, gf, / также являются
изоморфизмами (см. § 24.1). Итак, gf и f~l — ортогональные опера-
операторы пространства Еп. Это и означает, что мы имеем дело с группой
преобразований.
Зафиксируем ортонормированный базис Еп и сопоставим с каж-
каждым ортогональным оператором Еп его матрицу в выбранном базисе.
Из теоремы 24.6 следует, что тем самым установлено взаимно одно-
однозначное соответствие между группой ортогональных операторов Еп
и группой ортогональных матриц порядка п. Так как произведению
двух линейных операторов отвечает произведение их матриц, пост-
построенное отображение есть искомый изоморфизм.^
Установленная связь между ортогональными операторами и орто-
ортогональными матрицами позволяет детально исследовать произволь-
произвольный ортогональный оператор л-мерного евклидова пространства.
А это в свою очередь приводит к соответствующему утверждению
для ортогональных матриц.
В основе дальнейших рассуждений лежит следующая
Теорема 24.8. Если подпространство W инвариантно относитель-
относительно ортогонального оператора \, то ортогональное дополнение W^~
также инвариантно относительно f.
^ По теореме 24.& из инвариантности подпространства W отно-
126
сительно оператора / следует инвариантность W1- относительно /*.
Так как / — ортогональный оператор, то/*/ = е, т. е. /* = f~l. Значит,
W1- инвариантно относительно оператора f~l, а потому и относи-
относительно /.^|
Лемма 24.1. Для любого линейного оператора f действительного
конечномерного ненулевого линейного пространства V существует
инвариантное относительно f одномерное или двумерное под-
подпространство.
> Если в пространстве V существует собственный вектор а
оператора /, то, как показано в § 19.11, линейная оболочка L(a) —
одномерное инвариантное относительно / подпространство.
Пусть оператор / не имеет собственных векторов. Тогда его
характеристический многочлен не имеет действительных корней
(см. § 19.11). Рассмотрим минимальный многочлен пг(х) оператора /.
Поскольку пг(х) является делителем характеристического многочле-
многочлена, то ш(х) не имеет действительных корней. Но многочлен степени
выше второй приводим над R, следовательно, пг(х) делится на
некоторый многочлен второй степени. Итак, m(x) = c(x)b(x), где
с(х) = x2 + px + q, /?, q ? R.
Так как deg b(x)<. degm(x)y то Ь(()Ф0— ненулевой линейный
оператор. Но тогда и b(f)(V) = U — ненулевое подпространство.
Возьмем в U произвольный ненулевой вектор v и положим W —
= L(v, /(v)). Вектор v не является собственным относительно /,
поэтому подпространство W двумерно. Остается доказать его инва-
инвариантность относительно оператора /.
Вектор v можно представить в виде v = ft(/)(a), где а ? 1/, так что
() = (c(f)b(f))(a) = m(/)(a) = 0(а) = 0. С другой стороны, c(f) (v) =
) + p/(v) + <7v. Итак,
/2(v) + p/(v) + qv= 0, /2(v) = -p/(v) - qv € W.
Теперь очевидно, что подпространство W инвариантно относи-
относительно /.^
Из теоремы 24.8 и леммы 24.1 следует
Теорема 24.9. Пусть f — ортогональный оператор евклидова про-
пространства Еп. Тогда Еп — прямая сумма попарно ортогональных
одномерных или двумерных подпространств, инвариантных отно-
относительно /.
> Воспользуемся индукцией по п. При п ^ 2 теорема очевидна.
Пусть п > 2 и теорема верна для евклидовых пространств, размер-
размерность которых меньше п.
Если W\ — одномерное или двумерное инвариантное относитель-
относительно / подпространство, то
D)
и подпространство W\~ также инвариантно относительно /. Огра-
Ограничение /i оператора / на подпространство W\~ линейно и сохраняет
скалярное произведение. Поэтому, согласно предложению 24.4,
/i — ортогональный оператор пространства W\~. Так как dim W\- <
< dim En = я, то, по индуктивному предположению, подпространство
127
W\~ является прямой суммой попарно ортогональных одномерных
или двумерных подпространств W^, инвариантных относитель-
относительно /,:
Wf- = W2®...® ^s. E)
Ясно, что все эти подпространства инвариантны и относительно
преобразования /. Из разложений D) и E) следует, что
Рп — 117. /Фк XV/п /Фк /Фк XV/ ((\\
is — w | vjy " 2 чС • • • чС " s* V /
Очевидно, что F) — искомое разложение пространства Еп на
инвариантные относительно / подпространства.^
Теорема 24.9 сводит описание ортогональных операторов м-мер-
ного евклидова пространства к случаю п ^ 2.
Нам понадобятся следующие два предложения.
Предложение 24.6. Собственные значения ортогонального опе-
оператора равны ± 1 •
> Пусть а — собственный вектор и А, — соответствующее ему
собственное значение ортогонального оператора /. Тогда
аа = /(а)/(а) = (А,а) (А,а) = А,2(аа).
Так как а Ф О, то аа Ф О, следовательно, А,2 = 1, откуда к= ± 1 -М
Предложение 24.7. Определитель ортогональной матрицы ра-
равен ± 1.
> Из равенства АТА=Е, где Е — единичная матрица, следует,
что \АТА\ = 1. Но \АТА\ = \АТ\ \А\ = \А\ \А\ = \А\2. Значит,
IА |2 = 1, откуда | А | = ± 1. ^
Перейдем к описанию ортогональных операторов одномерных
и двумерных евклидовых пространств.
Предложение 24.8. Существуют только два ортогональных опера-
оператора евклидова пространства Ех:
1) тождественное преобразование;
2) преобразование, переводящее каждый вектор в противопо-
противоположный.
> Пусть /—произвольный ортогональный оператор пространст-
пространства Ех. В силу одномерности пространства Ех каждый его вектор
является собственным вектором оператора /, соответствующим
одному и тому же собственному значению А,. Согласно предложению
24.6, i=zhl. Если А,= 1, то / — тождественное преобразование.
Если же А,= — 1, то /(а)= —а для каждого а 6 Ех.^
Предложение 24.9. Любой ортогональный оператор евклидова
пространства Е2 имеет в подходящем ортонормированном базисе
либо матрицу
Г1 О
128
либо матрицу вида
Гсоз
[sin
созф -sirup! (g
> Выберем в пространстве Е2 какой-либо ортонормированный
базис. Пусть А — матрица произвольного ортогонального опера-
оператора /: Е2-+Е2 в этом базисе. Мы знаем, что матрица А ортогональна
и |Л| = ±1.
Рассмотрим сначала случай |Л| = —1. Характеристический
многочлен матрицы А имеет вид х2-\-рх— 1 и различные действи-
действительные корни A,i, А,2. Это означает, что у оператора / есть ровно два
собственных значения к\, А,2. Поэтому на основании предложе-
предложения 24.6 A,i = 1, А,2= — 1.
Пусть ei и е2 — собственные векторы оператора /, отвечающие
собственным значениям К\ и А,2. Можно считать, что |eil = |е2| = 1.
Покажем, что векторы d и е2 ортогональны. Действительно,
eie2 = /(ei)/(e2) = ei( —е2)= —eie2,
откуда de2 = 0.
Итак, d, е2 — ортонормированный базис пространства Е2 и оче-
очевидно, что / имеет в этом базисе матрицу G).
Пусть теперь | А | = 1. Если
А\аи аХ2\
La2i a22j'
то
а\\а22 — ^12^21 = 1, (9)
и из ортогональности матрицы А следует, что
a?,+ai, = l, (Ю)
0. A1)
ф= 1, )
ф = 0. /
В силу равенства A0) аи и а2\ можно представить в виде
ах, == cos ф, а2Х = sin ф для некоторого ф 6 R- Соотношения (9) и A1)
приводят к системе линейных уравнений относительно неизвестных
#12, #22-
а22со5ф —ai2sin ф=
а22 sin ф + аХ2 cos
Эта система имеет единственное решение: а\2= —sin ф, а22 = со5ф.
Значит, Л —матрица вида (8).<^
Предложения 24.8 и 24.9 вместе с теоремой 24.9 позволяют
описать произвольный ортогональный оператор я-мерного евклидова
пространства.
Теорема 24.10. Для любого ортогонального оператора f: En-+En
существует ортонормированный базис пространства Еп, в котором f
имеет матрицу вида
9. Зак. 6466 129
J
-1
coscpi
sin ф1
-sin ф1
СОЭф!
COS <
sin (
-Sin ф/г
COS Wb
. A2)
>Согласно теореме 24.9, Еп = Wx © W2 © ... © Ws — прямая
сумма попарно ортогональных одномерных или двумерных под-
подпространств, инвариантных относительно /. Ограничение оператора
/ на каждое такое подпространство Wiy /=1,2, ..., s, есть ортогональ-
ортогональный оператор. Согласно предложениям 24.8 и 24.9, можно указать
ортонормированный базис подпространства Wi, в котором это ограни-
ограничение имеет матрицу А вида ±1, если dim UP,-=1, и вида G)
(или (8)), если dim Wt = 2. Объединив такие базисы подпространств
Wi, i— I, 2, ..., 5, получим ортонормированный базис пространства
?п, в котором оператор / имеет клеточно-диагональную матрицу
diag[/4i, Л2, ..., As]. Изменяя при необходимости порядок векторов
этого базиса, получаем искомый ортонормированный базис прост-
пространства Еп.<Ц
Теорема 24.10 позволяет получить соответствующий результат
для ортогональных матриц.
Теорема 24.11. Любая ортогональная матрица А порядка п орто-
ортогонально подобна некоторой ортогональной матрице В вида A2).
Другими словами, для любой ортогональной матрицы А существует
такая ортогональная матрица С, что С~хАС = В — матрица ви-
вида A2).
> В я-мерном евклидовом пространстве Еп зафиксируем какой-
либо ортонормированный базис и рассмотрим линейный оператор
/: Еп-+Еп, который в этом базисе имеет матрицу А. Согласно теоре-
теореме 24.6, / — ортогональный оператор. По теореме 24.10 найдется
ортонормированный базис пространства Еп, в котором / имеет мат-
матрицу В вида A2). Если С — матрица перехода от первого базиса ко
второму, то С~1АС = В. Остается отметить, что матрица перехода,
связывающая два ортонормированных базиса, является ортого-
ортогональной.^
Упражнения
1. Докажите, что если два вектора a, b евклидова пространства имеют одина-
одинаковую длину, то существует ортогональный оператор /, переводящий а в Ь.
2. Покажите, что всякое преобразование /: Еп-+Еп, сохраняющее скалярное
произведение, линейно и, следовательно, является ортогональным оператором прост-
пространства Еп.
3. Докажите теорему 24.6, пользуясь лишь предложением 24.5 и определением
матрицы линейного оператора.
130
4. Докажите теорему 24.8, пользуясь лишь определением ортогонального опера-
оператора и простейшими свойствами линейных операторов.
5. Докажите, что всякая осевая симметрия плоскости определяет линейный
оператор векторов этой плоскости, который в подходящем ортонормированном
базисе имеет матрицу вида G).
6. Докажите, что всякий поворот плоскости на угол ф определяет линейный
оператор векторов этой плоскости, который в подходящем ортонормированном
базисе имеет матрицу вида (8).
24.4. Самосопряженные операторы
Самосопряженные операторы образуют еще один важный класс
операторов евклидова пространства.
Определение 24.3. Линейный оператор f пространства Еп
называется самосопряженным, если он совпадает со своим сопряжен-
сопряженным оператором /*, т. е. если /(a)b = a/(b) для любой пары
векторов a, b 6 Еп.
Теорема 24.12. Линейный оператор является самосопряженным
тогда и только тогда, когда его матрица А в ортонормированном
базисе удовлетворяет условию Ат = А, т. е. является симметрической.
> Пусть А — матрица линейного преобразования / в ортонор-
ортонормированном базисе. Тогда оператор /* имеет в этом базисе матрицу
Ат. Остается заметить, что равенства / = /* и А = Ат равносильны.^
Теорема 24.13. Если подпространство W инвариантно относи-
относительно самосопряженного оператора f, то ортогональное дополне-
дополнение W1- также инвариантно относительно /.
> Согласно теореме 24.3, W1- инвариантно относительно /*, а
Теорема 24.13 позволяет исследовать произвольный самосопря-
самосопряженный оператор с помощью метода, которым мы уже пользовались
при изучении ортогональных операторов.
Теорема 24.14. Для любого самосопряженного линейного опера-
оператора f пространства Еп существует одномерное инвариантное отно-
относительно f подпространство.
> По лемме 24.1 существует инвариантное относительно / одно-
одномерное или двумерное подпространство WaEn. Если d\mW=\,
теорема верна. Пусть dim W = 2. Обозначим через /i ограничение
оператора / на W. Очевидно, что /i — самосопряженный оператор
подпространства W. Выберем произвольный ортонормированный
базис подпространства W. Оператор /i имеет в этом базисе некоторую
симметрическую матрицу
аи aX2\
над полем R. Ее характеристический многочлен X2 — (аи + #22)^ +
+ (#п#22 — а\2J имеет действительные корни (проверьте!). Это озна-
означает, что существует собственный вектор оператора /i, который
будет собственным вектором и исходного оператора /.
Одномерное подпространство, натянутое на этот вектор, является
искомым инвариантным относительно / подпространством.^
131
Следующая теорема вытекает из теорем 24.13 и 24.14. Ее дока-
доказательство аналогично доказательству теоремы 24.9 для ортогональ-
ортогональных преобразований, и поэтому мы предлагаем его читателю в ка-
качестве упражнения.
Теорема 24.15. Пусть f — самосопряженный линейный оператор
евклидова пространства Еп. Тогда Еп есть прямая сумма попарно
ортогональных одномерных подпространств, инвариантных относи-
относительно /.
Так как каждый ненулевой вектор инвариантного относительно
линейного оператора / одномерного подпространства является соб-
собственным вектором этого оператора, то справедлива
Теорема 24.16. Для любого самосопряженного линейного опера-
оператора f пространства Еп существует ортонормированный базис
пространства Еп, состоящий из собственных векторов оператора /.
Очевидно, что в этом базисе оператор f имеет диагональную матрицу.
Из теоремы 24.16 легко получается соответствующее утвержде-
утверждение для симметрических матриц.
Теорема 24.17. Любая действительная симметрическая матрица
ортогонально подобна некоторой диагональной матрице. Другими
словами, для любой действительной симметрической матрицы А су-
существует такая ортогональная матрица С, что С~~1 АС = В — диаго-
диагональная матрица.
Доказательство теоремы 24.17 почти дословно повторяет дока-
доказательство теоремы 24.11 для ортогональных матриц. В качестве
следствия из теоремы 24.17 получаем следующее утверждение.
Теорема 24.18. Все корни характеристического многочлена дейст-
действительной симметрической матрицы действительны.
Упражнения
1. Докажите ортогональность любых двух собственных векторов самосопряжен-
самосопряженного преобразования, относящихся к различным собственным значениям.
2. Докажите, что произведение fg самосопряженных операторов / и g является
самосопряженным тогда и только тогда, когда fg — gf.
3. Докажите, что если / и g — самосопряженные операторы, то самосопряжен-
самосопряженным будет и оператор fg-\-gf.
4. Пусть / и g — самосопряженные операторы евклидова пространства Еп.
Докажите, что перестановочность операторов fug равносильна существованию
ортонормированного базиса пространства Еп, каждый элемент которого является
собственным вектором и для /, и для g.
24.5. Разложение линейного оператора в произведение
ортогонального и самосопряженного операторов
Несмотря на то что ортогональные и самосопряженные операто-
операторы пространства Еп — это линейные операторы специального вида,
всякий линейный оператор /: Еп-+Еп можно представить в виде
произведения двух подходящих операторов: ортогонального и само-
самосопряженного.
Предположим, что искомое разложение существует:
l = hg, A)
132
где h — ортогональный оператор; g— самосопряженный оператор,
т. е. h* = h~\ g* = g. Тогда /* = (hg)* = g*h* = gh~{ и /*/ =
= {ёЬ~~1)№) = g • Следовательно, из существования разложе-
разложения A) вытекает, что
g* = fV- B)
Рассмотрим более внимательно произведение /*/.
Предложение 24.10. Для произвольного линейного оператора f
пространства Еп произведение /*/ — самосопряженный оператор, все
собственные значения которого неотрицательны.
> Так как (/*/)* = /*(/*)*=/*/, то /*/ — самосопряженный
оператор. Пусть, далее, К — собственное значение преобразования
/*/, а — соответствующий собственный вектор. Тогда
(/*/)(а)а = (Яа)а = Маа).
С другой стороны,
(И)(а)а = Р(Да))а = /(а)/(а).
Следовательно, А,(аа) = /(а)/(а). Так как аа>0 и /(а)/(а) ^ О, то
Предложение 24.10 позволяет доказать существование само-
самосопряженного оператора g, удовлетворяющего условию B). В самом
деле, так как оператор /*/ — самосопряженный, то существует
ортонормированный базис пространства Епу состоящий из собствен-
собственных векторов оператора /*/. В этом базисе /*/ имеет диагональную
матрицу
A = diag[A,i, A.2, •••, К\
где h — действительные неотрицательные числа. Пусть
Очевидно, что В2 = А. Обозначим через g линейный оператор
пространства Еп с матрицей В в рассматриваемом базисе. Тогда
g^ = f*fj и так как В — симметрическая матрица, то оператор
g — самосопряженный.
Поскольку можно указать несколько различных диагональных
матриц, квадрат которых равен матрице Л, оператор g не определя-
определяется однозначно условием B).
Отметим, что если оператор / — невырожденный, то и любой опе-
оператор g, удовлетворяющий условию B), будет невырожденным.
Вернемся к разложению A) и предположим, что оператор /
невырожден. В этом случае g тоже должен быть невырожденным
оператором, так что можно говорить об обратном операторе g~l.
Тогда h = fg~l, следовательно, h однозначно определяется преобра-
преобразованием g.
Проверим, будет ли h = fg ортогональным преобразованием,
если g — самосопряженное преобразование, удовлетворяющее
условию B):
133
Итак, h = fg l — ортогональный оператор, откуда / = hg—
искомое разложение. Доказана
Теорема 24.19. Для любого невырожденного линейного оператора
f пространства Еп существуют ортогональный оператор h и само-
самосопряженный оператор g, такие, что f = hg.
Можно показать, что теорема 24.19 остается верной и для
любого вырожденного линейного оператора.
Из доказанной теоремы вытекает неожиданное на первый взгляд
следствие.
Предложение 24.11. Для любого невырожденного линейного
оператора f пространства Еп существует ортогональный базис прост-
пространства Еп, который переводится этим оператором в ортогональный
базис.
> Пусть f = hg, где /г, g — соответственно ортогональный и
самосопряженный операторы. Из невырожденности / следует невы-
невырожденность g. По теореме 24.16 существует ортонормированный
базис пространства Еп
аь а2, ..., а„, C)
состоящий из собственных векторов оператора g. Так как g невырож-
невырожден, он переводит базис C) в некоторый базис
bi, b2, ..., Ь„, D)
причем Ь/ = А,а*. Хотя векторы Ь, не обязательно единичной длины,
они по-прежнему попарно ортогональны. Оператор h невырожден
и сохраняет углы между векторами. Поэтому он переводит ортого-
ортогональный базис D) в некоторый ортогональный базис
Ci, С2, .-., С„. E)
Ясно, что / переводит базис C) в базис E) и оба эти базиса
ортогональны.^
Теорема 24.1 У приводит к соответствующему утверждению для
матриц.
Теорема 24.20. Всякая невырожденная действительная матрица
А порядка п есть произведение ортогональной и симметрической
матриц.
> В я-мерном евклидовом пространстве Еп зафиксируем какой-
либо ортонормированиый базис и рассмотрим линейный оператор
/;: Еп-+Епу который в этом базисе имеет матрицу А. Оператор / —
невырожденный, и по теореме 24.19 / = hg, где A, g — соответственно
ортогональный и самосопряженный операторы пространства Еп.
Обозначим через В и С матрицы операторов h и g в выбранном
базисе, матрица В — ортогональная, С — симметрическая. В этом же
базисе произведение hg имеет матрицу ВС. Так как / = hg,
то А = ВС.<4
Можно показать, что теорема 24.20 остается справедливой и для
любой вырожденной действительной матрицы А.
134
24.6. Приведение действительной квадратичной формы к канони-
каноническому виду с помощью ортогонального преобразования
переменных
Свойства симметрических матриц, полученные при изучении само-
самосопряженных преобразований, находят применение в теории квадра-
квадратичных форм.
В § 22.3 доказано, что всякая действительная квадратичная
форма с помощью действительного невырожденного линейного
преобразования переменных может быть приведена к каноническому
виду. Покажем сейчас, что это преобразование можно выбрать так,
чтобы его матрица была ортогональной.
Теорема 24.21. Для всякой действительной квадратичной формы
F(x\, х2, ..., хп) существует линейное преобразование переменных
Х~ CY с ортогональной матрицей С, приводящее эту форму к кано-
каноническому виду
где hi — корни характеристического многочлена матрицы формы
F(x\, x2, ..., хп).
> Пусть Л —матрица квадратичной формы F(x\, х2у ..., хп).
Тогда А— действительная симметрическая матрица, и, согласно
теореме 24.17, существует такая ортогональная матрица С, что
С АС — диагональная матрица, на диагонали которой расположе-
расположены корни характеристического многочлена матрицы А. Применив к
квадратичной форме F{x\, х2у ..., хп) линейное преобразование
переменных X=CY, переведем ее в квадратичную форму G(yi,
Уъ ..., Уп) с матрицей В = СТАС (см. § 22.2). Так как С—ортого-
С—ортогональная матрица, то СТ = С~1 и, следовательно, В = С~1АС.
Поэтому G = Х\у2\ + Х2у2 + ••• + Kyi, где А,,- — корни характеристи-
характеристического многочлена матрицы А.^
Теорему 24.21 используют при решении следующего вопроса.
Пусть F(x\, x2y ..., хп) и G(jti, x2y ..., хп) — пара действительных
квадратичных форм от п переменных. Существует ли невырожденное
линейное преобразование переменных х\, х2у ..., хп, приводящее обе
эти формы к каноническому виду? В общем случае ответ будет
отрицательным. Однако ситуация меняется, если дополнительно
потребовать, чтобы одна из двух данных квадратичных форм была
положительно-определенной.
Имеет место
Теорема 24.22. Для любой пары действительных квадратичных
форм от п переменных, одна из которых является положительно-
определенной, существует невырожденное линейное преобразование
переменных, приводящее каждую из этих форм к каноническому
виду.
> Пусть F(x\, x2j ..., хп)—положительно-определенная квадра-
квадратичная форма. Тогда существует невырожденное линейное преоб-
преобразование переменных X = TY, приводящее F к нормальному виду
из п положительных квадратов:
F(x\, х2у ..., хп) = у\ + */2 + ..- + yl
135
Это же преобразование переменных переводит квадратичную форму
G(x\y х2у ..., хп) в некоторую форму G'(yi, у2у ..., уп)-
Согласно теореме 24.21, С можно привести к каноническому виду
с помощью подходящего ортогонального линейного преобразования
переменных
Y = CZ. A)
Оказывается, если применить это преобразование к квадратичной
форме y'i + yl + ...+ ул, получится квадратичная форма такого же
вида от переменных z\, z2, ..., zn, т. е.
м2 _1_ м2 _1_ _1_ м2 -?2 I -?2 I I -72
У\ + У2 + ••• + Уп = 2\ + Z2+ ... + Zn.
В самом деле, квадратичная форма y'i + yl + ... + у2п имеет еди-
единичную матрицу ?. После преобразования переменных A) эта форма
перейдет в новую квадратичную форму с матрицей С1ЕС = СТС = Е,
так как С — ортогональная матрица. Следовательно, линейное пре-
преобразование переменных X==(TC)Z является искомым.^
24.7. Линейные операторы унитарных пространств
Изучение линейных операторов унитарных пространств аналогич-
аналогично проведенному выше исследованию линейных операторов евклидо-
евклидовых пространств. Некоторые утверждения получают, даже более
простую форму, так как переход к комплексному полю позволяет
шире использовать собственные векторы линейных преобразований.
Пусть U и U' — унитарные пространства, т. е. линейные про-
пространства над полем С комплексных чисел, на каждом из которых
задано свое скалярное произведение (см. § 23.1). Точно так же, как и
в случае евклидовых пространств, определяется понятие изоморфиз-
изоморфизма унитарного пространства U на унитарное пространство U' и дока-
доказывается, что любые два унитарных пространства одинаковой раз-
размерности изоморфны.
Если /: U-+U' — изоморфизм унитарных пространств, то любой
ортонормированный базис пространства U переводится в ортонор-
мированный базис пространства V. Верно и обратное утверждение,
аналогичное теореме 24.2.
Доказательства всех этих фактов дословно повторяют соответ-
соответствующие доказательства для случая евклидова пространства.
Исключение составляют лишь фрагменты доказательств, в которых
используется формула, выражающая скалярное произведение векто-
векторов унитарного пространства в ортонормированном базисе:
аЬ = хху\ + х2у2 + ... + хпуп,
где хи Х2, ..., хП9 у\9 у2у ..., Уп — координаты векторов а и Ь, а черта
означает переход к комплексно-сопряженному числу.
В дальнейшем произвольное я-мерное унитарное пространство
будем обозначать Un.
Для каждого линейного оператора / пространства Un вводится
понятие сопряженного оператора /* (это удобно делать, имея в виду
предложение 24.2).
136
Определение 24.4. Линейный оператор f*: W-^U" называ-
называется сопряженным линейному оператору f: Un->-Un, если для любых
а,ъеип
/*(a)b = a/(b). A)
Для каждого линейного оператора / существует не более одного со-
сопряженного ему оператора /*. Действительно, пусть /f и /2 —линейные
операторы, сопряженные оператору /. Тогда /f (a)b = /f (a)b для лю-
любых а, Ь6 {/", откуда /*(а)Ь - /f (a)b = 0, (/*(а)- /*(а))Ь = 0. Пола-
Полагая b = /f(a) — /f(a), получаем, что /f (a) — /f (a) = 0, откуда /?(а) =
= /|(а) для любого а ? Un9 т. е. /f = /f.
Докажем существование оператора /*. Пусть et, e2, ..., е„—
произвольный ортонормированный базис пространства Un. Пусть,
далее, Л=[а/У-]—матрица преобразования / в этом базисе, Л* =
= [bij]— ее эрмитово-тран9понированная матрица, т. е. Ьц^а-^. Обо-
Обозначим через /* линейный оператор Un с матрицей А* б
базисе. Тогда
/¦(еОеу = (fti/ei + &2/е2 + ... + Ьп1еп)е-,=ЬИ = ац
е//(е/) = е^а,,*! + а2/е2 + • • ¦ + ап}еп) = ац.
Таким образом, /*(е/)е/ = е,-/(е/) для всех /, /= 1, 2, ..., п. Теперь
легко убедиться в справедливости условия A).
п п
Пусть а= 2 х,е/, Ь= 2 y^j. Имеем:
/=1 /=1
/*(a)b = ri^xfii)^Jf/ye,) =( 2х,
= 2 *j/,(f*(e,)ey);
a/(b) = ( 2 )( 2 Л
/=l
т. е. оператор f* является сопряженным к оператору /.
Доказана
Теорема 24.23. Для каждого линейного оператора f простран-
пространства Un существует единственный сопряженный к нему оператор
/*. Если А и В — матрицы операторов f и f* в произвольном орто-
нормированном базисе пространства Un, то В = А*.
Как и в действительном случае, (fg)* = g*/* для любых линейных
операторов / и g. Если / — невырожденный оператор, то (Z)*^
Важнейшее свойство, связанное с понятием сопряженного опе-
оператора, выражает
10. Зак. 6466 137
Теорема 24.24. Пусть f: Un-+Un — линейный оператор и W —
подпространство пространства Un. Если W инвариантно относи-
относительно f, то его ортогональное дополнение W^ инвариантно отно-
относительно f*.
Доказательство этой теоремы ничем не отличается от доказа-
доказательства теоремы 24.3.
Аналогом ортогональных операторов евклидова пространства
служат унитарные операторы пространства Un.
Определение 24.5. Изоморфизм унитарного пространства Un
на себя называется унитарным оператором пространства Un.
Так же, как и в случае евклидовых пространств, доказывается
Предложение 24.12. Линейный оператор f: Un-+Un является
унитарным оператором пространства Un тогда и только тогда, когда
f сохраняет скалярное произведение, т. е. /(a)/(b) = ab для любых
a, b 6 Un.
Из определения унитарного оператора и свойств изоморфизмов
унитарных пространств следует, что унитарный оператор переводит
любой ортонормированный базис в ортонормированный. Верно и
обратное: линейный оператор пространства Un, переводящий хотя бы
один ортонормированный базис в ортонормированный, унитарен.
Те рема 24.25. Линейный оператор f: Un-+Un является унитар-
унитарным тогда и только тогда, когда
f*f = e. B)
Доказательство этой теоремы дословно повторяет доказательство
теоремы 24.5.
Из теоремы 24.25 следует
Теорема 24.26. Линейный оператор пространства Un является
унитарным тогда и только тогда, когда его матрица в ортонорми-
рованном базисе унитарна.
> Согласно теореме 24.25, унитарность линейного оператора /:
Un-+Un равносильна условию B). Если А — матрица оператора
/ в ортонормированном базисе Un, то в этом же базисе оператор /*
имеет матрицу Л* (см. теорему 24.23). Условие B) можно перепи-
переписать в матричной форме:
А*А=Е. C)
Остается заметить, что равенство C) означает унитарность
матрицы Л.^
Теорема 24.27. Множество всех унитарных операторов простран-
пространства Un образует группу преобразований, изоморфную группе всех
унитарных матриц порядка п.
Доказательство теоремы 24.27 по существу не отличается от
доказательства теоремы 24.7.
Изучение унитарных операторов основано на теореме, аналогич-
аналогичной теореме 24.8 для ортогональных операторов.
Теорема 24.28. Если подпространство W инвариантно относи-
относительно унитарного оператора f, то ортогональное дополнение W1-
также инвариантно относительно f.
138
Доказательство теоремы 24.28 дословно повторяет доказатель-
доказательство теоремы 24.8.
Поскольку в рассматриваемой ситуации основное поле совпа-
совпадает с полем С, то унитарный оператор всегда имеет собственный
вектор, соответствующий некоторому комплексному собственному
значению.
Предложение 24.13. Если X — собственное значение унитарного
оператора, то \ к | = 1.
> Пусть а — собственный вектор унитарного оператора /, соответ-
соответствующий собственному значению к. Тогда
аа - /(а)/(а) = (Ал)(Ал) = (П)(аа) = | А, 12(аа).
Так как а ф О, то аа^О, следовательно, |а|2=1, откуда
Предложение 24.14. Определитель унитарной матрицы есть комп-
комплексное число, модуль которого равен 1.
> Из равенства А*А = Е следует, что | А* А 1 = 1. Пусть \А\ =z.
Тогда |Л*|=г (почему?) и \А*А \ = \А*\ \А\ = zz = \z\2. Значит,
z|2 = 1, откуда |z| = 1 .^
Теорема 24.28 и предложение 24.13 позволяют описать произ-
произвольный унитарный оператор /t-мерного унитарного пространства.
Теорема 24.29. Для любого унитарного оператора f: Un-*Un
существует ортонормированный базис пространства Un, в котором
f имеет диагональную матрицу diagfA,,, А,2. ..., А,Д где А,,- — комплекс-
комплексные числа, по модулю равные 1.
> Воспользуемся индукцией по п. При п = 1 теорема следует
из предложения 24.13. Пусть п > 1 и теорема верна для унитарных
пространств, размерность которых меньше п. Пусть, далее, А,, —
собственное значение оператора / и а, — соответствующий собствен-
собственный вектор. Согласно предложению 24.13, 1^1 = 1. Очевидно, что
единичный вектор ei—г^~т ai тоже будет собственным вектором
оператора / с тем же собственным значением А,,. Обозначим через W
одномерное подпространство пространства Un, натянутое на вектор
е,. Ясно, что W инвариантно относительно / и, следовательно, тем же
свойством обладает ортогональное дополнение W1-, которое можно
рассматривать как (я—1)-мерное унитарное пространство. Пусть
/' — ограничение оператора / на подпространство W±. Тогда /' —
линейный оператор подпространства W±, сохраняющий скалярное
произведение, т. е. он является унитарным оператором WL. По
предположению индукции найдется ортонормированный базис е2, ... ,
е„ подпространства W±, в котором /' имеет диагональную матрицу
diag[A,2, ... , АД | А,/1 = 1. Явно, что е2, ..., е„ — собственные векторы,
отвечающие собственным значениям А,2, ..., hi оператора /'. Очевид-
Очевидно, что е2, ..., е„ являются также собственными векторами опера-
оператора / с теми же собственными значениями. Следовательно, е,, е2, ...,
еп — ортонормированный базис пространства Un, в котором / имеет
матрицу diag[X,, A,2, •••, К], |А/| = 1.^(
139
Из теоремы 24.29 следует соответствующее утверждение для
унитарных матриц.
Теорема 24.30. Всякая унитарная матрица А порядка п унитарно
подобна диагональной матрице В — diag^, Х2, ..., Хп\ где \ Xt-\ = 1.
Иными словами, для всякой унитарной матрицы А существует такая
унитарная матрица С, что С~]АС — В.
Доказательство теоремы 24.30 аналогично доказательству тео-
теоремы 24.11.
Как и в случае евклидовых пространств, вводится понятие са-
самосопряженного оператора.
Определение 24.6. Линейный оператор f пространства Un
называется самосопряженным, если он совпадает со своим сопря-
сопряженным оператором f*, т. е. /(а)Ь —а/(Ь) для любых a, b ? Un.
Теорема 24.31. Линейный оператор пространства Un является
самосопряженным тогда и только тогда, когда его матрица, А в
ортонормированием базисе удовлетворяет условию А*—А, т. е.
является эрмитовой.
> Пусть А — матрица линейного оператора /: Un-+Un в ортонор-
мированном базисе. Тогда оператор /* имеет в этом базисе матри-
матрицу Л*.Остается заметить,что равенства /— /* и А = А*равносильны.^
Без изменений переносится на случай унитарных пространств
и теорема 24.13 (вместе с доказательством).
Теорема 24.32. Если подпространство W пространства Un инва-
инвариантно относительно самосопряженного оператора f: Un-+-Un, то
W1^ также инвариантно относительно f.
Следующая теорема обобщает теорему 24.18 и играет далее су-
существенную роль.
Теорема 24.33. Все корни характеристического многочлена эрми-
эрмитовой матрицы действительны.
> Пусть А — эрмитова матрица порядка я, X— корень ее ха-
характеристического многочлена. В унитарном пространстве Un вы-
выберем ортонормированный базис и через / обозначим тот линейный
оператор пространства Uny который в данном базисе имеет матрицу
А. Тогда X — собственное значение оператора /. Пусть а — соответ-
соответствующий собственный вектор оператора /. Так как А — эрмитова
матрица, то f — самосопряженный оператор пространства Un.
Поэтому —
Да)а = а/(а)=КА,а)а = а(Ла)=^(аа) = Х(аа).
Учитывая, что а=^0, заключаем, что Х = Х, т. е. X — действи-
действительное число. <4
Теоремы 24.32 и 24.33 позволяют получить аналог теоремы 24.16
для случая унитарных пространств.
Теорема 24.34. Для любого самосопряженного оператора f про-
пространства Un существует ортонормированный базис пространства
Un, состоящий из собственных векторов оператора f. Во всяком
таком базисе оператор f имеет действительную диагональную
матрицу.
Доказательство теоремы читателю предлагается провести само-
самостоятельно.
140
Из теоремы 24.34 легко получить соответствующее утвержде-
утверждение для эрмитовых матриц.
Теорема 24.35. Любая эрмитова матрица унитарно подобна не-
некоторой действительной диагональной матрице.
Следующая теорема является аналогом теоремы 24.19 с почти
дословным повторением доказательства.
Теорема 24.36. Для любого невырожденного линейного опера-
оператора f пространства Un существует унитарный оператор h и само-
самосопряженный оператор g, такие, что f = hg.
Теорема 24.36 приводит к соответствующему утверждению о
матрицах, которое доказывается аналогично теореме 24.20.
Теорема 24.37. Любая невырожденная комплексная матрица
есть произведение унитарной и эрмитовой матриц.
Как и в случае евклидова пространства, последние две теоремы
останутся справедливыми, если пренебречь требованием невырож-
невырожденности.
Упражнения
1. Пусть / и g — линейные операторы пространства Un. Докажите, что (/ -)- g)* =
= f* + g*- _
2. Докажите, что если А, ? С, /: Цп-> Un — линейный оператор, то (А/)* = А/*.
3. Докажите, что если линейный оператор /: Un^Un имеет собственные зна-
значения А,[, А2, ... , Хп, jo собственными значениями сопряженного оператора /* будут
сопряженные числа А,,, А,2, ... , кп.
4. Линейный оператор / унитарного пространства называется нормальным, если
он перестановочен с сопряженным ему оператором /*. Докажите, что невырожден-
невырожденный линейный оператор / является нормальным тогда и только тогда, когда f = hg,
где h — унитарный оператор, g — самосопряженный оператор и hg = gh.
5. Докажите, что собственные векторы нормального оператора, принадлежа-
принадлежащие двум различным собственным значениям, ортогональны.
6. Докажите, что для нормальности линейного оператора f: Un-+Un необхо-
необходимо и достаточно, чтобы каждый собственный вектор оператора / был собственным
и для /*.
Раздел 4
ГЕОМЕТРИЯ л-МЕРНОГО ПРОСТРАНСТВА
25. АФФИННОЕ ПРОСТРАНСТВО
Мы возвращаемся к изучению аналитической геометрии, но уже
на более высоком уровне. Теперь мы можем использовать аппарат
линейной алгебры, описанный в третьем разделе. Кроме того, объек-
объектом исследования будет не только пространство Е3, которое рас-
рассматривалось в элементарной геометрии, но и некоторые его много-
многомерные обобщения. В этой главе будет введено и изучено понятие
я-мерного аффинного пространства.
25.1. Определение аффинного пространства
Линейное я-мерное пространство Vn над полем Р является ре-
результатом обобщения множества Vs всех векторов в пространстве
Е3. Теперь мы хотим построить обобщение самого пространства Е3,
рассматриваемого как множество точек. На первом этапе выделим
только некоторые свойства пространства Е3, а именно: каждой
упорядоченной паре точек пространства Е3 соответствует вектор,
и множество всех таких векторов образует трехмерное действитель-
действительное линейное пространство. Обобщая эту ситуацию, сформулируем
следующее
Определение 25.1. Пусть заданы п-мерное линейное прост-
пространство Vn над полем Р и непустое множество Ап, элементы кото-
которого будем называть точками. Предположим, что каждой упорядо-
упорядоченной паре точек Му N?An поставлен в соответствие вектор про-
пространства Vn, обозначаемый MN, причем выполнены следующие
аксиомы.
1°. Для любой точки М?Ап и любого вектора а? Vn существует
единственная точка N?An, такая, что MN = a..
2°. Для любых трех точек L, M, N?An имеет место равенство
(О
Тогда множество Ап называется п-мерным аффинным простран-
пространством, связанным с линейным пространством Vn.
Пространство Е3 удовлетворяет определению 25.1 при п = 3
и Р = R. Произвольное я-мерное аффинное пространство Апу связан-
связанное с линейным пространством Vn, и пространство Е3 сходны лишь
теми своими свойствами, которые задаются аксиомами 1°, 2° и след-
следствиями, вытекающими из них. Рассмотрим некоторые из этих
следствий.
142
1. Для любой точки М ? Ап вектор ММ — нулевой вектор про-
пространства Vn.
> В самом деле, полагая в равенстве A) L = M, получаем
ММ + MN = MNy следовательно, ММ = 0. ^
2. Для любых точек М, N ?Ап имеем NM = — MN.
>Это вытекает из равенства A) при L = N и предыдущего
следствия.^
3. Фиксируем в пространстве Ап какую-либо точку О. Тогда
каждой точке М?Ап будет соответствовать вектор OM?Vn, назы-
называемый радиусом-вектором этой точки. В силу аксиомы 1° отобра-
отображение
является биекцией.
Это позволяет аффинное пространство Ап, связанное с линейным
пространством Vn, превратить в линейное пространство, изоморф-
изоморфное пространству Vn. В самом деле, назовем суммой точек М,
N ?Ап точку с радиусом-вектором ОМ + ON, а произведением точки
М на число Х?Р — точку с радиусом-вектором ХОМ. Тогда оче-
очевидно, что все аксиомы линейного пространства выполняются и /
будет изоморфизмом линейных пространств.
Покажем теперь, что для произвольного п-мерного линейного
пространства Vn можно построить аффинное пространство Ап, свя-
связанное с Vn.
Возьмем в качестве Ап множество Vn, т. е. элементы множества
Vn будем называть и векторами, и точками. Двум произвольным
точкам a, b?An = Vn поставим в соответствие вектор ab = b — a
п проверим, будут ли выполняться аксиомы 1° и 2°.
Пусть а 6 Ап = Vn — произвольная точка и b 6 Vn — произволь-
произвольный вектор. Требуется доказать существование единственной точки
x?An = Vny такой, что ах = Ь, т. е. х — а = Ь. Очевидно, что иско-
искомой является точка х = а + Ь, и только она.
Для трех произвольных точек a, b, c?An = Vn аксиома 2° вы-
выполняется, так как равенство ab + be = ас равносильно очевидному
равенству (Ь — а) + (с — Ь) = с — а.
В дальнейшем нас будут интересовать в основном два вида
аффинных пространств Апу а именно: пространства, связанные с
действительным или комплексным линейным пространством Vn. В
соответствующем случае и само пространство Ап называется дейст-
действительным или комплексным. Для краткости мы часто не будем
упоминать о линейном пространстве Vnf с которым связано аффин-
аффинное пространство Ап.
Упражнения
1. Пусть Р — произвольное поле. Векторами будем называть строки вида
(а„ а2, ... , ап, 0), а, 6 Я, (А)
143
а точками — строки вида
(Ь{, Ь2, .. , Ьп, 1), bt?P. (Б)
Сложение строк вида (А) и умножение такой строки на число к?Р определим
покомпонентно (см. § 17.1). Паре точек (Ь[у Ь2, ... , Ьп, 1) и (с,, с2, ... , сп, 1) поставим
в соответствие вектор {C[ — b[y c2 — b2, ..., сп — Ь„, 0). Докажите, что множество
всех строк вида (А) образует я-мерное линейное пространство Vn над полем Р,
а множество всех строк вида (Б) — «-мерное аффинное пространство /Г, связанное
с пространством Vn.
2. Докажите, что приведенное ниже определение я-мерного аффинного прост-
пространства равносильно определению 25.1.
Пусть заданы я-мерное линейное пространство Vn над полем Р и непустое
множество /Г, элементы которого будем называть точками. Предположим, что
каждой упорядоченной паре (М, а), где М?Ап, а 6 Vn, сопоставлена точка, которая
обозначается М -}- а, причем выполнены следующие аксиомы.
1°. Af + (aH-b) = (M H-a) + b,V М?А\ V a, b 6 Vn-
2°. Для любых точек М, N ?/Г существует единственный вектор а 6 V", такой,
что М -\- а = N.
Тогда множество /Г называется п-мерным аффинным пространством, связанным
с линейным пространством Vn.
25.2. Координаты
Координаты в аффинном пространстве Ап вводятся точно так же,
как это делалось в случаях аффинных координат на плоскости и в
пространстве Е3 (см. § 12.7, 12.8).
Определение 25.2. Аффинной системой координат или репе-
репером в аффинном пространстве Ап называется упорядоченная система
(О, е„ е2, „.., еД A)
состоящая из некоторой точки О?Ап и базиса
е,, е2, ... , е„ B)
соответствующего линейного пространства Vn. Координатами точки
М?Ап в репере A) называются координаты
*!, Х2у ... , Хп C)
ее радиуса-вектора ОМ в базисе B), т. е. коэффициенты в разло-
разложении
ОМ = х,е, + х2е2 + ... + хпеп.
Согласно теореме 17.3, верна
Теорема 25.1. Координаты точки в заданном репере определены
однозначно.
Пусть наряду с точкой М задана еще одна точка N с координа-
тами </„ </2, •-., </* ' D)
в том же репере A). Тогда
ON = f/,e, + у2е2 + ... + упеп
и в силу равенства A) из § 24.1
144
= ON — ОМ =
—xn)en.
Таким образом, координаты Xl9 X2, ... y Xn вектора MN в базисе
B) связаны с координатами C) и D) точек М и N в репере A)
формулами Xi = yi — xif /=1, 2, ..., п.
Рассмотрим наряду с репером A) еще один репер
(О', е{, е'2, ..., е'п).
E)
Пусть заданы координаты а\, а2, ..., ап точки О' в репере A)
и матрица Л=[а//] перехода от базиса B) к базису
е{, е'2, ..., ei. F)
Пусть, далее, произвольная точка М ? Ап имеет в репере A) коорди-
координаты C) и в новом репере E) координаты
Х\, Х2у
G)
Мы хотим выразить старые координаты C) точки М через ее
новые координаты G). Для этого введем следующие обозначения:
Х =
х2
Хп
.х-
xl
Л
а2
ап
(8)
Так как координатный столбец вектора О'М в базисе B) равен
X — Л1, а в базисе F) равен X', по формулам преобразования коорди-
координат вектора (см. § 17.8) имеем: X — А\=АХ' или
Mi- (9)
A0)
A1)
Запишем формулы (9) в развернутом виде
х\ =а\\х\ +а\2х2 + .
хп = ап\х\
ап2х2
или в виде
xi = 2 ацх] + аи / = 1, 2,
п.
Формулы (9) — A1) называются формулами преобразования
аффинных координат. Они выражают координаты произвольной
точки в некотором репере A) через координаты этой же точки в
другом репере E).
145
25.3. Плоскости
В § 14.5 было получено следующее уравнение прямой П1 в
пространстве Е3:
г = го + /а, A)
где а— направляющий вектор прямой; г0 — радиус-вектор некоторой
фиксированной точки Мо прямой; г — радиус-вектор произвольной
точки М прямой (см. рис. 14.3). Векторы /а (/ ? R) образуют одномер-
одномерное подпространство Vх линейного пространства V3 всех свободных
векторов. Таким образом, прямую П1 можно рассматривать как
множество всех точек М, таких, что MQM ? Vх.
Аналогично уравнение плоскости П2 в пространстве Е3 можно
записать в виде (см. § 14.6)
B)
Векторы /iai + /2a2 образуют двумерное подпространство V2
линейного пространства V , и плоскость П2 есть множество всех
точек М, таких, что М0М ? V2.
Обобщая эти два примера, получаем следующее
Определение 25.3. Пусть Мо— некоторая тонка аффинного
пространства Ап и Vk — k-мерное подпространство линейного прост-
пространства Vn, с которым связано Ап. Множество всех точек М ? Ап,
таких, что MqM ? Vk, называется k-мерной плоскостью, проходящей
через точку Af0 и имеющей направляющее пространство Vk. Одно-
Одномерная плоскость называется также прямой, а (п—I)-мерная —
гиперплоскостью.
Как будет показано ниже, точка Af0, фигурирующая в определении
плоскости, никакой особой роли не играет.
Предложение 25.1. В качестве начальной точки Мо плоскости
Uk может быть выбрана любая точка этой плоскости.
^ Пусть М\ — некоторая фиксированная точка плоскости П*,
проходящей через точку Af0 и имеющей направляющее пространство
Vk. Надо доказать, что точка М принадлежит плоскости Uk тогда
и только тогда, когда M\M?Vk. Пусть М\М ? Vk. Тогда М0М =
= М0М\ -\- М\М ?Vky так как каждое слагаемое принадлежит Vk.
Следовательно, М ? Uk. Обратно, если М ? П*, то М\М =
= МхМо + М0М = М0М — AfoAf/e Vk. ^
Теорема 25.2. Всякая k-мерная плоскость в аффинном прост-
пространстве Ап является k-мерным аффинным пространством, связанным
со своим направляющим пространством V .
> Пусть Ап — аффинное пространство, связанное с линейным
пространством Vny и П* — 6-мерная плоскость в Ап, проходящая
через точку Мо и имеющая направляющее пространство Vk. Возьмем
в плоскости П* две произвольные точки М и N. Согласно определению
25.1, им соответствует вектор MN? Vn. Так как Му N ? П*, то Af0Af,
146
M0N?Vk и MN = M0N — M0M ? Vk. Итак, каждой паре точек Му N
плоскости П* поставлен в соответствие вектор MN из /г-мерного ли-
линейного пространства Vk.
Пусть М ? П\ а?1Л В силу аксиомы 1° (см. определение 25.1)
для аффинного пространства Ап существует точка N ?Ап, такая, что
MN = а. Из определения 25.3 следует, что N ? П*, т. е. аксиома 1°
справедлива и для П*. Аксиома 2" выполняется для точек L, Af,
N?Hk, так как она справедлива для любых точек из Ап.^
Введем в аффинном пространстве Ап понятие, аналогичное поня-
понятию линейной зависимости в линейном пространстве Vn. Вначале
докажем следующую теорему.
Теорема 25.3. Для любого непустого подмножества S а Ап
существует плоскость Нк, удовлетворяющая следующим условиям:
1) Sc=n*;
2) плоскость Uk принадлежит любой плоскости, содержащей S.
> Если Пк и П/ —две искомые плоскости, то П* cz П' и П'сгП*,
поэтому П* = П'. Итак, если искомая плоскость существует, то она
единственна. Покажем теперь, что такая плоскость существует.
Возьмем в множестве S некоторую точку Мо и рассмотрим мно-
множество векторов U = {М0М\М ? 5}. Обобщая понятие линейной
оболочки конечной системы векторов (см. § 17.9), построим подпро-
подпространство L(U) линейного пространства Vny состоящее из всевозмож-
всевозможных линейных комбинаций конечных систем векторов простран-
пространства U:
Покажем, что плоскость A(S), проходящая через точку Мо и име-
имеющая направляющее пространство L(U), является искомой. Очевид-
Очевидно, что плоскость A(S) содержит все точки множества S, т. е.
Scii4(S). С другой стороны, если некоторая плоскость П содержит
все точки множества S, то ее направляющее пространство включает
в себя все векторы пространства ?/, а также любые их линейные
комбинации, т. е. П с: Л E). В силу единственности искомой плоскости
рассмотренное построение не зависит от выбора начальной точки
M0es.<4
Определение 25.4. Плоскость A (S), построенная при доказа-
доказательстве теоремы 25.3, называется аффинной оболочкой множества S.
Определение 25.5. Точки Мо, М\, ..., Mk аффинного прост-
пространства Ап называются аффинно независимыми, если их аффинная
оболочка k-мерна.
Замечание. Из доказательства теоремы 25.3 следует, что точки Мо, М\, ...,
Mk аффинно независимы тогда и только тогда, когда векторы М0М[, М0М2,
..., MoMk линейно независимы.
Теорема 25.4. Через любые k + 1 аффинно независимые точки
пространства Ап проходит единственная k-мерная плоскость. Во
всякой k-мерной плоскости есть k -\- 1 и не существует больше k -\- 1
аффинно независимых точек. Любую систему аффинно независимых
147
точек k-мерной плоскости можно дополнить до системы, состоящей из
k -\- 1 аффинно независимых точек этой плоскости.
> Пусть Мо, Afi, ..., Mk — аффинно независимые точки простран-
пространства Ап. Их аффинная оболочка A(MOt Мь ..., Mk) является 6-мерной
плоскостью, содержащей эти точки, согласно сделанному выше
замечанию. Пусть П* — также некоторая /г-мерная плоскость с
направляющим пространством Vk, и точки Мо, Мь ..., Mk принадле-
принадлежат П*. Так как подпространство Vk содержит линейно независимые
векторы AfoAfi, М0М2у ..., M0Mki оно совпадает с их линейной
оболочкой, т. е. с направляющим пространством плоскости А(Мо,
Мь ..., Mk). Следовательно, П* = Л(Мо, М\, ..., Mk), и первое
утверждение теоремы доказано.
Пусть П* — произвольная /г-мерная плоскость, проходящая через
точку Мо и имеющая направляющее пространство Vk. Возьмем
какой-либо базис з.\, а2, ..., а* пространства Vk и рассмотрим точки
Mi, М2, ..., М^ такие, что M0Mi=ai, М0М2 —а2, ..., M0Mk = a*.
Мы получили k -\- 1 аффинно независимых точек Мо, Мь ..., Mk,
принадлежащих плоскости П*. Предположим теперь, что в плоскости
П* существует k -\- 1 -(-/(/> 0) аффинно независимых точек. Тогда
аффинная оболочка Xlk+l этой системы точек есть плоскость
размерности k + /, содержащаяся в /г-мерной плоскости П*. Но это
невозможно, так как направляющее пространство Vk+l плоскости
П*+/ не может содержаться в направляющем пространстве Vk пло-
плоскости П*. Полученное противоречие и доказывает второе утвержде-
утверждение теоремы.
Пусть теперь Мо, Мь ..., М/— аффинно независимые точки,
принадлежащие плоскости П*. Согласно теореме 17.2, система ли-
линейно независимых векторов МоМ\, М0М2у ..., М0М/ может быть
дополнена векторами M0M/+i, ..., M0Mk до базиса направляющего
пространства V* плоскости П*. Тогда Мо, ..., М/, М/4-ь ..., Mk есть
система k -\- 1 аффинно независимых точек плоскости Пй. ^
Следствие 25.1. Через любые две различные точки аффин-
аффинного пространства Ап проходит единственная прямая.
Зафиксируем в пространстве Ап некоторую точку О. Тогда про-
произвольную точку М пространства Ап можно задать с помощью ее
радиуса-вектора г = ОМ.
Пусть в пространстве Ап задана плоскость П*, проходящая
через точку Мо с радиусом-вектором г0 = ОМ0 и направляющим
пространством Vk. Возьмем в линейном пространстве Vk какой-
либо базис а,, а2, ..., а*. Тогда
г = г0 + /,а, + /2а2 + ... + tk&k, C)
где t{, /2, ..., tk принадлежит основному полю Р. Когда эти числа
принимают всевозможные значения из поля Р, точка М с радиусом-
вектором C) описывает плоскость П*. Уравнение C) называется
векторным параметрическим уравнением плоскости П , а числа /,,
148
/2, ..., tk — параметрами. Заметим, что уравнения A) и B) являются
частными случаями уравнения C).
Если точка О принадлежит плоскости 11*, то, взяв ее в качестве
начальной точки, уравнение этой плоскости можно записать в виде
В этом случае множество всех радиусов-векторов точек плоскости
П* совпадает с направляющим пространством Vk этой плоскости.
Упражнения
1. Дайте определение /г-мерной плоскости в пространстве Лп, используя упраж-
упражнение 2 из § 25.1.
2. Составьте уравнения прямой и гиперплоскости в пространстве Лп, анало-
аналогичные уравнениям A) и E) из § 14.6.
25.4. Плоскости и системы линейных уравнений
Пусть задана система линейных уравнений
Щ\Х\+Щ2Х2 +... + ainxn = bi, i= I, 2, ••• , га, A)
где atj, bi — числа из поля Р. В § 18.3 систему линейных однород-
однородных уравнений с теми же коэффициентами а-ц
апх\ + ai2x2 + ... +ЪпХп = 0, /=1, 2, •••, га, B)
мы назвали приведенной для системы A). Там же была установлена
связь между решениями систем A) и B). Дадим ей геометрическое
истолкование. В аффинном пространстве Апу связанном с линейным
пространством Vn над полем Р, зафиксируем некоторый репер
(О, е„ е2, ..., е„). C)
Тогда произвольный вектор с ? Vn может быть задан своими ко-
координатами у,, 72. •••, Уп в базисе е,, е2,..., ея. Будем называть вектор с
решением системы A) (или B)), если его координаты образуют
решение этой системы. Как показано в § 18.2, множество всех век-
векторов, являющихся решениями системы B), есть (п — г)-мерное
подпространство Vn~r линейного пространства Vny где г — ранг
матрицы [ац]. Если а,, а2, ..., а„_Л — базис этого подпространства,
то каждый вектор г? ]/п~~г можно представить в виде
г = /1а1 + /2а2 + ...+/я_гая_г, ?6 Р. D)
Если система A) совместна и г0 — одно из решений этой системы,
то, согласно теореме 18.3, все ее решения задаются формулой
г = го + /1а1 + ...+/„_Ла„_Л, tie P. E)
Точка М?Ап называется решением системы A) (или B)), если
ее радиус-вектор г = ОМ является решением этой системы. Так как
уравнение E) задает (п — г)-мерную плоскость, направляющее про-
пространство которой есть пространство решений системы B), то
справедлива
149
Теорема 25.5. Пусть A) — совместная система линейных урав-
уравнений, г — ранг ее матрицы. Множество точек аффинного простран-
пространства Ап, являющихся решениями этой системы, есть (п — г)-мерная
плоскость, направляющее пространство которой совпадает с про-
пространством решений приведенной системы B).
Заметим, что плоскость, заданная системой линейных уравнений,
проходит через начало координат тогда и только тогда, когда эта
система однородная.
Верна и обратная
Теорема 25.6. Пусть в аффинном пространстве Ап фиксирован
репер C). Тогда любая плоскость \\k пространства Ап есть множе-
множество всех решений некоторой линейной системы.
^ Рассмотрим сначала случай, когда плоскость [\k проходит
через начало координат (точку О). Тогда направляющее прост-
пространство этой плоскости задается с помощью формулы Vk = {ОМ \ М ?
б nfe}. Согласно теореме 18.2, существует однородная система ли-
линейных уравнений B), векторы-решения которой образуют прост-
пространство Vk, причем можно считать, что m-=n~k. Множество то-
точек-решений этой системы совпадает с плоскостью П*.
Пусть теперь плоскость II* не проходит через начало координат
и задается уравнением E), где п — r = k. Рассмотрим плоскость
П*, проходящую через начало координат и определяемую уравне-
уравнением D). Построим однородную систему вида B), где m = r =
= n~-k, задающую плоскость П^. Выберем в плоскости 11* какую-
либо точку, например Мо с радиусом-вектором г0 и координатами
х°\, х\, ..., х°п, и подставим ее координаты в систему A), где в ка-
качестве а,ц взяты соответствующие коэффициенты построенной выше
однородной системы B). В результате получим следующие значе-
значения для коэффициентов ft,, ft2, ..., bm\
a,i*i + Щ2х\ + ... + ainx°n = ft,, / = 1, 2, ..., m. F)
Выбирая в системе A) в качестве atj найденные выше коэффи-
коэффициенты системы B), а в качестве ft,, ft2, ..., bm — значения F),
получаем искомую систему. В самом деле, система A), согласно
теореме 25.5, задает й-мерную плоскость, направляющее простран-
пространство которой совпадает с множеством решений системы B), т. е. с
направляющим пространством плоскости П*. В силу равенств F)
плоскость, определяемая системой A), проходит через точку Мо
и поэтому совпадает с плоскостью 11^.^
Из теорем 25.5 и 25.6 следует, что линейное уравнение
а,х, + а2х2 + • • • + апхп = Ь G)
задает в пространстве Ап гиперплоскость, и обратно, любая гипер-
гиперплоскость в Ап может быть задана уравнением G). Частные случаи
этого утверждения были рассмотрены в § 13.2 и § 14.1.
150
25.5. Взаимное расположение двух плоскостей
Рассмотрим в аффинном пространстве Ап, связанном с линей-
линейным пространством Vn, две плоскости: П* с направляющим простран-
пространством Vk, проходящую через точку Мо, и П/ с направляющим про-
пространством V1, проходящую через точку No. Будем называть эти
плоскости пересекающимися, если они имеют по крайней мере одну
общую точку.
Теорема 25.7. Плоскости Uk и П1 пересекаются тогда и только
тогда, когда
лЛе^ + к', A)
где Vk + У1— сумма подпространств Vk и V1 линейного пространства
Уп. Если плоскости П* и \V пересекаются, то их пересечением явля-
является плоскость с направляющим пространством У П У1-
> Зафиксируем в пространстве Ап точку О. Тогда плоскости Uk
и П* можно задать соответственно уравнениями:
г = го + /,а| + ...+/ЛаЛ, B)
Г = Г|+51Ь, + ...+5/Ь/, C)
где г0, г, — радиусы-векторы точек Af0, No; (а,, ..., а*)— базис
подпространства Ук\ (bt, ..., Ы) — базис подпространства V1.
Пусть плоскости П^ и П' пересекаются и М2 — их общая точка.
Тогда найдутся такие значения параметров в уравнениях B) и C),
что
ОЛ12 = го-М|а1 4- ... + /*а* = г, +s,b, + ...
Отсюда получаем
~М^0 = Г, - Г0 = tilii + ... + tkdik - E,bi + ... + S/Ь/) ?Vk+ V',
т. е. соотношение A) имеет место.
Обозначив радиус-вектор точки М2 через г2, перепишем урав-
уравнения плоскостей П и П/ в виде:
г^Го + ^а, + ... + tkSLk, D)
г = г2 + 5,Ь, + ••• +^'/Ь/. E)
Рассмотрим плоскость Пт с направляющим пространством
Vk П У1 и покажем, что она совпадает с плоскостью И^ПН'. Если
М е Пш, то очевидно, что М 6 Yl\ Af 6 П', т. е. М 6 ПЛ П И'. Пусть
теперь М?Пк()П1. Тогда существуют такие значения параметров
//, Si в уравнениях D) и E), что
Вектор
принадлежит подпространству КЛ П У1- Поэтому точка М, имеющая
151
радиус-вектор г2 + с, принадлежит плоскости Пт. Итак, Пт =
= п*пп/.
Обратно, пусть справедливо соотношение A). Тогда
ЗД) = а + Ь, F)
где а?К\ b?Vl. Равенство F) можно переписать в виде ON0 —
— ОМ0 = а + b или
= г,—Ь. G)
Точка с радиусом-вектором G) принадлежит плоскостям П*
и П', а следовательно, и их пересечению. Итак, из соотношения A)
следует, что плоскости П* и П' пересекаются.^
Согласно теореме 25.3, для любых двух плоскостей П* и П'
существует их аффинная оболочка, т. е. минимальная плоскость,
содержащая каждую из плоскостей П* и П'.
Теорема 25.8. Пусть m — размерность пересечения Vk П V1 на-
направляющих пространств плоскостей Uk и И1. Тогда размерность
аффинной оболочки плоскостей Uk и П1
s = k + l — m, (8)
если эти плоскости пересекаются, и
s = k + l — m+ 1, (9)
если они не пересекаются.
> Пусть плоскости Uk и П' пересекаются и О — их общая точка.
Если принять эту точку за начало отсчета радиусов-векторов, то
множествами радиусов-векторов точек плоскостей П*, П' и П^ПП'
являются соответственно Vk, V1 и Vk f] У1- Но тогда формула (8)
следует из теоремы 17.8.
Пусть теперь плоскости П* и П' не пересекаются. Рассмотрим
одномерное подпространство Т = {kM0N01 X 6 Р} пространства Vn и
подпространство 5 = Vh + Vl + T. Согласно теореме 25.7, M0N0~(: Vk +
+ Vlt поэтому dim S = k -\- I — m -\- 1. Очевидно, что плоскость П
с начальной точкой Мо и направляющим пространством 5 содержит
каждую из плоскостей iik и П'. С другой стороны, любая плос-
плоскость, которой принадлежат плоскости II* и П', содержит плоскость
П. Итак, П — аффинная оболочка плоскостей П* и П', и, следова-
следовательно, формула (9) доказана.^
Определение 25.6. Характеристикой пары плоскостей Пк и П'
аффинного пространства Ап называется упорядоченный набор чисел
(к, /, m, s), где s — размерность аффинной оболочки плоскостей
П* и П1, a m — размерность пересечения их направляющих про-
пространств.
Без ограничения общности можно считать, что k ^ /. Тогда
0<m<?</<s<rc. A0)
152
Определение 25.7. Непересекающиеся плоскости П* и П' с
характеристикой (ky /, m, s) называются: 1) параллельными, если
m = k\ 2) частично параллельными, если 6<m<ik; 3) скрещи-
скрещивающимися, если m = 0.
B.2.2.2)
@,2,2,3)
if.2 2,3)
Рис. 25.1
На рис. 25.1 изображены все возможные случаи взаимного рас-
расположения двух двумерных плоскостей в пространстве Е3 и ука-
указаны соответствующие характеристики.
Упражнения
1. Перечислите все возможные случаи взаимного расположения двух двумер-
двумерных плоскостей в четырехмерном аффинном пространстве Л4 и укажите соответст-
соответствующие характеристики.
2. Какое минимальное число прямых в действительном пространстве Ап надо
взять, чтобы их аффинная оболочка совпадала с Лп?
25.6. Аффинное отображение. Изоморфизм
Пусть Ап и Ат — аффинные пространства, связанные соответ-
соответственно с линейными пространствами Vn и Vm над одним и тем же
полем Р.
Определение 25.8. Отображение
/: Ап-+Ат A)
называется аффинным, если существует линейный оператор
ф: Vn-+Vmy B)
такой, что
ф(М jV) = f(M)f(N) C)
для любых точек Му N?An. Отображение ф называется однород-
однородной частью отображения f.
Теорема 25.9. Для любого линейного оператора B) и любых
точек М ? Vny Мх ? Vm существует единственное аффинное отобра-
отображение A), такое, что ф — его однородная часть и Мх =f(M).
> Предположим, что искомое отображение A) существует.
Возьмем произвольную точку N?An. Тогда в силу равенства C)
имеем
f(M)f(N) = MJ(N).
153
В силу аксиомы 1° из определения 25.1 существует единственная
точка jVj, такая, что f(N) = Nl.
Итак, если искомое отображение A) существует, то оно един-
единственно. Теперь докажем существование отображения, построив его
следующим образом. Для произвольной точки N?An определим ее
образ jV, при искомом отображении / с помощью равенства (p(M;V) =
= MXNX. Это возможно в силу аксиомы 1° из определения 25.1.
Покажем теперь, что построенное отображение / удовлетворяет
условию q(KL) = f(K)f(L) для любых точек /(, L^An. Имеем
( ж) = ф(-Ш
Теорема 25.10. Пусть Мо, Af,, ..., Мп — система аффинно не-
независимых точек пространства Ап, a jV0, Nx, ..., Nn — произволь-
произвольная система точек пространства Ат. Тогда существует единственное
аффинное отображение A), удовлетворяющее условиям:
f(Mi) = Ni, ; = 0, 1, ••-, п. D)
> Если ф — однородная часть искомого аффинного отображения
/, то условия D) равносильны следующим условиям:
= N0, E)
= ад. ;=i, 2, ••., п. F)
Так как векторы М0Ми ..., М0Мп линейно независимы, то по
теореме 19.1 существует единственный линейный оператор B), удов-
удовлетворяющий условиям F). Тогда, согласно теореме 25.9, существует
единственное аффинное отображение A), удовлетворяющее усло-
условиям E) и F), а следовательно, и условиям D).^
Важным частным случаем аффинного отображения является
изоморфизм аффинных пространств.
Определение 25.9. Биективное аффинное отображение A)
называется изоморфизмом аффинного пространства Ап на аффин-
аффинное пространство А171. Если существует изоморфизм A), то говорят,
что аффинное пространство Ап изоморфно аффинному простран-
пространству Ат.
Теорема 25.11. Аффинное отображение A) является изомор-
изоморфизмом аффинных пространств Ап и Ат тогда и только тогда, когда
его однородная часть B) есть изоморфизм линейных пространств
Vn и Vm.
> По определению 19.2 линейное отображение ф является изо-
изоморфизмом линейных пространств, когда это отображение — биек-
ция. Возьмем некоторую точку О 6 Ап. Согласно следствию 3 из
§ 25.1, отображения
g: An^V\ Mf-^OM, h: Am^Vm
являются биекциями.
154
Пусть ф — изоморфизм линейных пространств, т. е. биекция.
Тогда отображение f = h~loq)og на основании теоремы 3.2 является
биекцией и, следовательно, изоморфизмом аффинных пространств.
Обратно, пусть / — изоморфизм аффинных пространств, т. е.
биекция. Тогда отображение y = h°f°g~l есть биекция и, следова-
следовательно, является изоморфизмом линейных пространств.^
В следующей теореме сформулирован критерий изоморфизма
аффинных пространств Ап и Ат, аналогичный соответствующему
критерию в случае линейных пространств.
Теорема 25.12. Аффинные пространства Ап и А™, связанные
с линейными пространствами Vn и V™ над одним и тем же полем Р,
изоморфны тогда и только тогда, когда п = пг.
Доказательство теоремы вытекает из следствия 19.2 и теоремы
25.11.
25.7. Аффинные преобразования
Пусть Ап — аффинное пространство, связанное с линейным про-
пространством Vn над полем Р.
Определение 25.10. Изоморфизм f аффинного пространства
Ап на себя называется аффинным преобразованием или автомор-
автоморфизмом этого пространства.
Согласно теореме 25.11, однородная часть ф автоморфизма /
аффинного пространства Ап является автоморфизмом линейного
пространства Vn. Это позволяет вывести для аффинных преобра-
преобразований ряд свойств, аналогичных основным свойствам автомор-
автоморфизмов линейных пространств.
Теорема 25.13. При аффинном преобразовании f пространства
Ап всякий репер
(О, е„ е2, ..., е„) A)
переходит в репер
(О', е{, ej, ... , ei), B)
а любая точка М ?Ап, имеющая в репере A) координаты хи х2, ...,
хп,— в точку М', имеющую координатами в репере B) те же числа.
> Так как однородная часть ф аффинного преобразования явля-
является автоморфизмом линейного пространства V™, то по свойству 5
из § 19.4 базис ei, ег, ..., е„ переходит в базис ef, eS, ..., е? и, следо-
следовательно, репер A) переходит в репер B), где O' = f(O). Коорди-
Координаты точки М в репере A) определяются как коэффициенты в раз-
разложении
ОМ = ххъх -\- х2е2 -f- ... -f- xnen.
Но при автоморфизме ф линейного пространства Vn линейные за-
зависимости между векторами сохраняются (см. § 19.1). Поэтому
О'М' = х1е'1+х2е'2+ ... + хпе'п,
155
т. е. числа хи хъ ..., хп являются координатами точки М' в репе-
ре B).^
Творена 25.14. Для любых двух реперов A) и B) аффинного
пространства Ап существует единственное аффинное преобразова-
преобразование пространства Ап, переводящее репер A) в репер B).
> Репер A) однозначно определяется упорядоченной системой
точек (О, М,, М2, ..., Мп\ таких, что ОМ/ = е„ /=1, 2, ..., п. Ана-
Аналогично репер B) определяется упорядоченной системой точек
(О', М[у М2', ..., М'п\ таких, что O'Af/ = e/, /= 1, 2, ..., п. Но тогда
теорема 25.14 следует из теоремы 25.10. ^
Теорема 25.15. Для любых двух систем аффинно независимых
точек
MOJ М{, ••-, Mk, C)
MJ, Mf, ..., M? D)
пространства Ап существует аффинное преобразование, переводя-
переводящее точки первой системы в соответствующие точки второй системы.
> Так как система векторов
линейно независима, ее можно дополнить векторами
AfoAffc+i, М0М* + 2, ..., М0Мп
таким образом, чтобы получился репер в пространстве Ап:
(Мо, мД, ... , Щмк, M^Mk + lJ ... , W0~Mn) E)
(см. теорему 17.2). Аналогично построим еще один репер
^ ? .-, ЩМ'П) F)
пространства Лл. Согласно теореме 25.14, существует аффинное
преобразование / пространства Апу переводящее репер E) в репер
F). Это преобразование переводит точки C) в точки D).^
Найдем выражение произвольного аффинного преобразования /
пространства Ап в координатах. Фиксируем в пространстве Ап
некоторый репер A). Рассмотрим репер B), полученный из ре-
репера A) с помощью преобразования /. Пусть а,, а2, ..., ап — ко-
координаты точки О' в репере A) и Л=[а,у] — матрица перехода
от базиса
ei, e2, ... , е;, G)
пространства Vn к базису
ef, e$ ei (8)
этого пространства. Возьмем произвольную точку М и ее образ М' =
= 'f(M) при отображении /. Пусть заданы координаты
X j, ЛГ2, ... , Хп [у)
156
точки М в репере A) и координаты
х'и х'ъ ..., х'п A0)
точки М' в этом же репере. Согласно теореме 25.13, точка М' имеет
в репере B) координаты (9). Как известно из § 25.2, координаты
A0) точки М' в репере A) выражаются через координаты (9) этой
же точки в репере B) по формулам:
п
х[= 2 auXj + cii, /=1, 2, ... , п. A1)
Использовав обозначения (8) из § 25.2, перепишем формулы
A1) в матричном виде:
Х' = АХ + АХ. A2)
Формулы A1) и A2) называются выражением аффинного пре-
преобразования f в координатах. Матрица А = [а,-,] называется мат-
матрицей аффинного преобразования f в репере (Г). Отметим, что она
совпадает с матрицей автоморфизма ф линейного пространства Vn
в базисе G), являющегося однородной частью преобразования /.
Отсюда следует, что
det[ai7]^0. A3)
Покажем, что любые формулы вида A1) или A2) с условием
A3) задают аффинное преобразование пространства Ап.
Теорема 25.16. Пусть А = [а,-/] — произвольная невырожденная
матрица с элементами из поля Р и аи а2, ..., ап — произвольный
набор чисел из Р. Поставив в соответствие произвольной точке М
с координатами (9) в репере A) точку М' с координатами A0)
в том же репере, вычисленными по формуле A1) или A2), получим
аффинное преобразование f пространства Ап.
^ Рассмотрим наряду с точкой М еще одну точку — N. Пусть у]у
у2у ..., уп — координаты точки N в репере A). Тогда координаты
точки N' = f(N) в репере A) можно задать с помощью формул:
п
у! =2 аиу1 + а1у /=1, 2, ..., п. A4)
/=i
Вычитая из равенств A4) соответствующие равенства A1),
получаем
п
У1—х! = 21а,1(у1 — х1), /=1, 2, ..., п.
A5)
Итак, координаты у[ — х[ вектора f(M)f(N) в базисе G) выра-
выражаются через координаты у} — х\ вектора MN в том же базисе по
формулам A5), причем выполняется условие A3). Как известно
(см. предложение 19.3), формулы A5) являются координатным
выражением автоморфизма ф линейного пространства Vn. Таким
157
образом, указанное в теореме отображение /: Ап-+Ап является аф-
аффинным преобразованием пространства Л" с однородной частью ф. ^
В заключение докажем еще одну важную теорему.
Теорема 25.17. Множество всех аффинных преобразований про-
пространства Ап есть группа относительно композиции преобразований.
^ Пусть аффинное преобразование / пространства Ап переводит
произвольную точку М с координатами (9) в репере A) в точку
М' с координатами A0) в том же репере, вычисляемыми по форму-
формулам A2). Пусть, далее, аффинное преобразование g пространства
Ап переводит точку М' в точку М" с координатами
*?, *$', .... xZ A6)
в репере A). Тогда имеют место формулы:
Х" = ВХ' + Ви A7)
где В — невырожденная матрица; X" — координатный столбец,
составленный из чисел A6); В\ — координатный столбец, составлен-
составленный из некоторых чисел Ь]у Ь2у ..., Ьп?Р. Подставляя выражение
X' из формулы A2) в A7), получаем
Х" = {ВА)Х + {ВАХ + Вх). A8)
Эти формулы выражают координаты точки М." в репере A) через
координаты точки М в том же репере, т. е., другими словами, они
являются координатным выражением отображения gof; An-+An в ре-
репере A). Согласно теореме 25.16, это отображение является аффин-
аффинным преобразованием пространства Ап. Итак, композиция двух
аффинных преобразований пространства Ап есть аффинное преоб-
преобразование пространства Ап. По теореме 3.1 композиция аффинных
преобразований обладает свойством ассоциативности.
Тождественное отображение е: Ап-+Ап задается формулой Х =
= ЕХУ где Е — единичная матрица, и поэтому является аффинным
преобразованием, играющим роль нейтрального элемента.
Из формулы A2) получаем
Эта формула является координатным выражением преобразования
/-1: Ап-+Ап. Из нее видно, что f~] — аффинное преобразование
пространства Ап.^
Упражнения
1. Докажите, что группа всех аффинных преобразований пространства Ап не
является абелевой при п>\.
2. Укажите какие-либо подгруппы в группе всех аффинных преобразований
пространства Лп.
158
25.8. Геометрия аффинной группы
Пусть Ап — аффинное пространство, связанное с линейным
пространством Vn над полем Р.
Определение 25.11. Фигурой в пространстве Ап называется
произвольное множество точек этого пространства.
Рассмотрим в качестве двумерного аффинного пространства
плоскость, изучаемую в элементарной геометрии. Примерами фигур
в плоскости будут: пустое множество, точка, прямая, треугольник,
окружность, круг, пара параллельных прямых и др. В произвольном
аффинном пространстве Ап фигурами являются: пустое множество,
точка, прямая, й-мерная плоскость, пара плоскостей и т. д.
В этом параграфе будем обозначать группу всех аффинных
преобразований пространства Ап буквой G.
Определение 25.12. Фигура Ф\ пространства Ап называется
аффинно эквивалентной фигуре Ф2 этого пространства, если суще-
существует аффинное преобразование f?G, переводящее фигуру Ф\ в
фигуру Ф2, т. е. /(ф,) = ф2.
Теорема 25.18. Аффинная эквивалентность фигур пространства
Ап есть отношение эквивалентности на множестве всех фигур прост-
пространства Ап в смысле определения 3.2.
> Произвольная фигура Ф пространства Ап аффинно эквива-
эквивалентна самой себе, так как тождественное отображение переводит
фигуру Ф в себя. Итак, аффинная эквивалентность фигур обладает
свойством рефлексивности.
Пусть фигура Ф1 аффинно эквивалентна фигуре Ф2, т. е. суще-
существует аффинное преобразование /, такое, что /(ф,) = ф2. Очевидно,
что /~1(Ф2) = Ф1, причем f~l — аффинное преобразование. Тем
самым доказано свойство симметричности для аффинной эквивалент-
эквивалентности фигур.
Предположим теперь, что фигура Ф1 аффинно эквивалентна
фигуре Ф2, а фигура Ф2 аффинно эквивалентна фигуре Ф3. Это
означает существование аффинных преобразований / и gy таких, что
/(ф,) = ф2 и ?(Ф2) = Ф3. Но тогда (?о/)(ф,) = ф3, и, так как gof
есть аффинное преобразование, свойство транзитивности для аффин-
аффинной эквивалентности фигур доказано.^
Множество всех фигур пространства Ап разбивается на непере-
непересекающиеся аффинные классы фигур. Любые две фигуры из одного
класса аффинно эквивалентны друг другу. Любые две фигу-
фигуры из разных классов не являются аффинно эквивалентными
(см. § 3.2).
Ниже рассматриваются некоторые классы аффинно эквивалент-
эквивалентных фигур.
Теорема 25.19. Аффинное преобразование f пространства Ап
переводит всякую k-мерную плоскость в k-мерную плоскость. Все
плоскости данной размерности k в пространстве Ап аффинно эквива-
эквивалентны друг другу и образуют один аффинный класс.
>Пусть \Jk — й-мерная плоскость в пространстве Ап. Зафикси-
Зафиксировав начало отсчета радиусов-векторов — точку О, мы можем
159
сказать, что плоскость П* есть множество точек, радиусы-векторы
которых задаются с помощью формулы
г = го + f iai + ^а2 + - + tkbk, A)
где ai, a2, ..., а^ — линейно независимые векторы. Пусть ф — одно-
однородная часть аффинного преобразования /. При преобразовании /
точка О перейдет в точку О' = ДО), а плоскость П* — в множество
точек, определяемых радиусами-векторами
г' = Ф(г) = ф(г0) + * i<p(ai) + *2ф(а2) + ... + ифк) B)
с началом в точке О'. Так как ф — автоморфизм линейного прост-
пространства Vn, то векторы ф(а[), ф(аг), •••, ф(а^) линейно независимы и B)
есть векторное уравнение /г-мерной плоскости.
Пусть теперь П* и П{ — две произвольные /г-мерные плоскости
в пространстве Ап. Возьмем в плоскости П* какую-либо систему
аффинно независимых точек
Mo, Afi, ... , Mk. C)
Плоскость Uk есть аффинная оболочка множества точек C).
Аналогично и плоскость И\ является аффинной оболочкой некоторой
системы
М6\ MU ... , Mi D)
аффинно независимых точек. Согласно теореме 25.15, существует
аффинное преобразование / пространства Ап, переводящее точки C)
в точки D). Это преобразование переведет плоскость Пк в /г-мерную
плоскость /(ПЛ), содержащую точки D). Отсюда следует, что плос-
плоскость f(Uk) — аффинная оболочка точек D), т. е. f(H ) = П\.4
Теорема 25.20. Множество всех пар плоскостей пространства Ап,
имеющих одну и ту же характеристику, образует класс аффинно
эквивалентных фигур.
^ Пусть задана пара плоскостей П^ и П' с направляющими
пространствами Vk и V1 соответственно и характеристикой (ky /, m, s).
Рассмотрим произвольное аффинное преобразование / пространства
Ап с однородной частью ф. Согласно теореме 25.19, плоскости
f(Uk) и /(IT) имеют размерности k и / соответственно. Третьим
числом в характеристике плоскостей П* и П' является m = A\m(Vk[\
П V1), а в характеристике плоскостей f(Uk) и f(Ul) — m! = dim (<f(Vk) П
П ф(^))- Но так как ф— автоморфизм линейного пространства V™, то
dim (ф(КЛ) П ф(К')) = dim (Vk П Vl\
т. е. т'= т. Итак, характеристика пары плоскостей f(Uk) и f(Ul)
имеет вид (й, /, т, 5Г).
Предположим, что плоскости П^ и П' пересекаются. Тогда будут
пересекаться и плоскости f(Uk\ /(П'), и по теореме 25.8 5 = k 4- / —
— m = s'. Следовательно, характеристики пар плоскостей (П , П')
и (/(ПЛ), /(П')) совпадают. Если плоскости П^ и П' не пересекаются,
не будут пересекаться и плоскости /(ПЛ), f(Ul). Тогда по теореме 25.8
160
s = k -f- / — m + 1 = s'> т. е. снова приходим к совпадению характе-
характеристик пар плоскостей (IIй, П') и (/AТЛ), /(П')).
Пусть теперь заданы две пары плоскостей (П\ П') и (П*, П[),
имеющие одну и ту же характеристику (&, /, m, s). Обозначим
через Л5 аффинную оболочку плоскостей П* и П', а через А\ —
аффинную оболочку плоскостей Пк} и П\. Предположим, что плоскости
П* и П' пересекаются. Тогда, согласно теореме 25.8, будут пере-
пересекаться и плоскости Ш, П'.
Положим Ат = П* П П', AT = П* П П{. Выберем систему аффинно
независимых точек
Мо, М,, ..., Afm E)
в плоскости Ат и систему аффинно независимых точек
MS, Ml, ..., M'm F)
в плоскости А\п. (Если плоскости II* и П' не пересекаются, то системы
точек E) и F)—пустые множества.) Согласно теореме 25.4,
существуют точки
такие, что
Mo, Mi, ..., Mm, Mm+U ..., Mk
есть система аффинно независимых точек плоскости П\
Мо, Mi, ..., Mm, yvm+i, ..., Ni
является системой аффинно независимых точек плоскости П',
Мо, ..., Mw, Mm+I, ..., Mfe, Nm + U ..., Л// G)
суть система аффинно независимых точек плоскости А\
Мб, М{, ..., М^, М'т + ,, ..., М^
есть система аффинно независимых точек плоскости П?,
Мо, Mi, ...,' М^.^ + ь ..., Ni
является системой аффинно независимых точек плоскости ni,
Мб, ..., М'т, М'т + 1, ..., Mi, ^+i, ..., Ni (8)
суть система аффинно независимых точек плоскости А\.
Согласно теореме 25.10, существует аффинное преобразование /
пространства Апу переводящее точки G) в соответствующие точ-
точки (8). Очевидно, что /(П*) = П?, ДП') = П{.^
Следствие 25.2. Любое аффинное преобразование аффинного
пространства А3 переводит параллельные прямые в параллельные
прямые, а параллельные плоскости в параллельные плоскости.
Далее в этом параграфе будем предполагать, что основным полем
является поле R или С.
П.Зак. 6466 161
Пусть Mi, М2, М3— три точки пространства Апу принадлежащие
одной прямой, причем М\ Ф М2. Тогда найдется число X из основного
поля, такое, что
М1М3 = кМ3М2. (9)
Определение 25.13. Три тонки Mi, M2, Мз аффинного прост-
пространства Ап, принадлежащие одной прямой, называются коллинеар-
ными. Число X, определяемое формулой (9), называется простым
отношением коллинеарных точек Мь М2, М3 и обозначается
(МхМ2М3).
Теорема 25.21. Аффинное преобразование f пространства Ап
сохраняет коллинеарность точек и простое отношение тройки колли-
коллинеарных точек.
> Пусть Mi, М2, Мз — тройка коллинеарных точек пространства
Ап. Будем предполагать эти точки попарно различными, так как в
противном случае утверждение теоремы очевидно. Тогда имеем
равенство (9). Пусть f(Mi) = Niy i— 1, 2, 3. Тогда
где ф —однородная часть преобразования /. В силу линейности ф
из равенства (9) следует равенство NXNZ = XN3N2. Но это означает,
что точки N\, N2y N3 коллинеарны и простое отношение тройки точек
Л/i, Л/2, N3 равно X, т. е. простому отношению тройки точек Мь
м2, м3.<4
Пусть Mi и М2— две произвольные точки пространства Ап.
Если эти точки различны, то через них проходит одна и только одна
прямая и на этой прямой есть единственная точка М, удовлетво-
удовлетворяющая условию
1л$1 = ~ММ2. A0)
Если точки Mi и М2 совпадают, то точка М, удовлетворяющая
условию A0), также существует и единственна: M = Mi=M2.
Определение 25.14. Произвольная пара точек Mi, М2 прост-
пространства Ап называется отрезком, а точка М, удовлетворяющая
условию A0),— серединой этого отрезка.
Выведем формулы для координат середины отрезка. Пусть в
пространстве Ап выбран некоторый репер (О, d, e2, ..., е„). Тогда
точки Mi, М2, М будут иметь определенные координаты: Mi(*i, x2,
..., х'п)у М2(х", x'i, ..., *"), M(*i, х2у ..., хп). Равенство A0) примет вид
(х{ — x\)t\ + (x2 — х2)е2 + ... + (хп — х'пуп =
... + (jtf - хп)еп.
В силу линейной независимости векторов ei, e2, ..., еп имеем:
Xi — x\ = x'i —Xi, /=1, 2, ..., п.
Отсюда получаем формулы для координат середины отрезка:
xi = (xl + xl')/2, i=\, 2, ..., п.
162
Используя понятие середины отрезка, можно определить центр
фигуры.
Определение 25.15. Точка М?Ап называется центром фи-
фигуры Ф, если для всякой тонки М\?Ф существует такая тонка
М2?Ф, нто тонка М является серединой отрезка MiM2.
Понятие центра фигуры согласуется с тем понятием центра,
которое мы ввели в § 15.1 и 15.2 для эллипса и гиперболы.
Заметим, что из определения центра фигуры вовсе не следует,
что у любой фигуры есть центр. С другой стороны, фигура может
иметь более чем один центр. Например, если Ф — прямая, то любая ее
точка является ее центром.
Согласно теореме 25.21, аффинное преобразование f пространства
Ап переводит середину любого отрезка в середину преобразованного
отрезка, а центр фигуры Ф — в центр преобразованной фигуры /(Ф).
Упражнения
1. При каких значениях k фигура, состоящая из k точек плоскости Е2, может иметь
центр? Приведите примеры.
2. Укажите центры фигур второго порядка, перечисленных в § 15.7, 16.2—
16.7, 16.9.
26. ЕВКЛИДОВО ТОЧЕЧНОЕ ПРОСТРАНСТВО
В этой главе будет введено понятие n-мерного евклидова точеч-
точечного пространства Еп и рассмотрены некоторые его свойства. Отме-
Отметим, что при /г = 3 имеем пространство Е3, которое изучается в
элементарной геометрии.
26.1. Определение пространства Еп
Евклидово пространство Еп получается из n-мерного действи-
действительного линейного пространства Vn путем введения в него скаляр-
скалярного произведения. Пусть задано /г-мерное действительное аф-
аффинное пространство Апу связанное с действительным линейным
пространством Vn. Задавая на Vn скалярное произведение, т. е. пре-
превращая его в пространство Епу мы преобразуем аффинное прост-
пространство Ап в евклидово точечное пространство Еп. Итак, имеет место
следующее
Определение 26.1. Аффинное пространство, связанное с ев-
евклидовым пространством Еп, называется п-мерным евклидовым то-
ненным пространством и обозначается Еп.
В n-мерном пространстве Еп можно ввести ряд понятий, обоб-
обобщающих известные понятия в трехмерном пространстве Е3.
Определение 26.2. Репер
(О, 1,, 12, ..., М A)
пространства Еп в случае ортонормированного базиса
ii, 12, -.., in B)
163
будем называть прямоугольной системой координат, а координаты
точек и векторов относительно такого репера — прямоугольными.
Так как в любом ненулевом я-мерном евклидовом пространстве
Еп существуют ортонормированные базисы (см. § 23.6), то в любом
евклидовом точечном пространстве Е\ п^\, существуют прямо-
прямоугольные системы координат.
Пусть в пространстве Еп заданы две прямоугольные системы
координат: A) и
(О', К, 15, .-, in). C)
Если jci, х2, ..., хп— координаты точки М ? Еп в репере A),
х'и х2, ..., хп — координаты этой же точки в репере C), аи а2, ..., ап —
координаты точки О' в репере A) и Л = [а//]—матрица перехода
от базиса B) к базису
И, Й, .... U, D)
то, как показано в § 25.2, старые координаты точки М связаны
с новыми координатами этой точки формулами:
=аХ\х\
= а2\х\ + 222 + + 2nn + 2у 9
лл — an\Xn-\- an2x2 -\- ... -j- annxn -\- an.
Использовав обозначения (8) из § 25.2, можно записать эти
формулы в матричном виде:
Х = АХ' + А\. F)
Так как базисы B) и D) —ортонормированные, то матрица А
в формуле F) — ортогональная.
Определение 26.3. Расстоянием между точками М и N прост-
пространства Еп называется длина вектора MN.
Итак, обозначая указанное расстояние через р(М, N), имеем
р(М, N)=\MN-MN.
Если заданы прямоугольные координаты точек М и N: М(х\,
Х2, ..., Х„), N(yU */2, •••, Уп), ТО
. р(М, /v)= \ 2j (yi — Xi) .
Упражнения
1. С помощью прямоугольных координат определите понятия (п — 1)-мерной
сферы, л-мерного шара и л-мерного куба в пространстве Е".
2. Перенесите на л-мерное пространство Е" основные утверждения, полученные
в § 12.10 для пространства Е3.
164
26.2. Плоскости
Так как пространство Еп удовлетворяет аксиомам аффинного
пространства (см. определение 25.1), то в Еп существуют плос-
плоскости любой размерности k, где 0 ^ k ^ я, причем нуль-мерные
плоскости — это точки, а единственная я-мерная плоскость совпадает
с пространством Еп. Очевидно, что всякая плоскость Uk пространства
Е" является fe-мерным евклидовым точечным пространством.
Возьмем в пространстве Еп две одномерные плоскости, т. е. пря-
прямые Л, Ai. Пусть а — какой-либо направляющий вектор прямой А
и ai — направляющий вектор прямой Ai.
Определение 26.4. Углом между прямыми Д и Дi называется
угол между их направляющими векторами а, а^ т. е. число ф,
определяемое формулой
COS<P = lal la' I ' °<Ф<Д
(см. § 23.5).
Легко видеть, что угол между прямыми А и Ai не зависит от
выбора направляющих векторов этих прямых.
Пусть в пространстве Е" заданы две плоскости — плоскость Uk
с начальной i сечкой М и направляющим пространством Ek и плоскость
II' с начальной точкой N и направляющим пространством Е1.
Определение 26.5. Плоскости Uk и П/ называются ортого-
ортогональными, если они имеют общую точку и каждый вектор из прост-
пространства Ek ортогонален каждому вектору из пространства Е1.
Покажем, что ортогональные плоскости П* и П/ имеют всего
только одну общую точку. В самом деле, пусть М\ N' — две различ-
различные точки, принадлежащие и плоскости Гг, и плоскости П . Тогда
вектор M'Nf принадлежит и пространству Ek, и пространству ?',
поэтому МfNf • M'N' = 0. Но это невозможно, так как M'N'=?Q.
В § 23.8 для произвольного fe-мерного подпространства Ek евкли-
евклидова пространства Еп мы построили ортогональное дополнение {Е11)^.
Оно является (п — &)-мерным подпространством и состоит из всех
векторов, ортогональных каждому вектору пространства Ek. В связи
с этим введем следующее
Определение 26.6. Ортогональным дополнением плоскости \\k
пространства Е" называется (п — к)-мерная плоскость, ортогональная
плоскости Пк.
Теорема 26.1. Если в пространстве Еп задана плоскость Ukf
то через каждую точку N пространства Еп проходит единственное
ортогональное дополнение этой плоскости.
^Пусть плоскость И* задана начальной точкой М и направ-
направляющим пространством Ek. Рассмотрим ортогональное дополнение
(Е*I- подпространства Ek в пространстве Еп. Пусть Un~k — плоскость
в пространстве Е" с начальной точкой N и направляющим простран-
пространством (f*)". Так как MN ? Еk ф (Е*I- = Еп, то, согласно теореме 25.7,
плоскости П* и Un~k имеют общую точку. Итак, Un~k — искомое
ортогональное дополнение плоскости П*.
165
Единственность ортогонального дополнения плоскости следует
из того, что каждая плоскость однозначно определяется заданием
какой-либо ее точки и направляющего пространства.-^
Рассмотрим (п— 1)-мерную плоскость, т. е. гиперплоскость ГГ
и прямоугольную систему координат
(О, 1,, i2, ..., 1Я). A)
Пусть Mo(x°i, х2, ..., х°п) — некоторая точка гиперплоскости П" и
Еп~х— направляющее пространство для П" Согласно теореме
26.1, через точку Мо проходит одномерное ортогональное дополнение
плоскости ГГ~~\ т. е. прямая Д. Пусть п(а\, а2, ..., ап) — какой-либо
направляющий вектор прямой Д и М(х\, х2, ..., хп)—произвольная
точка пространства Е". Точка М принадлежит плоскости П" тогда
и только тогда, когда векторы п и М0М ортогональны, т. е. п • М0М =
= 0. Записывая это равенство в координатах, получаем
а{(хх - х({) + а2(х2 - х°2) + ... + ая(хя - х°п) = 0. B)
Этому уравнению относительно Х\, х2, ..., хп удовлетворяют коорди-
координаты любой точки плоскости П", и только такой точки. Другими
словами, уравнение B) является уравнением плоскости П". Отме-
Отметим, что эта плоскость проходит через точку М0(У?, х°2. ..., х°п) и
ортогональна вектору n(ai, a2, ..., а„), т. е. прямой с направляющим
вектором п.
Запишем уравнение B) гиперплоскости ГГ в виде
п
2оЛ + о = 0. C)
Пусть N(x\, х2, ..., хп)—произвольная точка пространства Е".
Рассмотрим прямую Д», проходящую через точку N и являющуюся
ортогональным дополнением гиперплоскости П". _Эта^ прямая
пересекает гиперплоскость П" в некоторой точке Р(х\, х2, ..., хп).
По аналогии с пространством Е3 сформулируем
Определение 26.7. Расстоянием от точки N до гиперплоскости
№~1 называется длина вектора NP.
Теперь выведем формулу для указанного расстояния. Умножив
обе части уравнения C) на число
мы приведем его к виду
п
2&Л-р = 0. D)
/= 1
Заметим, что вектор no(fei, b2, ..., Ьп) имеет единичную длину. Прямая
NP задается уравнением
г=7+^п0, E)
166
где г—радиус-вектор точки N. Запишем уравнение E) в коор-
координатной форме:
Xl = Xi+tbi. F)
Пусть /о — значение параметра /, соответствующее точке Р. Тогда
имеем
tobi, t0b2, ..., tobn).
Поэтому
Ш = Ц G)
Подставляя выражения F) в уравнение D), получаем уравнение
для t0:
п
2 bi(Xi + tobi) -p = 0.
i= I
Отсюда
п
to = р - 2 b,Xi. (8)
/= 1
Сопоставляя равенства C), G) и (8), получаем формулу
ад + а
для расстояния от точки N(x\, x;2, ..., хп) до гиперплоскости ГГ 1,
заданной уравнением C).
Упражнения
1. Приведите примеры пар ортогональных плоскостей в пространстве Е\
2. Сформулируйте определение угла между двумя гиперплоскостями простран-
пространства Е".
26.3. Объем параллелепипеда
В § 12.13 доказано, что объем параллелепипеда, построенного
на трех линейно независимых векторах
Ui, U2, U3, A)
отложенных от некоторой точки М трехмерного евклидова точечного
пространства Е3, равен модулю определителя, составленного из
координат векторов A) в каком-либо ортонормированном базисе.
Теперь обобщим это утверждение для n-мерного евклидова точечного
пространства Е".
167
Определение 26.8. Множество всех точек пространства Еп,
координаты которых в репере (М, ub u2, ..., ип) удовлетворяют
неравенствам О ^ xt ^ 1, / = 1, 2, ..., п, называется п-мерным парал-
параллелепипедом в пространстве Еп, построенным на п линейно незави-
независимых векторах
иь и2, ..., ип, B)
отложенных от некоторой точки М ? Е".
Теперь каждому параллелепипеду поставим в соответствие неко-
некоторое положительное число, которое по аналогии с трехмерным
случаем естественно было бы назвать объемом параллелепипеда.
Пусть параллелепипед построен на линейно независимых векто-
векторах B). Зафиксируем в пространстве Еп какой-либо ортонормирован-
ный базис
ii, 12, ..., i« C)
и разложим каждый из векторов B) по векторам базиса C). Пусть
Л=[а,-/]—квадратная матрица п-го порядка, столбцами которой
являются координатные столбцы соответствующих векторов B)
в базисе C).
Определение 26.9. Объемом п-мерного параллелепипеда,
построенного на векторах B), отложенных от некоторой точки М,
называется число
V(u\, u2, ..., и„) = I det Л |. D)
Покажем, что число V не зависит от выбора ортонормированного
базиса C). Зафиксируем наряду с базисом C) еще один орто-
нормированный базис
\'и 12, .... К. E)
Пусть А' = \а'{\— матрица, столбцами которой являются коорди-
координатные столбцы векторов B) в базисе E), а 5 — матрица перехода
от базиса B) к базису E). Рассмотрим координатные столбцы
а\{
а^
А,=
• 1 О
векторов и/ в базисах B) и E). Как известно из § 17.8, имеют
место равенства
A'j = S-lAh /=1, 2, ..., п.
Эти равенства можно переписать в виде одного матричного равенства
Так как матрица S l — ортогональная и, следовательно,
""М = 1, то
IdeM'l = IdetS-'l | det Л | = | det Л |,
что и требовалось доказать.
168
26.4. Движения
Определение 26.10. Аффинное преобразование f точечного
евклидова пространства Еп называется движением этого простран-
пространства, если оно не изменяет расстояний между точками, т. е. для любых
точек М, N 6 Е" имеем
р(М, N) = 9(f(M\ /(АО). A)
Движения точечного евклидова пространства Е" тесно связаны с
ортогональными операторами соответствующего линейного евклидо-
евклидова пространства Еп, а именно: имеет место следующая
Теорема 26.2. Аффинное преобразование f пространства Еп явля-
является движением тогда и только тогда, когда его однородная часть ф —
ортогональный оператор.
>Пусть М и N — две произвольные точки пространства Е",
M' = f(M), N' = f(N). Так как / — аффинное преобразование с одно-
однородной частью ф, то, согласно определению 25.8, M'N' = tp(MN).
Отсюда следует, что равенство
\WN'\ = \WJ] B)
равносильно равенству
Г C)
Покажем теперь, что условие C) для линейного оператора ф
пространства Еп равносильно условию
Ф(а).ф(Ь) = а.Ь D)
для любых векторов а, Ъ?Еп. То, что из равенства D) следует
равенство C), очевидно. Займемся выводом равенства D) из C).
Имеем:
(ф
= |ф(а)|2 + 2ф(а).ф(Ь)+|Ф(Ь)|2. F)
Так как условие C) выполняется, то
|а + Ь|2=|Ф(а + Ь)|2, |а|2=|Ф(а)|2, |Ь|2=|Ф(Ь)|2.
Поэтому из равенств E) и F) следует равенство D).
Итак, равенство B), выражающее условие сохранения рассто-
расстояния между точками при движении /, равносильно условию ортого-
ортогональности линейного оператора ф. ^
Пусть в пространстве Е" задана прямоугольная система коор-
(О, I,. .„ .... ..). G)
Так как движение / является аффинным преобразованием, его
можно задать в координатах формулой A2) из § 25.7, а именно:
Х' = АХ + Аи (8)
12. Зак. 6466 169
где X, X', А\ — координатные столбцы соответственно точек М,
M' = f(M), /(О); А — матрица линейного оператора ф в базисе
1,, 12, .-, \п. (9)
Поскольку оператор ф — ортогональный, а базис (9) —ортонор-
мированный, то по теореме 24.6 матрица А — ортогональная. Запи-
Запишем формулы (8) движения / в развернутом виде:
+CL22X2 +... + а2пХп + а2, ш
I
Х'п = ап\Х\ + ^«2*2 + ••• + ЯппХп + <*п-
Итак, всякое движение / пространства Ел выражается в пря-
прямоугольных координатах с помощью формул (8) или A0), где
A=[a,ij] — ортогональная матрица.
Обратно, пусть А = [а«/]—произвольная ортогональная матрица
порядка п и а\, а2, ..., ап — произвольные действительные числа.
Рассмотрим отображение /: ЕЛ->Е\ которое произвольной точке
М ? Е" с координатами х\, х2, ..., хп в прямоугольной системе коорди-
координат G) ставит в соответствие точку М' ? Ел с координатами х\у х'2,
..., xfn в той же системе координат, вычисленными по формулам A0).
Согласно теоремам 25.16 и 24.6, это отображение является движе-
движением пространства Е". ^
Теорема 26.3. Множество всех движений пространства Е" есть
подгруппа в группе всех аффинных преобразований этого прост-
пространства.
^ Пусть / и g — два движения пространства Е". По теореме 25.17
композиция gof есть аффинное преобразование пространства Ея.
Возьмем две произвольные точки М, N ? Еп. Пусть Л1/ = /(Л1), N' =
= f(N), M" = g(M') = (gof){M\ N» = g{N') = {gof){N). Так как / и g
сохраняют расстояния между точками, то р(Л1, N) = p(M', N') =
= p(Af/r, N"). Но это означает, что аффинное преобразование gof
сохраняет расстояние, т. е. является движением. Еще проще дока-
доказывается, что отображение f~~l: ЕЛ->Ел также является движением.
Теперь теорема 26.3 непосредственно следует из теоремы 5.1.^
Группу всех движений пространства Е" будем обозначать G(En).
Как и в § 25.8, рассмотрим некоторые вопросы геометрии этой группы.
Определение 26.11. Фигура Ф\ пространства Еп называется
метрически эквивалентной фигуре Фг этого пространства, если
существует движение f?G (En), переводящее фигуру Ф\ в фигуру Ф2,
т. е. f(<t>\) =Ф2-
Как и в § 25.8, можно показать, что множество всех фигур про-
пространства Еп разбивается на непересекающиеся классы попарно
метрически эквивалентных фигур. Ниже в качестве примеров рас-
рассмотрены два таких класса.
Теорема 26.4. Все ортонормированные реперы пространства Еп
образуют один класс метрически эквивалентных фигур.
^>Заметим прежде всего, что ортонормированный репер G)
170
вполне определяется упорядоченным набором из п + 1 точек О, М\,
М2у ..., Af„, таких, что OMk = U, Л = 1, 2, ..., п. Поэтому репер можно
считать фигурой.
Так как по теореме 26.2 любое движение пространства Е" сохра-
сохраняет скалярное произведение векторов, то / переводит всякий
ортонормированный репер в ортонормированный. Пусть заданы два
ортонормированных репера: G) и
(О', if, Г2> ..., К), (И)
причем ai, а2, ..., ап— координаты точки О' в репере G) и A = [aij] —
матрица перехода от ортонормированного базиса (9) к ортонорми-
рованному базису W, V2t ..., Vn. Как известно из § 23.7, матрица А
является ортогональной. Рассмотрим теперь движение, заданное
формулой (8). Оно переводит репер G) в репер A1). Итак, любые
два ортонормированных репера метрически эквивалентны.^
Теорема 26.5. Все k-мерные плоскости пространства Е" при
фиксированном k образуют один класс метрически эквивалентных
фигур.
^>Всякое движение пространства Е", являясь аффинным пре-
преобразованием, переводит fe-мерную плоскость в fe-мерную плоскость
(см. теорему 25.19). Пусть заданы две плоскости П* и П* соответ-
соответственно с начальными точками М, Мх и направляющими простран-
пространствами Ek, E\. Возьмем в ^-мерном точечном евклидовом простран-
пространстве П* какой-либо ортонормированный репер (М, i,, i2, ..., u).
Согласно теореме 23.7, существуют векторы 1Л + 1, ife + 2, ..., i«, такие,
что репер пространства Е"
(М, 1„ i2, ..., 1Я) A2)
является ортонормированным. Аналогично построим ортонормиро-
ортонормированный репер (Л1,, i{, i2, ..., U) плоскости П^ и дополним его до
ортонормированного репера
(М„ i{, IJ, ..., Vn) A3)
пространства Еп. Движение пространства Е", переводящее репер
A2) в репер A3), переведет плоскость П* в плоскость П^.^
Упражнения
1. Докажите, что все пары ортогональных пересекающихся прямых в простран-
пространстве Еп образуют один класс метрически эквивалентных фигур.
2. Последовательность 11° cz П1 cz П2 cz ... cz П^ плоскостей в пространстве Еп
называется флагом длины k. Докажите, что все флаги фиксированной длины k
образуют один класс метрически эквивалентных фигур.
26.5. Движения евклидовой точечной плоскости
Евклидово точечное пространство Е2 будем называть в этом
параграфе плоскостью Е2. Как показано в § 26.4, произвольное
171
движение / плоскости Е2 задается в прямоугольной системе коор-
координат (О, ij, i2) формулами:
x'2 = a2Xxx+a22x2
где
[a2l a22\
есть ортогональная матрица, являющаяся матрицей линейного опе-
оператора ф — однородной части движения / в ортонормированном
базисе 1,, i2.
С помощью подходящего выбора системы прямоугольных коор-
координат формулы A) можно упростить. В соответствии с предложе-
предложением 24.7 следует различать два случая: det(p= \А | = 1 и det ф =
= |Л| = -1.
Определение 26.12. Движения плоскости Е2 в случае \А\ =
— 1 называются собственными, а в случае \ А \ = — 1 — несобст-
несобственными.
Как следует из §24.3, в любой прямоугольной системе координат
собственное движение может быть задано формулами:
х\ = хх cos а — х2 sin а +
х2 = хх sin a + x2 cos a +
а{9 1
a2. J
Рассмотрим два частных случая формул C).
1. В случае, когда а = 0,
Y' у I п у' v _L_ П (А\
л,х — Л| -у u-j, л,2 — л2 -р u2. ytj
При движении, заданном формулами D), все точки плоскости пе-
перемещаются по параллельным прямым, имеющим направляющий
вектор a(at, a2). Величина смещения у всех точек одинакова и равна
длине вектора а. Как известно, такое движение называется парал-
параллельным переносом плоскости Е2 на вектор а.
В случае, когда a1=a2 = 0, имеем:
х[ = хх cos a — x2 sin a, 1 ,с\
х'2 = хх sin a + x2 cos a. J ^
При этом движении точка О@, 0) остается неподвижной. Рас-
Рассмотрим произвольную точку М(хх, х2) и ее радиус-вектор 0М(хи х2).
Координаты точки М' — образа точки М при движении E) — так
же, как и координаты ее радиуса-вектора ОМ', задаются формула-
формулами E). Найдем угол между векторами ОМ и ОМ'. Имеем:
ОМ • ОМ' == хх (хх cos a — x2 sin a) + х2(хх sin a + х2 cos a) =
= {x\ + jEJpcosa, \OM | =Vjc2 + jc2,
\~OM'\ ="
172
Итак, для косинуса угла ф между векторами ОМ и ОМ' полу-
получаем следующее выражение:
ОМ • ОМ' (*? + х%) cos a
cos ф = —>-——^ = — " = cos a.
Следовательно, угол между векторами ОМ и ОМ' равен а. Таким
образом, при движении E) каждый отрезок ОМ поворачивается
вокруг точки О на угол а. Как известно, такое движение называется
поворотом плоскости Е2 вокруг точки О на угол а.
Как видно из формул C), произвольное собственное движение
плоскости Е2 является композицией поворота вокруг точки О и па-
параллельного переноса. Однако ситуация упрощается благодаря
следующему предложению.
Предложение 26.1. Всякое собственное движение плоскости Е2,
заданное формулами C) при а Ф 2&л, есть поворот вокруг неко-
некоторой точки О'.
> Покажем, что движение C) при а Ф 2kn имеет единственную
неподвижную точку. Координаты неподвижных точек движения C)
совпадают с решениями системы
хх — хх cos а — х2 sin а + Я\А
х2 = хх sin а -{- х2 cos а -j- а2 J
относительно неизвестных xXt x2. Перепишем эту систему в виде
- cos а) + х2 cos а = ах, 1
ia -f- jc2A — cos а) = а2. j
— хх sin
Это система двух линейных уравнений с двумя неизвестными, опре-
определитель которой равен 2A — cos а) и отличен от нуля. Как известно,
такая система имеет единственное решение О (Ьх, Ь2). Запишем
формулы рассматриваемого движения / в прямоугольной системе
координат (О', iXt i2):
х'х = хх cos а — х2 sin а + сх, ) ^
х2 = хх sin a + x2 cos а + с2. j ^
Так как при движении f точка О' остается неподвижной, то, под-
подставляя в систему F) хх—0у х2 = 0, Jt[ = O, jc2 = 0, получаем сх —
= с2 = 0. Формулы F) принимают вид:
sin a, 1
os a /
х[ — хх cos a — х2 sin
х'2 = хх sin a + х2 cos
и, следовательно, задают поворот вокруг точки О'.
Рассмотрим несобственные движения плоскости Е2. Как было
показано в § 24.3, произвольное несобственное движение плоскости
Е2 может быть задано в некоторой прямоугольной системе координат
(О, ij, i2) формулами:
х[ = х{ + аи х'2 = — х2 + а2. G)
173
Перейдем к новой прямоугольной системе координат (О , ii, 12),
где О (О, а2/2). Формулы преобразования координат для произ-
произвольной точки М и ее образа при движении G) имеют вид: хх =х{,
х2 = х2 + а2/2, х[=х[, х!2 = х!2-\- а2/2. Подставляя эти выражения
в формулы G), получаем:
х{=хх + аи х!2=-х'2. (8)
Рассмотрим частный случай формул (8) при ai—0:
х[ = хХз х'2= — х2. J9)
При движении, определяемом этими формулами, произвольная точка
М(хх, х2) плоскости Е2 переходит в точку М'{хи —х2), симметричную
точке М относительно координатной оси Оху Как известно, такое
движение называется симметрией плоскости Е2 относительно прямой
Охх. Движение, заданное формулами (8), является композицией
симметрии (9) относительно прямой Охх и параллельного переноса
на вектор a.(al9 0) вдоль оси Ох{.
Определение 26.13. Движение плоскости Е2, заданное фор-
формулами (8), называется скользящей симметрией с дсью Охх.
Отметим, что симметрия (9) есть частный случай скользя-
скользящей симметрии.
Итак, доказана следующая
Теорема 26.6. Собственные движения плоскости Е2 исчерпы-
исчерпываются поворотами вокруг любой точки и параллельными перено-
переносами. Несобственные движения плоскости Е2 совпадают со сколь-
скользящими симметриями.
Упражнения
1. Докажите, что любой поворот плоскости Е2 является композицией двух
симметрии относительно прямых, проходящих через неподвижную точку поворота.
2. Докажите, что любой параллельный перенос плоскости Е2 является компо-
композицией двух симметрии относительно параллельных прямых.
26.6. Движения трехмерного евклидова точечного пространства
а2, \
аЗ> J
Как показано в § 26.4, всякое движение трехмерного евклидова
точечного пространства Е3 задается в прямоугольной системе коор-
координат (О, 1,, i2, i3) формулами:
х[ = ахххх + аХ2х2 +ахзх3 ^
х!2 = а2Ххх + а22х2 + а23х3 + а2, \ A)
Х'з = Я31*1 + а32^2 + «33-^3 J
где А = [ац] — ортогональная матрица. Согласно теореме 24.10,
ортонормированный базис ii, 12, i3 можно выбрать так, что форму-
формулы A) примут один из следующих видов:
х\ = хх cos а — х2 sin а + а,, "|
х2 = хх sin а + х2 cos а + а2, !> B)
' + J
= х3 + а
3;
174
х[ = хх + а„ х'2 = х2 + а2, х? = — х3 + а3; C)
х\ = хх cos а — jc2 sin а + ^ь ^
jcJ = хх sin а + jc2 cos а + а2, I D)
*з = — *з + а3. J
Упростим формулы B) — D) с помощью перехода к новой
прямоугольной системе координат. Начнем с формул B). Сохранив
базисные векторы \ь i2, i3, перенесем начало координат в точку
JC9, 0), где jc?, х\ определяются из уравнений:
х°х cos а — х\ sin а -+- ах =
х°х sin a + x% cos a + а2==
i} E)
'2> J
которые мы перепишем в виде:
x?(cos а — 1) —jc2sin а
4
x?sina
=_а1Д
a-1)= -а2.)
Определитель последней системы двух линейных уравнений от-
относительно неизвестных jc?, x\ равен (cos a — lJ + sin2a. Он равен
нулю, если:
cosa=l, sina = 0. G)
В этом случае формулы B) принимают вид:
х[ = хх + ах, х'2 = х2 + а2, х'ъ = хъ + а3. (8)
Очевидно, что формулы (8) задают параллельный перенос про-
пространства Е3 на вектор а(а,, а2, а3).
Предположим теперь, что условия G) не выполняются. Тогда
найдется единственное решение jc?, x\ системы E), и мы перенесем
начало координат в точку б(х°{9 jc2, 0). Обозначив новые координаты
произвольной точки M(xlt jc2, jc3) через xl9 jc2, jc3, получим следующие
формулы преобразования координат: хх= хх-\- х°х, х2 = х2-\- х%,
х3 = х3. Цк новых координатах формулы движения B) примут вид:
х\ +х°\= jcicosa — jc2 sin a + (*?cosa — jc^sina + ax\ 1
x'2 + x\ = x\ sin a + x2 cos a + (x°x sin a + x2 cos a + a2), J
или в силу тождеств E):
х\ = хх cos a — jc2 sin j
x2 = xx sin a + *2cos a» f (9)
J
a, "j
J
Рассмотрим частный случай формул (9) при a3 = 0:
х[ = JCi cos a — jc2 sin
х2 = хх sin a-\- x2 cos a, > A0)
in a, "j
os a, >
)
175
При движении, задаваемом формулами A0), в каждой плоско-
плоскости П, параллельной плоскости Ох\Х2, и в самой этой плоскости про-
происходит поворот на угол а вокруг точки пересечения плоскости П
с осью бхз.
Определение 26.14. Движение пространства Е3, заданное
формулами A0), называется поворотом пространства вокруг оси
Ох3 на угол а.
Движение пространства Е^заданное формулами (9), есть ком-
композиция поворота вокруг оси Охз на угол а и параллельного переноса
на вектор а@, 0, а3).
Определение 26.15. Движение пространства Е3, заданное
формулами (9), называется винтовым.
Обратимся теперь к формулам C). Перейдем к новой прямоу-
прямоугольной системе координат, сохранив базисные векторы i,, i2, i3 и
перенеся начало координат в точку 6@, 0, а3/2). Итак, выполним
преобразование координат по формулам: хх=хх, х2 = х2, х3 = х3-{-
+ а3/2. В новых координатах движение C) задается формулами:
хх=хх-\-ах, Х2 = х2-\-а2, х3——х3. {ii)
При а,=а2 = 0 формулы A1) принимают вид:
у' = у у' Y У' Y ( \9\
При движении, заданном формулами A2), произвольная точка
М(х{, х2, х3) переходит в точку М'(х{, х2, —х3), симметричную точке
М относительно координатной плоскости бх\Х2. Как известно, та-
такое движение называется симметрией относительно плоскости бх\Х2.
Движение, заданное формулами A1), есть композиция симметрии
относительно плоскости бх\Х2 и параллельного переноса простран-
пространства Е3 на вектор a(ai, a2, 0), параллельный плоскости 6х\Х2.
Определение 26.16. Движение пространства Е3, заданное
формулами A1), называется скользящей симметрией.
Рассмотрим теперь формулы D). Перейдем к новой прямоуголь-
прямоугольной системе координат, сохранив базисные векторы и перенеся
начало координат в точку 6(х?, х\, аз/2), где х°и х\ определяются
из уравнений F). Если условия G) выполнены, то мы приходим
к уже рассмотренному случаю C). Пусть условия G) не выполнены.
Тогда система F) имеет единственное решение относительно *?, х\,
и мы приходим к следующим формулам преобразования координат:
х\=х\-\-А> Х2 = Х2 + Х2> хъ = *з + аз/2- В новых координатах дви-
движение D) задается формулами:
х\ = хх cos a — х2 sin a, ^
х2 = хх sin a + x2 cos a, f A3)
л3 — лз- /
Движение, заданное этими формулами, есть композиция симметрии
относительно плоскости бххх2 и поворота вокруг оси бх3 на угол а.
176
Определение 26.17. Движение пространства Еп, заданное
формулами A3), называется поворотной симметрией.
Заметим, что симметрию можно считать частным случаем как
скользящей симметрии, так и поворотной.
Итак, доказана следующая
Теорема 26.7. Всякое движение пространства Е3 есть одно из
следующих: параллельный перенос, поворот вокруг прямой, винто-
винтовое движение, скользящая симметрия и поворотная симметрия.
Упражнения
1. Докажите, что любое движение пространства Е3, оставляющее неподвижной
некоторую точку О, есть поворот вокруг прямой, проходящей через точку О, или
поворотная симметрия.
2. Поворот пространства Е3 вокруг некоторой прямой на угол л называется
симметрией относительно этой прямой. Докажите, что композиция двух симметрии
относительно двух различных параллельных прямых есть параллельный перенос.
26.7. Аффинные преобразования пространства Е"
До сих пор рассматривались только те аффинные преобразова-
преобразования евклидова точечного пространства Е", которые сохраняют рас-
расстояния между точками, т. е. являются движениями. Теперь мы
изучим структуру произвольного аффинного преобразования прост-
пространства Е".
Пусть в пространстве Е" выбрана прямоугольная система ко-
координат
(О, 1„ i2, ..., in). A)
Рассмотрим линейный оператор ф, евклидова линейного прост-
пространства ?", заданный в ортонормированном базисе
1„ 12, - . •« B)
матрицей
ГА, 0 ... О
О 1 ... О
.0 0 ... 1.
где к — отличное от нуля действительное число. В соответствии
с теоремой 25.9 рассмотрим аффинное преобразование /, простран-
пространства Е", имеющее в качестве однородной части оператор <р, и удовлет-
удовлетворяющее условию
f№ = 0, C)
т. е. оставляющее точку О неподвижной. Преобразование /, задается
в прямоугольной системе координат A) формулами:
х[ = кх, x! = xi9 i = 2, 3, ...,/z. D)
Определение 26.18. Аффинное преобразование пространства
Еп, заданное в прямоугольной системе координат формулами D),
177
называется сжатием с коэффициентом X к гиперплоскости с на-
начальной точкой О и направляющим пространством L(i2, i3, • ••, in)
параллельно вектору i,.
Заметим, что введенное здесь понятие сжатия согласуется с
общепринятым понятием сжатия лишь при условии 0<k<i 1. При
к > 1 обычно говорят о растяжении, а при А,<СО сжатие (или
растяжение) сопровождается симметрией относительно плоскости.
Аналогично определяются сжатия параллельно векторам i2, i3, •••, in-
Рассмотрим теперь линейный оператор ф пространства ?", имею-
имеющий в базисе B) матрицу
Г А,, 0 ... О
О Х2 ... О
О О* .".." \п
где Я,, А,2, ..., Хп — отличные от нуля действительные числа. Аффин-
Аффинное преобразование /о, имеющее однородную часть ф и удовлетво-
удовлетворяющее условию C), задается формулами:
x[ = iiXi9 i= I, 2, ..., п. E)
Это преобразование является композицией п сжатий параллельно
векторам B).
Основной в этом параграфе является
Теорема 26.8. Всякое аффинное преобразование пространства
Еп есть композиция п сжатий параллельно п попарно ортогональ-
ортогональным векторам и движения.
>В силу формул A1) из §25.7 произвольное аффинное преобра-
преобразование / есть композиция аффинного преобразования, удовлетво-
удовлетворяющего условию C), т. е. заданного формулами:
x!=iai}xh det[a,7]^O, F)
/ = i
и аффинного преобразования, заданного формулами:
x[ = Xi + ah /=1, 2, ..., п. G)
Преобразование G) — движение, так как его однородная часть
имеет единичную матрицу, и поэтому оно является изометрией. Это
преобразование называется параллельным переносом на вектор
а(а„ а2, ..., ап).
Рассмотрим теперь аффинное преобразование /, заданное
формулами F). Однородная часть ф этого преобразования опреде-
определяется по тем же формулам. Согласно теореме 24.19, линейный
оператор ф является композицией ф2ф! самосопряженного оператора
ф! и ортогонального оператора ф2. Поэтому и аффинное преобразо-
преобразование f есть композиция двух аффинных преобразований: / = /2/v
Преобразование /2 является движением, а преобразование /ь со-
согласно теореме 24.16, задается в подходящей прямоугольной системе
координат формулами E), т. е. представляет собой композицию п
178
сжатий параллельно попарно ортогональным базисным векторам
этой системы.
Итак, произвольное аффинное преобразование / пространства
Е" есть композиция /3/2/i, где f{ — композиция п сжатий параллельно
попарно ортогональным векторам B); /2 — движение, удовлетво-
удовлетворяющее условию C); /3 — параллельный перенос. ^
Как видно из примера сжатия пространства к плоскости, аффин-
аффинное преобразование пространства Е" может сохранять длины одних
отрезков и изменять длины других. Иначе ведут себя при аффин-
аффинных преобразованиях объемы параллелепипедов, как показывает
Теорема 26.9. При аффинном преобразовании пространства Еп
любой п-мерный параллелепипед П переходит в п-мерный парал-
параллелепипед П'. Отношение объемов параллелепипедов П и П' не
зависит от выбора параллелепипеда П.
> Пусть / — аффинное преобразование пространства Е" и ф —
его однородная часть. По определению 26.8 я-мерный параллеле-
параллелепипед П строится на п линейно независимых векторах
и„ и2, ... , ипу (8)
отложенных от некоторой точки М, и состоит из всех точек, коорди-
координаты которых в репере (М, и,, и2, ..., ип) удовлетворяют нера-
неравенствам:
0<х/< 1, /= 1, 2, ... , п. (9)
Согласно теореме 25.13, образ /(П) параллелепипеда П состоит
из всех точек, координаты которых в репере (f(M), Ц)(и{)у <р(и2), ...,
ф(и„)) также удовлетворяют неравенствам (9), т. е. П' = /(П) —
параллелепипед, построенный на векторах
<p(ui), <p(u2), ..., <р(иД (Ю)
отложенных от точки f(M).
Возьмем прямоугольную систему координат A). Пусть г|з —
линейный оператор, переводящий базис B) в базис (8), и % — ли-
линейный оператор, переводящий базис B) в базис A0). Тогда
Х = ФФ- (И)
Обозначим через Л, В, С соответственно матрицы операторов
г|), х> ф в базисе B). Согласно определению 26.9, объем V парал-
параллелепипеда П равен |deM|, а объем V параллелепипеда IT —
|detB|. Из равенства A1) на основании теоремы 19.3 получаем
В = СА. Отсюда по теореме 4.8 следует равенство V = \detC\V,
доказывающее теорему. ^
Упражнения
1. Докажите, что множество всех аффинных преобразований пространства Е",
заданных в прямоугольных координатах с помощью формул вида X' = kAX -{- В, где
А — ортогональная матрица; k — отличное от нуля действительное число, образует
группу. Она называется группой подобий. Докажите, что все пары параллельных
/г-мерных (k фиксировано) плоскостей (см. определение 25.7) эквивалентны отно-
относительно преобразований подобия.
2. Укажите какие-либо подгруппы в группе подобий, рассмотренной в преды-
предыдущем упражнении.
179
27. КВАДРИКИ
В этой главе будет введено понятие квадрики, обобщающее
понятие фигуры второго порядка, описанное во втором разделе
пособия. Мы рассмотрим два варианта теории квадрик: в аффинном
и евклидовом пространствах. При этом целесообразно будет расши-
расширить действительное пространство путем вложения его в комплексное.
27.1. Пространство An(i)
Пусть Л "(С) — я-мерное комплексное аффинное пространство,
связанное с комплексным линейным пространством К"(С). Выберем
в пространстве Ап(С) какой-либо репер
(О, е,, е2, ... , ея). A)
Множество Vn всех векторов пространства К"(С), имеющих дейст-
действительные координаты в базисе
ej, е2, ..., в,г,
является я-мерным действительным линейным пространством. Мно-
Множество Ап всех точек пространства ЛЯ(С), имеющих действительные
координаты в репере A), является я-мерным действительным аф-
аффинным пространством, связанным с линейным пространством Vn.
Определение 27.1. Пространство Ап(С), в котором фикси-
фиксирован репер A), а следовательно, и действительное аффинное про-
пространство Ап, будем обозначать An(i). Тонки пространства An(i)
называются действительными, если они принадлежат пространству
Ап, и мнимыми в противном случае. Векторы пространства Vn(C)
называются действительными, если они принадлежат пространству
Vn, и мнимыми в противном случае.
В дальнейшем интерес для нас будут представлять действи-
действительные точки и векторы.
Рассмотрим формулы:
п
Xi=2xaiixj + at, /=1, 2, ... , л, B)
где det[a//]=H=O; aih ai — действительные числа. Можно считать, что
эти формулы задают преобразование координат в пространстве
An(i): координаты xlt х2, ..., хп точки М в репере A) выражаются
через координаты х[, х'2у ..., х'п этой же точки в новом репере
(О', е{, е?, ..., е?). C)
Заметим, что действительные точки и векторы, и только они,
в новой системе координат будут иметь действительные координаты.
В этой главе мы будем рассматривать в пространстве только такие
аффинные координаты, которые получаются с помощью формул
вида B).
С другой стороны, можно считать, что формулы B) задают аф-
аффинное преобразование пространства An(i). При этом преобразова-
преобразовании действительные точки и векторы переходят в действительные.
180
В этой главе будут рассматриваться только такие аффинные пре-
преобразования.
27.2. Определение квадрики
Пусть в пространстве An(i) выбран некоторый репер
(О, е„ е2, ..., ея) A)
и задано уравнение
п п
2ацх1Х1+ 2 S а,х, + а = 0, B)
где ац, щ, а — действительные числа, причем среди чисел ац есть
отличные от нуля и ац — ап.
Определение 27.2. Квадрикой в пространстве An(i) назы-
называется множество всех точек этого пространства, координаты ко-
которых в репере A) удовлетворяют уравнению вида B). Уравнение
B) называется уравнением той квадрики, которую оно определяет.
Понятие квадрики тесно связано с понятием фигуры второго
порядка, введенным во втором разделе пособия, а именно: рас-
рассматриваемую там плоскость можно считать множеством дейст-
действительных точек пространства A2(i). Тогда каждая плоская фигура
второго порядка является множеством всех действительных точек
некоторой квадрики. Рассмотрим, например, уравнение
х2 + х2 = 0. C)
Плоская фигура второго порядка, заданная этим уравнением в
аффинной системе координат Оххх2 на плоскости, есть точка О@, 0).
Рассмотрим теперь квадрику, заданную уравнением C) в прост-
пространстве A2(i). Это уравнение можно представить в виде
(xl+ix2)(xl—ix2) = 0. D)
Квадрика, заданная уравнением D), состоит из двух прямых,
определяемых уравнениями:
хх + ix2 = 0, хх — ix2 = 0. E)
Она содержит одну действительную точку О@, 0), т. е. плоскую
фигуру второго порядка с уравнением C), и бесконечно много мни-
мнимых точек. В дальнейшем мы будем называть пространство A2(i)
плоскостью, а квадрики на этой плоскости — линиями второго
порядка.
Аналогично рассмотренное во втором разделе пособия простран-
пространство можно считать множеством действительных точек простран-
пространства A3(i). Тогда каждая фигура второго порядка является множе-
множеством действительных точек некоторой квадрики. Рассмотрим, на-
например, уравнение C). В аффинной системе координат Оххх2хъ
действительного трехмерного пространства оно задает прямую —
ось Охъ. Квадрика же, заданная этим уравнением в пространстве
Л3(/), состоит из двух плоскостей, определяемых уравнениями E).
181
В дальнейшем мы будем называть квадрики пространства A's(i)
поверхностями второго порядка.
Вернемся к общему случаю. Пусть в пространстве An(i) задана
квадрика К с уравнением B). Если X — произвольное, отличное от
нуля действительное число, то уравнение
(П П v
2 OijXiX, + 22 ара + а) = О
задает в пространстве An(i) ту же самую квадрику К, что и уравне-
уравнение B). Оказывается, верно и обратное: если два уравнения вида B)
задают в выбранном репере пространства An(i) одну и ту же квад-
квадрику, то левые части этих уравнений различаются лишь не равным
нулю действительным числовым множителем. Однако доказательство
этого утверждения не столь очевидно, и мы докажем вначале не-
некоторые вспомогательные утверждения.
Лемма 27.1. Если многочлен
п п
2 atjXiXj + 22 OiXi + а F)
от переменных xlt x2, •••, хп с комплексными коэффициентами обра-
обращается в нуль при любых значениях этих переменных, то все коэф-
коэффициенты данного многочлена — нули.
> Доказательство проведем индукцией по п. Пусть /z=l, т. е.
многочлен имеет вид
апх* + 2аххх+а. G)
Придавая хх значения 0, 1, 2, получаем: а = 0, а,, + 2а,=0,
а\\ +а\ =0» следовательно, аи =а, = а = 0.
Предположим теперь, что лемма 27.1 справедлива для п—1
(п > 1) переменных, и докажем ее для многочлена F). Перепишем
этот многочлен в виде
п п
l + l)+ 2 ai]xix] + 2 2 uiXi + а.
= 2 ' i.j = 2 i = 2
Придавая переменным лс2, ..., хп произвольные числовые значения,
получаем многочлен от переменной хх. По предположению индукции
п п п
ап=0, 2алХ/ + а1=0, 2 ai}XiX} + 2 2 ад- + а = 0.
i = 2 i,i = 2 i = 2
Так как эти соотношения имеют место при любых значениях пе-
переменных Хо хп то в силу предположения индукции а(/=0,
а, = 0, /, /=1, 2, ..., п. ^
Лемма 27.2. Если два многочлена с комплексными коэффициен-
коэффициентами: F) и
2 bijxixj + 2Zbixl + b, (8)
i, j=\ i=\
182
принимают равные значения при любых значениях переменных
хх, х2у ..., хп, эти многочлены равны, т. е.
ац = Ьц, ai = biy a = b, /, /=1, 2, ..., п.
> Для доказательства достаточно применить лемму 27.1 к раз-
разности многочленов F) и (8).^
Лемма 27.3. Пусть каждый из многочленов F) и (8) имеет вто-
вторую степень, т. е. среди коэффициентов ац есть отличные от нуля
и не все коэффициенты Ьц — нули. Если эти многочлены имеют одни
и те же корни, т. е. обращаются в нуль только при одних и тех же
значениях переменных, то
Ьц = kaij9 bi = laiy b = la, iy j = 1, 2, ..., az, (9)
где X — отличное от нуля комплексное число.
>Пусть AZ == 1, т. е. мы рассматриваем многочлены вида G) и
Ьххх* + 2Ьххх + Ь, A0)
причем аххФ0у Ьххф0. Пусть, далее, а и р — корни многочленов
G) и A0):
аих\ + 2аххх + а = аи(хх — а)(хх - р),
Ьпх\ + 2Ьххх + b = Ьхх(хх - а)(хх - р).
Тогда соотношения (9) имеют место при Х = Ьп/ап.
Пусть теперь п>\. Предположим вначале, что по крайней
мере один из многочленов, например F), содержит квадрат какой-
либо переменной, например хх. Тогда многочлены F) и (8) предста-
вимы в виде:
(п
%auxi +
i=2
п п
2 ^ a, A1)
;,/=2 /=2
+ 2^ + 22 biXi + Ь, A2)
где аххФО. Пусть также ЬХХФО. Придавая переменным х2, ..., хп
какие-либо числовые значения, мы превратим многочлены A1) и
A2) в многочлены от одной переменной хх. По доказанному выше
bu = kaxl9 S buxi + bx =
i = 2
п п п
2 bijXiXj + 22 btXi + b = l( 2 ацХ1Х} + 22 щх, + a),
i,j = 2 i = 2 \ i,j = 2 i = 2 '
183
где к — отличное от нуля комплексное число. Отсюда, согласно
лемме 27.1, с учетом произвольности значений х2, ..., хп получаем
равенства (9).
Пусть теперь Ьи = 0. Тогда многочлен Ф относительно х{ имеет
первую степень, и так как у многочленов F и Ф одни и те же корни, то
F = \<t>\ A3)
где А, — функция от х2, ..., хп: Х = Цх2, ..., хп).
Сравнивая в обеих частях равенства A3) коэффициенты при
х\, получаем ап = 4А,6?. Отсюда следует, что А, = const. Тогда из
равенства A3) находим: 6и=0, Ьц = 0, /, / = 2, ..., п. Итак, вопре-
вопреки предположению, многочлен Ф имеет первую степень.
Обратимся теперь к случаю, когда многочлены F) и (8) не со-
содержат квадратов переменных. Так как по крайней мере один из
коэффициентов aih /, /=1, 2, ..., я, отличен от нуля, положим,
например, а12фО. Преобразуем переменные:
*\=У\+У2> Х2 = У\—У2> Ъ = у(, * = 3, ..-, П.
Подставив эти выражения переменных в многочлены F) и (8),
получим:
п п п п
+ 22 ад + а = 2 aSiyty, + 22aiy, + a', A4)
l l il
2 6чх,х, + 22йЛ + 6= 2 Ы,у1у1 + 2ЪЫу1 + Ь', A5)
причем а[х = 2al2 фО.
Многочлены A4) и A5) относительно переменных ух, у2, ..., уп
удовлетворяют условию леммы, и для них справедливо доказатель-
доказательство, приведенное выше. Но тогда
2 bijXiXj + 2 2 btxi + 6=2 Ь'фу, + 22 bfyi + b' =
n n
= x( 2 aljyiyj + 22 aiyi + a'J =
(n n ч
2 a//jc/jc/ + 22a/Jc/ + a).
/./=1 /=i y
Отсюда и следуют равенства (9).^
Теперь можно утверждать, что имеет место
Теорема 27.1. Для того чтобы два уравнения:
2 a,7^ + 22aix, + a = 0,
«, / = 1 1 = 1
2 й|7^у + 22йл- + й = 0
задавали в выбранном репере одну и ту же квадрику, необходимо
и достаточно, чтобы коэффициенты этих уравнений были пропор-
пропорциональны, т. е. выполнялись равенства (9).
184
>Достаточность указанного условия отмечалась выше, необхо-
необходимость следует из леммы 27.3. 4(
Выясним теперь, как преобразуется уравнение квадрики при
переходе к новым координатам. Введем следующие обозначения:
А=[аи]у Л =[01 а2 ... ап\ S = [a//],
Х =
х2
х„
> Х' =
'<
х'2
' А2 =
а.
а2
= \х, х„
Тогда уравнение квадрики B) можно записать в виде
-2AlX + a = 0, A6)
а формулы преобразования координат при переходе от репера A)
к реперу
(О', ef, e?, ...,е?) A7)
в виде
Л — ОЛ +Л2 (,loj
(здесь jcj, jc2, ..., хл — координаты произвольной точки M?An(i)
относительно репера A),ах[, xj, ..., *« — координаты той же точки
относительно репера A7)). Подставляя выражение X из равенства
A8) в левую часть уравнения A6), получаем
ХТАХ
2АХХ
а = Х'ГВХ + 2BxXf + b, A9)
lS; Ь = АТ2АА2 + 2А{А2 + а. Здесь мы
где B = STAS] B[=AT2AS +
воспользовались равенствами:
Ат = At X'TSTAA2 = (X'TSTAA2)T = AT2ASX'.
Из равенства A9) следует, что уравнение квадрики B) отно-
относительно репера A7) имеет вид
Х'ТВХ' + 2В{Х' + Ь = 0. B0)
Заметим, что при переходе от уравнения B) к уравнению B0),
соответствующему преобразованию координат A8), квадратичная
форма ХТАХ преобразуется в квадратичную форму X'TBX't так же
как и в результате преобразования X = SX'.
Если рассматривать A8) как формулы аффинного преобразо-
преобразования пространства An(i)y мы получим следующую теорему.
Теорема 27.2. При аффинном преобразовании пространства
An(i) любая квадрика преобразуется в квадрику.
185
27.3. Пересечение квадрики с прямой
Выберем в пространстве An(i) некоторый репер и рассмотрим
квадрику, определяемую в этом репере уравнением
2 ai,xixl + 2iaixt + a = 0. A)
Найдем точки пересечения квадрики A) с прямой
dt, i= 1, 2,
пу
B)
где bi, Ci — действительные числа. Подставляя выражения x-t из
формул B) в уравнение A) и приводя подобные члены, получаем
уравнение относительно t:
C)
где
= 2 aijbiCj+ 2 (цс;
i,j=\
i= 1
q = 2j ciijbiCj + 2 ^ dibi + a.
Подставляя корни уравнения C) в качестве значений t в форму-
формулы B), получаем координаты всех искомых точек пересечения.
Рассмотрим следующие два случая:
п п
1) 2 ацС^фО; 2) 2 ацМ^О.
В первом случае уравнение C) — квадратное, и в зависимости
от значений его корней tx и t2 имеются три возможности:
а) tx, t2 действительны и различны, прямая B) пересекает квад-
квадрику A) в двух различных действительных точках;
б) t{ = t2 — действительное число, прямая B) имеет с квадри-
квадрикой A) одну общую действительную точку;
в) tx и t2 не действительны, прямая B) не пересекает квадрику
A) в действительных точках, но имеет с ней две общие мнимые
точки. „
Во втором случае имеем:
г) рф 0, уравнение C) —линейное,
Чл^ и прямая B) имеет с квадрикой A)
^ ^^ одну общую действительную точку;
д) р = 0, qфOy равенство C) не
выполняется, прямая B) не имеет с
квадрикой A) общих точек;
е) р = 0, <7 = 0, равенство C) явля-
является тождеством, все точки прямой B)
принадлежат квадрике, т. е. сама пря-
рис. 27.1 мая принадлежит квадрике.
186
На рис. 27.1 изображена гипербола и пять прямых различных
типов.
27.4. Асимптотические направления
Выберем в пространстве An(i) репер
(О, еь е2, ..., ел) A)
и рассмотрим квадрику
п п
2 OijXiX! + 22 aiXi + a = 0. B)
Пусть задан ненулевой вектор
фь с2, ..., сп\ C)
действительный или мнимый. Будем говорить, что все векторы ас,
где а— произвольное, отличное от нуля комплексное число, задают
в пространстве Vn{i) одно определенное направление, любой же
другой ненулевой вектор задает другое направление.
Направление, определяемое вектором C), будем называть дейст-
действительным, если существует такое число а, что все координаты
вектора ас действительны, в противном случае — мнимым.
Определение 27.3. Направление вектора C) называется
асимптотическим относительно квадрики B), если
п
2 a,/W/ = 0. D)
/, /=i
Поскольку левая часть уравнения квадрики B) в репере A)
определена с точностью до числового множителя, отличного от нуля,
определение асимптотического направления не зависит от выбора
уравнения заданной квадрики в фиксированном репере. Кроме того,
имеет место
Теорема 27.3. Асимптотическое направление относительно квад-
квадрики B) не зависит от выбора репера.
> Запишем уравнение квадрики B) в виде
2AiX + a = 0, E)
а равенство D), определяющее асимптотическое направление, в виде
СМС = 0, F)
где Ст = [с\ с2 ... сп\
Пусть переход к новому реперу задается формулами:
X = SX' + A2, G)
C = SC't (8)
где X' — столбец новых координат точки М; С — столбец новых
координат вектора C). В новом репере уравнение квадрики E)
имеет вид
X'TSTASX' + ВХХ' + 6 = 0. (9)
187
Используя формулу (8), получаем
= C'TSTASC.
Но отсюда следует, что равенство F) равносильно равенству
CTSlASC = Ot
определяющему асимптотическое направление относительно квад-
квадрики (9). ^
Проведенному сейчас рассуждению можно дать и другое истол-
истолкование, а именно: будем рассматривать равенства G) как формулы
аффинного преобразования пространства An(i), выражающие коорди-
координаты точки М(х\, х2, ..., хп) (прообраза) в репере A) через
координаты точки М' (х\, х'2, ..., х'п) (образа) в том же репере. При
этом преобразовании квадрика E) перейдет в квадрику (9),
а вектор C) —в вектор c'(d, с'2, ..., с'п). Тогда очевидно, что имеет
место следующая
Теорема 27.4. Пусть вектор с имеет асимптотическое (неасимп-
(неасимптотическое) направление относительно квадрики К и f — аффинное
преобразование пространства An(i) с однородной частью ф. Тогда
вектор ф(с) имеет асимптотическое (неасимптотическое) направле-
направление относительно квадрики /(/С).
Теперь мы можем утверждать, что проведенное в § 27.3 разде-
разделение действительных прямых пространства An(i) на шесть типов
относительно данной квадрики имеет аффинный характер, а именно:
справедлива
Теорема 27.5. Пусть в пространстве An(i) заданы квадрика К,
прямая П и аффинное преобразование f. Тогда прямая ДП) имеет
относительно квадрики f(K) тот же тип (см. § 27.3), что и прямая П
относительно квадрики К.
>Доказательство вытекает из теоремы 27.4 и того факта, что при
аффинном преобразовании пространства Ап{1) действительные точки
переходят в действительные, а мнимые—в мнимые.^
Докажем еще одну теорему, которая понадобится нам в даль-
дальнейшем.
Теорема 27.6. Существует п линейно независимых векторов,
имеющих неасимптотические относительно заданной квадрики B)
направления.
К следует из § 22.4, существует преобразование координат
Xi= 2 OLijXJ, /=1, 2, ..., Л, (Ю)
приводящее квадратичную форму 2 aqXiXj к нормальному виду
/ /1
2 е/D) , е,- = ±1, 0 < г < п.
/=1
Запишем уравнение квадрики B) в новом репере:
г п
.2е,DJ + 2 2 а]х] + а = Ъ. A1)
188
На основании теоремы 27.3 мы можем искать векторы неасимпто-
неасимптотически \ направлений исходя из уравнения A1), т. е. как векторы
с(с\, cf2, ..., c'n), удовлетворяющие неравенству
Очевидно, что векторы:
с, A, 0, ..., О, 0, ..., 0),
с2 @, 1, ..., 0, 0, ..., 0),
сг @, 0, ..., 1, 0, ..., 0),
с,+ , A, 0, ..., 0, 1, ..., 0),
с„ A, 0, ..., О, 0, ..., 1)
удовлетворяют условию теоремы. ^
27.5. Линии эллиптического, гиперболического и параболического
типов
Пусть на плоскости A2(i) выбран некоторый репер и задано
уравнение линии второго порядка
\ 2 + 022*2 + 2а\х{ + 2а2х2 + а = 0. A)
Векторы, имеющие относительно линии A) асимптотические направ-
направления, определяются равенством
а, ХС\ + 2а\2С\С2 + a^cl = 0. B)
Пусть вектор с имеет асимптотическое направление относительно
линии A). Так как любой вектор ас, где а — произвольное, отличное
от нуля комплексное число, имеет то же направление, то направление
вполне определяется заданием отношения C\\c<i координат вектора с,
если С2ФО. Мы будем употреблять запись С\\Съ и в том случае,
когда ?2 = 0, а именно: символ 1:0 задает направление базисного
вектора еь
Пусть а\\Ф0. У вектора, имеющего асимптотическое направле-
направление, с2=7^0, так как в противном случае из равенства B) следует
? , а аиф0 и С\ Ф 0. Запишем теперь равенство B) в виде
С\
Решая это квадратное уравнение относительно С\/с2, получаем
с2
Возможны следующие случаи:
1) а?2 — ^11#22 < 0, поэтому не существует действительных асимп-
189
тотических направлений относительно линии A), иначе, существует
два мнимых асимптотических направления;
2) а22— ама22>0, следовательно, существует два действитель-
действительных асимптотических направления;
3) а2\2 — а\\а22 = 0, поэтому существует одно действительное
асимптотическое направление.
Если ац=0, a а22Ф0, то, меняя ролями С\ и с2у приходим
к тем же случаям.
Наконец, пусть ам=0 и а22 = 0. Тогда а\2ф0, и уравнение B)
принимает вид а[2С\С2 = 0. В этом случае существует два асимпто-
асимптотических направления, определяемых векторами сA, 0) и с'@, 1).
Определение 27.4. Линия второго порядка на плоскости
A2 (i) называется линией эллиптического, гиперболического или пара-
параболического типа в соответствии с тем, к какому из трех указанных
выше случаев она относится.
При аффинных преобразованиях плоскости A2(i) линия второго
порядка не может изменить свой тип, так как при этом действитель-
действительные асимптотические направления переходят в действительные.
Пример 27.1. Найти асимптотические направления линии
х\ — Злг|лг2 + 2x'i — 5лг, + 2х2 — 3 = 0. C)
Решение. Координаты С\ и с2 вектора, имеющего асимптотическое направление,
находятся из уравнения
c'i — Зс\С2-\-2с2 = 0.
Перепишем это уравнение в виде
Оно имеет два решения: С\\с2 = 2:\ и с\\с2= 1:1, и, следовательно, линия C) —
гиперболического типа.
Упражнения
1. Докажите, что на плоскости Е2 эллипс является линией эллиптического типа;
гипербола и пара пересекающихся прямых — линиями гиперболического типа;
парабола, пара параллельных прямых и прямая—линиями параболического типа.
2. Прямая в пространстве An(i) имеет асимптотическое направление, если ее
направляющий вектор имеет асимптотическое направление относительно квадрики.
Нарисуйте фигуры, образованные в пространстве Е3 всеми прямыми, имеющими
асимптотическое направление относительно однополостного и двуполостного гипер-
гиперболоидов.
27.6. Центр квадрики
Пусть в пространстве An(i) выбран некоторый репер и задана
квадрика уравнением
п п
_ ^, QijXiXj + 2 2 а^ + а = 0. A)
Предположим, что точка В(Ь\, Ь2> ..., Ьп) — центр квадрики A)
(см. § 25.8). Рассмотрим прямую
xi = bi + dt9 /=1, 2, ..., я, */,?,-€ R, B)
190
имеющую неасимптотическое направление. Как известно из § 27.3,
прямая B) имеет с квадрикой A) две общие точки, различные или
совпадающие. Для отыскания этих точек подставим значения xt из
формул B) в уравнение A) и приведем подобные члены. Получим
t2 2 aijcici + 2/2(^2 ацЬ, + щ )d + q = 0, C)
где
q = 2 aijbibj + 22 аД- + a.
i, /=1 i= I
Если t\ и r2 — корни уравнения (З), то точками пересечения
прямой B) с квадрикой A) будут:
Так как точка В является серединой отрезка М\М2, то (см. § 25.8)
g|/2) с
г= ^+^-(/i + /2), t=U 2, ..., л. D)
Поскольку среди чисел
С\, с2, ..., сп E)
есть отличные от нуля, то из равенств D) следует, что /, + /2 = 0.
Но тогда в квадратном уравнении C) коэффициент при первой
степени / должен быть равен нулю, т. е.
п п
Z(Za,ibi + at)ct = O. F)
Рассмотрим F) как систему линейных однородных уравнений
относительно неизвестных E) (система состоит из одного уравне-
уравнения). Она должна удовлетворяться для любого неасимптотического
направления. Как известно из § 27.4, существует п линейно незави-
независимых решений этой системы, и, следовательно, ее ранг равен
нулю, т. е.
п
2 fll76/ + fli = 0, i=l, 2, ..., /1. G)
/=1
Системе G) должны удовлетворять координаты bt любого цент-
центра квадрики A). Верно и обратное: любая точка В(Ь\, Ь2у ..., Ьп\
удовлетворяющая системе G), является центром квадрики A), так
как из равенств G) следуют равенства D).
Перепишем систему G) в виде
п
2 CLijXj + Щ = 0, /=1, 2, ..., П. (8)
/=1
191
,
Итак, решения системы (8), и только они, являются координатами
центров квадрики A). Так как система (8) —линейная, то множест-
множество центров квадрики A), если оно непустое, является плоскостью
пространства An(i).
Определение 27.5. Квадрика, имеющая единственный центр,
называется центральной.
Рассмотрим теперь плоскость A2(i). Пусть в некоторой аффинной
системе координат задано уравнение линии второго порядка
аих2\+ 2а,2*1*2 + 022*1 + 2а,*, + 2а2*2 + а = 0. (9)
Система уравнений для определения координат центра имеет вид
а 11X1 —J— а, 2*2 ¦
^12*1 ~т" ^22*2
Так как для линий эллиптического и гиперболического типов
определитель системы A0)
\а\\ а,2
|а,2 <
то каждая из этих линий имеет единственный центр, т. е. является
центральной линией. Таким образом, линии эллиптического и гипер-
гиперболического типов — центральные.
У параболы х\ — 2р*2 = 0 нет центра, так как второе уравнение
системы A0) дает р = 0, что противоречит определению параболы.
Для пары параллельных прямых
*?-а2 = 0 A1)
система A0) сводится к одному уравнению *, =0. Отсюда следует,
что каждая точка прямой, задаваемой этим уравнением, является
центром линии A1), т. е. линия A1) имеет прямую центров. Это же
справедливо для линии х2 = 0.
Упражнения
1. Пусть квадрика A) имеет хотя бы один центр. Найдите размерность
плоскости, состоящей из всех центров квадрики A).
2. Докажите, что линия второго порядка (9), имеющая центр, принадлежащий
этой линии, распадается на две прямые (различные или совпадающие).
27.7. Диаметральные плоскости
Пусть в пространстве An(i) выбран некоторый репер и задана
квадрика
п п
2 ацъх, + 22 ад, + а = 0. A)
/, / = 1 1=1
Пусть, далее,
х, = Ь, + Ы, i=l, 2, .... п, B)
есть уравнения прямой, направляющий вектор которой
С(С, С2, .-, Сп) C)
192
имеет неасимптотическое относительно квадрики A) направление.
Прямая B) пересекает квадрику A) в двух точках: М'(х{9 х!>, ...,
х'п) и М"(хл, х'{, ..., Хп% быть может, совпадающих.
Определение 27.6. Отрезок М'М", определяемый двумя точ-
точками, принадлежащими квадрике A), называется хордой этой
квадрики.
Если в качестве начальной точки B(bu b2, ..., Ьп) прямой B)
взять середину хорды АГАР, то должно выполняться равенство F)
из § 27.6:
п п
2 ацсф^ 2 а,с, = 0. D)
i, /= 1 /= 1
(Если М' = М", то положим В = М' = М".)
Рассмотрим теперь все прямые с заданным направляющим
вектором C). Середины хорд, отсекаемых на этих прямых квадри-
квадрикой A), образуют множество точек, определяемое уравнением
п п
2 ацсх, + 2 afit = 0, E)
которое получается из равенства B) заменой обозначений Ь\ на х-}.
Уравнение E) —линейное. В самом деле, если в этом уравнении все
коэффициенты при х} — нули, т. е.
п
.2^== 0, /=1, 2, ..., л,
то, умножая каждое из этих равенств на соответствующее с} и сум-
суммируя по /, получаем
п
2 aijCiCj = O9
т. е., вопреки предположению, вектор C) имеет асимптотическое
направление. Таким образом, верна
Теорема 27.7. Множество середин хорд, отсекаемых квадрикой
A) на всех параллельных прямых с направляющим вектором C),
имеющим неасимптотическое направление, является гиперплос-
гиперплоскостью с уравнением E).
Определение 27.7. Гиперплоскость E) называется диамет-
диаметральной гиперплоскостью квадрики A), сопряженной с направле-
направлением вектора C).
Очевидно, что диаметральная плоскость — аффинное понятие.
Упражнения
1. Докажите, что если квадрика в An(i) имеет хотя бы один центр, то всякая
гиперплоскость, содержащая все центры данной квадрики, является ее диаметральной
гиперплоскостью.
2. Докажите, что каждая диаметральная плоскость квадрики в пространстве
An(i) проходит через любой центр этой квадрики.
193
13. За к. 6466
27.8. Диаметры линий второго порядка
Рассмотрим плоскость A2(i). Выберем некоторый репер и зададим
линию второго порядка с уравнением
а22х\ + 2ахх\ + 2а2х2 + а = 0. A)
В этом случае диаметральная гиперплоскость является прямой и на-
называется диаметром. Уравнение диаметра, сопряженного с неасимп-
неасимптотическим направлением вектора с(с\, с2), имеет вид
(anci 4- ах2с2)х\ + (а12с\ + а22с2)х2 + ахс\ + а2с2 = 0. B)
Как отмечалось в предыдущем параграфе, каждый диаметр линии
A) проходи-i через любой ее центр. Для линии A), имеющей прямую
центров, вопрос о диаметрах решается теперь полностью: у такой
линии имеется только один диаметр — прямая центров.
Рассмотрим теперь вопрос о диаметрах центральной линии A).
В этом случае
а\\а22 — а2\2фО. C)
Определение 27.8. Два направления С\:с2ис\: с2 называются
сопряженными относительно центральной линии второго порядка (I),
если они удовлетворяют соо^чашению
ах \c\c\ + ах2{с\с'2 + с2с\) + a22c2cf2 = 0. D)
Отметим основные свойства сопряженных направлений.
1. Каждому направлению С\:с2 соответствует в качестве сопря-
сопряженного одно вполне определенное направление с\:с2.
>В самом деле, перепишем равенство D) в виде
(а\ \С\ + а\2с2)с\ + (а\2с\ + а22с2)с2 = 0. E)
Если предположить, что
а>\\С\ + а\2с2 = 0,1 /gx
= 0j
то в силу неравенства C) мы получим, что система уравнений F)
относительно неизвестных С\ и с2 имеет только нулевое решение:
С\ =0, с2 = 0. Но это невозможно, так как вектор с(с\, с2)— ненуле-
ненулевой. Итак, оба коэффициента при с\ и с2 в уравнении E) не могут
одновременно обратиться в нуль, и, следовательно, из уравнения мы
найдем вполне определенное отношение с\:с2.^
2. Асимптотическое направление, и только оно, сопряжено
самому себе.
> В самом деле, если для данного направления С\: с2 сопряженным
является само это направление, то равенство D) дает
ах \с\ + 2аХ2С\С2 + а22с\ = 0, G)
т. е. направление С\\с2 — асимптотическое.
Обратно, если направление С\:с2 — асимптотическое, т. е. удов-
удовлетворяет равенству G), то равенство D) выполняется, если
194
с\ = С\ и cf2 = C2. Следовательно, направление С\:С2 сопряжено само-
самому себе. <Ц
3. Если направление С\:С2 — неасимптотическое, то сопряженное
направление также неасимптотическое и является направлением
диаметра, сопряженного с направлением С\:С2.
>В самом деле, диаметр, сопряженный с неасимптотическим на-
направлением С\:С2,— это прямая B). Для направляющего вектора
с'(с'\, сг2) этой прямой выполняется условие
c\:cf2= —(a\2C\ +a22C2):(auC\ +ai2c2),
откуда и следует равенство E).^
Определение 27.9. Два диаметра линии второго порядка,
имеющие взаимно сопряженные направления, называются сопряжен-
сопряженными диаметрами.
Из определения диаметра следует, что каждый из двух сопряжен-
сопряженных диаметров делит пополам все хорды, параллельные другому
диаметру.
На рис. 27.2 изображены эллипс, два его взаимно сопряженных
диаметра и параллельные им хорды.
Мы знаем, что любой диаметр центральной линии
второго порядка A) проходит через ее центр. По-
Покажем теперь, что любая прямая / неасимптотиче-
неасимптотического направления, проходящая через центр цен-
центральной линии второго порядка, является диамет-
диаметром этой линии. В самом деле, пусть С\ : С2 определяет рнс. 27.2
направление прямой / и с\:с'2 — сопряженное на-
направление, причем оба этих направления являются неасимпто-
неасимптотическими. Рассмотрим диаметр, сопряженной с направлением
с[ : cf2. Он имеет направление С\'.С2 и, проходя через центр ли-
линии A), совпадает с прямой /.
Теперь рассмотрим диаметры параболы. Пусть парабола в неко-
некоторой ортонормированной системе координат задается уравнением
2pjc, — jc| = 0. (8)
Уравнение диаметра параболы (8), сопряженного с направле-
направлением С\ : С2, имеет вид рс\—с2*2 = 0. Отсюда следует, что все ди-
диаметры параболы параллельны ее оси и любая прямая, параллельная
оси параболы, является диаметром.
Пример 27.2. Записать уравнение диаметра линии
Ъх\ — \ххх2 — 6х, — 2х2 + 1 = 0, (9)
проходящего через точку МB, —4).
Решение. Уравнение B) для линии (9) имеет вид
Eх, - 2х2 - 3)с, - Bх, + \)с2 = 0. A0)
Координаты точки М должны удовлетворять этому уравнению, следовательно, Зс, =
= с2. Подставляя выражение с2 через сх в уравнение A0), сокращая на с, и приводя
подобные члены, получаем хх -\- 2х2 + 6 = 0—уравнение искомого диаметра
195
27.9. Приведение уравнения квадрики к нормальному виду
с помощью преобразования координат
Пусть в пространстве An(i) выбран некоторый репер и задано
уравнение квадрики
п п
2 ctijXiXj + 2 2 diXi + а = 0. A)
I, / = 1 / = 1
Постараемся за счет преобразования координат упростить это урав-
уравнение.
Как известно из § 22.4, существует преобразование координат
xi= 2 atkxi, i= 1, 2, ••• , л, B)
где det[a^]=^0; a^ — действительные числа, приводящие квадра-
п п
тичную форму 2 a/yX/Ху к нормальному виду 2 е,(х/J, где е, =
/, /= 1 <=1
= ±1; 0. Уравнение квадрики A) в новых координатах имеет вид
2 ф!J + 22 aixi + a = 0, C)
l i\
где б, = dh 1; 0.
Если Е[Ф 0 для некоторого /, то с помощью преобразования
координат можно исключить член с первой степенью х[. Пусть, на-
например, е{Ф0. Имеем
Выполним теперь преобразование координат, заданное форму-
формулами:
хх=х[ + а\/еи Xi = x[i / = 2, 3, •••, п.
Такое преобразование называется параллельным переносом репера.
При переходе к новым координатам в уравнении квадрики C)
коэффициент при квадрате первой координаты сохранится, первая
степень первой координаты исчезнет, свободный член получит до-
дополнительное слагаемое. Аналогичные преобразования мы произве-
произведем и с другими координатами, для которых г^фО.
Предположим, что в уравнении C)
е,=И=0, е2ф0, ••-, ггф0, ег + ,=0, ..., ел = 0. D)
Этого всегда можно добиться. В самом деле, если, например, 8, =0,
а 8г + 1=т^0, то, совершив преобразование координат по формулам:
х\=х'г + \9 *г+1=*ь Xi = x!,i=?l, r-f-1, мы придем к тому, что
коэффициент при х\ будет равен ±1.
Итак, предполагая, что выполнены условия D), и выполняя
1%
указанные выше параллельные переносы репера, мы приводим урав-
уравнение квадрики D) к виду
г п
2е,*? + 2 2 afXi + b = 0. E)
i=\ /=r+l
Пусть arr+\ =а'г+2 = ••• =а'п = 0, т. е. уравнение E) имеет вид
2 Eixf + Ь = 0. F)
Если ЬфОу введем обозначения А,,- =—е,/6, /=1, 2, ..., г. Тогда
уравнение F) примет вид
1. G)
Преобразуя координаты по формулам:
Xi = ykiXiy если
Xj=^/—XjXh если /
Xjfe = x/fe для остальных
приводим уравнение G) к виду
!=1, Ц,= ±1, 0<г<«. (8)
1=1
Если в уравнении F) 6 = 0, то это уравнение имеет вид
г
2 EiX? = 0, 8/ = ± 1, 0 < Г < П. (9)
1 = 1
Пусть теперь в уравнении E) среди коэффициентов а/ есть от-
отличные от нуля, например а^+1=й=0. Выполним преобразование ко-
координат:
п
Xr-hi = — 2 ajxj — i
Xi = xif 1фг+1.
Тогда уравнение E) примет вид
<«. A0)
Определение 27.10. Уравнения (8) — A0) называются нор-
нормальными уравнениями квадрик в пространстве An(i).
Таким образом, имеет место
Теорема 27.8. Любая квадрика пространства An(i) в подходя-
подходящем репере может быть задана нормальным уравнением.
Выясним геометрический смысл системы координат, в которой
квадрика задается нормальным уравнением (8), (9) или A0). Рас-
197
смотрим вектор е,-, Кг. Диаметральная гиперплоскость, сопряжен-
сопряженная с направлением этого вектора, имеет уравнение
* = 0. A1)
Определение 27.11. Гиперплоскость A1) называется коорди-
координатной гиперплоскостью репера (О, е1э е2, ..., ея).
Таким образом, для вектора е,, К г, сопряженная с ним диамет-
диаметральная гиперплоскость является координатной. Если же i>r,
то вектор е, имеет относительно квадрики асимптотическое направ-
направление.
Заметим, что уравнения (8) и (9) в отличие от уравнения A0)
не содержат первых степеней неизвестных. Это связано с тем, что
у каждой из квадрик (8), (9) есть по крайней мере один центр —
начало координат, а у квадрики A0) центра нет, что легко проверить.
Имеет место
Теорема 27.9. Для того чтобы в уравнении квадрики отсутство-
отсутствовали члены с первыми степенями неизвестных, необходимо и до-
достаточно, чтобы начало координат являлось центром квадрики.
>Если начало координат является центром квадрики, то урав-
уравнения центра:
п
2 ацх} + at: = 0, /=1, 2, •••, я,
имеют решение х1==01 х2 = 0, ..., хп = 0. Следовательно, al==0i
а2 = 0, ..., ап = 0.
Обратно, если в уравнении A) нет членов первой степени, то
этому уравнению наряду с точкой М(хи хъ ..., хп) удовлетворяет
и точка Af'( — *,, — х2, •••, —хп), и, следовательно, начало координат
является центром квадрики.^
27.10. Аффинная классификация квадрик
Рассмотрим нормальные уравнения квадрик пространства An(i),
полученные в предыдущем параграфе:
+ ...+^=l, 0<г<я, ?>0, A)
+ ...+jtr2 = 0, 0<г<я, 0<?<г/2,
B)
+ ...+jtr2 = 2jtr.H, 0<г<я, 0<&<г/2.
C)
Пусть квадрика Ф задана в репере
(О, е„ е2, ..., ея) D)
уравнением A), а квадрика Ф' — в репере
(О', е{, е$, ... , е'п) E)
тем же уравнением (с теми же г и k). Рассмотрим аффинное преоб-
преобразование пространства An(i), переводящее репер D) в репер E).
198
При этом преобразовании квадрика Ф как множество всех точек
пространства, координаты которых в репере D) удовлетворяют
уравнению A)>перейдет в квадрику Ф', состоящую из всех точек,
координаты kotoJtw^b репере E) удовлетворяют тому же уравне-
уравнению. Приведенное рассуждение применимо к любым двум квадрикам,
которые в подходящих реп^ра^задаются одним и тем же из нор-
нормальных уравнений A) — C) (прт^о^них и тех же г и k)\ для таких
квадрик существует аффинное преобразование пространства An(i\
переводящее одну из них в другую.
Пусть теперь Ф и Ф' — две квадрики, которые в репере D)
задаются соответственно уравнениями:
п п
ZaijXiXj +22 aiXi + a = 0, F)
j
2 a!ix[x'j+2^a!x! + a' = 0. G)
(В последнем уравнении для удобства дальнейших рассуждений
мы поставили штрихи у координат.) Пусть, далее, существует аф-
аффинное преобразование / пространства An(i), переводящее квадрику
F) в квадрику G). Запишем формулы этого преобразования в виде
п
xi= Zaijxj + ai, /==1, 2, ..., я, (8)
где det[a//]=^=0; щ, a, — действительные числа; *,, jc2, ..., хп —
координаты произвольной точки М пространства An(i) в репере D);
*{, х'2, ..., Хп — координаты точки f(M) в том же репере.
Если в левую часть уравнения F) подставить выражения *,-, х\
из формул (8), то получится выражение, отличающееся от левой
части уравнения G) лишь постоянным действительным множителем
ЬфО. При этом квадратичная форма
п
2 (9)
jj
преобразуется в квадратичную форму
b i a!jx!xh A0)
причем коэффициенты а'ц не зависят от а/, т. е. переход от формы (9)
к A0) совершается фактически с помощью преобразования коор-
координат:
п
xi= 2 aijX'j, i= 1, 2, ... , /i, A1)
где det[a/y]=^=O; at/ — действительные числа, с последующим умно-
умножением на действительное число b Ф 0.
Покажем теперь, что от любого из нормальных уравнений A) —
C) нельзя перейти к какому-либо другому нормальному уравнению
199
с прмощью преобразований (8). Иначе говоря, мы покажем, что
квадрики пространства An(i), задаваемые различными нормальными
уравнениями, не переводятся друг в друга с помощью аффинных
преобразований этого пространства.
Квадрика C) отличается от квадрик (i) и B) отсутствием
центров. Далее, в отличие от квадрики A) любой центр квадрики B)
принадлежит этой квадрике. Если теперь сравнить квадратичные
формы двух нормальных уравнений одного и того же вида, напри-
например B) при несовпадающих г или k, то мы увидим, что они разли-
различаются либо рангом г, либо величиной s= \r — 2k\. Но при преоб-
преобразовании A1) ранг и величина s не меняются, а при умножении
на действительное число ЬфО ранг не меняется, а число г — 2k
может изменить только знак. Проведенные выше рассуждения по-
позволяют сформулировать следующую теорему.
Теорема 27.10. Разобьем множество всех квадрик пространства
An(i) на классы, отнеся к одному классу все квадрики, которые в
подходящих реперах задаются одним и тем же нормальным урав-
уравнением. Это разбиение на классы является отношением эквивалент-
эквивалентности в множестве всех квадрик. Все квадрики, принадлежащие
одному классу, аффинно эквивалентны. Квадрики, принадлежащие
различным классам, аффинно различны, т. е. не могут переводиться
друг в друга с помощью аффинных преобразований пространства
An(i).
27.11. Аффинная классификация линий второго порядка на
плоскости A2(i)
Изучим детальнее аффинную классификацию линий второго по-
порядка на плоскости A2(i) и сопоставим ее с классификацией, полу-
полученной в гл. 15 для плоских фигур второго порядка.
Согласно теореме 27.8, любая линия второго порядка на пло-
плоскости A2(i) может быть задана в подходящем репере одним из сле-
следующих нормальных уравнений:
*? + *!= 1, A)
х* + 4=-1, B)
х2-х2=\, C)
*?-*! = <>, D)
х2 + х2 = 0, E)
х2 = 2х2, F)
*?-1=0, G)
*?+1=0, (8)
х2 = 0. (9)
Множество всех линий второго порядка на плоскости A2(i) рас-
распадается на непересекающиеся классы. Линии, принадлежащие одно-
одному классу, задаются в подходящих реперах одним и тем же нормаль-
нормальным уравнением. Кроме того, каждая из этих линий может быть
переведена в любую другую линию из того же класса с помощью
200
некоторого аффинного преобразования. Для двух линий из разных
классов не существует аффинного преобразования, переводящего
одну линию в другую.
Рассмотрим плоскость Е2, фигурирующую в гл. 15, как множество
действительных точек плоскости A2(i) и выясним отношение различ-
различных плоских фигур второго порядка к аффинным классам линий
второго порядка, определяемым уравнениями A) — (9).
Начнем с уравнения A). Покажем, что оно задает эллипсы.
В самом деле, произвольный эллипс можно задать в подходящей
прямоугольной системе координат Оху с помощью уравнения
х2 и2
^r + jr = \. A0)
Совершим переход к аффинной системе координат Оххх2 по фор-
формулам: x = axl, y = bx2. Подставляя эти выражения в левую часть
уравнения A0), получаем х2-\-х1=\. Таким образом, эллипс A0)
задается в подходящей аффинной системе координат нормальным
уравнением A). Линия второго порядка, заданная на плоскости
A2(i) уравнением A), кроме действительных точек, образующих
эллипс A0), содержит еще и мнимые точки. В качестве примера
укажем точку M(i, Л/2), координаты которой удовлетворяют урав-
уравнению A).
Пусть теперь на плоскости А2A) задана произвольная линия /
второго порядка с уравнением A) в некоторой аффинной системе
координат. Рассмотрим множество /' всех действительных точек
линии / и покажем, что /' — эллипс. Во-первых, отметим, что /' —
фигура в плоскости Е2, заданная в аффинной системе координат
Ох{х2 уравнением A). Перейдем к какой-либо прямоугольной систе-
системе координат Оху. Как показано в § 27.2, уравнение A) перейдет
в уравнение второй степени относительно х, у, задающее фигуру /'
в прямоугольной системе координат. Следовательно, /' есть плоская
фигура второго порядка. В соответствии с § 27.5 находим, что / —
линия эллиптического типа. Но тогда /' не может быть гиперболой,
параболой, парой пересекающихся или параллельных прямых, пря-
прямой. С другой стороны, /' не является точкой и пустым множеством.
Согласно теореме 15.1, получаем, что /'— эллипс.
Итак, доказано, что класс линий второго порядка, определяемых
каноническим уравнением A), состоит из всех эллипсов, и только
из них.
Перейдем к уравнению B). Ему не удовлетворяет ни одна дейст-
действительная точка. В плоскости Е2 это уравнение задает пустое мно-
множество. Однако в плоскости A2(i) есть мнимые точки, удовлетворяю-
удовлетворяющие уравнению B), например точка MBi, \3). Линия второго
порядка, определяемая на плоскости A2(i) уравнением B), назы-
называется мнимым эллипсом.
Уравнение C) исследуется аналогично уравнению A). Линия
второго порядка, заданная на плоскости A2(i) уравнением C),
называется гиперболой. Она состоит из обычной гиперболы, изу-
изученной в § 15.2, 15.3, и некоторого множества мнимых точек.
14. Зак. 6466 201
Рассмотрим уравнение D). На плоскости Е2 оно задает пару
обычных прямых:
хх — х2 = О, хх -\- х2 = О, A1)
пересекающихся в начале координат. На плоскости А2A) к действи-
действительным точкам прямых A1) добавляются мнимые точки этих
прямых, заданных теми же уравнениями.
Уравнение E) было рассмотрено в § 27.2. На плоскости Е2 оно
задает точку О@, 0), а на плоскости А (/) — пару мнимых прямых:
jCj — /л:2 = 0, xx-\-ix2 = Q, пересекающихся в действительной точке
0@, 0).
Уравнение F) задает на плоскости Е2 параболу, которая на
плоскости A2(i) дополняется мнимыми точками. Полученная линия
второго порядка также называется параболой.
Уравнение G) задает на плоскости Е2 пару параллельных пря-
прямых:
*, = 1, хх = -\. A2)
На плоскости A2(i) к действительным точкам прямых A2) до-
добавляются мнимые точки прямых, заданных теми же уравнениями.
Уравнение (8) задает на плоскости Е2 пустое множество. Рас-
Рассматривая это уравнение на плоскости A2(i), удобно представить
его в виде (хх —i)(xx-\- i) = 0. Очевидно, что это уравнение зада-
задает на плоскости A(t) пару мнимых параллельных прямых: хх — / =
= 0, хх + i = 0.
Наконец, уравнение (9) задает на плоскости Е2 прямую, а именно:
координатную ось Ох2. С учетом того, что (9) есть уравнение вто-
второй степени, говорят, что это уравнение задает сдвоенную прямую
как на плоскости Е2, так и на плоскости A(i).
Упражнения
1. Проведите исследование уравнений C) и F), которое мы опустили в тексте
параграфа.
2. Для каждой из линий второго порядка A) — (9) укажите свойства, отли-
отличающие ее от других линий второго порядка (наличие центров, характер асимпто-
асимптотических направлений и т. д.).
27.12. Аффинная классификация поверхностей второго порядка
в пространстве A3(i)
В этом параграфе мы подробнее рассмотрим аффинную класси-
классификацию поверхностей второго порядка в пространстве Az(i) и со-
сопоставим ее с результатами, полученными в гл. 16 для фигур вто-
второго порядка в пространстве Е3.
Как показано в § 27.9, любая поверхность второго порядка в
пространстве Az(i) может быть задана в подходящем репере одним
из следующих нормальных уравнений:
*? + *! + *!= 1, A)
*? + ** + *§=-1, B)
202
*!-**= i. C)
l4=-U D)
x\ + x\-x\ = 0. E)
лг? + *! + *! = о, F)
x2l+x22 = 2x3, G)
4-4 = 2x3, (8)
дс? + дс|=1, (9)
*? + *!=-!. A0)
*?-*?= L (И)
*? = 2ж2, A2)
ж? —д| = 0, A3)
ДС? + Jf| = 0, A4)
л:?-1=0, A5)
л:?+1=0, A6)
4 = 0. A7)
Множество всех поверхностей второго порядка в пространстве
A3(i) распадается на непересекающиеся классы. Поверхности, при-
принадлежащие одному классу, задаются в подходящих реперах одним
и тем же нормальным уравнением. Далее, каждая из этих поверх-
поверхностей может быть переведена в любую другую поверхность того
же класса с помощью некоторого аффинного преобразования. С дру-
другой стороны, поверхность одного класса не может быть переве-
переведена в поверхность другого класса никаким аффинным преобра-
преобразованием.
Рассмотрим точечное трехмерное евклидово пространство Е2
как множество действительных точек пространства A3(i) и выясним
отношение различных фигур второго порядка, рассмотренных в гл.
16, к аффинным классам поверхностей второго порядка, опреде-
определяемым уравнениями A) — A7).
Покажем, что класс поверхностей второго порядка, определяе-
определяемых уравнением A), включает все эллипсоиды. В самом деле, про-
произвольный эллипсоид задается в подходящей прямоугольной си-
системе координат Oxyz уравнением
Выполним переход к аффинной системе координат Ох{х2х3 по
формулам: х = ахи y = bx2, z = cx3. В новой системе координат
эллипсоид A8) будет задаваться уравнением A). Итак, рассматри-
рассматриваемая поверхность второго порядка, определяемая уравнением A),
включает эллипсоид в качестве множества действительных точек.
Кроме того, эта поверхность содержит и мнимые точки. Поверхности
второго порядка в пространстве Л3(/), заданные в подходящих
системах координат уравнением A), называются эллипсоидами.
Поверхность, заданная уравнением B), называется мнимым эллип-
эллипсоидом.
203
Уравнение C) задает в пространстве Е2 однополостный гипер-
гиперболоид, а уравнение D) — двуполостный гиперболоид. В простран-
пространстве А3A) они дополняются мнимыми точками. Интересно отме-
отметить, что в пространстве Е3 однополостный гиперболоид C) содер-
содержит два семейства прямолинейных образующих, одно из них зада-
задается системой уравнений:
Х(х1
Двуполостный гиперболоид D) в пространстве Е3 не содержит
прямых, однако в пространстве A3(i) он имеет мнимые прямые:
K(xl-x3)=\x{i — x2\ ]
\i(xx+x3) = b(i + x2).f
Уравнение E) задает конус. В пространстве Е3 он образован
действительными прямыми, содержащими только действительные
точки и проходящими через начало координат. В пространстве
A3(i) конус E) состоит из тех же прямых, но расширенных за счет
их мнимых точек. Похожее на E) уравнение F) определяет в про-
пространстве Е3 единственную точку О@, 0, 0). Поверхность, задан-
заданная уравнением F) в пространстве Л3(/), состоит из мнимых пря-
прямых, пересекающихся в действительной точке О@, 0, 0). Она назы-
называется мнимым конусом.
Уравнения G) и (8) задают соответственно эллиптический и
гиперболический параболоиды. Относительно прямолинейных обра-
образующих можно сделать то же замечание, что и для поверхностей
C) и D).
Уравнение (9) задает эллиптический цилиндр. В пространстве
Е3 он состоит из действительных прямых:
= \х(\ — х
2\
)
(jIX| = Л( 1 —Г" Л2у,
параллельных оси Ох3 и проходящих через точки эллипса:
х\ "Г Х2 —
В пространстве A3(i) эллиптический цилиндр (9) состоит из
всех прямых, параллельных оси Ох3 и проходящих через действи-
действительные и мнимые точки эллипса A9).
Поверхность A0) не содержит ни одной действительной точки.
В пространстве A3(i) она состоит из мнимых прямых:
параллельных оси Ох3 и проходящих через точки мнимого эллипса:
х2 -U х2 — 1 )
204
Поверхность A0) в пространстве A3(i) называется мнимым
эллиптическим цилиндром.
Уравнения A1) и A2) задают соответственно гиперболический
и параболический цилиндры. Первая из этих поверхностей имеет
прямую (ось Ох3), состоящую из центров цилиндра. Поверхность
A2) центров не имеет.
Уравнение A3) задает в пространстве Е3 пару плоскостей, х,—
— х2 = 0, xl-\-x2 = 0, пересекающихся по оси Ох3. В пространстве
A3(i) эти плоскости пополняются мнимыми точками. Уравнение A4)
задает в пространстве Е3 прямую (ось Охъ). В пространстве же
A3(i) поверхность A4) состоит из двух мнимых плоскостей,*! — ix2 =
= 0, х{ -\-ix2 = 0, пересекающихся по действительной прямой (оси
Ох,).
Уравнение A5) задает пару параллельных плоскостей: х,—
— 1=0, хх + 1 =0, а уравнение A6) — пару мнимых параллель-
параллельных плоскостей: хх— / = 0, x{-\-i = Q.
Наконец, уравнение A7) задает сдвоенную плоскость.
Пример 27.3. Определить аффинный класс поверхности второго порядка в
пространстве Е3, заданной в прямоугольной системе координат уравнением
х2 - 2у2 + z2 + Аху - IOjcz + Ayz + 2х + \6у - г + 2 = 0. B0)
Решение. Преобразуем уравнение B0):
(х2 + Аху — Wxz + 2х) — 2у2 + Ayz + \6у + z2 — z + 2 = 0,
(jc + 2у — bz + IJ — 6y2 + 2Ayz + \2y — 2Az2 + 9z + 1 = 0,
{x-\-2y — 5z+ IJ — 6(# —2z+ IJ— 15z + 7 = 0. B1)
Совершим преобразование координат по формулам:
1), z' = A5z-7)/2.
В новых координатах уравнение B1) примет вид (х'J — (у'J = 2z'. Таким обра-
образом, уравнение B0) задает гиперболический параболоид.
Упражнения
1. Для каждой из поверхностей A) — A7) укажите свойства, отличающие ее
от других поверхностей второго порядка (наличие и характер асимптотических на-
направлений, наличие центров, действительных точек и прямых и т. д.).
2. Сколько аффинных классов квадрик имеется в пространстве Л4(/)?
27.13. Приведение уравнения квадрики в пространстве Е"(/)
к каноническому виду
Пространство An(i) было получено путем вложения действитель-
действительного аффинного пространства Ап в комплексное аффинное прост-
пространство Ап(С). Теперь мы модифицируем пространство An(i), пре-
превратив аффинное пространство Ап в точечное евклидово простран-
пространство ЕЛ.
Определение 27.12. Пространство An(i), в котором действи-
действительная часть Ап превращена в евклидово точечное пространство
Еп, будем называть комплексной оболочкой я/ >странства Еп и
обозначать En(i).
205
Пусть в пространстве En(i) в ортонормированном репере
(О, 1,, 12, ..., 1Я) A)
задано уравнение квадрики Ф:
п п
_ 2^ t aijXiXj + 2 Д aiXi + a = 0. B)
Упростим уравнение квадрики B) с помощью подходящего вы-
выбора ортонормированного репера. Согласно теореме 24.21, существу-
существует преобразование
п
Xi= 2 OLijXl 1=1, 2, ..., Л, C)
где [а*/] — действительная ортогональная матрица, приводящее квад-
п п
ратичную форму 2 a^XiXj к виду 2 bfaff, где 6Ь 62, ..., &« —
/, /=1 /=1
собственные значения матрицы [пц\
Будем рассматривать равенства C) как формулы преобразования
координат, соответствующего переходу от репера A) к новому орто-
нормированному реперу
(О, И, i'2, ..., Vn). D)
Подставляя выражения xt из формул C) в уравнение B) и
приводя подобные члены, получаем уравнение квадрики B) в новых
координатах:
2
1=1
E)
Определение 27.13. Ортонормированный репер, в котором
квадрика задается уравнением E), не содержащим произведений
различных координат, называется репером главных направлений
этой квадрики.
Так же, как это делалось в § 27.9, с помощью параллельного
переноса репера и изменения нумерации координат можно привести
уравнение E) к виду
Г П
2 bixf+ 2 2 см + 6 = 0, 0 < г < л, ЬгФО. F)
/=1 /=г+1
Пусть Cr + i = сг+2 = ... = сп = 0, т. е. уравнение F) имеет вид
г
2 Ь,х?+ 6 = 0, bt Ф 0. G)
i= 1
Если ЬфО, введем обозначения pi= —b/bi, /=1, 2, ..., г. Тогда
уравнение G) примет вид
±W=L (8)
/ = 1
206
Если в уравнении G) 6 = 0, то уравнение можно представить
в виде г
21=0. (9,
Пусть теперь в уравнении F) г</2, сг + \ф0, ..., сг+8ф0,
cr+s + 1 =0, ..., сп = 0. Тогда можно перейти к новому ортонормиро-
ортонормированному реперу так, чтобы в уравнении F) избавиться от первых
степеней всех координат, кроме одной. В самом деле, в пространстве
всех действительных строк длины п со скалярным произведением
п
(oti, а2, ..., an)(Pi, 02, ..., Рп) = .2 а«р«
система строк
ji=(l, 0, ..., 0), ]2 = @,1, 0, ..., 0), ..., jr = @, ..., 0, 1, 0, ..., 0),
где т = Л/^г+1 + ••• + ??+«> является ортонормированной. Следова-
Следовательно, она может быть дополнена до ортонормированного базиса
jl, J2, -., j«, (Ю)
где j/ = (Yii, Y/2, ..., у in), i = r + 2, ..., п.
Рассмотрим теперь преобразование координат:
Xi=xi9 /= 1, 2, ..., г,
Х
г, ч
+ ... + Cr + sXr+s + ~2/> \
...+yjnXn, / = Г + 2, ..., П. '
Так как репер A0) ортонормирован, то матрица преобразования
A1) ортогональна и это преобразование соответствует переходу к
новому ортонормированному реперу. В этом репере уравнение квад-
квадрики имеет вид
Д-рГ =2*' + i' A2)
i=1
где pi= —m/bi, /= 1, 2, ..., г.
Определение 27.14. Уравнения (8), (9), A2) называются ка-
каноническими уравнениями квадрик в пространстве En(i).
Таким образом, имеет место
Теорема 27.11. Любая квадрика пространства En(i) может быть
задана в подходящем ортонормированном репере каноническим
уравнением.
207
27.14. Исследование поверхности второго порядка
в пространстве Е3(/) по общему уравнению
Пусть в пространстве Е3(/) поверхность II второго порядка задана
с помощью уравнения
ах ix2 + а22у2 + CI33Z2 + 2аХ2ху + 2al3xz +
+ 2a23yz + 2axx + 2a2y + 2a3z + a = 0 A)
в прямоугольной системе координат
(О, i, j, k). B)
Мы укажем здесь способ отыскания такой прямоугольной систе-
системы координат, относительно которой уравнение поверхности П будет
иметь простейший вид. Это позволит определить вид и размеры
поверхности П, а также ее расположение относительно исходной
системы координат B). Как было отмечено в § 27.13, существует
такая прямоугольная система координат (репер главных направле-
направлений), относительно которой уравнение поверхности П не содержит
произведений различных координат.
Опишем способ построения репера главных направлений. Рас-
Рассмотрим матрицу
Г^п п\2 013 1
А = п\2 а22 а23 C)
[_Я13 Я23 ДЗЗ -I
и линейный оператор / пространства Е3(/), соответствующий этой
матрице в ортонормированном базисе
i, j, k. D)
Так как матрица А—симметрическая, линейный оператор /
является самосопряженным (см. § 24.4). Согласно теореме 24.16,
существует ортонормированный базис
1", Г, ^, E)
состоящий из собственных векторов линейного оператора /. В этом
базисе оператор / имеет диагональную матрицу В = diagfXi, X2, Хз],
где Xi, X2, Х3 — характеристические числа матрицы А. Координаты
векторов E) в базисе D) являются решениями систем линейных
однородных уравнений (см. § 19.11):
( a\2t2—
F)
ai2t3 = 0, 1
а23/з = 0, >
a33)ts = Q J
относительно неизвестных tu t2i t3. При /=1 получаем систему
для вектора Г, при / = 2 — систему для вектора У и, наконец, при
/ = 3—систему для вектора к'. Найдя координатные столбцы
векторов E), объединим их в матрицу
5ц
521
531
512
522
532
5i.il
5.*<
208
Как показано в § 19.7,
B = S-lAS. G)
Так как матрица 5 ортогональна, т. е. S~l = ST, равенство G)
можно переписать в виде
B = STAS. (8)
Рассмотрим теперь переход от прямоугольной системы координат
B) к прямоугольной системе координат
(О, Г, Г, к'). (9)
В координатах он задается с помощью формул:
J A0)
Z = S3\X' + S32J/' + 5332'. J
Как показано в § 22.2, в результате подстановки выражений для
х, у, z из формул A0) в квадратичную форму
а22у2 + assz2 + 2al2xy + 2аХзхг + 2a23yz
2
получим квадратичную форму с матрицей вида (8), т. е. Х\х' -\-
-\-Х2у' -\- Хзг' . Таким образом, в прямоугольной системе коорди-
координат (9) поверхность П будет задаваться уравнением
+ 2b2y' + 2Ьъг' + а = 0, A1)
т. е. репер (9) является репером главных направлений.
Дальнейшее упрощение уравнения A1) выполняется с помощью
параллельного переноса координатных осей и поворота вокруг одной
из них. В приведенных ниже примерах иллюстрируется указанный
способ исследования поверхности П.
Пример 27.4. Исследовать поверхность второго порядка, заданную в прямо-
прямоугольной системе координат Oxyz уравнением
5х2 + 6у2 + lz2 - Аху + Ayz - \0х + %у + 14г - 6 = 0. A2)
Решение. Матрица C) имеет вид
Корни
Г
5
-2
0
-2
6
2
ее характеристического многочлена
А,—
2
0
равны 3, 6, 9.
Составим систему F) для А,| =
-2jc,
2jc,
5
= 3:
2
А, —6
-2
— Зх2 — 2х
0 !
0
— 2
з = о!
209
Решение этой системы — вектор аBа, 2а, —а), где а — произвольное действительное
число. Нормируя вектор а, получаем вектор
'(ff-т)-
Аналогично находятся векторы:
J \3 ' 3 • 3 /* k \ 3 ' 3 ' 3 /• ( '
Итак, точка О и векторы A3), A4) образуют репер (О, V, ]\ к') главных
направлений поверхности A2).
Запишем формулы преобразования координат, соответствующие переходу от
исходного репера к реперу (О, V, j', к'), т. е. формулы вида A0):
2x' + 2y'-z' 2x'-y' + 2z' -x' + 2y'+2z'
х- з • у- з • z~ з • A5)
Подставляя выражения х, у, z из формул A5) в многочлен —10* + &/+ 14z
и приводя подобные члены, получаем: —6x'-\-\Sz'. Итак, в системе координат
Ox'y'z' уравнение поверхности A2) имеет вид
Зх'2 + 6у'2 + 9z/2 - 6х* + 18^ - 6 = 0
2 2
у' +3z' —
Представим это уравнение в виде
Совершая параллельный перенос системы координат Ox'y'z' по формулам:
X = х'— 1, К = (//, Z=z'+1, мы приходим к каноническому уравнению поверх-
поверхности A2):
Итак, поверхность A2) — эллипсоид с полуосями а = \6, Ь = \3, с=Л/2.
Пример 27.5. Исследовать поверхность второго порядка, заданную в прямоуголь-
прямоугольной системе координат уравнением
х2 + У2 + 4г2 + 2ху + 4xz + 4yz — 2y + z = 0. A6)
Решение. Матрица C) имеет вид
112
1 1 2
2 2 4
Корни ее характеристического многочлена: 0 и 6.
Если А, = 0, то система F) сводится к одному уравнению: х\ + *2 + 2*з = 0.
Этому уравнению удовлетворяют все векторы вида а( —а — 2C, а, Р), где а, р — про-
произвольные действительные числа. Фиксируем один из этих векторов, например
а.1 (— 1, 1, 0). Второй вектор найдем из условия ортогональности векторов а и ai:
а + 2C + а = 0. Следовательно, можно-взять вектор агA, 1, —1)- Нормируя векторы
ai и аг, получаем два из искомых векторов главных направлений:
Для отыскания третьего главного направления можно воспользоваться тем
обстоятельством, что искомый вектор к' ортогонален векторам Г, j' и, значит,
коллинеарен векторному произведению V X У- Следовательно, имеем (см. § 12.12)
210
kY-L.-L,-?-Y (.8)
VVe л/б л/6/
Репер, образованный точкой О и векторами A7), A8), является репером
главных направлений поверхности A6).
Запишем формулы вида A0):
-у/2 УЗ т/6 -у/2 ^3 7<б
В системе координат Ox'y'z' уравнение поверхности A6) имеет вид
б2/2-Л/2х/-Л/31// = 0. A9)
Запишем формулы поворота системы координат Ох'у'г' вокруг оси Oz'\
х' = X cos а — Y sin а, #' = X sin а -f- Y cos а, z' = Z.
Подставив выражения *', у', z' из этих формул в уравнение A9), получим
6Z2 — (^/2~cos a + y3"sin а)Х + (-y^sin а — -y^cos а) Y = 0. B0)
Найдем значение а из условия -^sin а—^cos а — 0. Имеем: tg а =
sin а = -у/3/5, cos а = ¦у/2/Ъ.
Уравнение B0) принимает канонический вид:
f. B1)
О
Итак, поверхность A6) — параболический цилиндр с каноническим уравнением
B1).
27.15. Метрические инварианты многочлена второй степени
Пусть в пространстве Еп(/) выбран ортонормированный репер
и в этом репере задано уравнение квадрики
п п
2 QijXiXj + 2 2 ад: + а = 0. A)
(,/=1 (=1
Левая часть этого уравнения
п п
2 aijXiXj + 22 а,*,- + а B)
/,/=1 /=1
является многочленом второй степени относительно переменных
xh x2, ..., jc« с действительными коэффициентами. Совершим пре-
преобразование переменных:
п
*.= 2а.*; + а.> /=1, 2, .... л, C)
где C = [a,ij] — действительная ортогональная матрица; а, — дейст-
211
вительные числа. Можно считать, что формулы C) задают пре-
преобразование координат точек при переходе к новому ортонормиро-
ортонормированному реперу.
Подставляя значения х{ из формул C) в многочлен B) и при-
приводя подобные члены, получаем многочлен второй степени относи-
относительно переменных х[, х'2, ... , х'п\
2 a!jx!x'j+22a! + a'. D)
г, / = i t = i
Определение 27.15. Метрическим инвариантом многочлена B)
называется такой многочлен /7(fli/, 0^, а) относительно коэффициен-
коэффициентов многочлена B), который не изменяет своей числовой величины,
если вместо коэффициентов 0,/, а*, а подставить соответствующие
коэффициенты а'ц, а?, а' многочлена D), получающегося из много-
многочлена B) в результате произвольного преобразования вида C), т. е.
F(alh a'k, a') = F{aih aky а).
Теорема 27.12. Коэффициенты характеристического многочлена
E)
\КЕ — А
,=
л аи
012
— 01/г
матрицы А = [ciij] и определитель
012 022
01
02/г ...
а2
— а
Х-а
а\п
02/г
0/г/г
0/г
12 •••
22 •••
2п ••• А, — 0««
01
02
0/г
а
F)
являются метрическими инвариантами многочлена B).
> Перейдем к новому ортонормированному реперу по формулам
C). Как показано в § 27.2, уравнение квадрики A) примет вид
2 a[,x!xj
/, / = 1
п
22 a!xl + а' = О,
причем
G)
Так как матрица С ортогональна, т. е. СГ = С~\ то из равенства
G) следует, что матрицы А и В подобны. Как известно (см. предло-
предложение 19.13), у подобных матриц характеристические многочлены
равны:
(8)
Х — а\\ —012 ... —01/г
— а'\2 Х — а22 ... —02«
— а\п —af2n ••• ^ — а™
X — ап —а12 ... —01,г
— а12 X — а22 ... —02/г
— ain —а2п ••• Я — апг
212
Представим определитель \ХЕ — А\ в виде
| хЕ - А | = Г - 1хкя~1 + /2Г - ... +
где 1п — определитель матрицы А; /*, Л=1, 2, ..., я,— сумма
диагональных миноров й-го порядка определителя /„. Аналогично
\ХЕ-В\ =кп-1\Хп-х + /'2кп-2- ...+
+ (-l)"-1/i_,X + (
Равенство (8) запишется теперь в виде
X«_/ir-|+/2^-.-4-(-l)'I"l/n-
= Г-/{Г-1+/^й-2- ...+(- I)"
Так как у равных многочленов коэффициенты при соответст-
соответствующих степенях X равны, то /„=/„, Гп-i=/«-i, ..., /i^/ь Итак,
величины /„, /л-1, ..., /i являются метрическими инвариантами
многочлена B).
Перейдем к исследованию определителя F). Рассмотрим вместо
многочлена B) многочлен
п п
2 dijXiXj + 2 2 aiXit + at2, (9)
/, /=i 1 = 1
введя новую переменную t. Многочлен (9) является квадратичной
формой относительно переменных xXi x2i ..., хп, t. Многочлен B)
получается из многочлена (9) при ^= 1.
Далее рассмотрим линейное преобразование переменных хи
х2у ..., хп, t в переменные х[, x'2i ..., x'tu V\
п
t = f, i=l, 2, .... nj
A0)
где [a.ij] — ортогональная матрица. Определитель матрицы Т пре-
преобразования A0) равен определителю матрицы Т = [aij] и, следо-
следовательно, равен 1 или —1.
Пусть квадратичная форма (9) в результате преобразования
A0) принимает вид
п п
2 aijx!xj + 22aixit' + a't''. A1)
/,/=1 /=1
Рассмотрим матрицы квадратичных форм (9) и A1):
Г аи аХ2 ••• ахп а,]
а12 а22 ••• а2п а2 ;
А= ' ! ,
I CL\n a2n *•• CLnn CLn
\ах а2 ••• ап а
213
ахх
а\2
а\п
а\
а\2 •••
а'22 ¦¦¦
а2п -
а'2 -
а\„
а'т
aL
а'п
а2
а'п
а'
Как известно из § 22.2,Ах = ТАТ. Применяя теорему об опре-
определителе произведения матриц, получаем
\АХ\ = \ТТ\ \А\ |Г| = |Г|2|Л1 = |Л|.
Тем самым показано, что определитель F), состоящий из коэффи-
коэффициентов многочлена B), является метрическим инвариантом, ко-
который обычно обозначается 1п + \.^
27.16. Исследование линий второго порядка с помощью
инвариантов
Рассмотрим плоскость Е2(/). Пусть в некоторой прямоугольной
системе координат Оху задано уравнение линии второго порядка
аххх2 + а22у2 + 2аХ2ху + 2ахх + 2а2у + а = 0. A)
Как следует из § 27.13, с помощью подходящего выбора прямо-
прямоугольной системы координат О'х'у' уравнение линии A) можно
привести к одному из следующих видов:
B)
C)
кУ + ё = 0, D)
где Xj, X2, 6, с, d — действительные числа, причем XXi X2 и с отличны
от нуля. Мы укажем сейчас, как с помощью инвариантов найти
коэффициенты уравнений B), C) и исследовать линию D).
Вычислим для всех левых частей уравнений A) и B) инва-
инварианты, введенные в предыдущем параграфе:
'2 + 2су' = О,
#22 — ^1 Н" '
h =
*12
E)
F)
Х2
•42
*22
I #2 п
Из равенств E) и F) следует, что
квадратного уравнения
Из равенств F) и G) получаем
1Х\2Ь. G)
ц и К2 являются корнями
(8)
(9)
214
Вычислим инварианты левой части уравнения C): 1Х = ХХ,
= 0, /3 = —Ххс2. Следовательно,
/2=
A0)
Обратимся к уравнению D). Имеем
/з = 0. A1)
Покажем, что в этом случае левая часть уравнения A) распадается
на два линейных множителя (либо действительных, либо нет). Рас-
Рассмотрим квадратичную форму
аххх2 + а22у2 + 2аХ2ху + 2axxt + 2a2yt + at2 A2)
относительно переменных ху у, t. Согласно равенству A1), ранг
квадратичной фирмы A2) меньше 3, и, следовательно, она разло-
разложима на два линейных множителя (см. § 22.6):
аххх2 + а22у2 + 2аХ2ху + 2axxt + 2a2yt + at2 =
A3)
где ah рь 7j, a2, P2> Y2 — комплексные числа. Положив в равен-
равенстве A3) ?= 1, получим разложение на линейные множители левой
части уравнения A). Для отыскания этих линейных множителей
можно применить следующий прием. Если апФ0, то разложение
должно иметь вид
Но тогда величины кху-{-\ix и ^2у + \i2 можно найти как корни
квадратного относительно х уравнения A). Если а22=7^0, уравне-
уравнение A) можно решить как квадратное относительно у. Наконец,
если an=a22 = 0, то разложение должно иметь вид
2аХ2ху + 2ахх + 2а2у + а = 2аХ2(х + а)(у + р) A4)
и числа a, p можно найти путем сравнения соответствующих коэф-
коэффициентов в обеих частях равенства A4).
Пример 27.6. С помощью инвариантов исследовать линии, задаваемые сле-
следующими уравнениями:
1) Ъх2 + \2ху -22х-\2у-\9 = 0;
2) х2 - 2ху + у2- 10* - 6у + 25 = 0;
3) 4х2 —\2ху + 9у2-2х + Зу-2 = 0. A5)
Решение. 1. Вычислим инварианты:
Л—5. /а—1| g| 36. /3 =
5 6 -11
6 0-6
-11 _б -19
= 1296.
Решаем уравнение (8): к2 — Ък — 36 = 0, X, = 9, К2=—4.
По формуле (9) находим Ь= —36. Итак, уравнение исследуемой линии можно
записать в виде
9л:'2 - 4у'2 - 36 = 0
215
т. е. искомая линия — гипербола.
2. Вычисление инвариантов дает: 1\ =2, 12 = 0, /3 = —64. Следовательно, иско-
искомая линия может быть задана уравнением
2х' —\j32y' = 0 или х' =<
т. е. она является параболой.
3. Имеем /3 = 0. Запишем уравнение A5) в виде
Ах2 — 2Fу + \)х + 9у2 + Зу — 2 = 0
и решим его как квадратное уравнение относительно х. Получим Х\ = (Зу -\- 2)/2,
х2 = (Зу — 1)/2. Следовательно, уравнение A5) можно представить в виде
4[ х —
Bjc — 3f/ — 2) Bjc — 3i/ 4- 1) = 0.
Искомая линия распадается на пару параллельных прямых:
2х — Зу — 2 = 0 и 2х — 3# + 1 = 0.
Упражнения
1. Докажите, что если 1\ =0, то /2 <С 0.
2. С помощью инвариантов 1и /2, /з сформулируйте условие, необходимое
и достаточное для того, чтобы линия второго порядка была парой взаимно перпенди-
перпендикулярных прямых.
28. ПРОЕКТИВНОЕ ПРОСТРАНСТВО
В этой главе будет рассмотрено еще одно пространство — про-
проективное. Первоначально понятие проективного пространства возник-
возникло в связи с задачей проектирования одной плоскости на другую.
Отсюда произошло и название «проективное пространство». Затем
было установлено, что проективное пространство тесно связано с ли-
линейным и аффинным. В проективном пространстве теория квадрик
приобретает завершенный вид. Проективное пространство может
быть положено в основу классификации различных геометрий: евкли-
евклидовой, псевдоевклидовых, неевклидовых.
В этой главе мы будем обозначать поле не буквой Р, а буквой F.
28.1. Определение проективного пространства
Пусть Vn+l-—(n + 1)-мерное линейное пространство над полем F.
Его элементы, как известно, называются векторами. Рассмотрим
множество, элементами которого являются одномерные подпрост-
подпространства пространства Vn + X.
Определение 28.1. Множество Рп одномерных подпрост-
подпространств линейного пространства Vn+X называется п-мерным проек-
проективным пространством, связанным с пространством Vn~^\ Элементы
пространства Рп будем называть точками.
216
Как и в любом другом пространстве, в проективном вводятся
подпространства, которые называются плоскостями.
Определение 28.2. Множество одномерных подпространств
(k-\- 1) -мерного подпространства Vk+X пространства Vn+X называ-
называется k-мерной плоскостью пространства Рп. Одномерные плоскости
называются также прямыми, а (п— \)-мерные — гиперплоскостями
пространства Рп.
Очевидно, что всякая ^-мерная плоскость проективного про-
пространства Рп является fc-мерным проективным пространством, свя-
связанным с линейным пространством Vk + X.
Проективное пространство можно построить и с помощью аффин-
аффинного пространства. Пусть Ап+х — (п + 1)-мерное аффинное простран-
пространство, связанное с линейным пространством Vn+X. Если зафиксировать
в пространстве Ап+Х некоторую точку О, то множество векторов
{ОМ\М ? Ап + Х) будет совпадать с пространством Vn+X. Тогда точки
пространства Рп будут изображаться прямыми пространства Лп+1,
проходящими через точку О, а ^-мерные плоскости пространства
Рп—(k -f- 1)-мерными плоскостями пространства Лп+1, проходящими
через точку О.
Теперь попробуем установить соответствие между пространства-
пространствами Рп и Ап. Будем представлять себе пространство Рп в виде
множества прямых пространства Ап+Х, проходящих через некоторую
фиксированную точку О. Зафиксируем в пространстве Рп какую-либо
гиперплоскость Рп~х. Пусть Ап — гиперплоскость пространства Ап+\
являющаяся изображением гиперплоскости Рп~х. Возьмем в прост-
пространстве Ап+Х какую-либо гиперплоскость В, параллельную гипер-
гиперплоскости Ап. Построим отображение множества Р* = рп\рп~1 всех
точек проективного пространства Рп, не принадлежащих гиперплос-
гиперплоскости Рп~х, на я-мерное аффинное пространство В (рис. 28.1). Пусть
произвольная точка М ? Р* изображается
прямой Д пространства Ап+Х, проходящей
через точку О. Так как точка М не при-
принадлежит гиперплоскости рп~1 простран-
пространства Рп, то изображающая ее прямая Д
не принадлежит гиперплоскости Ап про-
пространства Ап+Х. Поэтому прямая Д пере-
пересекает гиперплоскость В в некоторой точке
М'. Рассмотрим теперь отображение
р: Р*->В, A) Рис. 28.1
ставящее в соответствие произвольной точке РЛ?Р* = Рп\Рп~х
построенную выше точку М' g В.
Определение 28.3. Пара (В, р), состоящая из п-мерного
аффинного пространства В и отображения р, называется аффинной
картой проективного пространства Рп, а точка М' = р (М) — изобра-
изображением точки М на карте (В, р). Точки гиперплоскости Рп~1 назы-
называются несобственными точками пространства Рп по отношению к
карте (В, р), остальные точки пространства Рп — собственными,
а сама эта гиперплоскость называется несобственной.
217
Итак, мы построили отображение р множества всех собственных
точек пространства Рп на я-мерное аффинное пространство В.
Легко видеть, что это отображение есть биекция. В самом деле, пусть
ЛГ — произвольная точка гиперплоскости В пространства Ап+Х. Так
как гиперплоскости Ап и В параллельны, то М' Ф О и, следовательно,
существует единственная прямая Д, соединяющая точки О и М'. Эта
прямая и является единственным прообразом точки М' при отобра-
отображении р.
Посмотрим теперь, как отображение р действует на различные
плоскости пространства Рп. Пусть Рк— некоторая /г-мерная плос-
плоскость пространства Рп и Ак+Х —соответствующая ей (k + 1)-мерная
плоскость пространства Ап+Х. Предположим сначала, что плоскость
Рк полностью принадлежит гиперплоскости Рп~1. Тогда плоскость
Ак+Х полностью принадлежит гиперплоскости Ап и поэтому не имеет
общих точек с гиперплоскостью В. В этом случае плоскость Рк
не имеет изображения на карте В при отображении р. Пусть
теперь плоскость Рк не принадлежит гиперплоскости Рп~\ а значит,
и плоскость Ак + х не принадлежит гиперплоскости Ап. Тогда плоскость
Ак + Х пересекает гиперплоскость Ап по /г-мерной плоскости (см.
§ 25.5), а следовательно, плоскость Ак+Х пересекает и параллельную
Ап гиперплоскость В по /г-мерной плоскости Ак. Плоскость Ак
является изображением плоскости Рк при отображении р.
Обратно, пусть Ак — произвольная /г-мерная плоскость в я-мер-
ном аффинном пространстве В, Мо — некоторая точка из этой плос-
плоскости и Vk — ее направляющее пространство. Линейная оболочка
L(Vk, ОМо) есть (k -f- 1)-мерное подпространство Vk+X пространства
Vn+X. Соответствующая Vk+X плоскость Ак+Х пересекает гипер-
гиперплоскость Л", а значит, и параллельную ей гиперплоскость В по
/г-мерной плоскости, а именно: по плоскости Ак. Итак, любая /г-мерная
плоскость Ак из гиперплоскости В является изображением некоторой
/г-мерной плоскости пространства Рп.
Таким образом, отображение A) индуцирует биективное отобра-
отображение множества всех /г-мерных плоскостей пространства Рп, не
принадлежащих гиперплоскости Рп~ху на множество всех /г-мерных
плоскостей аффинного пространства В.
28.2. Координаты
Пусть Рп — я-мерное проективное пространство, связанное с ли-
линейным пространством Vn^~x над полем F. Рассмотрим отображение
я: Vn + x\O-+P\
ставящее в соответствие произвольному ненулевому вектору х? Vn+X
одномерное подпространство V = {кх | к ? F].
Возьмем в пространстве Vn+X какой-либо базис
е0, ei, ..., ел. A)
Определение 28.4. Однородными координатами точки М?Рп
в базисе A) называются координаты любого ненулевого вектора
218
x?Vn+x, такого, что л(х) = М. Другими словами, однородные
координаты точки М в базисе A) — это коэффициенты
*о, хи ..-, хп B)
п
в разложении х = 2 jc,-e/.
Заметим, что однородные координаты фиксированной точки М
в данном базисе A) определены неоднозначно. В самом деле, пусть
задан какой-либо набор B) однородных координат точки М, явля-
являющийся набором координат вектора x?Vn + x, такого, что л(х) = М.
Тогда однородными координатами точки М будут также координаты
Уо, Уи ..., Уп C)
любого вектора у ? Vn + \ такого, что л (у) = п(х) = М. Это равносиль-
равносильно тому, что существует ненулевое число А, ? F, такое, что
yi='kxii ? = 0, 1, ..., п. D)
Итак, при данном базисе A) каждой точке М ставится в соот-
соответствие в качестве однородных координат некоторый ненулевой
набор B) чисел из поля F, а также любой пропорциональный ему
набор, т. е. набор C), удовлетворяющий условию D). Обратно, для
любого ненулевого набора B) чисел из поля F существует ненулевой
вектор x?V™ + 1 с координатами B), а значит, и точка М?Рп
с однородными координатами B).
Рассмотрим линейное пространство Fn+\ образованное строками,
состоящими из чисел B), взятых из поля F. Введем в этом простран-
пространстве отношение эквивалентности, считая эквивалентными пропор-
пропорциональные строки, т. е. строки B) и C), удовлетворяющие усло-
условию D). Множество классов ненулевых наборов B) чисел из поля F
обозначим PFn.
Задание в проективном пространстве Рпу связанном с линейным
пространством Vn+X над полем F, однородных координат с помощью
базиса A) позволяет рассмотреть биективное отображение
ставящее в соответствие каждой точке М?Рп класс пропорциональ-
пропорциональных строк чисел, являющихся однородными координатами точки М.
Теперь становится естественным
Определение 28.5. Множество PFn называется арифмети-
арифметической моделью проективного пространства Рп или п-мерным арифме-
арифметическим проективным пространством над полем F.
Пусть наряду с базисом A) в пространстве Vn+X задан еще один
базис
еб, е{, ..., ej. E)
Как известно (см. § 17.8), координаты jc6, jtf, ..., х'п произвольного
вектора х? 1Л + 1 в базисе E) связаны с координатами B) этого же
вектора в базисе A) формулами:
21 ;>
xi=2ay*f, « = 0, 1, .... л, F)
/ = 0
где det[ai/]^=O. Следовательно, однородные координаты точки
М = л(х) в базисах A) и E) связаны формулами:
kXi 2 ЩХ\% ? 0, 1, ..., Я,
/ = 0
где А, — произвольное, отличное от нуля число из поля F.
Иногда два базиса A) и E) пространства Vn+{ определяют
в проективном пространстве Рп одну и ту же систему однородных
координат. В самом деле, пусть базисы A) и E) связаны соотно-
соотношениями:
ef=A,e«, i = 0, 1, ..., л, G)
где X?F. Тогда формулы F) принимают вид Xi = kxl, / = 0, 1, ..., п.
Но это означает, что произвольной точке М ?Рп ставится в соответ-
соответствие в качестве однородных координат относительно базисов A) и
E) один и тот же класс пропорциональных строк чисел из поля F.
Пусть (В, р) — аффинная карта проективного пространства Рп,
заданная несобственной гиперплоскостью Рп~{ (см. § 28.1). Рас-
Рассмотрим в аффинном пространстве В некоторый репер
(Afo, ei, e2, ..., ея). (8)
Определение 28.6. Неоднородными координатами точки
М ? Рп\Рп~1 относительно карты (В, р) и репера (8) называются
координаты
Ei, Б2, .... In (9)
точки р(М) ?В в репере (8).
В отличие от однородных неоднородные координаты определены
не на всем пространстве Рп, а лишь на множестве Рп\Рп~1. Однако
это множество биективно отображается на
множество наборов координат (9), т. е. на
линейное пространство Fn.
Установим связь между однородными и
неоднородными координатами. Так как
(8) — репер аффинного пространства В, то
базис линейного пространства Vn, с которым
связано пространство В, образуют векторы
. ei, е2, ..., е„, а базис пространства Vn + X —
Рис- 282 векторы
е,, е2, ..., еп A0)
(рис. 28.2, где п = 2). Пусть (9) — неоднородные координаты собст-
собственной точки М ? рп\рп~1 в репере (8), а B) — однородные коорди-
координаты этой точки в базисе A0). Тогда
Ор(М) = е0 + 2 liti = XX Xjeh
i—\ / = 0
220
откуда
?# = JCf/jCo, i=l, 2, ..., п. A1)
Заметим, что Хо^О, так как М? Рп.
28.3. Плоскости
Рассмотрим проективное пространство Рп как множество прямых
Ап+\
р р рр р
ффинного пространства Ап+\ проходящих через фиксированную
очку О?Ап+\ Как отмечено в § 28.1, fc-мерная плоскость прост-
простРп б Ап+Х (k )й
а
точку ? § , р р
ранства Рп изображается в пространстве Ап+Х (k + 1)-мерной плос-
плоскостью, проходящей через точку О. Исходя из этого, каждому
утверждению, относящемуся к плоскостям пространства Ап+ ,
проходящим через точку 0, отвечает утверждение, относящееся к
плоскостям пространства Рп. Рассмотрим некоторые из них.
Теорема 28.1. Для любого непустого множества Q точек про-
пространства Рп существует единственная плоскость P(Q), удовлет-
удовлетворяющая условиям:
1) QczP(Q);
2) любая плоскость, содержащая множество Q, содержит плос-
плоскость P(Q).
> Рассмотрим отображение
я: (Ап + 1\О)-+Р\ A)
ставящее в соответствие каждой точке N пространства Лл+|, отлич-
отличной от точки О, точку пространства Я", изображаемую прямой ON.
Это отображение каждую (k + 1)-мерную аффинную плоскость Ak + \
проходящую через точку О, переводит в ^-мерную проективную плос-
плоскость Pk (плоскость Ak+X состоит из всех точек прямых, образующих
плоскость Я*, исключая точку О). Множество n~x{Q) состоит из
всех отличных от О точек прямых ON, образующих множество п.
Согласно теореме 25.2, множество n~l(Q) имеет единственную аф-
аффинную оболочку Л(л~~'(&)), т. е. аффинную плоскость, обладающую
следующими свойствами: 1) n~l(Q)czЛ(я-1(Й)); 2) любая аффин-
аффинная плоскость, содержащая n~l(Q), содержит A(n~l(Q)).
Рассмотрим проективную плоскость n(A(n~~l(Q))). Очевидно, что
эта плоскость включает множество Q. С другой стороны, пусть не-
некоторая проективная плоскость Pk содержит плоскость n(A(n~~l(Q))).
Тогда плоскость A(n~l(Q)) принадлежит аффинной плоскости Л*+|,
изображающей Pk. Отсюда следует, что плоскость Ak + X содержит
множество n~l(Q), а поэтому плоскость Pk включает множество Q.
Итак, мы доказали, что проективная плоскость я(Л(я~1(Й))) обла-
обладает свойствами искомой плоскости Я(й), т. е.
1 Л B)
Доказанная теорема позволяет сформулировать следующее
Определение 28.7. Проективной оболочкой непустого множе-
множества Q точек пространства Рп называется плоскость Я(Я).
221
Согласно теореме 28.1, для любого непустого множества Q
точек пространства Рп существует единственная проективная обо-
оболочка, и она задается формулой B).
По аналогии с определением 25.5 введем следующее
Определение 28.8. Точки
Af0, М„ ..., Mk C)
проективного пространства Рп называются проективно независимы-
независимыми, если их проективная оболочка является k-мерной плоскостью.
Теорема 28.2. Точки C) пространства Рп проективно независи-
независимы тогда и только тогда, когда в пространстве Ап + Х существуют
точки
#о> Nu ..., Nk, D)
такие, что Л1,- = ji (#,-), / = 0, 1, ..., k, и точки
О, NOi Nu ..., Nk E)
аффинно независимы или, иначе (см. § 25.3), векторы ONQy ONU ...,
ONk линейно независимы.
> Предположим, что существуют точки D), удовлетворяющие
условиям теоремы. Обозначая через Q множество точек C), имеем
A(n-l(Q)) = A(O, No, Nl$ ..., Nk). F)
Из равенств F) и B) находим
Р(М0, Мь ..., Mk) = n(A(ii-{(Q))) = 7i(A@, NOi Nu ..., Nk)). G)
По условию теоремы аффинная плоскость Л (О, jV0, Ni, ..., Nk)
(k + 1)-мерная, поэтому в силу равенства G) проективная плоскость
P(MOi Af 1, ..., Mk) является fe-мерной и точки C) проективно не-
независимы.
Обратно, пусть точки C) проективно независимы. Возьмем в
качестве точек D) произвольные, отличные от О точки, принадле-
принадлежащие прямым ОМ0, ОМ,, ..., OMk. Обозначив через Q множество
точек C), снова получим равенства F) и G). Так как по условию
проективная плоскость Р(М0, Ми ..., Mk) fe-мерная, то в силу ра-
равенства G) аффинная плоскость Л(О, jV0, Nu ..., Nk) является
(k + 1)-мерной. Это и означает, что точки E) аффинно неза-
независимы. 4(
Из теорем 25.4 и 28.2 вытекает следующая
Теорема 28.3. Через любые k + 1 проективно независимые точки
пространства Рп проходит единственная k-мерная плоскость. Во
всякой k-мерной плоскости есть k-\- \ и нет более k + 1 проективно
независимых точек. Любую систему проективно независимых то-
точек пространства Рп, лежащих в k-мерной плоскости, можно до-
дополнить до системы, состоящей из k-\- 1 проективно независимых
точек, лежащих в этой плоскости.
Пусть в пространстве Ап+Х выбран репер
(О, е0, е,, ..., е„). (8)
222
Тогда каждая точка М пространства Рп имеет однородные коорди-
координаты х0, хь ..., хп (см, § 28.2), которые определяются как коэф-
коэффициенты разложения
п
где х — любой вектор, такой, что л(х) = Af. Другими словами, одно-
однородными координатами точки М?Рп называются координаты любой
точки из множества я^) относительно репера (8), т. е. любой,
отличной от О точки прямой ОМ пространства Ап + К
Пусть теперь Рк — произвольная плоскость пространства Рп и
Ak+X — изображающая ее плоскость пространства Ап+Х. Тогда
Как известно из § 25.4, плоскость А +1 есть множество точек-
решений системы уравнений
аюхо+ апхх-\- ...+ а\пХп=0, (9)
CLn-k 0*0 + Q*n—k 1 *1 + ••• + Ып-k пХп — 0,
и обратно, любая система вида (9) задает плоскость в пространстве
Ап+Х. Будем говорить, что плоскость Pk задается в однородных
координатах системой (9), если координаты любой точки этой пло-
плоскости образуют решение системы (9), и обратно, любое ненулевое
решение системы (9) представляет координаты некоторой точки
плоскости Рк. Согласно сказанному выше, имеет место
Теорема 28.4. Любая плоскость пространства Рп задается в од-
однородных координатах системой (9), и обратно, любая система (9)
задает плоскость пространства Рп.
Из теоремы 28.4 следует
Теорема 28.5. Если две плоскости Pk и Р1 проективного простран-
пространства Рп пересекаются, т. е. имеют по крайней мере одну общую
точку, то их пересечением является плоскость.
По аналогии с определением 25.6 введем следующее
Определение 28.9. Характеристикой пары плоскостей Pk и
Р1, k <^ /, проективного пространства Рп называется упорядоченный
набор чисел (k, /, m, s), где s — размерность проективной оболочки
множества Pk (J Pl; m — размерность плоскости Pk f| Pl, если это
пересечение — непустое множество, и m=~l, если Pk(]Pl=0.
Теорема 28.6. Для любой характеристики (k, /, m, s) имеют
место следующие соотношения:
-1<т<*</<5<п, 0<?; A0)
s = k + l-m. A1)
Для любого набора целых чисел (m, k, /, s, n), удовлетворяющих
соотношениям A0), (И), в пространстве Рп существует пара плос-
плоскостей Pky Pl с характеристикой (k, /, т, s).
> Для любой пары плоскостей неравенства A0) очевидны. Пусть
223
плоскости Рк и Р1 пересекаются по плоскости Рт и Ак+\ Л/+1,
А^ + \ — плоскости пространства Лп+1, проходящие через точку О
и изображающие соответственно плоскости Pk, Pl, Рт и проектив-
проективную оболочку плоскостей Рк и Р1. В силу формулы (8) из § 25.5
s + 1 = (k + 1) + (/ + 1) — {jn + 1), откуда и следует формула A1).
Если плоскости Рк и Р1 не пересекаются, то изображающие их
плоскости Ак+Х и Л/+1 имеют только одну общую точку и в силу
той же формулы (8) из § 25.5 s + 1 =(? + 1)+ (/+ 1). Так как в
этом случае га= — 1, снова получаем формулу A1).
Пусть теперь задан произвольный набор целых чисел m, k, /, s, n,
удовлетворяющих соотношениям A0), A1). Возьмем в простран-
пространстве Рп любые п + 1 проективно независимые точки Мо, Мх, ..., Мп.
Тогда искомыми плоскостями Рк и Р1 будут проективные оболочки
систем точек:
Mo, Ml, ..., Mm, Mm+i, ..., Mk\
Mo, Mi, ..., Mm, Л
В § 28.2 однородные координаты в проективном пространстве
Рп были введены с помощью базиса линейного пространства Vn+\
с которым связано пространство Рп. Покажем, что однородные ко-
координаты в пространстве Рп можно задать с помощью определенной
системы точек этого пространства.
Определение 28.10. Репером проективного пространства Рп
называется упорядоченная система точек
Mo, M,, ..., Мп + \ A2)
этого пространства, такая, что любые п + 1 из этих точек проектив-
проективно независимы.
Теорема 28.7. Любую систему
Мо, М{, ••-, Mk A3)
проективно независимых точек пространства Рп можно дополнить
до репера этого пространства.
>Согласно теореме 28.3, систему A3) можно дополнить до
системы
Мо, М„ •••, М„, A4)
также состоящей из проективно независимых точек. Пусть е0, е,, ...,
еп — ненулевые векторы пространства Vn+X, лежащие в одномерных
подпространствах, определяемых соответственно точками A4).
Введем вектор
d + i =eo + ei +... +еп. A5)
Пусть Мл+1 — точка, определяющая одномерное подпростран-
подпространство {A,en+i |^6 F}. Тогда точки Мо, Mi, ..., Мп+\ образуют репер.
В самом деле, предположим, например, что точки Mi, ..., Мп + \
содержатся в гиперплоскости Р". Тогда из равенства A5) сле-
следует, что в этой гиперплоскости содержится и точка Мо, а это
противоречит тому, что точки A4) проективно независимы.^
224
Теорема 28.8. Пусть в пространстве Рп задан репер A2). Тогда
найдется единственная система однородных координат, в которой
точки A2) имеют следующие координаты:
МоA, 0, ••-, О, О),
Af,(O, 1, •••, О, О),
A6)
Мп@, О, •¦•, 0, 1),
Мп+1 A, 1, ••• , 1, 1).
> В соответствии с теоремой 28.2 в каждом из одномерных под-
подпространств пространства Кл+1, определяющих точки A2), можно
выбрать вектор так, что любые п + 1 из этих векторов
а0, а,, •••, а„ + , A7)
будут линейно независимы. Поэтому существуют числа А,о, А,,, ...,
К 6 F, такие, что
Ни одно из чисел А,о, А-,, ..., Хп не равно нулю. В самом деле,
если бы, например, А0 = 0, то векторы а,, а2, ..., ал + 1 были бы ли-
линейно зависимы вопреки их выбору. В результате мы получим, что
векторы
ti = h^ / = 0, I, ... , п, A8)
образуют базис пространства Vn + l и
а„+, =е0 +е, + ... + ел. A9)
Очевидно, что базис A7) определяет искомые однородные ко-
координаты.
Пусть в пространстве 1/л + 1 имеется еще один базис
е'о, ef, ..., е'я, B0)
такой, что в определяемой этим базисом системе координат вы-
выполняются условия A6). Тогда одномерные подпространства про-
пространства Vn+\ заданные векторами B0), совпадают с одномер-
одномерными подпространствами, определяемыми векторами A8), и, следо-
следовательно,
e/ = |i«e,-, / = 0, 1, ..., л, B1)
причем все ^ отличны от нуля.
В силу последнего условия A6) вектор
B2)
лежит в одномерном подпространстве пространства V™ + 1, опреде-
определяемом точкой Мп + \. В этом же подпространстве лежит и вектор
A9), поэтому
a^ + i = iin + ian + i. B3)
15. За к. 6466 225
Из равенств A9), B1)—B3) получаем
a? + i = еб + е( + ... + е^ = ^оео + fuiiei +... -f ^е„ =
В силу линейной независимости векторов A8) имеем: juto =
= цЛ = iin + ь а значит, е/=цов/, / = 0, 1, ..., /г. Отсюда следует,
что однородные координаты произвольной точки М ? Рл в системе
координат, определяемой базисом A8), пропорциональны однород-
однородным координатам этой точки в системе координат, определяемой
базисом B0).«^
Таким образом, задание репера в проективном пространстве Рп
приводит к однозначно определенной системе однородных коорди-
координат. Однородные координаты точки М ? Рп в этой системе координат
будем называть также координатами относительно соответствую-
соответствующего репера.
Упражнения
1. Покажите, что на проективной плоскости любые две прямые пересекаются.
2. Пусть дано уравнение
иохо + иххх Н- ... Н- ипхп == 0 (А)
(п — 1)-мерной гиперплоскости в проективном пространстве Рп. Говорят, что точка
с однородными координатами хо, *ь -.., хп и гиперплоскость (А) инцидентны,
если они связаны соотношением (А). Докажите принцип двойственности для проек-
проективного пространства: если верна какая-либо теорема, касающаяся точек и гипер-
гиперплоскостей проективного пространства и тех или иных соотношений инцидентности
между ними, то, заменив в ней слово «точка» словом «гиперплоскость» и наоборот,
мы получим теорему, которая также верна. Приведите примеры таких теорем.
3. Установите общий принцип двойственности в пространстве Рп для т-мерных
и (п — m — 1)-мерных плоскостей.
28.4. Проективная группа
Рассмотрим проективное пространство Рп одномерных подпро-
подпространств линейного пространства 1Л + 1 над полем F. Пусть / —
автоморфизм пространства V"+I. Так как при автоморфизме / одно-
одномерные подпространства пространства 1Л+1 переходят в одномерные
подпространства, то в пространстве Рп индуцируется преобразова-
преобразование /.
Определение 28.11. Преобразование f: Pn-*Pn, индуцирован-
индуцированное автоморфизмом f пространства Vn+l, называется проективным
преобразованием, порожденным автоморфизмом f.
Пусть задан базис
е0, е„ .... е„ A)
пространства Vn + l. Как известно из § 19.3, координаты х0, хи ...,
хп вектора x?Vrt+1 связаны с координатами х'Оу х\у ..., хп образа
этого вектора при автоморфизме / формулами:
226
Xl = 2 atjXj, / = 0, 1, ... , /2,
[7]
Рассмотрим в проективном пространстве Рп точку М = л(х),
1. е. одномерное подпространство пространства Vn^\ порожденное
вектором х: {kx\k?F}. Однородные координаты этой точки отно-
относительно базиса A) равны координатам вектора х или любого век-
вектора ах, где а — отличное от нуля число из поля F. Аналогично
однородными координатами точки f(M) относительно того же ба-
базиса являются координаты вектора /(х). Теперь ясно, что однород-
однородные координаты х0, хь ..., хп точки М связаны с однородными ко-
координатами х'о, х[, ..., х'п образа этой точки при проективном пре-
преобразовании f формулами:
п
А,*/= 2 al7x/, / = 0, 1, ..., п, B)
/=о
где det[a,/] Ф 0; А- — произвольное, отличное от нуля число из поля F.
Обратно, любое преобразование проективного пространства,
заданное формулами B), является проективным.
Из формул B), в частности, видно, что если два автоморфизма
/, и /2 пространства l/rt + 1 связаны равенством \2 = ЦХ, то они ин-
индуцируют одно и то же проективное преобразование: /, = /2-
Теорема 28.9. Множество G(Pn) всех проективных преобразова-
преобразований проективного пространства Рп является группой относительно
композиции преобразований.
> Как известно (см. теорему 3.1), композиция преобразований
обладает свойством ассоциативности. Тождественный автоморфизм
пространства l/rt + 1 порождает тождественное проективное преоб-
преобразование пространства Рп. Пусть / — произвольный автоморфизм
пространства 1Л + 1 и f — порожденное им проективное преобразо-
преобразование пространства Рп. Легко видеть, что автоморфизм /~] прост-
пространства 1Л+1 порождает проективное преобразование f~\ обратное
преобразованию /. Итак, G(Pn) — группа. ^
Теперь мы опишем свойства проективного пространства Рпу свя-
связанные с группой G(Pn)y аналогично тому, как было сделано в § 25.8
для аффинной группы, поэтому некоторые детали могут быть опу-
опущены.
Определение 28.12. Группа G(Pn) всех проективных пре-
преобразований проективного пространства Рп называется проективной
группой.
Определение 28.13. Фигурой в пространстве Рп называется
произвольное множество точек этого пространства. Две фигуры
в пространстве Рп называются проективно эквивалентными, если
существует проективное преобразование, переводящее одну из этих
фигур в другую.
Как и в § 25.8, можно показать, что проективная эквивалент-
227
ность есть отношение эквивалентности (см. § 3.2) на множестве
всех фигур пространства Рп и это множество разбивается на не-
непересекающиеся классы попарно проективно эквивалентных фигур.
Ниже рассмотрены некоторые из этих классов.
Теорема 28.10. Все реперы пространства Рп образуют класс
проективно эквивалентных фигур. Для любых двух реперов суще-
существует единственное проективное преобразование J, переводящее
первый репер во второй. При этом произвольная точка М, имеющая
в первом репере координаты х0, хх, ..., хп, переходит в точку f(M),
имеющую во втором репере координаты Алг0, ал:,, ..., Ххп.
> пусть задан репер
Мо, Af,, ..., Мп + Х C)
пространства Рп. Это означает, что любые п + 1 точки среди точек
C) проективно независимы. Так как произвольный автоморфизм
/ пространства l/rt + 1 переводит линейно независимые векторы в ли-
линейно независимые, то индуцируемое им проективное преобразова-
преобразование f переводит проективно независимые точки в проективно не-
независимые. Отсюда следует, что при любом проективном преобра-
преобразовании репер переходит в репер. Пусть наряду с репером C) задан
еще один репер
AfJ, Af{, ..., Afi + ,. D)
Как и при доказательстве теоремы 28.8, выберем в одномерных
подпространствах пространства Vn + \ определяемых точками C),
ненулевые векторы
е0, е,, ..., ел, an + i, E)
такие, что
а„+1 =60 + 6! + ...+ е„. F)
Аналогично в одномерных подпространствах, определяемых точ-
точками D), выберем ненулевые векторы
ео, ef, ..., ei, a? + i, G)
удовлетворяющие условию
a^ + ,=eJ + e; + ...+e^. (8)
Согласно теореме 19.1, существует автоморфизм / пространства
Vn+\ переводящий базис
е0, е,, ..., е„
в базис
ej, е{, ..., ei. (9)
Из равенств F) и (8) получаем
Итак, автоморфизм / переводит векторы E) в векторы G),
поэтому индуцируемое проективное преобразование f переводит
репер C) в репер D).
Предположим теперь, что имеется еще одно проективное преоб-
преобразование g пространства Р", переводящее репер C) в репер D).
228
Согласно определению, g индуцируется некоторым автоморфизмом
/, пространства Vn+\ т. е. g = f\. Так как автоморфизм /, переводит
одномерные подпространства пространства Vn+\ определяемые
векторами E), в одномерные подпространства, определяемые векто-
векторами G), найдутся такие числа ц0, М-ь •••> М-л + ь что
1, /,(е/) = ^е/, / = 0, 1, ..., п. A0)
В силу равенств F) и A0) имеем:
... + \ine'n. A1)
С другой стороны, из равенств (8) и A0) получаем
f() ? 6
Так как векторы (9) линейно независимы, из равенств A1) и A2)
следует \i0 = futi = ... = \in + \. Из равенства A0) получаем
а следовательно,
A3)
для любого хб Vn + \ Равенство A3), равносильное равенству /, =
= \iof, означает, что f\=f. Итак, доказано, что существует един-
единственное проективное преобразование пространства Рпу переводя-
переводящее репер C) в репер D).
Последнее утверждение теоремы следует из теоремы 25.13. Л
Теорема 28.11. Для данного k (\<ik<in-\-\) все системы,
состоящие из k проективно независимых точек, образуют класс
проективно эквивалентных фигур.
^Выше уже было отмечено, что любое проективное преобразова-
преобразование переводит проективно независимые точки в проективно незави-
независимые. Пусть заданы две системы проективно независимых точек:
Afo, Mu ..., Af*_,, A4)
Мб, М'и ..., Af?_i. A5)
Согласно теореме 28.7, систему A4) можно дополнить до репе-
репера C), а систему A5) — до репера D). Проективное преобразование,
переводящее репер C) в репер D), переведет систему A4) в систе-
систему A5). А
Теорема 28.12. Для данного k @ ^ k ^ п) все k-мерные плос-
плоскости образуют класс проективно эквивалентных фигур.
> То, что проективное преобразование любую ^-мерную плоскость
переводит в ^-мерную плоскость, следует из свойства 6 § 19.4. Пусть
теперь Pk и Р\ — две произвольные ^-мерные плоскости пространст-
пространства Рп. Возьмем в плоскости Pk какие-либо k-\- 1 проективно незави-
независимые точки
Afo, Ми .-, Mk. A6)
229
Аналогично возьмем в плоскости Р\ проективно независимые
точки
М'о, M'u .... Ml A7)
Проективное преобразование, переводящее точки A6) в точки
A7), переведет плоскость Рк в плоскость Рк. ^
Теорема 28.13. Все пары плоскостей пространства Рп, имеющие
одну и ту же характеристику, образуют класс проективно эквива-
эквивалентных фигур.
> Пусть задана пара плоскостей Pk и Р1 с характеристикой
(&, /, m, s). Так как при любом проективном преобразовании всякая
плоскость переходит в плоскость той же размерности, пара плоско-
плоскостей Рк и Р1 перейдет при этом преобразовании в пару плоскостей,
имеющих ту же характеристику (k, /, m, s).
Пусть теперь в пространстве Рп заданы две пары плоскостей
РЛ, Р1 и Р\, Pi, имеющие одну и ту же характеристику (k, /, m, s).
Соответствующие им пары плоскостей Ak + \ А1+х и Ак+\ A[+l
пространства An + l также имеют одну и ту же характеристику
(?+1, /+1, ал+1, 5+1)- Согласно теореме 25.20, существует
автоморфизм / пространства Ап+\ переводящий плоскости Ак + Х^
А1+х в плоскости А\ + \ А\+х. Тогда проективное преобразование /,
индуцированное автоморфизмом /, переведет плоскости Рк, Р1 в плос-
плоскости Pi p[. <4
В заключение установим связь между проективными и аффин-
аффинными преобразованиями. Рассмотрим аффинную карту (Ву р) прост-
пространства Р", считая, что направляющее пространство плоскости В
натянуто на векторы d, ег, ..., еЛ. В этом случае несобственные
точки пространства Рп характеризуются равенством хо = О, а для
остальных точек неоднородные координаты gi, g2, •••, In связаны
однородными формулами (см. § 28.2):
ti = Xi/xo, /=1, 2, ..., п. A8)
Запишем формулы проективного преобразования:
<Х\ \Х\
Рассмотрим теперь такое проективное преобразование /0, которое
несобственные точки переводит в несобственные. Оно характеризу-
характеризуется тем, что из равенства х0 = 0 следует равенство х'о = 0. Из перво-
первого равенства системы A9) получим
aoi = а02 = ••• = аОл = 0, B0)
т. е. первое равенство B0) примет вид
Кхо = аоохо. B1)
Из невырожденности матрицы [at/] и равенств B0) следует, что
230
аОо ф 0. Поэтому равенство B1) показывает, что преобразование
/о собственные точки переводит в собственные. Разделив теперь
обе части каждого из равенств A9), кроме первого, на кх'о =
и использовав формулы A8), получим:
B2)
где р?7 = а///аОо; Р/ = а?-о/аОо, U j=U 2, ..., /1. Очевидно, что
Преобразование /0 индуцирует на карте аффинное преобразо-
преобразование g, задаваемое формулами B2). Итак, имеет место
Теорема 28.14. Множество всех проективных преобразований
п-мерного проективного пространства, переводящих в себя совокуп-
совокупность точек, несобственных относительно некоторой аффинной карты,
индуцирует на этой карте аффинную группу.
28.5. Сложное отношение четырех точек
Пусть в проективном пространстве Рп задана прямая Рх и выбрана
система однородных координат, определяемая базисом ео, ei, ..., еп
пространства Vn + X. Как известно из § 28.3, прямая Р1 может быть
задана системой уравнений:
|_ |_ „ /Л
A)
1п —2 \Х\ -\- ... -\~ OLn — 2 пХп = U,
ранг которой равен п — 1. Пусть, далее, (^о, q\, •-., qn\ (^о, гь ••-, гп) —
фундаментальная система решений системы A), a Q, R — соответ-
соответствующие точки прямой Р1. Тогда для любой точки M(xOj x\, ..., хп)
прямой Р1 найдутся числа juti, \i2(zF, такие, что
B)
причем если точка М отлична от Q и /?, то futi фО, ^Ф0. Пусть
S(s0, s2, -.., sn), T(t0, tu ..., /„) — две различные точки прямой Р\
отличные от точек Q, R. Тогда
/ = 0, 1, ..., м, C)
/ = 0, 1, ..., м, D)
причем ai^=0; 02^=0; т\ф0; г2ф0.
Определение 28.14. Число — :——называется сложным или
двойным отношением четырех точек Q, /?, S, Т и обозначается
(QRST).
231
Итак,
О2 Т2
fr}D<2T\ • (?\
ук^1\Э 1 ) = . . \0)
ОI Т i
Покажем, что сложное отношение E) зависит только от выбора
точек Q, /?, 5, Т и не зависит от координат этих точек. В выбранной
системе координат координаты точек определены лишь с точностью
до множителя, поэтому точки Q, /?, 5, Т могут быть заданы соответст-
соответственно координатами:
где A-i, A-2, А-з, Я4 — произвольные, отличные от нуля элементы поля F.
Относительно этих координат равенства C) и D) примут вид:
Следовательно, сложное отношение точек Q, /?, 5, Т
A,2G|A,3 ' A,2TiA,4 CT i T[
не зависит от выбора координат этих точек в данной системе
координат.
Перейдем теперь к какой-либо новой системе однородных коорди-
координат. Как известно из §28.2, старые координаты х0, х\,..., хп произволь-
произвольной точки М выражаются через новые координаты х'о, х\, ..., х'п этой
точки по формулам:
п
Х1=\1^ ЫцХ], / = 0, 1, ..., /2, F)
1=0
где det[a//]=^ 0; (i — не равное нулю число из поля F. В частности,
для точек Q, /?, 5, Т имеем:
п и
5? = р, 2 «?,-5/, U = |л 2 a////.
у = 0 / = 0
Подставляя эти выражения в равенства C), D) и сокращая полу-
полученные равенства на |л, получаем:
п
2 ail(s'i-olq'j-a2r'j) = 0, / = 0, 1, .... л, (8)
/ = 0
а;
2i)O(/(^-T,^-T2rf) = 0, / = 0, 1, .... л. (9)
232
Равенства (8) показывают, что
s'j — oxq] — o2r'i = 0, / = 0, 1, ..., л, A0)
так как в противном случае столбцы матрицы [а,/] были бы линейно
зависимы вопреки невырожденности этой матрицы.
Перепишем равенства A0) в виде
s^Oxq]+o2rfh / = 0, 1, ..., п. A1)
Аналогично из равенств (9) получаем
/ = 0, 1, ..., п. A2)
Равенства A1) и A2) показывают, что сложное отношение
точек Q, /?, S, Г, выраженное в новых координатах, имеет то же
значение E), что и в старых координатах.
Проведенным выше вычислениям можно дать и другое истолкова-
истолкование. Будем рассматривать соотношения F) как формулы проектив-
проективного преобразования пространства Рпу переводящего произвольную
точку Af, заданную в некоторой проективной системе координатами
хо, Х\у ..., хп, в точку АГ, заданную в той же системе координатами
х'о, х\, ..., Хп. Тогда мы получаем следующее утверждение.
Теорема 28.15. Сложное отношение четырех точек сохраняется
при любом проективном преобразовании.
28.6. Квадрики в проективном пространстве
Рассмотрим действительное (п + 1)-мерное аффинное простран-
пространство, вложенное в комплексное (я + 1)-мерное аффинное простран-
пространство An+l(i) (см. § 27.1). Зафиксировав в пространстве An + \i)
действительную точку и проведя через нее все прямые пространства
An+l(i\ получим действительное /2-мерное проективное пространство,
вложенное в комплексное /2-мерное проективное пространство Pn(i).
Выберем в пространстве Vn + X некоторый базис
е0, еь ..., е„ A)
и рассмотрим уравнение
п
2 ailxixi = 09 B)
i, / = 0
где ац — действительные числа, не равные нулю одновременно,
ац = a\i.
Определение 28.15. Квадрикой пространства Pn(i) называ-
называется множество всех точек этого пространства, однородные коорди-
координаты которых в базисе A) удовлетворяют уравнению B).
Согласно теореме 27.1, уравнение заданной квадрики в выб-
выбранном репере определено однозначно с точностью до умножения
левой части уравнения на произвольное, отличное от нуля действи-
действительное число.
233
Перейдем теперь к новому базису
еб, е{, .... е?. C)
Формулы, выражающие однородные координаты хо> х\у ..., хп
точки М в базисе A) через однородные координаты 4, 4, ..., 4
этой же точки в базисе C), имеют вид
п
kXi= 2 anX'h / = 0, 1, ..., Л, D)
/=о ' ' v 7
где det[a//] = O; a,-/— действительные числа.
Подставляя выражения xt из формул D) в уравнение B), полу-
получаем уравнение квадрики B) в новых координатах:
Если рассматривать формулы D) как формулы проективного
преобразования, переводящего точку М с координатами хо> х\, ..., хп
в репере A) в точку М' с координатами 4, х\, ..., х'п в том же репере,
то мы получаем следующее утверждение:
Теорема 28.16. При проективном преобразовании пространства
Pn(i) любая его квадрика преобразуется в квадрику.
Как показано в § 22.4, квадратичную форму, стоящую в левой
части уравнения B), с помощью преобразования D) можно при-
привести к нормальному виду:
В результате имеем следующее утверждение:
Теорема 28.17. Для любой квадрики B) можно подобрать базис
C) так, чтобы уравнение квадрики в этом базисе имело нормаль-
нормальный вид:
_DJ-...-DJ + D+iJ + ... + DJ = 0, 0<г<м. E)
Так как уравнение квадрики можно умножить на — \ и с помощью
преобразования вида D) изменить нумерацию координат, будем
считать, что в уравнении E) k^(r— 1)/2.
Разобьем теперь множество всех квадрик пространства Pn(i)
на классы. К одному классу отнесем такие квадрики, которые в под-
подходящих базисах задаются одним и тем же уравнением E) (при
одних и тех же k и г). Согласно теореме 28.17 и закону инерции
для действительных квадратичных форм, каждая квадрика попадет
в один вполне определенный класс.
Теперь мы покажем, что построенные классы совпадают с клас-
классами проективно эквивалентных квадрик. Пусть К и К! — две квадри-
квадрики, принадлежащие одному из построенных классов. Пусть, далее,
квадрика К задается в некотором базисе A) уравнением
-xl ~х\- ... - х\ + 4 +1 + ... + х2г = 0. F)
234
Тогда квадрика К' задается в каком-либо базисе C) этим же
уравнением. Возьмем реперы R и /?' пространства Рпу соответст-
соответствующие базисам A) и C). Согласно теореме 28.10, существует
проективное преобразование / пространства Рпу переводящее репер R
в репер /?'. При этом произвольная точка Му имеющая в репере R
однородные координаты х0, хх, ..., хп, переходит в точку f(M) с коорди-
координатами кхоу kxi, ..., кхп в репере R'. Так как квадрика К состоит
из всех точек пространства Рп, координаты которых в репере R
удовлетворяют уравнению F), ее образ f(K) состоит из всех точек,
координаты которых в репере R/ также удовлетворяют уравне-
уравнению F), следовательно, /(/() =/('. Итак, для любых двух квадрик
из одного класса существует проективное преобразование, пере-
переводящее одну из этих квадрик в другую.
Пусть теперь К и К" — две квадрики из разных классов, причем
квадрика К задается в базисе A) уравнением F), а квадрига К"
задается в некотором базисе C) уравнением
-(x'of - {x\f - ... - (х!J + (х?+|J + ... + (x'sf = 0, G)
где s Ф г или 1ф k.
Предположим, что существует проективное преобразование gy
переводящее квадрику К в квадрику К"• Оно задается формулами:
п
№= 2pf/<, / = 0, 1, ..., м, (8)
/=о
где *о, х\у ..., хп — координаты произвольной точки М 6 Рп в бази-
базисе A); x'd, х", ..., Хп—координаты точки g (M) в том же базисе.
Подставляя выражения Xi из формул (8) в левую часть уравне-
уравнения F), получаем уравнение
п
2 ацх?х? = 0 (9)
квадрики g(K) в базисе A). Левая часть этого уравнения пред-
представляет собой квадратичную форму ранга г-f-l, положительный
индекс инерции которой равен г — k.
Рассмотрим теперь преобразование однородных координат, со-
соответствующее переходу от базиса A) к базису C). Оно задается
с помощью формул:
п
1х!'= 2 ацх'ь / = 0, 1, ..., л, A0)
/=о
где х'о\ х\\ ..., Хп — координаты произвольной точки М' в базисе A);
х'о, х\, ..., хп — координаты той же точки в базисе C). Подставляя
значения x'd, х'{', ..., х'п из выражений A0) в левую часть уравне-
уравнения (9), получаем уравнение
2 ЪЦЩ = Ъ A1)
i, / = 0
квадрики g(K) в базисе C). Здесь слева стоит квадратичная форма
ранга г -\- 1, положительный индекс инерции которой равен г — k. Так
235
как, по нашему предположению, g(K) = К"> то уравнения G) и A1)
задают одну и ту же квадрику К" в одной и той же системе
однородных координат, определяемой базисом C). На основании
леммы 27.3 левые части уравнений G) и A1) должны различаться
лишь действительным, отличным от нуля числовым множителем а.
Из условий &<(r— l)/2, /<(s— l)/2 следует, что а > 0. Однако
это невозможно, так как квадратичные формы, стоящие в левых
частях уравнений G) и A1), различаются рангом или положитель-
положительным индексом инерции, а умножение квадратичной формы на поло-
положительное число а не изменяет этих чисел. Полученное противоре-
противоречие показывает, что для двух квадрик К и К!\ взятых из разных
классов, не существует проективного преобразования, переводящего
одну из этих квадрик во вторую.
Итак, доказана
Теорема 28.18. Множество всех квадрик пространства Рп (i)
разбивается на непересекающиеся классы проективно эквивалентных
квадрик. К одному классу относят все квадрики, задающиеся в соот-
соответствующих базисах одним и тем же нормальным уравнением E).
Сопоставим теперь проективную классификацию квадрик в прост-
пространстве Pn(i) с аффинной классификацией квадрик в простран-
пространстве An(i). Как и в § 28.1, аффинное пространство An(i) будем
рассматривать как множество всех собственных точек проективного
пространства Pn(i).
Пусть в пространстве An(i) задан некоторый репер
@, е,, е2, ..., е„). A2)
Будем обозначать координаты произвольной точки М в репере
A2) через gi, g2* •••> ?«• Рассмотрим в пространстве An(i) произволь-
произвольную квадрику КУ заданную в репере A2) уравнением
п п
2 ацЫ1 + 22 aOib + а00 = 0. A3)
i, / = 1 / = 1
Как было сделано в § 28.2, введем в пространстве РпA) однород-
однородные координаты хо, хи ..., хп. Для собственных точек пространства
Pn(i\ т. е. для точек пространства An(i), имеем:
?. = *;/*<), /=1, 2, ..., П. A4)
Для несобственных точек пространства РпA) х0 = 0. Подставляя
выражения A4) в левую часть уравнения A3) и умножая получен-
полученное уравнение на х%, приходим к уравнению
п
2 anXiXj = 0. A5)
Л / = 0
Это уравнение квадрики К в однородных координатах в пространстве
АпA). Однако уравнение A5) можно рассматривать и в пространст-
пространстве Pn(i). Там оно задает некоторую квадрику К. Квадрика К есть
множество всех собственных точек квадрики R.
Итак, каждой квадрике К пространства An(i) можно поставить
236
в соответствие однозначно определенную квадрику К пространства
Pn(i) так, чтобы К было множеством всех собственных точек
квадрики К.
Обратно, пусть в пространстве Pn(i) некоторая квадрика К задана
своим уравнением A5) в однородных координатах. Напомним, что
среди чисел а,-/, /, / = 0, 1, ..., /г, есть отличные от нуля.Обозначим
через К множество всех собственных точек квадрики К. Разделив
уравнение A5) на xl и воспользовавшись формулами A4), мы при-
придем к уравнению A3) множества К в репере A2). Возможны
следующие случаи.
1. Среди коэффициентов ац, i, / = 1, 2,..., /2, есть отличные от нуля.
Тогда A3) —уравнение второй степени относительно ?i, ?2, •••> |« и
К является квадрикой в пространстве An(i).
2. Коэффициенты ац = 0, /, /=1,2, ..., /г, но среди коэффициентов
а0/, /=1, 2, ..., /7, есть отличные от нуля. Тогда A3) является
уравнением первой степени относительно ?i, ?2, •••> 1>п и К — гип< ,
плоскость в пространстве An(i).
3. Коэффициенты аг, = 0у аО/ = О, /,/=1, 2, ..., я. Так как по
условию аОо^О, то равенство A3) приводит к противоречию.
В этом случае /С= 0.
Итак, множество всех собственных точек квадрики К прост-
пространства Pn(i) может быть в пространстве An(i) квадрикой, гипер-
гиперплоскостью или пустым множеством.
28.7. Линии второго порядка на плоскости P2(i)
Пространство P2(i) в дальнейшем будем называть плоскостью,
а квадрики в этой плоскости — линиями второго порядка.
На плоскости P2(i) имеется пять классов проективно эквивалент-
эквивалентных линий второго порядка (см. § 28.6). В некоторой однородной
системе координат представители этих классов могут быть заданы
следующими уравнениями:
-4 + *21+4 = 0> A)
*2 + *? + *2 = О, B)
-х20 + х2 = 0, C)
jtij+ *? = (), D)
*? = 0. E)
Определение 28.16. Линия, заданная на плоскости Р2A)
уравнением A), называется действительным овалом, а линия, за-
заданная на плоскости Р2 (i) уравнением B),— мнимым овалом.
Уравнение C) задает пару действительных прямых: — хо-\- хх =
= 0, х0 + *i = 0, а уравнение D) — пару мнимых прямых: —ix0 +
+ *i = 0, ixo-\- хх=0. Уравнение E) задает сдвоенную прямую.
Напомним аффинную классификацию линий второго порядка
на плоскости А2(Г). В некотором репере (О, е,, е2) представители
аффинных классов могут быть заданы следующими уравнениями:
^ + ^2=1 (эЛЛиПС), F)
237
^? + ^2= —1 (мнимый эллипс), G)
1\ — ll = 1 (гипербола), (8)
^ — ll = 0 (пара действительных пересекающихся пря-
прямых), (9)
?? + ^2 = О (пара мнимых пересекающихся прямых), A0)
g? = 2gl (парабола), (И)
^— 1=0 (пара действительных параллельных прямых),A2)
|? + 1 = 0 (пара мнимых параллельных прямых), A3)
? 1 = 0 (сдвоенная прямая). A4)
При переходе от плоскости A2(i) к плоскости Р2(/) каждая из
линий F) — A4) превращается в одну из линий A) — E). Для
реализации этого перехода рассмотрим формулы, связывающие
однородные координаты с неоднородными:
?, = *i/*2, 12 = Х2/Хо- A5)
Подставляя выражения A5) в уравнение F) и умножая полу-
полученное уравнение на х\, приходим к уравнению A). Это означает,
что эллипс является множеством собственных точек действитель-
действительного овала Оэ.
Подставляя выражения A5) в уравнение (8), мы приходим к
уравнению
4х*+ 4
Оно задает на плоскости P2(i) овал. Следовательно, гипербола
также является множеством собственных точек некоторого овала
Ог. Различие между овалами Оэ и Ог состоит в следующем. Овал Оэ
не имеет действительных несобственных точек. В самом деле, пола-
полагая хо = О, из уравнения A) получаем х\-\-х\ = 0. Отсюда следует,
что овал Оэ содержит только две несобственные мнимые точки:
Л1 jA, /, 0), М2(\, —/, 0). Аналогично получаем, что овал Ог содержит
две действительные несобственные точки: Af3(l, 1, 0), Л14A, —1, 0).
Подставляя теперь выражения A5) в уравнение A1), имеем
*? —2*0*2 = 0. A6)
Совершая преобразование однородных координат по формулам:
*O = (*5-*$)/V2, *,=*{, *2 = (*0 +
приводим уравнение A6) к нормальному виду:
-х*+ 4 = о.
Мы снова получили овал. Итак, парабола (И) является множе-
множеством собственных точек овала Оп. Подставляя хо = Ов уравнение
A6), получаем *, =0. Это означает, что овал Оп имеет одну несоб-
несобственную точку М@9 0, 1).
Мнимый эллипс G) плоскости A2(i) при переходе к плоскости
P2(i) превращается в мнимый овал B). Пара действительных пере-
пересекающих прямых (9) плоскости A2(i) пополняется двумя несобст-
238
венными точками: N,@, 1, 1), jV2@, 1, —1) и превращается в пару
действительных прямых C) плоскости P2(i). Если перейти к одно-
однородным координатам в уравнении A2), получим
*§-*? = 0, A7)
т. е. уравнение пары прямых на плоскости P2(i). Итак, при переходе
от А (/) к P2(i) пара действительных параллельных прямых A2)
пополняется несобственной точкой S@, 0, 1), принадлежащей обеим
этим прямым, и превращается в пару действительных пересекаю-
пересекающихся прямых плоскости P2(i).
Аналогично в один проективный класс D) попадают пара мнимых
пересекающихся прямых A0) и пара мнимых параллельных пря-
прямых A3). Наконец, сдвоенная прямая A4) плоскости A2(i) превра-
превращается в сдвоенную прямую E) плоскости P2(i) после добавления
сдвоенной точки Г@, 0, 1).
28.8. Поверхности второго порядка в пространстве Р3(/)
Квадрики пространства Я3(/) будем называть поверхностями вто-
второго порядка. Как показано в § 28.6, в пространстве P3(i) имеется
восемь классов проективно эквивалентных поверхностей второго
порядка. В некоторой однородной системе координат представители
этих классов задаются следующими уравнениями:
у2 I у2 I у2 I у2 А /о\
Л0 "Т~ Л1 ~Т~ Л2 I" Л3 ' V /
y2 J- y2 J- г2 П (А\
Л0 I Л1 I Л2 и> \Ч)
Xq ~Т х\ I Х2 = 0» E)
v2 I v2 П f&\
л0 ~Г х\ — и» \V)
ло ~р A;i == и, ^ / j
*2 = 0. (8)
Определение 28.17. Поверхности A), B), C) в простран-
пространстве P3(i) называются соответственно мнимой овальной поверх-
поверхностью, действительной овальной поверхностью и кольцевидной по-
поверхностью.
Уравнения D) — (8) задают соответственно мнимый конус, дей-
действительный конус, пару действительных различных плоскостей,
пару мнимых различных плоскостей и сдвоенную плоскость.
Напомним аффинную классификацию поверхностей второго по-
порядка в пространстве Л3(/). В некотором репере (О, е,, е2, е3) пред-
представители аффинных классов могут быть заданы следующими урав-
уравнениями:
Й + Ш + U = 1 (эллипсоид), (9)
Й + ll + ?з ~ — 1 (мнимый эллипсоид), A0)
й + Ш — ?з = 1 (однополостный гиперболоид), A1)
й + ^2 — ?з = — 1 (двуполостный гиперболоид), A2)
239
gj + g| = 2g3 (эллиптический параболоид), A3)
g2 — ll = 2?;3 (гиперболический параболоид), A4)
gf -|- g| — 6з = 0 (действительный конус), A5)
?? + ^ + U = О (мнимый конус), A6)
?? + ?2 — 1 (эллиптический цилиндр), A7)
^ + ^2 = — 1 (мнимый эллиптический цилиндр), A8)
?2 — g| = 1 (гиперболический цилиндр), A9)
?? = 2?2 (параболический цилиндр), B0)
?2 — ^2 = 0 (пара действительных пересекающихся
плоскостей), B1)
?i + ^2 —0 (пара мнимых пересекающихся плоско-
плоскостей), B2)
?, — 1 = 0 (пара действительных параллельных пло-
плоскостей), B3)
g2+ 1 =0 (пара мнимых параллельных плоскостей)B4)
?i = 0 (сдвоенная плоскость). B5)
При переходе от пространства Л3(/) к пространству Я3(/) каждая
из поверхностей (9) — B5) превращается в одну из поверхностей
A) — (8). Чтобы проследить этот переход, используем формулы,
связывающие однородные координаты с неоднородными:
?,l=xl/x0, \>2 = xilx& ?>з = хз/хо- B6)
Подставляя выражения B6) в уравнение (9) и умножая полу-
полученное уравнение на *§, приходим к уравнению B). Это означает,
что эллипсоид является множеством действительных точек действи-
действительной овальной поверхности Оэ. Подставляя выражения B6)
в уравнение A2), получаем
*? + *2-*з + *о = О, B7)
т. е. уравнение типа C). Итак, при переходе к пространству P3(i)
двуполостный гиперболоид A2) превращается в действительную
овальную поверхность Ог, задаваемую уравнением B7).
Перейдем теперь к однородным координатам в уравнении A3):
*? + *? —2*0*3 = 0. B8)
Совершая преобразование однородных координат:
приводим уравнение B8) к нормальному виду:
~\X0) +\Xl) +{X2) +{X3) =V.
Таким образом, эллиптический параболоид A3) при переходе
к пространству Р3A) превращается в действительную овальную по-
поверхность Оп, задаваемую уравнением B8).
Покажем, что действительные овальные поверхности Оэ, Ог, Оп
отличаются друг от друга своим отношением к несобственной плос-
плоскости. В самом деле, найдем пересечение поверхности Оэ с несоб-
240
ственной плоскостью. Для этого в уравнение B) подставим хо =
Получим уравнение
которое в однородных координатах на несобственной плоскости
P2(i) задает мнимый овал. Итак, поверхность Оэ пересекает несоб-
несобственную плоскость по мнимому овалу. Аналогично находим, что
поверхность Ог, заданная уравнением B7), пересекает несобствен-
несобственную плоскость по действительному овалу
Наконец, поверхность Оп пересекает несобственную плоскость
по паре мнимых прямых
Х\ —|— Х<± == \J-
Мнимый эллипсоид A0) при переходе к пространству Я3(/) пре-
превращается в мнимую овальную поверхность A).
Переходя к однородным координатам в уравнении A1), полу-
получаем уравнение
Х0 \ Х\ \ Х2 ХЪ == ^*
Это уравнение, подобно уравнению C), задает в пространстве P3(i)
кольцевидную поверхность /Сг. Запишем в однородных координатах
уравнение A4):
Приводя это уравнение к нормальному виду, убеждаемся, что оно
задает кольцевидную поверхность /Сп. Поверхности /Сг и Ки разли-
различаются своим отношением к несобственной плоскости P2(i): поверх-
поверхность Кг пересекает плоскость P2(i) по овалу x2-\-xl— xl = 0, а по-
поверхность /О, — по паре действительных прямых х\ — xl = 0.
Мнимый конус Мк, заданный уравнением A6), при переходе к
пространству Р (/) превращается в мнимый конус пространства
Ps(i) с уравнением
з = О
Если теперь перейти к однородным координатам в уравнении
A8), мы получим уравнение
которое в постранстве P3(i) также задает мнимый конус Ма. По-
Поверхность Мк пересекает несобственную плоскость P2(i) по действи-
действительному овалу, а поверхность Мц — по паре мнимых прямых.
Действительный конус A5) пространства A3(i) при переходе
к пространству P3(i) превращается в действительный конус К с урав-
уравнением
** + *2 —*| = 0. B9)
16. Зак. 6466 241
Переходя к однородным координатам в уравнении A7) эллипти-
эллиптического цилиндра, приходим к уравнению
-*g+ *? + *! = о, C0)
которое в пространстве Р3(/) задает действительный конус Кэ. Ана-
Аналогично из уравнения A9) гиперболического цилиндра получаем
уравнение
х20-х2х+4 = 0, C1)
которое в пространстве Р3(/) также задает действительный конус
Кг Переходя к однородным координатам в уравнении B0) парабо-
параболического цилиндра, получаем уравнение
х\ - 2х0х2 = 0. C2)
Приводя это уравнение к нормальному виду, убеждаемся, что оно
также задает действительный_конус /Сп.
Поверхности /С, Кэ, Кт, Кп отличаются друг от друга своим
отношением к несобственной плоскости. Чтобы найти пересечение
каждой из этих поверхностей с несобственной плоскостью, доста-
достаточно в уравнения B9) — C2) подставить хо = О. В результате
получаем, что поверхности /С, /Сэ, /(г, /Сп пересекают несобственную
плоскость соответственно по следующим линиям: действительному
овалу, паре мнимых прямых, паре действительных прямых, сдво-
сдвоенной прямой.
Пара действительных пересекающихся плоскостей пространства
Л3(/), заданная уравнением B1), при переходе к пространству P3(i)
превращается в поверхность П,, заданную уравнением х\ — xl = 0
и состоящую из пары действительных плоскостей. Переходя в урав-
уравнении B3) к однородным координатам, получаем уравнение
— jcq + jc? = O, которое в пространстве Р3(/) задает поверхность П2,
также состоящую из пары действительных плоскостей. Поверхности
Г^ и П2 пересекают несобственную плоскость соответственно по
паре действительных прямых и по сдвоенной прямой.
Пара мнимых пересекающихся плоскостей B2) и пара мнимых
параллельных плоскостей B4) при переходе к пространству P3(i)
превращаются в поверхности П3 и П4, каждая из которых в свою
очередь сама является парой мнимых плоскостей, пересекающихся
по действительной прямой. Эта прямая для поверхности П3 является
собственной, а для поверхности П4 — несобственной.
Сдвоенная плоскость B5) пространства Л3(/) при переходе к
пространству Р3(/) превращается в сдвоенную плоскость простран-
пространства Р3(/).
29. ТЕНЗОРЫ
В этой главе дается общее понятие о тензорах и операциях
над ними. Тензоры довольно часто встречаются в линейной алгебре
и аналитической геометрии. Они применяются не только в матема-
математике, но и в механике, физике и т. д.
242
29.1. Общее понятие о тензорах
Пусть Vn — я-мерное линейное пространство над полем Р. Возь-
Возьмем какой-либо вектор x?Vn. Если выбрать некоторый базис
е„ е2, ..., ея, A)
то вектор х можно единственным образом разложить по этому ба-
базису:
х = х!е, + х2е2 + ... + хпеп -
B)
Здесь мы номер координаты вектора х помещаем в верхний индекс
буквы х, а не в нижний, как это делалось раньше. Такой способ
обозначений при рассмотрении тензоров оказывается более удобным.
Введем новое соглашение относительно операции суммирова-
суммирования: если в каком-либо выражении производится суммирование
по индексу, стоящему один раз вверху и один раз внизу, знак сум-
суммирования будем опускать. Другими словами, сумму, стоящую в
правой части равенства B), будем обозначать х'е(. Итак, формулу
разложения вектора х по базису A) можно переписать в виде
х = х*ъ. C)
Возьмем теперь какой-либо другой (новый) базис
е{, е?, ..., е'п
и разложим каждый из векторов D) по базису A):
е, = ale, 4- a?e9 + ... + с?\ъп,
D)
E)
Из коэффициентов разложения в формулах E) можно составить
матрицу
А =
а*
F)
которая в § 17.7 была названа матрицей перехода от базиса A) к
базису D). Заметим, что элемент матрицы Л, стоящий в /-й
строке и /-м столбце, мы обозначаем теперь а). Использовав согла-
соглашение о суммировании, перепишем теперь формулы E) в виде
tj = affii. G)
Индекс / в равенстве G) называется индексом суммирования,
а / — свободным индексом. В дальнейшем будем считать, что если
в формуле есть свободный индекс, это означает, что данная форму-
формула является краткой записью п формул, которые получаются, когда
свободному индексу придают значения 1,-2, ..., п.
243
Разложим теперь указанный выше вектор х по базису D):
х = *"е/, /= 1, 2, ..., п. (8)
Здесь х'\ х'\ ..., х'" — новые координаты вектора х, т. е. его коорди-
координаты в новом базисе D), Выразим новые координаты вектора х
через его старые координаты х , х2у ..., хп. Для этого запишем фор-
формулы G) в матричном виде:
[е{ t'2 ... ej] = [e, e2 ... ел]Л. (9)
Пусть В — матрица, обратная матрице А:
ь\ ь\
Ы
ы
A0)
Умножая обе части равенства (9) справа на матрицу В, получаем
[е, е2 ... е„] = [е{ е'2 ... е'п]В.
Перепишем это равенство в виде
e, = ft}e/. (И)
Использовав равенства C), (8), A1), имеем:
л — л с, — л Cj —-х \OjCt) —\OjX' je/.
Отсюда в силу единственности разложения вектора х по базису D)
следует искомая формула
х = орс. (lz)
Запишем эту формулу в развернутом виде:
x'l = b\xl + bl2x2 +... + b\x\
х'п = Ьпххх
Ъ\х2
Ыхп.
Сопоставим формулы E) и A3). Если в формулах E) коэффи-
коэффициенты перехода от старого базиса A) к новому базису D) обра-
образуют матрицу Ат, в формулах A3) коэффициенты перехода от ста-
старых координат вектора х к его новым координатам образуют матрицу
Теперь мы сформулируем первое определение тензора.
Определение 29.1. Говорят, что в линейном пространстве Vn
дан одновалентный контравариантный тензор, если в каждом базисе
указано п чисел а\ а2, ..., ап из поля Р (координат тензора), пре-
преобразующихся при переходе от базиса A) к базису D) по закону
a/l = ftja/", A4)
где В =[&/] — матрица перехода от базиса D) к базису A).
244
Термин «контравариантный», т. е. «противопреобразующийся»,
указывает на то, что координаты контравариантного тензора а\
а2, ..., ап преобразуются не так, как векторы базиса е,, е2, ..., е„,
а с помощью обратной транспонированной матрицы (ср. формулы
E) и A3)). Выше мы видели, что примером одновалентного контра-
контравариантного тензора служат координаты вектора.
Рассмотрим теперь линейную функцию на линейном простран-
пространстве V" (см. § 23.1):
/: Г->А A5)
Исходя из базиса A), получаем
где
а, = /(«,)¦ A6)
Определение 29.2. Числа A6) называются координатами
линейной функции f в базисе A).
Посмотрим теперь, как преобразуются координаты линейной
функции / при переходе к новому базису D). Имеем
= ajf (e>) = afr.
Итак,
a\ = dfli. A7)
Мы видим, что координаты линейной функции преобразуются
так же, как базисные векторы (ср. равенства G) и A7)). Этим и
объясняется употребление термина «ковариантныи», т. е. «сопре-
образующийся», в следующем определении.
Определение 29.3. Говорят, что в линейном пространстве
Vn дан одновалентный ковариантныи тензор, если в каждом базисе
указано п чисел ах, а2, ..., ап из поля Р (координат тензора), пре-
преобразующихся при переходе от базиса A) к базису D) по закону
A7), где А=[а!^ — матрица перехода от базиса A) к базису D).
Выше было показано, что координаты линейной функции обра-
образуют одновалентный ковариантныи тензор.
Рассмотрим введенную в § 23.2 билинейную функцию ср на линей-
линейном пространстве Vn. Элементы матрицы этой билинейной функ-
функции в базисе A) задаются с помощью формулы
а// = ф(е,-, е,-). A8)
Назовем числа A8) координатами билинейной функции ср в ба-
базисе A) и найдем закон преобразования этих координат при пере-
переходе к базису D). Имеем
Итак,
245
A9)
Определение 29.4. Говорят, что в линейном пространстве
Vn дан двухвалентный ковариантный тензор, если в каждом базисе
указано п чисел ач, преобразующихся при переходе от базиса A)
к базису D) по закону A9).
Выше было показано, что координаты билинейной функции об-
образуют двухвалентный ковариантный тензор.
Теперь мы сформулируем понятие тензора общего вида.
Определение 29.5. Говорят, что в линейном пространстве
Vх дан (р -f ц)-валентный тензор, р раз ковариантный и q раз контра-
вариантный, или типа (р, q), если в каждом базисе указаны npJtq чисел
a[ft \i (координаты тензора), преобразующихся при переходе от
базиса A) к базису D) по закону
U ft,ft2 kP — «ft, akv°\x °}qai\i2~h' VZUi
Суть закона преобразования B0) состоит в том, что каждый
нижний индекс тензора а[^ \ч участвует в преобразовании один раз
по схеме ковариантного тензора A7), а каждый верхний индекс —
один раз по схеме контравариантного тензора A4).
29.2. Примеры тензоров
В § 29.1 уже было рассмотрено три примера тензоров: коорди-
координаты вектора образуют тензор типа @,1), координаты линейной
функции — тензор типа A,0) и координаты билинейной функции —
тензор типа B,0). (Здесь и далее линейную функцию мы будем на-
называть также ковектором.)
Числа р и q, определяющие тип (р, q) тензора, могут принимать
любые целые неотрицательные значения.
Определение 29.6. Тензор типа @, 0) называется инвари-
инвариантом.
Инвариант — это число, не зависящее от выбора базиса. При-
Примером инварианта может служить число п векторов, образующих
базис пространства Vn.
В качестве следующего примера рассмотрим линейный оператор
/ пространства Vn. Как известно (см. § 19.3 и 19.7), в любом базисе
е„ е2, ..., еп A)
оператору / соответствует матрица С = [с% которая при переходе
от базиса A) к базису
е{, ej, ...,eJ B)
изменяется по закону
С' = ВСАУ C)
где А = \а)\ — матрица перехода от базиса A) к базису B); В =
246
= [b)] = A l. Сравнивая элементы матриц, стоящих в левой и правой
частях равенства C), получаем
ci' = alb№h D)
Итак, элементы матрицы линейного оператора образуют тензор
типа A,1).
Возьмем, в частности, тождественный линейный оператор е.
В любом базисе ему соответствует единичная матрица.
Определение 29.7. Элементы единичной матрицы обозна-
обозначают символом 6), который называется символом Кронекера.
Итак, символ Кронекера определяется формулой
¦ П
°> \0,
если / = /,
Определение 29.8. Тензор, полученный при задании в каждом
базисе единичной матрицы, называется тензором Кронекера.
Обобщим понятие билинейной функции, заданной на линейном
пространстве Vn.
Определение 29.9. Полилинейной или m-линейной функцией
на линейном пространстве Vn называется отображение
f: ГХГХ...ХГ->Л E)
пг раз
линейное относительно каждого из аргументов, т. е.
= Л,/(х1, х2, ...,
для любых векторов хь у,, х2, ..., хт 6 Vn и любых чисел Л,, Мч 6 Р-
Возьмем какой-либо базис A) и обозначим координаты вектора
х/ через Х@, xfi), ..., х(% Тогда
= *?1)*1B) '"^(m)f(^ e/2, ..., ej. F)
Введем следующие обозначения:
cixi, im = /(elV elV ..., ef-J. G)
Определение 29.10. Числа G) называются координатами
полилинейной функции E) в базисе A).
Найдем закон преобразования координат G) при переходе от
базиса A) к базису D) по формуле е/ = а%. Имеем
Сравнивая последнюю формулу с формулой B0) из § 29.1, мы
видим, что координаты полилинейной функции E) образуют "тензор
типа (т, 0).
Рассмотрим теперь два примера тензоров из области аналити-
247
ческой геометрии. Пусть Ап — /г-мерное аффинное пространство,
связанное с линейным пространством Vn над полем Р. Зафиксиро-
Зафиксировав в пространстве Ап некоторую точку О, мы превратим Ап в ли-
линейное пространство, изоморфное пространству Vn. Задание в про-
пространстве Ап репера
(О, е,, е2, ..., ел) (8)
с началом в точке О равносильно заданию базиса A) в пространстве
Vn. Таким образом, появляется возможность рассматривать тензоры.
Возьмем в пространстве Ап какую-либо гиперплоскость П, не
проходящую через точку О. Выберем некоторый репер (8), тогда
гиперплоскость задается уравнением
п[х1 + а = 0. (9)
Так как афОу то разделив это уравнение на а, получим
Cixl+l = 0. A0)
Числа с,, с2, ..., сп назовем координатами гиперплоскости П.
Возьмем еще один репер
(О, е[, е?, ..., е?), A1)
а значит, и базис B). Запишем уравнение гиперплоскости П в новой
системе координат. Для этого выразим старые координаты х\ х2, ...,
хп произвольной точки М через ее новые координаты (см. формулы
A1) из § 25.2):
х1 = а)х'\ A2)
где Л=[а}] — матрица перехода от базиса A) к базису B).
Подставляя выражения A2) в уравнение A0), получаем урав-
уравнение гиперплоскости П в новых координатах:
где
cj = a)Ci. A3)
Формулы A3) показывают, что координаты гиперплоскости об-
образуют тензор типа A,0).
Рассмотрим теперь в пространстве Ап некоторый репер (8) и
квадрику д, не содержащую точку О. Уравнение этой квадрики
можно записать в виде
djxixi + 2cixi+ 1=0. A4)
Числа Cij и d называются соответственно двухиндексными и
одноиндексными координатами квадрики К. Найдем закон преобра-
преобразования этих координат. Для этого подставим в уравнение A4) вы-
выражения х1 = alkx'\ х' = а\х'[ старых координат через новые. В резуль-
результате получим уравнение квадрики К в новых координатах:
c'kix'kx'1 + 2c'kx'k +1=0,
где сш 1\ '
ц
Итак, двухиндексные координаты Сц квадрики К образуют тензор
типа B, 0), а одноиндексные координаты d этой же квадрики —
тензор типа A,0).
248
29.3. Операции над тензорами
Как известно, при сложении векторов складываются их соответ-
соответствующие координаты (см. теорему 17.4), а при сложении линейных
операторов — их матрицы (см. теорему 19.3). Этими свойствами
можно воспользоваться при определении операции сложения для
тензоров.
Пусть в пространстве Vn заданы два тензора одного и того же
типа, например B,1). Их координаты c)ky d\k в базисах:
е„ е2, ..., ея> A)
е{, е?, ..., е'п B)
записываются соответственно в виде:
c';s = a[aksb\c)k, C)
d'rs= a[aksblid)k. D)
Рассмотрим теперь в каждом базисе систему чисел, полученных
при сложении соответствующих координат данных тензоров:
h)k = c)k + 4*, К* = c'rs + d;'s.
Чтобы получить закон преобразования чисел h)k при переходе
от базиса A) к базису B), достаточно сложить левые и правые
части равенств C) и D) и воспользоваться свойством дистрибу-
дистрибутивности суммы. В результате имеем
h'rs= a[aksblih)k.
Итак, числа h)k преобразуются по закону тензора типа B,1).
Аналогично рассматривается общий случай тензоров типа (р, q).
Определение 29.И. Суммой двух тензоров одного и того же
типа (р, q) называется тензор того же типа, полученный в резуль-
результате сложения соответствующих координат данных тензоров в каж-
каждом базисе.
Аналогично обосновывается и следующее
Определение 29.12. Произведением тензора типа (р, q) на
число X ? Р называется тензор того же типа, полученный умножением
координат данного тензора в каждом базисе на число X.
Теперь введем операцию умножения для двух произвольных
тензоров, заданных в пространстве Vn. Пусть, например, заданы
тензоры типа A,2) и типа B,0). Возьмем их координаты c)k, glm в
базисах A) и B) соответственно:
g>uv=bfbvmgtm. F)
Рассмотрим теперь в каждом базисе систему чисел, полученных
в результате умножения каждой координаты первого тензора на
каждую координату второго тензора:
pitm — rl-,0lm P''uv — rVafUC
17. За к. 6466 249
Чтобы получить закон преобразования чисел еLт, достаточно
перемножить левые и правые части равенств E) и F) и восполь-
воспользоваться известными свойствами операции суммирования. В резуль-
результате имеем
Мы видим, что при умножении получился тензор типа B,3).
Итак, можно сформулировать следующее
Определение 29.13. Произведением тензора типа (р, q) на
тензор типа (г, 5) называется тензор типа (р-\- г, q -\- s), который по-
получается в результате умножения в каждом базисе каждой коорди-
координаты первого тензора на каждую координату второго тензора.
Теперь рассмотрим так называемую операцию свертывания тен-
тензоров. Пусть задан тензор, имеющий по крайней мере один верхний
и один нижний индекс, например сЪ. Выберем какой-нибудь из верх-
верхних индексов, например первый, и какой-нибудь из нижних индексов,
например второй. Отберем те координаты тензора, для которых два
выбранных индекса имеют одинаковые значения 1, 2, ..., п, и про-
просуммируем их при фиксированных значениях остальных индексов:
Эта сумма зависит только от индексов / и ?, и ее можно обозначить
с[. Итак,
cVs=ci. • G)
Такое же суммирование проведем и в любом другом базисе. На-
Например, для базиса B) получим
c!s=cr (8)
Покажем теперь, что построенные нами системы чисел с[, с\\ ...
образуют тензор типа A,1), т. е. тензор, имеющий по сравнению
с исходным на один верхний индекс и на один нижний индекс меньше.
Запишем закон преобразования координат исходного тензора:
Придадим индексам и и и одинаковые значения и проведем
суммирование:
cis=aktalsbsib]dii. (9)
В правой части равенства (9) происходит суммирование по пяти
индексам: /, /, k, /, 5. Выполним сначала суммирование по индексу 5.
Так как матрицы A = [а?] и B = [brt] взаимно обратные, то
aibs_&i__(U если 1 = 1,
Подставляя формулу A0) в равенство (9), получаем
250
и, далее,
ЦЬ]
с'и = аЦЬ]с%- (И)
В силу равенств G) и (8) равенство A1) принимает вид
т. е. числа с? образуют тензор типа A,1)- Приведенные рассуждения
позволяют сформулировать следующее
Определение 29.14. Получение тензора сЪ из тензора сЪ по
формуле G) называется операцией свертывания тензора сЪ по пер-
первому верхнему и второму нижнему индексам.
Это определение применимо и к произвольному тензору типа
(р, q\ если р > 0 и </ > 0. В результате свертывания получается тен-
тензор типа (р — 1, q — 1).
Операция свертывания является важным источником получения
инвариантов, т. е. тензоров типа @,0). Если выполнить последо-
последовательно р свертываний тензора типа (р, р) по парам разнотипных
индексов, получится тензор типа @, 0).
Возьмем, например, тензор с), образованный матрицами линей-
линейного оператора / пространства Vn. Свертывание приводит к инва-
инварианту
С = С[ = С j —\~ С2 ~\~ • • • "Т" Сп у
который по аналогии со следом матрицы (см. § 19.10) может быть
назван следом тензора с).
Линейная функция на пространстве Vn
может рассматриваться как результат умножения тензора а, на тен-
тензор х1 и последующего свертывания. Аналогично билинейная функция
г(х, у) = gutty'
может рассматриваться как результат умножения тензоров g^, xk, yl
и последующего двукратного свертывания.
Упражнения
1. Докажите, что множество всех тензоров данного типа (р, q) в линейном
пространстве Vn над полем Р является линейным пространством над полем Р.
2. Докажите, что операция свертывания является линейным оператором.
29.4. Симметрические и кососимметрические тензоры
Рассмотрим еще одну операцию над тензором, имеющим по
крайней мере два однотипных индекса, например над тензором, обра-
образованным матрицами билинейной функции
f(x, у) = МУ A)
на пространстве Vn. Далее рассмотрим билинейную функцию
Я(х. У) = «У. х) = я,/дА/'. B)
251
Очевидно, что gij~fji и матрица G = [gij] получается из матрицы
F = [fij] транспонированием.
Определение 29.15. Описанная выше операция над тензором
fq называется операцией перестановки индексов.
В общем случае билинейные формы A) и B), как и соответст-
соответствующие им тензоры, не совпадают. Случай их совпадения отражает
определение 22.14 и следующее
Определение 29.16. Тензор сц называется симметрическим,
если
Cij = Cji. C)
Аналогично произвольный тензор d(*h\, содержащий по крайней
мере два однотипных индекса, называется симметрическим по паре
таких индексов, например по \х и jq, если
6/i/2 b~CW2 /V \*>
Рассмотрим теперь произвольный тензор Сц и тензор йц = с}1,
полученный из Сц перестановкой индексов. Тензор
удовлетворяет условию C), т. е. является симметрическим. Будем
обозначать его с{}. Итак,
с^ = {сц + сп)/2. E)
Определение 29.17. Получение тензора Сщ) из тензора сц
называется операцией симметрирования.
Понятия симметрического тензора и операции симметрирования
можно обобщить.
Определение 29.18. Тензор dfa Лри называется симметрическим
по нижним индексам, если он не меняется при перестановке любой
пары этих индексов.
Аналогично определяется симметричность по верхним индексам.
Возьмем теперь произвольный тензор cixhrh и поставим ему в со-
соответствие тензор того же типа (р, q), но симметрический по нижним
индексам. Для этого используем понятие подстановки множества
{/i» /2» •••» iq)y введенное в § 3.6. Любая подстановка
а=(Ь h '• М,
согласно теореме 3.6, может быть представлена в виде произведения
транспозиций, т. е. перестановок двух индексов. Поэтому можно
говорить о тензоре
„i\io ip rixi2 in
Определение 29.19. Получение из тензора
252
тензора
1 V л- i
-4,2
где суммирование берется по всем подстановкам множества
{/i, /2, .., jq), называется симметрированием тензора F) по нижним
индексам.
Очевидно, что тензор G), полученный в результате симметри-
симметрирования по нижним индексам, является симметрическим по этим
индексам.
Перейдем теперь к операции альтернирования. Для этого на-
напомним, что любая подстановка является четной или нечетной, и
введем следующее
Определение 29.20. Знаком подстановки о называется число
е (а), заданное формулой
/ ч Г 1, если а — четная подстановка,
г(о) = < t
{— 1, если а — нечетная подстановка.
Определение 29.21. Тензор с1^'^ называется кососимметри-
ческим по нижним индексам, если
для любой подстановки о.
Теперь мы можем ввести операцию альтернирования по аналогии
с операцией симметрирования.
Определение 29.22. Получение тензора
из тензора .. .
называется операцией альтернирования тензора (9) по нижним
индексам.
Очевидно, что тензор (8), полученный альтернированием по
нижним индексам, кососимметричен по этим индексам.
Упражнения
1. Покажите, что множество всех тензоров типа (р, q\ симметрических (косо-
симметрических) по нижним индексам, образует подпространство в линейном про-
пространстве всех тензоров типа (р, q). Найдите размерность этих подпространств для
случая р = 0, q = 2.
2. Докажите, что операции симметрирования и альтернирования являются ли-
линейными операторами.
29.5. Тензоры в евклидовом пространстве
Пусть Еп — /г-мерное линейное евклидово пространство. Все,
что было сказано о тензорах в произвольном линейном пространст-
пространстве, остается верным и для пространства Еп. Однако благодаря
253
наличию скалярного произведения появляются новые возможности
для операций над тензорами.
Билинейную функцию, задающую в пространстве Еп скалярное
произведение, обозначим через g. Выберем в пространстве Еп ка-
какой-либо базис
ei, e2, ..., е„. A)
Как и в предыдущих параграфах, координаты произвольного
вектора х в базисе A) будем обозначать х\ г2, ..., хп. Заметим,
что они порождают один раз контравариантный тензор (см. § 29.1).
Если у (у1, у2, ..., уп)— еще один вектор из Еп, то, как известно
(см. §23.2),
г(*> у) = #/*#>
где
Вч = В(ъ> «/) B)
являются координатами дважды ковариантного тензора.
Определение 29.23. Тензор, определяемый формулой B),
называется ковариантным метрическим тензором.
Как известно (см. § 23.4), тензор gij является симметрическим
и матрица G = (gij)— невырожденная. Рассмотрим в каждом базисе
матрицу G~\ обратную матрице G. Элементы матрицы G будем
обозначать через glS.
Теорема 29.1. Элементы матрицы G~\ заданные в каждом
базисе, образуют дважды контравариантный симметрический
тензор.
Возьмем наряду с базисом A) еще один базис
е{, е$, ..., t'n. C)
Пусть А = (а)) — матрица перехода от базиса A) к базису C),
а В = (blj) — обратная матрица перехода от базиса C) к базису A).
Рассмотрим дважды контравариантный тензор, имеющий в базисе
A) координаты glj, а в базисе C) — координаты
Так как gst— координаты дважды ковариантного тензора в ба-
базисе A), то координаты этого тензора в базисе C) задаются фор-
формулой
Имеем
g"' = g!p = btb
=&iW'ff/' = ЬЫрЬ\= b\alp= 6*.
Итак, показано, что координаты g'kl в базисе C) тензора, опре-
определяемого матрицей G~\ совпадают с элементами матрицы, обрат-
обратной матрице ковариантного метрического тензора в любом базисе.
Симметричность матрицы G следует из симметричности матри-
матрицы G.
254
Определение 29.24. Дважды контравариантный тензор, опре-
определяемый элементами glj матрицы G~\ называется контравариант-
ным метрическим тензором.
Пусть задан произвольный вектор
x = xfti. D)
Его координаты, взятые в каждом базисе, образуют один раз
контравариантный тензор. Рассмотрим теперь тензор, полученный
перемножением тензоров gij и / с последующим свертыванием:
xi = gijxi. E)
Числа х\у Х2У ..., хп, полученные по формуле E) в каждом
базисе, образуют один раз ковариантный тензор. Выясним, как свя-
связаны эти числа с вектором х:
Xi = gijXi = (ti-tj)xi = Ъ-Х. F)
Итак, Xi равно скалярному произведению вектора х на базис-
базисный вектор е,.
Определение 29.25. Числа х\ г2, ..., хп, определяемые фор-
формулой D), называются контравариантными координатами вектора х.
Числа х\у Х2, ..., Хп, заданные формулой F), называются ковариант-
ными координатами этого вектора.
Формулы E) выражают ковариантные координаты вектора х
через его контравариантные координаты. Чтобы найти выражение
контравариантных координат через ковариантные, умножим тензор
E) на тензор gkl и произведем свертывание:
А- = ЛУ = в^ = х*. G)
В случае ортонормированного базиса A) матрицы тензоров
gij и glj обращаются в единичную матрицу, и ковариантные коорди-
координаты совпадают с контравариантными.
Определение 29.26. Переход от тензора х1 к тензору xt
по формуле F) называется операцией опускания индекса. Обрат-
Обратный переход от тензора xt к тензору х* no формуле G) называ-
называется операцией поднятия индекса.
Эти две операции можно перенести на тензоры любого типа.
Прежде всего изменим способ нумерации нижних и верхних индексов
тензора. До сих пор мы проводили раздельную нумерацию нижних
и верхних индексов. Например, у тензора afcw среди нижних индексов
k стоит на первом месте, / — на втором, т — на третьем, а среди
верхних индексов на первом месте стоит / и на втором /. В даль-
дальнейшем нумерация мест нижних и верхних индексов будет произ-
производиться в совокупности. Если, например, первый индекс стоит ввер-
вверху, то первое место внизу остается пустым, что отмечается точкой.
Аналогично для нижних индексов. Запись а;^т обозначает тензор,
у которого на первом месте стоит верхний индекс, на втором и
третьем — нижние индексы, на четвертом — верхний и на пятом —
нижний индексы. У этого тензора можно, например, опустить пер-
первый индекс:
255
a:;i = # .а./ .
У вновь полученного тензора можно поднять последний индекс:
Uskl- & Uskl.m'
Аналогично выполняются операции поднятия и опускания ин-
индексов у тензора произвольного типа.
ЛИТЕРАТУРА
Александров П. С. Курс аналитической геометрии и линейной алгебры.— М.:
Наука, 1979.—512 с.
Ефимов Н. В., Розендорн Э. Р. Линейная алгебра и многомерная геометрия.— М.:
Наука, 1974.— 544 с.
Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия.— М.: Наука,
1986.— 304 с.
Моденов П. С, Пархоменко А. С. Сборник задач по аналитической геомет-
геометрии,— М.: Наука, 1976.—384 с.
Постников М. М. Линейная алгебра и дифференциальная геометрия.— М.:
Наука, 1979.—312 с.
Проскуряков И. В. Сборник задач по линейной алгебре.— М.: Наука, 1984.—
336 с.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ К ПЕРВОЙ ЧАСТИ
Абсцисса 216
Автоморфизм группы 100
внутренний 101
— кольца 134
Алгебраическое дополнение 53, 56
Алгоритм Евклида 6, 146
Аппликата 216
Аргумент комплексного числа 88
Асимптота гиперболы 267
Вектор 198—200
—, противоположный данному 201
— прямой направляющий 232
Векторы базисные 213, 216
— коллинеарные 199
— компланарные 199
— линейно зависимые 207—209
— линейно независимые 207—209
Вершина гиперболы 267
— параболы 273
— эллипса 262
Вычет по модулю 126
Гипербола 264
— равносторонняя 267
— сопряженная 267
Гиперболоид двуполостный 290
— однополостный 287
Главная диагональ 23
Гомоморфизм групп 111
— естественный группы на фактор-
факторгруппу 113
— колец 133
Группа 72—74
— абелева (коммутативная) 74
— аддитивная 74
кольца 79
— знакопеременная 77
— конечная 75
— мультипликативная 74
кольца 81
— полная линейная 75
— примарная 118
— симметрии фигуры 72
— симметрическая 74
— специальная линейная 78
— циклическая 103
Действительная часть комплексного
числа 86
Декартов квадрат множества 28
Деление 82
Делимость многочленов 144
Делитель 5, 144
— наибольший общий 6—8, 150
— нормальный 108
— нуля 80
— общий 6, 145
Директриса гиперболы 269
— параболы 271
— эллипса 269
Длина вектора 199
Долгота 218
Запись многочлена лексикографиче-
лексикографическая 173
Значение многочлена 156
Идеал кольца 135
главный 135
Изоморфизм групп 99
— колец 133
Инверсия 38
Индекс подгруппы 106
— суммирования 21
Каноническое разложение многочлена
153
числа 11
Касательная плоскость двуполостного
гиперболоида 291
эллипсоида 284
Кватернион 91
Класс смежный левый группы по под-
подгруппе 105
Классы разбиения 30
— смежные кольца по идеалу 135
кольца по идеалу 135
Кольцо 78—81
— вычетов по модулю 128
— главных идеалов 135
— коммутативное 79
— многочленов от нескольких перемен-
переменных 167
от одной переменной 138—141
— числовое 79
Композиция отображений 33
Коническое сечение 287
Конус второго порядка 285, 288
Координаты вектора 211, 213, 216
— полярные 215
258
— Координаты прямоугольные 214, 216
— сферические 217
— точки аффинные 213, 216
— цилиндрические 217
Корень многочлена 156
/г-кратный 158
— первообразный 95
Коэффициент многочлена старший 139
— прямой угловой 233
Кратное 5
— наименьшее общее 8, 9
— общее 8
Критерий взаимной простоты 149
— идеала 135
— Эйзенштейна 192
Лемма Гаусса 191
Линейная комбинация 207
Матрица 12
— верхняя треугольная 24
— диагональная 24
— единичная 21
— квадратная 12
элементарная 66
— квазидиагональная 24
— невырожденная 62
— нижняя треугольная 24
— нулевая 13
— обратная 60
— прямоугольная 12
— расширенная системы линейных
уравнений 15
— симметрическая 26
— системы линейных уравнений 15
— скалярная 24
— ступенчатая 13
— транспонированная 25
Метод Гаусса 15, 16
Минор 53
— дополнительный 53
Мнимая единица 86
— часть комплексного числа 86
Многочлен (полином) 139
— линейный 156
— неприводимый 151
— нулевой 139
— приводимый 151
— примитивный 191
— симметрический 174
— элементарный симметрический 175
Многочлены взаимно простые 145
Модуль комплексного числа 88
Нормирующий множитель 242
Образ множества 32
— элемента 31
Объединение множеств 27
Ограничение (сужение) отображения
33
Октант координатный 216
Операция алгебраическая 69
ассоциативная 70
коммутативная 71
— групповая 74
— коммутирования 79
— транспонирования 25
Определитель Вандермонда 57
— матрицы 43—47
Ордината 216
Остаток от деления 6, 143
Ось 204
— гиперболы 267
— действительная 87, 267
— мнимая 87, 267
— параболы 273
— эллипса 261
Отрезок направленный 198
— нулевой 198
Парабола 271
Параболоид гиперболический 293
— эллиптический 292
Параллельный перенос 200
Пересечение множеств 28
Перестановка 37, 39
— нечетная 38
— четная 38
Плоскость комплексная 87
— координатная 216
Подгруппа 76, 77
— инвариантная 109
— конечного индекса 106
— нормальная 107
— тривиальная 77
— циклическая 103
Подкольцо 81
Подполе 82
Подстановка множества 33
— нечетная 42
— четная 42
Поле 81, 82
— комплексных чисел 85
— разложения многочлена 160
Полный прообраз 32
Полуоси гиперболы 267
— эллипса 262
Порядок группы 75
— элемента 102
Преобразование множества 32
тождественное 33
— элементарное строк матрицы 12
Примарные компоненты группы 119
Проекция 205—207
Произведение вектора на число 202
— декартово множеств 28
— векторов векторное 226
двойное 229
скалярное 223
смешанное 230
— матриц 20, 24
— матрицы на число 20
— многочленов 139
— отображений 33
259
Произведение прямое групп 115
Пучок плоскостей 249
— прямых 239
Равенство векторов 199
— матриц 12
— многочленов 139
— отображений 31
Радиус-вектор .213
Разбиение множества 30
Разложение определителя по элементам
столбца (строки) 54
Разность 75
— векторов 202
— множеств 28
Расстояние от точки до плоскости 252
до прямой 240
Расширение поля 83
Рациональная дробь 162
правильная 164
простейшая 165
Репер аффинный 212, 215
Решение системы линейных уравне-
уравнений 15
Свободные неизвестные 17
Свойство мультипликативности 128
Связка плоскостей 249
Симметрия плоскости относительно пря-
прямой 35
Система векторов линейно зависимая
207
линейно независимая 207
— координат левая 216
правая 216
— линейных уравнений 15
несовместная 15
совместная 15
ступенчатая 16
Сложение векторов 200
— матриц 19
Сравнение 126
Сравнимость по модулю 126
Степень многочлена 139
полная 169
Сумма векторов 200
— матриц 19
— многочленов 139
Суперпозиция функций 34
Схема Горнера 157
Теорема Крамера 64
— Кэли 101
— Лагранжа 105
— Лапласа 56
— Лиувилля 196
— основная арифметики 10
— о гомоморфизмах групп 113
колец 137
— о делении с остатком 5, 142
— о симметрических многочленах 175
— существования корня 180, 184
— Ферма 131
— Эйлера 131
Тождество Якоби 230
Транспозиция 39—42
Тригонометрическая форма комплекс-
комплексного числа 69
Тройка векторов левая 216
правая 216
Угол между векторами 199
Уравнение гиперболы каноническое 266
полярное 276
— линейное 234, 245
— параболы каноническое 272
полярное 276
— плоскости в отрезках 248
нормальное 251
общее 247
— прямой векторное параметрическое
236, 254
в отрезках 236
на плоскости каноническое 236
нормальное 241
общее 235
— фигуры 221
— эллипса каноническое 261
полярное 276
Уравнения прямой канонические 254
параметрические 236, 254
— эллипса параметрические 263
Фактор-группа 109
Фактор-кольцо 136
Фигура второго порядка 281
плоская 72
— цилиндрическая 295
Фокальный параметр гиперболы 268
параболы 273
эллипса 263
— радиус гиперболы 268
эллипса 263
Фокус гиперболы 264
— параболы 271
— эллипса 259
Формула Муавра 93
Функция Эйлера 128
Характеристика поля 132
Центр гиперболы 267
— эллипса 261
Цилиндр вращения 296
— гиперболический 297
— параболический 296
— эллиптический 295
Числа взаимно простые 8
Число алгебраическое 193, 194
— комплексное сопряженное 86
— простое 9
— число мнимое 86
Член определителя 47
— многочлена свободный 141
Широта 218
260
Эквивалентность матриц 13
— направленных отрезков 198
— систем линейных уравнений
Эксцентриситет гиперболы 267
— эллипса 262
Элемент матрицы 12
— множества 27
— нейтральный 69
— симметричный 71
Эллипс 259
15, 17 Эллипсоид 283
— вращения 284
— трехосный 284
Ядро гомоморфизма групп
колец 136
112
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ КО ВТОРОЙ ЧАСТИ
Автоморфизм аффинного пространст-
пространства 155
— линейного пространства 45
Алгоритм Лагранжа 89
Базис дуальный 107
— линейного пространства 11
— ортонормированный 117
— системы векторов 15
Вектор 6
— действительный 180
— мнимый 180
— нулевой 7
— противоположный 7
Векторы ортогональные 115
Выражение аффинного преобразова-
преобразования в координатах 157
Закон инерции действительных квадратич-
квадратичных форм 91
Знак подстановки 253
Изоморфизм пространств аффинных
154
— — евклидовых 120, 121
— — линейных 41, 42
— — унитарных 136
Инвариант 246
— метрический 212
Инвариантные множители канонической мат-
матрицы 55, 56
Индекс инерции отрицательный 92
— —положительный 92
— свободный 243
— суммирования 243
Инцидентность 226
Гиперплоскость 146, 217
— диаметральная 193
— координатная 198
— несобственная 217
Группа аффинная 158, 159
— подобий 179
— проективная 226, 227
Движение 169
— винтовое 176
— несобственное 172
— собственное 172
Дефект линейного оператора 44
Диаметр 184
Диаметры сопряженные 194, 195
Длина вектора 113
Жорданова нормальная форма мат-
матрицы 70
Каноническая форма матрицы 56
Канонический вид квадратичной формы
87, 88
симметрической билинейной фор-
формы 100, 101
Карта аффинная проективного про-
пространства 217, 218
Квадрика 181, 233
— центральная 192
Классификация аффинная квадрик
198—200
— — линий второго порядка 200—202
— — поверхностей второго порядка
202—205
— проективная квадрик 234—237
— — линий второго порядка 237—239
— — поверхностей второго порядка
239—242
Клетка Жордана 70
— Фробениуса 80
262
Ковектор 246
Конус мнимый 204
Координаты билинейной функции 245
— в пространстве аффинном 144, 145
— — — линейном 13, 14
— — — проективном неоднородные
220
— вектора ковариантные 255
— — контравариантные 255
_ однородные 218, 219
— гиперплоскости 248
— квадрики двухиндексные 248
— — одноиндексные 248
— линейной функции 245
— полилинейной функции 247
— прямоугольные 163, 164
— тензора 246
Коэффициенты линейной комбинации 8
— системы линейных уравнений 27
Критерий диагонализируемости мат-
матрицы 79, 80
— Кронекера — Капелли совместности
системы линейных уравнений 28
— обратимости матрицы над кольцом
многочленов 60, 61
— отрицательной определенности действи-
действительной квадратичной формы 96
— подобия матриц 68
—- положительной определенности действи-
действительной квадратичной формы 95
— равенства нулю определителя 19
— эквивалентности действительных квад-
квадратичных форм 92, 93
— — комплексных квадратичных форм
90
— — матриц 55
— — функции 109
— диагонализируемая 79
— Жордана 70
— каноническая 55, 56
— квадратичной формы 85
— линейного оператора 37
— — преобразования переменных 83,
84
— над кольцом многочленов 54, 55
— ортогональная 118
— перехода от базиса к системе векто-
векторов 21
— постоянная 65
— системы линейных уравнений 28
— расширенная 28
— трансформирующая 69
— унитарная 118
— Фробениуса 80, 81
— характеристическая 50
— элементарная 60
— эрмитова 102
— эрмитово-транспонированная 102
Матрицы подобные 47
Минор матрицы базисный 17
— — главный 51
— — угловой 94
Многочлен, аннулирующий матрицу 76
— матричный 65
— минимальный 77
— от матрицы 39, 40
— характеристический линейного операто-
оператора 51
— — матрицы 50, 51
Модель арифметическая проективного
пространства 219
Линейная комбинация векторов 8
— — — нетривиальная 8
— — — тривиальная 8
Линия второго порядка 181, 237
— — — гиперболического типа 190
— — — параболического типа 190
— — — эллиптического типа 190
Матрица аффинного преобразования
157
— билинейной формы 99
Направление 187
— асимптотическое 187
— действительное 187
— мнимое 187
Направления сопряженные 194
Неравенство Коши-Буняковского 113
— треугольника 114
Нормальная форма Смита целочислен-
целочисленной матрицы 58
Нормальный вид действительной квад-
квадратичной формы 89—91
комплексной квадратичной фор-
формы 89, 90
263
— — симметрической билинейной формы
100, 101
Оболочка аффинная 147
— проективная 221, 222
— пространства комплексная 205
Объем л-мерного параллелепипеда 167,
168
Овал действительный 237
— мнимый 237
Однородная часть аффинного отображения
153
Оператор дифференцирования 34
— линейный 33
— —, индуцированный на подпрост-
подпространстве 48
— — нулевой 34
— — ортогональный 125
— — самосопряженный 131
— —, сопряженный данному 124
— — унитарный 138
Операция альтернирования 253
— опускания индекса 255
— перестановки индексов 252
— поднятия индекса 255
— свертывания 251
— симметрирования 252
Определитель линейного оператора 51
Ортогональная проекция вектора 120
Ортогональное дополнение плоскости
165
— — подпространства 119
Остаток при делении матриц 66
Отображение аффинное 153, 154
Отрезок 162
Параллелепипед я-мерный 167, 168
Перенос параллельный 172, 175
Пересечение подпространств 23, 24
Плоскости ортогональные 165
— параллельные 153
— пересекающиеся 151
— скрещивающиеся 153
— частично параллельные 153
Плоскость 146, 217
Поверхность второго порядка 182, 239
— — — кольцевидная 239
— — — овальная действительная 239
— — — — мнимая 239
Поворот плоскости вокруг точки 173
— пространства вокруг прямой 176
Подпространство инвариантное 47, 48
— линейного пространства 22
Поле основное 6
Полярность билинейной и квадратичной форм
100
Преобразование аффинное 155
— линейное 33
— — переменных 83, 84
— — — невырожденное 84
—, обратное данному 84
— проективное 226
— элементарное системы векторов 16
— — столбцов матрицы 20
— — строк матрицы 20
Проектор пространства на подпростран-
подпространство 34
Проекция вектора на подпространство
34
Произведение линейного оператора на
число 36
— линейных операторов 37
— — преобразований переменных 84
— скалярное 111, 112
— тензора на число 249
— тензоров 250
Простое отношение трех точек 162
Пространство аффинное 142
— — действительное 143
— — комплексное 143
— евклидово 112
— — точечное 163
— линейное 5, 6
— — бесконечномерное 11
— — действительное 6
— — комплексное 6
— — конечномерное 11
— — л-мерное 12
— — — арифметическое (координатное)
6
— — нулевое 11
— — нульмерное 12
— —, сопряженное данному 107
— направляющее плоскости 146
— проективное 216
— — арифметическое 219
— унитарное 112
Процесс ортогонализации 116, 117
Прямая 146, 217
264
Разложение по базисным векторам 13
Размерность линейного пространства 12
Разность векторов 7
Ранг билинейной формы 99
— квадратичной формы 85
— линейного оператора 44
— матрицы 16
— системы векторов 15
Расстояние между двумя точками 164
— отточки до гиперплоскости 166,167
Растяжение от гиперплоскости 178
Репер в пространстве аффинном 144
— — — проективном 224
— главных направлений 206
Решение системы линейныхуравнений 27
Свободные члены 27
Середина отрезка 162, 163
Сжатие к гиперплоскости 177, 178
Символ Кронекера 247
Симметрия 174, 176
— поворотная 177
— скользящая 174, 176
Система векторов 7, 8
— — линейно зависимая 8
— — линейно независимая 8
— — ортонормированная 117
— координат прямоугольная 164
— линейных уравнений 27
— — — несовместная 27
— — — однородная 29
— — — приведенная 32, 33
— — — совместная 27
— наибольших общих делителей миноров
матрицы 59
— образующих подпространства 23
— элементарных делителей матрицы 62
След линейного оператора 51
— матрицы 51
— тензора 251
Сложное отношение четырех точек 231—233
Собственное значение линейного опе-
оператора 52
Собственный вектор линейного операто-
оператора 52
Столбец координатный вектора 14
Сумма линейных операторов 36
— подпространств 23, 24
— — прямая 25, 26
— тензоров 249
Тензор двухвалентный ковариантный
246
— кососимметрический 253
метрический ковариантный 254
контравариантный 255
— одновалентный ковариантный 245
— — контравариантный 244, 245
— симметрический 252
— типа (р, д) 246
Теорема Гамильтона — Кэли 79
— о ранге матрицы 17
Точка действительная 180
— мнимая 180
— несобственная 217
— собственная 217
Точки аффинно независимые 147
— коллинеарные 162
— проективно независимые 222
Угол между вектора ми 114
прямыми 165
Уравнение квадрики каноническое 207
— — нормальное 197
— плоскости векторное >чраметриче-
ское 148, 149
Фигура 159, 227
Фигуры аффинно эквивалентные 159
— метрически эквивалентные 170
— проективно эквивалентные 227
Флаг 171
Форма билинейная 98
— — симметрическая 100
— — — каноническая 100
— — — положительно-определенная
101
эрмитова 102, 103
— — — каноническая 104
симметрическая 103
— квадратичная 85
— — действительная 90
— — каноническая 87
— — комплексная 90
— — отрицательно-определенная 93
265
— - положительно-определенная 93
— — разложимая 96
— -- эрмитова 103
— - каноь.шеская 104
- — нормальная 104
— — отрицательно-определенная 105
— — -- положительно-определенная 105
Формулы преобразования аффинных коор-
координат 145
Фрооениусова нормальная форм;.- .ма-
.матрицы 81
Фундаментальная система решений 31
Функция билинейная 107, 108
— — симметрии 1 .«я 110
— линейная ^
— полили и* -тая 247
— эрмитова билинейная 108
- -- симметрическая 110
Характеристика пары плоскостей
аффинного пространства 152
— — — проективного пространства
223
Хорда квадрики 193
Центр фигуры 163
Цилиндр эллиптический мнимый 205
Частное при делении матриц 66
Числа 6
Эквивалентность билинейных форм 99
— квадратичных форм 86
— матриц 55
— систем векторов 10
— — линейных уравнений 28
— эрмитовых билинейных форм 103, 104
квадратичных форм 103, 104
Эллипс мнимый 201
Эллипсоид мнимый 203
Ядро линейного оператора 44
ОГЛАВЛЕНИЕ
Предисловие 3
Раздел 3
ТЕОРИЯ ЛИНЕЙНЫХ ПРОСТРАНСТВ
17. Линейные пространства 5
17.1. Определение линейного пространства 5
17.2. Линейная зависимость 7
17.3. Базис. Размерность 11
17.4. Координаты вектора 13
17.5. Ранг системы векторов 15
17.6. Ранг матрицы 16
17.7. Связь между базисами 20
17.8. Преобразование координат 21
17.9 Подпространство 22
17.10. Сумма и пересечение подпространств 23
17.11. Прямая сумма подпространств 25
18. Системы линейных уравнений 27
18.1. Критерий совместности системы линейных уравнений 27
18.2. Однородные системы линейных уравнений 29
18.3. Связь между решениями произвольной и соответствующей однородной
систем линейных уравнений 32
19. Линейные операторы 33
19.1. Определение и простейшие свойства линейных операторов 33
19.2. Действия с линейными операторами 36
19.3. Матрица линейного оператора 37
19.4. Изоморфизмы линейных пространств 40
19.5. Ранг и дефект линейного оператора 44
19.6. Автоморфизмы линейного пространства 45
19.7. Изменение матрицы линейного оператора при замене базиса 46
19.8. Инвариантное подпространство 47
19.9. Линейный оператор с клеточно-диагональной матрицей 48
19.10. Характеристический многочлен 50
19.11. Собственные векторы линейного оператора 52
20. Матрицы над кольцом многочленов 54
20.1. Каноническая форма матрицы над кольцом многочленов 55
20.2. Однозначность канонической формы 58
20.3. Матрицы, обратимые над кольцом многочленов 60
20.4. Элементарные делители матрицы 62
20.5. Матричные многочлены 65
20.6. Критерий подобия матриц над полем 67
267
21. Нормальные формы матрицы над полем 70
21.1. Определение и построение жордановой нормальной формы 70
21.2. Еще один способ построения жордановой нормальной формы 73
21.3. Минимальный многочлен 76
21.4. Критерий диагонализируемости матрицы над полем 79
21.5. Фробениусова нормальная форма 80
22. Билинейные и квадратичные формы 83
22.1. Линейные преобразования переменных 83
22.2. Квадратичные формы 85
22.3. Приведение квадратичной формы к каноническому виду 87
22.4. Нормальный вид квадратичной формы над полями действительных и
комплексных чисел 89
22.5. Знакоопределенные действительные квадратичные формы 93
22.6. Условия разложимости действительной и комплексной квадратичных
форм 96
22.7. Билинейные формы 98
22.8. Эрмитово-сопряженная матрица 102
22.9. Эрмитовы билинейные и квадратичные формы 102
23. Евклидовы и унитарные пространства 105
23.1. Линейные функции 106
23.2. Билинейные функции 107
23.3. Симметрические билинейные функции 110
23.4. Скалярное произведение 111
23.5. Длина вектора 113
23.6. Ортогональные векторы 115
23.7. Связь между ортонормированными базисами 118
23.8. Ортогональное дополнение подпространства 119
24. Линейные операторы евклидовых и унитарных пространств 120
24.1. Изоморфизмы евклидовых пространств 120
24.2. Сопряженный оператор 122
24.3. Ортогональные операторы 125
24.4. Самосопряженные операторы 131
24.5. Разложение линейного оператора в произведение ортогонального и само-
самосопряженного операторов 132
24.6. Приведение действительной квадратичной формы к каноническому виду
с помощью ортогонального преобразования переменных 136
24.7. Линейные операторы унитарных пространств 136
Раздел 4
ГЕОМЕТРИЯ я-МЕРНОГО ПРОСТРАНСТВА
25. Аффинное пространство 142
25.1. Определение аффинного пространства 142
25.2. Координаты 144
25.3. Плоскости 146
25.4. Плоскости и системы линейных уравнений 149
25.5. Взаимное расположение двух плоскостей 151
25.6. Аффинное отображение. Изоморфизм 153
25.7. Аффинные преобразования 155
25.8. Геометрия аффинной группы 159
26. Евклидово точечное пространство 163
26.1. Определение пространства Е" 163
26.2. Плоскости 165
268
26.3. Объем параллелепипеда 167
26.4. Движения 169
26.5. Движения евклидовой точечной плоскости 171
26.6. Движения трехмерного евклидова точечного пространства 174
26.7. Аффинные преобразования пространства Е" 177
27. Квадрики 180
27.1. Пространство An(i) 180
27.2. Определение квадрики 181
27.3. Пересечение квадрики с прямой 186
27.4. Асимптотические направления 187
27.5. Линии эллиптического, гиперболического и параболического типов 189
27.6. Центр квадрики 190
27.7. Диаметральные плоскости 192
27.8. Диаметры линий второго порядка 194
27.9. Приведение уравнения квадрики к нормальному виду с помощью пре-
преобразования координат 196
27.10. Аффинная классификация квадрик 198
27.11. Аффинная классификация линий второго порядка на плоскости A2(i) 200
27.12. Аффинная классификация поверхностей второго порядка в пространстве
Л3 (/) 202
27.13. Приведение уравнения квадрики в пространстве Е"(/) к каноническому
виду 205
27.14. Исследование поверхности второго порядка в пространстве Е3(/) по
общему уравнению 208
27.15. Метрические инварианты многочлена второй степени 211
27.16. Исследование линий второго порядка с помощью инвариантов 214
28. Проективное пространство 216
28.1. Определение проективного пространства 216
28.2. Координаты 218
28.3. Плоскости 221
28.4. Проективная группа 226
28.5. Сложное отношение четырех точек 231
28.6. Квадрики в проективном пространстве 233
28.7. Линии второго порядка на плоскости P2(i) 237
28.8. Поверхности второго порядка в пространстве Я3(/) 239
29. Тензоры 242
29.1. Общее понятие о тензорах 243
29.2. Примеры тензоров 246
29.3. Операции над тензорами 249
29.4. Симметрические и кососимметрические тензоры 251
29.5. Тензоры в евклидовом пространстве 253
Литература 257
Предметный указатель к 1-й части 258
Предметный указатель ко 2-й части 262
Михаил Васильевич Милованов,
Михаил Мефодьевич Толкачев,
Регина Иосифовна Тышкевич,
Анатолий Семенович Феденко
АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
Часть 2
Зав редакцией Е. В. Сукач
Редактор М. С. Молчанова
Мл. редактор В. М Кушилевич
Ю. С. Сергаче
Худож. редактор
Техн. редактор М. Н. Кислякова
Корректоры Т. К. Скрипкина, Т. К. Хваль
ИБ № 2320
Сдано в набор 10.12.86. Подписано в печать 24.09.87.
Формат 60X90'/16. Бумага офсетная. Гарнитура лите-
литературная. Офсетная печать Усл. печ. л. 17. Усл. кр.-
отт. 17. Уч.-изд. л. 17,4. Тираж 5600 экз. Зак 6466.
Цена 1 р.
Издательство «Вышэйшая школа» Государственного ко-
комитета БССР по делам издательств, полиграфии и книж-
книжной торговли. 2200048, Минск, проспект Машерова, 11.
Набрано в Минском ордена Трудового Красного Знамени
полиграфкомбинате МППО им. Я. Коласа. 220005, Минск,
ул. Красная, 23.
Отпечатано с диапозитивов в типографии «Победа».
222310, Молодечно, ул. В. Тавлая, 11.
Алгебра и аналитическая геометрия.: В 2 ч. Ч. 2: Для вузов.
А45 Для студентов мат. спец. ун-тов и пед. ин-тов/М. В. Милованов,
М. М. Толкачев, Р. И. Тышкевич, А. С. Феденко.— Мн.: Выш.
шк., 1987.—269 с: ил.
Рассматриваются линейные и евклидовы пространства, линейные операторы, билинейные и
квадратичные формы Описывается приложение аппарата линейной алгебры к геометрии «-мерного
аффинного точечного евклидова и проективного пространств Дается понятие о тензорах и опера-
операциях над ними
1702010000—125
А М304@3)-87 18~87 ББ|< 22.151.5я73