Предисловие
Основные обозначения
Введение
1. Линейные пространства
1.2. Свойства линейного пространства
1.3. Линейная зависимость
1.4. Свойства систем векторов
1.5. Базис линейного пространства
1.6. Линейные операции в координатной форме
1.7. Размерность линейного пространства
1.8. Преобразование координат при замене базиса
Д.1.1. Линейное пространство над полем Р
Вопросы и задачи
2. Линейные подпространства
2.2. Пересечение и сумма линейных подпространств
2.3. Прямая сумма линейных подпространств
2.4. Размерность линейного подпространства
2.5. Ранг системы векторов
2.6. Линейные оболочки и системы уравнений
2.7. Прямое дополнение
Вопросы и задачи
3. Евклидовы пространства
3.2. Неравенство Коши-Буняковского
3.3. Нормированные пространства
3.4. Угол между векторами
3.5. Ортогональные системы векторов
3.6. Ортогональные и ортонормированные базисы
3.7. Вычисления в ортонормированном базисе
3.8. Процесс ортогонализации Грама - Шмидта
3.9. Ортогональное дополнение
Д.3.1. Нормы матриц
Д.3.2. Метод наименьших квадратов
Д.3.3. Псевдорешения и псевдообратная матрица
Вопросы и задачи
4. Линейные операторы
4.2. Изоморфизм линейных пространств
4.3. Матрица линейного оператора
4.4. Преобразование матрицы линейного оператора
4.5. Произведение линейных операторов
4.6. Линейные пространства линейных операторов
Вопросы и задачи
5. Собственные векторы и собственные значения
5.2. Характеристическое уравнение линейного оператора
5.3. Собственные векторы линейного оператора
5.4. Вычисление собственных значений и собственных векторов
5.5. Свойства собственных векторов
Д.5.1. Жорданова нормальная форма
Вопросы и задачи
6. Самосопряженные операторы
6.2. Самосопряженные операторы и их матрицы
6.3. Собственные векторы самосопряженного оператора
Д.6.1. Инвариантные подпространства самосопряженного оператора
Вопросы и задачи
7. Ортогональные матрицы и операторы
7.2. Ортогональные операторы
7.3. Матрицы перехода в евклидовом пространстве
7.4. Приведение симметрической матрицы к диагональному виду
Вопросы и задачи
8. Квадратичные формы
8.2. Преобразование квадратичных форм
8.3. Квадратичные формы канонического вида
8.4. Ортогональные преобразования квадратичных форм
8.5. Закон инерции
8.6. Критерий Сильвестра
Д.8.1. Билинейные формы
Вопросы и задачи
9. Кривые и поверхности второго порядка
9.2. Изменение системы координат
9.3. Упрощение уравнения поверхности второго порядка
9.4. Примеры
9.5. Классификация кривых второго порядка
9.6. Классификация поверхностей второго порядка в пространстве
Вопросы и задачи
10. Элементы тензорной алгебры
10.2. Полилинейные формы
10.3. Тензоры
10.4. Операции с тензорами
Вопросы и задачи
11. Итерационные методы
11.2. QR-разложение. Сингулярное разложение
11.3. Описание итерационных методов
11.4. Сходимость итерационных методов
11.5. Скорость сходимости стационарных итерационных методов
Вопросы и задачи
Список рекомендуемой литературы
Предметный указатель
Text
                    Комплекс учебников из 20 выпусков
Под редакцией В. С. Зарубина и А. П. Крищенко
I. Введение в анализ
П. Дифференциальное исчисление функций
одного переменного
III. Аналитическая геометрия
IV. Линейная алгебра
V. Дифференциальное исчисление функций
многих переменных
VI. Интегральное исчисление функций
одного переменного
VII. Кратные и криволинейные интегралы.
Элементы теории поля
VIII. Дифференциальные уравнения
IX. Ряды
X. Теория функций комплексного переменного
XI. Интегральные преобразования
и операционное исчисление
XII. Дифференциальные уравнения
математической физики
XIII. Приближенные методы математической физики
XIV. Методы оптимизации
XV. Вариационное исчисление и оптимальное управление
XVI. Теория вероятностей
XVII. Математическая статистика
XVIII. Случайные процессы
XIX. Дискретная математика
XX. Исследование операций


А.Н. Канатников, А.П. Крищенко ЛИНЕЙНАЯ АЛГЕБРА Под редакцией д-ра техн. наук, профессора B.C. Зарубина и д-ра физ.-мат. наук, профессора А.П. Крищенко Издание третье, стереотипное Допущено Министерством образования Российской Федерации в качестве учебника для студентов высших технических учебных заведений Москва Издательство МГТУ им. Н.Э. Баумана 2002
УДК 517.1@75.8) ББК 22.151.5 К19 Рецензенты: проф. В.И. Елкин, проф. Е.В. Шикин К19 Канатников А.Н., Крищенко А.П. Линейная алгебра: Учеб. для вузов. 3-е изд., стереотип. / Под ред. B.C. Зарубина, А.П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 336 с. (Сер. Математика в техническом университете; Вып. IV). ISBN 5-7038-1754-4 (Вып. IV) ISBN 5-7038-1270-4 Книга является четвертым выпуском серии „Математика в техниче- техническом университете" и содержит изложение базового курса по линейной алгебре. Дополнительно включены основные понятия тензорной алгебры и итерационные методы численного решения систем линейных алгебраиче- алгебраических уравнений. Материал изложен в объеме, необходимом для подготовки студента технического университета. Содержание учебника соответствует курсу лекций, который авторы читают в МГТУ им. Н.Э. Баумана. Для студентов технических университетов. Может быть полезен преподавателям и аспирантам. Ил. 22. Библиогр. 31 назв. Выпуск книги финансировал Московский государственный технический университет им. Н.Э. Баумана УДК 517.1@75.8) ББК 22.151.5 © А.Н. Канатников, А.П. Крищенко, 2001 © Московский государственный технический университет ISBN 5-7038-1754-4 (Вып. IV) им' НЭ' Баумана> 2001 ISBN 5-7038-1270-4 © Издательство МГТУ им. Н.Э. Баумана, 2001
ПРЕДИСЛОВИЕ Четвертый выпуск серии я Математика в техническом уни- университете" содержит материал по курсу линейной алгебры, обычно читаемой во втором или третьем семестре. Книга, как и другие выпуски серии, имеет развитый аппа- аппарат для поиска информации, позволяющий использовать книгу как справочник. Любое ключевое понятие в месте определе- определения выделено полужирным курсивом. Первое упоминание ключевого понятия в параграфе дано светлым курсивом. Для удобства цитирования определения, теоремы, замечания, фор- формулы и т.п. снабжены двойной нумерацией. Например, теорема 2.1 — это первая теорема в главе 2, B.1) — первая формула в главе 2, рис. 1.5 — пятый рисунок в главе 1. В тексте книги используются ссылки, облегчающие поиск нужных определений и других сведений. Такие ссылки ука- указывают номер главы или параграфа и могут относиться как к данной книге, так и к другим выпускам серии. Например, (см. 1.2) отсылает читателя ко второму параграфу первой гла- главы этой книгц, тогда как [1-7.5] означает ссылку на пятый параграф седьмой главы в первом выпуске*. Все ключевые понятия приведены в предметном указателе, помещенном в конце книги. Они следуют в алфавитном порядке по существительному в именительном падеже. Ссылки пред- предметного указателя разделяются на основные (даны шрифтом прямого начертания) и неосновные (даны курсивным шриф- шрифтом). Основная ссылка указывает, где введено понятие, нео- * Детальные ссылки с указанием параграфа даются только на первый выпуск серии и относятся к изданию: Морозова В.Д. Введение в анализ: Учеб. для вузов. М.: Изд-во МГТУ им. Н.Э.Баумана, 1996. В остальных случаях (выпуски [II] и [III]) приводится лишь номер выпуска, а нужное место в книге можно найти при помощи предметного указателя.
ПРЕДИСЛОВИЕ сновная ссылка указывает место в книге или другом выпуске серии, где имеются дополнительные сведения о ключевом по- понятии. Ссылки на термины, введенные в других выпусках серии, содержат номера этих выпусков. Например, ссылка 1-215 означает страницу 215 первого выпуска, а ссылка II — второй выпуск (соответствующее место в этом выпуске можно найти по его предметному указателю). Большинство используемых обозначений помещены в переч- перечне основных обозначений. Для каждого обозначения наряду с краткой расшифровкой указаны разделы этого или других вы- выпусков серии, в которых оно было введено. В книге приведены написание и русское произношение букв латинского и греческо- греческого алфавитов. Перед чтением этой книги предлагаем в целях самоконтроля выполнить некоторый набор заданий. В тексте этих заданий прямым полужирным шрифтом выделены ключевые тер- термины, значение которых должно быть известно читателю, а в конце каждого задания указана ссылка на номер выпуска се- серии, в котором можно найти соответствующие разъяснения. Задания для самопроверки 1. Что понимают под критерием некоторого утвержде- утверждения? [I] 2. Из каких этапов состоит доказательство по методу математической индукции? [I] 3. Сформулируйте определение взаимно однозначного отображения двух множеств. Чему равна композиция прямого и обратного отображений двух множеств? [I] 4. Является ли множество R действительных чисел (множество С комплексных чисел) упорядоченным и образуют ли натуральные числа его конечное или беско- бесконечное подмножество? Что такое абсолютная величина (модуль) числа? [I]
3 5. Имеют ли операции сложения и умножения действитель- действительных чисел свойства коммутативности, ассоциативности и в чем состоит их свойство дистрибутивности? [I] 6. Для комплексного числа z = 2 — Ъг найти действи- действительную и мнимую части, модуль и его произведение с комплексно сопряженным числом. [I] 7. Какие свойства имеют функции: а) непрерывные на отрезке; б) непрерывно дифференцируемые в интерва- интервале? Привести пример монотонных в интервале функций, сумма которых не является монотонной в этом интервале. [I], [Щ 8. Как можно выяснить, имеет ли многочлен одного переменного кратные корни? [I] 9. Всегда ли производная многочлена одного перемен- переменного степени п является многочленом степени п — 1? [I], [II] 10. Как в множествах векторов V*i на плоскости и V3 в пространстве вводятся операции их сложения и умножения на действительные числа? Что такое длина (модуль) вектора и угол между векторами? [III] 11. Какие свойства имеет скалярное умножение векто- векторов из Уз? Чему равно скалярное произведение двух векторов из V2, если: а) они образуют ортонормированный базис в V<i\ б) они коллинеарны? [III] 12. Когда тройка векторов из V3, состоящая из двух век- векторов и их векторного произведения а) является компла- компланарной; б) образует правый ортонормированный базис в Vs? [III] 13. Доказать, что произведение двух кососимметриче- ских матриц является симметрической матрицей тогда и только тогда, когда перемножаемые матрицы перестановоч- перестановочны. [III] 14. Может ли ранг квадратной невырожденной ма- матрицы быть меньше количества ее базисных строк (столб- (столбцов)? [III] 15. Что утверждает теорема о базисном миноре? [III]
8 ПРЕДИСЛОВИЕ 16. Привести пример верхней (нижней) треугольной матрицы, у которой максимальное число линейно незави- независимых строк не равно максимальному числу ее линейно за- зависимых столбцов. [III] 17. Приведите пример вырожденной матрицы третье- третьего порядка, которая не является произведением матрицы- столбца на матрицу-строку. [III] 18. Как перейти от матричной записи системы линей- линейных алгебраических уравнений (СЛАУ) к ее векторной и координатной записям и наоборот? Как неизвестные СЛАУ разбивают на зависимые (базисные) и независимые (свободные)? [III] 19. Какие свойства имеют решения СЛАУ и решения соответствующей ей однородной СЛАУ? Что утвержда- утверждает теорема Кронекера — Капелли о совместности и несовместности СЛАУ и связана ли ее формулировка с ма- матрицей СЛАУ? [III] 20. Что можно утверждать об определителе матрицы а) обратной к транспонированной; б) обратной к проти- противоположной? [III] 21. Какой тип имеют нулевая и единичная матри- матрицы, если для них определены операции сложения и умноже- умножения? [III] 22. Доказать, что определитель диагональной матрицы равен произведению ее диагональных элементов. [III] 23. Какие размеры имеют блоки блочно-диагональной матрицы? [III] 24. Перечислите виды кривых второго порядка. Укажи- Укажите их канонические уравнения. [III] 25. Перечислите основные виды поверхностей второго порядка и укажите их канонические уравнения. [III] 26. Что такое абсолютная и относительная погрешно- погрешности? [II]
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ 4 и > — начало и окончание доказательства # — окончание примера, замечания a Е Л, А Э а — элемент а принадлежит множеству А (множе- (множество А содержит элемент а) 1-1.1 N — множество натуральных чисел 1-1.3 Ш — множество действительных чисел 1-1.3 С — множество комплексных чисел Д.1.1, 1-4.3 \х\ — абсолютная величина числа х 1-1.3 W1 — линейное арифметическое пространство 1.1 а, а — вектор (элемент линейного пространства) и столбец его координат 1.6 \а\ — длина вектора а 3.3, III О — нулевой вектор 1.1, III а + Ь — сумма векторов а и Ь 1.1, III Ха — произведение вектора а на действительное число А 1.1, III а, 6 — угол между векторами а и 6 3.4, III dim? — размерность линейного пространства С 1.7 span{a} — линейная оболочка системы векторов а 2.1 %+% (%Ф%) — сумма (прямая сумма) линейных подпро- подпространств Hi и %2 2.3 HL — ортогональное дополнение к линейному подпро- подпространству Н 3.9 V\ (V2 и V3) — пространство коллинеарных векторов (компла- (компланарных векторов и всех свободных векторов) III (а, Ь) — скалярное произведение векторов а и Ь 3.1, III ахЬ — векторное произведение векторов а и Ь III
10 ОСНОВНЫЕ ОБОЗНАЧЕНИЯ abc — смешанное произведение векторов а, & и с III а = {х\у) (а = {x\y\z}) — задание вектора а из V<i (V3) с по- помощью его координат в фиксированном базисе в V<i г (t,j и i,j,fc) — ортонормированный базис в V\ (правый ор- тонормированный базис в V<i и в V3) III Оху, Oij (Oxyz, Oijk) — правая прямоугольная система ко- координат на плоскости (в пространстве) III M(x;y\z) (М(х\у)) — точкаМ пространства (плоскости) с ко- координатами х (абсцисса), у (ордината) и z (аппли- (аппликата) III Кп[х] — множество многочленов переменного х степени, не превышающей п 1.1 Ат — матрица, транспонированная к матрице А III diag(ai, ..., ап) — диагональная матрица с диагональными элементами а\, ..., ап III det А — определитель матрицы А III А — матрица, обратная к матрице А III RgA — ранг матрицы А III А+ — псевдообратная матрица Д.3.3 0 — нулевая матрица III Л, Л — линейный оператор и его матрица 4.3 0 — нулевой оператор 4.1 ker A, imA — ядро и образ линейного оператора А 4.1 А ® В — произведение тензоров А и В 10.4 <р(х,-) — функция многих переменных, рассматриваемая при фиксированном значении аргумента х (в общем случае векторного) как функция второго аргумента 10.2 п Ylak — сумма п слагаемых ai, ..., о*, ..., an I-2.6 к = 1, п — число А: принимает последовательно все значения из множества N от 1 до п включительно 1-2.6
11 Буквы латинского алфавита Начертание А а В b С с D d Е е F f G g Н h I i Jj К к L 1 M m A a В b С с D d E e F f G g H h I i J 3 К к L I M m Произно- Произношение a бэ цэ ДЭ e эф же аш и йот ка эль эм Начертание N п О о Рр Qq R г S s Т t U u V v W w X х Yy Z z N п О о Р р Qq R г S s Т t U и V v W w X х Y у Z z Произно- Произношение эн о пэ «У эр эс тэ У вэ дубль-вэ икс игрек зэт Буквы греческого алфавита Начер- Начертание А а В /3 Г 7 Д 5 Е е z С Н г, /Л _0 /) V-/ С/ V Произно- Произношение альфа бета гамма дельта эпсилон дзета эта тэта Начер- Начертание I ь К х Л Л М 11 N v S ? О о П 7Г Произно- Произношение йота каппа ламбда ми ни кси омикрон пи Начер- Начертание Р Р Е о Т г Т v Ф (р х х ф ф Произно- Произношение ро сигма тау ипсилон фи хи пси омега Представлен наиболее употребительный (но не единствен- единственный) вариант произношения (в частности, вместо „йот" иногда говорят „жи").
ВВЕДЕНИЕ Два раздела из курса аналитической геометрии [III] имеют много общего. На множестве векторов в пространстве (V3) или на плоскости (V2) определены линейные операции сложения век- векторов и умножения вектора на число. Одноименные операции введены и во множестве Mmn(R) матриц одного типа тхп. В обоих случаях операции обладали схожими свойствами. Анало- Аналогия между векторами и матрицами была подчеркнута стилем изложения: линейные свойства матриц описаны в том же ключе, что и линейные свойства векторов. Естественно задаться целью построить такую математиче- математическую теорию, которая охватывала бы и векторную алгебру, и матричную как частные случаи. Такая теория была созда- создана и получила название линейной алгебры. Она базируется на аксиоматическом методе. Согласно этому методу вводятся первичные, неопределяемые понятия, которые должны подчи- подчиняться некоторому набору аксиом. Аксиомы — это первичные утверждения, которые не доказываются, а считаются верными изначально. Все остальные утверждения теории, базирующей- базирующейся на аксиоматическом методе, выводятся из заданных аксиом. Примером использования аксиоматического метода являет- является геометрия, известная из школьного курса математики. Ее первичными понятиями являются точки, прямые и плоскости. В качестве аксиом используются, например, утверждения: че- через две несовпадающие точки проходит прямая, и притом толь- только одна; через три точки, не лежащие на одной прямой, можно провести плоскость, и притом только одну; если две точки пря- прямой лежат в данной плоскости, то и вся прямая принадлежит этой плоскости. Основным объектом линейной алгебры является линейное пространство — понятие, обобщающее множество Vs векто-
13 ров в пространстве и множество Мтп(Ш) матриц одного типа с линейными операциями, заданными на этих множествах. Эле- Элементы линейного пространства называют векторами, обобщая термин из векторной алгебры. Само линейное пространство ча- часто называют векторным. Линейные пространства — один из самых распространенных математических объектов, и при- применение линейной алгебры далеко не исчерпывается векторной и матричной алгебрами. В линейном пространстве действуют две операции: сло- сложение векторов и умножение вектора на число, которые под- подчиняются аксиомам линейного пространства. Однако могут вводиться и другие операции и соответственно дополнительные аксиомы, например операция, аналогичная скалярному умно- умножению векторов. Эти операции задают дополнительные от- отношения в линейном пространстве, которые тоже изучаются в линейной алгебре и часто используются в различных ее прило- приложениях. Аксиоматический метод, положенный в основу линейной ал- алгебры, приводит к тому, что теория становится менее нагляд- наглядной и более сложной для восприятия. Доказательства теорем проводятся более строго, но и более формально. И хотя фор- формулировки теорем чаще всего мотивируются аналогиями из конкретных приложений линейной алгебры (в частности, все теми же векторной и матричной алгебрами), доказательства не всегда можно представить образно, как в планиметрии или стереометрии. Трудности линейной алгебры в освоении окупаются тем, что удается уловить связи между весьма отдаленными раздела- разделами математики, между которыми на первый взгляд не может быть ничего общего. В учебник включены как традиционные вопросы, посвящен- посвященные понятию линейного пространства, линейного подпростран- подпространства, линейного оператора, так и вопросы для углубленного изучения. Последние оформлены в виде дополнений. Кроме
14 ВВЕДЕНИЕ того, в стандартный курс не входит глава 10, посвященная эле- элементам тензорной алгебры. Для изучения материала учебника требуется знание мате- математики в рамках первого семестра технического университета. Соответствующую информацию можно почерпнуть в преды- предыдущих выпусках [II], [III] серии „Математика в техническом университете ".
1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА 1.1. Определение линейного пространства Центральное место в линейной алгебре занимает следующее понятие. Определение 1.1. Множество С элементов ж, у, 2, ... любой природы называют линейным пространством, если выполнены три условия: 1) задано сложение элементов ?, т.е. закон, по которому любым элементам ж, у Е С ставится в соответствие элемент z Е ?, называемый суммой элементов ж и у и обозначаемый 2) задано умножение элемента на число, т.е. закон, по которому любому элементу х G С и любому числу A Е Ш ставится в соответствие элемент z Е ?, называемый произведением элемента х на (действительное) число и обозначаемый z = = Аж; 3) указанные законы (линейные операции) подчиняются следующим аксиомам линейного пространства: а) сложение коммутативно: х + у = у + ж; б) сложение ассоциативно: (ж + у) + z = ж + (у + г); в) существует такой элемент 0 6 С, что ж + 0 = х для любого же?; г) для каждого элемента ж множества ? существует такой элемент (—ж) 6 ?, что ж + (—ж) = 0; д) произведение любого элемента ж из ? на единицу равно этому элементу: 1-х = ж; е) умножение на число ассоциативно: А(//ж) = (А/х)ж; ж) умножение на число и сложение связаны законом дистри- дистрибутивности по числам: (А + /х)ж = Аж + //ж;
16 I. ЛИНЕЙНЫЕ ПРОСТРАНСТВА з) умножение на число и сложение связаны законом дистри- дистрибутивности по элементам: А(ж + у) = Хх + Ху. Элементы линейного пространства принято называть век- векторами. Элемент 0, существование которого постулируется аксиомой в), называют нулевым вектором, а элемент (—ж) — вектором, противоположным к вектору х. В понятии „линейное пространство" важно не только рас- рассматриваемое множество ?, но и заданные операции сложения элементов и умножения на число. Одно и то же множество С при одних операциях может быть линейным пространством, а при других — нет. Фактически линейным пространством является совокупность (?,+,•) из множества элементов и двух операций, которая удовлетворяет условиям определения 1.1. В этой тройке объектов базовым все-таки является множество ?, так как операции вводятся именно на этом множестве. По- Поэтому понятие линейного пространства обычно ассоциируют с множеством элементов С и говорят, что С — линейное про- пространство. При этом, как правило, очевидно, что понимается под операциями линейного пространства. Если же требуется явно указать используемые операции, то говорят: множество С — линейное пространство относительно таких-то операций. Согласно определению 1.1 линейного пространства С сумма определена для любых элементов из ? и всегда является эле- элементом множества С. Подчеркивая последнее, говорят, что множество С замкнуто относительно операции сложе- сложения. Аналогично, согласно тому же определению, множество С замкнуто относительно операции умножения его элементов на действительные числа. Пример 1.1. Приведем примеры линейных пространств: - множество Vz (V2) всех свободных векторов в простран- пространстве (на плоскости) с линейными операциями над векторами — линейное пространство, так как верны все аксиомы линейного пространства [III];
1.1. Определение линейного пространства 17 - множество всех геометрических векторов в простран- пространстве с началом в данной точке и параллельных данной плоскости (рис. 1.1) с линейными операци- ями над векторами является ли- линейным пространством [III]; Рис* 1#1 - множество Мтп(Ш) матриц типа гахп, элементами кото- которых являются действительные числа, с линейными операциями над матрицами также удовлетворяет всем аксиомам линейного пространства; - множество матриц-строк (матриц-столбцов) длины п явля- является линейным пространством относительно матричных опе- операций сложения и умножения на число (это частный случай предыдущего примера); - множество -КпЭД многочленов переменного х степени, не превышающей п, которые как функции можно складывать и умножать на действительные числа; - множество всех решений данной однородной системы ли- линейных алгебраических уравнений (СЛАУ). Решения можно рассматривать как матрицы-столбцы, складывать и умножать на числа по законам матричных операций [III]. Столбец, по- получаемый в результате сложения решений или умножения ре- решения на число, снова будет решением системы. Поэтому определены операции, о которых говорится в определении 1.1, подчиняющиеся аксиомам линейного пространства; - множество функций, непрерывных на отрезке, с обычны- обычными операциями сложения функций и умножения функции на число. При сложении непрерывных функций получаем непре- непрерывную функцию, при умножении непрерывной функции на число также получаем непрерывную функцию. Поэтому сложе- сложение функций и умножение функции на число, не в^|^дяЩие-^аг пределы множества непрерывных на отрезке функций, можно рассматривать как операции линейного пространства,- Легко убедиться, что для этих операции верны все а^с^омы лйш§но го пространства.
18 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Пример 1.2. Рассмотрим множество R+ всех действитель- действительных положительных чисел. Если суммой элементов ж,у Е R+ считать обычную сумму действительных чисел ж + у, а произ- произведением действительного числа А на элемент х Е R+ — обыч- обычную операцию произведения действительных чисел Аж, то мы не получим линейного пространства, так как при А = 0 обычная операция умножения действительных чисел дает А • х = О, т.е. умножение на нуль дает число, не принадлежащее множеству R+, а значит, множество R+ не замкнуто относительно этой операции умножения на действительные числа, т.е. нарушает- нарушается условие 2) определения 1.1. Введем операции на множестве R+ по-другому. „Суммой" х ф у элементов ж и у назовем произведение этих элементов как действительных чисел: х ф у = ху. „Произведением" А © ж эле- элемента х Е R+ на число А Е R назовем возведение х как числа в действительную степень А: А©ж = жА. Видоизмененное обозна- обозначение введенных операций ф и 0 подчеркивает их необычную трактовку. „Сумма" ж фу и „произведение" А ©ж, как нетрудно уви- увидеть, определены для любых пар ж,у G R+ и А Е R, ж Е R+ соответственно. Кроме того, множество R+ замкнуто отно- относительно этих операций. Убедимся, что для этих операций верны аксиомы линейного пространства. Для любых элементов ж,у,2 Е R+ и любых действительных чисел A, /i, учитывая свой- свойства умножения и возведения в степень действительных чисел, получаем: а) ж ф у = жу = уж = у Ф ж; б) (ж фу) ф z = (xy)z = ж(уг) = ж ф (у Ф z)\ в) в качестве нулевого элемента 0 следует взять число 1, так как жфО = ж-1 = ж для любого элемента ж; г) противоположным произвольному элементу ж Е R+ будет элемент (©ж) = 1/ж, так как ж ф (©ж) = жA/ж) = 1 = 0; д) „умножение" элемента на число 1 его не меняет: 1 © ж = = ж1 = ж;
1.1. Определение линейного пространства 19 е) А 0 {р 0 х) = (х»)х = ж"л = жл" = (A/i) © ж; ж) (А + /i) © х = xA+/i = xxx» = (А © ж) 0 (/i © ж); з) А0(жеу) = (жу)л = жлул = (А©жH(А©у). Итак, заключаем, что все восемь аксиом линейного про- пространства выполнены. Значит, множество R+ с введенными операциями © и 0 является линейным пространством. Пример 1.3. На множестве Шп = {х: a? = (rri, ..., яп)}, элементами которого являются упорядоченные совокупности п произвольных действительных чисел, введем операции х + у = (хг+уъ ..., xn + yn), Xx = {\xu ..., Ажп), ХеШ. Тогда получим линейное пространство, так как все аксиомы линейного пространства для данных операций выполняются. Это линейное пространство, по сути, есть линейное простран- пространство матриц-строк. Отличие лишь формальное, так как первое определено как множество упорядоченных наборов чисел, а второе как множество матриц. Но элементы матрицы всегда записывают в определенном порядке. Линейное пространство W1 называют линейным арифметическим пространст- пространством. Замечание 1.1. Операция умножения вектора на число в определении 1.1 задана только для действительных чисел. Но точно так же можно ввести линейное пространство с умно- умножением элементов множества С на произвольные комплекс- комплексные числа. Два способа определения линейного пространства различают, используя термины „линейное пространство над полем* действительных чисел" (более коротко: действитель- действительное линейное пространство) и „линейное пространство над полем комплексных чисел" (комплексное линейное про- пространство). Теории в этих двух случаях очень близки, но *По поводу термина „поле" см. Д. 1.1
20 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА различия все-таки есть. Важный пример комплексного линени ного пространства — комплексное арифметическое простран- пространство элементами которого являются упорядоченные наборы из п комплексных чисел. Операции в этом пространстве задаются по тем же правилам, что и в случае действительного арифме- арифметического пространства. 1.2. Свойства линейного пространства Непосредственно из аксиом линейного пространства можно получить ряд простейших свойств. Свойство 1.1. Любое линейное пространство имеет только один нулевой вектор. М В аксиоме в) линейного пространства не утверждается, что нулевой вектор должен быть единственным. Но из аксиом а) и в) в совокупности это вытекает. Пусть существуют два нуле- нулевых вектора 0 и 0'. Тогда 0 = аксиома в) =0 + 0 = аксиома а) = 0 + 0 = аксиома в) = 0;. Здесь в роли нулевого элемента сначала выступает вектор 0', а затем 0. Видим, что векторы 0 и 0; совпадают. > Свойство 1.2. Каждый вектор линейного пространства имеет только один противоположный вектор. 4 Пусть для вектора х существуют два противоположных век- вектора (—ж) и (—xY. Согласно аксиоме г) линейного простран- пространства это означает, что х + (—ж) = 0 и х + (—х)' = 0. Рассмо- Рассмотрим двойную сумму (—ж) + х + (—хI элементов линейного пространства. Согласно аксиоме б) эта сумма не зависит от
1.2. Свойства линейного пространства 21 порядка выполнения двух операций сложения. Меняя порядок сложения, получаем: (-ж) + ж + (-ж)' = (-ж) + (ж + (-ж)') = (-ж) + 0 = (-ж) + ж + (-ж)' = ((-ж) + ж) + (-ж)' = аксиома в) = (—ж), аксиома а) I = (ж + (-ж)) + (-ж)' = 0 + (-ж)' = аксиома а) = (—ж) + 0 = аксиома в) = (—ж) . > Свойство 1.3. Если вектор (—ж) противоположен вектору ж, то вектор ж противоположен вектору (—ж). <4 Утверждение опирается на коммутативность сложения. Дей- Действительно, „(—ж) противоположен ж" <=$> ж + (—ж) = О, „ж противоположен (—ж)u Ф=Ф (—ж) + ж = 0. Справа стоят эквивалентные равенства (в силу аксиомы а)). Значит, и утверждения слева равносильны. > Свойство 1.4. Для любых двух векторов а и Ь уравнение а + ж = Ь относительно ж имеет решение, и притом единствен- единственное. ^Существование. Решением уравнения a + ж = Ь является вектор (—о) + Ь, так как Единственность. Пусть ж — какое-либо решение ука- указанного уравнения, т.е. выполнено равенство a + ж = Ь. При- Прибавив к обеим частям этого равенства вектор (—а), получим (-а) + а + ж = (-а) + Ь, откуда ж = (-а) + Ь. Видим, что век- вектор ж совпал с указанным выше решением (—а) 4- Ь. Значит, других решений нет. >
22 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Последнее свойство позволяет ввести еще одну операцию) в линейном пространстве, которая является противоположной» сложению. Разностью двух векторов Ь — а называют век- вектор ж, являющийся решением уравнения а + х = Ь (вспомним, что разностью двух чисел Ь — а называют такое число, которое в сумме с вычитаемым а дает уменьшаемое Ь). Из доказатель- доказательства свойства 1.4 вытекает, что > Свойство 1.5. Произведение произвольного элемента линейного пространства на число О равно нулевому вектору: 0-ж = 0. <4 Отметим, что решением уравнения х + у = х относительно неизвестного у является нулевой вектор (аксиома в)). Пока- Покажем, что в качестве решения этого уравнения можно взять и вектор 0 • ж, который тогда, в силу единственности решения, будет совпадать с 0. Итак, проверяем: = аксиома ж) = = A + 0)х = 1 • X = аксиома д) = X. Свойство 1.6. Вектор, противоположный данному векто- вектору ж, равен произведению х на число —1: (—х) = (—1)х. <4 Благодаря единственности противоположного вектора (свой- (свойство 1.2) достаточно доказать, что вектор {—1)х удовлетворяет аксиоме г) линейного пространства. Для этого используем аксиому дистрибутивности ж) и только что доказанное свой- свойство 1.5: X + ( — 1H5 = 1 • X + ( — 1H5 = A + ( —I))fl5 = 0 ¦ X = 0. > Замечание 1.2, Эквивалентность равенств а + х = Ь и х = Ь — а можно трактовать как правило, согласно которому
... 1.3. Линейная зависимость 23 слагаемое, которое переносят в другую часть равенства, меня- меняет свой знак. Ясно также, что &ля a € R из равенства a = Ь следует равенство aa = ab и наоборот (при а Ф 0), так как — (оса) = [—а\а = 1 а = а а \а / и аналогично -(аЬ) = Ь. а Свойство 1.7. Произведение нулевого вектора на любое число есть нулевой вектор: АО = 0. < Мы теперь знаем, что нулевой вектор можно представить как произведение произвольного вектора (того же 0) на число 0 (свойство 1.5). Используя это, получаем: АО = А@-О) = (А.0H = 0-0 = 0. > 1.3. Линейная зависимость Из данного набора векторов х\, #2, •••> &k линейного про- пространства С при помощи линейных операций можно составить выражение вида а\Х\ + С*2Х2 + .. • + &кхк-> A-1) где c*i, с*2, ..., &к — произвольный набор действительных чи- чисел. Такое выражение называют линейной комбинацией векторов a?i, а?2> •••> хь, а действительные числа аи <*2, •••? otk — коэффициентами линейной комбинации. Если все коэффициенты линейной комбинации равны нулю, то такую ли- линейную комбинацию называют тривиальной, а в противном случае — нетривиальной. Конкретный (неупорядоченный) набор векторов жх, а?2, ..., Xk линейного пространства будем называть системой век- векторов, а любую его часть — подсистемой.
24 J. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Определение 1.2. Систему векторов жх, x<i, •••> &к в ли- линейном пространстве С называют линейно зависимой, если существует нетривиальная линейная комбинация этих векто- векторов, равная нулевому вектору. Если же линейная комбинация этих векторов равна нулевому вектору только лишь в случае, когда она тривиальна, систему векторов называют линейно независимой. Опуская слово „система", часто говорят: век- векторы a?i, а?2, ••-, &к линейно зависимы или соответственно линейно независимы. Линейная зависимость системы векторов х\, а?2, ..., &k означает, что существуют такие коэффициенты ai, с*2, ..., ctk G R, одновременно не равные нулю, для которых выполнено равенство OL\X\ + С*2Ж2 + • • • + <*кХк = 0. A.2) Векторы х\, а?2, ..., Xk линейно независимы, если из равенства + • - • + otkXk = 0 вытекает, что а\ = «2 = ... = &к = 0. В такой интерпретации понятия линейной зависимости и независимости мы будем использовать в различных доказательствах. Следующее утверждение дает простой критерий линейной зависимости векторов. Теорема 1.1. Для того чтобы система векторов х\, Х2, ..., Xk была линейно зависима, необходимо и достаточно, что- чтобы один из векторов системы являлся линейной комбинацией остальных. < Необходимость. Пусть векторы х\, а?2> ..., ж* линейно зависимы. Согласно определению 1.2, это означает, что су- существуют коэффициенты ai, <*2, ..., &к € R, одновременно не равные нулю, р,ля которых выполнено равенство A.2). Не теряя общности, мы можем считать, что а\ Ф 0, так как этого все- всегда можно добиться изменением нумерации векторов в системе.
1.3. Линейная зависимость 25 Из равенства A.2), используя обычные правила преобразования выражений (см. замечание 1.2), находим «2 <*k = х2 - ... хк. Следовательно, вектор Х\ является линейной комбинацией ос- остальных векторов системы. Достаточность. Теперь предположим, что один из век- векторов системы является линейной комбинацией остальных. Как и выше, можно, не теряя общности, считать, что таким явля- является вектор asi. Согласно этому предположению, существуют такие коэффициенты с*2, ..., #ь чт0 хг = Преобразуя очевидным образом записанное выражение, полу- получаем 1 • Я?1 — OL2X2 — .. — &кхк = 0. В левой части этого равенства стоит линейная комбинация век- векторов системы. Она равна нулевому вектору, но не все ее коэффициенты равны нулю (например, коэффициент при векто- векторе Х\ равен единице). Согласно определению 1.2, это означает, что система векторов х\, x2i ..., хк линейно зависима. > Пример 1.4. В линейном пространстве С[0,2тг] функций, непрерывных на отрезке [0, 2тг], рассмотрим функции 1, sin2 я, cos2x. Система из этих трех элементов линейного простран- пространства линейно зависима, поскольку в силу известной формулы тригонометрии функция sin2 x является линейной комбинацией двух других функций: .о 1 — cos 2rr sin х = .
26 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА 1.4. Свойства систем векторов Непосредственно из аксиом линейного пространства можно получить ряд простейших свойств систем векторов произволь- произвольного линейного пространства С. 1°. Если среди векторов xi, X2, ..., х^ ? С есть нулевой вектор, то эта система векторов линейно зависима. -4 Пусть, например, х\ = 0. Тогда линейная комбинация 1 • х\ + + 0 • Ж2 + ... + 0 • Xk является нетривиальной, так как первый ее коэффициент равен единице. В то же время указанная линейная комбинация равна 0, потому что все ее слагаемые равны нулевому вектору. > 2°. Если система векторов содержит линейно зависимую nodcucmt *ty, то она линейно зависима. < Подсистема состоит из части векторов исходной системы. Пусть, например, в системе векторов х\, ..., х* подсистема ®ь •••! хт, т <п, линейно зависима. Это значит, что можно указать коэффициенты а\, ..., ат, одновременно не равные нулю, для которых Введя дополнительные коэффициенты am+i = ... = а* = 0, по- получим линейную комбинацию системы векторов xi, ..., хт, xm+i, ..., Xfc. С одной стороны, она не является тривиальной, так как среди первых ее т коэффициентов есть ненулевые, а с другой стороны, ... 4- атх так как все коэффициенты начиная с (т+1)-го равны нулю. Следовательно, исходная система векторов линейно зависи- зависима. >
1.4. Свойства систем векторов 27 3°. Если система векторов линейно независима, то и любая ее подсистема тоже линейно независима. < Это свойство является переформулировкой предыдущего. В самом деле, по свойству 2° система, имеющая линейно зави- зависимую подсистему, не может быть сама линейно независимой. Поэтому у линейно независимой системы вообще не может быть линейно зависимых подсистем. > 4°. Если векторы ei, ..., ет линейного пространства С линейно независимы и вектор у Е С не является их линейной комбинацией, то расширенная система векторов ei, ..., em, у является линейно независимой. < Действительно, пусть aiei + ... + атет + /?t/ = 0. Тогда коэффициент /3 должен быть нулевым, так как в против- противном случае мы можем выразить вектор у через остальные. Но слагаемое @у в равенстве слева можно при /? = 0 опустить, и мы получаем линейную комбинацию векторов ei, ..., е*, рав- равную нулевому вектору. В силу линейной независимости этих векторов все коэффициенты линейной комбинации равны нулю. Значит, исходная линейная комбинация является тривиальной и поэтому система векторов еш, ..., ет, у линейно независи- независима. > Пример 1.5. В линейном арифметическом пространстве Шп рассмотрим п векторов ег = A,0, ...,0,0), е2 = @, 1, ...,0,0), е„ = @, 0, ...,0, 1). Докажем, что система из этих векторов линейно независима. Так как для любых коэффициентов c*i, ..., ап + а2е2 +... + апеп = (аь а2, ••-, ап),
28 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА то ясно, что эта линейная комбинация векторов ei, ..., еп может быть равна нулевому вектору 0 = @, 0, ..., 0) только лишь при условии, что а\ = аг = ... = осп = 0. Это и означает, что эта система векторов линейно независима. Отметим, что если из векторов ei, ..., еп, рассматривая их как строки одинаковой длины, составить матрицу гл (\ о ... о о\ 0 1 ... 0 0 0 0 ... 0 I) то ее ранг будет максимальным (Rg-E = n), так как Е является невырожденной матрицей. По теореме о базисном миноре [III] строки этой матрицы линейно независимы. Таким образом, по- понятие линейной независимости векторов ei, ..., еп линейного арифметического пространства в данном случае согласуется с понятием линейной независимости строк единичной матри- матрицы Е. Пример 1.6. Любые два коллинеарных вектора на плоско- плоскости (в Vfc) и любые три компланарных вектора в пространстве (в V3) линейно зависимы. И в том, и в другом случае один из векторов можно представить в виде линейной комбинации дру- другого (других) [III]. По этой же причине в пространстве линейно зависима любая система из четырех векторов. Пример 1.7. Пусть в произвольном линейном простран- пространстве С даны два вектора d\ и d*i и пусть а = 3di — 2d2, b = = 2d\ + 3d2, с = d\ + 5d2- Тогда система векторов а, 6, с линейно зависима. В самом деле, составим линейную комбинацию системы векторов а, Ь, с с произвольными коэффициентами ж, у, z и приравняем ее нулевому вектору: ха + yb + zc = 0. В этой линейной комбинации заменим векторы их представлениями
1.5. Базис линейного пространства, 29 через d\ и d2: = Crr + 2y + z)di + {-2x + 3y + 5z)d2. Теперь достаточно приравнять нулю коэффициенты при d\ и cfe, чтобы получить нулевую линейную комбинацию. Значит, если коэффициенты ж, у, z удовлетворяют системе линейных алгебраических уравнений {Зх + 2у+ 2 = 0, -2х + Зу + bz = 0, то линейная комбинация векторов а, Ь, ее коэффициентами ж, у, ^ равна нулевому вектору. Как следует из теории систем линейных алгебраических уравнений [III], указанная система всегда имеет ненулевое решение, поскольку ранг ее матрицы равен двум и меньше трех — количества неизвестных. Например, ненулевым решением является х = 7, у = —17, z = = 13. Значит, существуют такие х, у, 2, одновременно не равные нулю, что линейная комбинация векторов а, Ь, ее этими коэффициентами равна нулевому вектору, т.е. система векторов a, Ъ, e линейно зависима. 1.5. Базис линейного пространства В линейном пространстве наибольший интерес представля- представляют системы векторов, в виде линейной комбинации которых можно представить любой вектор, причем единственным обра- образом. Если зафиксировать такую систему векторов, то любой вектор можно будет однозначно представить набором чисел, являющихся коэффициентами соответствующей линейной ком- комбинации, а всевозможные векторные соотношения превратить в соотношения числовые.
30 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Этот подход применялся уже в аналитической геометрии [III]. В пространстве Vi векторов на плоскости любые два не- коллинеарных вектора образуют базис, так как через такую пару векторов любой вектор плоскости выражается однозначно в виде линейной комбинации [III]. Аналогично в V3 (множестве векторов в пространстве) базис образуют любые три некомпла- некомпланарных вектора. Для матриц использовалось понятие базисных строк и базисных столбцов. По теореме о базисном миноре ба- базисные строки (столбцы) линейно независимы, а любая строка (столбец) матрицы является линейной комбинацией базисных строк (столбцов) [III]. Определение 1.3. Базисом линейного пространства С называют любую упорядоченную систему векторов, для которой выполнены два условия: 1) эта система векторов линейно независима; 2) каждый вектор в линейном пространстве может быть представлен в виде линейной комбинации векторов этой сис- системы. Пусть 6i, ..., Ъп — базис в ?. Определение 1.3 говорит о том, что любой вектор ж € ? может быть записан следующим образом: х = х\Ь\ +... + xnbn. Такую запись называют разложением вектора х по бази- базису Ьи ..., Ьп. Данное нами определение базиса согласовывается с поняти- понятием базиса в пространстве свободных векторов в Vi, V2 или V3 [III]. Например, в V3 базисом была названа любая тройка неком- некомпланарных векторов. Такая тройка векторов является линейно независимой, так как представление одного ее вектора в виде линейной комбинации двух других равносильна компланарно- компланарности трех векторов. Но, кроме того, из курса векторной алгебры [III] мы знаем, что любой вектор в пространстве можно выра- выразить через произвольные три некомпланараных вектора в виде
1.5. Базис линейного пространства 31 цх линейной комбинации. Три компланарных вектора не могут быть базисом в %, так как любая линейная комбинация таких векторов даст вектор, им компланарный. Теорема 1.2 (о единственности разложения). В ли- линейном пространстве разложение любого вектора по данному б&зису единственно. <4 Выберем в линейном пространстве С произвольный базис bi, ..., Ьп и предположим, что вектор х имеет в этом базисе два разложения Воспользуемся тем, что аксиомы линейного пространства позволяют преобразовывать линейные комбинации так же, как и обычные алгебраические выражения. Вычитая записанные равенства почленно, получим (хг - х\)Ьг + ... + (*„- х'п)Ъп = 0. Так как базис — это линейно независимая система векторов, ее линейная комбинация равна 0, лишь если она тривиальная (см. определение 1.2). Значит, все коэффициенты этой линей- линейной комбинации равны нулю: х\ — х[ = 0,..., хп — xfn = 0. Таким образом, x\=x'ii ..., хп = х'п и два разложения вектора х в ба- базисе bi, ..., Ьп совпадают. > Замечание 1.3. Условие линейной независимости векторов базиса означает, что нулевой вектор имеет в этом базисе един- единственное разложение, а именно тривиальное: все коэффициенты этого разложения равны нулю. Из доказательства теоремы 1.2 следует, что из единственности разложения нулевого вектора по данной системе векторов вытекает единственность разло- разложения любого другого вектора. # Согласно определению 1.3, базис является упорядоченной си- системой векторов. Это значит, что, изменив порядок векторов
32 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА в системе, мы получим другой базис. Порядок векторов в ба- базисе фиксируют для того, чтобы задать определенный порядок коэффициентов разложения произвольного вектора. Это позво- позволяет заменить линейную комбинацию, представляющую вектор, упорядоченным набором ее коэффициентов и тем самым упро- упростить запись. Порядок векторов в базисе определяется их нумерацией. Определение 1.4. Коэффициенты разложения вектора по оазису линейного пространства, записанные в соответствии с порядком векторов в базисе, называют координатами вектора в этом базисе. Пример 1.8. В линейном пространстве К^х] многочленов переменного х степени не выше 2 (см. пример 1.1) элементы х ю. х2 линейно независимы: их линейная комбинация ах + /Зх2 есть многочлен, который равен нулю (нулевому многочлену) лишь при а = /3 = 0. В то же время пара этих элементов не образует базиса. Действительно, многочлен 1 нулевой степени, являющийся элементом #2[я]» нельзя представить в виде линейной комбинации многочленов х и х2. Дело в том, что линейная комбинация ах + /Зх2 многочленов хих2 есть либо многочлен второй степени (при /3 ф 0), либо многочлен первой степени (а ф 0, /3 = 0), либо нулевой многочлен (а = /3 = 0). Значит, равенство 1 = ах + /Зх2 двух многочленов невозможно ни при каких значениях коэффициентов. В то же время три многочлена 1, х, х2 образуют базис линейного пространства .КгМ- Докажем это. Во-первых, система многочленов 1, я, х2 линейно незави- независима. Составим их линейную комбинацию с произвольными коэффициентами а, /3, 7 и приравняем нулю: а • 1 + (Зх + ух2 = 0. Это равенство есть равенство двух многочленов, и оно возмож- возможно только в случае, когда коэффициенты этих двух многочленов совпадают. Значит, а = /3 = j = 0. Во-вторых, через многочлены 1, #, х2 можно выразить лю- любой многочлен второй степени, т.е. любой элемент линейного
1.6. Линейные операции в координатной форме 33 пространства -Кг [я] можно представить в виде линейной ком- комбинации указанных трех элементов. Возьмем произвольный многочлен р(х) = a 2 2 Его запись можно рассматривать как линейную комбинацию многочленов 1, ж, х2: р(х) = a • 1+ (Зх2 + jx2, причем коэффициенты многочлена в то же время являются коэффициентами линейной комбинации. Итак, система трех многочленов 1, ж, #2 линейно незави- независима, а любой элемент линейного пространства К2 [х] является линейной комбинацией указанной системы. Согласно определе- определению 1.3, система многочленов 1, ж, х2 есть базис в 1.6. Линейные операции в координатной форме Фиксация порядка векторов в базисе преследует еще одну цель — ввести матричные способы записи векторных соотно- соотношений. Базис 6i, ..., bn в данном линейном пространстве С удобно записывать как матрицу-строку Ь=(Ьг ... Ьп), а координаты вектора х в этом базисе — как матрицу-столбец: х= : . A.3) Тогда разложение х = х\Ь\ + ... + xnbn вектора х по базису Ь\, ..., Ьп можно записать как произведение матрицы-строки на матрицу-столбец: х = Ьх. A.4) 2 Линейная алгебра
34 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Пример 1.9. Векторы ортонормированного базиса в V3 имеют стандартное обозначение и порядок: г, jf, fc. В ма- матричной записи это будет выглядеть так: Ь= (г j fc). Вектор, например, с координатами — 1, 2, 2 может быть представлен в виде* . /"Л 2fe = (» j fc) T где x = (—1 2 2) — столбец координат вектора х. # Запись линейных операций над свободными векторами в координатной форме [III] обобщается на случай произвольного линейного пространства. Теорема 1.3. При сложении любых двух векторов в линейном пространстве их координаты в одном и том же базисе складываются, а при умножении вектора на число его координаты умножаются на это число. < Рассмотрим в линейном пространстве С базис Ь = Fi ... Ьп). Пусть даны разложения векторов ж и у в этом базисе: х = хфх +... + хпЪп, у = yibi + ...+ ynbn. В силу аксиом линейного пространства х + у = (xibi +... + xnbn) + (yibi +... + УпК) = Таким образом, при сложении двух векторов их координаты, отвечающие одному базисному вектору, складываются. В матричной записи координат этому соответствует матричная сумма столбцов координат. * Напомним, что в векторной алгебре [III] мы записывали координаты вектора в строку, ограничивая ее фигурными скобками. Для упрощения выкладок мы отождествляли вектор с набором его координат, хотя, вообще говоря, эти объекты имеют различную природу. В линейной алгебре принято координаты записывать не в строку, а в столбец.
1.6. Линейные операции в координатной форме 35 Аналогично для произвольного действительного числа А Аж = \{xibi +... + xnbn) = (Axi)bi +... + (Xxn)bn, т.е. при умножении вектора на число каждая из его координат умножается на это число. > Запись координат векторов в матричной форме снимает во- вопрос о том, что понимать, например, под сложением координат: координаты складываются как матрицы-столбцы. Аналогично столбец координат умножается на число по правилам умноже- нця матрицы на число. Запись-утверждения теоремы 1.3 в матричной форме Ьх + by = Ь(х + у), ХЬх = Ь(Хх) соответствует свойствам матричных операций: дистрибутив- дистрибутивности сложения относительно умножения и ассоциативности умножения. Следствие 1.1. Линейная независимость (зависимость) векторов линейного пространства эквивалентна линейной не- независимости (зависимости) их столбцов координат в одном и том же базисе этого линейного пространства. М Если вектор а равен линейной комбинации векторов ai, ..., ak, т.е. то его столбец координат а в заданном базисе Ь равен такой же линейной комбинации столбцов координат ai, ..., ak векторов ai, ..., а*; в этом же базисе: Это следует из равенств: Ьа = а = aiai +... + akak = ai(bai) +... + ak(bak) = >
36 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Пример 1.10. В линейном арифметическом пространстве Шп векторы ei = (l, О, ...,0), е2 = @, 1, ...,0), A5) е„ = @, 0, ..., 1) образуют базис е = (ei ... еп), так как они линейно незави- независимы (см. пример 1.5) и любой вектор х = (a?i, ..., хп) 6 Кп представим в виде x = xie\ + ,.. + xnen. # Базис A.5) в пространстве W1 называют стандартным. Замечание 1.4. В линейном арифметическом простран- пространстве Шп для произвольного вектора х = (х\, ..., хп) его столбец координат х в стандартном базисе совпадает с жт. Как и в ана- аналитической геометрии [III], удобно при фиксированном базисе отождествлять вектор с его координатами. Для стандартного базиса это равносильно записи вектора не как матрицы-строки, а как матрицы-столбца. Отметим, что запись элементов ариф- арифметического пространства в виде столбца не противоречит определению арифметического пространства, понимаемого как множество упорядоченных совокупностей чисел. Порядок же элементов можно указывать как при помощи записи в строку, так и при помощи записи в столбец. Пример 1.11. Покажем, что в R3 система векторов в1 = A, -1, 2), О2 = B, 1, 0), а3 = D, -1,1) образует базис и найдем в этом базисе координаты вектора с =B, 1,3). Для того чтобы доказать, что система векторов ai, c&2, аз образует базис, надо убедиться в линейной независимости этих векторов и в том, что любой вектор Ь = (fei, 62? fa) Е К3 является их линейной комбинацией.
1.6. Линейные операции в координатной форме 37 В стандартном базисе е в К3 векторы ai, 02, 03, Ь, с имеют следующие столбцы координат: ai= -1 , 02= 1 , as= -1 , Ь= Из столбцов координат векторов щ, а2, аз составим матрицу и рассмотрим квадратную систему линейных алгебраических уравнений (СЛАУ) Ах = Ь, ж = (rci ?2 #з) • Так как det A = —9, то матрица А невырожденная, ее ранг равен 3 и все ее столбцы являются базисными. Поэтому, во-первых, согласно теореме о базисном миноре [III], эти столбцы линейно независимы, что, согласно следствию 1.1, означает линейную независимость векторов oi, a2, 03, а, во-вторых, СЛАУ Ах = Ь при любом столбце 6 правых частей имеет решение х = (х[ х!2 х'ъ) , что после записи этой СЛАУ в векторной форме [III] позволяет сделать вывод о выполнении равенства В частности, решив СЛАУ Ах = с, которая в координатной форме имеет вид = 2, х2- ж3 = 1, х3 = 3, находим координаты вектора с в базисе (ai 02 аз): xi = 2, Х2 = 2, Жз = -1.
38 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА 1.7. Размерность линейного пространства Эта важнейшая характеристика линейного пространства связана со свойствами систем векторов в этом пространстве. Определение 1.5. Максимальное количество линейно не- независимых векторов в данном линейном пространстве называ- называют размерностью линейного пространства. Если размерность линейного пространства С равна п, т.е. существует линейно независимая система из п векторов, а лю- любая система векторов, содержащая п + 1 вектор или более, линейно зависима, то говорят, что это линейное пространство п-мерно. Размерность такого линейного пространства обозна- обозначают п = dim?. Существуют линейные пространства, в которых можно вы- выбрать линейно независимую систему, содержащую сколь угодно большое количество векторов. Такие линейные пространства называют бесконечномерными. В отличие от них, п-мерные линейные пространства называют конечномерными. Эта книга посвящена конечномерным линейным пространствам. Пример 1.12. Линейное пространство С[0,1] функций, непрерывных на отрезке [0,1] (см. 1.1), является бесконечно- бесконечномерным, так как для любого натурального п система многочле- многочленов 1, ж, ж2, ..., хп, являющихся элементами этого линейного пространства, линейно независима. В самом деле, линейная комбинация этих многочленов, отвечающая набору коэффици- коэффициентов ао, ах, ..., ап, есть многочлен ао + ot\x +... который является нулевым (т.е. равен постоянной функции 0), только если все его коэффициенты (они же коэффициенты линейной комбинации) равны нулю. # Оказывается, что размерность линейного пространства тес- тесно связана с количеством векторов, которое может иметь базис линейного пространства.
1.7. Размерность линейного пространства 39 Теорема 1.4. Если линейное пространство С n-мерно, то любая линейно независимая система из п векторов является его базисом. <* Пусть система векторов Ь\, ..., ЬПЕ С линейно независима. Тогда для любого вектора х G С система векторов ж, Ь\, ..., Ьп линейно зависима, так как она содержит п + 1 вектор, т.е. количество большее, чем размерность линейного пространства. Это значит, что существуют такие коэффициенты ао, ах, ..., ап, одновременно не равные нулю, что ацх + а\Ь\ +... + anbn = 0. A.6) Заметим, что ао ^ 0, так как в противном случае равен- равенство A.6) сводится к равенству причем среди коэффициентов ai, ..., ап есть хотя бы один ненулевой (так как ао = 0). Но это означало бы, что система векторов Ь\, ..., Ьп линейно зависима. Учитывая, что ао ф 0, из A.6) находим ж = 6i-... Ьп. ао ао Так как вектор х был выбран произвольно, заключаем, что любой вектор в линейном пространстве С можно представить в виде линейной комбинации системы векторов bi, ..., Ьп. Поэтому эта система векторов, по предположению линейно независимая, является базисом в ?. > Теорема 1.5. Если в линейном пространстве С существует базис из п векторов, то dim? = п. <4 Пусть Ь= (Ь\ ... Ьп) — базис в линейном пространстве С. Нам достаточно показать, что любая система a&i, ..., хп+\ из п-\~1 вектора из С линейно зависима.
40 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Разложим каждый из этих векторов Х{ по базису Ь: а из столбцов координат векторов Х{ составим матрицу типа пх(п + 1). Согласно следствию 1.1, линейная зависимость системы векторов х\, ..., хп+\ равносильна линейной зависи- зависимости столбцов матрицы А, так как выполнение каких-либо линейных операций над векторами идентично выполнению тех же операций над их столбцами координат. Но в матрице А содержится п строк, поэтому ее ранг не превосходит п. Следо- Следовательно, при любом выборе базисного минора хотя бы один из столбцов матрицы не является базисным и по теореме о базис- базисном миноре [III] является линейной комбинацией базисных. Но тогда такое же соотношение справедливо для соответствующих векторов. Следовательно, согласно необходимому и достаточ- достаточному условию линейной зависимости (см. теорему 1.1), система векторов #1, ..., жп+1 линейно зависима, так как один из них равен линейной комбинации остальных. > Из теорем 1.4 и 1.5 следует, что в каждом линейном про- пространстве любые два базиса содержат одно и то же количество векторов, и это количество равно размерности линейного про- пространства. Пример 1.13, В линейном арифметическом пространстве W1 стандартный базис A.5) состоит из п векторов, поэтому dimRn = n, что и отражено в обозначении этого линейного пространства.
1.7. Размерность линейного пространства 41 Пример 1.14. Рассмотрим однородную СЛАУ Х\ — 2X2 + 2^3 — Я4 = О, Х\ — 3X2 + Xz — 4^4 = О, — 5x2 + Зхз — 5x4 = О, множество решений которой образует линейное пространство. Найдем размерность этого линейного пространства и какой- либо базис в нем. Следуя [III], решим эту систему, определив ее фундамен- фундаментальную систему решений. Для этого запишем матрицу систе- системы и при помощи элементарных преобразований строк приве- приведем ее к треугольному виду: Из полученного вида находим, что ранг матрицы системы равен 2, в качестве свободных неизвестных можно взять хз и Х4, а в качестве базисных неизвестных — х\ и Х2- Преобразованная система имеет вид Г xi -2х2 + 2х3- я4 = 0, |^ Х2 + Хз + 3X4 = 0. Полагая хз = 1, Х4 = 0, находим Х2 = —1, х\ = —4, а при хз = 0, Х4 = 1 имеем Х2 = —3, х\ = —5. Записав найденные решения в виде столбцов, получим фундаментальную систему решений: -3 0 V 1/ Согласно теории систем линейных алгебраических уравнений [III], эти два решения линейно независимы, а любое другое ре- решение СЛАУ представляется в виде линейной комбинации х^
42 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА и х^2\ Другими словами, столбцы х^ и х^ образуют базис в линейном пространстве решений рассматриваемой однород-^ ной СЛАУ. Размерность этого линейного пространства равна двум — количеству векторов в базисе. 1.8. Преобразование координат вектора при замене базиса В линейном пространстве все базисы равноправны. Тот или иной базис выбирают исходя из конкретных обстоятельств, а может быть, и вообще произвольно. Иногда удобно исполь- использовать для представления элементов линейного пространства несколько базисов, но тогда естественным образом возникает задача преобразования координат векторов, которое связано с изменением базиса. Пусть в п-мерном линейном пространстве С заданы два базиса: старый Ь= (Ь\ ... Ьп) и новый с = (с\ ... сп). Любой вектор можно разложить по базису Ь. В частности, каждый вектор из базиса с может быть представлен в виде линейной комбинации векторов базиса Ь: С{ = ацЬх +... + ambn, % = 1, п. Запишем эти представления в матричной форме: ИЛИ где U=\ )• A.7) ani ... апп
1.8. Преобразование координат при замене базиса 43 Определение 1.6. Матрицу A.7) называют матрицей перехода от старого базиса Ь к новому базису с. Согласно данному определению, г-й столбец матрицы пе- перехода есть столбец координат г-ro вектора нового базиса в старом. Поэтому говорят, что матрица перехода состоит из координат векторов нового базиса в старом, записанных по столбцам. Обсудим некоторые свойства матрицы перехода. 1°. Матрица перехода невырождена и всегда имеет обрат- обратную. < Действительно, столбцы матрицы перехода — это столбцы координат векторов нового базиса в старом. Следовательно, они, как и векторы базиса, линейно независимы. Значит, ма- матрица U невырожденная и имеет обратную матрицу U~l [III]. > 2°. Если в n-мерном линейном пространстве задан базис Ь, то для любой невырожденной квадратной матрицы U порядка п существует такой базис с в этом линейном пространстве, что U будет матрицей перехода от базиса Ь к базису с. «* Из невырожденности матрицы U следует, что ее ранг равен п, и поэтому ее столбцы, будучи базисными, линейно незави- независимы. Эти столбцы являются столбцами координат векторов системы с = bU. Линейная независимость столбцов матрицы U равносильна линейной независимости системы векторов с. Так как система с содержит п векторов, причем линейное простран- пространство n-мерно, то, согласно теореме 1.4, эта система является базисом. > Пример 1.15. Пусть Ь = (Ь\ &2 &з) — базис линейного пространства. Тогда система векторов с\ = 2bi, С2 = — &2> сз = 6з тоже является базисом в этом линейном пространстве. Это следует из того, что (ci с2 c3) = Fi 62 где диагональная матрица U = diagB, —1,1) невырождена.
44 J. ЛИНЕЙНЫЕ ПРОСТРАНСТВА 3°. Если U — матрица перехода от старого базиса Ъ к новому базису с линейного пространства, то U~l — матрица перехода от базиса с к базису 6. М Матрица U невырождена, и поэтому из равенства с = bU следует, что cU = 6. Последнее равенство означает, что столбцы матрицы U являются столбцами координат векторов базиса Ь относительно базиса с, т.е., согласно определению 1.6, U~l — это матрица перехода от базиса с к базису Ь. > 4°. Если в линейном пространстве заданы базисы Ь, с и d, причем U — матрица перехода от базиса b к базису с, а V — матрица перехода от базиса с к базису d, то произведение этих матриц UV — матрица перехода от базиса Ъ к базису d. < Согласно определению 1.6 матрицы перехода, имеем равен- равенства откуда т.е. UV — матрица перехода от базиса Ъ к базису d. > Рассмотрим теперь, как преобразуются координаты про- произвольного вектора в линейном пространстве при переходе от старого базиса к новому. Выберем произвольный вектор х 6 С и разложим его в старом базисе: х = Ьж, х = • . A.8) Разложение того же вектора в новом базисе имеет вид (Х'Л х = сх\ х' = : . A.9)
1.8. Преобразование координат при замене базиса 45 Найдем связь между старыми координатами х вектора х и новыми его координатами х\ Из соотношений A.8), A.9) следует, что Ьх = сх1. Учитывая, что с = Ы7, получаем Ьх = (bU)x\ или Ьх = b(Ux'). Последнее равенство можно рассматривать как запись двух разложений одного и того же вектора х в данном базисе Ь. Разложениям соответствуют столбцы координат х и Ux1, которые, согласно теореме 1.2 о единственности разложения вектора по базису, должны быть равны: х = С/а:', или х1 = U .' - 7Y-1 X. Итак, чтобы получить координаты вектора в старом базисе, необходимо столбец координат этого вектора в новом базисе умножить слева на матрицу перехода из старого базиса в новый. Матрица перехода из старого базиса в новый позволяет пересчитывать новые координаты в старые. Пример 1.16. Рассмотрим в V<i ортонормированный базис Ь= (г j) из векторов г, j. Обозначим через е = (ei ег) новый базис, который получается поворо- поворотом старого базиса Ь на заданный угол (р. Исходя из заданного угла поворота мы можем найти коорди- координаты векторов ei, e<i нового базиса относительно старого (рис. 1.2): Рис. 1.2 У А I cosy? ) Эти разложения позволяют составить матрицу перехода U из старого базиса 6 в новый е, а также обратную матрицу: -i=( C0S(P ^ -sin</A \smcp cos(p /' Найденные матрицы перехода U (из старого базиса в новый) и U~l (из нового базиса в старый) позволяют записать соотно-
46 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА шения между старыми хи Х2 и новыми х\, х'2 координатами произвольного вектора х из V2: х[ = хг cos <р + Х2 sin <р, х\ = а^ cos <p — я^ sin <р, ^2 = — гг 1 sin (р + Х2 cos <р, Ж2 = #i sin (p + х'2 cos (р. Например, вектор х = г + j в старом базисе имеет координаты #1 = 1, Х2 = 1, а в новом базисе — а^ = cos</? + sine/?, rc^ = = — sin <p + cosy?. Пример 1.17. Пусть в линейном пространстве V3 зада- заданы два правых ортонормированных базиса: старый (г j к) и новый (г' f к'). Тогда старый базис можно преобразовать в новый при помощи трех поворотов вокруг координатных осей прямоугольной системы координат, определяемой ортонорми- рованным базисом. Рассмотрим единичный вектор в, который одновременно лежит в плоскостях пар векторов г, j и г', f. Повернем базис (г j к) вокруг оси вектора к на некоторый угол ф так, что вектор г совпадет с вектором з. Отметим, что вектор 5 ортогонален и вектору fe, и вектору fc;, так как является линейной комбинацией и пары г, j, и пары г;, j1. Значит, поворотом вокруг оси вектора а на некоторый угол # можно добиться совмещения вектора * с вектором к!. Наконец, поворотом вокруг оси вектора к! на некоторый Рис. 1.3 угол ip совместим вектор з с вектором г1 (рис. 1.3). Матрица перехода, соответствующая первому повороту во- вокруг оси вектора fc, имеет вид /cos U\ = I si V о o
Д. 1.1. Линейное пространство над полем Р 47 Матрица перехода A<i, соответствующая повороту уже нового базиса вокруг оси вектора з на угол $, похожа на предыдущую: /10 0 U2= I 0 costf -sim? \0 sintf cos i? Наконец, матрица перехода, соответствующая третьему пово- повороту вокруг оси вектора к' имеет вид /cosy? — si С/з = I sin</? V 0 0 Согласно свойству 4°, матрица перехода U из старого базиса (i j к) в новый базис (г' jf к') равна U = Е/хС/^з и может быть записана в виде I sin</;cos<? + cos^cosi9sin<^ — sin^sinv?-fcos^cost?cosv? -cos^sint? J. sintfsin</? sin^cosy) cost? / Дополнение 1.1. Линейное пространство над полем Р Мы ввели понятие линейного пространства как множества произвольной природы, на котором заданы две операции: сло- сложение элементов множества и умножение элемента множе- множества на число. Согласно замечанию 1.1, под числами можно понимать как действительные числа, так и комплексные. Обе операции должны подчиняться аксиомам линейного простран- пространства, при этом происхождение этих операций совершенно не- несущественно. Этот подход можно развивать, давая понятию „число" рас- расширительное толкование. Само понятие числа характеризу- характеризуется в первую очередь тем, что над числами можно выпол- выполнять четыре арифметические операции. Если наличие четырех
48 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА арифметических операций взять за основу, мы придем к ал- алгебраической структуре, называемой полем. Напомним, что в самом широком толковании алгебраическая структура (алгебраическая система) — это некоторое множество, на ко- котором задана одна или несколько алгебраических операций, подчиняющихся некоторому набору аксиом. Алгебраическая операция (внутренний закон композиции, [1-4.1]) на множе- множестве X — это такой закон, или правило, который любому упорядоченному набору х\,..., хп элементов множества X (опе- (операндов) ставит в соответствие единственный элемент того же множества (результат этой операции). Наиболее распростра- распространены бинарные алгебраические операции, имеющие два операнда (т.е. п = 2). Определение 1.7. Полем называют множество Р про- произвольной природы, на котором заданы две бинарные алге- алгебраические операции, условно сложение (+) и умножение (•), подчиняющиеся следующим аксиомам поля: а) сложение коммутативно: a + b = b + a; б) сложение ассоциативно: (а + 6) + с = а + (Ь + с); в) существует такой элемент О Е Р (нулевой элемент, или нуль), что а + 0 = а для любого элемента а? Р; г) каждый элемент a ? Р имеет противоположный (симметричный) элемент (—а), такой, что а + (—а) = 0; д) умножение коммутативно: а - b = 6 • а; е) умножение ассоциативно: (а-b) -с = а- (Ь-с); ж) существует такой элемент е G Р (единичный), что а • е = а для любого а € Р\ з) каждый элемент a G Р, а ф 0, имеет обратный элемент а, такой, что а • а = е; и) умножение дистрибутивно относительно сложения: (а + Отметим, что первые четыре аксиомы поля, относящиеся к операции сложения, совпадают с соответствующими аксиомами
Д. 1.1. Линейное пространство над полем Р 49 линейного пространства. Так же как и в линейном простран- пространстве, исходя из аксиом в) и г) строим операцию вычитания, полагая, например, что, по определению, Аксиомы ж) из), относящиеся к умножению, аналогичны аксиомам в) и г). Они позволяют определить операцию деления: Сложение и умножение задаются в поле априори, их называ- называют основными операциями, а вычитание и деление, которые базируются на свойствах основных операций, называют допол- дополнительными операциями. Аксиомы поля позволяют с его элементами оперировать так же, как и с числами. Сохраняются основные правила пре- преобразования выражений. В записи выражений используют те же соглашения, что и в записи числовых выражений. Знак операции умножения опускают, если сомножители обозначены буквами, т.е. вместо а • b пишут ab. В выражениях действует приоритет операций умножения и деления по отношению к сло- сложению и вычитанию. Если в выражении записаны несколько операций подряд, то сперва выполняются более приоритетные операции. Операции одного приоритета выполняются в поряд- порядке слева направо. Например, в выражении a + bc — d/f сперва следует операция умножения 6с, затем деления d//, затем сло- сложения, последней выполняется операция вычитания. Операция умножения на число в линейном пространстве на самом деле не опирается на специфические свойства дей- действительных чисел. Важно лишь, что числа можно умножать (используется в аксиомах д) и е) линейного пространства) и складывать (аксиома ж)). Операция сложения вообще опе- оперирует только элементами линейного пространства. Поэтому можно, опираясь на то же определение 1.1, ввести линейное пространство над произвольным полем Р. Такое линейное
50 J. ЛИНЕЙНЫЕ ПРОСТРАНСТВА пространство определяют как множество произвольной приро- природы, на котором заданы две операции: сложение, подчиняю*- щееся аксиомам а)-г) линейного пространства, и умножение элементов линейного пространства на элементы поля Р, подчи- подчиняющееся аксиомам д)-з) линейного пространства. о В качестве поля Р чаще всего рассматривают поле действи- действительных чисел Ш и поле комплексных чисел С. Это объясняет введенную ранее терминологию („линейное пространство над полем действительных чисел", „линейное пространство над по- полем комплексных чисел", см. замечание 1.1). Пример 1.18. Рассмотрим однородную СЛАУ ' B + i)xi + C - 2i)x2 - 7xs = 0, A - i)xi + х2 - C - 2г)х3 = 0, 3ixi + A - 2г)х2 - A + 4г)х3 = 0 с комплексными коэффициентами. Множество ее решений представляет собой комплексное линейное пространство. Раз- Размерность и базис этого пространства мы определим, если най- найдем фундаментальную систему решений этой СЛАУ. Решаются системы с комплексными коэффициентами по той же схеме, что и СЛАУ с действительными коэффициентами. Записываем матрицу СЛАУ и при помощи элементарных преобразований строк приводим ее к ступенчатому виду. Чтобы упростить вы- вычисления, используем умножение строк на комплексные числа, сопряженные к элементам первого столбца: '2 + г 3-2* -7 1-i 1 -3 + 2% Ъг 1 — 2* —1 — 4* ^2 1 -3-2* ~ | 0 19 + 3* —19 — 3* 0 7 + 5г -7-5* 5 4-7г -14 + 7*
Вопросы и задачи 51 Видим, что ранг матрицы СЛАУ равен двум, а значит, линейное пространство решений одномерно. В качестве базис- базисных неизвестных можно взять х\, Х2, тогда х$ — свободное неизвестное. Полагая жз = 1, находим Х2 = 1, х\ = 2. Таким образом, фундаментальная система решений рассматриваемой СЛАУ имеет один вектор х^ = B 1 1) , а общее решение име- имеет вид где С — произвольное комплексное число. # Далее мы будем рассматривать линейные пространства только над полем действительных чисел. Вопросы и задачи 1.1. Может ли линейное пространство состоять из: а) двух элементов; б) одного элемента; в) 100 элементов? 1.2. Выясните, образует ли линейное пространство: а) множество всех векторов данной плоскости, не парал- параллельных данной прямой, относительно линейных операций над векторами; б) множество всех векторов плоскости с началом в начале системы координат, расположенных в правой полуплоскости, относительно обычных операций сложения и умножения век- векторов; в) множество кососимметрических матриц третьего поряд- порядка относительно операции сложения матриц и умножения ма- матрицы на число; г) множество функций вида acost + 6sint, t G (—00,00), a,b E R, относительно обычных операций сложения функций и умножения функции на число;
52 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА д) множество многочленов степени п относительно обычных операций сложения многочленов и умножения многочлена на число. 1.3. Пусть множество М состоит из одного элемента а. Определим операции сложения и умножения на действитель- действительное число а соответственно равенствами: а + а = а, аа = о. Является ли М линейным пространством? 1.4. Предположим, что множество М состоит из всевоз- всевозможных упорядоченных пар действительных чисел х = (аьскг)- Пусть на этом множестве заданы следующие операции: а) если ж = (аьа2), у = (/3i,/%), то х + у = (ai +/?i,a2 + /%); б) если 7 € К и ж Е М, то 7# = Gаъа2)- Является ли М линейным пространством? 1.5. Является ли линейным пространством множество всех действительных чисел, если операции сложения ф и умножения 0 на число ввести следующим образом: х©у = ж + у, а©ж = = \a\xi 1.6. Докажите, что множество матриц-столбцов высоты п образует линейное пространство относительно матричных опе- операций сложения и умножения. 1.7. В линейном пространстве V3 заданы три вектора аг = {1;4;3}, а2 = {3;3;2}, а3 = {8;1;3}. Выясните, является ли система этих векторов линейно зависи- зависимой. Бели система линейно зависима, то найдите зависимость между векторами (нулевую нетривиальную линейную комбина- комбинацию этих векторов). 1.8. Пусть в линейным пространстве С задана линейно независимая система из п векторов. При каких условиях можно утверждать, что dim? = п? 1.9. Докажите, что dimT^ = 2, dimV3 = 3.
Вопросы и задачи 53 1.10. Найдите размерность линейного пространства, состо- состоящего из решений системы линейных однородных уравнений [III]. Как связаны между собой понятия: а) базис и фундамен- фундаментальная система решений; б) размерность линейного простран- пространства решений и ранг матрицы системы? 1.11. Векторы c*i, O2, аз, сц линейного пространства С заданы своими координатами в некотором базисе: Является ли система этих векторов линейно зависимой? Дайте ответ, не проводя вычислений. 1.12. Выясните, образуют ли векторы <ц = A, 0, 0, 0), а2 = A, 1, 0, 0), в3 = A, 1, 1,0), а4 = A, 1,1, 1) базис в линейном арифметическом пространстве R4? 1.13. Найдите координаты вектора х в базисе е = (ei e% если известны его координаты (—14 3) в базисе Ь = (Ь\ &2 а базисы связаны соотношениями 1.14. В линейном пространстве две системы векторов Ь = = (bi 62 Ьз) и е = (ei e<i ез) заданы своими координатами в некотором базисе: .68 =
54 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Докажите, что эти системы являются базисами. Найдите: а) матрицу U = Рье перехода от базиса Ь к базису е; б) матрицу Реь обратного перехода от базиса е к базису Ь; в) координаты вектора в2 в обоих базисах; г) координаты вектора х = = —36i — 5&2 + 2Ьз в базисе е. 1.15. Найдите размерность dimMnm(R) линейного про- пространства матриц типа гахп с элементами из Е. 1.16. Является ли матрица матрицей перехода от одного базиса трехмерного линейного пространства к его другому базису? 1.17. Какой вид имеет матрица перехода от старого базиса к новому, если матрица перехода от нового базиса к старому является: а) треугольной; б) симметрической; в) кососимме- трической? 1.18. Может ли в пространстве V3 матрица перехода быть кососимметрической? 1.19. При каких условиях векторы а, Ь, axb в пространстве Vs образуют базис? 1.20. Докажите, что в линейном пространстве Кп[х] мно- многочлены (х — а)*, к = 0, п, а = const, образуют базис. Найти координаты произвольно взятого многочлена р(х) 6 Кп[х] в этом базисе.
2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 2.1. Определение и примеры В любом линейном пространстве С можно выделить такое подмножество векторов, которое относительно операций из С само является линейным пространством. Это можно делать различными способами, и структура таких подмножеств несет важную информацию о самом линейном пространстве ?. Определение 2.1. Подмножество % линейного простран- пространства С называют линейным подпространством, если вы- выполнены следующие два условия: 1) сумма любых двух векторов из % принадлежит %: х,уеН=> х + уеП; 2) произведение любого вектора из % на любое действи- действительное число снова принадлежит Н: х Е И, А Е Ш =$> Хх Е И. Определение 2.1 фактически говорит о том, что линейное подпространство — это любое подмножество данного линей- линейного пространства, замкнутое относительно линейных опе- операций, т.е. применение линейных операций к векторам, при- принадлежащим этому подмножеству, не выводит результат за пределы подмножества. Покажем, что линейное подпростран- подпространство W как самостоятельный объект является линейным про- пространством относительно операций, заданных в объемлющем линейном пространстве ?. В самом деле, эти операции опре- определены для любых элементов множества ?, а значит, и для элементов подмножества %. Определение 2.1 фактически тре- требует, чтобы для элементов из % результат выполнения опера- операций также принадлежал %. Поэтому операции, заданные в С,
56 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА можно рассматривать как операции и на более узком множе- множестве %. Для этих операций на множестве И аксиомы линейного пространства а)-б) и д)-з) выполнены в сцлу того, что они справедливы в С. Кроме того, выполнены й две оставшиеся аксиомы, поскольку, согласно определению 2.1, если х Е Н, то: 1H-ж = 0е%и0 — нулевой вектор в Ч\ 2) (-1)х = -жЕН. В любом линейном пространстве С всегда имеются два ли- линейных подпространства: само линейное пространство С и нулевое подпространство {0}, состоящее из единствен- единственного элемента 0. Эти линейные подпространства называют несобственными, в то время как все остальные линейные подпространства называют собственными. Приведем при- примеры собственных линейных подпространств. Пример 2.1. В линейном пространстве VJ$ свободных век- векторов трехмерного пространства линейное подпространство образуют: а) все векторы, параллельные данной плоскости; б) все векторы, параллельные данной прямой. Это вытекает из следующих соображений. Из определения суммы свободных векторов [III] следует, что два вектора а, & и их сумма а + Ь компланарны (рис. 2.1, а). Поэтому, если а и Ь параллельны данной плоскости, то этой же плоскости будет параллельна и их сумма. Тем самым установлено, что для случая а) выполне- выполнено условие 1) определения 2.1. Если вектор умножить на число, получится вектор, коллинеарный исходному (рис. 2.1,6). Это доказывает выполнение условия 2) определения 2.1. Случай б) обосновывается аналогично. Рис. 2.1 Линейное пространство V3 дает наглядное представление о том, что такое линейное подпространство. Действительно,
2.1. Определение и примеры 57 U Рис. 2.2 фиксируем некоторую точку в пространстве. Тогда различным плоскостям и различным прямым, проходящим через эту точку, будут соответствовать различные линейные подпространства из Уз (рис. 2.2). Не столь очевидно, что в V3 нет других собственных под- подпространств. Если в линейном подпространстве И в ^ нет ненулевых векторов, то Ti — нулевое линейное подпростран- подпространство, являющееся несобствен- несобственным. Если в Ti есть ненулевой вектор, а любые два вектора из К коллинеарны, то все векторы этого линейного подпространства параллельны некоторой пря- прямой, проходящей через фиксированную точку. Следовательно, Ti совпадает с одним из линейных подпространств, описанных в случае б). Если в Ti есть два неколлинеарных вектора, а любые три вектора компланарны, то все векторы такого ли- линейного подпространства параллельны некоторой плоскости, проходящей через фиксированную точку. Это случай а). Пусть в линейном подпространстве Ti существуют три некомпланар- некомпланарных вектора. Тогда они образуют базис в V3. Любой свободный вектор можно представить в виде линейной комбинации этих векторов. Значит, все свободные векторы попадают в линей- линейное подпространство %, и поэтому оно совпадает с V3. В этом случае мы получаем несобственное линейное подпространство. Итак, в V3 все собственные подпространства можно пред- представить в виде плоскостей или прямых, проходящих через фик- фиксированную точку. Пример 2.2. Любое решение однородной системы ли- линейных алгебраических уравнений (СЛАУ) от п переменных можно рассматривать как вектор в линейном арифметическом пространстве Шп. Множество всех таких векторов является
58 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА линейным подпространством вКп. В самом деле, решения од- однородной СЛАУ можно покомпонентно складывать и умножать на действительные числа, т.е. по правилам сложения векторов из Мп. Результат операции снова будет решением однородной СЛАУ (см. [III]). Значит, оба условия определения линейного подпространства выполнены. Уравнение х + у — Ъг = 0 имеет множество решений, кото- которое является линейным подпространством в R3. Но это же уравнение можно рассматривать как уравнение плоскости в не- некоторой прямоугольной системе координат Oxyz. Плоскость проходит через начало координат, а радиус-векторы всех точек плоскости образуют двумерное подпространство в линейном пространстве V3. Множество решений однородной СЛАУ -х+у = 0 также образует линейное подпространство в К3. В то же время эту систему можно рассматривать как общие уравнения прямой в пространстве, заданные в некоторой прямоугольной системе координат Oxyz. Эта прямая проходит через начало координат, а множество радиус-векторов всех ее точек образует одномер- одномерное подпространство в V3. Пример 2.3. В линейном пространстве Мп(Ш) квадрат- квадратных матриц порядка п линейное подпространство образуют: а) все симметрические матрицы; б) все кососимметрические матрицы; в) все верхние (нижние) треугольные матрицы. При сложении таких матриц или умножении на число мы получаем матрицу того же вида. Напротив, подмножество вырожден- вырожденных матриц не является линейным подпространством, так как сумма двух вырожденных матриц может быть невырожденной матрицей: 1 0\ /0 0\ /1 0>
2Л. Определение и примеры 59 Пример 2.4. В линейном пространстве С[0,1] функций, непрерывных на отрезке [0,1], можно выделить следующие ли- линейные подпространства: а) множество функций, непрерывных на отрезке [0,1] и непрерывно дифференцируемых в интервале @,1) (в основе этого утверждения лежат свойства дифферен- дифференцируемых функций: сумма дифференцируемых функций есть дифференцируемая функция, произведение дифференцируемой функции на число есть дифференцируемая функция); б) множе- множество всех многочленов; в) множество 1?п[ж] всех многочленов степени не выше п. Напротив, множество всех монотонных функций, непрерывных на отрезке [0,1], очевидно, является подмножеством С[0,1], но не является линейным подпростран- подпространством, так как сумма двух монотонных функций может и не быть монотонной функцией. # Пусть в линейном пространстве С задана система векторов вь е2> •••? ек- Рассмотрим множество Н всех векторов в ?, которые могут быть представлены линейной комбинацией этих векторов. Это множество является линейным подпростран- подпространством в ?. Действительно, пусть х = ziei +... + хкек, у = у\ег +... + укек. Тогда Хх = (Azi)ei +... + (Ххк)ек е U, где А € IR. Описанное линейное подпространство называют линейной оболочкой системы векторов ei, в2, ..., ек и обозначают span{ei,e2,...,e^}. Примечательно то, что любое собственное линейное под- подпространство можно представить как линейную оболочку не- некоторой системы его векторов (это будет ясно из дальнейшего изложения). В этом состоит универсальный способ описа- описания линейных подпространств. Отметим, что само линейное пространство является линейной оболочкой любого из своих базисов.
60 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА Пример 2.5. Рассмотрим плоскость тг, проходящую че- через три произвольные точки О, A, J3, не лежащие на одной прямой. Тогда линейное подпространство векторов, компла- компланарных плоскости тг, представляет собой линейную оболочку двух свободных векторов, соответствующих геометрическим векторам ОА и СШ (рис. 2.3). Действительно, любой вектор, компланарный векторам ОА и Рис. 2.3 представляется в виде их линейной комбинации [III]. 2.2. Пересечение и сумма линейных подпространств Пусть Н\, %2 — линейные подпространства в линейном пространстве ?. Определение 2.2. Множество Ч\Г\Ч2 называют переев- чением линейных подпространств Н\ и%- На рис. 2.4 видим, что два ли- линейных подпространства, изобра- изображенные плоскостями, в пересече- пересечении дают прямую, также явля- являющуюся представлением некото- некоторого линейного подпространства (см. пример 2.1). Рис. 2.4 Теорема 2.1. Пересечение Н\Г\/Н2 двух линейных под- подпространств Н\ и %2 в линейном пространстве С является линейным подпространством в С. < Проверим, выполняется ли условие 1) определения 2.1. Ес- Если векторы Х\ и Х2 принадлежат Hi П?^2> то каждый из этих векторов принадлежит как Hi, так и %2- Поскольку 1-Li —
2.2. Пересечение и сумма линейных подпространств 61 линейное подпространство, то, согласно определению 2.1, за- заключаем, что вектор Ж1+Ж2, павный сумме векторов этого линейного подпространства, тоже принадлежит Н\. Анало- Аналогично х\ + Х2 € 7^2? так как каждое из слагаемых является элементом линейного подпространства %2- Следовательно, Проверим условие 2) определения 2.1. Выберем произволь- произвольный вектор х Е Н\ П %2* Тогда х G Н\ и жЕ% Так как Н\ является линейным подпространством, то произведение эле- элемента х этого линейного подпространства на произвольное действительное число А принадлежит Н\. Но совершенно ана- аналогично вектор \х принадлежит и %2- Поэтому Хх ? Н\ Г\%2- Итак, оба условия определения 2.1 выполнены. Следователь- Следовательно, Hi Г\%2 является линейным подпространством. > Определение 2.3. Множество Н\ + %2 всех векторов х вида х = х\ + Ж2, где х\ е Ни #2 € ^2, называют суммой линейных подпространств Н\ и 7^2- На рис. 2.5 линейные под- подпространства Н\ и Н2 предста- влены несовпадающими прямы- прямыми, проходящими через фикси- фиксированную точку О. Их сумма представляется плоскостью, со- Рис 2 5 держащей обе прямые. Теорема 2.2. Сумма линейных подпространств данного линейного пространства является линейным подпространством в том же линейном пространстве. < Рассмотрим два вектора v и го из множества Н\+Н2- Согласно определению 2.3, имеют место представления
62 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА где векторы х^ yi принадлежат Ни t = 1,2. Складывая эти равенства, получаем v + w = (xi + yi) + (х2 + у2). Сумма xi +J/1 векторов a?i и yi линейного подпространства Hi принадлежит Hi, Точно так же сумма Х2 + У2 векторов х2 и У2 линейного подпространства Н2 принадлежит Н2. Поэтому вектор v + w принадлежит множеству Hi+H2. Условие 2) определения 2.1 проверяется аналогично. Произ- Произвольный вектор v 6 Hi + ^2 имеет представление v = xi + х2, где xi E Wi, x2 G 7^2- Для любого действительного числа А по- получаем равенства Xv s= Так как вектор Xxi принадлежит %i, а вектор Ая?2 — %2<> то вектор Av является элементом множества Hi +H2. Мы доказали, что множество Hi + H2 замкнуто относи- относительно линейных операций объемлющего линейного простран- пространства и поэтому, согласно определению 2.1, оно является линей- линейным подпространством. > Пример 2,6. Рассмотрим две однородные системы линей- линейных алгебраических уравнений = О, + о,т2х2 +... + атпхп = 0; f Cl2^2 + • • • + CinXn = 0, f C22^2 + - • - + С2пХп = 0, Множества решений этих систем представляют собой линейные подпространства Hi и Н2 линейного арифметического про- пространства Шп. Объединив обе системы в одну, получим новую
2.2. Пересечение и сумма линейных подпространств 63 однородную систему, множеством решений которой будет ли- линейное подпространство Пример 2.7. Рассмотрим две системы векторов ei, ..., ек и> /ъ •••» // в некотором линейном пространстве С. Линейные оболочки этих систем представляют собой линейные подпро- подпространства Н\ =span{ei,...,efc} H?{2 = span{/i,...,/j} в ?. Если мы объединим обе системы в одну, то у новой, объединенной системы линейной оболочкой будет линейное подпространство /Н\+%2- В самом деле, любой вектор хЕ/Н\ + /Н2 разлагается в сумму х = х\ + я?2, где х\ Е Ни x<i € Щ- Векторы Х\ и а?2 пред- представляются в виде линейной комбинации, первый — векторов вь •••* ekt второй — векторов /i, ..., //. Значит, их сум- сумма представляется линейной комбинацией векторов ei, ..., е&, /i> •••» /ь т-е- вектор ж принадлежит span{ei,...,ejt,/i,...,//}. Предположим теперь, что вектор х принадлежит указанной ли- линейной оболочке, т.е. имеет место представление Положив приходим к представлению х = х\ +Ж2, в котором х\ G ж2 G ^2. Значит, ж Е Пример 2.8. Линейное подпространство из примера 2.5, являющееся линейной оболоч- оболочкой span{OA, O5}, можно представить как сумму под- подпространств Н\ = span{ Ол} и% = span{0^} (рис. 2.6). Рис. 2.6
64 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 2.3. Прямая сумма линейных подпространств Определение 2.4. Сумму Hi + %2 двух линейных подпро- подпространств Hi ъ %2 данного линейного пространства называют прямой суммой, если для каждого вектора х из Hi + Н2 его представление единственно. Прямую сумму линейных подпространств Hi и %2 обозна- обозначают Hi ©%2- Прямая сумма как частный случай суммы линейных подпространств по теореме 2.2 является линейным подпространством. Пример 2.9. Сумма линейных подпространств Wi и Н2 в примере 2.8 является прямой. Действительно, представле- представление произвольного вектора Ом в виде Ом = О Mi + ОМ2, где О Mi € Ни ОМ2 € %2, равносильно представлению этого векто- вектора в виде линейной комбинации векторов ОА и On, так как, согласно определению подпространств Hi и %2> ОМ[ = XiOA, ОМ2 = Х2ОВ для некоторых чисел Ai и А2. Но так как векторы ОА и On линейно независимы, такое представление единст- единственно. Теорема 2.3. Для того чтобы сумма Hi + H2 линейных подпространств Hi и Н2 была прямой, необходимо и доста- достаточно, чтобы пересечение этих линейных подпространств было нулевым подпространством, т.е. Hi ПН2 = {0}. М Необходимость. Пусть сумма Hi + H2 является прямой суммой. Выберем любой вектор у G Hi П Н2- Тогда у € Hi + H2 и для него справедливы два представления B.1)
2.3. Прямая сумма линейных подпространств 65 в каждом из которых левое слагаемое является элементом линейного подпространства 1i\, а правое — Н2. Так как %\ + *Н2 является прямой суммой, то оба представления B.1) совпадают, т.е. у = 0. Значит, Н\ ПН2 содержит единственный вектор 0. Достаточность. Пусть Hi С) У.2 = {0}- Рассмотрим произвольный вектор х ? Н\ + %2 и докажем, что любые два его представления х2еП2; B.2) х'2еН2, B.3) совпадают совпадают. Вычтем из равенства B.2) равенство B.3). В результате получим (х\ + х2) — {х[ + х'2) = 0, откуда Х\ — Xi = Х2 — Но тогда, с одной стороны, вектор у = х\ — х[ принадлежит линейному подпространству Ц\, ас другой — он, согласно представлению y = xf2 — X2, принадлежит и другому линейному подпространству ^2- Следовательно, у G %\ Г\Н2^ а так как Н\ПУН2 = {0}, то и у = 0. Поэтому х\ — х[ = Q и х2 - х2 = 0, т.е. представления B.2) и B.3) совпадают. > Пример 2.10. В примере 2.8 линейные подпространства Tii и %2 образуют прямую сумму (см. пример 2.9). Это можно показать следующим образом. Так как прямые пересекают- пересекаются в единственной точке, то единственный вектор, коллине- арный одновременно обеим прямым, изображающим подпро- подпространства, — это нулевой вектор. Значит, ^! П % = {0}. Согласно теореме 2.3, эти подпространства образуют прямую сумму.
66 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 2.4. Размерность линейного подпространства > "X Линейное подпространство является линейным пространт ством относительно операций объемлющего линейного про- пространства и поэтому имеет размерность и базис. Теорема 2.4. Если И — линейное подпространство линей- линейного пространства ?, то dim?/ < dim?. Если к тому же И Ф ?, то dim ft < dim?. А Любой базис линейного подпространства ft, рассматриваемо- рассматриваемого как линейное пространство, является линейно независимой системой векторов в объемлющем линейном пространстве ?. Если этот базис из ft является базисом ив?, то, согласно те- теореме 1.5, diml-L = dim? и ясно, что в этом случае ft = ?, так как у нирс есть общий базис. Если базис из ft не является ба- базисом объемлющего линейного пространства ?, то существует такой вектор х Е ?, который не является линейной комбинацией векторов этого базиса. В этом случае, конечно, линейное под- подпространство ft не может совпадать с С. Добавив вектор х к векторам базиса, получим линейно независимую систему векто- векторов (см. свойство 4°, с. 27). Это значит, что в С найдено больше линейно независимых векторов, чем dim'H. Следовательно, со- согласно определению 1.5 размерности линейного пространства, dim ft < dim?. > Замечание 2.1. Любой базис собственного подпростран- подпространства И линейного пространства С можно расширить, добавив вектор так, что расширенная система векторов останется ли- линейно независимой. Если расширенная система опять не являет- является базисом в ?, процедуру расширения можно повторить. Для конечномерного линейного пространства очередное расшир*е- ние через какое-то количество шагов станет невозможным, так как количество векторов в линейно независимой систе- системе не может превышать размерности линейного пространства. Максимально расширенная система векторов будет линейно не- независимой, а любой вектор будет представляться ее линейной
2.4. Размерность линейного подпространства 67 комбинацией, т.е. эта система векторов будет базисом в С. Со- Согласно теореме 1.5, количество векторов в этой системе будет равно размерности линейного пространства ?. Приведенное рассуждение показывает, что любой базис соб- собственного линейного подпространства может быть расширен до базиса объемлющего линейного пространства добавлением новых векторов. Например, рассмотрим линейное простран- пространство Vz с ортонормированным базисом г, j, к. Линейное под- подпространство И = span{i, j} имеет размерность 2, так как его базисом является пара векторов г, j. Действительно, они ли- линейно независимы, а любой вектор из И представляется в виде линейной комбинации г и j согласно определению этого под- подпространства. Этот базис можно расширить до базиса в V3, добавив один вектор. В качестве этого, дополнительного век- вектора можно взять любой вида х = oti + f3j + jk с 7 Ф 0. Теорема 2.5. Если %\ и %2 — линейные подпространства линейного пространства ?, то < В линейном подпространстве Н\ П %2 выберем некоторый базис е =f(ei ... еш). Множество %\Г\%2 является линейным подпространством не только в ?, но и в его части Н\. Поэтому выбранный базис можно дополнить некоторой системой векто- векторов / = (/i ... //) до базиса (е /) в линейном подпространстве %\ш Точно так же систему е можно дополнить некоторым на- набором векторов g = (g\ ... gk) до базиса (е д) в %2- Докажем, что система векторов (е / flO = (ei ••• em /1 ... // дх ... дк) является базисом в линейном пространстве Во-первых, установим, что указанная система линейно не- независима. Пусть имеет место равенство = 0. B.4)
682. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА Тогда для вектора У = выполнено равенство У = — cxiei — ... A/i + ...+А. -omem-7iff Л l-----7fefffe- i B.5) B.6) Согласно равенству B.5) заключаем, что у Е Hi> а согласно B.6) делаем вывод, что у е У,2- Следовательно, у € Hi П %2 и потому имеет единственное разложение y = <*iei + ... + <$mem B.7) по базису е линейного пространства Hi ПН2- Разложение B.7) можно рассматривать как разложение по базису (е д) в линейном подпространстве %2- Но тогда раз- разложения B.6) и B.7) совпадают как разложения одного и того же вектора в базисе (е д). Следовательно, 7j = 0, j = 1, Л, а все коэффициенты 6{ отличаются от соответствующих коэф- коэффициентов щ лишь знаком. С другой стороны, представление B.5) вектора у и представление B.7) того же вектора явля- являются разложениями одного вектора в базисе (е /) линейного подпространства Н\ и потому совпадают. Их совпадение озна- означает, что Pi = ... = Pi = 0 и 8\ = ... = &т = 0. Тогда и а\ = = ... = ат = 0. Таким образом, все коэффициенты произвольно взятой линейной комбинации B.4), равной нулевому вектору, оказались равными нулю. Значит, система векторов (е / д) линейно независима. В-вторых, любой вектор у € Hi + H2 есть линейная комбина- комбинация системы векторов {е f д). Действительно, такой вектор представим в виде у = yi + j/2> где yi ? Н\, J/2 6 ^2- Вектор t/i представляется линейной комбинацией системы векторов (е /), а у2 — линейной комбинацией системы векторов (е д). Поэтому у разлагается по системе векторов (е / д). Итак, система векторов (е / д) линейно независима и лю- любой вектор из Hi + H2 разлагается по этой системе. Следова- Следовательно, (е / д) — базис в Hi +H&. Нам остается подсчитать
2.5. Ранг системы векторов 69 размерности: Линейное подпространство н2 ПхПП2 Ux+Ui базис (в/) (eg) е (efg) размерность тп + 1 m + k m m + l + k Таким образом, получаем утверждение теоремы. > Следствие. dim('Hi © Ч2) = di 2.5. Ранг системы векторов Определение 2.5. Рангом системы векторов в линей- линейном пространстве называют размерность линейной оболочки этой системы векторов. Теорема 2.6. Ранг системы векторов а = (а\ ... а*) линейного пространства С равен: а) максимальному количеству линейно независимых векто- векторов в системе а; б) рангу матрицы, составленной по столбцам из координат векторов oi, ..., а* в каком-либо базисе линейного простран- пространства С. < Пусть g — некоторый базис в ?. Составим по столбцам матрицу А из координат в базисе g векторов a*, i = 1, к. Ли- Линейные операции над векторами щ соответствуют таким же линейным операциям над столбцами их координат. Поэтому, согласно следствию 1.1, векторы линейно независимы тогда и только тогда, когда столбцы их координат линейно независи- независимы. По теореме о базисном миноре [III] ранг матрицы А равен максимальному количеству ее линейно независимых столбцов. Это совпадает с максимальным количеством линейно независи- независимых векторов в системе а. Следовательно, утверждения а) и б) теоремы эквивалентны.
70 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА Выберем в матрице А какой-либо базисный минор и зафикт сируем столбцы этого минора (базисные столбцы). Соответ? ствующие им векторы будем называть базисными. По теоремр о базисном миноре, во-первых, базисные столбцы линейно неза- независимы и поэтому базисные векторы образуют линейно незавц: симую систему, а во-вторых, все остальные столбцы матрицы являются линейными комбинациями базисных и поэтому неба- небазисные векторы системы выражаются через базисные. Сле- Следовательно, любая линейная комбинация векторов системы а сводится к линейной комбинации системы базисных векторов, т.е. любой вектор линейной оболочки системы векторов а вы- выражается через базисные векторы. Значит, базисные векторы образуют базис линейной оболочки. Количество базисных век- векторов, с одной стороны, равно количеству базисных столбцов, т.е. рангу матрицы Л, а с другой — совпадает с размерностью линейной оболочки, т.е. с рангом системы векторов а. > Замечание 2,2. Как следует из приведенного доказатель- доказательства, столбцы любого базисного минора матрицы А отвечают набору векторов системы а, являющемуся базисом в span{a} — линейном подпространстве, порожденном этой системой векто- векторов. Пример 2.11. Пусть даны векторы ai, a2, аз, а>\ в че- четырехмерном линейном пространстве ?, имеющие в некото- некотором базисе столбцы координат а\ = A 2 0 6) , п2 = B 0 3 1) , аз = C 2 3 7) , а* = G 2 9 9) . Соответствующая матрица А имеет вид /1 2 0 2 0 3 1 3 2 3 7 7^ 2 9 9> Вычислив ранг матрицы, убеждаемся, что он равен 2. Таким образом, ранг системы векторов равен 2. Легко проверить, что любой минор второго порядка является базисным. Поэто- Поэтому базисом линейной оболочки этой системы векторов будут
2.6. Линейные оболочки и системы уравнений 71_ любые два вектора системы. Например, базисом является пара векторов oi, аг. По этому базису можно разложить, напри- йер, остальные векторы системы. Чтобы найти разложение вектора аз по базису, достаточно решить систему линейных алгебраических уравнений которая в координатной форме имеет вид 2a?i = 2, Зх2 = 3, - х-> = 7. Из четырех уравнений можно оставить любые два. ЙСпользуя второе и третье уравнения, находим х\ = 1, x<i = 1 и, следо- следовательно, аз = о,\ + а,2- Аналогично находим и разложение вектора а±\ сц = а,\ + 2.6. Линейные оболочки и системы уравнений Пусть С — п-мерное линейное пространство, в котором фиксирован некоторый базис е = (ei ... еп) и выбраны век- векторы ai, ..., a*, Ь. Запишем разложение выбранных векторов по базису е: а3 = ecij, j = 1, fc, 6 = еб, где aj; = (ay ... anj)T, j = Tjk, 6 = (&i ... bnf — столбцы координат соответствующих векторов. Пусть А — матрица типа nxfc, составленная из координатных столбцов векторов oi, ..., а*;, а {А\Ь) — матрица, полученная из матрицы А добавлением справа еще одного столбца Ь. Для вектора Ь возможны два случая: 1) вектор Ь принадлежит линейной оболочке span{ai,..., a/ь}; 2) вектор Ь не принадлежит span{ai,...,
72 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА В первом случае добавление к системе векторов ai, ..., ajc вектора b не приводит к расширению линейной оболочки системы и, следовательно, dimspan{ai,..., a*} = dimspan{ai,..., a*, 6}. По теореме 2.6 заключаем, что RgA = Во втором случае, наоборот, добавление вектора Ь к системе векторов oi, ..., а* приводит к расширению линейной оболоч- оболочки, причем по теореме 2.5 dimspan{ai,...,afc,6} = dimspan{ai,...,afc} + 1, так как span{ai,...,aA;,b}=span{ab...,aA;}©span{b}. Следовательно, Rg(A | Ъ) = Rg A + 1. Выясним теперь, что означают эти два случая „на коорди- координатном уровне". В первом случае условие Ь G span{ai,...,afc} означает существование разложения х\а\ +... + Xka>k = Ь B.8) с некоторыми действительными коэффициентами #i, ..., х^. Записывая это векторное равенство в координатной форме, по- получаем систему линейных алгебраических уравнений (СЛАУ) B.9) относительно переменных х = (х\ ... хь) , которая в матрич- матричной форме имеет вид Ах = 6. Существование разложения B.8) означает, что полученная система имеет решение. Во втором случае представление B.8) невозможно, т.е. система B.9) не имеет решений.
2.6. Линейные оболочки и системы уравнений 73 Итак, следующие четыре утверждения эквивалентны между собой: - 6espan{ai,...,a*}; - dimspan{ai,...,afc,b} = dimspan{ab...,afc}; -Rg(A\b) = RgA; - система Ax = Ьизп линейных алгебраических уравнений относительно к неизвестных совместна. Эквивалентность последних двух утверждений составляет содержание теоремы Кронекера — Капелли [III], которая верна для произвольных СЛАУ. Отметим, что любая система из п ли- линейных алгебраических уравнений относительно к неизвестных может быть получена как результат проведенных рассуждений. Для этого достаточно в качестве векторов ai, ..., a^ рассмо- рассмотреть столбцы коэффициентов при неизвестных, а в качестве вектора 6 — столбец свободных членов. Все эти столбцы могут рассматриваться как n-мерные векторы в линейном арифмети- арифметическом пространстве Шп. Таким образом, теорему Кронекера — Капелли можно пере- переформулировать следующим образом: для того чтобы линейная оболочка системы векторов аи •••> <*>k совпадала с линейной оболочкой расширенной системы аи •••> &ь Ь> необходимо и достаточно, чтобы были равны размерности этих линейных оболочек. Предположим, что квадратная СЛАУ Ах = b имеет решение при любом столбце b правых частей. Рассматривая столбцы матрицы А и столбец b как элементы ai, ..., an, b n-мерного линейного арифметического пространства и записывая СЛАУ в векторной форме х\а\ + х2а2 + ... + хпап = Ь, заключаем, что линейная оболочка системы векторов oi, ..., ап совпадает со всем линейным пространством Еп. Из этого следует, что ранг этой системы векторов равен размерности линейного пространства п, а так как в системе ровно п
74 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА векторов, то она, согласно теореме 2.6, линейно независима. Другими словами, столбцы матрицы А линейно независимы, а матрица А является невырожденной (см. теорему о базисном миноре [Ш]). Таким образом, если квадратная СЛАУ Ах = b имеет реше- решение при любой правой части, то матрица А системы невырождет на, а решение системы при любой правой части единственно. 2.7. Прямое дополнение Определение 2.6. Если линейные подпространства Hi и %2 в линейном пространстве С образуют прямую сумму, причем /Н\®Н2 = С, то говорят, что Hi является прямым дополнением для %• Если линейное подпространство %% является прямым допол- дополнением для линейного подпространства Hi, то верно и обрат- обратное: Н\ является прямым дополнением для %2- Оказывается, что любое линейное подпространство имеет прямое дополне- дополнение. Теорема 2.7. Любое линейное подпространство Н в ли- линейном пространстве С имеет прямое дополнение. -4 Если линейное подпространство Н совпадает со всем ли- линейным пространством ?, то в качестве его прямого допол- дополнения следует взять другое несобственное подпространство: Hi = {0}. Точно так же прямым дополнением к нулевому подпространству {0} является само линейное пространство С. Опуская эти два тривиальных случая, полагаем, что линейное подпространство И является собственным. Выберем в Н какой-либо базис е = (ei ... е*) и дополним его (см. замечание 2.1) системой векторов f = (/i ... fm) до базиса (е /) в С. Положим Hi = span{/}. Тогда H + Hi = ?, так как сумма H + Hi содержит все векторы системы (е /),
Вопросы и задачи 75 являющейся базисом в ?, а значит, и любой другой вектор линейного пространства. Остается доказать, что сумма Н + Н\ является прямой. Выберем произвольный вектор у ЕНПНх. Тогда, с одной стороны, у = а\В\ + ... + afcefc, так как у принадлежит линей- линейному подпространству W, ас другой стороны, у = C\f\ +... + + Pmfm, так как у принадлежит линейному подпространству Hi. Эти две линейные комбинации есть два разложения векто- вектора в базисе (е /) линейного пространства С и, следовательно, должны совпадать: или Система векторов (е /) линейно независима, так как является базисом. Поэтому из последнего равенства векторов следует, что в нем все коэффициенты нулевые. Значит, вектор у является нулевым, а так как он выбирался произвольно, то HnHi = {0}. Поэтому линейные подпространства Н и Н\ образуют прямую сумму (см. теорему 2.3). > Вопросы и задачи 2.1. Может ли линейное подпространство состоять из: а) двух элементов; б) одного элемента; г) 100 элементов? 2.2. Может ли линейное подпространство конечномерного линейного пространства быть бесконечномерным? 2.3. Докажите, что бесконечномерное линейное простран- пространство содержит собственные бесконечномерные линейные под- подпространства. 2.4. По аналогии с суммой двух линейных подпространств определите сумму конечного числа линейных подпространств.
76 2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА 2.5. Пусть для линейных подпространств %\ и %2 не* которого линейного пространства С выполняется равенство dim^i + H2) = dim Hi + dim %2- Что можно утверждать о ли- линейном пространстве: а) И\С\Н2\ б) Н\ + %2? 2.6. Найдите максимальное число линейно независимых векторов в системе векторов, заданных своими координатами / 2\ 3 -1 V ч > 1 2 ^ о/ /0\ 0 1 W /1\ 4 1 /2\ 3 0 в некотором базисе линейного пространства С размерности 4. 2.7. Докажите, что линейным подпространством является множество всех векторов n-мерного линейного арифметическо- арифметического пространства, удовлетворяющих условию: а) первые две координаты равны между собой; б) первая координата равна нулю; в) координаты удовлетворяют уравнению х\ + 2хг + 22а?з + Найдите базис и размерность этого линейного подпростран- подпространства. 2.8. Найдите размерность и базис линейной оболочки сле- следующих векторов из R4: О1 = A, -1, 1, 1), а2 = B, 3, 1, 2), а3 = D, 1, 3, 4). 2.9. В линейном пространстве ?, dim? = 4, две системы векторов е = (ei ег ез) и / = (/i /2 /3) заданы своими коор- координатами в некотором базисе: 2 3 Ч- -1
Вопросы я задачи 77 /2 = 2\ -3 5 /з = 0\ 2 -1 \ 2/ Какова размерность пересечения линейных подпространств span{e} и span{/}? 2.10. Найдите размерность и базис линейного подпростран- подпространства в R4, состоящего из решений системы = 0, = О, 7^1 + 9^2 ~ Зхз + 5^4 = О, 2.11. Докажите, что в линейном пространстве квадратных матриц порядка тг линейные подпространства симметрических и кососимметрических матриц можно рассматривать как пря- прямые дополнения друг друга. 2.12. В линейном пространстве квадратных матриц по- порядка п найдите размерность и базис пересечения линейных подпространств верхних треугольных и нижних треугольных матриц. 2.13. Докажите, что множество трехдиагональных матриц порядка п является линейным пространством относительно линейных матричных операций. Найти размерность и базис этого линейного пространства. 2Л4. В шестимерном линейном пространстве С даны два линейных подпространства Н\ и %2 размерностей 3 и 4 соот- соответственно. Что можно утверждать о размерности пересечения этих линейных подпространств? При выполнении какого усло- условия справедливо равенство Н\ + Щ = С? Может ли сумма У>\ + ^2 быть прямой? 2.15. Сколько прямых дополнений имеет двумерное линей- линейное подцространство в трехмерном линейном пространстве?
3. ЕВКЛИДОВЫ ПРОСТРАНСТВА 3.1. Определение евклидова пространства В линейном пространстве свободных векторов V3 кроме линейных операций рассматривались и другие. Были введены две операции умножения векторов (скалярное и векторное), для вектора использовалась такая естественная характеристика, как длина (модуль). Взаимное расположение векторов можно было оценивать с помощью угла между ними [III]. Понятие скалярного произведения вводилось исходя из гео- геометрических свойств свободных векторов (длины и угла меж- между векторами). В произвольном линейном пространстве этих свойств пока нет, и поэтому мы не можем ввести скалярное про- произведение аналогичным способом. Однако такое произведение можно определить исходя из алгебраических свойств, которые были установлены для пространства V3. Определение 3.1. Линейное пространство ? называют евклидовым пространством, если в этом пространстве за- задано скалярное умножение, т.е. закон или правило, согласно которому каждой паре векторов ж, у € ? поставлено в соот- соответствие действительное число (а?, у), называемое скалярным произведением. При этом выполняются следующие аксиомы скалярного умножения: а) (ю,у) = (у,ж); б) (ж + у, *) = («,*) +(у,*); в) (Ах, у) = А (ж, у), A6R; г) (ж, ж) > 0, причем (ж, х) = 0 лишь в случае, когда х = 0.
\ 3.1. Определение евклидова пространства 79 \ Скалярное произведение часто обозначают так же, как и произведение чисел, т.е. вместо (ж, у) пишут ху. Скалярное произведение вектора на себя называют скалярным квадра- квадратом (по аналогии с квадратом числа). (Пример 3.1. В линейном пространстве V$ было введено скалярное умножение согласно правилу (x,y) = \x\-\y\cos{x?y), где ж~У — угол между векторами х и у, а |ж|, |у| — их длины. Это умножение удовлетворяет приведенным аксиомам скаляр- скалярного умножения [III] и, следовательно, полностью согласуется с определением 3.1. Таким образом, линейное пространство V3 относительно указанной операции является евклидовым про- пространством. ,.м Пример 3.2. В линейном арифметическом пространстве Rn формула (ж, у) = х\у\ + ... + хпуп вводит скалярное умноже- умножение, поскольку выполняются аксиомы скалярного умножения. Указанное скалярное умножение векторов из Rn иногда назы- называют стандартным, а само Rn — евклидовым арифмети- арифметическим пространством. Пример 3.3. В произвольном п-мерном линейном про- пространстве С всегда можно ввести скалярное произведение, причем различными способами. Выберем в этом простран- пространстве некоторый базис ei, ..., еп. Для произвольных векторов х = a;iei + ... + хпеп и у = у\е\ + ... + упеп положим Нетрудно убедиться, что аксиомы скалярного умножения вы- выполняются, т.е. n-мерное линейное пространство становится евклидовым. Отметим, что разным базисам будут соответство- соответствовать, вообще говоря, разные операции скалярного умножения. Задание скалярного произведения через координаты век- векторов в некотором базисе можно рассматривать как обобще- обобщение стандартного скалярного произведения в Rn: компоненты
80 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА х\, ..., хп вектора (х\, ..., хп) Е Шп являются координатами этого вектора относительно стандартного базиса в линейном арифметическом пространстве. Пример 3.4. Линейное пространство С[0,1] всех функций, непрерывных на отрезке [0,1], тоже становится евклидовым, если в нем ввести скалярное умножение 1 ,g) = Jf(x)g(x)dx. о Убедимся, используя свойства определенного интеграла [VI], что эта операция — действительно скалярное умножение. Аксиома а): 1 1 (/, 9) = Jf(x)g(x)dx = Jg(x)f(x)dx = (g, /). о о Аксиома б): 1 о 1 1 = J fi{x)g(x)dx + jf2(x)g(x)dx = (Д, g) + (/2, g). о о Аксиома в): l l о Аксиома г): l (/, /) = ff(x)f(x)dx = Jf2(x)dx > 0.
3.1. Определение евклидова пространства свойств непрерывных функций следует, что последнее не- неравенство превращается в равенство только в случае, когда = 0. # Непосредственно из аксиом скалярного умножения следует ряд его простейших свойств. Далее ж, у, z — произвольные векторы евклидова пространства, а А — действительное число. Свойство 3.1. (ж, Ау) = А (ж, у). А Это свойство аналогично аксиоме в) скалярного умножения и вытекает из равенств (ж, Ау) = (Ау, ж) = А (у, ж) = А (ж, у), которые выполнены в силу этой аксиомы и коммутативности скалярного умножения (аксиома а)). > Свойство 3.2. (ж, у + z) = (ж, у) + (ж, z). Л Это свойство аналогично аксиоме б) и следует из равенств (ж, у + z) = (у + г, ж) = (у, ж) + (z, ж) = (ж, у) + (ж, z), которые выполнены в силу этой аксиомы и коммутативности скалярного умножения. > Свойство 3.3. (ж, 0) = 0. < Утверждение следует из свойства 3.1: (ж,0) = (ж,0-0)=0(ж,0)=0. > G71 \ m ? otkXk, У) = Е ак (хк, у), где ак G R, к=г ' к=\ к = 1, т. < Утверждение является обобщением аксиом б) и в) и выражает собой многократное применение этих аксиом. Доказательство базируется на методе математической индукции, который проводится по количеству т слагаемых в формуле. При
82 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА га = 1 формула совпадает с аксиомой в) скалярного умножен^ Пусть формула верна для некоторого значения т. Тогда m+l m аксиома б) предположение w математической индукции = аксиома в) к=1 к=1 т ак {хк, у) + am+i (жт+1, у) = к=1 т+1 Свойство 3.5. Бели векторы ж и у евклидова пространства 6 таковы, что для любого z E € выполнено равенство (ж, z) = = (у, z), то эти векторы совпадают: х = у. ^ Это свойство не является достаточно очевидным и интуитив- интуитивно понятным, но играет важную роль в некоторых доказатель- доказательствах. Чтобы доказать это свойство, преобразуем равенство (ж, z) = (у, z) в форму (ж — у, z) = 0, воспользовавшись аксио- аксиомой б). Полученное равенство верно для любого вектора z, з частности, оно верно для вектора z = ж — у: (ж — у, ж — у) = 0. Последнее же равенство, согласно аксиоме г), может выпол- выполняться только в случае, когда ж — у = 0. > 3.2. Неравенство Коши — Буняковского Теорема 3.1. Для любых векторов х} у евклидова про- пространства ? справедливо неравенство Коши — Буняков- Буняковского (ж,уJ ^ (ж,ж)(у,у). C.1)
3.2. Неравенство Коши — Буняковского 83 ^и ж = 0 обе части неравенства C.1) равны нулю согласно свойству 3.3, значит, неравенство выполняется. Отбрасывая этот очевидный случай, будем считать, что ж^О. Для любого действительного числа Л, в силу аксиомы г), выполняется неравенство (Аж-у,Аж-у)>0. C.2) Преобразуем левую часть неравенства, используя аксиомы и свойства скалярного умножения: {Хх - у, Хх - у) = А (ж, Хх - у) - (у, Хх - у) = = А2(ж,ж)-2А(ж,у) + (у,у). Мы получили квадратный трехчлен относительно параме- параметра А (коэффициент (ж, ж) при X2 согласно аксиоме г) ненуле- ненулевой, так как ж ф 0), неотрицательный при всех действительных значениях параметра. Следовательно, его дискриминант равен нулю или отрицательный, т.е. (ж, уJ - (ж, ж) (у, у) < 0. > Пример 3.5. Доказательство неравенства Коши — Бу- Буняковского выглядит достаточно просто. Тем не менее это неравенство очень полезное. Применяя его в конкретных ев- евклидовых пространствах, мы получаем некоторые хорошо из- известные в анализе и алгебре неравенства. В случае линейного арифметического пространства Шп не- неравенство Коши — Буняковского трансформируется в нера- неравенство Коши: В евклидовом пространстве С[0,1], скалярное произведе- произведение в котором выражается определенным интегралом (см. при- пример 3.4), неравенство Коши — Буняковского превращается в
84 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА неравенство Бунлковского (называемое также неравен-' ством Шварца): 2 1 1 f{x)g(x)<b) ^ j f2{x)dx j g2{x)dx. 3.3. Нормированные пространства В линейном пространстве обобщением понятия длины сво- свободного вектора является норма. Длину вектора в линейном пространстве V% или V<i можно рассматривать как функцию, определенную на множестве Vz (соответственно V^)? которая каждому вектору ставит в соответствие число — его длину. Эта функция обладает некоторыми характерными свойства- свойствами [III], которые и служат основой для определения нормы в линейном пространстве. Норму вектора в линейном простран- пространстве иногда называют длиной, имея в виду связь с аналогичным термином векторной алгебры. Определение 3.2. Функцию, заданную на линейном про- пространстве ?, которая каждому вектору х ? С ставит в соответ- соответствие действительное число \\x\\, называют нормой, если она удовлетворяет следующим аксиомам нормы: а) ||ж|| ^ 0, причем равенство ||ж|| = 0 возможно только при х = О" в) ||х + у|| ^ ||#|| + 1М1 (неравенство треугольника). Определение 3.3. Линейное пространство, в котором задана норма, называют нормированным пространством. Евклидовы пространства и нормированные пространства представляют собой примеры линейных пространств с допол- дополнительными структурами: скалярным умножением и нормой соответственно. Эти два понятия совершенно различны, одна- однако, как утверждает следующая теорема, исходя из скалярного
3.3. Нормированные пространства 85 умножения в евклидовом пространстве можно задать норму и тем самым превратить евклидово пространство в нормирован- нормированное. Теорема 3.2. Всякое скалярное умножение в евклидовом пространстве определяет норму согласно формуле \\x\\ = y/fc*j. C.3) < Отметим, что, согласно аксиоме г) скалярного умножения, (х, х) ) 0 и, следовательно, функция, заданная соотношением C.3), определена для всех векторов х евклидова пространства. Проверим выполнение аксиом нормы. Аксиома а) нормы немед- немедленно следует из аксиомы г) скалярного умножения (определе- (определение 3.1). Аксиома б) нормы вытекает из аксиомы в) скалярного умножения и свойства 3.1: || Ах|| = у/(Хх,\х) = лД2(*,х) = л/аУ^У = I А| И • Остается проверить аксиому в) нормы, для чего мы вос- воспользуемся неравенством Коши — Бунлковского C.1), которое можно записать в виде (х, у) < у/(х,х)у/{у,у) или, с учетом C.3), (*,уК1М11|у||. Используя это неравенство, получаем ^ (х, х) + 2 ||х|| ||У|| + (у, у) = (||х|| + ||у||J. > Введение нормы по формуле C.3) опирается только на об- общие свойства скалярного умножения, вытекающие из его ак- аксиом, и не связано со спецификой конкретного линейного про-
86 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА странства. Поэтому такую норму в евклидовом пространстве называют евклидовой или сферической нормой. Когда го- говорят, не уточняя, о норме в евклидовом пространстве, обычно имеют в виду именно эту норму. Вовсе не обязательно, чтобы в евклидовом пространстве норма вводилась через скалярное произведение. Рассмотрим следующие примеры, показывающие другие часто используе- используемые нормы, не связанные с каким-либо скалярным произведе- произведением. Пример 3.6. В линейном арифметическом пространстве W1 нормой является функция Ц-)^ вида (| • | в правой части обозначает модуль действительного числа). Легко убедиться, что аксиома а) нормы выполнена, так как величина \х\\ + ... + \хп\ всегда неотрицательна, причем она равна нулю тогда и только тогда, когда все компоненты Х{ арифметического вектора равны нулю. Так же просто убедиться в верности аксиомы б) нормы. Для проверки неравенства треугольника (аксиома в) нормы) выберем произвольные два вектора х = (a?i, ..., хп) и у = = (уь ...,уп) из Rn. Тогда Приведенную норму называют 1\-нормой или октаэдри- ческой нормой. Пример 3.7. Функция
3.3. Нормированные пространства 87 заданная на векторах х = (х\, ..., хп)вШп, также является нор- нормой в W1. Эту норму называют 1^ -нормой или кубической Нормой. Как и в предыдущем примере проверка аксиом а) и б) нормы очевидна. Проверим неравенство треугольника для произвольных векторов х = (#i, ..., хп) и у = (yi, ..., уп): ||Ж -Ь г/lloo = . # Нормы ||ж||, ЦжЦ^, \\х\\х одного и того же вектора х связаны неравенствами Нт»П < ПтII <Г IItII IFIloo ^ 11Х11 ^ ll^lll ' которые непосредственно вытекают из определений этих норм. Пример 3.8, Множество S тех векторов х нормированного пространства, которые удовлетворяют равенству ||а?|| = 1 (еди- (единичных векторов), называют единичной сферой. Мно- Множество 5 зависит от линейного пространства и однозначно определяет рассматриваемую в нем норму. На рис. 3.1 изо- изображен вид единичной сферы для различных норм двумерного линейного пространства (конкретно линейного пространства радиус-векторов точек плоскости): евклидовой (рис. ЗЛ, а), ок- таэдрической (рис. 3.1,6) и кубической (рис. 3.1, в). В случае трехмерного линейного пространства (линейного пространства радиус-векторов) единичные сферы указанных норм изображе- изображены на рис. 3.2. Мы видим, что это сфера (рис. 3.2, а), октаэдр (рис. 3.2, 6) и куб (рис. 3.2, в). Вид единичной сферы для этих норм и послужил источником для их названий.
88 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА х2 x3 3.4. Угол между векторами Понятие угла между свободными векторами в простран- пространствах V2 и Vs обобщается на любое евклидово пространство. Однако если в пространствах свободных векторов определение скалярного произведения базировалось на угле между векто- векторами, то в произвольном евклидовом пространстве наоборот, аксиоматически заданное скалярное произведение позволяет определить угол. Определение 3.4. Углом tp между ненулевыми векто- векторами х и у в евклидовом пространстве ? называют значение ^р на отрезке от 0 до тг, определяемое равенством , у) (ж, у) COS (fi = C.4)
3.5. Ортогональные системы векторов 89 Согласно неравенству Коти — Буняковского C.1) правая часть в C.4) по модулю не превосходит 1 и потому является косинусом некоторого действительного числа. Следовательно, угол (р определен корректно для любой пары ненулевых векто- векторов. Равенство C.4) не имеет смысла, если один из векторов нулевой. В этом случае угол между векторами не определен, и мы будем приписывать ему то значение, которое наиболее удобно в конкретной ситуации (то же соглашение действует и в пространствах свободных векторов, [III]). Пример 3.9. В R4 со стандартным скалярным умноже- умножением угол (р между векторами х = A, 0, 1, 0) и у = A, 1, 0, 0) равен 7г/3, поскольку в соответствии с C.4) Ы + 0-1 + 1-0 + 0-0 1 COS(Z? = — = -. л/12 + О2 +12 + 0V12 + 12 +О2 + О2 2 Аналогично в евклидовом пространстве С[0,1] (см. пример 3.4) угол <р между функциями f(x) = 2 и д(х) = 2х — 1 равен тг/2, так как 1 1 (/,д) = / f(x)g(x)dx = 2Bя- 1)dx = 2(x2 -a:) =0 о о и в соответствии с C.4) cosy? = 0. 3.5. Ортогональные системы векторов Определение 3.5. Два вектора в евклидовом простран- пространстве называют ортогональнглми, если их скалярное произ- произведение равно нулю. Ортогональность векторов х и у будем обозначать так: х _L у. Отметим, что, согласно свойству 3.3 скалярного умно- умножения, нулевой вектор ортогонален любому другому.
90 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Евклидово пространство — это, согласно определению 3.1j частный случай линейного пространства, и поэтому можно го- говорить о его линейных подпространствах в смысле определений 2.1. Каждое из таких линейных подпространств является ев- евклидовым пространством относительно скалярного умножения, заданного в объемлющем евклидовом пространстве. Говорят, что вектор ж в евклидовом пространстве ? орто- ортогонален подпространству Н, и обозначают ж 1_ %, если он ортогонален каждому вектору этого подпространства. Если Н = span{ai,... ,cifc}, то условие х А. Н равносильно то- тому, что вектор х ортогонален каждому вектору ai,..., а*. Дей- Действительно, если х ортогонален Н, то, согласно определению, он ортогонален и каждому вектору ai,..., а*. Докажем проти- противоположное утверждение. Пусть х JL а$, г = 1, &, и у € И. Тогда вектор у является линейной комбинацией векторов af. и поэтому, согласно свойству 3.4, (ж, у) = аг (ж, (ж, а*) = 0. В частности, если векторы ж и а ортогональны, то для любого А Е Ш векторы ж и Ха тоже ортогональны: (ж,Ла) = А(ж,о)=0. В пространстве V$ ненулевым ортого- ортогональным векторам ж и у можно сопоста- вить катеты прямоугольного треугольни- треугольника, причем так, что их сумме, построен- построенх + ной по правилу треугольника, будет со- соответствовать гипотенуза этого прямо- прямоугольного треугольника (рис. 3.3). По аналогии с V$ мы назовем в евклидовом пространстве сумму х + у ортогональных
3.5. Ортогональные системы векторов 91 ректоров х и у гипотенузой треугольника, построенного на х и у. Тогда на произвольное евклидово пространство распро- распространяется известная теорема Пифагора. Теорема 3.3. Если векторы ж и у из евклидова простран- пространства ортогональны, то Ч Здесь под нормой мы, как обычно, понимаем евклидову норму. Выразим левую часть этого равенства через скаляр- скалярное произведение и воспользуемся условием ортогональности = (х, х) + 2 (х, у) + (у, у) = |И2 + ||у ||2. > Определение 3.6. Систему векторов евклидова про- пространства называют ортогональной, если любые два вектора из этой системы ортогональны. Следующее свойство ортогональной системы является са- самым важным. Теорема 3.4. Любая ортогональная система ненулевых векторов линейно независима. М Рассмотрим произвольную ортогональную систему ненуле- ненулевых векторов ei, ..., ет. Предположим, что для некоторых действительных коэффициентов <*i,..., ат выполняется равен- равенство em = O. C.5) Умножим это равенство скалярно на какой-либо вектор е»: +... + otiei + ... + amem, e*) = @, е*).
92 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА В силу свойства 3.3 скалярного произведения правая часть полученного равенства равна нулю, и мы, преобразуя левую часть в соответствии со свойством 3.4, получаем ot\ (еь ег) +... + oti (е«, е*) +... + ат (еь е») = 0. Так как система векторов ортогональна, то все слагаемые слева, кроме одного, равны нулю, т.е. оч(е*,е*)=0. C.6) Так как вектор е» ненулевой, то (et-, е*) ф 0 (аксиома г) ска- скалярного умножения). Поэтому из C.6) следует, что а» = 0. Индекс г можно было выбирать произвольно, так что на самом деле все коэффициенты од являются нулевыми. Мы доказали, что равенство C.5) возможно лишь при нулевых коэффициен- коэффициентах, а это, согласно определению 1.2, означает, что система векторов еь ..., ет линейно независима. > Пример 3.10. В евклидовом пространстве С[0, тг] система функций cosfca;, А; = 1, п, является ортогональной, поскольку 7Г (cosfcx, coslx) = / cos kxcosIxdx = 0 при fc,Z = 3.6. Ортогональные и ортонормированные базисы Евклидово пространство является линейным простран- пространством. Поэтому правомерно говорить о его размерности и его базисах. Как и произвольные линейные пространства, ев- евклидовы пространства можно разделить на бесконечномерные и конечномерные.
3.6. Ортогональные и ортонормированные базисы 93 Бели базис евклидова пространства представляет собой i ортогональную систему векторов, то этот базис называют ортогональным. В силу теоремы 3.4 любая ортогональная система ненулевых векторов линейно независима, и если она в n-мерном евклидовом пространстве состоит из п векторов, то является базисом. В линейном пространстве все базисы равноправны. В евкли- евклидовом же пространстве наличие скалярного умножения позво- позволяет выделить среди всех базисов ортогональные и ортонорми- ортонормированные, которые более удобны и играют в линейной алгебре роль, аналогичную роли прямоугольной системы координат в аналитической геометрии. Определение 3.7. Ортогональный базис называют ор- тонормированным, если каждый вектор этого базиса имеет норму (длину), равную единице. Дополнительное требование к нормам векторов в ортонор- мированном базисе в принципе не является существенным, так как любой ортогональный базис легко преобразовать в орто- нормированный, умножая векторы на соответствующие норми- нормирующие коэффициенты (разделив каждый вектор базиса на его длину). Однако дополнительная нормировка векторов упроща- упрощает изложение теории. Пример 3.11. Система из трех векторов о = A, 0, — 1), 6= A, 0, 1), с = @, 1, 0) в евклидовом арифметическом про- пространстве R3 образует ортогональный базис, потому что (а, Ь) = (о, с) = (Ь, с) = 0. Этот базис не является ортонорми- рованным, так как, например, ||а|| = ^/12 + О2 + (-1J = у/2 Ф 1. Чтобы этот базис сделать ортонормированным, нужно векто- векторы а и Ъ разделить на их нормы, т.е. на число у/2. Пример 3.12. Векторы г, j образуют ортонормированный базис в пространстве V*i свободных векторов на плоскости. Точно так же векторы г, j, k образуют ортонормированный базис в пространстве Vs.
94 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА 3.7* Вычисления в ортонормированном базисе Использование ортонормированных базисов облегчает вы- вычисление скалярного произведения по координатам векторов. Пусть в евклидовом пространстве ? задан некоторый базис е = (ei ... еп). Рассмотрим два произвольных вектора х и у в этом пространстве. Эти векторы представляются в базисе е своими координатами: х = siei +... + хпеп, у = угег +... + упеп. Запишем эти разложения векторов по базису в матричной форме: ' *1 \ (VI х = еж, х = Скалярное произведение векторов ж и у может быть выра- выражено через скалярные произведения векторов базиса: . У) = Составив из скалярных произведений базисных векторов ква- квадратную матрицу Г= ((вг,е^)) порядка п, мы можем запи- записать скалярное произведение заданных векторов в матричной форме: (ж, у) = ятГу. Матрица Г является симметрической в силу коммутативности операции скалярного умножения. Бе называют матрицей Грама системы векторов ei, ..., еп. Пусть базис е является ортонормированным. Тогда скаляр- скалярное произведение (е*, ej) при несовпадающих i и j равно нулю,
3.8. Процесс ортогонализации Грэма — Шмидта 95 а скалярные квадраты базисных векторов равны е2 = ||е;|| = 1. Это значит, что для ортонормированного базиса матрица Г является единичной. Поэтому (ж, у) = хтЕу = хту = ххуг + х2у2 +... + хпуп. В частности, в ортонормированном базисе норма вектора ж, которая выражается через скалярный квадрат этого вектора, может быть вычислена по формуле C-7) а для косинуса угла (р между ненулевыми векторами ж и у получаем выражение х\у\ + «22/2 + -.. + ХпУп /о оч COS(P = / л , . -о- / л . ==• C.8) В ортонормированном базисе ei, ..., еп также упрощается вычисление координат вектора: они выражаются через ска- скалярные произведения. Если х = х\е\ + ... + хпеп, то, умножив равенство скалярно на вектор е^, находим, что (ж, е{) = хи г = 1, п. Пример 3.13. В евклидовом арифметическом простран- пространстве R4 найдем угол между векторами а = (—1, 1, 0, 2) и6 = = B, -1, 1, 0). Согласно формуле C.8), () () -3 cos<z>= 3.8. Процесс ортогонализации Грама — Шмидта В каждом ли евклидовом пространстве существует орто- нормированный базис! Непосредственно из определения ответ на этот вопрос получить нельзя. Кроме того, формального от-
96 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА вета на вопрос не достаточно, нужно уметь находить и строить такие базисы. Ответ на поставленный вопрос утвердительный, а постро- построить ортонормированный базис можно, отталкиваясь от неко- некоторого исходного базиса, при помощи алгоритма, который на- называют процессом ортогопализации Грама — Шмидта. Изложим этот алгоритм. Пусть / == (/i ... fn) — некоторый базис в п-мерном евкли- евклидовом пространстве ?. Модифицируя этот базис, мы будем строить новый базис е = (ei ... еп), который будет ортонор- мированным. Последовательно вычисляем векторы д\ и ei, дъ и б2 и т.д. по формулам: 9i = f и вх= * ^2 в2 = »з = /з-(/з,е1)ег-(/з,е2)е2, ез = тг^тг; ^3'9) en = \\9n\\ Геометрическая иллюстрация этой последовательности вы- вычислений при п = 3 (линейное пространство V3) приведена на рис. 3.4. Для обоснования алгоритма нужно показать, что ни один из последовательно вычисляемых векторов gi не является нуле- нулевым вектором (иначе процесс оборвался бы преждевременно) и что все векторы д^ i = 1, п, попарно ортогональны. Тогда и векторы ej, г = 1,п, образуют ортогональную систему, но при этом норма каждого из этих векторов равна единице. Ортого- Ортогональная система из п ненулевых векторов, согласно теореме 3.4, линейно независима и поэтому в n-мерном евклидовом про- пространстве является базисом.
3.8. Процесс ортогоналиэадии Грама — Шмидта 97 Рис. 3.4 Доказательство опирается на метод математической индук- индукции. В соответствии с этим методом мы будем доказывать, что для любого &, к = 1,п, векторы ei, ..., е& образуют ортого- ортогональную систему и длины их равны единице. Это утверждение очевидно при к = 1, так как в этом случае вектор д\ ненулевой, потому что равен вектору /i/||/i|| единичной длины, а систему векторов, состоящую из одного вектора, считают ортогональ- ортогональной по определению. Пусть векторы ei, ..., е* образуют ортогональную систему. Вычислим новый вектор Qk+\ по формуле 9к+\ = Л+1 - (Л+ь ei) ei - ... - (Д+i, е*) ек. C.10)
98 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Предположив, что gk+i = 0, заключаем, что = (Л+ т.е. вектор Д+i является линейной комбинацией векторов ei, ..., е*, которые в силу C.9) выражаются через векторы /ь •••> Л- Следовательно, этот вектор является линейной комбинацией системы векторов /i, ..., Д, а система векторов /ъ • • • » Л? Л+ъ согласно теореме 1.1, линейно зависима. Но это противоречит условию линейной независимости системы /i,..., /п (свойство 2°, с. 26). Итак, предположение о том, что gk+\ = 0, привело к про- противоречию и потому неверно. Нам остается убедиться, что вектор <7*+1 ортогонален каждому из векторов е\,..., е*. Умно- Умножим равенство C.10) скалярно на вектор е$, где г ^ к. Учиты- Учитывая, что векторы ej попарно ортогональны при j ^ fc, получим: так как (е^, е^) = 1. Следовательно, векторы ei,..., е*, e*+i, где e^-i-i =ffjt+i/||^+i||? образуют ортогональную систему векторов и имеют единичную длину. Мы полностью обосновали процесс Грама — Шмидта. Как следствие можем сформулировать следующий теоретический результат. Теорема 3.5. В конечномерном евклидовом пространстве существует ортонормированный базис. При практических применениях процесс Грама — Шмидта удобно модифицировать так, чтобы ограничиться вычислением векторов gi и не использовать их нормированные варианты ef. В этом случае нужно последовательно вычислить векторы ffb •••» ffn? a затем провести их нормировку, приводящую к векторам е^. Чтобы модифицировать алгоритм вычислений,
3.8. Процесс ортогонализации Грама — Шмидта 99 в левой колонке C.9) заменим векторы е* на gt согласно формулам в правой колонке. Получим: T.7л9\, \ы\ (f3,9i) _ (/з, 92) \ы2 ш 9г = /з ~ „ „2 9i - „ ,|2 92, -j (fn,9l) п- fn ЫГ llealf Ил-iir Пример 3.14. В линейном пространстве V*i рассмотрим векторы ai и а2 с длинами |ai| = 2, |a2| = 6 и углом между ни- ними </? = тг/3. Так как векторы ненулевые, а угол между ними не равен 0 или тг, они неколлинеарны, а потому образуют базис в Уг. Построим при помощи процесса Грама — Шмидта орто- нормированный базис. Согласно описанному выше алгоритму находим: Л Л 1 (a2,oi) bZ2 3 2~ |oi|2 x"" 4 1"~ 2 2 1# Затем полученные векторы д\ и д% нормируем: 3 3 ~ 2ab «2 - 2 Векторы ai, a2 и построенный по ним ортонормированный базис ei, €2 представлены на рис. 3.5.
100 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА 3.9. Ортогональное дополнение Как следует из теоремы 2.7, в произвольном линейном про- странстве С любое линейное подпространство Н имеет пря- прямое дополнение, т.е. такое линейное подпространство V!\ что % ф V! = ?. Такое линейное подпространство V! не является единственным. Однако в случае евклидова пространства сре- среди всех возможных прямых дополнений к данному линейному подпространству одно выделяется. Определение 3.8. Ортогональным дополнением ли- линейного подпространства Н в евклидовом пространстве ? на- называют множество Ц-^ всех векторов х € ?, ортогональных каждому вектору линейного подпространства И. Пример 3.15. В евклидовом пространстве V$ свободных векторов рассмотрим линейное подпространство W. векторов, параллельных данной плоскости (см. пример 2.1). Тогда орто- ортогональным дополнением TiL будет множество векторов, пер- перпендикулярных к этой плоскости (рис. 3.6, а), в то время как в качестве прямого дополнения Н\ можно взять подпространство векторов, коллинеарных произвольной прямой, пересекающей плоскость в единственной точке, т.е. не параллельной плоско- плоскости и не лежащей в этой плоскости (рис. 3.6, б). Отметим, что в данном случае %L является линейным подпространством в V3.
3.9. Ортогональное дополнение 101 б Рис. 3.6 Теорема 3.6. Ортогональное дополнение Н1 линейного подпространства И в евклидовом подпространстве ? является линейным подпространством в ?, причем ? = И ® И1 и dimH + + dim?*1- = dim?. ^ Чтобы доказать, что И1- является линейным подпростран- подпространством в ?, нужно проверить условия 1) и 2) определения 2.1. Взяв два произвольных вектора ж и у, принадлежащих Н1, умножим скалярно их сумму на произвольный вектор /г Е %. Получим: (ж + у, Ai) = (ж, /г) + (у, h) = 0 + 0 = 0, т.е. для любых векторов ж и у из множества Н1 их сумма ж + у принадлежит тому же множеству. Теперь рассмотрим произведение вектора ж ? И1- на про- произвольное действительное число А. Для произвольного вектора heH и поэтому Аж 6 Т/1, если ж G И1. Следовательно, T-LL является линейным подпространством в ?. Отметим, что любой вектор ж, принадлежащий пересече- пересечению НПН1, ортогонален самому себе: (ж, ж) = 0, так как любой вектор из И1- ортогонален любому вектору подпространства %. Но вектор ортогонален самому себе лишь в том случае, когда он нулевой {аксиома г) скалярного умножения). Поэто- Поэтому НПН1- = {0}, а сумма 'U + 'Н1- рассматриваемых линейных
102 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА подпространств является прямой (см. теорему 2.3). Докажем, что эта прямая сумма совпадает со всем евклидовым простран- пространством ?. Выберем некоторый ортоиормироваиный базис /i, ..., /m в линейном подпространстве Н и дополним его до базиса /ъ •••> fm, /m+ь •••> /п во всем евклидовом пространстве ?, dim? = п. Исходя из этого базиса построим при помо- помощи процесса Грама — Шмидта ортонормированный базис е = = (ei ... ет em+i ... еп) в ?. Так как первые т векторов /ь •••? /т исходного базиса попарно ортогональны и имеют единичную длину, процесс ортогонализации оставит их без изменения, т.е. е% = /г, i = 1,га. Векторы em+i, ..., еп орто- ортогональны каждому из векторов ei, ..., ет базиса линейного подпространства % и, следовательно, ортогональны %, так как Н = span{ei,... ,em}. Поэтому все они попадают в ортогональ- ортогональное дополнение HL. Рассмотрим произвольный вектор х Е ? и запишем его разложение по базису е: Легко увидеть, что xi = х\е\ +... + хтет есть вектор из %, а Ж2 = ^mH-i^m+i + ••• + ^пвп есть вектор из И1, при этом ж = х\ + Х2- Следовательно, х Е Н © W-1, и так как вектор ж выбирался произвольно, то HQH1- = ?. Согласно следствию из теоремы 2.5, из соотношения И © ф Н1- = ? вытекает следующее равенство для dim? = dimU + dimftx. > Следствие 3.1. Каково бы ни было линейное подпростран- подпространство % в евклидовом пространстве 5, любой вектор х € ? можно однозначно представить в виде , C.11) где hen.h^e UL. < Действительно, это утверждение означает, что ? = 4®4L. >
3.9. Ортогональное дополнение 103 Вектор h в разложении C.11) называют ортогональной проекцией вектора х на линейное подпространство Н, а вектор hL — ортогональной составляющей вектора ж относительно линейного подпространства %. Как построить ортогональное дополнение к данному линей- линейному подпространству? Пусть линейное подпространство % определено наиболее распространенным способом — кале ли- линейная оболочка некоторой системы векторов oi, ..., ат. Согласно определению 3.8 ортогонального дополнения, любой вектор х G Н1- должен быть ортогонален каждому из векто- векторов af. (<*,*)= 0, » = Т7^. C.12) Наоборот, если вектор х удовлетворяет системе равенств C.12), т.е. он ортогонален каждому из векторов а», то этот вектор ортогонален и любой линейной комбинации системы век- векторов ai, ..., am (см. 3.5). Значит, х ортогонален каждому вектору линейного подпространства И = span{ai,... ,am} и при- принадлежит линейному подпространству %L. Итак, система уравнений C.12) описывает ортогональное дополнение линейного подпространства %. Запишем эту си- систему в координатах в некотором ортонормированном базисе е = (ei ... еп). Пусть векторы аг- в этом базисе имеют раз- разложения ... + а\пеп, ... + amnen. Координаты произвольного вектора х в том же базисе обозна- обозначим #1, ..., хПу т.е. полагаем, что
104 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Тогда в ортонормированном базисе е = ацх\ + ... + CLinxn, г = 1, га. Таким образом, система C.12), записанная в координатах относительно ортонормированного базиса е, имеет вид = 0, C.13) .. • + атпхп — 0, т.е. представляет собой однородную систему из т линейных алгебраических уравнений с п неизвестными. Строки матрицы А этой системы совпадают с наборами координат векторов ai, ..., ат. Поэтому матрица А имеет ранг, равный рангу системы векторов ai, ..., am, т.е. этот ранг совпадает с размерностью линейного подпространства %. Каждое решение системы C.13) представляет собой набор координат некоторого вектора из Н1- и наоборот, любой век- вектор из И1- описывает решение системы C.13). Поэтому можно сказать, что множество всех решений этой системы есть ли- линейное подпространство И1. Согласно теореме 3.6, это под- подпространство имеет размерность п — dimH = п — Kg А. Множе- Множество решений однородной системы линейных алгебраических уравнений (СЛАУ) описывается при помощи фундаментальной системы решений. Напомним, что столбцы фундаменталь- фундаментальной системы решений линейно независимы, а любое решение однородной СЛАУ представляется в виде линейной комбина- комбинации столбцов фундаментальной системы решений. Другими словами, фундаментальная система решений — это базис в под- подпространстве всех решений данной однородной СЛАУ. Каждый столбец фундаментальной системы решений представляет со- собой координатную запись вектора линейного подпространства И1- в выбранном базисе е евклидова пространства ?, при этом
3.9. Ортогональное дополнение 105 такие векторы в совокупности образуют базис подпростран- подпространства Н1-. Мы здесь можем не различать фундаментальную систему решений системы C.13) и соответствующий ей базис ортогонального дополнения Н^. Пример 3.16. Пусть линейное подпространство Н пред- представляет собой линейную оболочку системы векторов, задан- заданных координатами в некотором фиксированном ортонормиро- ванном базисе е четырехмерного евклидова пространства ?: 12 -10 V 12 У Найдем какой-либо базис ортогонального дополнения Записываем систему вида C.13), используя координаты векторов щ: / 1\ 2 -1 ( 2\ 0 -1 / + 2x2 - =0, = 0, - 12х4 = О, и находим ее фундаментальную систему решений. Это можно сделать, например, с помощью приведения матрицы системы к ступенчатому виду методом элементарных преобразований [III]. В качестве базисных переменных выберем х\ и хг- Тогда фундаментальная система решений будет содержать два реше- решения, например: /2\ 1 4 3 0 4/ Столбцы найденной фундаментальной системы решений представляют собой координаты двух векторов /i, /2 из ?,
106 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА образующих базис линейного подпространства W1-, но этот базис не является ортонормированным. Чтобы получить ор- ортонормированный базис ортогонализации Грама торы 01 = /Ь х, достаточно применить процесс Шмидта. Сделав это, находим век- век-6\ 3 0 Ч 9 + 21е /2^ 1 4 W 12 1е / \ —9\ 6 3 и ортонормированный базис в линейном пространстве 9\ /12 = 92 IMI 6 3 Дополнение 3.1. Нормы матриц В линейном пространстве Мп(Ш) квадратных матриц по- порядка п норму можно задавать различными способами. На- Например, это линейное пространство можно трактовать как п2-мерное линейное арифметическое пространство со стан- стандартным скалярным умножением, которому соответствует ев- евклидова норма. Для матрицы А = (a»j) € Мп(Ш) эта норма имеет вид \ п п ЕЕ4- г=1 j=l Бе называют евклидовой нормой или ^-нормой. Евклидова норма матрицы никак не связана с расположе- расположением элементов матрицы по строкам и столбцам. Это обычно нежелательно, и поэтому она используется редко. Больший ин- интерес представляют нормы матриц, использующие специфику
Д.3.1. Нормы матриц 107 записи матриц. Такая норма может быть связана с некото- некоторой нормой, заданной для столбцов матрицы. Важно также и то, как норма связана с операцией умножения матриц. В этом разделе векторы линейных арифметических пространств удобно записывать как матрицы-столбцы, отождествляя век- векторы со столбцами их координат в стандартном базисе (см. замечание 1.4). Определение 3.9. Пусть в линейном арифметическом пространстве Шп задана норма Ц-Ц^. Норму ||-||т в линейном пространстве Мп(Ш) называют согласованной с нормой Ц-Ц^, если для любой матрицы А € Мп(Ш) и любого столбца х Е Rn выполняется соотношение 1И*||,<ииМ|,. C.14) Каждая ли норма в Шп имеет согласованную с ней норму в Mn(R)? ' Ответ на этот вопрос утвердительный. Приведем пример такой нормы. Пусть в Rn задана норма ||-||+. На линейном пространстве матриц Мп(Ш) рассмотрим функцию C.15) Из формулы не ясно, всегда ли определена указанная функ- функция, т.е. всегда ли точная верхняя грань имеет конечное зна- значение. Отметим, что, согласно аксиомам нормы и свойствам матричного умножения, Следовательно, значение \\А\\г равно точной верхней грани функции \\Ax\\t на множестве {х е Rn: ||ж||„ = 1}. Можно пока- показать, что это множество замкнутое и ограниченное (в част- частных случаях это показывает пример 3.8), а функция \\Ax\\*
108 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА непрерывна на нем. На замкнутом ограниченном множестве непрерывная функция ограничена и достигает точной верхней грани [V]. Значит, величина ||А||^ конечна, причем существует такой вектор у Е Rn единичной нормы, что \\А\\{ = ||Ау||+. Итак, соотношение C.15) корректно задает функцию на линейном пространстве Мп(М). Покажем, что эта функция является нормой, т.е. верны три аксиомы нормы. Выполнение аксиомы а) очевидно. Проверим аксиому б): \\XA\U = supИ^ = sup х#о 11*11» х?о Аксиома в) нормы также верна: ||Ав||. + ||B*|L (\\Ax\l \\Вх\\Л <sup^ !ij-J! ^ = sup (lL^ + iL_J!i)< хфО 11*11» хфО\ 11*11» 11*11» / z?SO ^ sup 1п!гй+sup -nSr^=n^iii+ii*ii< • Норму, определенную соотношением C.15), называют «к- дуцированной (или подчиненной, операторной) и исполь- используют для нее то же обозначение, что и для порождающей ее исходной нормы в Шп: Индуцированная норма всегда согласована с исходной нормой в Rn, так как для любой матрицы А и любого х Ф О
Д.3.1. Нормы матриц 109 что эквивалентно C.14) при ||-А||т = \\А\\^. Индуцированная норма является наименьшей из всех норм, согласованных с данной нормой в Шп. Действительно, пусть задана норма ||-|| в линейном пространстве матриц Mn(R), согласованная с нормой И'Н,,, в Rn. Выберем произвольную матрицу А, а в качестве вектора х выберем тот, на котором функция Н-АжИ* достигает наибольшего значения на множестве {||ж|| = 1} всех векторов единичной нормы. Тогда так как норма ||-|| согласована с нормой ||'||#. Говорят, что норма ||-|| в линейном пространстве матриц Mn(R) является матричной, или кольцевой, если Первый термин не совсем удачен, так как более естественно назвать матричной любую норму, заданную в линейном про- пространстве матриц. Отметим, что любая индуцированная норма является кольцевой, так как для любого ненулевого столбца х в силу согласованности инду- индуцированной нормы. Поэтому Задавая различные нормы в Rn, мы получаем индуцирован- индуцированные нормы в линейном пространстве матриц Мп(Ш). Выберем в W1 евклидову норму ||-||2:
110 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА где х = (х\, ..., хп). Индуцированную ею норму в линейном пространстве матриц Мп(Ш) называют спектральной нор- нормой. Это название вызвано тем, что спектральная норма ||А||2 матрицы А равна >/А, где Л — максимальное собственное зна- значение матрицы АТА. Задав в Шп 1\-норму в качестве индуцированной получим следующую норму: т.е. нормой матрицы А = (ay) E Мп(Ш) является максимальная из Zi-норм столбцов этой матрицы. Поэтому ее называют мак- максимальной столбце в ой или октаэдрической. В качестве нормы в Rn выберем loo-норму Тогда индуцированной нормой будет функция т.е. нормой матрицы А = (оу) 6 Mn(R) будет максимальная из Zi-норм строк этой матрицы. Поэтому ее называют макси- максимальной строчной или кубической. Особо стоит евклидова норма матриц ||А||2, которая не является индуцированной. Действительно, непосредственно из определения C.15) индуцированной нормы следует, что, какова бы ни была норма в Мп, индуцированная норма единичной матрицы всегда равна единице. Однако нетрудно убедиться, что евклидова норма единичной матрицы Е € МП(Е) равна у/п > 1 (при п > 1). Евклидова норма матриц является кольцевой. Действитель- Действительно, пусть даны квадратные матрицы А = (ау) и В = (bjk) поряд- порядка п. Их произведением будет матрица С = (сце) с элементами
Д.3.1. Нормы матриц 111 Cik = ацЬ\к + Q>i2b2k + • - • + a>inbnk- Так как, согласно неравенству Кошщ 4 заключаем, что И uml=??4 ^ (??4) В линейном пространстве матриц М„(М), интерпретируя его как линейное арифметическое пространство Еп , можно задать 1\ -норму и /оо-норму ||Л||0о = где А = (a^j) G Mn(R). В приложениях теории матриц первая норма заметного интереса не представляет. Вторая норма оце- оценивает величину матрицы по максимальному из абсолютных значений ее элементов и необходима при изучении свойств раз- различных методов вычислений. Можно показать, что /оо-норма в Мп(Ш) не является кольцевой, а потому она не согласована ни с какой нормой в Rn. Этот недостаток можно нейтрализовать, модифицировав эту норму. Новая норма отличающаяся от старой корректирующим множителем п, рав- равным порядку матрицы, уже является кольцевой и согласована с тремя основными нормами в W1: евклидовой, /i-нормой и /оо-нормой.
112 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Дополнение 3.2. Метод наименьших квадратов Постановка задачи. Рассмотрим систему из п линейных алгебраических уравнений (СЛАУ) относительно к неизвест- неизвестных =6i, или в матричной записи Ax = b. C.17) Каждому набору значений неизвестных сопоставим числа +... + akixk), г = 1, п, которые называют невязками уравнений системы для задан- заданного набора значений неизвестных. Очевидно, что набор зна- значений неизвестных является решением системы тогда и только тогда, когда соответствующие ему невязки всех уравнений си- системы равны нулю. Отметим, что функция к f(xu... ,хк) = ]Г [bi - {auxi +... + akixk)]2 на решениях системы равна нулю и положительна в остальных случаях. Поэтому ее можно рассматривать как оценку отклоне- отклонения набора значений неизвестных от точного решения системы. Если система несовместна, то часто возникает задача найти вместо отсутствующих решений такой набор значений неиз- неизвестных, который приводит к наименьшему значению функции /. Такой подход в решении некорректной (т.е. не имеющей решений) задачи называют методом наименьших квадра- квадратов, поскольку ищется минимум функции, являющейся суммой квадратов.
Д. 3.2. Метод наименьших квадратов 113 Сформулированная задача по своему типу относится к клас- классу задач минимизации функций многих переменных [V] и мо- может быть решена общими методами поиска минимума. Однако ей можно придать алгебро-геометрическую интерпретацию и полностью решить методами линейной алгебры. Для придания задаче такой интерпретации будем трактовать столбцы коэф- коэффициентов при неизвестных, столбец правых частей уравнений C.16) как столбцы координат векторов а\, ..., ak, Ъ евклидо- евклидова арифметического пространства W1 в стандартном базисе, отождествляя при этом векторы с их столбцами координат (см. замечание 1.4). Тогда и набор невязок уравнений системы мож- можно рассматривать как вектор d= (rfi, ..., dn) G Kn, который, согласно определению невязок, определяется соотношением Число ||d|| назовем невязкой СЛАУ C.17). Вычислив скаляр- скалярный квадрат вектора d, находим И2 =/(*!,...,**). Следовательно, задача сводится к определению таких действи- действительных коэффициентов х\, ..., хк, при которых величина ||d|| имеет наименьшее значение. Решение задачи. Введем линейное подпространство И = = span{ai,...,afc} и его ортогональное дополнение W,±. Раз- Разложим вектор Ъ на его ортогональную проекцию на линейное подпространство И и соответствующую ортогональную соста- составляющую: Тогда d = h + hL - (xiai + ... + xkak) = = h1 + (h - x\a\ - ... - xkak) —
114 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА где d0 = h - xxax - ... - хкак е П. Так как do JL hx, то по теореме Пифагора заключаем, что Ортогональная составляющая hL вектора невязок постоянна и от выбора коэффициентов хг не зависит. Поэтому минимизация величины ||d|| сводится к поиску минимума величины ||do|| • Эта величина является неотрицательной и достигает миниму- минимума, если обращается в нуль, т.е. при условии, что do = 0. А это равносильно тому, что d = /i1, т.е. вектор невязок принадлежит ортогональному дополнению И1 и поэтому является решением системы (a,,d)=0, j = M, C.18) или (a,, b - ххах -... - xkak) = 0, j = 1, fc, (cm. 3.9). После преобразований получаем СЛАУ (ei, oi)д?1 +... + (oi, ak)xk = (oi, b), C.19) , ak)xk = (ak) b) относительно неизвестных х\, ..., xk. Матрица этой си- системы Г= ((ai,aj)) — это квадратная матрица порядка fc, представляющая собой матрицу Грома для системы векторов аи • •-, «fc. Теорема 3.7. Если система векторов а\, ..., ак линейно независима, то ее матрица Грама является невырожденной. Ч Докажем равносильное утверждение, что если матрица Гра- Грама системы векторов ai, ..., ак вырождена, то эта система векторов линейно зависима. Вырожденность матрицы Гра-
Д. 3.2. Метод наименьших квадратов 115 ма означает, что ее столбцы линейно зависимы и один из них, например первый, является линейной комбинацией осталь- остальных [III]: к (о., ax) = 5^/ij (a», aj), i = 1, Л, или (а», /) = 0, г = 1 Следовательно, вектор / принадлежит ортогональному допол- дополнению линейного подпространства span{ai,...,a^}, а посколь- поскольку /espan{ai,...,afc}, то / = 0, т.е. Это равенство означает, что векторы ai, ..., a^ линейно зависимы, так как коэффициент при а\ не равен нулю. > Отметим, что система линейных алгебраических уравнений C.19) всегда совместна: ее решениями являются коэффициенты разложения вектора h € % = spanjai,... ,a^} по системе векто- векторов oi, ..., а*, так как в этом случае вектор d — b — h^h1 — решение системы C.18). Если система векторов oi, ..., a^ ли- линейно независима, то, согласно доказанной теореме, матрица СЛАУ C.19) невырождена и эта система имеет единственное решение, которое дает решение исходной задачи. Если же ука- указанная система векторов линейно зависима, то матрица СЛАУ C.19) вырождена. В этом случае квадратная СЛАУ C.19), бу- будучи совместной, имеет бесконечно много решений и каждое из них дает решение исходной задачи. Среди этих решений можно выбирать те, которые удовлетворяют каким-то допол- дополнительным условиям.
116 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Дополнение 3.3. Псевдорешения *, и псевдообратная матрица Рассмотрим систему линейных алгебраических уравнений (СЛАУ) Ах = 6, вообще говоря, несовместную, с матрицей А типа пхк. Мы остановимся на тех столбцах я, которые для рассматриваемой системы дают минимальную невязку. Если СЛАУ Ах = 6 совместна, то такие столбцы представляют собой ее решения. Если же СЛАУ несовместна, то столбцы, дающие минимальную невязку, можно находить при помощи метода наименьших квадратов. В этом разделе изложим другой метод их нахождения, используя отождествление векторов евклидова арифметического пространства W1 с матрицами-столбцами их координат в стандартном базисе. СЛАУ Ах = Ъ соответствует СЛАУ АТАх = АТ6, которую называют нормальной. Пусть oi,..., a,k 6 Rn — столбцы матрицы А. СЛАУ Ах = 6 может быть записана в векторной форме: Совместность СЛАУ Ах = 6 означает, что вектор Ь G Шп по- попадает в линейную оболочку Н системы векторов ai, ..., a*. Пусть Ь^Н. Разложим вектор Ь в сумму Ь = h + Лх, где h — ортогональная проекция вектора Ь на линейное подпростран- подпространство Н, а h1 — ортогональная составляющая этого вектора. Введенные обозначения используем в формулировках и доказа- доказательстве следующих трех теорем. Теорема 3.8. Для любой СЛАУ Ах = Ь следующие множе- множества совпадают: - множество столбцов, дающих минимальную невязку для этой СЛАУ; - множество решений СЛАУ Ах = h; - множество решений нормальной СЛАУ АТАх = АТЬ.
Д.3.3. Псевдорешения и псевдообратная матрица 117 М Норма вектора hL представляет собой минимальную невязку СЛАУ Ах = Ь (см. Д.3.2), а множество векторов, дающих такую невязку, представляют собой решения СЛАУ Ах = h. Условие hL Е Н1 равносильно тому, что вектор hL ортого- ортогонален каждому из векторов ai, ..., a&, т.е. Мы имеем СЛАУ относительно компонент столбца h1, которая в матричной форме имеет вид A h1- = 0. Умножим СЛАУ Ах = h, решения которой дают для си- системы Ах = Ь минимальную невязку, на матрицу Ат слева. Учитывая, что A*hL = 0, получим АтАх = ATh = ATh + AThL = АТЬ. Значит, все векторы ж, дающие для СЛАУ Ах = Ь минималь- минимальную невязку, являются решениями СЛАУ АтАх = АТЬ. Верно и обратное: если вектор х является решением системы АтАх = = А Ь, то для СЛАУ Ах = 6 он дает минимальную невязку. Действительно, если АтАх = АТЬ, то АТ(Ь — Ах) = 0, а это озна- означает, что вектор Ь' = Ь — Ла? ортогонален векторам ai, ..., a^ и, следовательно, принадлежит линейному пространству Н1-. Поскольку Ь" = Ах Е %, то 6 = Ь" + Ь;. Согласно следствию 3.1, последнее равенство совпадает с разложением Ь = h + h1-. Поэтому Ь1 = fi-1-, а норма вектора Ь', представляющая собой невязку, будет минимальной. > Теорема 3.9. Нормальная система линейных алгебраиче- алгебраических уравнений всегда совместна. < СЛАУ Ах = Ь соответствует нормальная СЛАУ АтАх = = АТЬ. Решениями нормальной СЛАУ являются векторы ж, дающие минимальную невязку для исходной СЛАУ Ах = Ь и являющиеся решениями СЛАУ Ах = h. Последняя же система всегда имеет решения, так как в векторной форме она имеет вид х\а\ +... + хкак = h, где h €?¦{ = span{ab...,aA:}. >
118 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Теорема ЗЛО. Для того чтобы нормальная СЛАУ А Ах &= = АТЬ имела единственное решение, необходимо и достаточно, чтобы: - однородная СЛАУ Ах = 0 была определенной; - ранг матрицы А совпадал с количеством ее столбцов; - векторы ai, ..., a,k были линейно независимы. <4 Так как множества решений систем Ах = h и А Ах = = АТЬ совпадают, то из теоремы о структуре общего решения СЛАУ [III] следует, что тогда совпадают и множества решений соответствующих однородных систем Ах = 0 и АтАх = 0. Если эти однородные системы определенны, т.е. имеют единственное решение, то СЛАУ Ах = Ь имеет единственный вектор с минимальной невязкой и наоборот. Для того чтобы однородная система Ах = 0 имела единственное решение, необходимо и достаточно, чтобы ранг матрицы А был равен количеству столбцов в ней, или, другими словами, чтобы столбцы матрицы были линейно независимы [III]. > Псевдорешения и их свойства. Если для системы Ах = Ь бесконечное количество векторов х дает минимальную невяз- невязку, то обычно выбор останавливают на том из них, который имеет минимальную норму. Такой вектор называют нормаль- нормальным псевдорешением (или просто псевдорешением) СЛАУ Ах = 6. Таким образом, псевдорешение системы линейных ал- алгебраических уравнений — это такой вектор, который дает минимальную невязку в этой системе и среди таких векторов имеет минимальную норму. Теорема 3.11. Любая СЛАУ имеет псевдорешение, и притом единственное. М Множество всех векторов ж, дающих минимальную невязку для СЛАУ Ах = Ь, описывается формулой C.20)
Д. 3.3. Псевдорешения и псевдообратная матрица 119 где хч — некоторое частное решение соответствующей нор- нормальной СЛАУ; х0 — общее решение однородной СЛАУ А Ах = О, которое является общим решением и однородной СЛАУ Ах = 0 (см. доказательство теоремы ЗЛО). Обозначим через /С линейное подпространство всех решений однородной СЛАУ Ах = 0. Тогда имеет место представление хч = х^ + х%, где ж° € /С, х^ G /Сх, и поскольку ж° + х0 ? /С, то для любого х вида C.20), согласно теореме Пифагора, имеем ||*||2 = ||*ч + *0||2 = Ц«± + К + хо)||2 = Равенство ||ж|| = \\хн\\ возможно и притом лишь в единственном случае, когда ж° +х0 = 0, или х = ж^. Следовательно, среди векторов, дающих минимальную невязку СЛАУ Ах = Ь, мини- минимальную норму будет иметь вектор я?^, и только он. Этот век- вектор является ортогональной составляющей (любого) частного решения нормальной СЛАУ относительно линейного подпро- подпространства /С всех решений соответствующей однородной СЛАУ Ах = 0. > Оказывается, что для любой СЛАУ можно построить та- такую другую СЛАУ, единственным решением которой явля- является псевдорешение исходной СЛАУ. Для нахождения такой СЛАУ воспользуемся тем, что, согласно доказательству теоре- теоремы 3.11, условие минимальности нормы псевдорешения СЛАУ Ах = Ь означает его ортогональность всем векторам линейно- линейного подпространства /С решений соответствующей однородной системы Ах = 0. Ортогональность линейному подпростран- подпространству /С равносильна тому, что псевдорешение ортогонально каждому из векторов произвольно выбранной фундаменталь- фундаментальной системы решений СЛАУ Ах = 0. Условия ортогональности представляют собой линейные уравнения, добавив которые к нормальной СЛАУ, мы и получим такую СЛАУ, единственным решением которой будет псевдорешение системы Ах = Ь.
120 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА Пример 3.17. Если матрица А нулевая, то псевдорешением СЛАУ Ах = Ь является нулевой вектор. Действительно, vb этом случае невязка не зависит от выбора вектора х и равна ||Ь||. Минимальную же норму среди всех векторов линейного арифметического пространства имеет нулевой вектор. Пример 3.18. Если матрица А является квадратной и невырожденной, то псевдорешение СЛАУ Ах = Ь совпадает с ее обычным решением, так как минимальная невязка, равная нулю, будет достигаться на единственном векторе, являющемся решением этой системы. Псевдорешение совпадет с решением и в случае, когда матрица А не является квадратной, но имеет ранг, совпадающий с количеством столбцов. Это возможно в том случае, когда число строк превышает число столбцов. Такую систему можно заменить эквивалентной ей квадратной, отбрасывая лишние уравнения. Пример 3.19. Рассмотрим простейшую систему двух уравнений с двумя неизвестными. Видно, что эта система несовместна. Последовательно вычисляем 0-^-0 O'-GO- Таким образом, нормальная СЛАУ в этом случае состоит из двух одинаковых уравнений:
0,54 1 ч^ Д.3.3. Псевдорешения и псевдообратная матрица 121 Множество решений нормальной системы, т.е. множество пар ж, у, дающих минимальную невязку в исходной системе, на плоскости изображается прямой х + у = 0,5 \ 0,5|Ч (рис. 3.7), а псевдорешением бу- \ ir\ \ дет точка этой прямой, ближай- — ~ шая к началу координат, т.е. точ- точка с координатами х = 0,25, у = = 0,25. Этой точке соответству- „ о гис. о.7 ет радиус-вектор с наименьшей нормой среди всех радиус-векторов точек прямой х + у = 0,5. Если одно из уравнений исходной системы умножить на ко- коэффициент, то и множество решений нормальной системы, и псевдорешение данной системы изменятся. Это достаточно очевидно, так как умножение уравнения на коэффициент изме- изменяет, вообще говоря, его невязку. Например, умножив второе уравнение рассматриваемой системы на 2: 2х + 2у = 2 и вычислив находим, что нормальная СЛАУ и в этом случае будет состоять из двух идентичных уравнений Ъх + Ъу = 4, но они уже дру- другие. Псевдорешением рассматриваемой системы будет х = 0,4, У = 0,4. Пример 3.20. Рассмотрим на плоскости треугольник с вершинами A;1), B;2), C;1) (рис. 3.8). Прямые, на которых
122 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА лежат стороны этого треуголь- треугольника, опишем при помощи нор- нормальных уравнений и составим из них систему V2 Полученная система несовместна, так как три прямых не имеют общей точки. Определим для полученной системы нормальную СЛАУ. Для этого последовательно находим: __ V2 О 1 V7I 1 1 71 АТА -t1 °) Нормальная СЛАУ АтАх = АТЬ имеет единственное решение х = 2, у = 1,5, являющееся (в силу единственности) псевдореше- псевдорешением исходной системы. Так как прямые плоскости заданы нормальными уравнени- уравнениями, квадрат невязки системы для вектора (#о, Уо) будет равен сумме квадратов расстояний от точки (хо;2/о) Д° тРех прямых. Найденному псевдорешению на плоскости соответствует точка B; 1,5), сумма квадратов расстояний от которой до трех сторон треугольника является минимальной. # Псевдорешения сохраняют линейные свойства решений ли- линейных систем. Теорема 3.12. Если Х\ — псевдорешение системы Ах = = bi, X2 — псевдорешение системы Ах = bi, то Х\Х\ + А2Ж2 — псевдорешение системы Ах = Ai&i +
Д.3.3. Псевдорешения и псевдообратная матрица 123 Щ Из условий теоремы вытекает, что Х{ является решением нор- нормальной СЛАУ АтАх = АТЬ{, г = 1,2. Значит, \\Х\ + А2Ж2 явля- является решением нормальной СЛАУ АтАх = AT\ib\ + AT\2b2, и нам остается показать, что при этом Ai^i + А2Ж2 имеет ми- минимальную норму или, что то же самое, \\Х\ + А2Ж2 и любое решение у однородной СЛАУ Ау = 0 ортогональны. Отметим, что псевдорешения Х{ ортогональны всем реше- решениям СЛАУ Ау = 0 как псевдорешения систем, различающих- различающихся лишь правыми частями. Это значит, что (у, Х{) = 0, если Ау = 0. Поэтому (у, Aixi + А2ж2) = Ai (у, xi) + А2 (у, х2) = О, если Ау = 0. > Псевдообратная матрица. Решение СЛАУ Ах = 6 с ква- квадратной невырожденной матрицей А может быть записано с по- помощью обратной матрицы в виде х = А~1Ь [III]. Обратная ма- матрица А является решением матричного уравнения АХ = Е, где Е — единичная матрица^ а столбцы С{ обратной матри- матрицы являются решениями систем Agi = е^, г = 1,п, где ei, ..., еп — стандартный базис в линейном пространстве Кп (стол- (столбец в{ является также г-м столбцом единичной матрицы). Для Ь = (Ь\ ... bn) справедливо разложение Ь = Ь\е\ + ... + Ьпеп, и поэтому формула х = А~1Ь в векторной форме записывается в виде х = &i<ji + ... + bngn, т.е. в виде линейной комбинации ре- решений gij, коэффициентами в которой служат правые части bi уравнений системы. Этот подход позволяет обобщить понятие обратной матри- матрицы и использовать это обобщение для нахождения псевдореше- псевдорешений примерно так же, как обратную матрицу для построения обычных решений. Рассмотрим СЛАУ Ах = 6 с произвольной матрицей А типа пхк. Пусть gi — псевдорешение системы Ах = е^, где ei, ..., еп — стандартный базис в Шп. Матрицу Л+ = (д\ ... дп), составленную из столбцов д^ называют псевдообратной к
124 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА матрице А. Отметим, что матрица А+ имеет тип fcxn, т.е. тот же, что и транспонированная матрица А . м Теорема 3.13. Псевдорешением СЛАУ Ах = Ь является вектор х = А+Ь. <4 Действительно, если gi — псевдорешение системы Ах = е^, г = 1, п, то, согласно теореме 3.12, ж = 6i<ji +... + Ьпдп является псевдорешением системы с той же матрицей и правой частью +... + Ьпеп = Ь, т.е. рассматриваемой системы Ах = 5. > Как вытекает из изложенного, любая матрица имеет псев- псевдообратную. Если матрица А квадратная невырожденная, то ее псевдообратная матрица А+ совпадает с обратной А", так как в этом случае псевдорешения gi систем Ах = е% будут совпа- совпадать с обычными решениями и, следовательно, будут столбцами обратной матрицы. Пример 3.21. Если А — нулевая матрица типа nxfc, то А+ — также нулевая, но типа fcxn. В этом случае псевдореше- псевдорешением системы Ах = е^ г = 1, п, будет нулевой столбец высоты к (см. пример 3.17). / Пример 3.22. Рассмотрим матрицу A V4 2 3 4 5 % Эта матрица имеет ранг 2, а соответствующая СЛАУ при лю- любой правой части, согласно теореме Кронекера — Капелли, будет совместна, так как ранг расширенной матрицы не мо- может превышать двух и потому совпадает с рангом матрицы системы. Поэтому псевдорешение СЛАУ Ах = Ь является од- одним из ее решений. Оно выделяется среди всех решений тем, что является ортогональным каждому решению соответствую- соответствующей однородной системы. Фундаментальная система решений СЛАУ Ах = 0 состоит из одного вектора (поскольку RgA = 2), и в качестве этого
Вопросы и задачи 125 вектора можно взять A —2 1) . Добавляя условие ортогональ- ортогональности, получаем две системы длл -^хождения столбцов д\ и g*i псевдообратной матрицы: 1 + 2х2 + Зхз = 1, fxi + 2х2 + Зх3 = О, 4xi + 5x2 + бхз = 0, и < 4xi + 5x2 + бхз = 1, 1 - 2x2 + #з = 0 [xi - 2x2 + #з = 0. Решая эти системы, находим /-17/18 \ 91 = -1/9 , V 13/18/ Итак, Вопросы и задачи 3.1. Для каких векторов евклидова пространства неравен- неравенство Коши — Буняковского превращается в равенство? 3.2. Можно ли утверждать, что в евклидовом пространстве верна теорема о трех перпендикулярах? 3.3. Выясните, является ли линейное пространство М2(Щ всех квадратных матриц второго порядка евклидовым от- относительно операции: а) (А, В) = а\п2 + bi&2 + С1С2 + б) (А, В) = ai<i2 + 61C2 + ci&2 + <Мг> где A=h bA, s=(a2 M. Vcl rfl/ \C2 d2) 3.4. Убедитесь, что в R3 векторы о: = A, -2, 2), а2 = (-1, 0, 1), а3 = E, -3, -7)
126 3. ЕВКЛИДОВЫ ПРОСТРАНСТВА образуют базис. С их помощью постройте ортонормированный базис. и 3.5. Проверьте, что в R3 векторы oi = (l, -2, 2), о2 = (-2, -2, -1), аз = B,-1,-2) образуют ортогональный базис, и для вектора х = A, 2, 3) найдите разложение по этому базису. 3.6. Убедитесь, что в R4 векторы ei = A,2, 2,-1), О2 = A, 1,-5,3), в3 = C, 2, 8, -7) линейно независимы. Используя процесс ортогонализации Гра- ма — Шмидта, постройте ортогональный базис для линейной оболочки этих векторов. 3.7. В евклидовом пространстве R4 даны два вектора ах = A, -2, 1,3), о2 = B, 1, -3, 1). Убедитесь, что эти векторы ортогональны. Для линейной оболочки этих векторов найдите ортогональное дополнение (в виде линейной оболочки) и постройте его ортонормированный базис. 3.8. Определите размерность и найдите ортонормирован- ортонормированный базис линейной оболочки векторов ах = B, 1,3,-1), в2 = G,4, 3, -3), а3 = A, 1, -6,0), а4 = E, 7, 7, 8). Дополните этот базис до ортонормированного базиса евклидова пространства R4. 3.9. В евклидовом пространстве R4 даны векторы в! = A, 1, 1, 1), в2 = A,2, 2, -1), а3 = A,0, 0,3), у = D, -1, -3,4). Найдите ортогональные проекции вектора у на линейную оболочку векторов ai, 02, 03 и ортогональное дополнение к этой линейной оболочке.
Вопросы и задачи 127 ii 3.10. Найдите ортонормированный базис в линейном под- подпространстве свободных векторов, параллельных плоскости: а) Зх - у + 2z = 0; б) х + 2у - z = 0. 3.11. В евклидовом пространстве R3 даны три вектора ai = (l, —1, 2),a2 = (l, 1, 1),оз = A, 0, 1). Вычислите матрицу Грама этой системы и с помощью ее докажите, что oi, аг, аз — базис в R3. Вычислите скалярное произведение векторов х = 2oi — a2 + 4аз и у = ai — а2 + 2аз двумя способами: через их координаты в стандартном базисе и в базисе au a2, аз при помощи найденной матрицы Грама. 3.12. Для матриц В = проверьте неравенство ||АВ|| ^ ||Л|| ||J5|| для евклидовой, спек- спектральной, октаэдрической и кубической норм. 3.13. Для вектора х = A, —1, 2, —1) ? R4 проверьте выпол- выполнение неравенств ЦхЦ^ < ||ж|| ^ \\х\\г (\\x\\ — евклидова норма вектора ж). 3.14. Изобразите на плоскости множества точек, радиус- векторы которых удовлетворяют условиям (е > 0): а) ||sd||00 ^ е; б) ||*|| ^ е; в) ЦхЦ! ^ е; г) 1 < \\х\\„ ^2; д) 1 < ||х|| < 2; еI^\\х\\г<2. 3.15. Даны координаты трех точек на плоскости: ЛA;9), ВB;14), СC;20). Найдите уравнение прямой, сумма расстоя- расстояний до которой от этих трех точек имеет наименьшее значение. 3.16. Найдите псевдорешение СЛАУ х- х + 2у + Ъг = 4, ,2х+ у+ 4^ = 4.
4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 4.1. Определение и примеры линейных операторов Линейная алгебра большое внимание уделяет отображени- отображениям, которые векторам одного линейного пространства ставят в соответствие векторы другого (возможно того же) линейно- линейного пространства. Среди таких отображений выделяются те, которые сохраняют алгебраические соотношения. В некотором смысле такие отображения являются и наиболее простыми, так как они естественным образом связаны со структурой линей- линейного пространства. Напомним некоторую терминологию из теории отображе- отображений [I]. Отображение /: X ->Y называют сюръективным, если каждый элемент у EY является образом некоторого эле- элемента х Е X, Отображение /: X ->• Y называют инъектив- ным, если разные элементы xi, X2 Е X имеют разные образы. Отображение одновременно и сюръективное, и инъективное называют биективным. Биективное отображение устанавли- устанавливает между множествами X и Y взаимно однозначное соответ- соответствие. Определение 4.1. Отображение А: С -> С! из линейного пространства С в линейное пространство С1 называют ли- линейным отображением или линейным оператором, если выполнены следующие условия: а) А(х + у) = А(х) + А(у) для любых векторов ж, у 6 ?; б) А(Хх) = ХА(х) для любого вектора ж € ? и любого числа Хеш Линейный оператор >!:?->?, который осуществляет ото- отображение линейного пространства С в себя, называют также
4.1. Определение и примеры линейных операторов 129 линейным преобразованием линейного пространства С и говорят, что линейный оператор А действует в линейном про- пространстве С. Условия а), б) определения 4.1 можно скомбинировать в виде одного условия, например, так: для любых ж, у Е С и любых действительных А и /л А(Хх + цу) = \{Ах) + /л(Ау). D.1) Нетрудно убедиться, что условия определения 4.1 являются частными случаями D.1). С другой стороны, если выполнены условия а) и б), то А(Хх + //у) = А(Хх) 4- A(fiy) — ХАх + цАу, т.е. выполняется и D.1). Свойства а), б) линейности отображения делают более удобной не традиционную форму записи линейного оператора в виде А(ж), при которой аргумент записывается в скобках вслед за функцией, а более простую в виде Ах как своеобразное „умножение линейного оператора на вектор". При такой записи условие а) определения 4.1 можно интерпретировать как свойство дистрибутивности этого „умножения", а условие б) — как свойство ассоциативности (если число Л записывать не слева от вектора, а справа, то запись будет выглядеть так: А{хХ) = (Ах)Х). Непосредственно из определения 4.1 вытекает, что для любого линейного оператора А: С —> С! образом АО пулевого вектора в С является нулевой вектор 0' в ?': А@) — О'. Действительно, Рассмотрим несколько примеров линейных операторов. От- Отметим, что для того, чтобы доказать линейность какого-либо отображения линейных пространств, нужно проверить условия а), б) определения 4.1 или комбинированное условие D.1). На- Нарушение любого из этих условий означает, что отображение 5 Линейная алгебра
130 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ не является линейным. Линейный оператор переводит нулевой вектор снова в нулевой, и это свойство может рассматриваться как необходимое условие линейности (но не достаточное). >т Пример 4.1. Пусть Кп[х] — линейное пространство много- многочленов одного переменного х степени, не превышающей нату- натуральное число п. Для каждого многочлена Р(х) определена eroJ производная Р'(#), являющаяся многочленом степени не выше п — 1. Таким образом, на линейном пространстве Кп[х] опре- определено отображение ^, которое каждому многочлену ставит в соответствие его производную. В качестве пространства значений такого отображения можно выбрать как исходное пространство i^n[^]? так и пространство JFfn_i[x]. Оба отобра- отображения -—: Кп[х] -» Кп[х]9 —: Кп[х] -> Кп-г[х] являются линейными в силу свойств линейности производной (производная суммы функций равна сумме производных, при умножении функции на число производная этой функции умно- умножается на это число). Пример 4,2. В пространстве V2 свободных векторов на плоскости поворот вектора на заданный угол (р против часовой стрелки представляет собой отображение V<i в себя, являюще- являющееся линейным оператором. Линейность отображения вытекает из простых геометрических соображений. Во-первых, сумма свободных векторов может вычисляться по правилу паралле- параллелограмма, но тогда очевидно, что сумма двух векторов как диагональ параллелограмма при повороте векторов на угол (р также повернется на этот же угол. Во-вторых, умножение свободного вектора на число означает изменение его длины и, возможно, изменение его направления на противоположное. Ясно, что' можно сначала умножить вектор на число, а потом повернуть на угол у>, а можно выполнить эти две операции в обратном порядке, т.е. повернуть вектор, а затем умножить его на число. Результат в обоих случаях будет один и тот же.
4.1. Определение и примеры линейных операторов 131 > Пример 4.3. Рассмотрим n-мерное линейное арифметиче- арифметическое пространство Rn, элементы которого будем представлять как матрицы-столбцы длиной п, и квадратную матрицу А по- порядка п. Отображение А: Шп -> Кп, которое столбцу х ставит в соответствие столбец Ах (Ах = Ах), является линейным опе- оператором в силу свойств умножения матриц: А(Хх + цу) = А(Хх + fxy) = ХАх + \iAy — ХАх где Пример 4.4. В n-мерном линейном арифметическом про- пространстве W1 для любого действительного числа к отображение А: Шп ~> Rn, определяемое формулой Ах = кх (растяжение в к раз с дополнительным отражением при к < 0), является линей- линейным оператором. Этот линейный оператор — частный случай предыдущего, он может быть определен при помощи матрицы кЕ, где Е — единичная матрица. Пример 4.5. Отображение A: W1 -> Кп n-мерного линей- линейного арифметического пространства в себя, которое задается формулой Ах = х + а, где о Ф 0 — некоторый фиксированный вектор, не является линейным, так как, например, образом ну- нулевого вектора является вектор а. Определение 4.2. Каждому линейному оператору А: С -> -* С1 соответствуют: - его ядро кегЛ — множество тех векторов х Е С, для которых Ах = 0;, где 0' — нулевой вектор в ?'; - его образ im А — множество векторов у Е ?', являющихся значениями этого оператора. Теорема 4.1. Для любого линейного оператора А: С -> С его ядро кегЛ является линейным подпространством в ?, а его образ imA — линейным подпространством в С!. < Доказательство сводится к проверке условий определения 2.1 линейного подпространства. Пусть векторы х\ и x<i
132 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ принадлежат множеству кег А, т.е. Ах\ = О', Ах2 = О'. Тогда, согласно условию а) определения 4.1, А{х\ + х2) = Ахх + Ах2 = 0' + 0' = О', т.е. вектор х\+х2 принадлежит множеству kerA, а, согласно условию б) того же определения, для любого действительного числа А т.е. и вектор Хх\ принадлежат ker А. Как видим, множество кегА замкнуто относительно линейных операций и потому является линейным подпространством. Если векторы у\ и у2 принадлежат множеству imA, то существуют такие векторы х\, х2 Е ?, что у\ = Aa?i, y2 = Ах2. Но тогда, согласно условию а) определения 4.1, У\ + У2 = Ах\ + Ах2 = А(хг + х2), т.е. вектор у\ + у2 является значением оператора А и, следова- следовательно, принадлежит imA. Аналогично вектор Aj/i = A(Axi) = A(Xxi) также входит в множество im А для любого А ? R. Приходим к выводу, что и imA является линейным подпространством, но уже в линейном пространстве С. > Размерности ядра и образа — важнейшие характеристики линейного оператора. Число dim(ker А) называют дефектом линейного оператора А, а число dim(imA) — его рангом. Отметим, что в примере 4.3 ядро оператора А имеет простую интерпретацию: это есть множество решений однородной системы линейных алгебраических уравнений с матрицей А. Среди линейных операторов, отображающих линейное про- пространство С в себя есть два важных частных случая: тожде- тождественный оператор J, который каждый вектор переводит
4.1. Определение и примеры линейных операторов 133 (в себя Aж = аг), и нулевой оператор 0, который каждый вектор отображает в нулевой (&х = 0). Эти два оператора являются предельными с точки зрения дефекта и ранга. Ну- Нулевой оператор имеет максимальный дефект (равный dim С) и минимальный ранг (нулевой). Тождественный оператор, на- наоборот, имеет минимальный дефект (нулевой) и максимальный ранг (равный dim?). Оператор максимального дефекта опре- определен однозначно, а операторов минимального дефекта и мак- максимального ранга бесконечно много. Линейный оператор А: С -+ С с нулевым дефектом является инъективным. В самом деле, если дефект оператора равен ну- нулю, то ядро этого оператора содержит единственный вектор — нулевой. Бели Ах = Ау, то А(х — у) = 0. Значит, вектор х — у принадлежит ядру и потому является нулевым. Следоб&тельно, х = у, т.е. различные векторы имеют в линейном пространстве С! различные образы. Наоборот, если оператор является инъек- инъективным, то в нулевой вектор линейного пространства С может отображаться только нулевой вектор линейного пространства ?. Значит, ядро линейного оператора содержит только нулевой вектор и дефект линейного оператора равен нулю. Дефект d(A) и ранг Rg(A) оператора А: С-> С! связаны с размерностью пространства С соотношением d(A) + Rg(A) = = dim?. Действительно, рассмотрим прямое дополнение К к линейному подпространству kerA в линейном пространстве ?. Тогда d(A) + dim'H = dim?, и нам достаточно показать, что dimW = dimimA = Rg А. Линейный оператор А может рас- рассматриваться как линейный оператор из линейного простран- пространства % в линейное пространство С. Очевидно, что Ах = 0 при х € %, лишь если х = 0. Поэтому линейный оператор А: % -> im А на И имеет нулевой дефект и является сюръек- тивным. Значит, он осуществляет биективное отображение линейного пространства Н в линейное пространство imA. В следующем параграфе будет показано, что в этом случае раз- размерности пространств % и imA совпадают.
134 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 4.2. Изоморфизм линейных пространств Определение 4.3. Два линейных пространства ? и ?' на- называют изоморфными, если существует линейное биективное отображение А: ? -> ?'. При этом само отображение А назы- называют изоморфизмом линейных пространств С и С!. Как следует из данного определения, изоморфизм предста- представляет собой линейный оператор нулевого дефекта и макси- максимального ранга. Примером изоморфизма линейного простран- пространства в себя является тождественный оператор. Теорема 4.2. Два конечномерных линейных пространства изоморфны тогда и только тогда, когда они имеют одинаковую размерность. Ч Пусть линейные пространства С и С' имеют одинаковую размерность п. Мы докажем изоморфность этих линейных пространств, построив отображение А: С -> ?', являющееся изоморфизмом. Для этого выберем произвольные базисы Ь = = (bi ... Ьп) в линейном пространстве С и е = (ei ... еп) в линейном пространстве ?'. Любой вектор х Е С может быть разложен в базисе Ь, т.е. представлен в виде х = Ьх, где х — столбец координат этого вектора в базисе Ь. Вектору х € С поставим в соответствие вектор ex G ?', который в базисе е линейного пространства С имеет те же координаты, что и вектор х в базисе Ь. Заданное таким образом отображение А: С-+С является линейным оператором. Действительно, если взять произвольные векторы ж, у € ? со столбцами координат х, у, то А(х + у) = е{х + у) = ех + еу = Ах + Ау, так как при сложении векторов их координаты складываются. Точно так же при умножении вектора х со столбцом координат х на произвольное число А получаем А(Хх) = е(Хх) = \{ех) =
4.2. Изоморфизм линейных пространств 135 где опять-таки использованы правила умножения вектора на число в координатах. Линейный оператор А является инъективным, так как равенство Ах = Ау означает, что ех = еу или х = у в силу единственности разложения вектора по базису. Поэтому х = у. Линейный оператор А является сюръективным, так как лю- любой вектор у 6 С1 с координатами у в базисе е является образом вектора х = Ьу с теми же координатами у, что и у, но относи- относительно „своего" базиса Ь. Линейное, инъективное и сюрьек- тивное отображение, по определению 4.3, и есть изоморфизм. Следовательно, линейные пространства ? и С1 изоморфны, при этом изоморфизмом является построенный нами линейный опе- оператор А. Предположим теперь, что линейные пространства С и С1 изоморфны и пусть отображение А: С -> С1 является соответ- соответствующим изоморфизмом. В n-мерном линейном простран- пространстве С выберем некоторый базис Ь= (Ь\ ... Ьп) и докажем, что система векторов е = (АЬ\ ... АЬП), состоящая из обра- образов базисных векторов, является базисом в С'. Во-первых, система векторов е линейно независима. Возь- Возьмем произвольную линейную комбинацию этой системы векто- векторов с некоторыми коэффициентами х\, ..., хп и приравняем нулевому вектору 0' в ?': + ... + xnAbn = О'. Левая часть равенства является образом некоторого вектора х: +... + xnAen = A (xibi + ... + xnbn) = Ах, х = x\b\ +... + xnbn, координатами которого в выбранном ба- базисе Ъ являются коэффициенты линейной комбинации. Так как отображение А инъективно, а нулевой вектор из С1 является образом нулевого вектора из ?, заключаем, что х = 0, посколь- поскольку Ах = О7. Итак, xibi +... + xnbn = 0,
136 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ а это возможно, лишь если все коэффициенты линейной комби- комбинации равны нулю. Во-вторых, любой вектор у Е С! можно представить в виде линейной комбинации системы векторов е. В самом деле, так как отображение А сюрьективно, вектор у является образом некоторого вектЬра ж, имеющего в базисе Ь столбец координат х. Тогда у = Ах = A(xibi + ... + xnbn) = xi (Abi) + ... + хп{АЬп), и мы получаем разложение у по системе векторов е, коэффици- коэффициентами в котором являются координаты вектора х в базисе Ь. Система векторов е линейно независима, и в ней можно раз- разложить любой вектор линейного пространства ?'. Значит, эта система является базисом в С!. При этом количество векто- векторов в е совпадает с количеством векторов в базисе Ъ линейного пространства ?, следовательно, размерности пространств С и С1 совпадают. > Следствие 4.1. Все n-мерные линейные пространства изоморфны линейному арифметическому пространству Кп. Построенный в доказательстве теоремы 4.2 изоморфизм связан с выбором базисов в линейных пространствах С и ?'. Если в той или иной ситуации мы можем считать, что базис в линейном пространстве фиксирован, то вместо абстрактного n-мерного линейного пространства можно использовать п стан- стандартное" линейное арифметическое пространство Кп. Все рас- рассуждения и выкладки в линейном арифметическом простран- пространстве носят более конкретный и интуитивно понятный характер. Но считать базис в линейном пространстве фиксированным не всегда приемлемо, поэтому нельзя считать идентичными произвольные n-мерные линейные пространства. Обычно ото- отождествляют линейные пространства, между которыми суще- существует „естественный" изоморфизм, не связанный с выбором того или иного базиса. Например, как линейные простран- пространства тождественны линейное пространство матриц типа тхп
4.3. Матрица линейного оператора 137 и линейное арифметическое пространство Rmn, так как меж- между ними возникает изоморфизм, если установить соответствие между элементами матрицы типа mxn и компонентами mn- мерного арифметического вектора. Точно так же можно не различать линейное пространство строк длины п и линейное пространство столбцов высоты п. Указанное отождествление линейных пространств позволя- позволяет записывать векторы линейного арифметического простран- пространства в зависимости от ситуации и как матрицы-строки, и как матрицы-столбцы. Напомним, что элементами n-мерного ли- линейного арифметического пространства являются упорядочен- упорядоченные совокупности из п чисел. Порядок чисел в каждой такой совокупности можно задавать различными способами, и запись ее в строку или столбец — лишь две возможности из бесчислен- бесчисленного множества способов. Пример 4.6. В линейном пространстве К^[х] многочленов переменного х степени не выше трех элементы 1, ж, ж2, х3 образуют базис. Этому базису соответствует изоморфизм между К$[х) и R4, при котором многочлену ао + a,\x + а^х2 + + аз#3 сопоставляется арифметический вектор (ао, аь а2-> #з)- 4,3. Матрица линейного оператора Пример 4.3 более глубок, чем это может показаться с пер- первого взгляда. Фактически любой линейный оператор можно интерпретировать как линейный оператор, описанный в этом примере, т.е. действие линейного оператора сводится к умно- умножению столбца координат вектора на матрицу. Поясним это подробнее. Пусть задан линейный оператор А: С -» ?, т.е. линейное преобразование п-мерного линейного пространства С в себя. Выберем базис Ъ = (bi ... Ьп) в С. Действие линейного опе- оператора полностью определено, если известны образы векто-
138 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ ров базиса. Действительно, если вектор х имеет координаты х = {хг ... xnf, то Ах = A(xibi +... + xnbn) = xi(Abi) +... + хп(АЬп), т.е., зная векторы -АЬ^, мы можем найти образ любого вектора х линейного пространства ?. Рассмотрим действие линейного оператора А на векторы базиса Ь. Обозначим столбцы координат векторов АЬ{ в базисе Ь через а*, а^ = (ац ... щп) , г = 1, п. Тогда j = bdi, i = 1, п. Определение 4.4. Матрицу А = (а\ ... ап), составленную из координатных столбцов векторов АЪ\, ..., АЬп в базисе Ь= (bi ... Ьп) называют матрицей линейного оператора А в базисе Ь. Матрица линейного оператора А: С -> С является квадрат- квадратной, ее порядок совпадает с размерностью линейного про- пространства С. Рассмотрим несколько примеров линейных операторов и их матриц. Пример 4.7. Матрицей нулевого оператора ©:?->? независимо от выбора базиса является нулевая матрица соот- соответствующего типа. Действительно, образом любого вектора в случае нулевого оператора является нулевой вектор. Поэтому матрица нулевого оператора в любом базисе должна состоять из нулевых столбцов. Пример 4.8. Матрица тождественного оператора I также не зависит от выбора базиса и в любом базисе явля- является единичной. Действительно, взяв произвольный базис
4.3. Матрица линейного оператора 139 = (&i ... Ьп), заключаем, что при ii = 1, n О 1 о где единица в последнем столбце стоит на г-м месте. Видно, что столбец координат вектора Ify является г-м столбцом единичной матрицы. Теорема 4.3. Пусть А: С -> С — линейный оператор. Тогда столбец у координат вектора у = Ах в данном базисе b линейного пространства С равен произведению Ах матрицы А оператора А в базисе b на столбец х координат вектора х в том же базисе: у = Ах. <4 Выберем произвольный вектор х = х\Ь\ + ... + xnbn* Его образом будет вектор у = Ах = A(a?i6i +... + ЖпЫ = +... + жп(АЬп) = Столбец координат вектора Ах в базисе Ъ имеет вид пц ... ал„ \ l xi ¦ • - • + о,ппхп Запись у = Ах из формулировки теоремы 4.3 удобно назы- называть матричной формой записи действия линейного оператора А в базисе Ь.
140 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Замечание 4.1. Выкладки, приведенные в доказательстве теоремы, можно упростить, если использовать матричные обо- обозначения и правила выполнения матричных операций. Полагая, что строка образов базисных векторов (АЬ\ ... АЬп) получа- получается „умножением" строки векторов Ь слева на оператор А: (АЬг .. получаем Ab=(Ab\ ... Abn) = (ba\ ... ban) = b(a\ ... an) = 6A, так как 6а^ — матричная запись разложения вектора Abi no базису 6, г = 1, п. Здесь мы использовали технику операций с блочными матрицами. Взяв произвольный вектор х = Ьж, получаем Ах = A(fcc) = (АЬ)ж = (ЬА)х = Ь(Ас). Это означает, что столбец Ах является столбцом координат вектора Ах. Пример 4.9. Рассмотрим отображение A: V$ —> V3, кото- которое каждый вектор х преобразует в его векторное произведе- произведение Ах = xxi на орт г оси Ох. В силу свойств векторного произведения это отображение — линейный оператор. Найдем матрицу А этого линейного оператора в (правом) ортонорми- рованном базисе г, j} fc. Для этого надо найти образы базис- базисных векторов и разложить их по тому же базису. Поскольку Ai = г х г — 0, то первый столбец в матрице А нулевой. Далее получаем второй столбец матрицы А\ ( °' Aj =jxi = -fc = Oi + Oj-lfc = (i j k)\ 0 V-i Затем третий столбец:
I 4.3. Матрица линейного оператора 141 % Итак, матрица А имеет вид \- А = Действие линейного оператора А на вектор х можно теперь записать как умножение столбца координат (х у z) вектора х слева на матрицу оператора: Ах = (* j k)A # Матрица линейного оператора полностью характеризует линейный оператор. В то же время, какую бы квадратную ма- матрицу порядка п мы ни взяли, она будет матрицей некоторого линейного оператора в заданном базисе n-мерного линейно- линейного пространства (см. пример 4.3). Таким образом, между линейными операторами, действующими в данном n-мерном ли- линейном пространстве С и квадратными матрицами порядка п существует соответствие, которое является взаимно однознач- однозначным, что и утверждает следующая теорема. Теорема 4.4. Пусть 6 — произвольный базис в п-мерном линейном пространстве ?. Различным линейным операторам Л и В, действующим в пространстве ?, соответствуют и различные матрицы в базисе Ь. Любая квадратная матрица А порядка п является матрицей некоторого линейного оператора, действующего в линейном пространстве ?. < Бели матрицы А и В операторов А и В в базисе Ь совпадают, то, согласно теореме 4.3, для любого вектора х со столбцом координат х Ах = ЬАх = ЬВх = Вх,
142 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ т.е. образы произвольного вектора при двух отображениях совпадают. Следовательно, совпадают и сами отображения. Пусть А = (а>ц) — произвольная квадратная матрица по- порядка п. Определим отображение А: С-± С согласно формуле А(х) = ЪАх, где х — столбец координат вектора х. Несложно проверить, что заданное таким образом отображение являет- является линейным оператором. Действительно, для любых векторов ж, у ? С и любых действительных чисел А, /х А(Хх + цу) = ЬА{\х + ну) = Х(ЬАх) = ХА(х В этой выкладке мы использовали теорему 1.3 и свойства умножения матриц. Вычислив для i = 1, п столбец координат образа г-го вектора из базиса Ь = ЬА /0\ 0 1 0 W = ь (аи \ аи \ ani ) где единица стоит в г-й строке, убеждаемся, что он совпадает с г-м столбцом матрицы А и поэтому матрица заданного линейного оператора совпадает с исходной матрицей А. > Теорема 4.5. Ранг матрицы линейного оператора А: ? -» -» С совпадает с рангом этого оператора. А Образ imA линейного оператора А представляет собой ли- линейную оболочку системы векторов АЪ\, ..., АЬП} где &i, ..., Ьп — некоторый базис линейного пространства ?. Размер- Размерность линейного подпространства imA, представляющая собой ранг оператора, совпадает с максимальным количеством ли- линейно независимых векторов в системе Abi, ..., АЪп и равна
\ 4.4. Преобразование матрицы линейного оператора. 143 максимальному количеству линейно независимых столбцов в матрице А, составленной из столбцов координат этих векто- векторов. Но матрица А является матрицей оператора А, Значит, dimim А совпадает с рангом матрицы оператора А в указанном базисе. Поскольку понятие ранга линейного оператора не зави- зависит от выбора базиса, то и ранг его матрицы в любом базисе один и тот же. > Замечание 4.2. Связь между линейными операторами и матрицами, вскрытая доказанными теоремами, позволяет дать геометрическую интерпретацию системе линейных алгебраи- алгебраических уравнений (СЛАУ). Если СЛАУ записать в матричной форме Ах = ft, то матрицу А можно связать с некоторым ли- линейным оператором А, а столбцы х и ft интерпретировать как столбцы координат векторов ж и 6. Мы приходим к опера- операторному уравнению, Ах = 6, решение которого означает опре- определение вектора х по его образу Ь. В частном случае Ь = О СЛАУ однородна, а решение операторного уравнения означает определение ядра оператора. Отметим, что тривиальное ре- решение х = 0 однородной СЛАУ Ах = 0 соответствует нулевому вектору, всегда входящему в ядро оператора. 4.4. Преобразование матрицы линейного оператора Матрица линейного оператора изменяется, когда изменя- изменяется базис линейного пространства. Возникает естественный вопрос, как она изменяется. Напомним, что связь двух базисов, старого (исходного) и нового, отражается матрицей перехода. Теорема 4,6. Матрицы Аь и Ае линейного оператора А: С —> ?, записанные в базисах Ьие линейного пространства ?, связаны друг с другом соотношением Ае = СГ %С/, D.2) где U = Ub->e — матрица перехода от базиса Ь к базису е.
144 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ / М Пусть у = Ах. Обозначим координаты векторов х и у/в старом базисе Ь через хь и уь, а в новом базисе е — через хеире. Поскольку действие линейного оператора А в матричной форме в базисе Ь имеет вид уь = Аьхь (см. теорему 4.3), а координаты векторов ж и у в новом и старом базисах связаны между собой равенствами (см. 1.8) хь = Uxe, уь = Uye, то получаем Уе = u~lyb = U-\Abxb) = [Г1 (АбСЛге) = (СГ %17) *в. Равенство уе = (J7 Л^С/) я?е является матричной формой записи действия линейного оператора А в базисе е и поэтому, согласно теореме 4.4, U~~lAbU = Ae. Изложенное доказательство теоремы хорошо иллюстрирует следующая диаграмма: Аеу %е ^ Уе X -^> Определение 4.5. Квадратные матрицы А и В порядка п называют подобными, если существует такая невырожденная матрица Р, что Р~1АР = В. Формула D.2) означает, что матрицы, представляющие один и тот же линейный оператор в разных базисах, являют- являются подобными. Верно также и обратное: если две матрицы А и В подобны, т.е. В = Р~1АР, то их можно рассматривать как матрицы одного оператора, но в разных базисах. Дей- Действительно, в произвольном п-мерном линейном пространстве зафиксируем произвольный базис Ъ и выберем линейный опера- оператор, который в этом базисе имеет матрицу А. Тогда в базисе е = ЪР этот же оператор будет иметь матрицу Р~1АР = В.
\ 4.4. Преобразование матрицы линейного оператора 145 \ Теорема 4.7. Если матрицы А и В подобны, то det A = 4detJ5. Ч рели матрицы А и В подобны, то, согласно определению 4.5, существует такая невырожденная матрица Р, что В — Р АР. Так как определитель произведения квадратных матриц ра- равен произведению определителей этих матриц, a det(P-1) = = (detP) [III], то получаем detS = det {P~lAP) = det (P~l) det AdetP = det A. > Следствие 4.2. Определитель матрицы линейного опера- оператора не зависит от выбора базиса. Ч Действительно, возьмем матрицы Аь и Ае линейного опера- оператора А в двух различных базисах Ъ и е. Согласно теореме 4.6 и определению 4.5 эти матрицы подобны. Поэтому det Аь = det Ae по теореме 4.7. > Следствие говорит о том, что, хотя матрица линейного опе- оператора и изменяется при замене базиса, определитель ее при этом остается неизменным. Значит, этот определитель ха- характеризует не конкретную матрицу оператора в конкретном базисе, а сам оператор. Это позволяет ввести следующее по- понятие. Определение 4.6. Определителем линейного опера- оператора называют определитель его матрицы в каком-либо ба- базисе. Пример 4.10. Линейный оператор A: V^ —> V3, определяе- определяемый формулой Ах = жхг, в базисе г, j, к имеет матрицу А = (см. пример 4.9). Определитель этой матрицы равен нулю. Значит, и в любом другом базисе определитель матрицы этого линейного оператора равен нулю.
146 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 4.5. Произведение линейных операторов Пусть в линейном пространстве С действуют два линещьых оператора Аи В. Рассмотрим отображение В А: С-> ?, кото- которое является композицией двух отображений и задается фор- формулой (ВА)х = В (Ах). Это отображение является линейным, так как для любых векторов ж и у и любых действительных Л и fi (В А) (Хх + цу) = В (А(Хх + цу)) = В(ХАх + рАу) = = ХВ(Ах) + fiB(Ay) = Х{В А)х + »(ВА)у. Введенный нами линейный оператор В А называют произ- произведением линейных операторов В и Л. Теорема 4.8. Пусть в линейном пространстве С действуют линейные операторы АиВ,аАи5 — матрицы этих линейных операторов в некотором базисе Ь, Тогда матрицей линейного оператора В А в том же базисе Ь является матрица В А. < Действие линейного оператора на вектор в данном базисе представляется как умножение матрицы этого оператора на столбец координат вектора. Поэтому для произведения двух операторов А и В получаем (ВА)х = В(Ах) = В(ЬАх) = Ь(В(Ах)) = Ь(ВА)х. > Если линейный оператор А: С -+ С представляет собой би- биективное отображение, то существует обратное отображение А~1:С^?. Теорема 4.9. Если линейный оператор А имеет обратное отображение А", то это отображение линейно, причем если матрицей А в данном базисе Ь является А, то матрицей линейного оператора А~1 в том же базисе является А~1. -4 Любым векторам у\ и y<i линейного пространства С соответ- соответствуют такие однозначно определенные векторы х\ и Ж2, что
4.5. Произведение линейных операторов 147 = Ах{, г = 1,2. При этом для любых действительных Л и \± тору \у\ + /лу2 соответствует вектор Хх\ +/ла?2, так как A(Xxi + fix2) = AAxi + /iAx2 = Ayi + /iy2. Поэтому A~l (\yi + 1лу2) = Axi + /хж2 = XA~lyi +fj,A~ly2. Следовательно, отображение А линейно. Отметим, что произведение операторов А~1 и Л, как ком- композиция прямого и обратного отображений, является тожде- тождественным оператором. Согласно теореме 4.8, произведение матриц А1 и А этих операторов равно единичной матрице Е: А'А = Е. Это значит, что матрица А1 оператора А~1 является обратной к матрице А оператора А: А1 = А~1. > Замечание 4.3. Для любых двух линейных операторов А и В, действующих в линейном пространстве ?, выполняется соотношение Rg(AB) ^ min{Rg A,RgB}. Действительно, рассмотрим оператор А как линейный опе- оператор A: imJB —>• ?. Размерность образа оператора, т.е. его ранг, не превосходит размерности линейного пространства, из которого он действует, так как сумма дефекта и ранга совпа- совпадает с размерностью этого пространства (см. 4.1). В нашем случае имеем Rg{AB) = dimim(AB) ^ dimimB = RgB. Так как образ линейного оператора АВ является линейным подпространством образа линейного оператора А, то Rg(AB) < RgA. Доказанное соотношение можно перенести на квадратные матрицы с помощью теорем 4.5 и 4.4. В результате по- получаем, что ранг произведения матриц АВ не превосходит
148 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ / min{Rg A, Rg JB}. Особо отметим случай, когда одна из матри^, например JB, является невырожденной. Тогда Rg(AB) ^ Rg-4'и одновременно Rg A = Rg{{AB)B~l) < Rg(AB). Следовательно, при умножении матрицы А справа на невырожденную матрицу ее ранг не изменяется. При умножении матрицы А слева на невырожденную матрицу ранг также не изменяется, что дока- доказывается аналогично. 4.6. Линейные пространства линейных операторов Обозначим через L(?,?') множество всех линейных опера- операторов, действующих из линейного пространства ? в линейное пространство ?'. В этом множестве введем операции сло- сложения линейных операторов и умножения линейного оператора на действительное число. Суммой линей- линейных операторов А, В Е Ь(?,?') назовем оператор А + В Е Е L(?,?'), определяемый формулой (А + В)х = Ах + Вх, х Е ?, а произведением линейного оператора А € ?(?,?') на действительное число X назовем оператор ЛАЕ ?(?,?'), действующий согласно формуле {ХА)х = Х(Ах). Поскольку {А + В){ах + Ру) = А{ах + Ру) + В{ах + Ру) = = {а Ах + РАу) + {аВх + PBy) = = а{Ах + Вх) + р{Ау + By) = = а{А + В)х + р{А + В)у
4.6. Линейные пространства линейных операторов 149 = \(А{ах + (Зу)) = \(А(ах) + А@у)) = = (Аа) Аж + (А/3) Ау = (аЛ) Ах + (/ЗА) Ау = = а(ААж) +/3(ААу) = а((АА)ж) + /?((АА)у), отображения А + В и А А действительно являются линейными операторами. Таким образом, относительно введенных нами операций множество ?(?,?') замкнуто. Проверив аксиомы линейного пространства, можно убедиться, что ?(?,?') отно- относительно этих операций является линейным пространством. Для каждого линейного оператора А: ? -> ?' определен линейный оператор (—А), задаваемый равенством (—А)х = = — (Ах). Нетрудно проверить, что (—А) действительно ли- линейный оператор: = А((-А)х В сумме с А линейный оператор (—А) дает нулевой опе- оператор. Поэтому в соответствии с терминологией линейных пространств (—А) называют оператором, противополож- противоположным к А. Линейное пространство L(C,C) линейных операторов из линейного пространства С в себя называют линейным про- пространством линейных операторов (преобразований) пространства С. Каждому линейному оператору А € L(?,?), действующе- действующему в п-мерном линейном пространстве ?, в заданном базисе Ь соответствует ква'дратная матрица А порядка п (матрица этого линейного оператора). Тем самым определено отобра- отображение Ф: L(C,C) -> Мп(Ш) из линейного пространства L(?,?) в линейное пространство Мп(Ш) квадратных матриц порядка п с действительными коэффициентами, при этом Ф(А) = А. Со- Согласно теореме 4.4 отображение Ф является биективным.
150 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ Теорема 4.10, Пусть в n-мерном линейном пространстве С задан некоторый базис 6. Тогда отображение Ф: L(?,?) -> -)-Mn(R), сопоставляющее каждому линейному оператору его матрицу в базисе Ь, является изоморфизмом линейных про- пространств L(C,C) и Мп(Ш). <4 Как мы уже отметили, отображение Ф биективно, и нам остается показать, что оно линейно. Пусть А и В — два произвольных линейных оператора из линейного пространства L(?,?). Тогда для любого вектора ж 6 ? со столбцом коорди- координат х (А + В)х = Ах + Вх = ЬАх + ЬВх = Ь({А + В)х), где А и В — матрицы операторов А и В в базисе Ь. Итак, действие линейного оператора А + В в базисе Ь записывается как умножение столбца координат вектора слева на матрицу А + В. Значит, А + В и является матрицей линейного оператора А + В. Итак, сложению линейных операторов при отображении Ф соответствует сложение их матриц. Аналогично умножению линейного оператора на действительное число Л соответству- соответствует умножение его матрицы на это число: {ХА)х = \{Ах) = \{ЬАх) = Ь((\А)х). Условия а), б) определения 4.1 выполнены, поэтому отображе- отображение Ф линейно > Следствие 4.3. Если матрицы А, В € Mn(R) являются матрицами линейных операторов А, В € L(?,?) в некотором базисе b линейного пространства ?, то для любых чисел А и // матрица ХА + /лВ является матрицей линейного оператора ХА + /аВ ? L(?, С) в том же базисе 6. < Эта формулировка лишь перефразирует утверждение, что отображение Ф: L(C,C) -» МП(К) является линейным, что до- доказано в теореме 4.10. >
Вопросы и задачи 151 Вопросы и задачи 4.1. Выясните, являются ли линейными следующие отобра- отображения пространства V3: а) ж-» 3(а?,ж)ж; б) ортогональная проекция на плоскость хОу; в) х —? (хха) хЬ, где а,Ъ — фик- фиксированные векторы пространства V3. 4.2. Выясните, являются ли линейными следующие отобра- отображения линейного пространства всех многочленов от перемен- переменной t в себя: а) умножение многочлена на t\ б) умножение многочлена на t2; в) дифференцирование многочлена. 4.3. Будет ли линейным отображение A: R3 ~> R3, если: а) А(х) = (sinzi, 0, я3); б) А(х) = (xi + я3, 2х2 + яз, -хг), где 4.4. Покажите, что линейным оператором является ото- отображение Л, которое каждый вектор х = ct\e\ + ... + сепеп, заданный в линейном пространстве С своими координатами от- относительно базиса е = (е\ ... еп), отображает в вектор А(х) = = ot\e\ + ... + o:mem, где т <п (оператор проектирования на подпространство span{ei,..., ет}). Найдите матрицу этого ли- линейного оператора в базисе е. 4.5. Запишите в заданном базисе матрицу следующих ли- линейных операторов, действующих в линейном пространстве V3: а) оператора проектирования на плоскость хОу, базис г, б) оператора проектирования на ось Оу, базис г, j, fe; в) оператора проектирования на плоскость хОу, базис в\ = 4.6. В пространстве V3 задан вектор с = Зг — 2j + fc. Дока- Докажите, что отображение А, определяемое условием -A(as) = с х ж, является линейным. Найдите его матрицу в базисе г, j, fc.
152 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 4.7. В линейном пространстве Кп[х\ многочленов перемен- переменного х степени не выше п задан линейный оператор дифферен- дифференцирования Х?[Р(#)] = Р;(х). Запишите матрицу этого операто- оператора в базисе х2 хп ei = 1, е2 = я, ез = -г𠦕•> еп = —. 4.8. Пусть ? и ?' — линейные пространства. Какому линейному пространству изоморфно пространство ?(?,?')? Чему равна размерность пространства L(?,?;)? 4.9. Определите, какие из следующих отображений A: R3 -» -> R3 являются линейными: а) А(х) = (хг +1, гс2, ж3 + 3); б) Л(ж) = (zf ) в) А(х) = (a?i - г) А(х) = (х2 если x = (xi, x2, жз). Для линейных операторов найти матрицы в базисе, в котором заданы векторы х и А(х). 4.10. Рассмотрим линейное пространство всех матриц вто- второго порядка. Покажите, что умножение справа любой матри- матрицы этого пространства на матрицу 0-П есть линейный оператор. Найдите матрицу этого оператора в базисе 1 0\ /0 j eU o 1\ /0 0\ /0 0\ 4.11. Покажите, что в линейном арифметическом простран- пространстве R3 существует единственный линейный оператор, перево- переводящий векторы ai, a2, аз соответственно в векторы bi, Ь2, Ьз?
Вопросы и задачи 153 и найдите матрицу этого оператора в том же базисе, в котором даны координаты указанных векторов: a) б) в) 4.12. Линейный оператор А в базисе (ei e2 ез е±) имеет матрицу A2 0 1 3 0-12 2 5 3 1 12 13, Найдите матрицу этого оператора в базисе: а) в4, в2, ез, еи б) /i=eb /2 = ei+e2, /з = е1+е2 + ез, /4 = в) /i = ei - е2, /2 = ei - е3, /з = ех - е4, /4 = е4.
154 4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 4.13. Как изменится матрица линейного оператора, если в базисе (ei ... еп) поменять местами два вектора е\ и е^? 4.14. Линейный оператор А в базисе (ei е2 ез) имеет матрицу /15 -11 5> А= [ 20 -15 8 V 8 -7 6, Найдите матрицу этого оператора в базисе f\ = 2е\ + Зе2 + /2 = 3ei + 4е2 + е3, /з = ei + 2е2 + 2е3. 4.15. Линейный оператор A G L(E3,K3) в базисе имеет матрицу 1 -18 15> А= | -1 -22 18 1 -25 22; Найдите матрицу этого оператора в базисе 4.16. Найдите матрицу линейного оператора дифференци- дифференцирования, действующего в линейном пространстве многочленов степени не выше двух, в базисе е\ = 1, е2 = #, ез = ж2. Используя матрицу перехода, найдите матрицу этого оператора в базисе
5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 5.1. Характеристическое уравнение матрицы Для произвольной квадратной матрицы А = (а^) порядка п рассмотрим определитель det(A-XE) = an-A а\п ~ А — А где Е — единичная матрица, а А — действительное перемен- переменное. Относительно переменного А этот определитель является многочленом степени п и может быть записан в виде Ха (А) = det(A - ХЕ) = ? (-1)ЧА*, E.1) где множители (—1)* введены для удобства. Определение 5.1. Многочлен ха(Х) = det(A — XE) назы- называют характеристическим многочленом матрицы Л, а уравнение хл(А) = 0 — характеристическим уравнением матрицы А. Пример 5.1. Найдем характеристическое уравнение ма- матрицы G20' 0 1 3 0 3 4
156 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Для этого раскроем определитель: 7-А 2 О О 1-А 3 О 3 4-А = G - А) (A-А)D-А) - 9) = -А3 + 12А2 - ЗОА - 35. Итак, характеристическое уравнение заданной матрицы имеет вид -А3 +12А2 - ЗОА - 35 = 0. # Квадратную матрицу можно использовать в качестве значе- значения переменного в произвольном многочлене. Тогда значением многочлена от матрицы будет матрица того же порядка, что и исходная [III]. Интерес представляют такие многочлены, зна- значение которых от данной матрицы есть нулевая матрица. Их называют аннулирующими многочленами. Оказывается, что одним из таких аннулирующих многочленов для матрицы явля- является ее характеристический многочлен. Теорема 5.1 (теорема Кэли — Гамильтона). Для любой квадратной матрицы характеристический многочлен является ее аннулирующим многочленом. # Выясним, как связаны между собой характеристические многочлены подобных матриц. Теорема 5.2. Характеристические многочлены (уравне- (уравнения) подобных матриц совпадают. < Пусть квадратные матрицы А и А1 одного порядка подобны, т.е. существует такая невырожденная матрица Р того же порядка, что А1 = Р~~1АР. Тогда в силу свойств определителей [III] имеем f - ХЕ) = det(PAP - \P~lEP) = A - \E)P) = detP-1 det(A - AE)detP =
5.2. Характеристическое уравнение линейного оператора 157 5.2. Характеристическое уравнение линейного оператора Рассмотрим линейный оператор А: ? -» ?, действующий в линейном пространстве ?. Выберем в линейном простран- пространстве ? некоторый базис Ь и запишем в этом базисе матрицу А = (dij) линейного оператора А. Согласно следствию 4.3 ма- матрица А — ХЕ является матрицей линейного оператора А — AI, где I — тождественный оператор. Определитель det(A — ХЕ) матрицы линейного оператора А — Л/, согласно следствию 4.2, от выбора базиса не зависит. Значит, характеристический многочлен ха(Х) матрицы А является также характеристи- характеристическим многочленом любой другой матрицы оператора А и совпадает с определителем линейного оператора А — XI. Мы можем ввести следующее определение. Определение 5.2. Характеристическим многочле- многочленом линейного оператора А: ? -» ? называют характери- характеристический многочлен его матрицы А, записанной в некотором базисе, а характеристическим уравнением этого опера- тора — характеристическое уравнение матрицы А. Определение корректно, так как характеристический мно- многочлен не зависит от выбора базиса. При этом коэффициенты dk характеристического многочлена, представленного в виде E.1), также не связаны с используемым базисом, т.е. являются инвариантами относительно выбора базиса. Другими слова- словами, коэффициенты <4 отражают свойства самого оператора, а не его матрицы А, являющейся записью оператора в конкрет- конкретном базисе. Коэффициенты d^ могут быть выражены в виде многочле- многочленов от элементов матрицы оператора. Таким образом, хотя коэффициенты матрицы меняются при замене базиса, некото- некоторые выражения от этих коэффициентов остаются неизменны- неизменными. Наиболее просто выражается коэффициент dn-i = ац + а22 +. ¦. + апп,
158 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ равный сумме диагональных элементов матрицы А, Этот коэффициент называют следом линейного оператора А (следом матрицы А) и обозначают tr A (tvA) или sp A (spA). Коэффициент do характеристического многочлена совпадает со значением этого многочлена при А = 0 и равен определителю линейного оператора А. Пример 5.2. В линейном пространстве ХгМ многочленов степени не выше двух элементы 1, я, х2 образуют базис. Матрица А линейного оператора дифференцирования в этом базисе имеет вид /О 1 А= 0 0 2 О О О Вычислив определитель -А 1 0 0 -А 2 0 0 -А и приравняв его нулю, получим характеристическое уравнение этого линейного оператора: А3 = 0. 5.3. Собственные векторы линейного оператора Определение 5.3. Ненулевой вектор х в линейном про- пространстве С называют собственным вектором линейно- линейного оператора А: ? -» ?, если для некоторого действительно- действительного числа А выполняется соотношение Ах = Ааг. При этом число А называют собственным значением (собственным чи- числом) линейного оператора А. Пример 5.3. В линейном пространстве Кп[х] многочленов степени не выше п содержатся многочлены нулевой степени, т.е. постоянные функции. Так как -?- = 0 = 0 • с, многочлены ах
5.3. Собственные векторы линейного оператора 159 нулевой степени р(х) = с ф 0 являются собственными векторами линейного оператора дифференцирования, а число Л = 0 — собственным значением этого оператора. # Множество всех собственных значений линейного операто- оператора называют спектром линейного оператора. Каждый собственный вектор связан со своим собственным значени- значением. Действительно, если вектор ж одновременно удовлетворяет двум равенствам Ах = Хх и Ах = /хж, то Аж = /4Ж, откуда (Л — fi)x = 0. Если А — /л Ф О, умножим равенство на число (А — /i) ив результате получим, что х = 0. Но это противоре- противоречат определению собственного вектора, так как собственный вектор всегда ненулевой. Каждому собственному значению отвечают свои собствен- собственные векторы, причем таких бесконечно много. Действительно, если х — собственный вектор линейного оператора А с соб- собственным значением А, т.е. Ах = Аж, то для любого ненулевого действительного числа а имеем ах ^0 и А(ах) = а(Ах) = = аАж = А(аж). Значит, и вектор ах является для линейного оператора собственным. Замечание 5.1. Часто говорят о собственных значени- значениях (числах), спектреи собственных векторах квадрат- квадратной матрицы. При этом имеют в виду следующее. Матрица А порядка п является матрицей некоторого линейного опера- оператора в фиксированном базисе, действующего в п-мерном ли- линейном пространстве. Например, если остановиться на стан- стандартном базисе в линейном арифметическом пространстве Rn, то матрица А определяет линейный оператор А, отобра- отображающий вектор ж G Кп со столбцом координат х в вектор со столбцом координат Ах. Матрицей А как раз и является ма- матрица А. Естественно отождествить оператор с его матрицей аналогично тому, как арифметический вектор отождествля- отождествляется со столбцом своих координат. Такое отождествление, которое часто используется и при этом не всегда оговаривает- оговаривается, позволяет перенести на матрицы „операторные" термины.
160 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Спектр линейного оператора тесно связан с его характери- характеристическим уравнением. Теорема 5.3. Для того чтобы действительное число А явля- являлось собственным значением линейного оператора, необходимо и достаточно, чтобы оно было корнем характеристического уравнения этого оператора. А Необходимость. Пусть число А является собственным значением линейного оператора А: С —> ?. Это значит, что существует вектор ж Ф О, для которого Ах = Аж. E.2) Отметим, что в С действует тождественный оператор I: 1х = х для любого вектора ж. Используя этот оператор, преобразуем равенство E.2): Ах = А/ж, или (А-А/)ж = 0. E.3) Запишем векторное равенство E.3) в каком-либо базисе Ь. Ма- Матрицей линейного оператора А — XI будет матрица А — ХЕ, где А — матрица линейного оператора А в базисе Ь, а Е — еди- единичная матрица, и пусть х — столбец координат собственного вектора ж. Тогда х ф 0, а векторное равенство E.3) равносиль- равносильно матричному (А-ХЕ)х = 0, E.4) которое представляет собой матричную форму записи одно- однородной системы линейных алгебраических уравнений (СЛАУ) с квадратной матрицей А — ХЕ порядка п. Эта система име- имеет ненулевое решение, являющееся столбцом координат х соб- собственного вектора ж. Поэтому матрица А — ХЕ системы E.4) имеет нулевой определитель [III], т.е. det(A — ХЕ) = 0. А это означает, что А является корнем характеристического уравне- уравнения линейного оператора А.
5.3. Собственные векторы линейного оператора 161 Достаточность. Легко убедиться, что приведенные рассуждения можно провести в обратном порядке. Если А явля- является корнем характеристического уравнения, то в заданном базисе Ь выполняется равенство det(A — \Е) = 0. Следователь- Следовательно, матрица однородной СЛАУ E.4), записанной в матричной форме, вырождена, и система имеет ненулевое решение х. Это ненулевое решение представляет собой набор координат в бази- базисе Ь некоторого ненулевого вектора х, для которого выполняет- выполняется векторное равенство E.3) или ему эквивалентное равенство E.2). Мы приходим к выводу, что число А является собствен- собственным значением линейного оператора А. > Каждому собственному значению А матрицы (линейного оператора) сопоставляют его кратность, полагая ее равной кратности корня А характеристического уравнения этой ма- матрицы (этого линейного оператора). Множество всех собственных векторов, отвечающих данно- данному собственному значению линейного оператора, не является линейным подпространством, так как это множество не со- содержит нулевого вектора, который, по определению, не может быть собственным. Но это формальное и легко устранимое препятствие является единственным. Обозначим через ?(-4., А) множество всех собственных векторов линейного оператора А в линейном пространстве С, отвечающих собственному значе- значению А, с добавленным к этому множеству нулевым вектором. Теорема 5.4. Множество ?(А,А) является линейным подпространством в ?. < Выберем произвольные два вектора х,у Е ?(А, А) и докажем, что ^ля любых действительных а и /5 вектор ах + /Зу также принадлежит ?(А, А). Для этого вычислим образ этого вектора под действием линейного оператора А: А{ах + (Зу) = А(ах) + А(/Зу) = аАх + (ЗАу = = а{Хх) + 0{\у) = Х(ах) + \(Cу) = \{ах + /Зу). ft IT идейная япгебпя
162 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Таким образом, для вектора z = ax + {3y выполняется соот- соотношение Az = \z. Если z — нулевой вектор, то он принадлежит ?(А,А). Если же он ненулевой, то, согласно доказанному соот- соотношению, он является собственным с собственным значением А и опять-таки принадлежит множеству ?(j4,A). > Линейное подпространство ?(А,А) иногда называют соб- собственным подпространством линейного оператора*. Оно является частным случаем инвариантного подпро- подпространства линейного оператора А — такого линейного под- подпространства К, что для любого вектора х 6 % вектор Ах также принадлежит %. Инвариантным подпространством линейного оператора яв- является также линейная оболочка любой системы его собствен- собственных векторов. Инвариантным подпространством линейного оператора, не связанным с его собственными векторами, явля- является образ оператора. Линейный оператор А: ?-> С можно рассматривать как ли- линейное отображение любого своего инвариантного простран- пространства Н в себя. Такое отображение, по сути, есть результат сужения отображения А на линейное подпространство %, и его называют ограничением линейного оператора на ин- инвариантное подпространство И. 5.4. Вычисление собственных значений и собственных векторов Характеристическое уравнение линейного оператора А: ? -» ?, действующего в п-мерном линейном пространстве С, — это алгебраическое уравнение n-й степени с действитель- действительными коэффициентами. Среди его корней могут быть ком- комплексные числа, но эти корни не относят к собственным зна- значениям линейного оператора, так как, согласно определению, *Не следует путать два термина: собственное подпространство и собственное подпоостоанство линейного onevamova.
ЪЛ. Вычисление собственных значений и собственных векторов 163 собственное значение линейного оператора — действительное число. Чтобы комплексные корни характеристического урав- уравнения можно было рассматривать как собственные значения линейного оператора, в линейном пространстве должно быть определено умножение вектора на любые комплексные числа. Как следует из доказательства теоремы 5.3, чтобы вычи- вычислить собственные значения линейного оператора А и найти его собственные векторы, нужно выполнить следующие опе- операции: - выбрать в линейном пространстве базис и сопоставить А матрицу А этого линейного оператора в выбранном базисе; - составить характеристическое уравнение det(A — ХЕ) = О и найти все его действительные корни А^, которые и будут собственными значениями линейного оператора; - для каждого собственного значения А* найти фундамен- фундаментальную систему решений для однородной системы линейных алгебраических уравнений (СЛАУ) (А — XkE)x = 0. Столб- Столбцы фундаментальной системы решений представляют собой координаты векторов некоторого базиса в собственном под- подпространстве ?(A,Afc) линейного оператора А. Любой собственный вектор с собственным значением А*; принадлежит подпространству ?(А,А*), и, следовательно, най- найденный базис в этом подпространстве позволяет представить любой собственный вектор с собственным значением А&. Пример 5.4, Найдем собственные векторы и собственные значения линейного оператора А, имеющего в некотором базисе матрицу /0 1 2 А= 4 0 1 \3 -1 1 В соответствии с описанной процедурой необходимо выпол- выполнить три действия. Первое действие можно опустить, так как оператор уже представлен своей матрицей в некотором базисе. Выполняем дальнейшие действия.
164 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 2) Находим собственные значения, решая характеристиче- характеристическое уравнение матрицы: -А 1 2 4 -Л 1 3 -1 1-А = C-А)(А2 + 2А-3)=0, откуда Ai = -3, А2 = 1, A3 = 3. 3) Находим столбцы координат собственных векторов, ре- решая для каждого из трех собственных значений однородную СЛАУ -А 1 2 \ /хЛ /0 4 -А 1 х2 = 0 3 -1 1-А/ \*з/ \0 За) Для А = Ai = —3 система E.5) имеет вид E.5) или 3xi+ — Х2 + 4хз = 0. Ранг матрицы этой системы равен 2: Поэтому размерность линейного пространства решений систе- системы равна 3 — 2 = 1. Фундаментальная система решений содер- содержит одно решение, например
5.4. Вычисление собственных значении и собственных векторов 165 Все множество собственных векторов линейного оператора с собственным значением Ai = — 3 в координатной форме имеет вид 1 где a — произвольное ненулевое действительное число. 36) При А = А2 == 1 система E.5) имеет вид Как и в предыдущем случае, размерность линейного простран- пространства решений равна 2 — 1 = 1 и фундаментальная система реше- решений содержит одно решение. Выберем следующее: Все множество собственных векторов с собственным значением А = — 1 в координатной форме имеет вид где /? — произвольное ненулевое действительное число. Зв) Для А = Аз = 3 аналогично предыдущим двум случаям находим столбец координат одного из собственных векторов, например = | И
166 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ который порождает собственное подпространство линейного оператора А, отвечающее собственному значению Л = 3. Пример 5.5. Найдем собственные значения линейного опе- оператора А, действующего в п-мерном линейном пространстве, матрица А которого в некотором базисе является верхней тре- треугольной порядка п: О а22 О 0 ... апп) причем все ее диагональные элементы ац попарно различны, т.е. ац ф ajj при г Ф j. Составляем характеристическое уравнение матрицы А: det(A - ХЕ) = (ап - Л)(а22 - Л)... (апп - Л) = О (определитель верхней треугольной матрицы равен произведе- произведению ее диагональных элементов). Находим все действительные корни этого уравнения: Как видим, линейный оператор А имеет п попарно различных собственных значений. Отметим, что пересечение любых двух собственных под- подпространств линейного оператора содержит лишь нулевой вектор, так как собственный вектор не может отвечать двум различным собственным значениям. Поэтому собственные под- подпространства линейного оператора образуют прямую сумму, а размерность прямой суммы линейных подпространств, соглас- согласно следствию из теоремы 2.5, равна сумме их размерностей. Из этих соображений следует, что каждое из п собственных под- подпространств рассматриваемого линейного оператора является одномерным, так как их размерность не может быть меньше,
5.4. Вычисление собственных значении и собственных векторов 167 но если бы одно из подпространств имело размерность больше единицы, то суммарная их размерность превышала бы размер- размерность самого линейного пространства. Итак, все собственные подпространства линейного операто- оператора в нашем случае одномерны. Рассмотрим то из них, которое отвечает собственному значению Лг = агг, где 1 ^ г ^ п. Со- Соответствующий собственный вектор имеет столбец координат, который является ненулевым решением однородной СЛАУ {А - атгЕ)х = 0. E.6) Достаточно очевидно, что ранг матрицы системы E.6) равен п — 1, а базисный минор для этой матрицы получается вычер- вычеркиванием r-й строки и г-го столбца. Наиболее просто решение системы E.6) выглядит для г = 1. В этом случае собственным является вектор х\ со столбцом ко- координат A 0 ... 0) . При г = 2 все координаты собственного вектора, начиная с третьей, будут равны нулю, так как они удовлетворяют системе «33 — 0 \ 0 G22/ Х4 \ХП/ = 0, получающейся выбрасыванием первых двух уравнений. Второе уравнение вытекает из всех последующих и может быть опуще- опущено, а первое уравнение определяет связь между первыми двумя координатами. Мы получаем, что собственному значению а22 отвечает вектор Х2 со столбцом координат (-ai2 ац 0 ... 0)т. Собственному значению азз отвечает вектор х$ со столбцом координат (х 13 хгз #зз 0 ... 0) , у которого лишь первые три координаты отличны от нуля. Эти три координаты удовлетво-
168 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ ряют однородной системе из двух уравнений \ ^22^23 + ^33^33 = 0. Эти рассуждения можно продолжить. Пример 5.6. Преобразование поворота в Уз на заданный острый угол вокруг некоторой оси — это линейный оператор. Его собственными векторами являются векторы, коллинеарные оси поворота. Например, если поворот выполняется вокруг оси Oz, то матрица оператора в базисе г, j, к будет иметь вид /cosip —simp 0' I simp cos<p 0 V 0 0 1. а его собственными векторами будут векторы со столбцами координат вида А@ 0 1) , А ф 0. 5.5. Свойства собственных векторов Теорема 5.5. Пусть собственные значения \\, ..., Аг линейного оператора А попарно различны. Тогда система соответствующих им собственных векторов е\, ..., ег линейно независима. < Доказательство опирается на метод математической индук- индукции, проводимый по количеству г векторов в системе. При г = 1 утверждение теоремы верно, так как линейная независимость системы из одного вектора означает, что этот вектор ненуле- ненулевой, а собственный вектор, согласно определению 5.3, является ненулевым. Пусть утверждение верно при г = т, т.е. для произвольной системы из т собственных векторов ei, ..., em. Добавим к системе векторов еще один собственный вектор em+i, отвечаю- отвечающий собственному значению Am+i, и докажем, что расширенная
5.5. Свойства собственных векторов 169 таким способом система векторов останется линейно независи- независимой. Рассмотрим произвольную линейную комбинацию полу- полученной системы собственных векторов и предположим, что она равна нулевому вектору: aiei + ... + amem + am+iem+i = 0. E.7) К равенству E.7) применим линейный оператор Айв резуль- результате получим еще одно векторное равенство ... + amAem + am+i Aem+i = 0. Учтем, что векторы ei, ..., em+i являются собственными: 4-... + ат\тет + ат+хAm+iem+i = 0. E.8) Умножив равенство E.7) на коэффициент Am+i и вычтя его из равенства E.8), получим линейную комбинацию векторов еь ..., ет, равную нулевому вектору: «i(Ai - Am+i)ei + ... + am(Am - Am+i)em = 0. Вспоминая, что система векторов ei, ..., em, по предполо- предположению, линейно независима, делаем вывод, что у полученной линейной комбинации все коэффициенты равны нулю: = 0, к = I~m. E.9) Поскольку все собственные значения А* попарно различны, то из равенств E.9) следует, что а\ = а.ч = ... = ат = 0. Значит соотношение E.7) можно записать в виде am+iem+i = 0, а так как вектор em+i ненулевой (как собственный вектор), то = 0. В итоге получаем, что равенство E.7) выполняется лишь в случае, когда все коэффициенты о^, г = 1,т+1, равны нулю. Тем самым мы доказали, что система векторов ei, ..., em? em+i линейно независима. >
170 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Теорема 5.6. Матрица линейного оператора А, действу- действующего в линейном пространстве, в данном базисе является диагональной тогда и только тогда, когда все векторы этого базиса являются собственными для оператора А. < Пусть А — матрица линейного оператора А в базисе Ъ = = (Ь\ ... Ьп). Согласно определению 4.4, j-м столбцом матри- матрицы А является столбец координат вектора Abj. Если матрица А является диагональной, то произвольно взятый ее j-й столбец имеет вид @ ... 0 /лj 0 ... 0) (един- (единственный ненулевой элемент может стоять на j-м месте). Для вектора Abj получаем представление ... 0 \ij 0 ... 0)Т = которое как раз и означает, что вектор bj является собствен- собственным с собственным значением \ij. Значит, все базисные век- векторы являются собственными, а все диагональные элементы матрицы А являются собственными значениями. Верно и обратное. Если каждый вектор bj является соб- собственным для линейного оператора А и ему отвечает собствен- собственное значение Aj, то Abj; = Xjbj = 6@ ... 0 Xj 0 ... 0)т, т.е. в матрице оператора А в этом базисе равны нулю все элементы, кроме диагональных, а диагональный элемент в j-м столбце равен Xj. > Следствие 5.1. Если характеристическое уравнение ли- линейного оператора, действующего в п-мерном линейном про- пространстве, имеет п попарно различных действительных кор- корней, то существует базис, в котором матрица этого оператора является диагональной. Ч Каждый действительный корень характеристического урав- уравнения является собственным значением линейного оператора.
5.5. Свойства собственных векторов 171 Каждому из таких корней можно сопоставить хотя бы по одно- одному собственному вектору. Система выбранных таким образом векторов, согласно теореме 5.5, является линейно независимой, а так как количество п векторов в ней равно размерности линейного пространства, она является базисом. Этот базис со- состоит из собственных векторов. Согласно теореме 5.6, матрица линейного оператора в этом базисе имеет диагональный вид. > Следствие 5.2. Если характеристическое уравнение ква- квадратной матрицы порядка п имеет п попарно различных дей- действительных корней, то эта матрица подобна некоторой диа- диагональной. < Пусть матрица А порядка п имеет п различных действи- действительных корней. Выберем произвольное n-мерное линейное пространство ?, зафиксируем в нем некоторый базис Ь = = (Ъ\ ... Ьп) и рассмотрим линейный оператор А, матрицей которого в базисе Ь является матрица А, По теореме 5.6 суще- существует базис, в котором матрица Аг этого оператора диагональ- на. Согласно теореме 4.6, матрицы А и А1 подобны. Отметим, что на диагонали матрицы Af стоят все попарно различные соб- собственные значения матрицы А. > Если характеристическое уравнение линейного оператора имеет кратные действительные корни, то такой линейный оператор может иметь диагональную матрицу в некотором базисе, но так бывает не всегда. Пример 5.7. В двумерном линейном пространстве (напри- (например, в R2) рассмотрим линейные операторы, матрицы которых в некотором базисе имеют вид /2 0\ /2 1\ \0 2у' \0 2)' Характеристические уравнения этих операторов совпадают и имеют вид (А — 2J = 0. Поэтому оба оператора имеют един- единственное собственное значение А = 2 кратности 2. Матрица
172 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ первого линейного оператора уже имеет диагональный вид, т.е. исходный базис состоит из собственных векторов этого опера- оператора. Можно показать, что любой ненулевой вектор для этого оператора является собственным и потому для него любой ба- базис есть базис из собственных векторов. У второго линейного оператора все собственные векторы отвечают собственному значению 2, но собственное подпространство линейного опе- оператора для этого собственного значения одномерно. Следова- Следовательно, найти два линейно независимых собственных вектора для этого линейного оператора невозможно и базиса из соб- собственных векторов не существует. # При изучении заданного линейного оператора появляется мысль выбрать такой базис, в котором его матрица выглядит наиболее просто. Из вышеизложенного следует, что в опре- определенных ситуациях линейный оператор в некотором базисе имеет диагональную матрицу. Чтобы это было так, оператор должен иметь базис из собственных векторов. Изменение бази- базиса вызывает замену матрицы оператора подобной ей. Замену матрицы А диагональной матрицей А', подобной А, называют приведением матрицы А к диагональному виду. Задача приведения матрицы к диагональному виду может рассматриваться самостоятельно, вне зависимости от изучения конкретного линейного оператора. Она состоит в подборе для данной матрицы А такой невырожденной матрицы Р, что матрица А1 = Р~ХАР является диагональной. Пример 5.8. Выясним, можно ли привести к диагонально- диагональному виду матрицу 7 -12 6' Л= | 10 -19 10 12 -24 13, Бели это возможно, найдем соответствующую диагональную матрицу и матрицу Р преобразования подобия.
5.5. Свойства собственных векторов 173 Найдем собственные значения данной матрицы. Бе харак- характеристическое уравнение имеет вид 7-А -12 6 10 -19-А 10 12 -24 13-А = 0. Раскрывая определитель и решая характеристическое уравне- уравнение, находим его корни: Ai = — 1, А2 = A3 = 1. Видим, что имеются два собственных значения, причем одно из них крат- кратности 2. Матрицу можно привести к диагональному виду, если сум- сумма размерностей всех собственных подпространств (в данном случае матрицы, см. замечание 5.1) равна размерности линей- линейного пространства, в нашем случае — трем. Отметим без доказательства, что размерность собственного подпростран- подпространства линейного оператора (матрицы) не превышает кратности соответствующего собственного значения. Проверим это на собственном подпространстве, отвечающем собственному зна- значению Ai, для чего вычислим ранг матрицы А — AijE7: 8 -12 6 10 -18 10 12 -24 14 Значит, размерность первого собственного подпространства равна 3-2 = 1. Аналогично находим размерность второго собственного подпространства. Вычисляем ранг соответствующей матрицы А-\2Е: 6 -12 6 10 -20 12 -24 10 12 = 1. Размерность второго собственного подпространства равна 3-1 = 2.
174 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Сумма размерностей обоих подпространств равна трем. Следовательно, базис из собственных векторов существует. Он собирается из базисов собственных подпространств. Чтобы его построить, нужно для каждого собственного значения А найти фундаментальную систему решений СЛАУ (А — ХЕ)х = = 0. Фундаментальная система решений представляет собой базис линейного пространства решений однородной СЛАУ, в нашем случае собственного подпространства матрицы. Для собственного значения Ai = —1 получаем систему 8 -12 6 10 -18 10 12 -24 14 Ранг матрицы системы равен двум, поэтому фундаментальная система состоит из одного столбца. Например, можно взять столбец C 5 6). Для собственного значения А2 = 1 получаем систему 6 -12 10 -20 10 12 -24 121 Ранг матрицы системы равен единице, поэтому фундаменталь- фундаментальная система состоит из двух столбцов. Например, фунда- фундаментальную систему решений составляют столбцы B 10) и @ 1 2)т. Таким образом, базисом из собственных векторов матрицы А является система а сама матрица А подобна диагональной матрице
5.5. Свойства собственных векторов 175 Отметим, что матрица Р преобразования подобия предста- представляет собой матрицу перехода из одного базиса в другой, т.е. ее столбцы представляют собой столбцы координат векторов нового базиса, записанные в старом. В нашем случае столбцы матрицы Р определяются векторами инового" базиса ei, в2, 63: Пример 5.9. Линейный оператор, действующий в трехмер- трехмерном линейном пространстве, в некотором базисе имеет матрицу Можно ли, изменив базис, привести матрицу этого оператора к диагональному виду? Составляем характеристическое уравнение линейного опе- оператора: 6-Л -5 -3 3 -2-А -2 2 -2 0-А Раскрывая определитель, получаем А3-4А2 =0. Корнями характеристического уравнения являются числа Ai = 1 кратности 2 и Аг = 2. Для определения размерностей собственных подпространств линейного оператора, отвечаю- отвечающих этим двум значениям, вычислим ранги соответствующих матриц: 5 -5 -3> 3 -3 -2 1 =2, 2 -2 -
176 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНА ЧЕНИЯ Оба собственных подпространства линейного оператора, отвечающие двум собственным значениям, имеют размерность 3 — 2 = 1. Поэтому линейно независимая система из собствен- собственных векторов данного оператора может содержать максимум два вектора и по соображениям размерности не может быть базисом. Дополнение 5.1. Жорданова нормальная форма При исследовании линейного оператора, действующего в линейном пространстве, желательно выбирать базис так, что- чтобы матрица линейного оператора имела наиболее простой вид. Если линейный оператор имеет базис из собственных векто- векторов, то его матрица в некотором базисе является диагональной (теорема 5.6). В частности, это верно в случае, когда все корни характеристического уравнения линейного оператора действительные и различные (см. следствие 5.1). Матрица диагонального вида — наиболее простая, но не всякий линейный оператор может иметь такую матрицу (см. пример 5.7). Линейный оператор, который не может быть при- приведен к диагональному виду (т.е. его матрица ни в одном базисе не является диагональной), имеет характеристическое уравне- уравнение, у которого есть комплексные или кратные действительные корни. Приведение матрицы линейного оператора к простому виду связано со структурой его инвариантных подпространств. Теорема 5.7. Пусть Hi и % — инвариантные подпро- подпространства линейного оператора А: С -> ?, причем Wi © %% := ?• Тогда в некотором базисе Ь матрица А этого оператора А име-
Д. 5.1. Жорданова нормальная форма 177 ет блочно-диагональный вид: А = 0 0 Н2 )• E.10) где 0 обозначает нулевые блоки соответствующего типа, а квадратные блоки JEfi, H2 имеют порядки dim?^i и dim?^2 соответственно. 4 Выберем в линейных подпространствах %\ и 'Н.2 базисы / = (/l ••• //) и 0 = (#1 ••• Як)- В совокупности эти два ба- базиса дают базис Ъ всего пространства С (см. доказательство теоремы 2.5). Так как %\ — инвариантное подпространство линейного оператора -А, вектор Afi, г = 1, /, попадает в Tii и поэтому является линейной комбинацией системы векторов /. Другими словами, координаты вектора Afi в базисе Ь, соответствующие векторам дг^, равны нулю. Аналогично ко- координаты векторов Agj, j = 1, к, в базисе Ь, соответствующие векторам /j, также равны нулю. Значит, в базисе Ь матрица А оператора А имеет вид E.10). > Следствие 5.3. Если Н\, ..., Hs — инвариантные под- подпространства линейного оператора А: С -» ?, причем %\ ©... ф ф %s = ?, то в некотором базисе матрица оператора А имеет блочно-диагональный вид (н, о о Я, где квадратный блок Hi имеет порядок dim%, г — 1,5, а остальные блоки являются нулевыми. <* Выберем в каждом из инвариантных подпространств Hi базис. Все базисы в совокупности образуют базис простран-
178 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ ства ?, в котором оператор А будет иметь матрицу указанного вида. > Остановимся на случае, когда характеристическое уравне- уравнение линейного оператора имеет лишь простые корни, среди которых, вообще говоря, есть и комплексные. Так как харак- характеристическое уравнение линейного оператора имеет действи- действительные коэффициенты, каждому комплексному корню a + iC этого уравнения соответствует комплексно сопряженный ко- корень a —iC той же кратности [I]. Теорема 5.8. Любой паре комплексно сопряженных корней характеристического уравнения линейного оператора соответ- соответствует двумерное инвариантное подпространство этого опера- оператора. <4 Зафиксируем в линейном пространстве С некоторый базис Ь и рассмотрим матрицу А линейного оператора А в этом базисе. Пусть А = а + г/?, C ф О, — комплексный корень ха- характеристического уравнения линейного оператора А. Тогда det(j4 — \Е) = 0 и система линейных алгебраических уравнений (СЛАУ) (А — ХЕ)х = 0 с комплексными коэффициентами имеет ненулевое решение я, которое можно записать в виде х = и + iv, разделив действительные и мнимые части у элементов столб- столбца х. Столбец v не является нулевым, так как в противном случае х = и, и Аи = Хи. Мы видим, что действительные элементы столбца Аи получаются из действительных элементов столбца и умножением на комплексное число А, а это возможно лишь в случае, когда и = 0. Но это заключение противоречит выбору столбца х. Столбцы и п v линейно независимы. Действительно, если они линейно зависимы, то jiu + vv = 0, где одно из чисел \х и v отлично от нуля. Мы можем утверждать, что /i ф 0, так как в противном случае w = 0. Но v Ф 0, значит v = 0. Получилось, что оба коэффициента /х и v являются нулевыми.
Д.5.1. Жорданова нормальная форма 179 Итак, // ф О, и поэтому и = Ал;, где к = —^/м ? М. Следовательно, x = u + iv = (fc + i)v. Так как Аг = Ах, то А((А; + г)г>) = A(fc + z)v, и мы, сокращая равенство на fc + i, находим, что Av = Av. Как мы уже знаем, для комплексного А такое равенство невозможно. В равенстве Ах = Ах сделаем замены А = a + if3, х = u + iv: А(и + iv) = (а + г/?)(n + iv). Разделив действительные и мнимые части, получим два матричных уравнения Аи = аи — /?г;, Av = (Зи + av. E.11) Рассмотрим векторы и и г;, которые в базисе Ь имеют столбцы координат и иу. Эти векторы образуют линейно независимую систему, так как линейно независимы столбцы и и v. Кроме того, Аи = аи — /3v, Av = (Зи + av, так как в матричной записи это совпадает с E.11). Полученные соотношения означают, что двумерное линейное подпространство % = span {u, v} является инвариантным подпространством линейного оператора А. > Для любых действительных а и /? обозначим / E.12) Теорема 5.9. Бели характеристическое уравнение линей- линейного оператора А: С -? С имеет р различных пар комплексно сопряженных корней aj±ifij, j = l,p, is. q различных действи- действительных корней fij, j = l,q, 2p + q = n = dim?, то в некотором базисе матрица А этого оператора А имеет вид А = С(ар,0р) О о E.13)
180 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ <4 Каждой паре комплексно сопряженных корней ay ± i/33 ха- характеристического уравнения соответствует двумерное инва- инвариантное подпространство Vj оператора А с базисом Uj, Vj (см. доказательство теоремы 5.8). Каждому собственному значению \ij соответствует одномерное собственное подпро- подпространство Qj линейного оператора А. Можно показать, что все эти подпространства образуют прямую сумму, так как пе- пересечение любой пары таких подпространств содержит лишь нулевой вектор. Учитывая, что сумма размерностей этих под- подпространств равна 2р + q = п = dim?, заключаем, что Согласно следствию 5.3, в некотором базисе матрица А опе- оператора А имеет блочно-диагональный вид, причем каждый диагональный блок представляет собой матрицу ограничения оператора А на соответствующее инвариантное подпростран- подпространство. В случае двумерного подпространства Vj в базисе Uj, Vj эта матрица равна C(aj,/?j) (см. E.12)), а в случае одномерного инвариантного пространства Qj такой блок есть просто число, представляющее собой собственное значение \ij. > Следствие 5.4. Если характеристическое уравнение ква- квадратной матрицы А порядка п имеет р различных пар ком- комплексно сопряженных корней ay ±i/?j, j = 1,р, и q различных действительных корней //j, j = 1, g, 2p + q = п, то эта матрица подобна некоторой блочно-диагональной матрице вида E.13). <4 Указанная матрица А является матрицей некоторого ли- линейного оператора Л, характеристическое уравнение которого имеет различные корни. Согласно теореме 5.9, в некотором ба- базисе оператор А имеет матрицу А' блочно-диагонального вида E.13). Матрицы А1 и А подобны как матрицы одного опера- оператора. > Если характеристическое уравнение оператора имеет крат- кратные корни, действительные или комплексные, то инвариант-
Д.5.1. Жорданова нормальная форма 181 ные подпространства такого оператора имеют более сложную структуру. Рассмотрим два типа специальных матриц. Для произвольного действительного числа /л введем обозна- обозначение матрицы порядка s: > 1 О О ц 1 о о о о 0 0 0 0 0 0 1 0 У этой матрицы все диагональные элменты равны /4, над главной диагональю расположены элементы 1, а все остальные равны нулю. В случае s = 1 рассматриваемая матрица сводится к единственному числу /z. Для любого комплексного числа А = a + г/3 (/? Ф 0) введем обозначение блочной матрицы порядка 2г: Cr{a,p) = fC{a,0) E 0 0 C(a,C) E 0 0 0 0 \ 0 0 0 ... С(а,Р) Е 0 0 0 ... 0 С(а,р); где Ci(a,/3) = С(а,/3) — квадратная матрица порядка 2 вида E.12). Все остальные блоки также являются квадратными матрицами порядка 2, Е обозначает единичную матрицу, а 0 — нулевую. Блочно-диагональную матрицу вида А = Сгт{<Хт,Ртп) о \ 0 E.14)
182 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ где ay, /3j (j = l,m) и /i/ (/ = 1, А;) — действительные числа, называют жор дано в ой, ее диагональные блоки — жордано- выми клетками. Жорданову матрицу А', подобную данной матрице А, называют жордановой нормальной формой (жордановой канонической формой) матрицы А. Жорданова нормальная форма определяется неоднозначно, так как подходящими преобразованиями подобия можно пере- переставлять диагональные блоки (перестановка блоков в матрице линейного оператора вызывается перестановкой соответствую- соответствующих векторов базиса). Среди жордановых клеток жордановой матрицы могут встречаться одинаковые. Однако можно утвер- утверждать, что если две жордановы матрицы подобны, то одна получается из другой перестановкой диагональных блоков. Это объясняется тем, что каждая жорданова клетка вида Jj(fij) определяется собственным значением /jlj матрицы, а жорданова клетка Cj(aj,/3j) — комплексным корнем Aj = ctj + ify характе- характеристического уравнения матрицы. Частным случаем жорда- жордановой матрицы является матрица вида E.13) (когда все корни характеристического уравнения простые) и диагональная ма- матрица (все корни действительные, а все жордановы клетки имеют порядок 1). Теорема 5.10. Каждая матрица имеет жорданову нор- нормальную форму. Вопросы и задачи 5.1. Найдите собственные векторы и собственные значения линейного оператора, имеющего в некотором базисе матрицу: /2-1 2\ /4 -5 2\ /-1 3 -1 а) 5-3 3 ]; б) I 5 -7 3 I; в) I -3 5 -1 \-1 0 -2/ \6 -9 4/ \-3 3 1 1 0 0\ /-1/3 4/3 -2/3\ /2-2 г) -4 4 0 ; д) 4/3 -1/3 2/3 ; е) -2 1-2 2 1 2/ \-2/3 2/3 2/3/ V
Вопросы и задачи 183 1 -2 0\ /1-22 ж) [ -2 2 -2 ; з) -2 -2 4 0-2 3/ \ 2 4-2 к) В примерах в), д)-к) постройте базис из собственных векторов и запишите матрицу линейного оператора в этом базисе. 5.2. Выясните, приводится ли к диагональному виду данная матрица: (8 15 -36' 8 21 -46 5 12 -27 5.3. Пусть линейный оператор, действующий в n-мерном ли- линейном пространстве, имеет в некотором базисе матрицу А. Пусть Ai, A2, ..., Ап — собственные значения этого оператора. Найдите собственные значения и собственные векторы линей- линейного оператора, матрицей которого в том же базисе является: а) Л2; б) Л. 5.4. В линейном пространстве квадратных матриц поряд- порядка 2 содержится линейная оболочка матриц Аку к = 0,100. Най- Найдите размерность этой линейной оболочки для матрицы А=П 9 5.5. Докажите, что для каждого собственного значения А линейного оператора А имеет место равенство ?(А,А) = = ker(A-AI).
184 5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 5.6. Докажите, что кратность собственного значения Л ли- линейного оператора А не меньше размерности соответствующе- соответствующего собственного подпространства ?(А, Л) этого оператора. 5.7. Докажите теорему Кэли — Гамильтона в случае ква- квадратной матрицы, все корни характеристического уравнения которой действительны и попарно различны. 5.8. Сформулируйте теорему Кэли — Гамильтона для ли- линейных операторов и доказать ее в случае линейного оператора, имеющего базис из собственных векторов. 5.9. Докажите, что поворот вектора на плоскости на угол 2ср можно реализовать за три последовательно выполняемых шага: поворот вектора на угол ср; растяжение с коэффициентом 2cos</?; прибавление вектора, противоположного исходному. 5.10. Докажите, что любой линейный оператор в простран- пространстве V$ имеет собственный вектор. 5.11. Приведите пример линейного оператора, не имеющего собственных векторов. Какой может быть размерность линей- линейного пространства, в котором есть такие операторы? 5.12. Докажите, что для любого ненулевого вектора с Е V3 линейный оператор A: Vs —> V3, определяемый соотношением Аа? = жхс, имеет единственное собственное значение, равное нулю. 5.13. Пусть % — линейное подпространство евклидова про- пространства ?. Рассмотрим линейный оператор ортогональ- ортогонального проектирования Рх = ж°, где х = х° + х±^ х° € Н, xL G ft1, — разложение произвольного вектора х на его орто- ортогональную проекцию х° и ортогональную составляющую xL. Найдите собственные значения и собственные векторы этого линейного оператора. 5.14. Докажите, что нуль является собственным значением любой кососимметрической матрицы нечетного порядка.
6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 6.1. Сопряженный оператор Пусть ? — евклидово пространство. Определение 6.1. Линейный оператор А*: ? -+ ? называ- называют сопряженным к линейному оператору А: ? -> ?, если для любых векторов ж, у € ? верно равенство (Ах,у) = (х,А*у). F.1) Данное определение сформулировано так, что оставляет открытыми два вопроса. Во-первых, не ясно, каждый ли линей- линейный оператор, действующий в евклидовом пространстве, имеет сопряженный. Во-вторых, из определения нельзя понять, одно- однозначно или нет определяется сопряженный оператор. Прежде чем формулировать теорему, отвечающую на оба эти вопроса, докажем одно вспомогательное утверждение. Лемма. Если квадратные матрицы М и N порядка п таковы, что для любых вектор-столбцов я, у € Шп выполняется соотношение х My = x Ny, то М = N. < Пусть m^, riij — элементы матриц М и N соответственно, стоящие в t-й строке и j-m столбце. Для произвольной пары индексов % и j выберем такие вектор-столбцы х и у: /0\ /0\ X = г-я 'строка ' У = .3-я строка '
186 6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ в которых присутствует только один ненулевой элемент, рав- равный единице и стоящий на указанном месте. Записав равенство хтМу = xTNy с выбранными столбцами х и у и вычислив обе стороны равенства, получаем rriij = riij. Так как пара индексов может быть выбрана произвольно, заключаем, что М = N. > Теорема 6.1. Любому линейному оператору А: ? -+ ? со- соответствует единственный сопряженный оператор А*, причем его матрицей в любом ортонормированном базисе е является матрица Лт, транспонированная матрице А линейного опера- оператора А в том же базисе е. «* Доказательство теоремы основано на том, что фиксиро- фиксированный базис евклидова пространства ? позволяет установить взаимно однозначное соответствие между линейными операто- операторами из L(?,?) и матрицами из Mn(R), n = dim?. Это соответ- соответствие заключается в сопоставлении линейному оператору его матрицы в фиксированном базисе. Докажем, что линейный оператор В с матрицей В = АТ в базисе е является сопряженным к линейному оператору А. Для этого достаточно проверить выполнение равенства (Ах,у) = (х,Ву) F.2) для любой пары векторов ж, у ? ?. Пусть гс, у — столбцы координат векторов ж, у в базисе е. Тогда, согласно теореме 4.3, вектор Ах имеет столбец коорди- координат Ах, а левйя часть равенства F.2) равна (Ах)ту, что следует из ортонормированности базиса (см. 3.7). Аналогично правая часть этого равенства имеет вид хт(Ву). Следовательно, ра- равенство F.2) в координатной записи имеет вид (Ах)ту = хт(Ву). F.3) Так как (Ах)т = хтАт в силу свойств матричных операций, равенство F.3) эквивалентно равенству хтАту = хтВу, F.4) которое при В = А превращается в тождество.
6.1. Сопряженный оператор 187 Если некоторый линейный оператор В является сопряжен- сопряженным к линейному оператору А, то для любых векторов х и у выполняется равенство F.2). Значит, для матриц А и В этих операторов равенство F.4) выполняется для любых столбцов х и у. Согласно доказанной лемме, В = Ат. Поэтому линейный оператор В определен однозначно, так как однозначно опреде- определена его матрица. > В некоторых случаях линейный оператор, сопряженный к данному линейному оператору, можно найти, не вычисляя матрицы этого оператора. Пример 6.1. Вектор а Е V3 порождает линейный оператор A: V3 -> V3 согласно формуле Ах = охж. Оператор, сопряженный к оператору А, можно определить, опираясь на свойства скалярного, векторного и смешанного произведений [III]: {Ах, у) = {ахх, у) = аху = уах = {уха, х) = = {х, уха) = {х, -аху) = {х, -Ау). Из приведенных соотношений видно, что А* = —А. Пример 6.2. Множество С™[а, Ь] бесконечно дифферен- дифференцируемых на отрезке [а, Ь] функций, у которых в точках а и Ь производные любого порядка равны нулю, является линей- линейным пространством относительно обычных операций сложения функций и умножения функции на действительное число, а формула 1 = Jf(t)g(t)dt О задает в этом линейном пространстве скалярное произведение (см. пример 3.4). Отображение А/ = /', которое каждой
188 6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ функции / Е С(Па, Ч ставит в соответствие ее производную, является линейным оператором. Оператором, сопряженным к ' А, будет —А, поскольку, согласно правилу интегрирования по частям, 1 1 (А/, д) = If'(t)g(t)dt = /(%(*)[ - J f(t)g'(t)dt = о о 1 1 о о 6.2. Самосопряженные операторы и их матрицы Определение 6,2. «ЛГгхкеймый оператор А, действующий в евклидовом пространстве, называют самосопряженным, если А* = А. Это определение можно сформулировать по-другому. Ли- Линейный оператор самосопряженный, если для любых векторов х и у верно равенство Действительно, если указанное соотношение выполняется, то, согласно определению 6.1, линейный оператор А является со- сопряженным оператором к самому себе, т.е. А* = А. Пример 6.3. Самосопряженными являются простейшие линейные операторы: нулевой 0 и тождественный I, так как для любых векторов х ту Aх, у) = (х, у) = (ж, 1у), @х, у) = @, у) = 0 = (ж, 0) = (х, 0у).
6.2. Самосопряженные операторы и их матрицы 189 Пример 6.4. Рассмотрим линейное пространство V3 с обычным скалярным произведе т^ем свободных векторов (ж, у). Отображение A: V3 —> V$ ортогонального проектирования век- векторов из Vs на направление вектора а единичной длины, кото- которое определяется формулой Ах = (ж, a) a, является линейным оператором, так как А(цх + vy) = (цх + vy, a)a = = ц(х,а)а + и (у, а)а = [л{Ах) + и(Ау). Убедимся, что этот оператор является самосопряженным: (Ах, у) = ((ж,а)о, у) = (ж, а) • (а, у) = = (ж, (а,у)а) = (ж, (у,а)а) = (ж, Ау). Приведенные рассуждения не используют специфику про- пространства Vz и могут быть проведены в произвольном евклидо- евклидовом пространстве. Любой единичный вектор а евклидова про- пространства ? порождает линейный оператор Ра ортогонального проектирования на линейное подпространство Н = span{a} со- согласно формуле Рах = (ж, а) а, и этот оператор является само- самосопряженным . Теорема 6.2. Матрица самосопряженного оператора в любом ортонормированием базисе является симметрической. Наоборот, если матрица линейного оператора в некотором ортонормированном базисе является симметрической, то этот оператор — самосопряженный. <4 Согласно определению 6.2, А — самосопряженный опера- оператор, если А = А*, т.е. если линейный оператор равен своему сопряженному оператору. Это эквивалентно тому, что матри- матрица линейного оператора в ортонормированном базисе совпадает со своей транспонированной (она является матрицей сопряжен- сопряженного оператора). Такие матрицы и называют симметричес- симметрическими. >
190 6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ Напомним, что комплексные числа а + Ы и а — Ы называют комплексно сопряженными. Число, комплексно сопряженное к числу z, обозначают z. Рассмотрим произвольную матри- матрицу М = (rriij), элементами которой являются комплексные (в частности, действительные) числа rriij. Матрицу М = (ту) того же типа, что и М, элементами которой являются числа ruij, будем называть комплексно сопряженной к матрице М. Она состоит из комплексно сопряженных элементов матри- матрицы М: М = (ту). Из свойств комплексных чисел вытекают следующие соотношения: Теорема 6.3. Все корни характеристического уравнения самосопряженного оператора действительны. <4 Согласно теореме 6.2, утверждение можно переформулиро- переформулировать следующим образом: характеристическое уравнение сим- симметрической матрицы имеет только действительные корни. В этой форме и будем его доказывать. Предположим, что некоторое число Л, вообще говоря комп- комплексное, является корнем характеристического уравнения сим- симметрической матрицы Л, т.е. det(A — ХЕ) = 0. Тогда система линейных алгебраических уравнений (А — \Е)х = 0 имеет неко- т торое ненулевое решение х = (х\ ... хп) , состоящее из ком- комплексных чисел Xky к = 1,п. Рассмотрим столбец af, комплексно сопряженный к столбцу х. Умножим равенство (А — ХЕ)х = 0 слева на строку хТ. Тогда или хтАх = \хтх. F.5) Так как произведение комплексного числа на сопряженное к нему является действительным числом, равным квадрату
6.2. Самосопряженные операторы и их матрицы 191 модуля комплексного числа, ах — ненулевое решение, то хтх = хххг +... + xnxn = |si|2 + ... + \хп\2 > О, т.е. матричное произведение хтх представляет собой действи- действительное положительное число. Из равенства 6.5 находим А = хтАх т ? X X причем знаменатель дроби справа является действительным числом. Следовательно, число Л будет действительным, если числитель этой дроби w = xTAx будет числом действительным. В силу симметричности матрицы А т /_т л \Т т .т__ т Ammm = ги = (х Ах) =х А х = х Ах. Поэтому с учетом свойств операции комплексного сопряжения матриц и благодаря тому, что элементами матрицы А являются действительные числа, получаем ^.Т А _ /=\ Т "Т~ _Т а __ = х1Ах = (х) Ах = х Ах = Комплексное число, сопряженное самому себе — это действи- действительное число. Следовательно, и w является действительным. > Следствие 6.1. Если матрица А является симметрической, то все корни ее характеристического уравнения det(A — ХЕ) = О действительные. Следствие 6.2. Самосопряженный оператор, действую- действующий в n-мерном евклидовом пространстве, имеет п собствен- собственных значений, если каждое из них считать столько раз, какова его кратность. Следствие 6.3. Симметрическая матрица порядка п имеет п собственных значений, если каждое из них считать столько раз, какова его кратность.
192 6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 6.3. Собственные векторы самосопряженного оператора Теорема 6.4. Собственные векторы самосопряженного оператора, отвечающие различным собственным значениям, ортогональны. М Рассмотрим самосопряженный оператор А и два его соб- собственных вектора х\ и х2, отвечающие различным собствен- собственным значениям \\ ъ \2. Тогда Ах\ = \\Х\ и Ах2 = \2х2. Поэтому (Ахих2) = (Xixux2) = Xi(xux2). F.6) Но так как А является самосопряженным оператором, то (Ах\,х2) = faiiAx2). Значит, {Ахих2) = («1, Аж2) = (жь А2ж2) = А2(ж1,ж2). F.7) Приравнивая правые части соотношений F.6) и F.7), полу- получаем или (Ai-A2)(*i,*2)=0. F.8) Так как Ai ф \2, из равенства F.8) следует, что (х\,х2) = О, что и означает ортогональность векторов х\ и х2. > Теорема 6.5. Если собственные значения Ai, ..., Ап само- самосопряженного оператора А, действующего в п-мерном евклидо- евклидовом пространстве ?, попарно различны, то в ? существует ор- тонормированный базис, в котором матрица этого линейного оператора А имеет диагональный вид, причем диагональны- диагональными элементами такой матрицы являются собственные значения • Ai, ..., Ап. < Поскольку собственные значения Ai, ..., Ап попарно раз- различны, то, выбрав для каждого А* соответствующий ему соб- собственный вектор в{, получим систему е ненулевых векторов,
6.3. Собственные векторы самосопряженного оператора 193 которые по теореме 6.4 попарно ортогональны. Поэтому е — ортогональная система векторов. Согласно теореме 5.5, она линейно независима и, имея п векторов, является базисом (см. теорему 1.4). Этот базис является ортогональным, а чтобы его превратить в ортонормированный, необходимо каждый вектор в{ нормировать делением на его длину. Таким образом, в условиях теоремы существует базис из собственных векторов самосопряженного оператора А. По тео- теореме 5.6 матрица линейного оператора в базисе из собственных векторов является диагональной, а диагональные элементы ма- матрицы представляют собой собственные значения. > Хотя все корни характеристического уравнения самосопря- самосопряженного оператора действительны (см. теорему 6.3), среди них могут быть кратные, и тогда теорема 6.5 неприменима. Од- Однако и в этом случае матрица самосопряженного оператора в некотором базисе имеет диагональный вид. Теорема 6.6. Для любого самосопряженного оператора А существует ортонормированный базис, состоящий из соб- собственных векторов этого линейного оператора. Матрица А самосопряженного оператора А в этом базисе имеет диагональ- диагональный вид, на ее диагонали расположены собственные значения оператора А, повторяющиеся столько ра^ какова их крат- кратность. # Доказательство этой теоремы приведено в Д.6.1. Следствие 6.4. Любая симметрическая матрица М поряд- порядка п подобна некоторой диагональной, т.е. существует такая невырожденная матрица Р порядка п, что p-1MP = diag(Ai, ..., Ап). Последовательность Ai, ..., Ап из п чисел представляет собой перечень всех корней характеристического уравнения матрицы М с учетом их кратностей.
194 6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ Ч Рассмотрим в n-мерном евклидовом пространстве дартный ортонормированный базис, и пусть матрица М явля- является матрицей в этом базисе некоторого линейного оператора М. Тогда этот оператор будет самосопряженным. По теореме б.б для него существует ортонормированный базис, в котором его матрица М1 имеет диагональный вид М' = diag (Ai, ..., An). Матрица М1 получается из исходной матрицы М при помощи матрицы перехода Р из стандартного базиса в указанный ор- ортонормированный базис: М' = Р~1МР. > Дополнение 6.1. Инвариантные подпространства самосопряженного оператора Теорема 6.7. Если % — инвариантное подпространство самосопряженного оператора А, действующего в евклидовом пространстве ?, то его ортогональное дополнение Н1- также является инвариантным подпространством этого оператора А. Ч Нам достаточно проверить, что для любого вектора у ли- линейного подпространства %L его образ Ау тоже принадлежит т.е. что для любого вектора жЕН выполнено условие Пусть у ? %L, х € Н. Так как оператор А самосопряжен- самосопряженный, выполнено равенство (Ау, х) = (у, Ах). Но И — инвари- инвариантное подпространство оператора А, т.е. Ах G % для вектора жЕИ. Поэтому (у, Ах) = 0, так как вектор у Е %^ ортогонален любому вектору из %, в частности вектору Ах. Следовательно, (Ау, х) = 0, что и требовалось доказать. > Мы видели, что кратность собственного значения и раз- размерность соответствующего собственного подпространства линейного оператора могут не совпадать (см. пример 5.7). Эти две характеристики совпадают, если линейный оператор, действующий в евклидовом пространстве, является самосопря- самосопряженным.
Д.6.1. Инвариантные подпространства 195 Теорема 6.8, Пусть Л — собственное значение самосо- самосопряженного оператора А, действующего в евклидовом про- пространстве ?. Тогда кратность собственного значения А равна размерности отвечающего этому значению собственного под- подпространства ?(А, А) линейного оператора А. < Собственное подпространство ?(А, А) самосопряженного оператора А является инвариантным подпространством этого оператора. Поэтому, согласно теореме 6.7, ортогональное до- дополнение ?(-4., АI- также является инвариантным подпростран- подпространством самосопряженного оператора А. Пусть dim?(A, А) = А:, a dim?(A,A)x = /. Выберем в линейных подпространствах ?(А,А) и ?(А,А)Х базисы е = (е\ ... е*) и g = {gi ... g{) со- соответственно. Так как ?(А, А) 0 ?(-4, АI = ?, система векторов (е д) явля- является базисом евклидова пространства 6. Рассмотрим в этом базисе матрицу А оператора А. Для любого вектора е* систе- системы е имеем Ав{ = Ае*, так как е» принадлежит собственному подпространству ?(А,А) линейного оператора, отвечающему собственному значению А. Для каждого вектора gj системы д имеем Agj = aj\g\ + ... + ajigi, так как ?(Л,АI — инва- инвариантное подпространство оператора Л, а д — базис этого подпространства. Эти разложения означают, что матрица А оператора А в базисе (е д) имеет блочный вид: Л~\ О MJ* ( \ О M где Ek обозначает единичную матрицу порядка fc, а блок М представляет собой квадратную матрицу порядка /, состоящую из коэффициентов разложения векторов Agj в базисе (е д): ill °12 ••• aU \ 121 ^22 «• • a2l \ац al2 ... ац/
196 б. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ Исходя из блочного представления матрицы А получаем вид ее характеристического уравнения: Хл(т) = det(A - тЕп) = (А - т)к det(M - тЕг) = = (А-т)*хм(т), F.9) где Еп и Ei — единичные матрицы порядков пи/. Отметим, что матрица М представляет собой матрицу в базисе д линейного оператора, являющегося ограничением ли- нейного оператора А на его инвариантное подпространство ?(А,АI. Оператор А не имеет в подпространстве ?(A,A)-L собственных векторов с собственным значением Л. Поэтому А не является собственным значением матрицы М, и из предста- представления F.9) заключаем, что собственное значение Л матрицы А имеет кратность к. > Доказательство теоремы 6.6 опирается на свойства инвари- инвариантных подпространств. < Пусть Ai, ..., Л* — собственные значения самосопряженного оператора A, a п, ..., г^ — их кратности. Так как харак- характеристическое уравнение самосопряженного оператора имеет только действительные корни, сумма кратностей г\ + ... + г^ собственных значений равна размерности п евклидова про- пространства ?. Рассмотрим собственное подпространство Hi опе- оператора А, соответствующее собственному значению А*. Раз- Размерность этого линейного подпространства, согласно теореме 6.8, совпадает с кратностью Г{ собственного значения А». Вы- Выберем ортонормированныи базис в линейном подпространстве 'Hj, который будет состоять из Г{ собственных векторов самосо- самосопряженного оператора А, попарно ортогональных и имеющих единичную длину. Объединив выбранные базисы в одну си- систему, получим систему из п собственных векторов единичной длины, любые два из которых ортогональны. Действительно, либо оба вектора одновременно входят в базис некоторого под- подпространства Hi и будут ортогональны согласно выбору, либо
Вопросы и задачи 197 они попадают в разные инвариантные подпространства %% и Hj и будут ортогональны как собственные векторы, отвечающие различным собственным значениям (см. теорему 6.4). Итак, мы выбрали систему из п попарно ортогональных век- векторов единичной длины. Согласно теореме 3.4, эта система линейно независима, а так как количество векторов в ней совпа- совпадает с размерностью пространства, она является ортонормиро- ванным базисом. Согласно теореме 5.6, матрица оператора А в этом базисе является диагональной и на ее диагонали рас- расположены собственные значения, повторяющиеся столько раз, какова их кратность, поскольку построенный базис состоит из соответствующих наборов собственных векторов. > Вопросы и задачи 6.1. Известно, что матрица линейного оператора в некото- некотором ортонормированном базисе диагональна. Является ли этот линейный оператор самосопряженным? 6.2. Известно, что в некотором базисе, не являющемся ор- ортогональным, матрица оператора А симметрическая. Можно ли утверждать, что: а) А — самосопряженный оператор; б) А не является самосопряженным оператором. Что можно утвер- утверждать, если базис ортогональный, но не ортонормированный? 6.3. Линейный оператор, действующий в n-мерном линей- линейном пространстве, имеет в некотором базисе симметрическую матрицу. Докажите, что этот оператор имеет базис из соб- собственных векторов, даже если линейное пространство не явля- является евклидовым. 6.4. Докажите, что: а) {А+В)* = А*+В*; б) (АВ)* = В*А*; в) если линейный оператор А имеет обратный, то и оператор А* имеет обратный, причем (А)* = (А*). 6.5. Рассмотрим в пространстве V<i линейный оператор R^ поворота вектора на угол </?, О < (р < я\ Найдите оператор, сопряженный к оператору
198 6. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 6.6. Пусть ? — евклидово пространство, е — произвольный, вообще говоря, неортогональный базис в 5, Г — матрица Грама для системы векторов е. Докажите, что если линейный оператор А в базисе е имеет матрицу А, то сопряженный к нему оператор А* имеет в том же базисе матрицу А* = Г~МТГ. 6.7. В базисе bi = (l, 1,1, 1), 62 = A, 1,1,0), 63 = A, 1, 0, 0), 64 = A, 0, 0, 0) линейного арифметического пространства Rn матрица линей- линейного оператора А имеет вид Найдите матрицу сопряженного оператора А* в том же базисе (Ь\ &2 Ьз 64)- В пространстве Шп предполагается стандарт- стандартное скалярное произведение. 6.8. Докажите, что для любого евклидова пространства ? отображение L(?,?) -4 L(?,?), сопоставляющее линейному оператору из L{?,?) ему сопряженный, является.изоморфизмом линейного пространства L(?,?). Зависит ли этот изоморфизм от выбора базиса в евклидовом пространстве ? ? Когда этот изоморфизм является тождественным отображением? 6.9. Для симметрической матрицы /5 1 х/2> А= 1 5 у/2 \л/2 \/2 3 найдите подобную ей диагональную матрицу А' = Р~1АР и соответствующую матрицу Р.
7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ 7.1. Ортогональные матрицы и их свойства Определение 7.1. Квадратную матрицу О называют ортогональной, если она удовлетворяет условию С/ = hi) \ I .1 j где Е — единичная матрица. Пример 7.1. Простейшей ортогональной матрицей явля- является единичная матрица Е, так как ЕТЕ = ЕЕ = Е. Напротив, нулевая матрица не является ортогональной: в в = в Ф Е. Пример 7.2. Матрица тт _ (C0SiP —sin</?\ у sirup cosy?у является ортогональной, поскольку U U = Е. Это можно про- проверить непосредственно. # Из определения 7.1 вытекает ряд свойств ортогональных матриц. Свойство 7.1. Определитель ортогональной матрицы О может иметь одно из двух возможных значений: det О = ±1. А Согласно равенству G.1), имеем det (OTO) = det25. Вспомнив [III], что определитель произведения матриц равен произве- произведению их определителей, а при транспонировании матрицы определитель не меняется, получим det(OTO) = det OT det О = (det ОJ.
200 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ Так как detE = 1, то и (detOJ = 1. Следовательно, detO = = ±1. > Свойство 7.2. Матрица, обратная к ортогональной ма- матрице О, совпадает с ее транспонированной матрицей, т.е. о~1 = от. <4 Согласно свойству 7.1, ортогональная матрица невырождена и потому имеет обратную матрицу О. Умножая равенство G.1) справа на матрицу О, получаем откуда ОТ{ОО~1) = О". Но ОО = Е, поэтому От = О. > Свойство 7.3. Произведение ортогональной матрицы О на транспонированную к ней равно единичной матрице, т.е. Согласно свойству 7.2 и определению обратной матрицы, Т =Е. > Свойство 7.4. Матрица, транспонированная к ортогональ- ортогональной матрице, тоже является ортогональной. < Нужно для произвольной ортогональной матрицы О доказать равенство (ОТ)ТОТ = Е, G.2) представляющее собой запись соотношения G.1) для матрицы От. Так как, согласно свойству операции транспонирования, (От)т = О, равенство G.2) эквивалентно равенству ООТ = Е, которое верно в силу свойства 7.3. > Свойство 7.5. Произведение двух ортогональных матриц О и Q одного порядка является ортогональной матрицей. М Для доказательства достаточно проверить выполнение ра- равенства G.1) для матрицы OQ: (OQf{OQ) = {QTOT)OQ = QT{OTO)Q = QTEQ = QTQ = E.
7.2. Ортогональные операторы 201 В этих выкладках Е, как обычно, обозначает единичную матрицу. > Свойство 7.6. Матрица, обратная к ортогональной матри- матрице, тоже является ортогональной. <4 Согласно свойству 7.1, ортогональная матрица невырождена, а потому имеет обратную. Согласно свойству 7.2, матрица, обратная к ортогональной, совпадает' с транспонированной. Наконец, согласно свойству 7.4, матрица, транспонированная к ортогональной, является ортогональной. > Пример 7.3. Рассмотрим матрицу U из примера 7.2. Так как она ортогональна, то обратную матрицу легко найти, ис- используя свойство 7.6: гг-1 _ ттт _ ( C0S(P sin</A ~ I — simp cosip) ' 7.2. Ортогональные операторы Определение 7.2. Линейный оператор А: ? -> ?, действу- действующий в евклидовом пространстве ?, называют ортогональ- ортогональным оператором (или ортогональным преобразовани- преобразованием), если он сохраняет скалярное произведение в ?, т.е. для любых векторов ж, у Е ? выполняется равенство (Ах,Ау) = (х,у). G.3) Так как ортогональный оператор сохраняет скалярное про- произведение, то он сохраняет норму (длину) вектора и угол между ненулевыми векторами. Действительно, Отсюда, в частности, следует, что если векторы х и у ненуле- ненулевые, то и векторы Ах и Ау ненулевые. При этом {Ах,Ау) (ж,у) шт - ни
202 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ Менее очевидно, что верно и обратное утверждение. Теорема 7.1. Если линейный оператор А: ? -> ? в евкли- евклидовом пространстве ? сохраняет евклидову норму: \\Ax\\ = ||х||, ж € ?, то этот оператор ортогональный. «* Доказательство опирается на следующее тождество: верное для любых векторов х и у, в чем можно убедиться, выра- выражая нормы векторов через скалярное произведение. Используя это тождество и сохранение нормы оператором А, получаем (Ах,Ау) = \\А(х + у) ||2 - \\Axf - \\Ayf = где х и у — произвольные векторы пространства ?. > Теорема 7.1 позволяет привести примеры ортогональных операторов. В пространствах V2 и V3 свободных векторов ортогональными являются линейные операторы, сохраняющие расстояние. Например, линейный оператор поворота вектора на фиксированный угол (см. пример 4.2) является ортогональ- ортогональным, так как при таком повороте длины векторов не изменя- изменяются. Линейный оператор симметрии относительно прямой на плоскости или относительно плоскости в пространстве также является ортогональным. Теорема 7.2. Пусть А: ? -* ? — ортогональный оператор в евклидовом пространстве ? и е = (ei ... еп) — произвольный ортонормированный базис в ?. Тогда система векторов Ае = = (Ае\ ... Аеп) является ортонормированным базисом в ?. •4 Достаточно подсчитать все парные скалярные произведения векторов Ав{. В силу ортогональности оператора А имеем = < ^
7.2. Ортогональные операторы 203 Видим, что различные векторы Aei и Aej ортогональны, а норма каждого из них равна единице. Поэтому система векторов Ае = (Ае\ ... Аеп) состоит из ненулевых векторов и ортогональна. Согласно теореме 3.4, она линейно независима. Количество векторов в линейно независимой системе Ае равно dim? = п, поэтому, согласно теореме 1.4, это базис, притом ортонормированный. > Теорема 7.3. Если линейный оператор А: ? -» ? в ев- евклидовом пространстве ? переводит какой-либо ортонорми- ортонормированный базис е = (ei ... еп) в ортонормированный базис Ае = (Ае\ ... Аеп), то этот оператор ортогональный. т Ч Если вектор х имеет столбец координат х = {х\ ... хп) в базисе е, то его образ Ах имеет тот же столбец координат в базисе Ае, так как, согласно определению линейного опера- оператора, Ах = А(ххе\ +... + хпеп) = хх (Аег) + ... + хп(Аеп). Выберем два произвольных вектора х = х\е\ + ... + хпеп и У = yie\ + ... + ynen- Их скалярное произведение в ортонор- мированном базисе е выражается формулой но той же формулой выражается и скалярное произведение (Лж,Лу), если в качестве базиса взять Ае. Поэтому соотноше- соотношение (Ах,Ау) = (ж, у) выполняется для любых векторов ж и у, что, согласно определению 7.2, означает ортогональность опе- оператора А. > Теорема 7.4* Если матрица линейного оператора в не- некотором ортонормированном базисе ортогональна, то этот оператор является ортогональным. Наоборот, матрица ор- ортогонального оператора в любом ортонормированном базисе является ортогональной.
204 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ 4 Выберем в евклидовом пространстве ? любой ортонормиро ванный базис е. Тогда для любых векторов х и у, имеющих в этом ортонормированном базисе е столбцы координат х и у соответственно, выполнено равенство (ж,у)=жту (это за- запись скалярного произведения в ортонормированном базисе, см. 3-7). Пусть матрица А линейного оператора А в ортонормиро- ортонормированном базисе является ортогональной. Тогда выполняется соотношение А А = Е и, следовательно, равенство хт(АтА)у = хтЕу G.4) верно для любых столбцов х и у. Но это равенство представля- представляет собой матричную запись равенства скалярных произведений (Ах,Ау) = (ж,у) для векторов ж и у, имеющих столбцы коорди- координат х и у в этом же ортонормированном базисе. Мы приходим к заключению, что оператор ортогональный. Докажем обратное утверждение теоремы. В любом орто- ортонормированном базисе соотношение G.3) в координатах имеет вид (Ах)т(Ау)=хту, т.е. его можно записать в виде G.4). Как мы ранее доказали (см. лемму на с. 185), из этого равенства, выполняющегося для любых столбцов я и у, следует равенство матриц АТА = J5, что и означает ортогональность матрицы А. > Замечание 7.1. Напомним, что матрица линейного опе- оператора состоит из столбцов координат образов базисных век- векторов. Имея это в виду, нетрудно заметить, что равенство АТА = Е означает, что столбцы матрицы А, как элементы п-мерного линейного арифметического пространства со стан- стандартным скалярным произведением, попарно ортогональны и имеют единичную длину. Действительно, в i-й строке и j-m столбце матрицы АТА стоит скалярное произведение г-го и j-ro столбцов матрицы А. Это позволяет свести теорему 7.4 к тео- теореме 7.3.
7.3. Матрицы перехода в евклидовом пространстве 205 7.3. Матрицы перехода в евклидовом пространстве Теорема 7.5. В евклидовом пространстве матрица пере- перехода от одного ортонормированного базиса к другому является ортогональной. Ч Рассмотрим в произвольном п-мерном евклидовом простран- пространстве ? два ортонормированных базиса 6= Fi ... bn) и е = = (бх ... еп). Пусть U — матрица перехода от Ь к е. Как следует из определения 1.6, столбцы ei, ..., еп мат- матрицы перехода U — это столбцы координат векторов нового базиса е относительно старого базиса Ь, т.е. U = (ei ... еп), где в{ = bej, i = 1, п. Поэтому А (ei / т \ Т т т \епе1 епе2 т еп€п 1 О О 1 о о 1 Последнее равенство в приведенной выкладке следует из того, что столбцы ei,..., еп — это столбцы координат векторов ортонормированного базиса в ортонормированием базисе, а матричное произведение e*ej представляет собой запись в координатах скалярного произведения (ег,е3), которое в силу ортонормированности базиса е равно нулю при г ф j и единице при t = j. Мы показали, что UTU = J5, а это, согласно определению 7.1 ортогональной матрицы, и означает, что U — ортогональная матрица. >
206 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ Теорема 7.6. Пусть Ь — ортонормированный базис в n-мерном евклидовом пространстве ?. Любая ортогональная матрица U порядка п является матрицей перехода из базиса Ъ в некоторый другой ортонормированный базис. < Столбцы ei, ..., еп матрицы U можно рассматривать как координаты в базисе Ь некоторых векторов е\,..., еп простран- пространства ?. Матрица UTU есть не что иное, как матрица Грама для системы векторов ei, ..., еп, так как элемент этой матрицы в г-й строке и j'-m столбце равен е^е^, что представляет собой запись в координатах в ортонормированном базисе скалярного произведения (е*,е^). Равенство UTU = Е означает, что векторы ei, ..., еп по- попарно ортогональны и имеют единичную длину (см. доказа- доказательство теоремы 7.5). Поэтому указанная система векторов является линейно независимой (см. теорему 3.4), а так как количество векторов в системе совпадает с размерностью п ев- евклидова пространства, она является базисом (см. теорему 1.4). Этот базис ортонормированный, а матрица U есть матрица пе- перехода из базиса 6 в базис е. > Замечание 7.2. Иногда говорят, что ортогональная ма- матрица состоит из ортонормированных столбцов и строк. Эта терминология мотивируется следующим. Равенства ОТО = J5, ООТ = ??, верные для любой ортогональной матрицы, озна- означают, что системы столбцов и строк матрицы О, рассматри- рассматриваемых как элементы n-мерного линейного арифметического пространства, являются ортонормированными. # Напомним, что матрица перехода определяет преобразова- преобразование координат вектора при замене одного базиса другим. Если хь — столбец старых координат вектора ж, хе — столбец но- новых координат, U — матрица перехода из старого базиса в новый, то хь = Uxe. Две последние теоремы показывают, что при замене одного ортонормированного базиса другим в соот- соответствующем преобразовании координат хь = Uxe матрица U ортогональная.
7.4. Приведение симметрической матрицы к диагональному виду 207 Замечание 7.3. Любое линейное преобразование линейного пространства представляет собой отображение пространства в себя: каждый вектор линейного пространства меняет свое положение и переходит в свой образ. Преобразование коорди- координат не затрагивает элементов пространства, а лишь отража- отражает изменение системы отсчета (базиса). Можно сказать, что преобразование пространства — это изменение окружающего пространства, а преобразование координат — это изменение положения наблюдателя. Эта физическая аналогия показыва- показывает, в чем различие между двумя понятиями. 7.4. Приведение симметрической матрицы к диагональному виду Матрица А линейного оператора А при замене базиса пре- преобразуется согласно формуле А1 = U~lAU, где U — матрица перехода (см. теорему 4.6). Если речь идет об евклидовом про- странстве и переходе из одного ортонормированного базиса в другой, матрица перехода U является ортогональной (см. тео- теорему 7.5). Согласно свойству 7.2, такая матрица удовлетворяет соотношению U~l = U . Поэтому для случая ортонормиро- ванных базисов формулу преобразования матрицы линейного оператора можно записать следующим образом: А! = UTAU. G.5) Теорема 7.7. Для любой симметрической матрицы М су- существует такая ортогональная матрица С/, что U MU = Л, где Л = diag(Ai, ..., Ап) — диагональная матрица, диагональными элементами которой являются собственные значения матрицы М, повторяющиеся согласно их кратности. <4 Доказательство теоремы основано на следствии 6.4, теореме 7.5 и свойстве 7.2. Согласно следствию 6.4, для симметриче- симметрической матрицы М порядка п существует такая невырожденная матрица Р, что Р~1МР = Л = diag(Ab ..., Ап), где в после-
208 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ дователыюсти Ai, ..., Ап указаны все собственные значения матрицы М с учетом их кратностей. Из доказательства то- того же следствия вытекает, что Р является матрицей перехода между ортонормированными базисами. Поэтому Р — ортого- ортогональная матрица (см. теорему 7.5) и Р~1 = Рт (см. свойство 7.2). Следовательно, РТМР = Р~1МР = Л, т.е. в качестве ма- матрицы U в формулировке теоремы можно взять Р. > Преобразование G.5) с ортогональной матрицей U иногда называют ортогональным преобразованием матрицы А. Поэтому теорему 7.7 можно сформулировать так: любая сим- симметрическая матрица ортогональным преобразованием приво- приводится к диагональному виду. Чтобы найти соответствующую матрицу U, о которой говорится в этой теореме, необходимо: 1) найти собственные значения матрицы М; 2) для каждого собственного значения найти набор соб- собственных векторов, соответствующих этому собственному значению, при этом эти собственные векторы должны быть линейно независимыми и их количество должно равняться крат- кратности собственного значения; 3) преобразовать системы собственных векторов, получен- полученные для каждого собственного значения, в ортонормирован- ные при помощи процесса ортогонализации Грама — Шмид- Шмидта. Объединить ортонормированные системы для каждого собственного значения в единую систему векторов, которая бу- будет ортонормированным базисом евклидова пространства; 4) выписать матрицу U, столбцами которой являются коор- координаты векторов построенной ортонормированной системы. Пример 7.4. Найдем ортогональное преобразование, при- приводящее симметрическую матрицу к диагональному виду.
7.4. Приведение симметрической матрицы к диагональному виду 209 1. Находим собственные значения матрицы А. Для этого составляем ее характеристическое уравнение 12А2-21А + 10 = Это уравнение третьей степени. Так как его коэффициенты являются целыми числами, то целое число может быть его корнем лишь в случае, если оно делитель свободного члена. Поэтому мы можем поискать корни среди чисел ±1, ±2, ±5. Подстановкой в уравнение убеждаемся, что одним из корней является Ai = 1. Найденный корень позволяет разложить левую часть харак- характеристического уравнения на линейный и квадратичный мно- множители, например, при помощи деления характеристического многочлена на х — 1 „в столбик": А3-12А2 'А3- А2 21А-10 А -1 А^-ПА -11А2 10А -10 10А-10 Получаем разложение 10)=0, откуда находим оставшиеся два корня Аг = 1, Аз = 10. Таким образом, имеются два собственных значения: 1 кратности 2 и 10 кратности 1. 2-3. Найдем для собственного значения Aif2 = 1 кратности 2 два линейно независимых собственных вектора. Для этого нужно найти фундаментальную систему решений однородной
210 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ системы линейных алгебраических уравнений (А — Е)х = 0, т.е. системы ! — 4хз = О, —2xi — 4x2 + 4хз = 0. Ранг матрицы этой системы равен единице (все строки ма- матрицы системы пропорциональны), поэтому можно отбросить второе и третье уравнения, оставив первое xi + 2х2 - 2х3 = 0. В качестве независимых переменных выбираем Х2, хз. Фунда- Фундаментальную систему решений составляют Х2 = 1, хз = 0, xi = —2 и Х2 = 0, хз = 1, х\ = 2, т.е. векторы Ч1)- *¦(?' Найденные собственные векторы, соответствующие соб- собственному значению Ai^ = 1, линейно независимы, но ортого- ортогональными не являются. Построим по ним другую, ортонор- мированную пару собственных векторов ei, в2 при помощи метода ортогонализации Грама — Шмидта: 1 ¦ 1 ИМ -Л\ „Г е2 =
7.4. Приведение симметрической матрицы к диагональному виду 211 Для собственного значения Аз = 10 система линейных алге- алгебраических уравнений имеет вид (А — ЮЕ)х = 0, или -8x1 + 2х2 - 2х3 = 0, 2xi — 5x2 — 4хз = 0> —2xi ~ 4x2 — 5хз = 0. В качестве ее фундаментальной системы решений можно взять одно ненулевое решение, например вектор Ьз = A 2 — 2) . Нормируя этот вектор, получаем 1 Найденные векторы ei, в2, ез образуют ортонормирован- ный базис из собственных векторов. 4. Составим из найденных векторов е\ матрицу /-6 2 л/5\ U=—f 3 4 2л/5 , 3л/5\ 0 5 -2V5/ которая и является искомой. Убедиться в том, что матрица U определена правильно, можно при помощи подстановки матрицы U и заданной матри- матрицы А в следующее тождество: Замечание 7.4. В случае п = 3 при Ai = A2 ф Аз собствен- собственные векторы удобнее с точки зрения экономии вычислений находить в следующем порядке. Сначала для собственного зна- значения кратности 1 (Аз = 10 в рассмотренном примере) найти
212 7. ОРТОГОНАЛЬНЫЕ МАТРИЦЫ И ОПЕРАТОРЫ собственный вектор и нормировать его. Обозначим получен- полученный вектор, например, ез- Затем для собственного значения кратности 2 (Ai^ = 1 в рассмотренном примере) найти один собственный вектор и нормировать его. Получим вектор е\. Векторы е\ и ез будут ортогональными согласно теореме 6.4. Недостающий третий вектор ортонормированного базиса мо- может быть найден при помощи векторного произведения: в2 = Описанный прием позволяет избежать процесса ортогона- лизации. Точно так же можно не применять процесс ортогона- лизации при п = 2, так как, зная один вектор е\ ортонормиро- ортонормированного базиса, мы можем получить второй поворотом первого на 90°. Для этого достаточно поменять две координаты векто- вектора е\ местами, а у первой из них к тому же изменить знак. При п > 3 приемов, аналогичных описанным, нет. Вопросы и задачи 7.1. Опишите множество всех ортогональных матриц вто- второго порядка. 7.2. Пользуясь результатами задачи 7.1, докажите, что лю- любой ортогональный оператор в евклидовом пространстве V<i является либо поворотом вектора на некоторый угол, либо сим- симметрией относительно некоторой прямой, либо произведением таких операторов. 7.3. Докажите, что произведение ортогональных операто- операторов является ортогональным оператором. Можно ли утвер- утверждать, что: а) сумма ортогональных операторов есть ортого- ортогональный оператор? б) произведение ортогонального оператора на число есть ортогональный оператор? 7.4. Докажите, что линейный оператор А в евклидовом пространстве тогда и только тогда является ортогональным, когда А* А = J.
Вопросы и задачи 213 7.5. Докажите, что если Н — инвариантное подпростран- подпространство для ортогонального оператора А, то и Н1- — тоже инва- инвариантное подпространство этого оператора. 7.6. Докажите, что собственными значениями ортогональ- ортогонального оператора могут быть лишь числа 1 и — 1. 7.7. Приведите пример ортогонального оператора, не име- имеющего собственных векторов. Какой может быть размерность евклидова пространства, в котором есть такие операторы? 7.8. Докажите, что любой ортогональный оператор в про- пространстве V3 имеет собственный вектор. Используя результа- результаты задач 7.2 и 7.5, опишите множество ортогональных опера- операторов в V3. 7.9. Докажите, что любому перемещению твердого тела вокруг неподвижной точки из одного положения в другое со- соответствует ортогональный оператор в пространстве V$ и что эти положения связаны между собой вращением тела вокруг не- неподвижной оси. Эта ось проходит через неподвижную точку и параллельна собственному вектору указанного ортогонального оператора. 7.10. Приведите пример оператора, одновременно являюще- являющегося и самосопряженным, и ортогональным. 7.11. Приведите к диагональному виду ортогональным пре- преобразованием следующие симметрические матрицы:
8. КВАДРАТИЧНЫЕ ФОРМЫ 8.1. Определение квадратичной формы Определение 8Л. Однородный многочлен второй степени от п переменных с действительными коэффициентами называют квадратичной формой. Для нас квадратичная форма представляет интерес как способ задания некоторой функции векторного аргумента, определенной в п-мерном линейном пространстве С. Если в этом пространстве выбрать некоторый базис, то квадратичную форму (8.1) можно трактовать как функцию, значение которой определено через координаты х\, ..., хп вектора х. Эту функцию часто отождествляют с квадратичной формой. Квадратичную форму (8.1) можно записать в матричном виде: хТАх, (8.2) где х = (х\ ... хп) — столбец, составленный из переменных; А = (aij) — симметрическая матрица порядка п, называемая матрицей квадратичной формы (8.1). Ранг матрицы А квадратичной формы называют рангом квадратичной формы. Бели матрица А имеет максималь- максимальный ранг, равный числу переменных п, то квадратичную фор- форму называют невырожденной, а если Rg A < п, то ее называ- называют вырожденной.
8.2. Преобразование квадратичных форм 215 Пример 8.1. Квадратичная форма от трех переменных х\ + 4tfi#3 имеет матрицу Так как Rg-A = 2 < 3, то эта квадратичная форма является вырожденной. В матричной записи квадратичная форма имеет вид / 0 2\ /хх 0 0 0 2 0 0 8.2. Преобразование квадратичных форм Пусть дана квадратичная форма хТАх, где х = (х\ ..., хп) . В п-мерном линейном пространстве С с фиксированным бази- базисом Ь она определяет функцию f(x) = x^Axb, заданную через координаты хь вектора х в базисе Ь. Найдем представление этой же функции в некотором другом базисе е. Пусть U — матрица перехода от Ь к е. Тогда координаты хь вектора х в старом базисе Ъ и координаты хе того же вектора в новом базисе е будут связаны соотношением хь = Uxe. (8.3) Функция f(x) в новом базисе будет выражаться через новые координаты вектора х следующим образом: xTbAxb = (UxefA(Uxe) = xTe(UTAU)xe = а?А'*е. Итак, функция / в новом базисе также записывается при помощи квадратичной формы, причем матрица А1 этой квадра-
216 8. КВАДРАТИЧНЫЕ ФОРМЫ тичной формы связана с матрицей А исходной квадратичной формы соотношением Af = UTAU. . (8.4) Преобразование матрицы квадратичной формы вызывается за- заменой переменных (переходом от переменных хь к переменным хе) в соответствии с формулой (8.3). Замечание 8.1. Замену переменных вида (8.3) с произ- произвольной матрицей U называют линейной. Изменение базиса в линейном пространстве приводит к линейной замене перемен- переменных (8.3) с невырожденной матрицей U. Пример 8.2. Квадратичную форму преобразуем к новым переменным yi, уг, Уз? где :i = ул 4- t/9 + У%ч 1 if L ' if Л ' iJO) Эта замена переменных в матричной записи имеет вид х = С/у, где Согласно (8.4) имеем UTAU =
8.3. Квадратичные формы канонического вида 217 и квадратичная форма принимает вид т.е. все коэффициенты при попарных произведениях перемен- переменных обнуляются и остаются слагаемые с квадратами перемен- переменных. 8.3. Квадратичные формы канонического вида Определение 8.2. Квадратичную форму \ 2 (8.5) не имеющую попарных произведений переменных, называют квадратичной формой канонического вида. Переменные #ъ • • • > хп, в которых квадратичная форма имеет канонический вид, называют каноническими переменными. Один из методов преобразования (или, как говорят, приве- приведения) квадратичной формы к каноническому виду путем заме- замены переменных состоит в последовательном выделении полных квадратов. Такой метод называют методом Лагранжа. Проиллюстрируем этот метод на простом примере. Пример 8.3. Рассмотрим квадратичную форму х\ — 4х\Х2 от двух переменных. Для преобразования ее к каноническому виду выделим полный квадрат по х\. Для этого соберем все слагаемые, содержащие #i, и дополним до полного квадрата: х\ - 4x1^2 = х\ - 4x1^2 + 4#2 ~ 4ж2 = (xi — 2#2J - 4^2. Введя новые переменные z\ = х\ - 2#2, 32 = 2ж2, получим ква- квадратичную форму канонического вида: z\ — z\. #
218 8. КВАДРАТИЧНЫЕ ФОРМЫ Как применять метод Лагранжа в общем случае? Рассмо- Рассмотрим квадратичную форму от п переменных общего вида (8.1). Если ац^0, соберем все слагаемые формы, содержащие пере- переменное #1, и дополним их слагаемыми так, чтобы получился полный квадрат. В результате получим: п ^^пцх? + 2 3=2 г=2 п nxnJ - ап ^ 3=2 n iXj + 2_^ o,uxf + 2 г=2 i=l где a'x = an, aij = ац/ап, j = 1, n, а Д — квадратичная форма, не содержащая переменного х\. С квадратичной формой Д можно поступить аналогичным образом, выделяя полный квадрат по переменной x*i- Продол- Продолжая процесс, мы преобразуем квадратичную форму f(x) к виду () J=l где коэффициенты о' являются ненулевыми, а ctjj = 1, j = 1, г.
8.3. Квадратичные формы канонического вида 219 Выполним линейную замену переменных х[ = ацхх +... + а\пхп, Хг — OLrrXr х'г+1 = хп ~~ определяемую верхней треугольной матрицей U. Отметим, что диагональные элементы матрицы U равны единице, поэтому эта матрица невырождена. В результате замены переменных мы придем к; квадратичной форме имеющей канонический вид. Изложенная схема не применима, если на каком-либо ее эта- этапе в квадратичной форме нет соответствующего переменного во второй степени. Например, может случиться, что аи =0. Тогда мы вместо переменного х\ можем остановить свой вы- выбор на другом, квадрат которого присутствует в квадратичной форме. Но может быть так, что в квадратичной форме нет ни одного квадрата (например, f{x\,X2) = x\X2). Тогда пе- перед выделением квадрата следует выполнить промежуточную замену переменных. Для этого выбираем любое слагаемое ква- квадратичной формы. Пусть для определенности аи Ф 0, так что присутствует слагаемое 2a\*ix\x<i. После замены переменных х\ = х\ + х'2, Х2 = х[ — х'2, жз = #з> • • •» хп = хп получим квадра- тичную форму, у которой присутствует квадрат переменного #1, так как х\х2 = (х[ + х?2)(х[ - xf2) = {х[J - (х'2J. Отметим, что канонический вид, к которому приводит- приводится данная квадратичная форма, определяется неоднозначно.
220 8. КВАДРАТИЧНЫЕ ФОРМЫ • Так, в примере 8.3 после дополнительной замены переменных w\ = zi/2, W2 = 22/2 получим еще одну квадратичную форму канонического вида Aw\ — 4w\. 8.4. Ортогональные преобразования квадратичных форм Как мы установили (см. 8*2), матрица А квадратичной формы при переходе к новому базису изменяется по формуле А! = UTAU, где U — матрица перехода. Если рассматри- рассматривается евклидово пространство, а старый и новый базисы выбраны ортонормированнымщ то матрица перехода U явля- является ортогональной и мы имеем дело с ортогональным пре- преобразованием квадратичной формы, т.е. преобразованием А' = UTAU, в котором матрица U ортогональна. Теорема 8.1. При ортогональном преобразовании квадра- квадратичной формы характеристическое уравнение ее матрицы не изменяется. -4 Пусть А — матрица заданной квадратичной формы. При ор- ортогональном преобразовании эта матрица изменяется по фор- формуле А' = UTAU, где U — ортогональная матрица. Согласно свойству 7.2, ортогональная матрица U имеет обратную, при- причем U~~l = UT. Поэтому А1 = UTAU = U~lAU, и мы видим, что матрицы А1 и А подобны. Согласно теореме 5.2, характеристи- характеристические уравнения подобных матриц совпадают. > Теорема 8.2. Любую квадратичную форму ортогональ- ортогональным преобразованием можно привести к каноническому виду, < Матрица А данной квадратичной формы является симме- симметрической. Но любая симметрическая матрица, согласно след- следствию 6.4, подобна диагональной, т.е. существует такая не- невырожденная матрица Р, что матрица А1 = Р~1АР является диагональной. Нам надо лишь убедиться, что в качестве Р можно выбрать ортогональную матрицу. Тогда А1 = РТАР
8.4. Ортогональные преобразования квадратичных форм 221 и диагональная матрица А1 является матрицей квадратичной формы, полученной из исходной при помощи ортогонального преобразования. Диагональный вид А1 равнозначен канониче- каноническому виду квадратичной формы. Чтобы выяснить характер матрицы Р, нужно вспомнить теорему 6.5, из которой и было выведено упомянутое следствие 6.4. Рассмотрим произвольное п-мерное евклидово простран- пространство ? (п — количество переменных в квадратичной форме) и некоторый ортонормированный базис Ь в этом пространстве. Матрица А является матрицей некоторого самосопряженного оператора А в базисе Ь. Согласно теореме 6.6, существует та- такой ортонормированный базис е, что матрица А1 оператора А в этом базисе является диагональной. Согласно формуле пре- преобразования матрицы линейного оператора, имеем А1 — Р АР (см. теорему 4.6), где Р — матрица перехода из базиса 6 в базис е. Так как оба базиса ортонормированные, матрица Р является ортогональной. > Теорема доказана, но подход, который мы использовали в доказательстве, позволяет сделать и другие выводы, о ко- которых в формулировке теоремы речь не идет. Во-первых, диагональными элементами матрицы А! квадратичной формы канонического вида, получающейся в результате ортогонально- ортогонального преобразования, являются собственные значения матрицы А квадратичной формы. Из этого следует, что мы можем записать матрицу А' канонического вида, не находя соответ- соответствующего ортогонального преобразования. Во-вторых, находя ортогональное преобразование, приводя- приводящее квадратичную форму к каноническому виду, мы фактиче- фактически ищем базис из собственных векторов соответствующего самосопряженного оператора. Действительно, если кйадра- тичная форма и самосопряженный оператор имели в исходном ортонормированном базисе одинаковую матрицу, то и в новом ортонормированием базисе их матрицы будут совпадать.
222 8. КВАДРАТИЧНЫЕ ФОРМЫ Мы предполагаем, что квадратичная форма представляет собой запись функции, заданной в евклидовом пространстве, через координаты вектора в некотором ортонормированном базисе. На самом деле такая интерпретация носит чисто вспо- вспомогательный характер, помогающий смотреть на процесс с геометрической точки зрения, но она никак не используется в самом алгоритме построения ортогонального преобразова- преобразования. Достаточно лишь записать матрицу квадратичной формы и применить к этой матрице процедуру приведения к диаго- диагональному виду (см. 7.4). Проиллюстрируем на примерах процедуру практического вычисления ортогонального преобразования, приводящего ква- квадратичную форму к каноническому виду. Пример 8.4. Квадратичную форму f(x,y) = х\ — Ьх\Х2 от двух переменных мы приводили к каноническому виду методом Лагранжа (см. пример 8.3). Теперь попробуем привести ее к каноническому виду ортогональным преобразованием. Матрица нашей квадратичной формы имеет вид V-2 О Найдем характеристическое уравнение этой матрицы: 12Х 0~-Х Вычисляем корни характеристического уравнения, они же соб- собственные значения матрицы А: Теперь можем записать канонический вид напгей квадратичной формы: 1 + VU 2 1 — л/17 , о У1 + а У2-
8.4. Ортогональные преобразования квадратичных форм 223 Пример 8.5. Найдем канонический вид квадратичной формы f(xi)X2) = 5#i + 8х\х2 + 5#2, к которому она приводится ортогональным преобразованием, и укажем одно из таких ортогональных преобразований. Квадратичная форма имеет матрицу А = с характеристическим уравнением матрицы 5-А 4 4 5-А Собственными значениями матрицы квадратичной формы являются Ai = 1, А2 = 9, т.е. квадратичная форма приводится ортогональным преобразованием к каноническому виду Для построения ортогонального преобразования найдем соб- собственные векторы матрицы рассматриваемой квадратичной формы. Из однородной системы линейных алгебраических уравнений (А — ХЕ)х = 0 при А = 1 находим собственный век- вектор е\ = A — 1) . Тогда вектор е2 = A 1) , ортогональный вектору ei, будет собственным вектором с соответствующим собственным значением А2 = 9 (см. 7.4). Пронормировав эти векторы, составляем из столбцов их координат матрицу орто- ортогонального преобразования --Ш О- которой соответствует линейная замена переменных х = Ру. # Единообразное поведение самосопряженных операторов и квадратичных форм при замене ортонормированного базиса объясняется следующей связью.
224 8. КВАДРАТИЧНЫЕ ФОРМЫ Теорема 8.3. Пусть А: ? -г» ? — самосопряженный опе- оператор, действующий в евклидовом пространстве ?. Функ- Функция /(ж) = (Ах, ж), определенная на евклидовом пространстве, является квадратичной формой. Наоборот, для любой квадра- квадратичной формы f(x) на евклидовом пространстве ? существует такой самосопряженный оператор А, что f(x) = (Ах, ж). Этот оператор определен однозначно. < Чтобы доказать первое утверждение теоремы, вспомним, как записывается скалярное произведение в ортонормирован- ном базисе (см. 3.7). Используя такую запись и учитывая самосопряженность оператора, получаем (Ах, х) = (ж, Ах) = х Ах, где х — столбец координат вектора х; А — матрица линейного оператора А. Мы пришли к координатной записи хтАх некоторой квадратичной формы. Пусть f(x) — квадратичная форма, которая в данном ортонормированном базисе е имеет вид f(x) = х1Ах. Взяв самосопряженный оператор А, который в базисе е имеет матрицу А, получаем f(x) = хтАх = хт(Ах) = (ж, Ах) = {Ах, ж). Наконец, докажем, что если для Двух самосопряженных опе- операторов А и В выполняется равенство (Ах, ж) = (Вх, ж) для любого вектора ж G ?, то А = В. Записав указанное равенство в координатах (А, В — матрицы операторов, х — столбец коор- координат вектора ж), получаем хтАх = хтВх, т.е. равенство двух многочленов второй степени от п переменных. Такое равенство возможно лишь в том случае, когда все коэффициенты этих многочленов при одинаковых слагаемых равны, но это экви- эквивалентно равенству матриц Л = Ви, следовательно, равенству самосопряженных операторов. >
8.5. Закон инерции 225 8.5. Закон инерции Квадратичная форма может быть приведена к различным каноническим видам. Например, для квадратичной формы х\ — Ьх\Х2 найдены уже три канонических вида. Но, несмотря на многообразие канонических видов для данной квадратичной формы, имеются такие характеристики их коэффициентов, ко- которые во всех этих канонических видах остаются неизменными. Например, если квадратичная форма преобразовалась к виду в котором все коэффициенты \ положительны, то соответству- соответствующая этой квадратичной форме функция в линейном простран- пространстве принимает только неотрицательные значения. Значит ни- никакой другой канонический вид не может иметь отрицательных коэффициентов, так как наличие отрицательных коэффициен- коэффициентов означает, что функция имеет и отрицательные значения. Другой важной характеристикой является ранг матрицы ква- квадратичной формы. Теорема 8.4. Ранг квадратичной формы не меняется при невырожденных линейных заменах переменных и равен: а) числу отличных от нуля коэффициентов в любом ее каноническом виде; б) количеству ненулевых собственных значений матрицы квадратичной формы (с учетом их кратности). <4 При изменении базиса линейного пространства матрица А квадратичной формы преобразуется по формуле А1 = UT AU, в которой U — матрица перехода (см. 8.2). Матрица С/, как матрица перехода, является невырожденной, поэтому ранг А1 совпадает с рангом Л, так как при умножении на невырожден- невырожденную матрицу ранг не меняется (см. замечание 4.3). Пусть квадратичная форма имеет два канонических вида
226 8. КВАДРАТИЧНЫЕ ФОРМЫ --- в которых все коэффициенты А* и /х^ ненулевые. Оба кано- канонических вида — это квадратичные формы, представляющие собой одну и ту же функцию на линейном пространстве, но записанную в разных базисах. Значит, одна из этих квадратич- квадратичных форм получается из другой в результате замены базиса, и ранги их матриц совпадают. Остается заметить, что ранг квадратичной формы канонического вида равен количеству не- ненулевых коэффициентов этой формы, т.е. в нашем случае га = fc. Это доказывает утверждение а). Квадратичную форму можно привести к каноническому ви- виду ортогональным преобразованием (см. теорему 8.2). При этом коэффициенты квадратичной формы канонического вида (они же диагональные элементы ее матрицы) будут собствен- собственными значениями матрицы исходной квадратичной формы. Это доказывает утверждение б). > В различных канонических видах данной квадратичной формы остается неизменным не только количество ненулевых коэффициентов, но и количество положительных и соответ- соответственно отрицательных коэффициентов. Объединяя это с до- доказанной теоремой, получаем следующее утверждение, называ- называемое законом инерции. Теорема 8.5. Для любых двух канонических видов Ai^O, г = Т7т, (8.6) /Ът^О, j=I7fc, (8.7) одной и той же квадратичной формы: - т = к и их общее значение равно рангу квадратичной формы; - количество положительных коэффициентов А$ совпадает с количеством положительных коэффициентов }ij\ - количество отрицательных коэффициентов А$ совпадает с количеством отрицательных коэффициентов fj,j.
8.5. Закон инерции 227 <4 Согласно теореме 8.4, количество ненулевых коэффициентов в квадратичных формах (8.6) и (8.7) одинаково, т.е. т = к. Пусть в этих канонических видах положительные коэффици- коэффициенты предшествуют отрицательным, так что мы можем пере- переписать их следующим образом: У где «г > 0, г = 1, А;, и /?j > 0, j = 1, fc. Этого всегда можно до- добиться изменением порядка переменных. Нам нужно доказать, что р = q. Пусть это не так, и мы для определенности положим, что р > q. Обозначим через е = (ei ... еп) и / = (/i ... fn) базисы, в которых записаны канонические виды f\ и /2 (8.8) квадратич- квадратичной формы. Покажем, что существует ненулевой вектор х с координатами у\ ..., уп в базисе е и *i, ..., zn в базисе /, для которого одновременно выполняются условия yi = 0, г =р+1, п, и zj = 0, j = 1, q. Действительно, координаты Zj линейным обра- образом выражаются через координаты у{\ Zj = Ujiyi + ... + щпуп, j = 1, n, причем матрица U = {uji) — это матрица перехода из бази- базиса/в базис е. Поэтому условия, поставленные для вектора х, составляют однородную систему линейных алгебраических- уразнений = О, относительно координат у\ вектора х. Так как уравнений меньше числа неизвестных (п — рЛ-q < п), эта система имеет
228 8. КВАДРАТИЧНЫЕ ФОРМЫ ненулевое решение. Следовательно, существует вектор х Ф О, удовлетворяющий поставленным условиям. Но для этого вею- тора, согласно представлениям (8.8), имеем: Первое неравенство является строгим, так как все координаты уi вектора ж, начиная с номера р + 1, являются нулевыми, а ненулевой вектор должен иметь хотя бы одну ненулевую координату. Два взаимоисключающих равенства показывают, что предположение p^que верно. Значит, р = q, т.е. количество положительных коэффициентов в двух канонических видах одинаково. Тогда и количество отрицательных коэффициентов у них совпадает, так как совпадает количество ненулевых коэффициентов. > 8*6. Критерий Сильвестра Квадратичные формы подразделяют на различные типы в зависимости от множества их значений. Определение 8.3. Квадратичную форму f(x) = хТАх, т х = (х\ ... хп) , будем называть: - положительно (отрицательно) определенной, если для любого ненулевого столбца х выполняется неравенство /(яг)>О(/(х)<О);' - неотрицательно (неположительно) определенной, если f(x)^0 (/(#) ^ 0) для любого столбца ж, причем существу- существует ненулевой столбец ж, для которого f(x) = 0; - знакопеременной (неопределенной), если существуют такие столбцы х и у, что f(x)>0nf(y)< 0.
8.6. Критерий Сильвестра 229 Пример 8.6. Рассмотрим четыре квадратичные формы от трех переменных: = х\ - х\ + х\, Квадратичная форма /i положительно определена, так как представляет собой сумму трех квадратов и потому принимает только положительные значения, если переменные одновремен- одновременно не обращаются в нуль. Квадратичная форма }2 неотри- неотрицательно определена: будучи суммой двух квадратов она не принимает отрицательных значений, но при х\ = х2 = 0 и х$ Ф О она принимает нулевые значения. Квадратичные формы /з и й знакопеременны. Первая из них положительна при х — {\ О 0) и отрицательна при х = @ 1 0) . Вторая положительна при я = A 1 0) и отрицательна при х = A —10). Квадратичные формы f2 и J\ являются вырожденными, так как ранг каждой из них равен двум. # Как следует из определения 8.3, тип квадратичной формы зависит только от множества значений, которые она прини- принимает, но не зависит от переменных, в которых она записана. Поэтому, представив квадратичную форму в каноническом ви- виде, сразу получаем следующие критерии для типа квадратичной формы в зависимости от множества собственных значений ее матрицы. Тип квадратичной формы Положительно определенная (Vx ф 0 : /(х) > 0) Отрицательно определенная (Vx/0:/(x)<0) Знакопеременная (Э*:/(*)>0,Эу:/(у)<0) Вырожденная Множество собственных значений Все собственные значения положительны (Ai > 0, i = I~n) Все собственные значения отрицательны (Л» < 0, г = l^n) Есть собственные значения разных знаков (ЗА. > 0, ЗА; < 0) Есть нулевое собственное значение (ЗА, = 0).
230 8. КВАДРАТИЧНЫЕ ФОРМЫ Хотя эта таблица дает удобную характеристику типам квадратичных форм, ее использование для определения типа конкретной квадратичной формы связано с вычислением соб- собственных значений матрицы. А это достаточно трудоемкая операция. На самом деле во многих случаях тип квадратичной формы можно определить, не вычисляя собственных значений ее матрицы. Метод состоит в вычислении и проверке знаков некоторых миноров матрицы квадратичной формы. Введем следующие обозначения. Пусть матрица квадратичной формы f(x) = х Ах имеет вид А = an \0>п\ где a{j = ajiy i,j = 1,п. Рассмотрим угловые миноры этой матрицы (которые также называют главными минорами): Д2 = О>21 ац 0>пп Как видим, угловой минор порядка к расположен на пересече- пересечении первых к строк и первых к столбцов матрицы. Угловой минор максимального, n-го порядка представляет собой опре- определитель матрицы. Теорема 8.6 (критерий Сильвестра). Для того чтобы квадратичная форма от п переменных была положительно определена, необходимо и достаточно, чтобы выполнялись неравенства Ai > 0, Д2 > 0, Д3 > 0, ..., Дп > 0. «^Необходимость. Если квадратичная форма положитель- положительно определена, то в ее каноническом виде все коэффициенты должны быть положительны. Значит, и определитель матрицы
~ 8.6. Критерии Сильвестра 231 квадратичной формы канонического вида положителен. Не- Невырожденное преобразование квадратичной формы не меняет знака определителя, так как, согласно формуле преобразова- преобразования (8.4), det(UTAU) = (detUJdetA. Поэтому определитель матрицы исходной канонической формы тоже положителен, т.е. дп>о. Если квадратичная форма /(жь... ,жп) от п переменных по- положительно определена, то квадратичная форма /*(#ъ ...,?*) = = / (х 1,..., Xk, 0,..., 0) от А: переменных также положительно определена и, следовательно, определитель ее матрицы поло- положителен. Но этот определитель совпадает с Д&, т.е. Д* > 0 при Достаточность. Используем метод математической индукции по количеству п переменных квадратичной формы. При п = 1 утверждение очевидно. Пусть утверждение верно для всех квадратичных форм от к переменных, к ^ п — 1. Рас- Рассмотрим произвольную квадратичную форму f(x) с матрицей А = (a,ij) в базисе е = (ei ... еп), у которой все угловые ми- миноры положительны. Квадратичная форма fn-i(xx > • • • ,#n-i) = = /(#i,...,#n_i,0) от п — 1 переменных определена на линейном подпространстве %п-\ =span{ei,...,en_i} и имеет матрицу, совпадающую с матрицей минора Дп-ь Так как все угловые миноры для Ап-ь они же угловые миноры матрицы А, поло- положительны, согласно предположению математической индукции квадратичная форма /n_i является положительно определен- определенной. Заменой базиса (ei ... en_i) подпространства Hn-i но- новым базисом (/i ... /n-i) мы можем привести квадратичную форму /n_i к диагональному виду: fn-i{x) = Ais? +... + An-irr*-!, Ai > 0, г = l,n-l. (8.9) В базисе (/i ... /n_i en) квадратичная форма f(x) имеет вид n-l n-l t=l
232 8. КВАДРАТИЧНЫЕ ФОРМЫ так как при хп = 0 она совпадает с квадратичной формой /n-i. Преобразуем последнее выражение для /(ж), выделяя квадраты по переменным х\, ..., хп-\: г=1 где /it = Ъгп/Хи г = 1,п-1, Ап = Ьпп - Ai/i? - ... - \n^x^_v Вы- полнив линейную замену переменных х\ = Zi + /4гжП7 *==: 1? га—1, х^ = хп с невырожденной матрицей, приходим к квадратичной форме канонического вида f(x) = \1(x[J + ... + \n(x'nJ, (8.10) в которой, согласно (8.9), коэффициенты Ai, ..., An_i положи- положительны. У определителя матрицы квадратичной формы знак не зависит от выбора базиса. Поэтому в представлении (8.10) имеем Ai...An_iAn > 0, так как Ап > 0. Отсюда следует, что Ап > 0, так как все остальные коэффициенты Х{ положитель- положительны. Таким образом, в представлении (8.10) все коэффициенты положительны и квадратичная форма f(x) положительно опре- определена. > Следствие 8.1. Для того чтобы квадратичная форма п переменных была отрицательно определена, необходимо и достаточно, ^н?обы выполнялись йеравенства — А\ > 0, Аг > 0, —Дз > 0, ..., (—1)ПДП > 0 (знаки угловых миноров чередуются начиная с минуса). <4 Если квадратичная форма /(ж) отрицательно определена, то квадратичная форма —f(x) положительно определена, и наобо- наоборот. Матрицей квадратичной формы —/(ж) является матрица —Л, противоположная матрице А квадратичной формы f(x). Согласно критерию Сильвестра, для положительной определен- определенности квадратичной формы —f{x) необходимо и достаточно, чтобы все угловые миноры AJ,, г = 1,п, матрицы —А были по- положительны. Но при умножении матрицы А на число —1 все
8.6. Критерий Сильвестра 233 ее элементы умножаются на это число и поэтому Д{. = (—1)ГАГ, где Дг — угловой минор порядка г матрицы А. Таким обра- образом, квадратичная форма —/(#) положительно определена то- тогда и только тогда, когда выполнены неравенства (—1)г Дг > О, г = 1, п, и это условие эквивалентно тому, что квадратичная форма f(x) отрицательно определена. > Следствие 8.2. Невырожденная квадратичная форма зна- копеременна тогда и только тогда, когда для матрицы квадра- квадратичной формы выполнено хотя бы одно из условий: - один из угловых миноров равен нулю; - один из угловых миноров четного порядка отрицателен; - два угловых минора нечетного порядка имеют разные знаки. <4 Невырожденная квадратичная форма может быть либо поло- положительно определенной, либо отрицательно определенной, либо знакопеременной — в зависимости от знаков коэффициентов в ее каноническом виде. Если имеется нулевой угловой минор или один из угловых миноров четного порядка отрицателен, то, со- согласно теореме 8.6 и следствию 8.1, эта квадратичная форма не является ни положительно, ни отрицательно определенной. То же можно утверждать и в случае, когда есть два угловых минора нечетного порядка с разными знаками. Значит, в этих случаях квадратичная форма знакопеременная. > Критерий Сильвестра и его следствия показывают, что тип квадратичной формы полностью определяется свойства- свойствами ее матрицы. Поэтому термины, введенные определением 8.3, можно перенести на симметрические матрицы. В част- частности, симметрическую матрицу А называют положитель- положительно {отрицательно) определенной и пишут А > О (А < 0), если положительно (отрицательно) определена соответствую- соответствующая квадратичная форма. Согласно теореме 8.6 и ее следстви- следствиям, симметрическая матрица положительно определена, если
234 8. КВАДРАТИЧНЫЕ ФОРМЫ все ее угловые миноры положительны. Симметрическая матри- матрица отрицательно определена, если у ее угловых миноров знаки чередуются начиная со знака минус. Следствие 8,3. Если симметрическая матрица положи- положительно определена, то все ее диагональные элементы положи- положительны. М Если А = (ац) — симметрическая положительно определенная матрица порядка п, то ее первый угловой минор положителен, т.е. оц = А\ > 0. Воспользовавшись тем, что утверждение следствия верно для диагонального элемента ац, докажем что и ац > 0 при г > 1. В квадратичной форме хтАх, х = (жх,... ,хп) сделаем замену переменных zi = 2/i, a* = t/i, Xj = yj пря j ? l,i. В новых переменных матрица А1 = (а!ц) квадратичной формы такова, что ац = а'п > 0. > Рассмотрим примеры на применение критерия Сильвестра. Пример 8.7. Квадратичная форма хтАх от трех перемен- переменных с матрицей 10-1 А=| 0 1 1 -1 1 3, положительно определена, так как А\ = Дг = Дз = 1 > 0. Пример 8.8. Квадратичная форма хтАх от трех перемен- переменных с матрицей является знакопеременной, так как она невырождена (Дз ф 0) и Ai = 1 > 0, а А2 = -8 < 0.
Д.8.1. Билинейные формы 235 Пример 8.9. Квадратичная форма 2x\x<i от двух пере- переменных является знакопеременной, так как она невырождена Пример 8.10. Квадратичная форма /(хъ #25#з5#4) = = 4#1Жз + 2^2X4 + х\ имеет угловые миноры Дх = Дг = Дз = О, Д4 = 4 и, согласно следствию 8.2, является знакопеременной. В этом можно убедиться, используя несложное преобразование вида квадратичной формы: Дополнение 8.1. Билинейные формы Функцию Ь(ж,у) от двух переменных, определенную в ли- линейном пространстве ?, называют билинейной формой, если эта функция линейна по каждому из своих аргументов, т.е. для любых действительных а и /3 и любых векторов x,y,z€ С выполняются равенства Пример 8.11. Частным случаем билинейной формы явля- является скалярное произведение. Действительно, аксиомы в) и г) скалярного умножения означают, что скалярное произведение как функция от двух переменных линейно по первому аргумен- аргументу, а в силу аксиомы а) скалярное произведение линейно и по второму аргументу. # Выберем в п-мерном линейном пространстве С некоторый базис е = (е\ ... еп). Для билинейной формы Ь(ж,у) обозначим hj = 6(ej,ej), ij = 1,п. Тогда для любых векторов х и у со столбцами координат х = (х\ ... хп) и у = (yi ... уп) в
2368. КВАДРАТИЧНЫЕ ФОРМЫ базисе е п п п п п Используя квадратную матрицу В = F^) порядка п, можем записать полученное представление в матричном виде: Ь{х,у)=хтВу. (8.11) Матрицу В называют матрицей билинейной формы. Тройное произведение, стоящее в правой части (8.11), нам уже встречалось (см., например, лемму на с. 185). Кстати, эта лемма показывает, что разным билинейным формам соответ- соответствуют разные матрицы. Таким образом, билинейная форма однозначно определяется своей матрицей в произвольно вы- выбранном базисе. Кроме того, из леммы следует, что любая функция 6, имеющая представление (8.11), является билиней- билинейной формой, и В является матрицей этой билинейной формы. Основываясь на этом, выясним, как изменяется матрица били- билинейной формы при изменении базиса. Пусть билинейная форма Ь имеет в базисе 6 матрицу В&, а в базисе е матрицу Ве. Обозначим через U матрицу перехода из базиса Ь в базис е. Тогда для любых двух векторов ж, у со столбцами координат ?&, уь в базисе b и хе, уе в базисе е имеем Ь(х,у) = хТьАьУь = (UxefAb(Uye) = xTe(UTAbU)ye. Сравнивая полученное представление с (8.11), делаем вывод, что матрица U AbU является матрицей билинейной формы в базисе е, т.е. Ае = UTAbU. (8.12) Представление (8.11) билинейной формы в базисе похоже на запись (8.2) квадратичной формы в матричном виде. Кроме того, матрица билинейной формы преобразуется по тому же
Д.8.1. Билинейные формы 237 закону, что и матрица квадратичной формы (ср. (8.4) и (8.12)). Но матрица квадратичной формы симметрическая, в то время как матрица билинейной формы, вообще говоря, нет. Для того чтобы матрица билинейной формы Ь(ж,у) в базисе е являлась симметрической, должны выполняться условия Ь(е*,е,) = Ь(е,-,е»), ij = 1, п. Если Ь(ж,у) — билинейная форма, то функция Ь(ж,а?) в за- заданном базисе записывается в виде Ь(ж, х) = хТВх. Это матрич- матричное произведение представляет собой квадратичную форму от координат вектора х. Матрицей этой квадратичной формы является матрица А = 0,5E + В ). Матрицы билинейной и ква- квадратичной форм совпадут, если матрица В билинейной формы симметрическая. Пример 8.12. Функция Ъ(х,у) = х\у2, заданная через коор- т 1? динаты х = (xi X2) и у = (yi j/г) векторов ж и у в некотором базисе е двумерного линейного пространства, является били- билинейной формой с матрицей Б = Соответствующая ей квадратичная форма имеет вид /(аз) = -=-x\x<i и матрицу A=(l/2 Отметим, что квадратичная форма /(аз) порождается так- также и билинейной формой bs(x,y) = 0,Ьх\у2 + 0,5^22/1 > имеющей матрицу А. Определение 8.4. Билинейную форму 6(ж,у) называют симметрической (кососимметрической), если Ь(аз,у) = = 6(у,х) (Ь(х,у) = —Ь(у,ж)) для любых векторов аз и у.
238 8. КВАДРАТИЧНЫЕ ФОРМЫ Пример 8.13. Примером симметрической билинейной фор- формы является скалярное произведение. По существу, определе- определение 3.1 говорит, что скалярное произведение — это билинейная симметрическая форма, порождающая положительно опреде- определенную квадратичную форму (последнее — содержание аксио- аксиомы г) скалярного произведения). # Бели в билинейной форме Ь(х,у) поменять местами пере- переменные, то получим новую билинейную форму У{х,у) = Ь(у,ж), матрица которой будет транспонированной к исходной. Дей- Действительно, если в некотором базисе 6(ж,у) = хТВу, то в том же базисе Ъ'(х,у) = Ъ{у,х) = утВх = (уТВх)т = хтВту, так как у Вх — это число и транспонирование его не меняет. Бели билинейная форма Ь(у,х) симметрическая, то переста- перестановка аргументов не меняет ее. В этом случае Ь1 (ж, у) = Ь(ж, у) и Вт = В, т.е. матрица симметрической билинейной формы явля- является симметрической. Верно и обратное утверждение: если матрица В билинейной форма Ь(у,х) симметрическая, то и са- сама билинейная форма симметрическая. Это следует из равенств 4х >У) = хтВу = (хтВу)т = утВтх = утВх = 6(у,ж). Итак, для симметричности билинейной формы необходи- необходима и достаточна симметричность ее матрицы. Отметим, что если билинейная форма имеет симметрическую матрицу в од- одном базисе, то ее матрица будет симметрической и в любом другом базисе. Случай косимметрической билинейной формы аналогичен. Для того чтобы билинейная форма была кососим- метрической, необходимо и достаточно, чтобы ее матрица в каком-либо базисе была кососимметрической. Теорема 8.7. Для любой квадратичной формы f(x) су- существует, и притом единственная, симметрическая билинейная форма 2?(ж,у), для которой /(ж) = В(х,х) для любого векто- вектора X.
Вопросы и задачи 239 <4 Выберем произвольный базис е и запишем в нем матри- матрицу А квадратичной формы /(ж). Билинейная форма Ь(х,у) с симметрической матрицей А в этом же базисе является сим- симметрической и порождает квадратичную форму f(x) с той же матрицей А. Разные симметрические билинейные формы поро- порождают квадратичные формы с разными матрицами. Значит, нмкакой квадратичной форме не могут соответствовать две различные симметрические билинейные формы. > Замечание 8.2. По квадратичной форме соответствую- соответствующая ей билинейная форма легко восстанавливается, при этом не нужно прибегать к записи функций в каком-либо базисе. Рас- Рассмотрим функцию Это билинейная симметрическая форма, что следует из ее записи в произвольном базисе: Ь(ж, у) = 0,5((х + у)тА(х + у) - хтАх - утАу) = = ОМ*ТАУ + УТАх) = 0,5(ятАу + (утАх)т) = т т т т = 0,5(ж Ау + х А у)/2-х Ау, где А — матрица квадратичной формы f(x) в этом же базисе. При этом Ь(х,х) = х1Ах = /(ж). Вопросы и задачи 8.1. Найдите ранг квадратичных форм от трех переменных: а) х2 + у2 + 2xz; б) 2ху + 2xz + 2yz\ в) (х + уJ - (х - у - гJ; r)(x-y-2zJ. 8.2. Приведите к каноническому виду методом Лагран- жа следующие квадратичные формы от трех переменных: а) х2 + 2у2 + 2xz + 2yz\ б) 2ху + 2xz + 2yz\ в) х2 - у2 + 2z2 + + 2xy + 2xz.
240 8. КВАДРАТИЧНЫЕ ФОРМЫ 8.3. Приведите к каноническому виду при помощи ортого- ортогонального преобразования следующие квадратичные формы от двух переменных: а) х2 + ху + у2; б) ху; в) 2х2 + Зу2 + 2ху. 8.4. Какой ранг может иметь положительно определенная квадратичная форма от п переменных? 8.5. Определите тип следующих квадратичных форм от двух переменных: а) х2 — ху + у2; б) 2ху\ в) х2 + Аху + 4у2. 8.6. Квадратичная форма от двух переменных имеет вид ах2 + Ъху + су2, т.е. является квадратным трехчленом относи- относительно любой из переменных. Как тип квадратичной формы связан с дискриминантом этого квадратного трехчлена? 8.7. Выясните, являются ли положительно определенными следующие квадратичные формы от трех переменных: а) х2 + + у2 -z2 + 2ху + 2xz + 2yz; б) ху + xz + yz; в) х2 + у2 + z2 + + 2ху\ г) х2 + у2 + z2 + ху + xz + yz.
9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 9.1. Поверхности второго порядка Рассмотрим линейное арифметическое пространство Rn, являющееся евклидовым пространством со стандартным ска- скалярным произведением: (ж, у) = xiyi + х2у2 + ... + ХпУп, где х = (xi, ..., хп), у = (уь ..., уп). Векторы из R3 или R2 можно рассматривать как геометрические векторы в w точеч- точечном" трехмерном пространстве или соответственно двумерном пространстве (плоскости). Зафиксировав в трехмерном про- пространстве точку, мы можем считать ее стандартным началом каждого вектора, а тогда каждая точка пространства опреде- определяется как конец некоторого геометрического вектора. Эту точку зрения можно обобщить на линейное арифмети- арифметическое пространство произвольной размерности. Векторы в Шп будем трактовать как точки. Некоторую фиксированную точку О (другими словами, вектор) и ортонормированный ба- базис ев!п назовем прямоугольной системой координат в Rn, точку О — началом системы координат. Коорди- Координатами произвольной точки М (это тоже вектор из Кп) в этом пространстве назовем координаты вектора М — О отно- относительно базиса е. Приведенное обобщение позволяет с единых позиций анали- анализировать геометрию плоскости и трехмерного пространства. Оно также позволяет дать геометрическую интерпретацию не- некоторым объектам арифметического пространства. Например, множество всех решений однородной системы линейных алге-
242 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА браических уравнений с геометрической точки зрения пред- представляет собой линейное подпространство арифметического пространства соответствующей размерности. А чем с гео- геометрической точки зрения является множество решений не- неоднородной системы? Как представить множество решений алгебраического уравнения второй степени, если переменных в этом уравнении четыре или больше? Определение 9.1. Поверхностью второго порядка в Шп называют множество точек х € Кп, координаты х = = (х\ ... хп) которых в данной прямоугольной системе ко- координат удовлетворяют уравнению (9.1) где пц, bfc, с — действительные коэффициенты, причем хотя бы один из коэффициентов оу, 1 ^ г ^ j'^ п, отличен от нуля. Замечание 9.1. Поверхность второго порядка в Шп при п = 3 представляет собой обычную поверхность в пространстве, а при п = 2 — кривую на плоскости. Уравнение (9.1) удобно записывать в матричной форме, полагая ац = а^ при i>j и сводя все коэффициенты ац в симметрическую матрицу А = (а^) порядка п, а слагаемые bk — в столбец Ь = (Ь\ ... Ьп) : хТАх + 2Ьтх + с = 0. (9.2) В левой части уравнения (9.2) слагаемые естественным образом распались на три группы. Первая группа предста- представляет собой квадратичную форму хТАх от координат точки. Бе называют квадратичной формой поверхности (9.1) (кривой при п = 2) второго порядка. Вторая группа пред- представляет собой линейные слагаемые. Ее можно трактовать
9.2. Изменение системы координат 243 как координатную запись удвоенного скалярного произведения вектора Ь со столбцом координат b на вектор х со столбцом ко- координат х. Третья группа в левой части (9.2) представлена одним слагаемым с. 9.2. Изменение системы координат Пусть даны старая прямоугольная система координат, со- состоящая из ортонормированного базиса Ь = (Ь\ ... Ьп) и ее начала в точке Ьо, и новая система координат, состоящая из ортонормированного базиса с= (с\ ... сп) и начала со- Рас- Рассмотрим произвольную точку х с координатами хь и хс соот- соответственно в старой и новой системах координат. Из определения координат точки в W1 имеем соотношения х — Ьо = bxfa х — Со = схс. Приравнивая выражения для ж, получаем = схс + со. (9.3) Пусть U — матрица перехода из ортонормированного бази- базиса Ь старой системы координат в ортонормированный базис с новой системы координат. Тогда U — ортогональная матрица (см. теорему 7.5) и с = bU. Подставляя это представление для с в равенство (9.3), находим Ъхъ + Ьо = Ы1хс + со, или Ь{хь - Uxc) = со - Ьо. (9.4) Координаты вектора Cq — Ьо относительно базиса Ь пред- представляют собой координаты точки со (начала новой системы координат) относительно старой системы координат, которые
244 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА мы обозначим через со,ь- со — Ьо = Ьсо,б- С учетом этого ра- равенства преобразуем правую часть (9.4): Ь(хь — Uxc) = Ьсо,ь- Отсюда следует, что xb = Uxc + cOib. (9.5) Соотношение (9.5) представляет собой формулу преобразо- преобразования координат при изменении системы координат. Если со,б = 0, т.е. начала старой и новой систем координат совпадают, то преобразование координат принимает вид хь == Uxc. (9.6) В двумерном случае при дополнительном условии det U = 1 преобразование (9.6) представляет собой поворот системы ко- координат вокруг неподвижного начала системы координат. В трехмерном случае при том же условии det U = 1 это преобра- преобразование является поворотом системы координат вокруг неко- некоторой оси, проходящей через начало координат. Ось поворота определяется собственным вектором матрицы U с собствен- собственным значением 1. Если det С/ = — 1, то преобразование системы координат кроме поворота включает преобразование симме- симметрии относительно некоторой плоскости или сводится к одной симметрии. Пример 9.1. Преобразование системы координат с матри- матрицей /cosy? — sirup О [/= I sirup cosy? 0 V 0 0 -1, состоит в повороте на угол <р вокруг третьего вектора исходно- исходного базиса и последующей симметрии относительно плоскости, которой параллельны первые два вектора (при повороте эта плоскость перейдет в себя). #
9.3. Упрощение уравнения поверхности второго порядка 245 По аналогии с двумерным и трехмерным случаями условно назовем замену (9.6) при произвольном п поворотом систе- системы координат в случае detU = 1 и поворотом системы координат с отражением (симметрией) в случае det[/ = = — 1. Введенные термины условны потому, что в п-мерном пространстве при п > 3 теряется наглядный смысл понятия „по- „поворот". Если в преобразовании (9.5) матрица U является единичной, т.е. U = J5, то старая и новая системы координат имеют один и тот же ортонормированный базис. В этом случае преобразо- преобразование координат имеет вид хь = хс + с0>ь. (9.7) При п = 2,3 такое преобразование означает параллельный перенос системы координат, при котором направления осей координат не изменяются. В общем случае (при п > 3) пре- преобразование (9.7) мы также будем называть параллельным переносом системы координат. Любое преобразование координат вида (9.5) можно предста- представить как последовательное применение двух преобразований х1 = Uxc и хь = х1 + со,ь, которые означают параллельный пере- перенос исходной системы координат в точку с и последующий ее поворот (возможно, с отражением), определяемый матрицей С/. 9.3. Упрощение уравнения поверхности второго порядка Один из подходов к анализу поверхности второго поряд- порядка в Rn, заданной уравнением (9.2), состоит в подборе такой прямоугольной системы координат, в которой уравнение при- принимает наиболее простой вид. Изменение системы координат приводит к преобразованию исходных координат х точки к ее новым координатам у по формуле
246 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА где уо — координаты начала новой прямоугольной системы ко- координат относительно старой (см. (9.5)), a U — ортогональная матрица. При этом преобразовании уравнение (9.2) трансфор- трансформируется к виду (Uy + yo)TA(Uy + уо) + 2bT(Uy + у0) + с = О, или yTUTAUy + 2(bTU + ylAU)y + уоАУо + 2ЬтУо + с = 0. (9.8) Уравнение (9.8) показывает, что параллельный перенос систе- системы координат (в этом случае U = Е) не изменяет квадратичной формы поверхности второго порядка. Квадратичная форма поверхности преобразуется по общему правилу (8.4) преобра- преобразования квадратичных форм при замене базиса. Наиболее естественный способ упрощения уравнения (9.2) базируется на предварительном преобразовании квадратичной формы поверхности. Согласно теореме 8.2, существует новый ортонормированный базис, в котором квадратичная форма имеет канонический вид. Этот базис состоит из собственных векторов матрицы А квадратичной формы, записанных в ис- исходном ортонормированном базисе. Матрица перехода от ста- старого ортонормированного базиса к новому ортонормированно му базису является ортогональной. Изменяя, если необходимо, направление одного собственного вектора на противоположное, можно считать, что определитель этой ортогональной матри- матрицы положителен и потому равен единице. Значит, существует такой поворот исходной системы координат, что квадратич- квадратичная форма поверхности (9.2) в новых переменных будет иметь канонический вид. Пусть yi, ..., уп — новые координаты, в которых ква- квадратичная форма поверхности (9.2) имеет канонический вид. Начало системы координат при этом не изменяется, и преобра-
9.3. Упрощение уравнения поверхности второго порядка 247 Эрванное уравнение (9.8) поверхности сводится к следующему: ^ 0, (9.9) где (d\ ... dn) = d = t/T6, a At, i = 1,n, представляют со- собой собственные значения матрицы Л квадратичной формы поверхности, соответствующие векторам нового ортонормиро- ванного базиса. Дальнейшее определяется возможными значе- значениями Аг и di. Для каждого значения индекса г, г = 1, п, возможен один из четырех случаев: 1)А^0,<*^0; 2) 3)А» 4)^ = 0,^ = 0. Бели реализуется случай 4), то соответствующая перемен- переменная yi вообще не входит в уравнение и мы имеем случай ци- цилиндрической поверхности в W1 (при п = 3 такая поверх- поверхность действительно является цилиндрической [III]). В осталь- остальных случаях дальнейшее упрощение уравнения (9.9) сводится к упрощению вида линейных слагаемых. Если в уравнении (9.9) для i-й переменной yi реализуется случай 1), то по этой переменной можно выделить полный квадрат: После параллельного переноса системы координат этот случай сводится к случаю 2).
248 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА . Реализуем все такие параллельные переносы и, если необхо- необходимо, изменим порядок переменных (это равносильно перестаг новке векторов в базисе). Тогда уравнение поверхности (9.9) в новых переменных z примет вид h = Ot (9.10) г=1 г=г+1 где параметр г определяет количество переменных, для кото- которых реализовался случай 2) (возможно, после выделения полно- полного квадрата и соответствующего параллельного переноса). В остальных случаях реализуется случай 3) (после перестановки индексы от г + 1 до s) или случай 4) (индексы от 5 + 1 до п). Если s = г, то случай 3) не встречается и в уравнении (9.10) линейные слагаемые будут отсутствовать. При s>r + l случай 3) реализуется для нескольких переменных. Тогда необходим дополнительный поворот, который преобразует ситуацию к случаю s = г + 1. Этот поворот сводится к замене переменных •» zs новыми переменными г?+1, ..., z's, при которой * = ) (9Л1) г=г+1 а остальные переменные подбираются так, чтобы соответству- соответствующая замена переменных имела ортогональную матрицу U1. Эта матрица при указанной замене переменных имеет блочно- диагональную структуру: U* = в которой блоки JS представляют собой единичные матрицы порядков г и п — 5, а блок V порядка s — г отвечает пере- переменным 2г+ь •••5 ^5 и должен быть ортогональной матрицей. Е 0 0 0 V 0 0 0 Е
9.3. Упрощение уравнения поверхности второго порядка 249 Элементами первого столбца в этой матрице являются числа d?+1, ..., dfs*. Такую матрицу можно построить, взяв век- вектор (с^+1, ..., dfs) из (s—г)-мерного линейного арифметическо- арифметического пространства и дополнив его в указанном пространстве до ортонормированного базиса. Итак, после выделения квадратов и выполнения параллель- параллельного переноса мы можем, если нужно, выполнить дополнитель- дополнительный поворот так, что в конечном счете уравнение поверхности (9.2) преобразуется к виду O, (9.12) г=1 в котором г > О (должно быть хотя бы одно слагаемое второго порядка), а коэффициент d^+1 может быть нулевым. Если d"+l Ф О и h Ф 0, то еще одним параллельным перено- переносом, который определяется заменой переменного 2r+i по фор- формуле , h , _ Zr+l — "г+1 можно „убрать" слагаемое Л. Учитывая, что умножение урав- уравнения на произвольное ненулевое число не меняет поверхности, мы заключаем, что исходное уравнение (9.2) путем замены си- системы координат приводится к одному из следующих видов: iz? = 0, ?>*? = 1, 5>*? = *+!¦ (9.13) 1=1 1=1 t=l В представлениях (9.13) параметр г является рангом ква- квадратичной формы поверхности второго порядка, который не * Равенство (9.11) представляет собой первое из уравнений перехода от нового базиса к старому, которое реализуется обратной матрицей У. Значит, первая строка матрицы V состоит из коэффициентов в (9.11), но V = V , т.е. первая строка в V~l является первым столбцом в V.
250 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА зависит от выбора системы координат и при описанных пре- преобразованиях не меняется. В первом и втором случае ранг может иметь любые значения от 1 до п, в последнем случае г <п, т.е. этот случай возможен для поверхности второго по- порядка с вырожденной квадратичной формой. Уравнения (9.13), к одному из которых приводится уравне- уравнение произвольной поверхности второго порядка в Rn, назовем уравнениями канонического вида, а переменные, в кото- которых они записаны, — каноническими. 9.4. Примеры Описанный выше процесс упрощения уравнения поверхно- поверхности второго порядка в W1 реализуется и для кривых второго порядка на плоскости, и для поверхностей второго порядка в пространстве [III]. Рассмотрим этот процесс на конкретных примерах. Пример 9.2. Приведем к каноническому виду уравнение кривой второго порядка 14х? + 24xxx2 + 1\х\ - 4a?i + 18х2 - 139 = 0, (9.14) выпишем все использованные преобразования и построим эту кривую в исходной системе координат. Квадратичная форма кривой имеет вид 14rrf + + 21x2, а матрицей этой квадратичной формы является =A412У У12 21 у Чтобы найти ортогональное преобразование, приводящее квадратичную форму кривой к каноническому виду, выпишем
9.4. Примеры ^ 251 характеристическое уравнение матрицы А А2-35Л + 150 = 0 и найдем его корни: Ai = 30, А2 = 5. Ранг матрицы однородной системы линейных алгебраиче- алгебраических уравнений (А — \Е)х = 0 при А = Ai,2 равен единице, и мы можем в системе оставить только одно уравнение — первое: A4 — A)#i +12^2 = 0. Собственному значению Ai = 30 соответ- соответствует единичный собственный вектор а Аг = 5 — единичный собственный вектор 1 который в двумерном случае проще найти из условия орто- ортогональности вектору ei, т.е. путем перестановки координат вектора е\ и изменения знака у одной из координат. Из найденных координат собственных векторов составля- составляем матрицу ортогонального преобразования которое является поворотом, так как detG = 1. Этому ор- ортогональному преобразованию соответствует линейная замена переменных = gift-gift», 472, (9.15)
252 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА Чтобы получить уравнение кривой с квадратичной формой канонического вида, нужно подставить выражения (9.15) для переменных х\ и ж2 в (9.14): + 2\х\ - 4rci + 18ж2 - 139 = /3 4 \2 /3 4 \/4 3 \ = 14(-У1 - -у2) +24(-У1 - -у2) (-У1 + -у2) 24 = ЗОу? + Ъу\ + 12ш + 14у2 - 139. (9.16) Следует отметить, что мы сразу можем записать канониче- канонический вид квадратичной формы кривой по известным собствен- собственным числам: 3Oyf + 5у2. Линейные слагаемые —4rci + 18хг = = 26тж, представляющие собой удвоенное скалярное произведе- произведение вектора с координатами Ь на вектор с координатами х, в новых переменных будет иметь вид 2(Ub)Ty = 2bTUy, или -!<-«»>О I Свободный член в процессе преобразования поворота не изме- изменится. Таким образом, приходим к тому же уравнению (9.16).
9.4. Примеры 253 По каждому из переменных выделяем полный квадрат: 30 f 1/1 + lY + 5(уо + IY = 150. Теперь параллельный перенос системы координат, определяе- определяемый соотношениями 1~_У1 J' (9-17) приводит к уравнению которое легко преобразуется к каноническому уравнению элли- эллипса делением на 150: 5 ^ 30 Чтобы построить эллипс, заданный в исходной системе ко- координат уравнением (9.14), можно поступить следующим обра- образом. Изобразим исходную систему координат OxiX2, а в ней векторы ei, в2, которые являются собственными для матрицы квадратичной формы поверхности. Эти векторы откладываем от начала О системы координат, они задают координатные оси новой системы координат Оу\у2- В этой системе координат строим точку 0i (—1/5;—7/5), которая должна быть началом следующей канонической системы координат OiziZ2- Оси этой системы координат параллельны осям Оу\ и Оу2- Определив положение канонической системы координат O\Z\Z2 относительно исходной OxiX2, строим в ней эллипс, руководствуясь величинами его большой и малой полуосей. В результате получаем расположение эллипса относительно исходной системы координат. Расположение осей трех систем координат и эллипса в данной задаче показано на рис. 9.1.
254 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА Рис. 9.1 Пример 9.3. Определим, какая кривая задается уравне- уравнением 32x1 + 52хгх2 - 1х\ + 180 = 0, и изобразим ее в канонической системе координат. Для решения поставленной задачи приведем к канониче- каноническому виду квадратичную форму F = 32xf + 52a; i #2 — Тх\ этой кривой. Матрица А квадратичной формы имеет вид / V 32 2б 26 -? Составим характеристическое уравнение det(.A — \Е) = 0, ~ или 32-А 26 26 -7-А = Л2-25Л-900 = откуда находим собственные значения Ai = 45, А2 = —20. Те- Теперь мы можем записать канонический вид квадратичной фор- формы кривой: Так как линейные слагаемые в исходном уравнении отсут- отсутствуют, то и после поворота, приводящего квадратичную фор- форму кривой к каноническому виду, линейные слагаемые будут
9.4. Примеры 255 отсутствовать. Свободный член при поворотах также не изменяет- изменяется. Поэтому в новой системе ко- координат кривая будет описываться уравнением 45у? - 20у| +180 = 0, или -2 У1 Рис. 9.2 У1  -I 4 9 ' Мы получили уравнение гипер- гиперболы, ее положение в канонической системе координат изображено на рис. 9.2. Пример 9,4. Приведем к каноническому виду уравнение поверхности 4х\ + 4х\ + х\ + Ylx\x<i — 20 = 0, определим ее тип и изобразим в канонической системе коорди- координат. Как и в предыдущем примере, уравнение поверхности не содержит линейных слагаемых. Следовательно, чтобы приве- привести уравнение к каноническому виду, достаточно привести к каноническому виду квадратичную форму поверхности. Само преобразование поворота по условию примера находить не тре- требуется. Квадратичная форма данной поверхности имеет вид F = 4x1 Запишем ее матрицу + х\
256 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА и составим характеристическое уравнение этой матрицы 4-А 6 6 4-А О О О О 1-А = A-Л)(D-АJ-Зб)=0. Уз Решая уравнение, находим его корни Ai = 1, А2 = 10, A3 = —2. Зная их, записываем канонический вид квадратичной формы поверхно- поверхности, а вместе с ним и каноническое уравнение самой поверхности: - 2у| - 20 = 0, Рис. 9.3 2/1 + 2 2 2 20 2 10 Видим, что полученное уравнение описывает однополостный гипербо- гиперболоид (рис. 9.3). 9.5. Классификация кривых второго порядка Кривая второго порядка на плоскости в системе координат Оху описывается уравнением ацх2 + 2аиху + а>22У2 + с = 0, в котором хотя бы один из коэффициентов при слагаемых второй степени отличен от нуля. Это уравнение может быть преобразовано к одному из канонических видов (9.13). В нашем случае п = 2, так что при г = 2 возможны лишь два варианта: где через X, Y обозначены канонические переменные, а пара- параметры а, /3 одновременно не равны нулю. В зависимости от
9.5. Классификация кривых второго порядка 257 знаков коэффициентов а и /? в уравнениях (9.18) с учетом воз- возможного переименования канонических переменных приходим к следующим вариантам: X2 Y2 Л —5" + То" = 1 — эллипс, X2 Y2 , —5- + То" = —1 — пустое множество (мнимый эллипс), а1 о1 — гипербола, — точка (вырожденный эллипс), — пара пересекающихся прямых. Если г = 1, то квадратичная форма кривой второго порядка вырождена и имеет одно слагаемое. В этом случае возможны три варианта: X2 а2 X2 а2 X2 а2 Y2 Ь2 Y2 Y2 б2 = 1 = 0 = и где а ф 0. В последнем варианте можно считать, что а > 0, так как иначе достаточно поменять направления векторов базиса и тем самым изменить знак переменной Y в правой части. Кривые с рангом квадратичной формы г = 1 дают еще четыре канонических уравнения: X2 = 0 — двойная прямая, X2 — а2, ат^О, — пара параллельных прямых, X2 = —а2, ат^0, — пустое множество (пара мнимых прямых), X2 Y ф, — парабола.
258 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 9.6. Классификация поверхностей второго порядка в пространстве Классификация поверхностей второго порядка в простран- пространстве аналогична классификации кривых второго порядка на плоскости. Но количество уравнений канонического вида при этом возрастает. Если ранг квадратичной формы поверхности второго по- порядка равен трем (г = 3), то возможны два варианта (см. (9.13)): аХ2 + /3Y2 + <yZ2 = l, аХ2 + /3Y2 + jZ2 = О, где коэффициенты а, /3, 7 ненулевые. С учетом возможных комбинаций знаков коэффициентов и перестановки переменных получаем следующую таблицу канонических видов: j?2 у2 Z2 —о" + тт + т = 1 — эллипсоид, аг ? сг X2 Y2 Z2 u _^ + -~~ — = 1 — однополостныи гиперболоид, сг Ьг сг jg2 y2 z2 _. + + _ -. _i — пустое множество (мнимый эллипсоид), X2 Y2 Z2 —о" + То о* а* сг cz X2 Y2 Z2 Y Z —о" + То о* = " — двуполостный гиперболоид, а* сг cz Х% у2 Z2 — о" + То" + Т — 0 — точка (вырожденный эллипсоид). а2 о1 с1 Если ранг квадратичной формы поверхности равен двум (г = 2), то из уравнений канонического вида (9.13) получаем два варианта: аХ2 + /3Y2 = 7, аХ2 + /3Y2 = Z,
9.6. Классификация поверхностей второго порядка 259 где а,/3^0. В первом варианте одно из переменных, Z, не входит в уравнение, и мы получаем цилиндрическую поверх- поверхность с образующей, параллельной оси OZ, и направляющей в плоскости XOY, которая является кривой второго порядка с квадратичной формой ранга 2. Направляющая определяет тип поверхности согласно классификации кривых второго порядка: X2 Y2 л —=- + То" = 1 — эллиптический цилиндр, а1 о1 X2 Y2 Т + То" = ~ 1 — пустое множество (мнимый цилиндр), а1 о1 X2 Y2 — = 1 — гиперболический цилиндр, а1 о1 X Y Л —¦я Го" == 0 — пара пересекающихся плоскостей, а1 ог X2 Y2 —¦я Го" а1 ог X2 Y2 ~~2 "^ IT ^ ^ — прямая (вырожденный эллиптический ци- линдр). Во втором варианте мы получаем параболоиды. С учетом возможного изменения знаков приходим к двум каноническим уравнениям, различающимся знаками в квадратичной форме поверхности: X2 Y2 „ _1_ —- = Z — эллиптический параболоид, or Ьг X2 Y2 —s тт ~ Z — гиперболический параболоид. а* о4 Если ранг квадратичной формы поверхности равен единице (г = 1), то уравнения канонического вида (9.13) приводят к двум случаям: в которых а ф 0. В этих двух случаях в уравнении также отсут- отсутствует переменное Z. Значит, это цилиндрические поверхности
260 9. КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА с образующей, параллельной оси OZ, и направляющей, которая расположена в плоскости XOY и представляет собой кривую второго порядка с квадратичной формой ранга 1. Всего полу- получается четыре варианта канонических уравнений: X2 = 0 — двойная плоскость, X2 = а2, а ф 0, — пара пересекающихся плоскостей, X2 = —а2, а ф 0, — пустое множество (мнимая пара плоско- плоскостей), X2 = 2pY, р ^ 0, — параболический цилиндр. Вопросы и задачи 9.1. В чем состоит различие между ортонормированным базисом и прямоугольной системой координат в евклидовом пространстве? 9.2. Сколько существует канонических видов кривых вто- второго порядка? 9.3. Можно ли прямую на плоскости задать уравнением второго порядка? 9.4. В уравнении второго порядка от двух переменных ко- коэффициенты при квадратах переменных имеют разные знаки. Какую кривую может описывать такое уравнение? 9.5. Определите, какие кривые описываются в прямоуголь- прямоугольной системе координат следующими уравнениями: а) х2 + у2 + ху + х + у - 1 = 0; б) х2 + 4ху - Ъу2 + 2у = 0; в) х2 + ху = 0; г) ху + у2 = 1; д) ху + х + у + 1 = 0.
Вопросы и задачи 261 9.6. Квадратичная форма в уравнении второго порядка от трех переменных является положительно определенной. Какую поверхность может описывать это уравнение? 9.7. Определите, какие поверхности описываются в прямо- прямоугольной системе координат следующими уравнениями: а) х2 + у2 + z2 + 2ху + у = 0; б) xy + xz + yz = 1; в) х2 + Аху + у2 + 2xz + z2 = 5. 9.8. Приведите к каноническому виду следующие уравнения второго порядка и постройте кривые в исходной системе коор- координат: а) 16х2 - 24ху + 9у2 + 19х - 8у + 4 = 0; б) Юх2 + 12ху + Ъу2 + 4х - 6у = 0; в) 15а:2 + Ыху - 15у2 + 44а; + 62у + 13 = 0; г) 7х2 - А8ху - 7у2 + 34ж + 62у - 98 = 0. 9.9. Приведите к каноническому виду следующие уравнения поверхностей второго порядка и постройте эти поверхности в канонической системе координат: а) 2х\ + 2х\ + 9х2 — 4х\хз + 4я2#з = 1; б) 4х2 + 4х2 + х\ + 2х\Х2 - 4ж2Жз + 4х\х$ = 2; в) 2х\ + Зх2 + 2 + х\ г) За;? + Ъх\ + Qx\ + 20ж3 = 15; д) 2х2 + Зх2 + 4х2 — 4xiX2 — 4х2Хз — 6x26x3 — 3 = 0; е) х2 - х\ + 5х| - 6xiX3 - 4x2x3 + 6xi - 4x2 + 2хз = 0; ж) 5х2 + 5х| + 8х2 — + 9 = 0.
10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ В различных приложениях наряду со скалярными и вектор- векторными величинами активно используются и тензорные величи- величины. Понятие тензора можно вводить по-разному. Согласно одному из подходов, говорят, что в линейном пространстве за- задан тензор, если каждому базису в соответствие поставлена упорядоченная система чисел (компонент тензора) и преобра- преобразование этой системы при переходе из одного базиса в другой подчиняется определенному закону. Компоненты тензора ну- нумеруются, как правило, несколькими индексами, которые ста- ставятся не только внизу, но и вверху буквенного обозначения. В рамках тензорного исчисления разрабатываются приемы и пра- правила преобразований компонент тензоров при операциях над ними. 10.1. Сопряженное пространство Определение ЮЛ. Отображение /: С -> К, которое опре- определено на линейном пространстве С и принимает действитель- действительные значения, называют линейной функцией (также линей- линейной формой, линейным функционалом), если оно удовле- удовлетворяет двум условиям: а) }{х + у) = f(x) + /(у), х,у € ?; б) /(Ах) = Xf(x), х € С, А € R. Сравнив данное определение с определением 4.1 линейного оператора, увидим много общего. Бели рассматривать множе- множество действительных чисел как одномерное линейное простран- пространство, то можно сказать, что линейная функция — это линейный оператор, пространство образов которого одномерно.
10.1. Сопряженное пространство 263 Выберем в линейном пространстве С некоторый базис е = ei ... еп). Тогда для любого вектора а? € ? с координатами {xi ... хп)Т f(x) = f(xxei +... + xnen) = xif(ex) + ...+xnf(en) = = a\X\ +... 4- o,nxn = ax, где a = (ai ... an), a* = /(^i), t = T^n. Поэтому линейная функ- функция однозначно определяется своими значениями на базисных векторах. Наоборот, если функция /(ж) через координаты х вектора х выражается в виде f(x) = ая, то эта функция ли- линейная, а строка а составлена из значений этой функции на базисных векторах. Таким образом, между множеством линей- линейных форм, заданных на линейном пространстве ?, и строками длины п установлено взаимно однозначное соответствие. Линейные формы можно складывать и умножать на дей- действительные числа согласно правилам: (f + 9)(x) = f(x)+g(x), (Xf)(x) = Xf(x). Введенные таким способом операции превращают множество линейных форм в пространстве С в линейное пространство. Это линейное пространство называют сопряженным про- пространством по отношению к линейному пространству С и обозначают С*. Опираясь на базис е, выбранный в пространстве ?, постро- построим базис в сопряженном пространстве С*. Для каждого вектора в{ из базиса е рассмотрим линейную форму /г, для которой /г(ег) ^ 1 и P(ej) = О ДЛЯ всех векторов е^, кроме е*. Мы получим систему линейных форм /*, ..., fn б ?*. Покажем, что это линейно независимая система. Пусть некоторая ли- линейная комбинация этих форм равна нулевой линейной форме / = OL\fl +... + anfn = 0. Форма / на всех базисных векторах
264 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ принимает нулевые значения. Но Нулевые значения / на базисных векторах эквивалентны равен- равенствам ai = 0, г = 1, п, и поэтому система линейных форм /*, ..., /п линейно независима. Система линейных форм /*, ..., fn является базисом в со- сопряженном пространстве. Действительно, так как это линейно независимая система линейных форм, то достаточно доказать, что любая линейная форма из С* является их линейной комбина- комбинацией. Выберем произвольную линейную форму / из С* и пусть а\, ..., ап — значения формы / на базисных векторах. Эти значения однозначно определяют линейную форму. Но линей- линейная комбинация /' = a\fl +... + anfn также является линейной формой, которая на базисных векторах принимает те же значе- значения а\, ..., ап. Значит, эти две линейные формы совпадают, и мы получаем равенство / = /' = a\fl +... + an/n, т.е. разложе- разложение произвольно выбранной линейной формы по системе форм /v..,/n. Приведенное рассуждение показывает, что сопряженное пространство ?* имеет ту же размерность, что и С. Постро- Построенный нами базис f1, ..., fn зависит от выбора базиса е в пространстве С. Определение 10.2. Базисы е\, ..., еп и /*, ..., fn линейного пространства С и сопряженного пространства ?* называют биортогоиальными, или взаимными, если
10.1. Сопряженное пространство 265 Бели базисы ei, ..., еп и /х, ..., fn взаимны, то коорди- координатами произвольной формы / в базисе /\ ..., fn являются значения этой формы на векторах взаимного базиса ei, ..., еп. При совместном рассмотрении линейного пространства ? и сопряженного пространства ?* элементы каждого из этих пространств называют векторами, но элементы сопряженно- сопряженного пространства ?* именуют ковариантными векторами (ковекторами), а элементы из линейного пространства ? — контравариантными векторами (или просто векторами). Координаты тех и других определяются преимущественно во взаимных базисах, при этом у координат контравариантных векторов индекс ставится вверху, а у ковариантных — внизу. На запись f(x) можно смотреть двояко. Зафиксировав фор- форму /, мы варьируем вектор ж, получая всевозможные значения линейной формы. Но если мы зафиксируем вектор х и будем варьировать линейную форму /, то получим функцию, опреде- определенную на сопряженном пространстве ?*. Нетрудно убедиться, что эта функция линейная, так как, согласно определению сум- суммы линейных форм и произведения линейной формы на число, (/ + <?)(*) = f(x) + g{x), (Xf)(x) = А/(ж). Итак, каждому вектору х Е ? соответствует линейная фор- форма на сопряженном пространстве ?, или элемент двойного сопряженного пространства (С*)* = ?**. Мы получаем отображение </?:?-» ?**. Несложно убедиться, что это отобра- отображение линейно и что оно инъективно. Из инъективности сле- следует, что dimimc/? = dim? = п. Но сопряженное пространство С* имеет ту же размерность, что и ?, a dim?** = dim?* = dim?. Таким образом, размерность линейного подпространства irrup в ?** совпадает с размерностью всего двойного сопряженного пространства. Значит, imip = ?** и отображение (р является изоморфизмом. Обратим внимание, что этот изоморфизм не связан с выбором какого-либо базиса. Поэтому естественно
266 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ отождествить линейные формы, заданные на ?*, с элемента- элементами пространства ?. Это означает, что двойное сопряженное пространство совпадает с исходным линейным пространством: ?** = С. Бели С* является сопряженным к ?, то и С является сопряженным к ?*. Взаимность линейного пространства и сопряженного к не- нему пространства указывает на симметричность связи между векторами и ковекторами. Поэтому вместо записи f(x) бо- более удобно использовать другую форму записи, симметричную: (/,#)¦ Линейные формы мы также будем теперь обозначать полужирным курсивом: (/,ж). Принятое обозначение похоже на обозначение скалярного произведения, но в отличие от по- последнего аргументы в новом обозначении берутся из разных пространств. Саму запись (/,ж) можно рассматривать как за- запись отображения, определенного на множестве ?*х?, которое паре из ковектора и вектора ставит в соответствие действи- действительное число. При этом указанное отображение линейно по каждому из аргументов. Теорема 10.1. Пусть Ь и с — два базиса п-мерного линей- линейного пространства C,U — матрица перехода из 5 в с. Базисы Ь* и с* сопряженного пространства ?*, взаимные с базисами Ь и с соответственно, связаны между собой соотношениями с* = Ъ*(иТ)~\ b*=c*UT. <4 Координатами /с = (/f ... /?) линейной формы / в базисе с* являются значения этой формы на векторах базиса с = = (с\ ... сп). Выясним, как связаны координаты формы / в двух базисах с* и Ь*. Базисы Ь и с связаны между собой при помощи матрицыг перехода матричным соотношением с = Ы1 (см. 1.8). Это соотношение представляет собой равенство строк длины п, составленных из векторов. Из равенства строк векторов следует равенство строк значений линейной формы / на этих
10.1. Сопряженное пространство 267 векторах: ((/,d) ... (/,сп)) = ((/,Ь0 ... (f,bn))U, ИЛИ где fb и /с — обозначения строк координат формы / в базисах Ь* и с* соответственно. Транспонировав это равенство, мы по- получим принятую форму связи координат элементов линейного пространства, в которой координаты записываются по столб- столбцам: (Пт = tfVf. Это соотношение означает, что матрица UT является матрицей перехода из базиса с*, играющего в формуле роль старого, в базис Ь*, играющий роль нового. Следовательно, Ь* = c*f/T, от- откуда умножением на матрицу {UT)~l получаем с* = b*(UT)~l. > Если линейное пространство С евклидово, то скалярное про- произведение порождает изоморфизм между С и ?*, не зависящий от базиса, который позволяет отождествить евклидово про- пространство с его сопряженным. Действительно, для любого вектора а Е ? отображение х -> (а, ж) представляет собой ли- линейную форму в ?, так как скалярное произведение линейно по второму из своих аргументов. Возникает отображение ф, которое вектору а € ? ставит в соответствие линейную форму fa (ж) = (а, ж). Это отображение линейно в силу свойств ска- скалярного произведения и инъективно. Инъективность следует из того, что если (а, ж) = 0 для любого х Е ?, то и (a, a) = 0, т.е. а = 0. Так как линейные пространства С и С* конечномерны и имеют одинаковые размерности, отображение ф биективно и реализует изоморфизм этих пространств. Итак, для евклидова пространства С* = С. В этом смысле евклидово пространство есть псамосопряженное" пространство.
268 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ 10.2. Полилинейные формы ** Пусть С — п-мерное линейное пространство и С* сопряженное к нему пространство. Рассмотрим функцию ip{x\,...,Xp\fl,...,fq), аргументами которой являются р век- векторов Х{Е Си q ковекторов ft E ?*. Определение 10.3. Функцию (р от р векторов и q ковек- ковекторов называют полилинейной формой, если она линейна по каждому отдельно взятому аргументу. Пару чисел (p,q) назы- называют типом полилинейной формы. Пример 10.1. Простейшие полилинейные формы — это линейные функции, зависящие от одного аргумента. Линейные функции на С представляют собой ковекторы, т.е. элементы сопряженного пространства ?*. Линейные функции на ?* отождествляются с векторами. Таким образом, полилинейная форма типа A,0) — это ковектор, а полилинейная форма типа @,1) — это вектор. Пример 10.2. Полилинейная форма типа B,0) — это билинейная форма, определенная на линейном пространстве С. Аналогично полилинейная форма типа @,2) представляет собой билинейную форму на сопряженном пространстве ?*. Пример 10.3. Полилинейную форму (p(x;f) типа A,1) можно ассоциировать с линейным оператором, действующим в линейном пространстве ?. Действительно, зафиксировав пер- первый аргумент, мы получим линейную функцию на сопряженном пространстве ?*, т.е. вектор. Таким образом, каждому векто- вектору х ? С поставлен в соответствие вектор, представленный в виде линейной формы на С*. Мы получаем отображение про- пространства С в себя. Покажем, что это отображение линейно. Если вектору х соответствует линейная форма <р(х;-) на ?* (точка обозначает меняющийся аргумент), а вектору у соответствует линейная форма <р(у, •)> то сумме этих векторов
10.2. Полилинейные формы 269 соответствует линейная форма <р(ж+ $/;•), равная сумме форм: что следует из линейности </? по первому аргументу. Аналогич- Аналогично вектору Ах соответствует форма <р(Аж;-), равная Х(р(х;-). Итак, любой полилинейной форме <р типа A,1) соответству- соответствует линейный оператор, действующий в С. Можно показать, что это соответствие биективное, и мы можем отождествить поли- полилинейные формы типа A,1) с линейными операторами. Соответствие между полилинейными формами типа A,1) и линейными операторами использует ранее построенный изо- изоморфизм между линейными пространствами С и ?**. Обратное соответствие более простое. Каждому линейному операто- оператору А можно поставить в соответствие полилинейную форму <рд(ж;/) = (/,Аж) типа A,1). При фиксированном векторе х мы получаем линейную форму на сопряженном пространстве, причем эта форма отождествляется с вектором Ах. Значит, это действительно то же соответствие, что и рассмотренное выше. # Полилинейные формы можно складывать по обычным пра- правилам сложения функций: для каждой комбинации значений р + q аргументов складываются значения функций. Полилиней- Полилинейные формы можно также умножать на действительные числа. Теорема 10.2. Множество VPiq полилинейных форм типа (р,д) в n-мерном линейном пространстве С является линей- линейным пространством относительно обычных операций сложения функций и умножения функции на число. <4 Операции сложения функций и умножения функции на число удовлетворяют всем аксиомам линейного пространства. По- Поэтому нам нужно лишь показать, что в результате сложения двух форм одного типа или умножения полилинейной формы на действительное число получается полилинейная форма того же типа.
270 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ Рассмотрим полилинейные формы <р(х\,..., хр; fl,..., fq) и ф(х\,..., хр] fl,..., fq). Их сумма представляет собой функцию х{х\,...,хр\ fl,..., /9), которая определяется равенством Проверим линейность этой функции, например, по первому аргументу, используя многоточия для обозначения остальных аргументов полилинейных форм: Линейность функции по остальным аргументам проверяется точно так же. Рассмотрим теперь функцию ?, определенную через поли- полилинейную форму <р равенством ?(...) = А<р(...). Проверим ее линейность по первому аргументу: '... Линейность функции ^ по остальным аргументам проверяется аналогично. >
10.2. Полилинейные формы 271 Рассмотрим в линейном пространстве С некоторый базис е = (ei ... еп). Используя свойства линейности полилиней- полилинейной формы (р типа (p,q) по каждому аргументу, мы можем выразить ее значение на фиксированном наборе значений ар- аргументов через ее же значения на базисных векторах. Пусть выбраны произвольные векторы Х{ = х\е\ + ... + х7}еп, г = 1, р, и произвольные ковекторы /г = /{е1 +... + /пвп, г = 1, д, разло- разложенные по взаимному базису е* = (е1 ... еп). Тогда i,...,*p;/\...,/*) = «1=1 гр=1 ji=l jfl=l Мы видим, что набор чисел (рЦЦ*я = Ч>(е^,..., е;р; е-71,..., е-79) однозначно задает полилинейную форму. Ясно, что, взяв про- произвольный набор чисел ^J".f*, мы сможем определить полили- полилинейную форму, используя эти числа как коэффициенты разло- разложения в базисе е. Таким образом, подобно тому, как каждому вектору соответствует столбец его координат, каждой поли- полилинейной форме соответствует набор чисел, упорядоченных с помощью р + q индексов. Эти числа назовем координатами полилинейной формы. Термин оправдан, так как в линейном пространстве VVA несложно указать базис, в котором эти числа действительно будут координатами данной полилинейной фор- формы. Этот базис будет состоять из пр+9 полилинейных форм, и поэтому dimPPj9 = np+q. Уже по приведенной выкладке видно, что большое коли- количество знаков суммы загромождает вычисления. Поэтому в тензорном исчислении используют правило суммирования по умолчанию, или правило индексов. Индексы в вы- выражениях тензорной алгебры ставят вверху и внизу. Если
272 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ в выражении какой-либо верхний индекс и какой-либо ниж- нижний индекс обозначены одинаково, то подразумевается, что по этому индексу проводится суммирование в пределах от едини- единицы до размерности линейного пространства. При этом знак ? суммирования опускается. Например, формулу разложения полилинейной формы в базисе в соответствии с правилом ин- индексов записывают так: Далее мы будем использовать это правило. Итак, полилинейную форму в данном базисе можно пред- представить набором ее координат. Выясним, как изменяются эти координаты при изменении базиса. Пусть Ь—{Ь\ ... Ьп) и с = (с\ ... сп) — два базиса в n-мерном линейном пространстве ?, Ь* = (б1 ... Ьп) и с* = (с1 ... сп) — базисы в сопряженном пространстве ?*, взаимные с 6 и с. Обозначим через U матрицу перехода из базиса Ъ в базис с. Теорема 10.3. Координаты <{Р^'Я полилинейной формы (р в базисе с связаны с координатами (fQ]]*4 этой же формы в базисе Ь соотношениями где (ulj) = U — матрица перехода из базиса Ь в базис с; (vlj) = V = U~l — матрица обратного перехода (верхний индекс соответствует номеру строки). < Координата $?"^, соответствующая фиксированному набо- набору индексов i\y ..., гр, ji, ..., jq, представляет собой значение полилинейной формы: Используя выражение векторов нового базиса через старый при помощи матрицы перехода
10.3. Тензоры 273 находим Пример 10.4. Для линейного оператора А с матрицей А = = (а1-)> который отождествляется с полилинейной формой типа A,1) (см. пример 10.3), формула преобразования при переходе к новому базису, согласно теореме 10.3, имеет вид aj = v3sasrury Эта формула является координатной записью известной фор- формулы А = U~lAU преобразования матрицы линейного операто- оператора (см. теорему 4.6). 10.3. Тензоры Определение 10.4. Говорят, что в п-мерном линейном пространстве С задан тензор типа (р,д)*, если каждому ба- базису Ьв С сопоставлена упорядоченная система чисел ^"'^(Ь), называемых компонентами тензора, причем системы чи- чисел, соответствующие разным базисам бис, связаны между собой соотношениями где U = (ulj) — матрица перехода из базиса Ь в базис с; V = (vlj) — обратная к U матрица (верхний индекс у tij- и vj обозначает номер строки в матрице). Сумму p + q называют валентностью тензора (или его рангом). Понятие тензора носит абстрактный характер: происхо- происхождение групп чисел, формирующих тензор, не играет роли. *В литературе встречается и другой порядок составляющих в типе тензора: для р раз ковариантного и q раз контравариантного тензора тип обозначают (д,р).
274 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ Пример тензора типа (р,д) дают координаты полилинейной формы типа (р,д). Действительно, закон преобразования по- полилинейных форм при замене базиса (см. теорему 10.3) и закон преобразования тензоров того же типа (см. определение 10.4) совпадают. Верно и обратное: любой тензор можно интерпре- интерпретировать как совокупность координат некоторой полилинейной формы. Если тензору типа (р,д) с компонентами а?^ \Я{Ъ) в базисе Ь сопоставить полилинейную форму с координатами ail".A4 W в том же базисе, то в силу совпадения формул преобра- преобразования и в любом другом базисе компоненты тензора будут совпадать с координатами полилинейной формы. Эти сообра- соображения показывают, что тензоры при необходимости можно трактовать как полилинейные формы и наоборот. Исходя из определения 10.4 можно предположить, что р > 0 и q > 0. Но это необязательно. Например, если р = 0, то в законе преобразования 10.1 не будет использоваться матрица С/, а если q = 0, то не будет использоваться V. Определение 10.5. Тензор типа (р,0) называют кова- риантным, а тензор типа @,<?) — контравариантным. Тензор типа (p,q) смешанный, если р > 0, q > 0. Про такой тензор говорят, что он р раз ковариантный и q раз контрава- риантный. Приведем простейшие примеры тензоров. Пример 10.5. Допустима ситуация, когда р = q = 0. Это означает, что объект описывается одним числом (индексов нет), причем это число не зависит от выбора базиса (в зако- законе преобразования нет суммирования и он приобретает вид а(с) =«(&)). Такой объект представляет собой тензор типа @,0). Его также называют инвариантом. Можно также ска- сказать, что инвариант — это попросту скалярная величина. Пример 10.6. Тензор образуют координаты вектора. Это вытекает из интерпретации вектора как полилинейной фор- формы типа @,1) (см. пример 10.1). Проверим непосредственно,
10.3. Тензоры 275 что координаты вектора представляют собой тензор типа @,1). Если U — матрица перехода из старого базиса в новый, а У — обратная к U, то столбец х новых координат вектора х свя- связан со столбцом х старых координат соотношением х = Vx, а в тензорной записи это выглядит следующим образом: х? ~vixs. Видим, что это преобразование координат совпадает с пре- преобразованием A0.1) при р = 0, q = 1. Рассуждая аналогичным образом, убеждаемся что ковек- тор (линейная форма) представляет собой тензор типа A,0). Пример 10.7. Линейный оператор А, действующий в ли- линейном пространстве ?, можно ассоциировать с полилинейной формой типа A,1) (см. пример 10.3). Это значит, что ли- линейный оператор можно рассматривать как тензор типа A,1). Проверим это непосредственно. В данном базисе Ь линейный оператор описывается своей матрицей А. При переходе в новый базис с матрица А линейного оператора преобразуется в матри- матрицу А согласно формуле А = U~lAU = VAU. Записав матрицы в тензорной форме (верхний индекс соответствует номеру стро- строки в матрице, а нижний — номеру столбца), получим Щ = via* и1- (см. пример 10.4), т.е. формулу A0.1) при р = 1, q = 1. Значит, элементы матрицы линейного оператора при переходе в другой базис меняются как компоненты тензора типа A,1). Пример 10.8. Символ Кроиекера — это тензор <$] ти- типа A,1), который в любом базисе имеет значения 8\ = 1 для любого % и <Й = 0, если i Ф j. Этот тензор соответствует тожде- тождественному линейному оператору, так как компоненты символа Кронекера соответствуют элементам единичной матрицы. Пример 10*9. В евклидовом пространстве ? заданное скалярное произведение представляет собой билинейную форму, т.е. тензор </у типа B,0). Этот тензор называют повари- антным метрическим тензором. Роль такого тензора (иначе, скалярного произведения) может играть любая сим- симметрическая билинейная форма, порождающая положительно определенную квадратичную форму.
276 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ Евклидово пространство ? изоморфно своему сопряженно- сопряженному ?*, причем изоморфизм, определяемый скалярным произве- произведением, не связан с выбором базиса (см. 10.1). Этот изомор- изоморфизм переносит скалярное произведение из ? в ?*, порождая тензор gli типа @,2). Этот тензор называют контравари- антным метрическим тензором. Компонентами ковариантного метрического тензора в дан- данном базисе е являются элементы матрицы Грама Г, так как, согласно определению метрического тензора, дц = (е*, е^). Ма- Матрицей контравариантного метрического тензора дгэ в е явля- является матрица, обратная матрице Грама. Действительно, компо- компоненты тензора д^ — это элементы матрицы Грама Г* в базисе /, взаимном с е. Пусть U — матрица перехода из базиса е в базис /. Тогда / = eU (/ и е, как обычно, представляются в виде строк). Матрица Грама Г* для базиса / записывается в виде Г* = /т/. Поэтому Г* = /т/ = feU = EU = U. С другой стороны, Е = /те = (eUfe = UTeTe = С/ТГ, откуда U = {ГТ)~1 = Г" и Г* = U = Г. Примеры тензоров можно почерпнуть в механику и физике. Пример 10.10. Механические свойства твердого тела свя- связаны с его моментами инерции относительно различных осей. Пусть для простоты тело состоит из конечной совокупности материальных точек, например из N точек. Моменты инерции такого тела относительно координатных осей Oxi, 0x2, прямоугольной системы координат задаются формулами N N N к=\
___^ 10.4. Операции с тензорами 277 где х\у х\, х\ — координаты fc-й материальной точки; га* — масса fc-й материальной точки. Если система координат изме- изменилась, мы получим новую тройку моментов инерции, но эта новая тройка не может быть получена из старой при помощи только матрицы перехода, так как в формулы преобразования включаются и центробежные моменты N N N I\2 = ^2mkxkXb A3 = ^2ткх\х1, Ы = Y^mkXlXt fc=l * k=l fc=l Рассмотрим совокупность чисел N а%3 == Sm*44> *> з =!»2>3' Jb=l через которые выражаются как моменты инерции (например, 1\ = а22 + а33), так и центробежные моменты A^ = аи при %Ф])* При переходе к новой системе координат Ох^хз мы получим новую группу чисел o*J', которая связана с исходной группой следующим образом: N N- N Л=1 к=1 k=l (в выкладке использованы закон хг = vj:xr преобразования коор- координат радиус-вектора точки и правило суммирования по умол- умолчанию для индексов г и s). Таким образом, группа чисел alJ представляет собой набор компонент тензора типа @,2) — тен- тензора инерции. 10.4. Операции с тензорами Линейные операции. Мы видели, что множество поли- полилинейных форм одного типа образует линейное пространство относительно обычных операций сложения функций и умноже-
278 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ ния функции на число. Каждой полилинейной форме соответ- соответствует тензор, и, наоборот, любой тензор можно реализовать как полилинейную форму. Значит структуру линейного про- пространства с множества полилинейных форм можно перенести на тензоры. Определение 10.6. Суммой двух тензоров А = а?'"? и В = Ь?''1Я типа (р,д) называют тензор С = А + В = сЦ]]'^ того же типа с компонентами Нетрудно убедиться, что набор компонентов С^'*'^, вычи- вычисляемых в каждом базисе по формуле A0.2), определяет тензор типа (р,д). Действительно, для двух базисов, старого Ь и но- нового с, с матрицей перехода U = (vij) и матрицей обратного перехода V = (t/J) Видно, что набор компонентов ^ j?9 преобразуется по тензор- тензорному закону, т.е. согласно формуле A0.2). Введенная операция сложения тензоров одного типа согла- согласуется с операциями сложения объектов, являющихся частными случаями тензоров. Для векторов тензорное сложение совпада- совпадает со сложением векторов, для линейных или билинейных форм тензорное сложение равносильно сложению функций. Наконец, тензорное сложение линейных операторов и их обычное сло- сложение — одно и то же. Для полилинейных форм тензорное сложение означает сложение форм как функций.
10.4. Операции с тензорами 279 Определение 10.7. Произведением тензора А = а**"'** на действительное число А называют тензор ХА с компо- компонентами XaJ-l'"J-q. г\..лр Так же как и в случае сложения тензоров, убеждаемся, что в результате умножения каждой компоненты тензора на число А мы получаем тензор того же типа. Умножение тензора на число в частных случаях сводится к умножению на число вектора, линейной или билинейной формы, линейного оператора. В интерпретации тензора как полилинейной формы умножение тензора на число равносильно умножению функции на число. Теорема 10.4. Множество TVA всех тензоров типа (р,д) в п-мерном линейном пространстве С относительно операций сложения тензоров и умножения тензора на число является линейным пространством размерности np+q. М Проверка аксиом линейного пространства не представляет сложности. Докажем утверждение о размерности пространства тензоров. Для каждого возможного набора индексов ковари- антных ti, ..., ip и контравариантных ji, ..., jq рассмотрим тензор Tj* "jP с компонентами (tl* '"*?)? I > пРичем равны ну- нулю все компоненты, кроме одной, индексы которой совпадают с индексами тензора: (i*1 "m%T)ll jq = 1- Тогда любой тензор А = a\l" j4 представляется в виде линейной комбинации указан- указанных тензоров: Докажем, что набор тензоров Т**'*р образует линейно не- независимую систему. Возьмем линейную комбинацию этих тен- тензоров и приравняем нулевому тензору, у которого все компо- компоненты равны нулю: о?{*"'?т?'л"? = 0. В левой части равенства стоит тензор, компонентами которого являются коэффициенты °^1..Лр линейной комбинации. Так как этот тензор является ну- нулевым, все его компоненты, они же коэффициенты линейной
280 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ комбинации, равны нулю. Итак, из равенства нулю линей- линейной комбинации следует равенство нулю ее коэффициентов» Значит, выбранная система тензоров линейно независима и является базисом в пространстве Tv,q. Подсчитаем количество тензоров в построенном базисе. Для этого необходимо опреде- определить количество всевозможных комбинаций из р + q индексов. Так как индексы меняются независимо друг от друга и каждый индекс может иметь п возможных значений, то суммарное ко- количество индексных комбинаций равно np+q. Следовательно, и базис Т^'? содержит пр+9 элементов, что равно размерности пространства Тр,я. > Транспонирование. У полилинейной формы можно пере- переставить какие-либо два аргумента одного типа (два вектора или два ковектора). В результате мы получим, вообще гово- говоря, новую полилинейную форму. Например, при перестановке аргументов билинейной формы мы получаем новую билиней- билинейную форму, матрица которой является транспонированной к матрице исходной формы. Такая операция не меняет билиней- билинейную форму лишь в случае, когда эта форма симметрическая. Транспонирование матрицы в тензорной записи выглядит как перестановка местами индексов, указывающих номер строки и номер столбца. Определение 10.8, Тензор В = &;•* "^, полученный из тен- тензора А = a^'j4 перестановкой двух первых нижних индексов: называют транспонированным к тензору А, Транспониро- Транспонированными называют также тензоры, полученные перестановкой любой другой пары верхних или нижних индексов. Нужно, естественно, убедиться, что если мы переставляем два верхних или два нижних индекса, то в результате по- получаем набор компонент, меняющихся при замене базиса по
10.4. Операции с тензорами 281 тензорному закону A0.1). При изменении порядка индексов на- набор компонент тензора в данном базисе остается неизменным, но меняется порядок этих компонент. Например, компонен- компоненты тензора валентности 2 можно записать в матрицу. Тогда транспонирование тензора будет означать транспонирование матрицы. Но то же происходит и в общем случае. Компо- Компоненты тензора валентности р + q можно рассматривать как элементы (р + </)-мерной матрицы (при р + q = 2 это обычная ма- матрица, ассоциирующаяся с квадратом, при р + q = 3 компоненты матрицы записываются в ячейки куба и т.д.). Если фиксиро- фиксировать все индексы, кроме двух переставляемых, мы получим в многомерной матрице плоское сечение, представляющее собой обычную матрицу. Транспонирование тензора есть транспони- транспонирование каждого такого сечения. Перестановка в тензоре одного верхнего и одного нижне- нижнего индекса не имеет какого-либо содержательного смысла, так как при этом нарушается тензорный закон изменения компо- компонент. Это лучше всего наблюдать на простых тензорах типа A,1): наличие дополнительных индексов усложняет выкладки, но не дает принципиальных изменений. Тензор типа A,1) бу- будем трактовать как линейный оператор. Тогда перестановка индексов в компонентах матрицы оператора означает транс- транспонирование этой матрицы. Но транспонирование матрицы линейного оператора в разных базисах приводит к разным операторам. Чтобы такая операция была законной, нужно ограничиться рассмотрением только евклидова пространства и ортонормированных базисов в нем. В этом случае транспони- транспонирование матрицы означает переход к сопряженному оператору. Операцию транспонирования можно усложнить, повторяя ее с разными парами индексов. Пусть, например, среди верхних индексов выбрана группа из s индексов. Используя различ- различные перестановки в этой группе индексов, мы можем расста- расставить эти s индексов в любом порядке. Количество вариантов есть количество перестановок из s элементов, которое равно s\ [I-2.6], [III]. Операцию множественной перестановки индек-
282 JO. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ сов мы также будем называть транспонированием, выделяя элементарное транспонирование, заключающееся в пере- перестановке пары индексов. Определение 10.9. Тензор называют симметрическим по группе индексов, если он не изменяется при любой пе- перестановке в этой группе индексов. Тензор кососимметри- ческий по группе индексов (антисимметрический по группе индексов), если при перестановке любой пары индек- индексов из группы он меняет знак. Особый интерес в связи с этим определением представляют ковариантные и контравариантные тензоры. Симметриче- Симметрический тензор — это ковариантный (контравариантный) тен- тензор, симметрический по группе всех индексов. Аналогично понятие кососимметрического тензора, относящееся к ко вариантным или контравариантным тензорам. Симметрирование и альтернирование. Рассмотрим группу из г верхних (нижних) индексов у тензора А типа (p,q), где г < q (г ^ р). Перестановкой этой группы индексов можно получить г! тензоров Аа, включая исходный. Умножим сумму всех этих тензоров на число 1/г! Мы получим новый тензор As: ,е 1 который будет симметрическим по выделенной группе из г индексов. Описанную операцию преобразования тензора, в результате которой получается тензор, симметрический по группе индексов, называют симметрированием. В частном случае пары индексов симметрирование выгля- выглядит наиболее просто. Например, для тензора а^ симметриро- симметрирование состоит в получении нового симметрического тензора
10.4. Операции с тензорами 283 Существует также операция, которая позволяет из данного тензора получить тензор, кососимметрическии по группе ин- индексов. Рассмотрим группу из s верхних (нижних) индексов. Любой тензор А<г, получаемый из тензора А перестановкой этих индексов, можно описать перестановкой <т = (ti, ..., is) из $ элементов, причем исходному тензору будет соответствовать тождественная перестановка A, 2, ..., s). Обозначим через \а\ количество инверсий в перестановке о [III] и рассмотрим сумму которая берется по всем перестановкам с из з элементов. Опе- Операцию преобразования А -> Аа называют альтернированием по указанной группе индексов. В результате альтернирования тензора получается тензор, кососимметрическии по группе ин- индексов. Действительно, перестановка двух индексов в группе меняет четность каждой перестановки а в сумме A0.3). Зна- Значит, каждое слагаемое и вся сумма в целом меняют знак. В случае тензора ац типа B,0) альтернирование выглядит наиболее просто: Произведение тензоров. Две полилинейные формы мож- можно перемножить, образуя функцию от большего числа перемен- переменных. Например, из полилинейных форм ч>{х\,..., xv\ fl,..., fq) и ^(УЪ'-чУп^1*-••??*) типов (р,д) и (r,s) можно образовать новую полилинейную форму имеющую тип (p+r> q+s). Аналогичная операция существует и для тензоров.
284 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ Определение 10.10. Произведением двух тензоров А = аР'"*4 и В = Ь1?'1 типов (p,q) и (г, 5) называют тензор С = А®В типа (р + г,q + $) с компонентами < Jl-jqh-Лш _ Jl-jq tfl.-As Sli*l* "a»ltpD*lib- Необходимо, конечно, убедиться, что указанный набор ком- компонент действительно представляет собой тензор, т.е. меня- меняется при замене базиса по тензорному закону A0.1). Непо- Непосредственная проверка закона изменения достаточно сложна. Можно ее обойти следующим образом. Каждый тензор мож- можно трактовать как полилинейную форму такого же типа. При этом произведению тензоров будет соответствовать произве- произведение полилинейных форм, так как компонентам перемножа- перемножаемых тензоров будут соответствовать координаты полилиней- полилинейных форм, т.е. значения этих форм на различных комбинациях базисных векторов. Убедиться же в том, что при перемно- перемножении полилинейных форм получается полилинейная форма, несложно. Произведение тензоров не является коммутативным. Дей- Действительно, при перестановке сомножителей меняется порядок индексов в их произведении. А это ведет к изменению резуль- результата. Чтобы проанализировать ситуацию подробнее, можно рассмотреть произведение двух ковекторов А = щ и В ±= bj. Их тензорным произведением будет ковариантный тензор С = су ранга 2 с компонентами су = a%bj. Если изменить порядок со- сомножителей, то получим Су = biuj = Cji, т.е. тензор С1, транс- транспонированный к тензору С. Тензоры СиС совпадают, если каждый из них является симметрическим. Например, если f Л1' *~1; а Л1' j = 2] то en = /i32 = 1, «Si = /2З1 = 0, и поэтому fi ® gj ф gj <g> /f.
10.4. Операции с тензорами 285 УУмножение тензоров является ассоциативным и дистрибу- дистрибутивным по отношению к сложению. Это напоминает свойства умножения линейных операторов. Однако отметим, что про- произведением двух линейных операторов является линейный опе- оператор, а их произведением как тензоров является тензор типа B,2), который трактовать как линейный оператор нельзя. Эти две операции принципиально разные, хотя и обладают некото- некоторыми одинаковыми алгебраическими свойствами. Произведение тензоров открывает возможность получать новые тензоры из тензоров более низкой валентности. Оттал- Отталкиваясь от векторов и ковекторов, мы можем получать тензоры любого типа. Однако не каждый тензор может быть пред- представлен в виде произведения тензоров. Например, билинейная форма, являющаяся произведением двух ковекторов, имеет ма- матрицу специального вида, ранг которой равен единице. В качестве контрпримера достаточно взять билинейную форму с рангом, равным 2. Оказывается, что любой тензор типа (р,д) может быть представлен в виде линейной комбинации элементарных тензо- тензоров вида х1 ®... ® хр ® ух ®... ® у9, являющихся произведением р ковекторов xi и q векторов у;. Действительно, вспомним ба- базис в пространстве ТРуЯ тензоров типа (р,д), рассмотренный в доказательстве теоремы 10.4. Каждый из тензоров этого базиса является элементарным. Тензор Г^1'*^, у которого еди- единичное значение имеет компонента с индексами нижними ti,..., ip и верхними ji, ..., j9, является произведением векторов базиса (ei ... еп) и ковекторов двойственного ему базиса (Z1 ... fn). Поэтому любой тензор А = a^'"jq предста- представим в виде
286 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ [_ Свертывание. Бели тензорное умножение позволяет полу- получать тензоры более высокой валентности, то следующая опера- операция, наоборот, понижает валентность тензора. Определение 10.11. Сверткой тензора А = а**]]*9 типа (p,q) по одному верхнему и одному нижнему индексам, например по индексам %\ и ji, называют тензор В = УЦ]]*9 типа (р — 1,<? — 1) с компонентами °i2...ip - aki2...ip' Напомним, что наличие одинаковых верхнего и нижнего индексов предусматривает суммирование по этому индексу (правило индексов). Можно убедиться, что введенная операция приводит к тензору, т.е. для нового набора компонент остается верным закон A0.1) преобразования тензоров. Пример 10.11. Сверткой тензора типа A,1) является тен- тензор валентности 0, т.е. инвариант. Тензор типа A,1) предста- представляет собой совокупность элементов матрицы линейного опе- оператора, а его свертка — это сумма диагональных элементов матрицы оператора, т.е. не что иное, как след матрицы линей- линейного оператора, который от выбора базиса не зависит. # Говорят также о свертке двух тензоров, подразумевая под этим свертку произведения этих тензоров, причем один из двух индексов, по которым выполняется свертка, относится к первому тензору, а второй — ко второму. Например, выражение a+jb™ означает свертку тензоров А типа B,1) и В типа A,2), в результате которой получается тензор типа B,2). Свертка тензора или двух тензоров может выполняться не по одной паре индексов, а по нескольким. Например, рассмотрим тензор а\ типа A,1). Произведением этого тензора на себя будет тензор a\alk типа B,2). Это произведение можно свернуть по двум парам индексов. Получим инвариант (тензор типа @,0)) а\аг^ который называют инвариантом второго
\ 10.4. Операции с тензорами 287 порядка, в отличие от инварианта первого порядка — следа питейного оператора. Отметим, что другой вариант свертки по двум парам индексов а\а3л дает квадрат инварианта первого порядка. В евклидовом пространстве выделен ковариантпный метри- метрический тензор gij и контравариантный метрический тензор д%К Свертка тензора А типа (р,д) с дц приводит к тензору типа (р+ 1,9 — 1) и представляет собой операцию опускания индекса тензора, а свертка А с дгэ приводит к тензору типа (р— 1,^ + 1), т.е. к поднятию индекса тензора. Компонен- Компоненты метрического тензора в ортонормированием базисе соста- составляют единичную матрицу. Поэтому в таком базисе опускание (поднятие) индекса выглядит как простая перестановка индек- индекса сверху вниз (снизу вверх), т.е. различие между верхними и нижними индексами исчезает. Если рассматривается евклидо- евклидово пространство и в нем только ортонормированные базисы, то все индексы можно записывать или только вверху, или только внизу. Возникающий при этом объект называют евклидовым тензором. Поливекторы. Поливекторами (мультивекторами) называют ковариантные и контравариантные кососимметри- ческие тензоры. Контравариантный кососимметрический тен- тензор типа (О,^) называют также g-вектором, а ковариантный кососимметрический тензор типа (р,0) —р-формой. В частном случае 2-форма, т.е. кососимметрический тензор типа B,0), представляет собой кососимметрическую билинейную форму с кососимметрической матрицей. Легко проверить, что множество поливекторов одного типа, например (р,0), образуют относительно сложения тензоров и умножения тензора на число линейное пространство. Это линейное пространство является линейным подпространством в пространстве 7^,о всех тензоров типа (р,0). Компоненты кососимметрического тензора, имеющие хотя бы одну пару одинаковых индесов, равны нулю, так как, с
288 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ эответсрву- однои стороны, при перестановке этих индексов соответству- соответствующая компонента меняется на компоненту с противоположным знаком в силу условия кососимметричности, а с другой сторо- стороны, перестановка одинаковых индексов не приводит к измене- изменению компоненты. Значит, валентность ненулевого поливектора не может превышать размерности п линейного пространства, поскольку у тензора валентности больше п любая компонента имеет одинаковые индексы. У кососимметрического тензора валентности п, где п — размерность линейного пространства, имеется п! ненулевых компонент. Например, для ковариантного кососимметрическо- кососимметрического тензора компонента aib..jn отлична от нуля, если все индексы различны, а все такие комбинации индексов получаются при помощи перестановок порядка п. Все ненулевые компоненты такого тензора различаются лишь знаком, так как получаются друг из друга перестановкой индексов. В частности, отсюда следует, что любые два ненулевых кососимметрических тензо- тензора валентности п одного типа могут быть получены друг из друга умножением на число. Это означает, что линейное про- пространство п-векторов (n-форм) является одномерным. Итак, у любого кососимметрического тензора имеются ком- компоненты, которые различаются лишь знаком или совпадают. Чтобы определить тензор, достаточно указать те компонен- компоненты, у которых индексы упорядочены, например, по возраста- возрастанию. Все остальные компоненты можно получить при по- помощи перестановки индексов. Таких ведущих компонент у кососимметрического тензора валентности р имеется Сп = -тт——ч7- Нетрудно увидеть, что у тензоров валентностей р!(п-р)! рип-р одинаковое количество ведущих компонент. Рассмо- Рассмотрим, например, р-вектор с компонентами a-71*^, j\ < ... < jp. Каждой компоненте а?1"** сопоставим равное ей число ЬГ1~'Гп-р, взяв в качестве индексов г\< ...<гп_р те, которых нет среди индексов ji, ..., jp. Можно показать, что в результате мы по- получим набор компонент кососимметрического (п—р)-вектора,
Вопросы и задачи 289 соответствие не зависит от выбора базиса и является изомор- изоморфизмом линейных пространств р-векторов и (п—р)-векторов. Аналогичный изоморфизм существует для пространств д-форм и (п—д)-форм. Произведение кососимметрических тензоров, вообще гово- говоря, не является кососимметрическим тензором. Например, произведение АВ кососимметрического тензора А типа (р,0) на кососимметрический тензор В типа (г, 0) будет тензором ти- типа (р + г, 0), который является кососимметрическим по первым р индексам и по последним г индексам, но не по всем индексам вместе. Чтобы получить кососимметрический тензор, нуж- нужно выполнить операцию альтернирования по всем индексам. В результате получится кососимметрический тензор С типа (р + г,0), который обозначают А/\В и называют внешним произведением тензоров А и В. Пример 10.12. Внешнее произведение двух векторов х = = (#ъ #25#з) и у = (j/i, 2/2? Уз) в R3 представляет собой косо- кососимметрический 2-вектор с ведущими компонентами «23 = 0,5(ж2уз — и матрицей (О аи аи —а\2 0 а2з Положив bi = 2а23, Ь2 = -2ai3, h = 2ai2, получим вектор, который совпадает с векторным произведением хху. Вопросы и задачи 10.1. Пусть А = (aij) — матрица компонентов тензора а1-7 типа @,2) (дважды контравариантного). Найдите закон изменения матрицы А при замене базиса.
290 10. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ / 10.2. Найдите закон изменения матрицы дважды ковари- антного тензора (см. задачу 10.1). 10.3. В евклидовом пространстве R2 со стандартным ска- скалярным произведением заданы два линейно независимых век- вектора а\ = (a}, af), аг = (aj, Q^)- Эти векторы образуют базис. Найдите базис, биортогональный базису ai, a2. 10.4. Пусть А — линейный оператор, действующий в ли- линейном пространстве ?. Найдите компоненты тензора aj, со- соответствующего полилинейной форме </?(ж;/) = /(Аж), ж G ?, fee*. 10.5. Пусть ciij — симметрический тензор, б*-7 — кососим- метрический тензор. Докажите, что их полная свертка OijW равна нулю. Что можно сказать о тензоре 10.6. Найдите полную свертку gijg^ двух метрических тензоров n-мерного евклидова пространства. 10.7. В условиях задачи 10.3 запишите координаты контра- вариантного и ковариантного метрических тензоров в базисе 10.8. В пространстве R3 задан тензор а^ типа B,0). При каких условиях на компоненты a\j этот тензор можно рассма- рассматривать как ковариантныи метрический тензор? 10.9. Найдите тензор, который получается при поднятии одного индекса: а) у метрического тензора дц\ б) у символа Кронекера &-.
11. ИТЕРАЦИОННЫЕ МЕТОДЫ Задача численного решения систем линейных алгебраиче- .ских уравнений (СЛАУ) с невырожденной матрицей была рас- рассмотрена в [III]. Методы численного решения СЛАУ можно разделить на две группы: прямые (или точные) и итерацион- итерационные. В [III] основное внимание было уделено прямым методам. Был рассмотрен метод Гаусса исключения неизвестных, а так- также методы, основанные на мультипликативных разложениях матриц. В этой главе мы сконцентрируем внимание на итерационых методах численного решения СЛАУ. Изложим также новые способы мультипликативного разложения матрицы. 11.1. Обусловленность квадратных матриц При решении любой математической задачи важную роль играет вопрос существования и единственности решения. Но положительный ответ на этот вопрос еще не гарантирует достоверности практических результатов, которые получены в результате решения математической задачи. Поясним это подробнее. При постановке математической задачи, как правило, име- имеются параметры, которые не фиксированы и могут принимать произвольные значения из некоторых интервалов. В качестве таких параметров могут рассматриваться данные измерений, результаты решения каких-то других задач, результаты экс- экспертных оценок и т.п., которые задаются приближенно. Если при каждом допустимом наборе значений параметров (вход- (входных данных математической задачи) задача имеет реше- решение, и притом единственное, то возникает зависимость решения от указанных параметров.
292 П. ИТЕРАЦИОННЫЕ МЕТОДЫ Результатом решения математической задачи является вы- вычисление на основе входных данных некоторого набора чи-> еловых значений — выходных данных математической задачи. Как входные, так и выходные данные можно рас- рассматривать в качестве элементов соответствующих нормиро- нормированных пространств. Это позволяет сравнивать между собой различные варианты входных (выходных) данных и оценивать степень их близости, что приводит к понятию непрерывной за- зависимости решения задачи от входных данных. Пусть ж, xq E Rm представляют собой векторы входных данных некоторой математической задачи, а у, уо € Кт — со- соответствующие этим входным данным решения, или выходные данные. Скажем, что решение задачи непрерывно зависит от входных данных, если для любого xq и для любого е > О суще- существует такое 6 > О, что при ||х — жо|| < 8 имеем ||у — уо|| < ?? где ||.|| — некоторая норма в Шт. Математическую задачу называют корректной или кор- корректно поставленной, если ее решение существует, един- единственно и непрерывно зависит от входных данных. Если одно из трех условий нарушается (решение неединственно, не суще- существует или нарушается требование непрерывной зависимости от входных данных), то говорят о некорректной матема- математической задаче. Понятие .корректной задачи легко конкретизировать для системы линейных алгебраических уравнений (СЛАУ) с невы- невырожденной матрицей. Напомним, СЛАУ Ах = 6 с квадратной матрицей А порядка п имеет единственное решение тогда и только тогда, когда матрица А невырождена [III]. Входными данными задачи решения СЛАУ следует считать элементы ее матрицы и правые части уравнений. Столбец неизвестных х и столбец правых частей Ь СЛАУ Ах = Ь можно трактовать как векторы п-мерного линейного арифметического пространства Кп, в котором задана неко- некоторая норма ||-||. Этой норме соответствует индуцированная норма матрицы, для которой будем использовать то же обозна-
11.1. Обусловленность квадратных матриц 293 чение ||-||. Изменение входных данных означает, что наряду со СЛАУ Ах = Ъ с решением^ надо рассмотреть другую возму- возмущенную систему Ах = Ь с матрицей А = А + АА и столбцом правых частей 6 = 6 + ДЬ, которая отличается от исходной системы возмущением матрицы системы А А и возмуще- возмущением столбца правых частей ДЬ. Решением возмущенной системы будет некоторый столбец ж, который отличается от х на столбец Ах = ж — ж, называемый возмущением решения. Величины ||АЛ||, ||ДЬ|| и ||Дж|| можно интерпретировать как абсолютные погрешности соответственно матрицы системы, правой части и решения, если компоненты исходной системы рассматривать как точные. При этом относительные погреш- погрешности будут выражаться формулами 5Л5Ь 5х ЬА- \\A\\ ' ЬЬ- \\Ь\\ ' ЬХ- \\x\\ ¦ Корректность задачи решения СЛАУ Ах = Ь с квадратной невырожденной матрицей заключается в том, что малым от- относительным погрешностям матрицы системы и правой части отвечает малая относительная погрешность решения системы. Чтобы показать, что это действительно так, нужно относи- относительную погрешность решения оценить с помощью относитель- относительных погрешностей матрицы и правой части. Определение 11.1. Для квадратной невырожденной ма- матрицы А величину A1.1) называют ее числом обусловленности. Число обусловленности матрицы всегда положительно и зависит от заданной нормы матриц. Эта характеристика имеет следующие свойства. Свойство 11.1. Для любой невырожденной матрицы А число ее обусловленности совпадает с числом обусловленности
294 11. ИТЕРАЦИОННЫЕ МЕТОДЫ обратной матрицы А: с(А~1) = \\А~1\\ НСЛ-1)"! = WA-1]] \\A\\ = с(А). > Свойство 11.2. Если норма матриц кольцевая, то с(АВ) < Согласно свойствам обратной матрицы, (AB)"~l = В~1А~~1, а согласно условию, что норма кольцевая, \\AB\\ Поэтому с(АВ) = ||АВ|| ЦЛВГЧ < И \\B\\ ЦВ-1 Свойство 11.3. Бели матричная норма кольцевая, то с(А) ^ 1 для любой невырожденной матрицы А. <4 Для единичной матрицы Е, согласно равенству ЕЕ = Е и свойству 11.2, получаем с(Е) = с{ЕЕ)^с(Е)с(Е). Так как с(Е) > 0, то, сокращая в неравенстве на с(Е), имеем с(Е) > 1. Для невырожденной матрицы А существует обратная ма- матрица А", при этом А А = ??. Согласно свойствам 11.1 и 11.2, заключаем, что 1 < с{Е) = с(АА~1) < с(А) с{А~1) = (с(А)J. Значит, с(Л) ^ 1, так как число обусловленности матрицы неотрицательное. > Свойство 11.4. Бели |||| — спектральная норма, то число обусловленности симметрической матрицы А равно с(А) = ?1
11.1. Обусловленность квадратных матриц 295 где Amax, Amin — ее собственные значения, соответственно наибольшее и наименьшее по абсолютной величине. «4 Спектральная норма симметрической матрицы равна макси- максимальной из абсолютных величин |Aj| ее собственных значений. Действительно, если симметрическая матрица имеет порядок п, то в Rn существует ортонормированный базис ei,..., еп из ее собственных векторов. Пусть соответствующие им собствен- собственные значения связаны неравенствами |Ai| ^ |Аг| ^ ... ^ |АП|. То- Тогда для любого вектора х = а\е\ +... + апеп имеем Поэтому Но на самом деле в приведенном неравенстве должен стоять знак равенства, так как для х = е\ имеем \\Ax\\ _ ||Aieill _ И Отметим, что если А — собственное значение невырожден- невырожденной матрицы А, то А — собственное значение матрицы А, так как равенство Ах = Ах, х ф 0, равносильно равенству А~1х = А ж. Кроме того, если А — симметрическая матри- матрица, т.е. А = А, то и А~1 — симметрическая матрица, так как {А"г)Т = (Ат)~~1 = Л. Поэтому, если Атах и Amin — соответ- соответственно наибольшее и наименьшее по абсолютной величине соб- собственные значения матрицы А, то \\A\\ = |Атах|, ||-А х|| = |A~jJ. Следовательно, с(А) = \\A\\ \\A~l\\ = |Am{uc||A~Jn|. > Число обусловленности матрицы А в значительной степени определяет чувствительность СЛАУ Ах = Ь к погрешностям в коэффициентах матрицы и в правых частях уравнений: чем
296 11. ИТЕРАЦИОННЫЕ МЕТОДЫ больше это число, тем выше погрешность решения при данном уровне погрешностей входных данных. Эту связь показывает следующая теорема. Теорема 11.1. Если матрица А невырождена и где ||*|| — произвольная кольцевая норма матриц, то матрица А = А 4- АА тоже невырождена и верна следующая оценка для относительной погрешности решения где 6х = \\х — а?||/||ж||; х — решение возмущенной системы Замечание 11.1. Если выполняется неравенство A1.2), то с(АNА = ЦАЦ ||Л1| !!М = ||ДЛ|| \\А~1\\ < 1. В этом случае в правой части неравенства A1.3) деления на нуль нет, и она положительная. 11.2. Q-R-разложение. Сингулярное разложение Одним из вариантов мультипликативного разложения ма- матрицы является QR-pизложение, т.е. представление матри- матрицы А в виде А = Qi?, где Q — ортогональная матрица, а Л — верхняя треугольная матрица. Построение Q Д-разложения матрицы А сводится к преобра- преобразованию этой матрицы путем последовательного умножения на ортогональные матрицы Pi, Рг> •••> Ps специального вида так, чтобы в результате получилась верхняя треугольная матрица R = Ps...PiA. Полагая Q = (Ps...Pi)~l, получаем предста- представление А = QR, где матрица Q, согласно свойствам 7.4 и 7.5 ортогональных матриц (см. с. 200), является ортогональной.
11.2. QR-разложение. Сингулярное разложение 297 Применяют два основных способа построения последова- последовательности матриц Pi, ..., Рп. Для описания этих способов удобно интерпретировать ортогональные матрицы как матри- матрицы ортогональных операторов в стандартном ортонормиро- ванном базисе в Кп, а матрицу А как набор столбцов а\, ..., ап, представляющих собой координаты векторов ai, ..., ап из Rn. Тогда О А = О(а\ ... ап) = (Оа\ ... Оап), где использова- использованы свойства умножения блочных матриц, и поэтому умножение матрицы А слева на ортогональную матрицу О равносильно применению к каждому из векторов а% ортогонального опера- оператора О, матрицей которого является О. Таким образом, задача сводится к последовательности ортогональных преобразований системы векторов oi, ..., an, в результате которой столбцы координат этой системы образуют верхнюю треугольную ма- матрицу. Метод вращений. В качестве элементарного ортого- ортогонального преобразования рассмотрим преобразование поворо- поворота Qij(<p) в двумерном подпространстве, образованном г-м и j-m векторами стандартного базиса в Шп (это подпростран- подпространство естественно ассоциировать с плоскостью). Матрица тако- такого преобразования имеет вид 1 \ сожр simp — simp cos<p и отличается от единичной элементами на пересечении г-й и jf-й строк, г-ro и j-ro столбцов. Эти элементы образуют матрицу
298 И. ИТЕРАЦИОННЫЕ МЕТОДЫ второго порядка / cosip — sin<p\ \sirup cosip /' которая на плоскости (в пространстве Уг) определяет поворот вектора на угол (р. Бели примененить преобразование с матрицей Qij{(p) к произвольному вектору а= (ах, ..., ап), то изменятся только его г-я и j-я координаты, а остальные останутся прежними. При этом за счет выбора угла (р можно добиться, чтобы j-я координата вектора обнулилась. Для этого при г < j достаточно выбрать (р из условия а{ sirup + ay cos<p = 0. Рассмотрим последовательность преобразований Q\j{<p\j), jf = 2, n, в результате которых вектор ах, представленный первым столбцом матрицы Л, превратится в вектор а} = = [а\х 0 ... 0) . При этом векторы аг,..., ап, представленные остальными столбцами матрицы Л, преобразуются в некото- некоторые векторы а\, ..., а\ с координатами (a}j ... о^) , / = = 2, п. Далее рассмотрим последовательность преобразований Q2j(<P2j)i j = 3, п, при которой вектор а\ переходит в вектор а2 = (ai2 a22 0 ... 0) . При этом вектор а\ не изменится, так как преобразуются лишь те координаты, которые у этого вектора равны нулю. Продолжая процесс, мы получим си- систему векторов а}, ..., aJJ, координаты которых составляют верхнюю треугольную матрицу. Последовательность ортого- ортогональных матриц Qij(<Pij), г = 1, п — 1, j = t+1, n, и есть искомая последовательность Pi, ..., Р$. Метод отражений. В этом методе в качестве элемен- элементарных ортогональных преобразований берут преобразования симметрии. Рассмотрим произвольный ненулевой вектор хо из Rn. Пусть И1 — ортогональное дополнение одномерного ли- линейного подпространства Но = span{a?o}. Согласно следствию 3.1, каждый вектор х G Шп представляется в виде х = Xxq + х±,
11.2. QR-разложение. Сингулярное разложение 299 где Аа?о — ортогональная проекция вектора х на Но, а х± — его ортогональная составляющая. Рассмотрим преобразова- преобразование Qx = Q(\xq + x±) = х± — Xxq = х — 2Ажо (рис. 11.1). Нетрудно показать, что это преобразование является линейным. Кроме того, согласно х0 теореме Пифагора, Рис. 11.1 (здесь рассматривается евклидо- евклидова норма, соответствующая стан- стандартному скалярному произведе- произведению в Rn). Поэтому линейный оператор Q является ортогональ- ортогональным. Лучше всего в качестве вектора жо взять вектор п с единичной нормой. Тогда А = (х, п), а линейный оператор Q записывается в виде «i/ — •»/ ^v ) JvjTb, 11**11 ¦"" *• Линейный оператор Q указанного вида будем называть отра- отражением. Покажем, что для любых ненулевых векторов х и у из Rn найдется такое отражение О, что Ож = ау, т.е. вектор ж преобразуется в вектор, коллинеарныи у. Из определения от- отражения следует, что Ох - ж = -2(ж, п)п. Значит, искомое отражение должно определяться единичным вектором п, кол- линеарным вектору Ох - ж = ау - ж. Отметим, что в этом случае число а определено с точностью до знака, так как \\ay\\ = ||Ож|| = ||ж|| и, значит, \а\ = ||ж||/||у||. Выбор знака — это выбор одного из двух возможных решений (рис. 11.2).
300 11. ИТЕРАЦИОННЫЕ МЕТОДЫ х\'~ <*\У Рис. 11.2 Итак, выбираем а = \\x\\ / \\y\\ и вычисляем вектор хо = ау -*- — х. Если этот вектор нуле- нулевой, то векторы х и у колли- неарны (любой из них принад- принадлежит линейной оболочке дру- другого), и в качестве отражения следует взять тождественный оператор. Бели же Хо ф 0, то отражение О задается единич- единичным вектором п = хо/ ||&о||* Действительно, \\ау - х\\2 = (ау - ж, ау - х) = = а2 ||у||2 - 2а(х, у) + ||х||2 = 2(||х||2 - а(х, у)). Поэтому (ау - х) = Ох = ж - 2(х, п)п = ж - а(ж, у) — llxll2 / \ 2(а»"а?) а(ж, у) - ||«|Г Столбцы матрицы А будем трактовать как столбцы коор- координат некоторых векторов а\,..., ап из Rn. Пусть ei,..., еп — стандартный ортонормированныи базис в W1. Рассмотрим ор- ортогональное преобразование Pi, которое вектор а\ переводит в вектор а\ =а\в\. Бели вектор а\ ненулевой, это преобра- преобразование строится описанным выше способом, а если вектор а\ нулевой, то в качестве Pi можно взять тождественный опера- оператор. Оператор Pi преобразует векторы аг, ..., о>г в некоторые векторы а\, ..., а\. Рассмотрим оператор Р2, который пре- преобразует вектор а\ = (а\2 а\2 • • • л^2) в некоторый вектор Ра\ = а2 = (а22 а22 0 ... 0) . Для этого в качестве вектора у
11.2. QR-разложение. Сингулярное разложение 301 можно взять любую линейную комбинацию базисных векторов е\ и в2- Некоторая свобода выбора оператора Рч позволяет при этом добиться того, чтобы вектор ci, а значит и а}, не изменял- изменялся. Действительно, все векторы, попадающие в ортогональное дополнение W1, остаются без изменений, и нам достаточно по- потребовать, чтобы вектор xq = Р2о\ — Q>\ = oty — a\, задающий отражение Рг, был ортогонален вектору е\. Это и будет озна- означать, что вектор е\ попадает в линейное подпространство Н1, которое состоит из всех векторов, ортогональных xq. Указан- Указанное условие будет выполняться, если оператор P<i переводит вектор а\ - а]^! = (О «22 • • • а\а) в вектор агвг, так как этот оператор определяется вектором а?о = #2^2 — {о.\ ~" ai2ei)> имею- имеющим нулевую первую координату и потому ортогональным е\. Итак, оператор Рг не изменяет вектор oj, преобразует вектор а\ в вектор а\ = (а\2 а^ " ••• 0) » а векторы a], j = 37п, в некоторые векторы о^. Продолжая процесс, мы на А;-м шаге строим преобразова- преобразование, которое не меняет базисные векторы е*, i = l,fc—1, но преобразует вектор ajj:" — uj^ei —... — d\i\ ^еА;-1 в некоторый вектор, коллинеарный е&. Бели /с-й столбец исходной матрицы оказался нулевым, то и вектор а* будет нулевым и в процес- процессе преобразований Pi, ..., Pk-\ он останется нулевым. В этом случае в качестве очередного оператора Pk можно взять тожде- тождественный оператор. Процесс ортогонализации. К QiJ-разложению непо- непосредственное отношение имеет процесс ортогонализации Гра- ма — Шмидта. Любую квадратную невырожденную матрицу А порядка п можно рассматривать как совокупность столб- столбцов, представляющих собой координаты векторов /i, ..., fn в некотором фиксированном базисе n-мерного евклидова про- пространства ?. Так как матрица А невырождена, ее столбцы линейно неза- независимы, поэтому векторы /i,..., fn образуют в ? базис, вообще говоря, неортонормированный. Процесс ортогонализации при-
302 11. ИТЕРАЦИОННЫЕ МЕТОДЫ водит к новому, уже ортонормированному базису ei, ..., еп. Характерной особенностью процесса ортогонализации являете ся то, что матрица перехода из нового базиса е к старому Ь является верхней треугольной. Действительно, из соотноше- соотношений C.9) следует, что /з = (/з, ei)ei + (/3, е2)е2 + ||0з||е3, /п = (/я» ei) ei +... + (/„, en_i) en_i + \\gn\\ en, а матрица перехода из нового базиса е в старый / имеет вид ^llffill (/2,ei) ... (/n,ei)\ д = 0 \\д2\\ ... (/п,е2) \ 0 0 ... \\дп\\ ) Записав координаты векторов ej в фиксированном бази- базисе евклидова пространства, получим ортогональную матрицу Q. Исходная матрица А и ортогональная матрица Q связаны между собой соотношениями А = Qi?, т.е. мы получили Qii-раз- ложение матрицы А. Еще раз отметим, что процесс ортогонализации Грама — Шмидта может использоваться для получения QR-разложения, если матрица является невырожденной. Кроме того, оказы- оказывается, что такой метод уступает методу вращений и методу отражений с точки зрения точности вычислений. Единственность QA-разложения. Несложно привести пример, показывающий, что фД-разложение данной матрицы не является однозначным. Действительно, представление Е = = ЕЕ единичной матрицы можно рассматривать в качестве ее фЯ-разложения, так как единичная матрица является одновре- одновременно ортогональной и верхней треугольной. Но и представле-
11.2. QR-разложение. Сингулярное разложение 303 ние Е = (—Е)(—Е) также является Q/2-разложением единичной матрицы. Природу неоднозначности, которую иллюстрирует приве- приведенный пример, раскрывает следующее рассуждение. Пусть Р — квадратная матрица, которая одновременно является и ортогональной, и верхней треугольной. Тогда Р является не- невырожденной матрицей, а Р" — ортогональной и верхней треугольной. Поэтому для любого QiJ-разложения матрицы А имеем А = QR = QPP~lR = (QP)(P~lR) = Q'R\ т.е. еще одно фЯ-разложение матрицы А (при РфЕ). Возникает во- вопрос, какие матрицы являются одновременно ортогональными и верхними треугольными? Пусть Р — ортогональная верхняя треугольная матрица. Тогда, с одной стороны, Р = Рт является нижней треуголь- треугольной, а с другой стороны Р", будучи обратной к верхней треугольной матрице, является верхней треугольной. Одновре- Одновременно оба условия выполняются, если матрица Р~1 является диагональной. Тогда и Р — диагональная матрица. Кроме то- того, так как РР = РРТ = РР = J5, то диагональные элементы Р могут иметь лишь два значения 1 и — 1. Используя подходящую диагональную матрицу, у которой на диагонали расположены числа 1 и -1, мы можем любое Q/2-разложение А = QR матрицы А видоизменить так, чтобы в верхней треугольной матрице R на диагонали стояли не- неотрицательные элементы. Действительно, надо рассмотреть матрицу Р = diag(pi, ..., рп), в которой рг = 1, если г-й диа- диагональный элемент матрицы R является неотрицательным, и Pi = — 1 в противоположном случае. Тогда А = QR = QP2R = = (QP)(PR) = Q'R! и диагональные элементы матрицы R! все неотрицательны. Теорема 11.2. Бели матрица А невырождена, то ее QA-разложение, в котором диагональные элементы R неотри- неотрицательны, определено однозначно.
304 11. ИТЕРАЦИОННЫЕ МЕТОДЫ М Отметим, что наличие нулевых диагональных элементов у матрицы R означает, что матрица А вырожденная, а для невырожденной матрицы матрица Л в ее QA-разложении не имеет нулевых диагональных элементов. Пусть А = QR = QfR'. Так как А невырожденная, то ма- матрица R имеет обратную матрицу. Напомним, что Q ортого- ортогональна: QTQ = Е. Поэтому равенство QR = Q'Rf равносиль- равносильно следующему: Е = (QTQf)(RfR~l) = QR, т.е. мы получили фЯ-разложение единичной матрицы. По предположению, диа- диагональные элементы матриц Rn Rf положительны. Поэтому и верхняя треугольная матрица R имеет положительные диаго- диагональные элементы. Таким образом, нам достаточно доказать, что определено однозначно QjR-разложение единичной матри- матрицы, т.е. Q = R = Е. Из равенства QR = Е следует, что R = Q~l = QT, т.е. верх- верхняя треугольная матрица R является одновременно ортогональ- ортогональной. Поэтому она диагональная (см. выше), а ее диагональные элементы равны ±1. Учитывая, что все диагональные эле- элементы R положительные, заключаем, что R = E. Но тогда и Q = QT = JR = E. > Сингулярное разложение. Рассмотрим произвольный оператор А в евклидовом пространстве ?. Оператор А* А (А* — оператор, сопряженный к А) является самосопряжен- самосопряженным, так как для любых векторов х,у е?, (Л* Ах, у) = (Ах, Ау) = (*, А* Ау). Согласно теореме 6.6, в ? существует ортонормированный базис Ь = (Ъ\ ... Ьп) из собственных векторов оператора А* А. Пусть Ai, ..., Ап — собственные значения этого оператора, соответствующие векторам bi,..., Ьп, т.е. А*АЬ{ = Л^Ьг, г = 1,п. Отметим, что все собственные значения А; неотрицательны, так как = (bu А*АЪ) = (Abh Abi) = ||A6i||2 ^ 0. A1.4)
11.2. QR-разложение. Сингулярное разложение 305 Будем считать, что векторы в базисе Ъ упорядочены таким образом, что последовательтность собственных значений не возрастает. Если среди собственных значений линейного опе- оператора А* А к ненулевых, то Ai ^ ... А& > 0 и А^+х = ... = An = 0. Положительные числа \i{ = \f\u i = 1, fc, квадраты которых являются собственными значениями линейного оператора А* А, называют сингулярными числами линейного оператора А, а базис 6 из собственных векторов А* А — сингулярным базисом оператора А. Рассмотрим систему векторов Cj = Ab{, i = 1, А;. Эта система состоит из ненулевых попарно ортогональных векторов, так как, согласно A1.4), Видим, что нормы векторов С{ равны соответствующим сингу- сингулярным числам \ii линейного оператора А. Положим в{ = /i^1^, г = 1,/с, и дополним систему векторов ei, ..., е^ векторами е&+1, ..., еп до ортонормированного базиса е в евклидовом про- пространстве ?. Пусть Q — линейный оператор, который каждому вектору Ь{ сопоставляет вектор е*, т.е. Qb{ = е^, г = 1, п. Этот линейный оператор определен однозначно, потому что заданы образы всех векторов базиса 6. Так как он переводит ортонор- мированный базис Ь в ортонормированный базис е, то является ортогональным (см. теорему 7.3). Рассмотрим линейный опе- оператор S = AQ. Если г = 1, fc, то Sei = A(Q~lei) = а если г = А;+1, п, то Se* = A(Q-lei) = Abi = 0 = 0 ¦ е». Таким образом, базис е является ортонормированным базисом собственных векторов оператора S. Значит, этот оператор 11 Линейная алгебра
306 11. ИТЕРАЦИОННЫЕ МЕТОДЫ самосопряженный, так как его матрица в базисе е являет- является диагональной (см. теоремы 5.6 и 6.2) и имеет вид D =? = diag(/ii, ..., fife, 0, ..., 0). Обратим внимание, что ненулевые элементы матрицы D — это сингулярные числа линейного опре- атора A. i Из приведенного рассуждения вытекает, что любой линей- линейный оператор А в евклидовом пространстве может быть пред- представлен в виде SQ, где S — самосопряженный линейный опе- оператор с неотрицательными собственными значениями, a Q — ортогональный линейный оператор. Выясним, что это означа- означает для матриц. Любая матрица А порядка п является матрицей некоторого линейного оператора А в n-мерном евклидовом пространстве ?. Представление А = SQ этого линейного оператора означает, что для матрицы А имеет место мультипликативное разложе- разложение А = SQ, где матрица S симметрическая с неотрицатель- неотрицательными собственными значениями, а матрица Q ортогональная. Такое представление называют полярным разложением ма- матрицы А. Пусть А = SQ — полярное разложение матрицы А. Так как, матрица S является симметрической и имеет неотрицатель- неотрицательные собственные значения, существует такая ортогональная матрица Р и такая диагональная матрица D с неотрицатель- неотрицательными диагональными элементами, что S = Р DP (см. теорему 7.7). В результате получаем мультипликативное разложение А = PTD(PQ) = PDQ, где Р и Q — ортогональные матри- матрицы. Это представление не является единственным: несложно заметить, что есть и другие разложения, отличающиеся от ука- указанного порядком диагональных элементов в матрице D. Пусть А = PDQy где Р, Q — ортогональные матрицы, а диагональные элементы матрицы D неотрицательны. Тогда АТА = (PDQ)T{PDQ) = QTDPTPDQ = QTD2Q. Полученное равенство означает, что АТА и D2 представляют собой матрицы одного и того же линейного оператора А*А,
11.2. QR-раэложение. Сингулярное разложение 307 записанные в двух различных ортонормированных базисах, причем матрица Q — это матрица перехода из базиса, соответ- соответствующего матрице D2 линейного onpeai;opa, в другой базис, в котором матрицей оператора является А А. Матрицей обрат- обратного перехода, при котором матрица АТА самосопряженного линейного оператора А* А преобразуется к диагональному ви- виду ?J, т.е. перехода к базису из собственных векторов А* А, является матрица Q" = QT. Диагональные элементы матрицы D2 представляют собой собственные значения оператора А* А, или, что то же самое, собственные значения матрицы Ат А. Ко- Количество ненулевых диагональных элементов матрицы D равно рангу матрицы АТА и совпадает с рангом матрицы А. Дей- Действительно, если Ь= (Ь\ ... Ьп) — базис, в котором линейный оператор А* А имеет матрицу jD2, to, согласно сказанному вы- выше, векторы АЬ{ попарно ортогональны, а поэтому количество ненулевых среди них равно рангу линейного оператора А. Но это количество равно количеству ненулевых диагональных эле- элементов матрицы D2. Отметим, что ненулевые диагональные элементы матрицы D представляют собой сингулярные числа оператора А. Мультипликативное разложение А = PDQ, где Р и Q — ортогональные матрицы, D = diag(/ii,...,/in) — диагональ- диагональная матрица с неотрицательными диагональными элементами /ii ^ ... ^ /jn, называют сингулярным разложением матри- матрицы А, а диагональные элементы /ii, ..., цп — сингулярными числами матрицы А. Можно показать, что указанное раз- разложение определено однозначно, если матрица А невырождена. Из приведенных рассуждений вытекает следующая последо- последовательность построения сингулярного разложения для невыро- невырожденной матрицы: а) находим собственные числа Ai,..., Лп и ортонормирован- ный базис из собственных векторов матрицы А А, располагая собственные значения в порядке убывания; б) строим матрицу D = diag(^i,... ,/in), где /^ = у/\1, г = Т7п;
308 П. ИТЕРАЦИОННЫЕ МЕТОДЫ в) составляем матрицу Q , записывая в нее по столбцам координаты найденных собственных векторов матрицы АТА и определяем обратную матрицу Q = QT; г) находим вторую ортогональную матрицу Р по формуле 11.3. Описание итерационных методов Итерационные методы решения системы линейных алгебра- алгебраических уравнений (СЛАУ) состоят в построении последова- последовательности столбцов а?1, х2, ..., xNj ... Каждый очередной столбец xN+l вычисляется на основе одного или нескольких предыдущих столбцов. Если в итерационном методе столбец х1У^1 вычисляется с использованием одного предшествующе- предшествующего столбца xN, то такой метод называют одношаговым, в двухгиаговых интерационных методах текущий столбец вычисляется с использованием двух предшествующих столбцов. В общем случае, если для вычисления xN+l используют столбцы xN, xN~x, ..., xN~k+l (всего к столбцов), то говорят о к-ша- говом итерационном методе. Наиболее употребительны одно- и двухшаговые методы. Общее представление об одношаговых методах дает метод простой итерации решения нелинейного уравнения f(x) = 0, в котором f(x) — произвольная функция одного действительного переменного [II]. Для применения этого метода нужно уравне- уравнение преобразовать к виду х = (f{x). Отправляясь от некоторого начального приближения я?о, строят итерационную последова- последовательность {хп} согласно формуле xjv+i== vfcjv), N = 0,1, 2,... Если эта последовательность сходится к некоторому значению я*, т.е. \xn — х*\ -> 0 при N ->¦ оо, а функция <р(х) непрерывна в точке #*, то, переходя в равенстве жлг+i = <р{хн) к пределу при N -> оо, заключаем, что х* = <р(х*) и значение ж* является искомым решением уравнения f(x) = 0. В качестве приближе-
11.3. Описание итерационных методов 309 ния точного решения х* берут одно из значений х#, достаточно близкое к х*. Аналогично можно поступить и в случае решения СЛАУ Ах = Ь с невырожденной матрицей А, Преобразовав СЛАУ в эквивалентную ей систему вида х = Ф(х) = Вх + с, мы можем построить итерационную последовательность xN~*~l = Ф(х^), N = 0,1,..., начав с некоторого начального столбца х° (ин- (индексы в нашем случае удобнее ставить вверху, а не внизу, оставляя нижний индекс для нумерации элементов матриц и столбцов). Сходимость такой последовательности, состоящей из столбцов, или элементов пространства Кп, следует рассма- рассматривать относительно некоторой нормы. Последовательность {xN} сходится к некоторому столбцу х*, если Цх^ —х*|| -» 0 при N —> оо. Векторная функция Ф(х) = Вх + с непрерывна в любой точке х* € Кп, и мы можем перейти к пределу под знаком непрерывной функции: х* = Вх* + с. Таким образом, предел итерационной последовательности дает нам точное ре- решение СЛАУ, а в качестве приближенного решения системы можно взять подходящий столбец итерационной последователь- последовательности. Каноническая форма одношаговых методов. Наибо- Наиболее употребительные одношаговые итерационные методы ре- решения СЛАУ укладываются в единую схему, согласно которой итерационная последовательность {xN}, построенная по тако- такому методу, подчиняется уравнению общего вида xx BN+X + AxN = b, A1.5) TNl в котором det Bn+\ ф О, N = 0,1,... Уравнение A1.5) называют канонической формой одно- шагового итерационного метода. Выбор невырожденных матриц jBjv+1 характеризует конкретный метод, итерацион- итерационный параметр t^+i не является обязательным (его можно было бы учесть в матрице Bw+i) и вводится в уравнение из
310 li. ИТЕРАЦИОННЫЕ МЕТОДЫ соображений удобства. Его используют для поиска путей уси- усиления конкретного метода с точки зрения сходимости итера- итерационной последовательности и скорости этой сходимости. В канонической форме одношагового итерационного метода изменение xN+1 — xN текущего столбца фактически связывает- связывается с невязкой b — AxN, которую дает этот столбец в рассма- рассматриваемой СЛАУ. Чем меньше невязка, тем меньше изменение текущего столбца. Матрица Вдг+ь реализующая эту связь на N-м шаге, должна быть достаточно простой, так как, со- согласно канонической форме метода, для получения изменения xN+l —xN требуется вычисление обратной матрицы для J3;v+i- Если это не так, то более простым может быть обращение ма- матрицы А, и тогда прямой метод решения СЛАУ окажется более предпочтительным. Если в канонической форме A1.5) одношагового итераци- итерационного метода матрица Bn+i является единичной, то итера- итерационный метод называют явным, а иначе — неявным. Если матрицы ?#+1 и итерационный параметр т^+х от номера ите- итерации не зависят: J9w+i = 2?, t#+i = т, то метод называют стационарным. Методы Якоби и Зейделя. Представим невырожденную матрицу А в виде суммы трех матриц A = A-+D + A+, A1.6) где D — диагональная матрица; А_ и А+ — соответственно нижняя и верхняя треугольные матрицы с нулевыми элемента- элементами на диагонали. Такое представление существует и единствен- единственно, так как в каждой позиции только одна из складываемых матриц имеет ненулевой элемент, равный соответствующему элементу матрицы А. Матрица А_ содержит элементы А, рас- расположенные под главной диагональю, матрица А+ — элементы над главной диагональю, а матрица D — диагональные.
11.3. Описание итерационных методов 311 Пример 11.1. Для квадратной матрицы А = { 1 -3 1 2\ 2 0 6-1 3 -3 -2 -7 -1-2 4 5 четвертого порядка в представлении A1.6) имеем 0 2 3 0 0 0 0 0 0 -3 0 0 -2 4 0 ?> = /1 0 0 0 0 0 0 0 0 0\ О О -2 О О Ь) -3 1 2\ 0 6-1 0 0-7 0 0 0J # В СЛАУ Ах = b вместо матрицы А подставим ее предста- представление A1.6). Получим (A- + D + А+)х = Ь, откуда Dx = -(А- + А+)х + Ъ. A1.7) Вели диагональные элементы матрицы А = (а^) не равны ну- нулю, то диагональная матрицаD = diag(an, 022» •¦¦¦, °nn) имеет обратную матрицу D~l =diag(aj1, a^1, ..., а~?). В этом слу- случае систему A1.7) можно записать в виде Систему A1.8) можно использовать для построения итера- итерационной последовательности „ЛГ+1 xN+l = - = 0,1,..., A1.9) где х° — произвольное начальное приближение. Вычисление решения СЛАУ при помощи указанной последовательности
312 ii. ИТЕРАЦИОННЫЕ МЕТОДЫ называют методом Якоби. Матричные соотношения A1.9) несложно записать в координатной форме. Обозначая номера строк и столбцов индексами внизу, получим г = Т^. A1.10) Здесь и далее мы условимся считать равными нулю суммы, у которых верхний предел суммирования меньше нижнего. Используя представление A1.6) матрицы А, запишем СЛАУ Ах = Ь в следующем виде: (?> + Л-)х = -Л+я + 6. A1.11) Если диагональные элементы матрицы А не равны нулю, то нижняя треугольная матрица D + A- имеет обратную матрицу (D + A-)~l и систему A1.11) эквивалентна следующей: x = {D + A.)-l(-A+x + b). A1.12) Соотношение A1.12) можно использовать для построения ите- итерационной последовательности = {D + A-)~l{-A+xN + Ь), A1.13) использование которой для решения СЛАУ Ах = Ь называют методом Зейделл. Для вычисления итерационной последовательности в мето- методе Зейделя требуется обращение нижней треугольной матрицы D + A_, но оказывается, ^то такое обращение является фор- формальным. Преобразуем соотношение A1.13): Исходя из этой формы уравнения, получаем
11.3. Описание итерационных методов 313 В уравнениях A1.14) элементы xf*1 столбца xN+l находят- находятся и в левой, и в правой части. Однако если их вычислять последовательно для г = 1, г = 2, ..., г = п, мы увидим, что в формуле для очередного элемента х±1 используются только уже найденные элементы ж^+1, ..., x^J[l. Обращение матри- матрицы D + А- естественным образом встроено в вычислительную схему и не требует отдельных усилий. Вычислительные схемы методов Зейделя и Якоби, которые описываются уравнениями A1.10) и A1.14), очень похожи. Различие лишь в том, что при вычислении каждого элемента столбца xN*1 в методе Якоби используются только элементы предыдущего столбца /,ав методе Зейделя более новые уже найденные элементы текущего столбца. И метод Якоби, и метод Зейделя могут быть получены в рамках канонической формы A1.5) одношаговых итерацион- итерационных методов. Итерационная последовательность метода Якоби подчиняется уравнению DxN+1 = — (А- + A+)xN + Ь, которое эквивалентно A1.9). Это уравнение легко преобразуется в фор- форму DxN+l = — (А — D)xN + 6, откуда получаем Видим, что для получения метода Якоби в канонической фор- форме надо положить ??лг+1 = jD, tjv+i = 1. Таким образом, метод Якоби можно квалифицировать как одношаговый неявный ста- стационарный итерационный метод. Из уравнения A1.13) находим (D + A-)xN+l = — A+xN + Ъ, или, заменяя матрицу А+ через матрицу A, (D + A-)xN+l = = — (А - D — A-)xN + Ъ. Следовательно, {D + A.)(xN+l - xN) + AxN = Ь. A1.15) Для представления метода Зейделя в канонической форме мы должны положить J3w+i = D + А_, tn+i = 1, N = 0,1,... Та- Таким образом, метод Зейделя также относится к одношаговым стационарным неявным методам.
314 11. ИТЕРАЦИОННЫЕ МЕТОДЫ Другие итерационные методы. Полагая в канонической форме итерационных методов Ду+i = Е, туу+х = т, N = 0,1,..., получаем уравнение A1.16) дающее метод простой итерации, представляющий собой явный стационарный метод. Обобщением метода простой ите- итерации является метод Ричардсона, для которого в канони- канонической форме A1.5) итерационных методов следует положить = Е. В результате получим + AxN = Ь. A1.17) В уравнение A1.15) метода Зейделя введем числовой пара- параметр ш: ? N = ft. A1.18) Это приведет к серии методов, среди которых находится и метод Зейделя, соответствующий частному случаю и = 1. Ско- Скорость сходимости итерационной последовательности зависит от параметра а>, подбирая который можно получить метод, бо- более точный по сравнению с методом Зейделя. Уравнение A1.18) задает метод верхней релаксации. К нему близок метод нижней релаксации, который имеет уравнение A1.19) U) Как и метод Зейделя, методы верхней и нижней релаксации связаны с обращением матрицы, которое естественно встроено в вычислительную схему метода. В случае метода верхней релаксации преобразуем уравнение A1.18) к виду n +u>D~lb.
11.4. Сходимость итерационных методов 315 Записывая это уравнение в координатах, находим , i = XH A1.20) В методе нижней релаксации приведем уравнение A1.19) канонической формы к виду ((l-u))E-u>D~lA-)xN +u>D~lb и запишем в координатной форме: f), i = TT^. A1.21) J=t+1 Из A1.20) и A1.21) следует, что методы верхней и ниж- нижней релаксации различаются порядком вычислений. В методе верхней релаксации элементы столбца xN+1 вычисляются по- последовательно от первого к последнему (как в методе Зейделя), а в методе нижней релаксации, наоборот, — от последнего к первому. 11.4. Сходимость итерационных методов Итерационные методы решения систем линейных алгебра- алгебраических уравнений (СЛАУ) наиболее детально разработаны в случае, когда матрица системы симметрическая положитель- положительно определенная. Это объясняется тем, что такие системы часто встречаются в приложениях, причем они имеют значи- значительные размеры, и прямые методы для таких систем теряют эффективность.
316 11. ИТЕРАЦИОННЫЕ МЕТОДЫ Отметим, что квадратную СЛАУ с невырожденной матри- матрицей А легко преобразовать в эквивалентную систему с симме- симметрической положительно определенной матрицей. Для этого достаточно умножить систему Ах = Ь слева на матрицу А . Поскольку det Ат = det А Ф О, то получающаяся при этом СЛАУ АтАх = АТЬ эквивалентна исходной СЛАУ, так как можно про- провести обратное преобразование, умножив полученную систему слева на матрицу (Ат)~1. Матрица АТА является симметри- симметрической: Покажем, что она является и положительно определенной. Для этого рассмотрим квадратичную форму х А Ах. В силу свойств умножения матриц имеем хТАТАх = (Ах)т{Ах) = \\Ax\\2 > О, где ||-|| — евклидова норма в линейном арифметическом про- странстве Rn со стандартным скалярным умножением. По- Последнее нестрогое неравенство превращается в равенство, если только столбец Ах является нулевым. Так как матрица А не- невырождена, существует обратная матрица А". Поэтому при Ах = 0 имеем х = Ех = (А'1А)х = А~1{Ах) = А~г0 = 0. Переход от данной СЛАУ к эквивалентной ей системе с симметрической положительно определенной матрицей не все- всегда целесообразен. При таком переходе могут утрачиваться свойства, которые были бы полезны при решении системы и которые не компенсируются приобретенными свойствами (сим- (симметричностью и положительной определенностью). Например, это наблюдается для разреженных матриц, отличительной осо- особенностью которых является большое количество нулевых эле- элементов. К недостаткам указанного перехода следует отнести и то, что он, как правило, приводит к увеличению числа обуслов- обусловленности матрицы системы. Основой любого итерационного метода является сходи- сходимость итерационной последовательности по той или иной нор-
11.4. Сходимость итерационных методов 317 ме, заданной в линейном пространстве. Мы рассмотрим ли- линейное арифметическое пространство Rn, норма в котором порождается стандартным скалярным умножением. Элементы линейного арифметического пространства будем записывать в вдде столбцов. Если матрица А симметрическая, то запись А > О озна- означает, что эта матрица положительно определена. Другими словами, положительно определенной является квадратичная форма хтАх, матрицей которой является А. Для произволь- произвольной матрицы В мы также можем рассмотреть квадратичную форму хтВх. Матрицей этой квадратичной формы является Bs = (В + Вт)/2. Если указанная квадратичная форма поло- положительно определена, то мы будем говорить, что и матрица В (вообще говоря, несимметрическая) положительно определена и обозначать это так: В > 0. Рассмотрим одношаговый итерационный метод в канониче- канонической форме A1.5). Если метод стационарный, то он определя- определяется частным случаем канонической формы Для такого метода верна следующая теорема о сходимости. Теорема 11.3 (теорема А.А. Самарского). Если А — симметрическая положительно определенная матрица, г > 0 и матрица В удовлетворяет условию В — 0,5тА > 0, то итера- итерационная последовательность для итерационного метода A1.22) сходится. # Сформулированная теорема 11.3 позволяет получить легко проверяемые условия сходимости для конкретных итерацион- итерационных методов. Следствие 11.1. Пусть А — симметрическая положитель- положительно определенная матрица порядка п с диагональным преобла-
318 П. ИТЕРАЦИОННЫЕ МЕТОДЫ данием, т.е. для ее элементов ац выполняются неравенства A1.23) Тогда итерационная последовательность метода Якоби схо- сходится. -< Метод Якоби является частным случаем канонической фор- формы A1.22) стационарного итерационного метода при г = 1, В = D. Поэтому условие теоремы 11.3 для этого метода имеет вид 2D — А > 0. Покажем, что это условие выполняется, если матрица А имеет диагональное преобладание. Оценим квадратичную форму хТАх, учитывая, что a,ji = ац для симметрической матрицы А: П П \cLijl \Xi\ \Xj\ ^ Из A1.23) немедленно следует, что у матрицы А с диаго- диагональным преобладанием диагональные элементы ац положи- положительны. Поэтому при х ф 0 хтАх = г=1 Следовательно, ж BD — А)ж > 0 при х^Ои условия теоремы А.А. Самарского выполнены. >
11.4. Сходимость итерационных методов 319 Следствие 11.2. Если А — симметрическая положительно определенная матрица, то итерационная последовательность метода верхней релаксации сходится при 0 < и) < 2. <4 Метод верхней релаксации получается из канонической фор- формы A1.22) стационарного метода при В = D + алА_, т = ш. Для симметрической матрицы А имеем A*L = А+. Значит, квадра- квадратичные формы хТА-х и хтА+х совпадают, так как у них одна и та же матрица 0,5(А- + А+). Учитывая это, преобразуем условие теоремы 11.3: хт (В -0? = A - 0?u)xTDx + 0,5а; (хтА-х - хтА+х) = A - 0,5w)xTDx. У симметрической положительно определенной матрицы все диагональные элементы положительны (см. следствие 8.3). Это значит, что диагональная матрица D положительно определена. Следовательно, хт(В - 0,5тА)х = A - 0?u)xTDx > 0 при и < 2 и х ф 0. Если и) > 0, то и г > 0. Согласно теореме 11.3, при 0 < ш < 2 итерационная последовательность метода верхней релаксации сходится. > При ш = 1 метод верхней релаксации превращается в метод Зейделл. Из следствия 11.2 сразу получаем следующее утвер- утверждение. Следствие 11.3. Если А — симметрическая положительно определенная матрица, то итерационная последовательность метода Зейделя сходится. Для метода простой итерации теорема 11.3 дает условие сходимости, более сложное для проверки. Следствие 11.4. Если А — симметрическая положительно определенная матрица, то итерационная последовательность
320 П. ИТЕРАЦИОННЫЕ МЕТОДЫ метода простой итерации сходится при 0<т<2/Атах, A1.24) где Атах — наибольшее собственное значение матрицы А. <4 Метод простой итерации A1.16) получается из канонической формы A1.22) стационарного метода в случае В = Е. Условие теоремы 11.3 для этого метода имеет вид Е — 0,5тА > 0, г > 0. Матрица Е - 0,5тА симметрическая. Поэтому она положитель- положительно определена тогда и только тогда, когда положительны все ее собственные значения (см. 8.6). Покажем, что каждому собственному значению /л матрицы Е — 0,5тА соответствует собственное значение Л = 2—^ ма- матрицы А. Пусть х — собственный вектор матрицы Е — 0,5тА, отвечающий собственному значению /i, т.е. (Е — 0,5тА)х = цх. Тогда х — 0,5т Ar = /irr, откуда Ах = 2—-х. Следовательно, х — собственный вектор матрицы А, при этом собственное значение равно А = 2—-. Выразив отсюда ^, находим \х = = 1-0,5тА. Собственное значение д матрицы Е — 0,5тА положительно, если для соответствующего ему собственного значения А ма- матрицы А выполняется неравенство 1 — 0,5тА > 0, или А < 2/т. Отсюда вытекает, что если максимальное собственное значе- значение Атах матрицы А меньше 2/т, то все собственные значения матрицы Е — 0,5тА положительны и эта матрица является поло- положительно определенной. Согласно теореме 11.3, итерационная последовательность метода простой итерации сходится, если Атах < 2/т. > Условия сходимости типа A1.24) можно получить для про- произвольного стационарного метода. Теорема 11.4. Для сходимости итерационной последо- последовательности стационарного метода, заданного канонической формой A1.22), при любом начальном приближении необходимо
11.5. Скорость сходимости стационарных методов 321 и достаточно, чтобы все корни характеристического уравнения матрицы Т = Е — г В А были по модулю меньше единицы. # Отметим, что в теореме не требуется, чтобы матрица А СЛАУ была симметрической. Достаточно лишь, чтобы и А, и В были невырожденными матрицами. В этом случае харак- характеристическое уравнение матрицы Т может иметь как дей- действительные корни (собственные значения), так и комплексные. Для сходимости итерационной последовательности нужно, что- чтобы все корни, и действительные, и комплексные, по модулю были меньше единицы. 11.5. Скорость сходимости стационарных итерационных методов Пусть х* — точное решение системы линейных алгебраиче- алгебраических уравнений (СЛАУ) Ах = 6 с квадратной невырожденной матрицей А порядка n; {xN} — итерационная последователь- последовательность стационарного итерационного метода A1.22). Раз- Разность vN = xN — %* называют ошибкой N-и итерации. Подставляя в уравнение A1.22) выражения xN = vN + х*, xN+1 = vN+l +х* и учитывая равенство Ах* = 6, находим откуда /+1=Т/, A1.25) где Т = Е — тВ"хА, Соотношение A1.25) позволяет выразить ошибку iV-й итерации через ошибку начального приближения: vN = TNv°. A1.26) Сходимость итерационной последовательности стационар- стационарного метода означает, что к нулю сходится последовательность {vN}> определенная рекуррентным соотношением A1.25). Со- Согласно равенству A1.26), указанная сходимость определяется
322 11. ИТЕРАЦИОННЫЕ МЕТОДЫ сжимающими свойствами матрицы Г [1-Д8.2]. Бели отобра- отображение у = Тх в пространстве Rn с заданной нормой является сжимающим, т.е. для некоторой постоянной q < 1 и любых ж1, х2 G Кп выполняется неравенство то последовательность {г;^} сходится. Постоянная q определя- определяется свойствами матрицы Т, и от величины этой постоянной зависит, насколько быстро сходится последовательность {vN}. Необходимое и достаточное условие сходимости к нулю после- последовательности ошибок дает теорема 11.4, но проверка условия теоремы достаточно сложна. Поэтому часто прибегают к дру- другим условиям, более простым, но имеющим лишь достаточный характер. Эти условия обычно связаны с нормой матрицы Т. Как и выше, будем рассматривать столбцы высоты п в качестве векторов линейного арифметического пространства Rn, в котором задана некоторая норма || • ||. Для матриц будем использовать норму, индуцированную заданной нормой в Rn, и для индуцированной нормы используем то же обозначение, что и для нормы в Rn. Из A1.26) следует, что Отсюда видим, что последовательность {vN} сходится к нулю, если \\TN\\ -> 0 при N -» сю. Взяв е > 0, найдем такой номер N(e), что при N ^ N(e) будет \\TN\\ < е. Тогда для N = N(e) получаем Цг^^Ц < ?||w°||, т.е. за N итераций начальное приближе- приближение уменьшилось в 1/е раз. Число N(e) следует выбирать наи- наименее возможным, и тогда оно будет определять минимальное число итераций для заданной точности е, а обратную величину l/N(e) естественно рассматривать как скорость сходимо- сходимости итерационного метода. Отметим, что минимальное число интераций и скорость сходимости метода зависят от того, какая выбрана норма в линейном арифметическом про- пространстве.
11.5. Скорость сходимости стационарных методов 323 Вычислить нормы \\TN\\ очень сложно. Чтобы установить сходимость последовательности таких норм и выяснить ско- скорость сходимости, надо использовать для таких норм различ- различные оценки. Например, если ||Т|| = q < 1, то, согласно нера- неравенству \\AB\\ < |Щ| ||В||, верному для любой кольцевой нормы, имеем неравенство ||Т^|| < \\T\\N = д^, откуда сразу следует сходимость к нулю последовательности {||Т^||}. Более того, записав неравенства ||Т^|| < qN < e, получаем при помощи ло- логарифмирования оценку минимального числа итераций: * "w'ln, ln(l/||T||)- Скорость сходимости итерационной последовательности в стационарном методе зависит, вообще говоря, от выбранного значения итерационного параметра т. То значение tq параме- параметра, при котором скорость сходимости метода наивысшая, на- называют оптимальным итерационным параметром. Это значение, конечно, зависит от используемой нормы. Остано- Остановимся на случае, когда в Rn рассматривается евклидова норма, порожденная стандартным скалярным произведением. Если А — симметрическая положительно определенная ма- матрица, то для метода простой итерации A1.16) где Хт\п(А) и ^тах(Л) — соответственно минимальное и макси- максимальное собственные значения матрицы А. При этом верна следующая оценка ошибки iV-й итерации: Ц^^Ц ^ pN Параметр р определяется отношением ? = Amax(j4)/Amin(A), представляющим собой число обусловленности симметриче- симметрической положительно определенной матрицы А. Чем меньше
324 П. ИТЕРАЦИОННЫЕ МЕТОДЫ число обусловленности, тем меньше р и тем выше скорость схо- сходимости метода. При плохо обусловленной матрице А параметр р близок к единице и скорость сходимости метода простой ите- итерации мала. В такой ситуации целесообразно ориентироваться на неявные итерационные методы A1.22). Для неявного итерационного метода A1.22), т.е. при ВфЕ, в случае симметрических матриц А и В 2 где Amin(jBi4) и XmaxiB^A) — соответственно минимальное и максимальное собственные значения матрицы В~1А. Для ошибки итерации верна оценка \\vN\\ ^ pN ||^°|L где Р Величина р определяется числом обусловленности матрицы В А. Невырожденную симметрическую матрицу В следует выбирать так, чтобы ? было мало и во всяком случае было меньше числа обусловленности матрицы А (в противном случае использование неявного метода не имеет смысла). Вопросы и задачи 11.1. Может ли число обусловленности квадратной невыро- невырожденной матрицы быть: а) отрицательным; б) положительным; в) целым; г) иррациональным; д) ббльшим единицы; е) меньшим единицы; ж) равным единице? 11.2. Найдите число обусловленности матрицы ( „ , J, рас- рассматривая в качестве нормы матриц: а) спектральную норму; б) октаэдрическую норму; в) кубическую норму. Сравните по- полученные ответы.
Вопросы и задачи 325 11.3. Докажите, что с(аА) = с(А) для любого действитель- действительного числа а ф 0. 11.4. Приведите пример нормы матриц и матрицы, которая относительно этой нормы имеет число обусловленности, мень- меньшее единицы. 11.5. Найдите все матрицы Л, для которых с(А) = 1 отно- относительно спектральной нормы матриц. 11.6. Докажите, что для октаэдрической, спектральной, кубической, евклидовой норм матриц число обусловленности не изменяется при перестановке строк и столбцов матрицы. 11.7. Как найти сингулярное разложение симметрической положительно определенной матрицы? 11.8. Найдите QiJ-разложение, полярное и сингулярное разложения для матриц: 11.9. Составьте программу на одном из алгоритмических языков, реализующую метод Зейделя. При помощи составлен- составленной программы решите систему - 8,0х2 + 9,3ж3 - 8,2х4 = 1,5, ~3,3xi + 2,4x2 - 2,8х3 + 2,4х4 = 2, + 1,9x2 - 2,2х3 + 1,9х4 = -1, + 9,3х2 - 1,1х3 + 9,5х4 = 0. Сравните найденное решение с решением той же системы методом Гаусса.
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ Учебники и учебные пособия Беклемишев Д.В. Дополнительные главы линейной алгебры. М.: Наука, 1983. 336 с. Беклемишев Д.В. Курс аналитической геометрии и линейной алгебры: Учеб. пособие для физ.-мат. и инж.-физ. специальностей вузов, б-е изд., стереотип. М.: Наука, 1984. 319 с. Беллман р. Введение в теорию матриц / Пер. с англ. под ред. В.Б. Лидского. М.: Наука, 1969. 368 с. Воеводин В.В. Вычислительные основы линейной алгебры. М.: Наука, 1977. Воеводин В.В. Линейная алгебра. М.: Наука, 1980. Гантмахер Ф.Р. Теория матриц. 3-е изд. М.: Наука, 1967. 576 с. Гельфанд ИМ. Лекции по линейной алгебре. 4-е изд., доп. М.: Наука, 1971. 272 с. Головина Л.И. Линейная алгебра и некоторые ее приложения. М.: Наука, 1979. 392 с. Ильин В.А., Познлк Э.Г. Линейная алгебра. 2-е изд. М.: Наука, 1978. 304 с. Курош А.Г. Курс высшей алгебры. 8-е изд. М.: Наука, 1965. 432 с. Ланкастер Д. Теория матриц / Пер. с англ. СП. Демушкина. М.: Наука, 1978. 280 с. Мальцев А.И. Основы линейной алгебры. М.: Наука, 1970. Стренг Г, Линейная алгебра и ее применения / Пер. с англ. под ред. Г.И. Марчука. М.: Мир, 1980. 456 с. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алге- алгебры. М.: Физматгиз, 1963. Хорн Р., Джонсон У. Матричный анализ / Пер. с англ. под ред. Х.Д. Икрамова. М.: Мир, 1989. 656 с.
327 Справочные издания Александрова Н.В. Математические термины: Справочник. М.: Высш. шк, 1978. 190 с. Бронштейн И.Н., Семендяев К. А. Справочник по математике для инженеров и учащихся втузов. 13-е изд., испр. М.: Наука, 1986. 544 с. Воднев В. Т., Наумович А.Ф., Наумович Н.Ф. Математический словарь высшей школы / Под ред. Ю.С. Богданова. Минск: Вышэйш. шк., 1984. 528 с. Воеводин В.В., Кузнецов Ю.А. Матрицы и вычисления. М.: Наука, 1984. 320 с. Выгодский М.Я. Справочник по высшей математике. 13-е изд., стерео- стереотип. М.: Физматлит, 1995. 872 с. Корн Г., Корн Т. Справочник по математике (для научных работников и инженеров) / Пер. с англ. под ред. И. Г. Арамановича. М.: Наука, 1973. 832 с. Математический энциклопедический словарь / Гл. ред. Ю.В. Прохоров. М.: Сов. энцикл., 1988. 848 с. Сигорский В.П. Математический аппарат инженера. 2-е изд., стерео- стереотип. Киев: Техшка, 1977. 768 с. Фор Р.у Кофман А., Дени-Папен М. Современная математика / Пер. с франц. под ред. А.Н. Колмогорова. М.: Мир, 1966. 272 с. Задачники Беклемишева Л.А., Петрович А.Ю., Чубарое И.А. Сборник задач по аналитической геометрии и линейной алгебре: Учеб. пособие / Под ред. Д.В. Беклемишева. М.: Наука, 1987. 496 с. Икрамов Х.Д. Задачник по линейной алгебре. М.: Наука, 1975. 320 с. Лефор Г. Алгебра и анализ. Задачи / Пер. с франц. Е.И. Стечкиной. М.: Наука, 1973. 464 с. Окунев ЛЯ. Сборник задач по высшей алгебре. М.: Просвещение, 1964. 184 с. Проскуряков И.В. Сборник задач по линейной алгебре. 5-е изд. М.: Наука, 1974. 384 с. Сборник задач по линейной алгебре / Под ред. С.К. Соболева. М.: Изд-во МГТУ, 1991. 155 с. Сборник задач по математике для втузов: Ч. 1. Линейная алгебра и основы математического анализа: Учеб. пособие для втузов. / Под ред. А.В. Ефимова и Б.П. Демидовича. 2-е изд. М.: Наука, 1986. 428 с.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аксиомы линейного пространства 15 - нормы 84 - поля 48 - скалярного умножения 78 Альтернирование 283 Базис линейного пространства 30 - ортогональный 93 - ортонормированный 93 - сингулярный 305 - стандартный 36 Базисы биортогональные 264 - взаимные 264 Валентность тензора 273 Вектор III, 16 - геометрический III, П - единичный III, 87 - ковариантный 265 - контравариантный 265 - нулевой 16 - ортогональный подпространству 90 - противоположный 16 - свободный III, 16 - собственный квадратной матрицы 159 -- линейного оператора 158 Векторы линейно зависимые 24 -- независимые 24 - ортогональные 89 Возмущение матрицы системы 293 Возмущение решения 293 - столбца правых частей 293 Грань точная верхняя 1-88 Данные математической задачи входные 291 выходные 292 Дефект оператора 132 Дополнение ортогональное 100 - прямое 74 Задача математическая корректная (корректно поставленная) 292 - некорректная 292 Закон инерции 226 Замена переменных линейная 216 Значение собственное квадратной матрицы 159 - - линейного оператора 158 Изоморфизм линейных пространств 134 Инвариант 157, 274 Квадрат скалярный 79 Клетка жорданова 182 Ковектор 265 Комбинация линейная III, 23 -- нетривиальная 23 -- тривиальная 23 Компонента тензора 273
329 Компонента тензора кососиммет- рического ведущая 288 Координаты вектора в базисе 32 - полилинейной формы 271 - точки III, 241 Коэффициент комбинации линейной III, 23 Кратность собственного значения 161 Критерий Сильвестра 230 ЛДатрица блочная III - Грама 94 - жорданова 182 - квадратичной формы 214 - комплексно сопряженная 190 - линейного оператора 138 - ортогональная 199 - отрицательно определенная 233 - перехода 43 - положительно определенная 233 - псевдообратная 123 - формы билинейной 236 Матрицы подобные 144 Метод верхней релаксации 314 - Гаусса исключения неизвестных III - Зейделя 312 - итерационный двухшаговый 308 - одношаговый 308 неявный 310 стационарный 310 явный 310 -- А>шаговый 308 - Лагранжа 217 - математической индукции 1-63 - наименьших квадратов 112 - нижней релаксации 314 - простой итерации II, 314 Метод Ричардсона 314 - Якоби 312 Минор III - главный III, 230 - угловой III, 230 Многочлен характеристический линейного оператора 157 -- матрицы 155 Множество замкнутое 1-186, V - - относительно операции 16 - ограниченное 1-183, V Мультивектор 287 Начало системы координат III, 241 Невязка СЛАУ 113 - уравнения 112 Неравенство Буняковского 84 - Коши 83 - Коши — Буняковского 82 - треугольника 84 - Шварца 84 Норма 84 - евклидова (сферическая) 86 - кубическая ПО -- (loo) 87 - максимальная столбцевая ПО -- строчная (кубическая) 110 - матрицы евклидова (fa) 106 -- индуцированная (подчиненная, операторная) 108 -- кольцевая (матричная) 109 - октаэдрическая ПО -- (/i) 86 - согласованная 107 - спектральная ПО Оболочка линейная 59 Образ оператора 131
330 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Ограничение линейного оператора 162 Оператор линейный 128 -- противоположный 149 - нулевой 133 - ортогонального проектирования 184 - ортогональный 201 - самосопряженный 188 - сопряженный 185 - тождественный 132 Операции линейные 15 Операция алгебраическая 48 -- бинарная 48 - дополнительная 49 - основная 4е) Определитель линейного оператора 145 Опускание индекса тензора 287 Отображение биективное 1-74, 128 - инъективное 1-74, 128 - линейное 128 - сжимающее 1-315, 322 - сюръективное 1-73, 128 Отражение 299 Ошибка итерации 321 Параметр итерационный 309 -- оптимальный 323 Переменные канонические 217, 250 Перенос параллельный системы координат 245 Пересечение линейных подпространств 60 Поверхность второго порядка в Шп 242 - цилиндрическая в Шп 247 Поворот системы координат 245 с отражением (симметрией) 245. Поднятие индекса тензора 287 Подпространство инвариантное 162 - линейное 55 - несобственное 56 - нулевое 56 - собственное 56 - - линейного оператора 162 Подсистема векторов 23 Поле 48 Поливектор 287 Последовательность итерационная 1-100, 308 Правило индексов 271 - интегрирования по частям VI - суммирования по умолчанию 271 Преобразование квадратичной формы ортогональное 220 - линейное 129 - ортогональное 201 - - матрицы 208 - элементарное строк матрицы III, 41 Приведение матрицы к диагональному виду 172 Проекция ортогональная 103 Произведение внешнее 289 - линейного оператора на действительное число 148 - линейных операторов 146 - скалярное 78 - тензора на действительное число 279 - тензоров 284 - элемента (вектора) на число 15
331 Пространства линейные изоморфные 134 Пространство евклидово 78 - арифметическое 79 - линейное 15 -- арифметическое 19 -- бесконечномерное 38 - действительное 19 - комплексное 19 - конечномерное 38 - над полем 49 - - п-мерное 38 - линейных операторов (преобразований) 149 - нормированное 84 - сопряженное 263 -- двойное 265 Процесс ортогоналиэации Грама — Шмидта 96 Псевдорешение (нормальное) 118 Разложение вектора по базису 30 - матрицы мультипликативное III, 296 QR296 - полярное 306 - сингулярное 307 Размерность пространства линейного 38 Разность векторов 22 Ранг квадратичной формы 214 - оператора 132 - системы векторов 69 - тензора 273 Решение тривиальное 143 Свертка двух тензоров 286 - тензора 286 Символ Кронекера 275 Симметрирование 282 Система векторов 23 - - линейно зависимая 24 независимая 24 - ортогональная 91 - возмущенная 293 - координат прямоугольная 93 вМп 241 - линейных алгебраических уравнений определенная III, 118 - решений фундаментальная III, 41, Щ Скорость сходимости итерационного метода 322 СЛАУ нормальная 116 След линейного оператора 158 - матрицы 158 Сложение линейных операторов 148 - элементов (векторов) 15 Соотношение рекуррентное 1-87 Составляющая ортогональная 103 Спектр квадратной матрицы 159 - линейного оператора 159 Структура алгебраическая 1-144, 48 Сужение отображения 1-73 Сумма линейных операторов 148 -- подпространств 61 прямая 64 - тензоров 278 - элементов (векторов) 15 Сфера единичная 87 Тензор 273 - антисимметрический по группе индексов 282 - евклидов 287 - ковариантный 274 - контравариантный 274
332 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Тензор кососимметрический 282 - - по группе индексов 282 - метрический ковариантный 275 - контравариантный 276 - симметрический 282 - - по группе индексов 282 - смешанный 274 - транспонированный 280 Теорема Кэли — Гамильтона 156 - Пифагора 91 Тип полилинейной формы 268 - тензора 273 Транспонирование тензора элементарное 282 Угол между векторами 88 Умножение линейного оператора на действительное число 148 - скалярное 78 -- стандартное 79 - элемента (вектора) на число 15 Уравнение канонического вида 250 - характеристическое линейного оператора 157 -- матрицы 155 Уравнения прямой общие III, 58 Форма билинейная 235 - кососимметрическая 237 -- симметрическая 237 - жорданова каноническая 182 -- нормальная 182 - каноническая одношагового итерационного метода 309 - квадратичная 214 Форма квадратичная вырожденная 214 -- знакопеременная 228 - канонического вида 217 -- невырожденная 214 -- неопределенная 228 - неотрицательно определенная 228 - неположительно определенная 228 -- отрицательно определенная 228 -- поверхности (кривой) второго порядка 242 - - положительно определенная 228 - линейная 262 - полилинейная 268 Функционал линейный 262 Функция линейная 262 Числа комплексно сопряженные 1-150, 190 Число обусловленности матрицы 293 - сингулярное линейного оператора 305 -- матрицы 307 - собственное квадратной матрицы 159 - - линейного оператора 158 Элемент единичный 48 - нулевой (нуль) 48 - обратный 48 - противоположный (симметричный) 48 Ядро оператора 131
ОГЛАВЛЕНИЕ Предисловие 5 Основные обозначения О Введение 12 1. Линейные пространства 15 1.1. Определение линейного пространства 15 1.2. Свойства линейного пространства 20 1.3. Линейная зависимость 23 1.4. Свойства систем векторов 26 1.5. Базис линейного пространства 29 1.6. Линейные операции в координатной форме 33 1.7. Размерность линейного пространства 38 1.8. Преобразование координат вектора при замене базиса 42 Д. 1.1. Линейное пространство над полем Р 47 Вопросы и задачи 51 2. Линейные подпространства 55 2.1. Определение и примеры 55 2.2. Пересечение и сумма линейных подпространств ... 60 2.3. Прямая сумма линейных подпространств 64 2.4. Размерность линейного подпространства 66 2.5. Ранг системы векторов 69 2.6. Линейные оболочки и системы уравнений 71 2.7- Прямое дополнение 74 Вопросы и задачи 75 3. Евклидовы пространства 78 3.1. Определение евклидова пространства 78 3.2. Неравенство Коши — Буняковского 82 3.3. Нормированные пространства 84 3.4. Угол между векторами 88 3.5. Ортогональные системы векторов 89 3.6. Ортогональные и ортонормированные базисы .... 92 3.7. Вычисления в ортонормированием базисе 94 3.8. Процесс ортогонализации Грама — Шмидта 95
334 ОГЛАВЛЕНИЕ 3.9. Ортогональное дополнение 100 Д.3.1. Нормы матриц 106 Д.3.2. Метод наименьших квадратов 112 Д.3.3. Псевдорешения и псевдообратная матрица 116 Вопросы и задачи 125 4. Линейные операторы 128 4.1. Определение и примеры линейных операторов .... 128 4.2. Изоморфизм линейных пространств 134 4.3. Матрица линейного оператора 137 4.4. Преобразование матрицы линейного оператора . . . 143 4.5. Произведение линейных операторов 146 4.6. Линейные пространства линейных операторов .... 148 Вопросы и задачи 151 5. Собственные векторы и собственные значения 155 5.1. Характеристическое уравнение матрицы 155 5.2. Характеристическое уравнение линейного оператора 157 5.3. Собственные векторы линейного оператора 158 5.4. Вычисление собственных значений и собственных век- векторов 162 5.5. Свойства собственных векторов 168 Д.5.1. Жорданова нормальная форма 176 Вопросы и задачи 182 6. Самосопряженные операторы 185 6.1. Сопряженный оператор 185 6.2. Самосопряженные операторы и их матрицы 188 6.3. Собственные векторы самосопряженного оператора 192 Д.6.1. Инвариантные подпространства самосопряженного опе- оператора 194 Вопросы и задачи 197 7. Ортогональные матрицы и операторы 199 7.1. Ортогональные матрицы и их свойства 199 7.2. Ортогональные операторы 201 7.3. Матрицы перехода в евклидовом пространстве . . . 205 7.4. Приведение симметрической матрицы к диагонально- диагональному виду 207 Вопросы и задачи 212
335 8. Квадратичные формы 214 8.1. Определение квадратичной формы 214 8.2. Преобразование квадратичных форм 215 8.3. Квадратичные формы канонического вида 217 8.4. Ортогональные преобразования квадратичных форм 220 8.5. Закон инерции 225 8.6. Критерий Сильвестра 228 Д.8.1. Билинейные формы 235 Вопросы и задачи 239 9. Кривые и поверхности второго порядка 241 9.1. Поверхности второго порядка 241 9.2. Изменение системы координат 243 9.3. Упрощение уравнения поверхности второго порядка 245 9.4. Примеры 250 9.5. Классификация кривых второго порядка 256 9.6. Классификация поверхностей второго порядка в про- пространстве 258 Вопросы и задачи 260 10. Элементы тензорной алгебры 262 10.1. Сопряженное пространство 262 10.2. Полилинейные формы 268 10.3. Тензоры 273 10.4. Операции с тензорами 277 Вопросы и задачи 289 11. Итерационные методы ^ 291 11.1. Обусловленность квадратных матриц 291 11.2. QA-разложение. Сингулярное разложение 296 11.3. Описание итерационных методов 308 11.4. Сходимость итерационных методов 315 11.5. Скорость сходимости стационарных итерационных ме- методов 321 Вопросы и задачи 324 Список рекомендуемой литературы 326 Предметный указатель 328
Учебное издание Математика в техническом университете Выпуск IV Канатников Анатолий Николаевич Крищенко Александр Петрович ЛИНЕЙНАЯ АЛГЕБРА Редактор В.И. Трефилов Художник С.С. Водчиц Корректор Е.В. Авалова Оригинал-макет подготовлен в издательстве МГТУ им. Н.Э. Баумана под руководством А.Н. Канагпникова Подписано в печать 18.09.2002. Формат 60x88/16 Печать офсетная. Бумага офсетная Усл. печ. л. 21. Уч.-изд. л. 20,74 Тираж 5000 экз. Заказ 3779 Издательство МГТУ им. Н.Э. Баумана 105005, Москва, 2-я Бауманская, 5 Отпечатано во ФГУП ИПК «Ульяновский Дом печати» 432980, г. Ульяновск, ул. ГЪнчарова, 14 ISBN 5-7038-1754-4 9||785703"81754-