/
Author: Жислин Г.М.
Tags: физика математика линейная алгебра алгебра лекции учебное пособие издательский дом интеллект
ISBN: 978-5-91559-275-8
Year: 2021
Text
г.м. жислин
ЛЕКЦИИ
ПО ЛИНЕЙНОЙ АЛГЕБРЕ
ДЛЯ ФИЗИКОВ И МАТЕМАТИКОВ
ИНТЕЛЛЕКТ
ДОЛГОПРУДНЫЙ
2021
Г.М. Жислин
Лекции по линейной алгебре для физиков и математиков:
Учебное пособие / Г.М. Жислин — Долгопрудный:
Издательский Дом «Интеллект», 2021. - 160 с.
ISBN 978-5-91559-275-8
В учебном пособии подробно излагаются основные вопросы
курса «Линейная алгебра».
Главные особенности этого учебника:
- теория матриц строится как следствие теории линейных
операторов;
- везде, где это не приводит к чрезмерным усложнениям,
рассматриваются не только конечномерные пространства (и
операторы в них), но и бесконечномерные пространства.
Приложение к книге содержит необходимые сведения из
теории определителей.
Учебное пособие отражает опыт Автора, читающего много лет
курсы по методам математической физики, линейной алгебре и
теории групп на факультете «Высшая школа общей и
прикладной физики» ННГУ.
Пособие предназначено для студентов и преподавателей
физико-математических специальностей университетов.
ISBN 978-5-91559-275-8 © 2020, Г.М. Жислин
© 2021, ООО Издательский Дом
«Интеллект», оригинал-макет,
оформление
ОГЛАВЛЕНИЕ
Введение 5
Глава I. Основные понятия теории линейных пространств . . 7
§ 1. Линейные пространства 7
§ 2. Базис и размерность линейного пространства 12
§3. Подпространства. Прямая сумма подпространств 19
§4. Пространства со скалярным произведением 24
§ 5. Гильбертово пространство 32
Глава 2. Линейные операторы и их матрицы 37
§1. Определения. Действия над линейными операторами 37
§2. Матрицы и действия над ними 43
§ 3. Обратные операторы и матрицы: определение, существование,
нахождение 47
§4. Изменение координат векторов и матриц операторов при
изменении базиса. Подобные матрицы 56
§5. Инвариантные подпространства. Собственные вектора и
собственные значения линейных операторов 60
§6. Отыскание собственных векторов и собственных значений. . 71
Глава 3. Жорданова нормальная форма матриц 81
§1. Ранг и дефект линейного оператора 81
§2. Теорема о жордановой нормальной форме 85
§3. Теорема о жордановой нормальной форме (общий случай) . . 92
Глава 4. Линейные операторы в пространствах со скалярным
произведением 99
§1. Сопряженные, эрмитовы и самосопряженные операторы. ... 99
§2. Положительно определенные операторы 107
§3. Унитарные и ортогональные операторы и их матрицы 115
Оглавление
Глава 5. Линейные, билинейные и квадратичные формы ... 123
§1. Линейные и билинейные формы 123
§2. Диагонализация билинейных форм 127
§3. Квадратичные формы и их диагонализация 135
§4. Положительно определенные квадратичные формы 146
Приложение 152
Список литературы 159
ВВЕДЕНИЕ
В настоящем учебном пособии рассмотрены практически все
вопросы, обычно изучаемые в университетских курсах линейной алгебры.
Пособие имеет две особенности.
1. Теория матриц строится как следствие теории линейных
операторов в конечномерных пространствах. Такой подход
представляется естественным и логически обоснованным.
2. Везде, где это не приводит к серьезным усложнениям, в
пособии наряду с конечномерными пространствами рассматриваются и
бесконечномерные пространства и определенные в них операторы.
В частности, это делается при построении обратных операторов,
при изучении свойств унитарных и эрмитовых операторов и в ряде
других мест. Реализуя этот подход, мы всюду отмечаем, какие
отличия возникают в бесконечномерном случае и какие определения
и утверждения сохраняются при уходе от конечномерности.
Причина именно такого подхода — в потребностях приложений и других
университетских курсов (в первую очередь — математической
физики и теории представлений).
Пособие написано замкнуто и чтение его возможно без
знакомства с другими дисциплинами (нужны только некоторые сведения
из теории определителей). Поэтому, может быть, в некоторых
местах изложение излишне подробно (например, при изучении систем
линейных однородных алгебраических уравнений).
Пособие содержит и упражнения для самостоятельной работы.
Их выполнение безусловно будет способствовать усвоению
излагаемого материала.
Небольшой по объему курс линейной алгебры, безусловно,
является вспомогательным по отношению к другим курсам физико-
математического цикла университетского образования. Однако зна-
Введение
чение его не пропорционально велико и это связано с двумя
обстоятельствами.
Во-первых, многие понятия, идеи, методы и результаты
линейной алгебры присутствуют и работают почти во всех
физико-математических дисциплинах.
Во-вторых, — и это, пожалуй, более важно — линейная алгебра,
возможно, больше других университетских курсов учит культуре
математического мышления, способности на простом материале
строить доказательства и умению отличать доказанное от не
доказанного, хотя и кажущегося очевидным. Другими словами,
линейная алгебра прививает мышлению «математический порядок».
А как сказал Леонард Эйлер: «Ежели кто к математическому
порядку не приучен, тот вразумлен быть не может».
В работе принята следующая система нумерации. Параграфы
нумеруются внутри каждой главы, пункты и формулы имеют
первой цифрой номер параграфа, в котором они находятся, второй —
номер пункта, формулы внутри параграфа. Аналогично
нумеруются теоремы и леммы. При ссылках внутри данной главы ее
номер опускается, а при ссылках на параграф, пункт, формулу и т. д.
другой главы обязательно указывается номер главы. Так п. 2.4 и
теорема 5.2 — это соответственно четвертый пункт §2 и вторая
теорема §5 той же главы, где помещены данные ссылки.
ГЛАВА
I
ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ
ЛИНЕЙНЫХ ПРОСТРАНСТВ
§1-
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
п.1.1. Главные понятия нашего курса — понятия поля
и линейного пространства.
Определение. Числовое множество F называется полем,
если для любых а,/3 £ F выполняется а±/3 € F, а/3 € F и а/0 £ F
Примеры полей:
1) F = Ш — множество вещественных чисел;
2) F = С — множество комплексных чисел;
3) F = Fq = {а | а = p/q^p, q —целые числа, q Ф 0} —
множество рациональных чисел;
4) F = F{ = {а | а = а 4- by/ЗУа, Ъ € Fo}.
Задания
1. Показать, что F\ — поле.
2. Выяснить, является ли полем множество
F = {а | а = а
, b e
Определение. Множество К = {x,y,z>...} элементов xyy,z...
называется линейным пространством над полем F, если
I. существует закон, по которому каждым двум элементам
х,у е К ставится в соответствие элемент z € К, называемый
суммой элементов х и у и обозначаемый z — x + y {правило
сложения)',
!)Мы
рассматриваем только числовые поля.
Глава I. Основные понятия теории линейных пространств
II. существует закон, по которому каждому элементу х £ К
и каждому скаляру (числу) а £р ставится в соответствие
элемент z £ К, называемый произведением а на элемент х и
обозначаемый z = ах (правило умножения);
и если законы I и II обладают следующими свойствами:
I. a)x + y = y + x для Ух, у £ К;
б) (x + y) + z = x + (y + z) дляУх,у,г£К\
в) существует элемент в £ К такой, что х+0 = х для Ух £ К;
элемент в называется нуль-вектором;
г) для Ух £ К существует элемент х £ К такой, что x-Vx — в;
элемент х называется противоположным для х;
И. а)А-х = хдляЧхеК\
б) а(0х) = (а/3)х для У х £ К, Уа,0 £ F;
в) (а 4- /?)* = ах + fix для Va, 0 е F, Ух £ К;
г) а(х + у) = ах 4- осу для Va £ F, Vx,# € Я.
Элементы линейного пространства называются векторами.
Приведем примеры линейных пространств.
1. /Г = Кз{Уг} — множество векторов в трехмерном
пространстве {на плоскости} над полем F = R с обычными операциями
сложения векторов и умножения вектора на скаляр.
2. К — Кп = {х |х = (аь ... ,art),Va/ G F, / = 1,2, ... yn) —
множество наборов п чисел с операциями сложения векторов и
умножения вектора на скаляр, определенными следующими
соотношениями: для х — (аь ... ,ап), у = (0\, ... ,0п) € Кп, А € F,
полагаем х + у = (aj + 0\, ..., а„ + 0п), Ал: = (Aai, ..., Хап). Нуль-вектор
пространства Кп: в = (0,0, ..., 0), противоположный элемент для х
есть х = (—аь -#2» • • •» — otn).
3. /С = С[ай] — пространство непрерывных на отрезке [ab]
функций x(t), F = R, с обычными законами сложения функций и
умножения функции на скаляр.
4. К = Но — множество решений X = (£ь • • • ,£«)> £/ € F,
однородной алгебраической системы т уравнений с коэффициентами из F:
(1.1)
с теми же законами I, II, что в /Сп.
Легко проверяется, что условия I а)-г), II а)-г) выполняются
для всех примеров 1-4.
§ 1. Линейные пространства
Задание
Выяснить, являются ли линейными пространствами следующие
множества функций с естественными законами сложения функций и
умножения функции на скаляр, F — R:
а) множество С1 [0,1] — непрерывно дифференцируемых функций на
отрезке [0,1];
б) К = {x(t) | x(t) е С[0,1] (см. пример 3), *(0) = 0};
в) К = {x(t)\x(t) в С1 [О,1], х(1/2) = 2x41)};
г)К= {x(t)\x(t) е С[0,1], х(1/2) = 1/2};
д)К= {x(t) | x(t) е С1 [0,1], jc'(OJ) = 0,7}.
п.1.2. Возвращаемся теперь к случаю произвольного
линейного пространства К над полем F. Многие из фактов, которые для
конкретных пространств очевидны, в случае абстрактного
линейного пространства требуют доказательства. Например, в
конкретных пространствах нулевой и противоположный элементы —
единственные, Ох = 0 при \/х е К, ав = в при Va € F,
противоположный элемент х для х — это (—\)х. Докажем эти факты в общем
случае.
Пусть в\ и в — нуль-вектора в К. Тогда в силу определения
нуль-вектора имеем
в\ 4- в = в\ (ибо в — нуль-вектор)
в\ +6 = в (ибо 01 — нуль-вектор);
значит, 0i = 0, т. е. нуль-вектор — единственный. Далее, пусть х £ К
их,х\ — противоположные элементы для х. В силу I б)
(х + х) + х\ = х + (х + j?i).
Так как х и х\ — противоположные вектора для jc, то отсюда
получаем 0 -f х\ = х + 0, т. е. х\ = х и, значит, противоположный
элемент вектора — единственный. Докажем, что Ох = 0. Имеем
Но в силу Ив) (1 + 0)х — jc-I-Ojc. Таким образом, получаем, что
х = х 4- Ох. Прибавим к обеим частям этого равенства вектор х,
противоположный х. Получим
х + х = (л: + Ох) + х = (Ох + х) + х = Ох + (х + х) = Ох + в = 0ху
т. е. 0 = Ох.
10 —' Ь- Глава L Основные понятия теории линейных пространств
Наконец, покажем, что (—\)х = х. Вычислим (1 + (—1))х.
Имеем (1 + (—1))л: = 1 • х + (—1)х = х 4- (—1 • х), но левая часть
этого равенства равна Ох = в и, значит, х + (—х) = 9, т.е. (—1)х = х.
Далее будем писать вместо (—1)х просто — х. Из приведенных
рассуждений следует, что в линейном пространстве наряду с
операцией сложения можно определить операцию вычитания как сложение
с противоположным вектором.
Задание
Доказать, что ав = в при Va € F.
п.1.3. Пустьлгь • • • ,Хт — фиксированные вектора из/С, а\, ... ,ат —
фиксированные числа из F.
Определение. Линейной комбинацией векторов х\, ...,хт
называется вектор у = YZ=\ aiXi-
Беря разные наборы аь ... ,ат, мы получаем различные
линейные комбинации векторов х\, ...,хт.
Определение. Линейной оболочкой С{х\} ... }хт} векторов
х\,...,хт называется множество всех линейных комбинаций
векторов х\,...9хт:
С{хи ...,хт} =
Задание
Докажите, что £{х\,... ,хт} есть линейное пространство над полем F.
Определение. Вектора xi,...,jcm из К называются
линейно зависимыми, если Заь ... ,ат € F так, что J2?=\ aixi = в и
Y^L\ \&i\ ф 0 (т. е. не все коэффициенты а/ нулевые).
Вектора х\,... ,хт из К называются линейно независимыми,
если равенство Yl?=\ aixi = & выполняется только при
ах = а2 = ... = ат = 0.
Рассмотрим пример. Пусть Кп = {х \х = (^, ... ,£я), Vf7- G F} и
xi = (£и, ^2/, •. • £m)> i = 1,2,..., m — какие-то вектора из К.
Покажем, как определить, будут ли вектора х\,... %хт линейно
зависимыми или нет. Составим линейную комбинацию у = Yl?=\ cixi этих
векторов и попробуем обратить ее в нуль-вектор. Очевидно,
§1. Линейные пространства -Jb- И
и, значит, равенство у = в—(О,0, ..., 0) эквивалентно системе равенств
frc, = 0, /=1,2,..., п. (1.2)
Соотношения (1.2) — это система п однородных уравнений с т
неизвестными си... ст. По определению, вектора х\у...,хт будут
линейно зависимыми, если система (1.2) допускает ненулевое
решение. Выясним, когда это происходит.
Матрица ||Л|| (таблица коэффициентов) этой системы имеет вид
^и £12 • • • £ы\
S22 • • • ц2/п I /1 о\
(1-3)
К£п\ £л2 • • • £пт/
Определение. Назовем рангом р(\\А\\) матрицы \\A\\
наибольший из порядков ее миноров не равных нулю.
В пп. 2.4 и 2.5 будет доказано, что для существования
ненулевого решения системы (1.2) необходимо и достаточно, чтобы ранг
матрицы ||Л|| был меньше числа неизвестных, т.е. чтобы
выполнялось неравенство
р:=р(||Л||)<т. (1.4)
При т = п данное требование означает, что
A = det||i4||=O. (1.5)
При т > п условие (1.4) выполняется автоматически, ибо
матрица ||Л|| вообще не содержит миноров m-го порядка.
Следовательно, в обоих этих случаях вектора хи ...,хт — линейно зависимы.
Задание
Привести примеры линейно зависимых и линейно независимых систем
векторов jci , ... ,хт при т < п.
п.1.4. Изучим некоторые свойства линейно зависимых и
линейно независимых систем.
1. Вектора х\, ...,лгт линейно зависимы тогда и только тогда,
когда среди них найдется такой вектор Xj9 который является
линейной комбинацией остальных векторов, т. е. когда для некоторых
чисел ds e F
х}= £ dsxs. (1.6)
12 —'ly- Глава I. Основные понятия теории линейных пространств
Действительно, если (1.6) выполнено, то Yl™=\asxs = в, где
as = ds, s^/, ay = — 1, т. е. вектора jci, ... txm — линейно
зависимы. С другой стороны, если вектора х\,...,хт — линейно
зависимы, то 3 as € F такие, что
т
Х>Л = 0 (1.7)
s=l
и Х^Г=1 lasl > ^- Пусть / таково, что aj ф 0. Тогда, поделив (1.7)
на а/, получаем из (1.7)
m
где ds = —as/a/, т.е. (1.6) доказано.
2. Если вектора *i,...,*„, линейно независимы, то и
вектора любой подсистемы этой системы линейно независимы.
Действительно, рассмотрим произвольную подсистему из х\,...,хт.
Для простоты считаем, что это x\,...,Xk, k<m. Тогда, если
вектора x\,...,Xk — линейно зависимы, то 3ai,...,a^, az G F,
Es=i la«| > 0, такие, что ^=i а*х* = *• а» значит, и ££1, asxs = 0,
где ak+\ = (*k+2 = ... = am = 0 и ]ГГ=1 |as| > 0. Таким образом,
предположив линейную зависимость векторов какой-либо
подсистемы, мы получили, что вектора х\, ...%хт всей системы линейно
зависимы. Значит, системы линейно независимых векторов не
имеют линейно зависимых подсистем.
Задание
1. Покажите, что у линейно зависимой системы векторов подсистемы
могут быть как линейно зависимы, так и линейно независимы.
2. Докажите, что система векторов х\,. ..,**, содержащая
нуль-вектор, линейно зависима.
§2. БАЗИС И РАЗМЕРНОСТЬ
ЛИНЕЙНОГО ПРОСТРАНСТВА
п.2.1. Определение. Говорят, что вектора в\,..., еп € К
образуют базис в линейном пространстве К над полем Fy если
Б1. Для \/хеК 3£ь ...,£л eF так, что
Б2. Вектора е\, ...,еп линейно независимы.
§2. Базис и размерность линейного пространства —1\у- 13
Примеры
1. В пространстве Кп базис образуют вектора
ех = (1,0,0 0), е2 = (0,1,0, ...,0), ..., еп = (0,0,..., 1).
Действительно, произвольный вектор х = (£ь ... ,£л) £ Кп можно
разложить по векторам е\,..., еп:
п
х = yy&g/
/=1
и вектора ег линейно независимы, ибо Ya=\ cie( = (^ь^2, • • • >Сп) и
ПОЭТОМУ ]С?=1 С^г = ^ ЛИШЬ ПрИ Ci = С2 = . . . = Сп = 0.
2. В пространстве К полиномов Pn(t) степени не выше чем п над
полем F = R в качестве базиса можно взять ei = 1, е2 = *,..., вл = tn~l,
Задание
Проверить, что вектора е\, ...уеп+\ действительно образуют базис.
В общем случае нахождение базиса в конкретных
пространствах не так просто, как в рассмотренных примерах. Мы вернемся
к этому вопросу в п. 2.4.
Определение. Коэффициенты &, i = 1,2,... ,/г, в разложении
(2.1) называются координатами вектора х по базису в\,... ,еп.
Покажем, что координаты определяются вектором однозначно.
Предположим, что вектор х G К имеет в базисе е\у ...,еп два
набора координат: £ь ... ,£„ и £ь ... ,£п, т. е.
Отсюда следует, что
п п
~~ - li)et = в.
i=\ i=l i=l
Так как вектора базиса линейно независимы, то из последнего
равенства следует, что & — £,• = 0, / = 1,2, ..., л, т. е. & = £,- и, значит,
координаты вектора определяются (самим вектором и базисом)
однозначно. Зная координаты векторов, мы можем заменить действия
с векторами действиями с координатами. Действительно, если ко-
14 —fly- Глава L Основные понятия теории линейных пространств
ординаты векторов х и у суть £ь • • •»6i и rj\, ..., rjni то координаты
суммы векторов х + у равны fi -F- тд,£2 + 42i • • •.fn + ffo, иб°
1=1 t=l i=l
а координаты вектора ал: при Va € F — это a£i,а£г> • • •, &£п.
п.2.2. Покажем, как, зная координаты векторов, можно определить,
являются ли эти вектора линейно зависимыми. В пространстве К с
базисом ей • . •, еп рассмотрим систему т векторов xu i = 1,2,..., m,
координаты которых суть £н, £2/. .... Спь т. е. х,- = YJj=\ £>jiei-
Попробуем обратить в нуль-вектор линейную комбинацию этих векторов
с какими-то коэффициентами с/ € F. Имеем:
(^)'(2-2)
Так как вектора ву линейно независимы, то равенство (2.2) будет
верно, лишь когда коэффициенты перед векторами е} равны нулю:
f = O, /=1,2,..., п. (2.3)
Мы получили систему п линейных однородных уравнений с m
неизвестными с\,...,ст и заданными коэффициентами £),-. Но эта
система совпадает с системой (1.2) п. 1.3 и поэтому мы можем
воспользоваться сделанными там выводами. Пусть ||Л|| — матрица
этой системы (см. (1.3)) и Д = det ||Л|| при т = п. Согласно п. 1.3
при т> п а также при т = п и Д = 0 существует ненулевое
решение с\ ст системы (2.3). Значит, в этих случаях вектора
х\, ... Ухт — линейно зависимы. При т = п и Д ф 0 система (2.3)
имеет только нулевое решение и, следовательно, вектора х\у... ,хт
в этом случае линейно независимы. Наконец, при т < п вектора
х\, ...,хт линейно зависимы, если ранг р(||Л||) матрицы ||Л||
меньше т и линейно независимы, если р(||Л||) > т.
Из наших рассуждений, в частности, следует, что если базис в
пространстве К состоит из п векторов, то любые т векторов при
т> п линейно зависимы.
п.2.3. Определение. Говорят, что размерность линейного
пространства К равна п и пишут dim К = п, если в К найдется
система п линейно независимых векторов, а любые т векторов
§2. Базис и размерность линейного пространства —11/- 15
при т> п будут линейно зависимы. Если для любого целого
N > О в К можно найти N линейно независимых векторов,
то говорят, что пространство К бесконечномерно и пишут
dim К = +оо.
Лемма 2.1. Размерность пространства К равна числу
элементов базиса.
Действительно, если базис состоит из п элементов, то dimК>п,
ибо вектора базиса линейно независимы. С другой стороны,
неравенство Aim К > п — невозможно, ибо в силу п. 2.2 любые т
векторов из К при т> п линейно зависимы.
Лемма 2.2. Если dim К — п, то любые п линейно
независимых векторов из К образуют базис.
Действительно, пусть вектора е\,..., еп из К — линейно
независимы их — произвольный вектор из К. Так как dim К = /г, то
вектора еь#2, ..*,еп,х — линейно зависимы. Значит, 3ct, / = 0,1, ...,п,
сх е F, такие, что $^=о \Ci\ > 0 и
£>е, + со* = 0. (2.4)
Если коэффициент со = 0, то Yli^i \ct\ > 0 и из (2.4) Y?i=\ ciei — О-
Но это невозможно, ибо вектора е\, ...,еп — линейно независимы.
Значит, со т^ 0 и из (2.4) мы получим
f
Таким образом, произвольный вектор х G К раскладывается по
линейно независимым векторам е\,..., еп. Значит, е\Л..., еп — базис в К.
Лемму 2.2 можно использовать для построения базиса в л-мер-
ном пространстве.
Лемма 2.3. Пусть /ь ... ,/т — произвольные линейно
независимые вектора в пространстве К над полем F ит < ntn= dim К.
Тогда можно указать вектор хеК так, что вектора f\,..., /т, х —
линейно независимы.
Доказательство. Предположим, что при Ух€ К вектора /ь ...
... ,/т> х линейно зависимы. Тогда существуют константы со, си ...
.. • ,ст € F, ЕГ=о М > 0, такие, что
f 0. (2.5)
16 Ju Глава L Основные понятия теории линейных пространств
Если со = О, то Y^iLi М > О и в силу (2.5) J2?=\ cifi = О* что
невозможно в силу линейной независимости векторов f\ fm. Значит,
со ф О и из соотношения (2.5) мы получаем, что
т
где 6- = -£. (2.6)
со
Так как х — произвольный вектор из К и вектора /i,...,/« —
линейно независимы, то из (2.6) следует, что вектора /ь ... ,/т
образуют базис в К. А это невозможно, ибо т < п. Значит,
предположение о том, что система векторов /ь ...,fm,x линейно зависима
при Vx e К неверно и лемма доказана.
Для построения базиса в К можно взять произвольный вектор
е\ € /Г, е\ Ф 0, и, последовательно применяя лемму 2.3, дополнить
его до линейно независимой системы е\>..., еп, состоящей из п
векторов. В силу леммы 2.2 набор векторов е\, ...,еп есть базис в К.
п.2.4. Рассмотрим теперь важный для приложений пример
определения размерности пространства и построения в нем базиса. Пусть
К = Но — пространство решений (&, ... ,£„) линейной однородной
системы
(2.7)
над полем F (см. п. 1.1, пример 4). Обозначим таблицу
коэффициентов (матрицу) системы (2.7) через
(
и пусть р = р(||Л||) — ранг матрицы ||Л||. Очевидно 0 < р < п.
При р = 0 все коэффициенты ац в (2.7) — нулевые и поэтому
любой набор чисел (£ь • • • »£л) из поля F является решением
системы (2.7), т. е. Но = {х | х = (^, • • •»60, V& е Z7} = #л.
Следовательно, в качестве базиса в Но можно взять векторы е\ = (1,0, ...,0),
е2 = (0,1,0, ...,0), ..., еп = (0,0, ...,1) и ШтЯ0 = п.
При р = п ъ системе (2.7) существует подсистема из п
уравнений с не нулевым определителем, из которой следует, что
единственное решение ее (и (2.7)) — это £j = £2 = • • • = 61 = 0.
Поэтому при р = п dim Но = 0. В силу сказанного далее рассматриваем
только случай 0 < р < п. Только для простоты предположим, что
§2. Базис и размерность линейного пространства
17
минор (один из миноров) р-ro порядка не равный нулю, расположен
в левом верхнем углу матрицы
5*0.
(Иногда этот минор называют базисным.) Запишем первые р
уравнений системы (2.7) в виде
(2.8)
i=p+l
и рассмотрим соотношения (2.8) как систему линейных
неоднородных уравнений относительно £ь ...,£р при заданных £р+ь ...,£л.
Так как определитель Др системы (2.8) не равен нулю, то
каждому фиксированному набору чисел £р+ь ...,£л будет отвечать
единственное решение £ь£г» •••»£/> системы (2.8) (с известными
правыми частями). В качестве £р+ь...,£л будем
последовательно брать наборы £^]_j, ..., $, j = 1,2, ..., п - р, следующего вида:
£р+/ = 1» €® = 0, i ^ р + у, f = р + 1,..., п. Полученное для /-го
набора решение системы (2.8) обозначим через (^\ ...,£р ) и
допишем к нему значения f^, ...,£п , ПРИ которых оно найдено.
Таким образом, мы получим (п - р) л-компонентных векторов
Xj = (^(у),... ,£py),fp]_1,... ,$), j = 1,2,..., n - p, где у каждого
вектора Xj все компоненты £,- = 0 при / > р + 1, кроме f^L- = 1.
Запишем эти результаты в виде таблицы
х2
■Л-п—р
6
£,(2)
л(«-Р)
si
6
сО)
S2
е(2)
S2
Л«-Р)
S2
s12)
ф-р)
1
0
0
47Н-2
0
1
0
...
0
0
1
По построению, вектора Хг являются решениями системы (2.8),
т.е. первыхр уравнений системы (2.7), причем в силу выбора
значений ^f\ i>p + l
^^ * = l,2,...,p; /=l,2f...fn-p. (2.9)
Л-
18 JL Глава L Основные понятия теории линейных пространств
п.2.5. Теорема 2.1. Вектора Л), / = 1,2,..., л - р, образуют
базис в пространстве решений системы (2.7).
Доказательство. Для справедливости теоремы 2.1 надо
установить, что
а) вектора Xj линейно независимы;
б) любое решение X = (£ь .. .£„) системы (2.7) можно
представить в виде линейной комбинации векторов Xj\
в) вектора Xj удовлетворяют всем уравнениям системы (2.7), а
не только первым р.
Докажем утверждения а)-в). Составим линейную комбинацию У
векторов Xj
п-р
Из определения векторов Xj следует, что в векторе У= (гц, т/2,. • •, Vn)>
очевидно, 7//Н-1 = сь ^р+2 = £2, • • • >Vn = Cn-p- Поэтому равенство
У = в = (0,0, ..., 0) возможно только при с\ = С2 = ... = сп-р = 0.
Значит, вектора Xj линейно независимы, т. е. а) — доказано.
Докажем б). Пусть X = (£ь£2» • • • £р»£p+i> • • •»£л) ~~
произвольное решение (2.7). Тогда, очевидно, X есть решение и (2.8).
Покажем, что
_ п~р_
5=1
Положим
у X ^ £ у ^ у у
s=l
Так как X и У удовлетворяют системе (2.8), то и вектор
Z — (£ь • • • • fл) удовлетворяет (2.8). По построению, ^p+i =^р+2 = .. .
... =^я = о. Следовательно, после подстановки решения Z в (2.8)
правые части уравнений (2.8) будут равны нулю. Поэтому из
полученной однородной системы (с ненулевым определителем Ар) будет
следовать, что & = & = • • • = £р = 0. Таким образом, Z = (0,0,..., 0)
и (2.10) доказано. Значит утверждение б) выполняется.
Докажем в). Произвольно фиксируем числа /, 1 < / < п — р> и 5,
5 > р + 1, и покажем, что решение Xj системы (2.8) удовлетворяет
s-му уравнению системы (2.7), т.е. что
£а«№ =-ач»1 (2Л1)
1=1
§3. Подпространства. Прямая сумма подпространств —'ь- 19
(здесь мы учли, что ^ = О, i = р +1, ..., л, / ф / + р, фр = 1.)
Положим k = р + / и рассмотрим систему
*=l,2,...,p;s, (2.12)
состоящую из (р + 1) однородных уравнений с (р + 1)
неизвестными £ь...,£р,&. Так как ранг матрицы ||Л|| равен р, а матрица
системы (2.12) имеет порядок (р + 1), то ее определитель равен
нулю. Следовательно, у системы (2.12) существует ненулевое
решение Z = (£ь ..., £р, &)• В этом решении & ^ 0, ибо при & = 0 из
первых р уравнений системы мы получили бы £i = £2 = • • • = €р = О
и Z = (0,0, ..., 0), что противоречит выбору Z. Поделим все
уравнения системы (2.12) на & и положим щ = &/&. Получим
р
5>«»й = -аЛ1 f = l,2,...,p; s. (2.13)
Из первых р уравнений системы (2.13) в силу (2.9) следует, что
fy = ^\ i = 1,2, ... ,р, а уравнение с номером * = s показывает, что
числа ^ удовлетворяют уравнению (2.11). Таким образом Xj есть
решение не только первых р уравнений системы (2.7), но и любого
другого уравнения этой системы. Утверждение в) доказано и тем
самым теорема 2.1 доказана полностью.
Следствие. Размерность пространства Но решений системы (2.7)
равна п- р(\\А\\).
Замечание. Следствие описывает и случаи р(\\А ||) = 0 (dim Ho = n)
и р(\\А\\) = п (dimНо = 0).
§ 3. ПОДПРОСТРАНСТВА.
ПРЯМАЯ СУММА ПОДПРОСТРАНСТВ
п.3.1. Введем весьма важное понятие подпространства.
Пусть К — линейное пространство над полем F.
Определение. Множество векторов Н называется
подпространством пространства К над полем F, если Н С К и Н
является пространством над тем же полем F относительно тех же
законов сложения векторов и умножения векторов на скаляры
из /\ что и пространство К.
20 —II- ГлаваI. Основные понятия теории линейных пространств
Таким образом, для того, чтобы множество Я из К было
подпространством, должны выполняться условия I, II, 1а)-г), Иа)-г) §1,
где вместо К надо написать Я. Однако фактически для того, чтобы
множество Я было подпространством, достаточно выполнения
лишь условий I и II:
I) для Vх,у € Я выполняется х + у £ Я;
И) для Va € F, Ух £ Н выполняется ах € Я.
Действительно, требования 1а), б) и Иа)-г) выполнены для
векторов из Я и скаляров из F, поскольку они выполнялись в К, а
Я С А". Существование нуль-вектора в Я следует из II и
соотношения в = Ох £ Я при х £ Я. Существование противоположного
элемента х для х £ Я вытекает из II и соотношения Зс = (—\)х £ Я
при х £ Я.
Таким образом, подмножество Я из /С — подпространство, если
выполняются требования I, II. Приведем примеры подпространств.
1. Пусть хи ...,хтеК9 Н = С{хи ...,хт}.
2. К = Кп, Н = Но — множество решений системы (2.7).
3. К = С[аЬ], Я = {*(*) | *(*) £ /С, jc(a) = *(&)}.
4. /f= V3, Я= Уг (Уз и V2 — векторные пространства в /?3 и в /?2).
Заметим, что при Н С К выполняется dim Я < dim К.
Действительно, если dim Я = dim К — п, то в Я есть п линейно
независимых векторов х\, . ..,хл. В силу леммы 2.2 эти вектора образуют
базис и в К и в Я и значит £{xi,... ,хп} = К = Я, что неверно.
Поэтому dim Я < dim К.
п.3.2. Пусть К — линейное пространство над полем F и Яь ...
..., Ят — некоторые подпространства /С.
Определение. Говорят, что линейное пространство К над
полем Fразлагается в прямую сумму подпространств H\,H<l, ...,Ят,
и пишут
£ (3.1)
если
1) для Vx e К найдутся такие х, € Я/, что
x = f>; (3.2)
2) для \/х £ К разложение (3.2) единственно, т.е. если
выполняется (3.2) и кроме того х = YmL\ ** для каких-то Xi € Я,-,
то Зс/ = Х(у i = 1,2, ..., т.
§3. Подпространства. Прямая сумма подпространств J\/- 21
Требование 2) эквивалентно требованию
2а) разложение нуль-вектора в по векторам из Я,- единственно,
т.е.
т
« = £**.
где Oi — нуль-вектор в пространстве Я,2).
Задание 1
Докажите равносильность условий 2) и 2а).
Из условия 2) вытекает, что Я, П Я; = {0} при i ф /.
Действительно, если вектор у € Я,- П Я;, то мы можем записать
y = yi + 0i = 0l+yh (3.3)
где #s — это вектор #, взятый из пространства Я5, 5 = /,/. Если
у ф 0у то равенство (3.3) противоречит требованию 2) и, значит,
у = в. В связи с этим возникает мысль о возможности замены
условия 2) в определении прямой суммы подпространств на условие
26) Я,ПЯу = {0}> i*h <\/ = l,...,m.
Однако при т > 3 выполнение 26) не влечет справедливость 2).
Рассмотрим пример. Пусть К = V% — множество векторов на
плоскости х,у, F = R. Пусть вектора е\ и в2 направлены по
координатным осям,
Нх = {ае{ | Va € М}, Я2 = {ш>2 I Va € R},
Ясно, что Hi ПЯУ = {^}, / ф /. В то же время условие 2) не
выполняется, ибо, например, для вектора х = е\ -Ь e<i справедливы два
разложения
\2 х и х =
Задание 2
Докажите, что при т = 2 условия 2) и 26) эквивалентны.
п.3.3. Опишем один из распространенных способов разбиения
пространства К в прямую сумму подпространств.
2) Разумеется в\ = 02 = • • • = От = 0, ибо нуль-вектор в пространстве
единственный. Нижний индекс указывает лишь номер пространства,
откуда «взят» нуль-вектор.
22 -J\j- Глава I. Основные понятия теории линейных пространств
Пусть е = (е\у... ,еп) базис в К. Разобьем множество базисных
векторов на т подмножеств G/, / = 1,2,..., т, так, что G,- nGj = 0
при / ^ /, U^j Gi = е. Обозначим базисные вектора из е, попавшие
в G,-, через е{ , ..., е®, где ki — число элементов множества G,-. По
построению, X)/li *i = n- Положим
я.^^Г <#}
и покажем, что
f2 (3.4)
Пусть х € К. Так как вектора е^\ ,.., ej^, ..., е\т\ ..., е^ — это
все базисные вектора вьвг, -..,еп (в других обозначениях и,
возможно, расположенные в другом порядке), то найдутся такие
числа $\ что
т ki
* = УУЧ1'Ч°- (3.5)
1=1 S=l
Положим
s=l
Тогда в силу (3.5)
x = Y,xt, (3.6a)
где Х[ € Hi, и, значит, условие 1) п. 3.2 выполнено. Проверим
выполнение условия 2).
Допустим, что кроме (3.6а) для каких-то векторов jc£-, x( e Hi,
справедливо представление
т
* = £*,•. (3.66)
Тогда в силу (3.6а), (3.66)
i-xt) = 0. (37)
Так как Xi — Xi G Я/, то разлагая этот вектор по базису е\1\ ...,е^
пространства Я/, получим, что
I>s 1)е\°. (3.8)
s=l
§3. Подпространства. Прямая сумма подпространств —f\y- 23
Подставляя (3.8) в (3.7) имеем
ТП ki
/=1 s=l
Это равенство — разложение нуль-вектора по базису пространства К
и, значит, все коэффициенты rjil) = 0. Поэтому в силу (3.8) jc,- = J/,
/ = 1,2,..., m, и, значит, требование 2) п. 3.2 выполнено и тем
самым (3.4) доказано.
Проведенные рассуждения позволяют решить, например,
следующую задачу. Пусть Н\ — подпространство из К. Надо построить
подпространство #2 С К так, что К = Н\ Ф#2. В силу
сказанного, для этого достаточно произвольный базис ей •••>£*
пространства Н\ дополнить любым образом до базиса е\9..., е^ еи+и • • •. вп
в К и положить Яг = C{ek+\, ..., еп}.
п.3.4. В п. 3.3 установлено, что разбив множество базисных
векторов на не пересекающиеся множества G; и взяв затем
линейные оболочки векторов каждого множества G,-, мы получим
подпространства Я,, в прямую сумму которых разбивается пространство К.
Пусть теперь нам дано разложение (3.1) и в каждом
пространстве Hi выбран произвольный базис е\\ ..., е£.\ Покажем, что век-
топя р - (р{1) р{1) p{i) p(i) р(т^ р{т)
базис в К. Пусть х £ К. В силу условия 1) п. 3.2 3 jc/ G Я/ так, что
т
* = £>. (3.9)
1=1
Разлагая Х[ по базису пространства Я,-, получим
JC/ = E^°eJ°- (3-Ю)
S=l
Подставляя (3.10) в (3.9), получим разложение произвольного
вектора х по векторам е^\ s = 1,..., ft,-, / = 1,2, ..., т
Покажем, что вектора системы в линейно независимы. Если бы это
было не так, то для некоторых констант с® € F, Yl?=\ Z)s=i \с^\ > О»
мы имели бы, что
<'М° = 0- (3-12)
1=1 S=l
24 —'b- Глава /. Основные понятия теории линейных пространств
Отсюда в силу условия 2) (или 2а) п. 3.2
Л/
V^/Л0л(0 — Й /—19 m f4 1ЧЪ
s=l
Поскольку при каждом фиксированном значении i вектора в{'\ е%\ ...
... ,е£. линейно независимы, то из (3.13) следуют равенства
с® = О, s = 1,2,..., *,-, / = 1,2,..., т (3.14)
и, значит, вектора системы е линейно независимы. Отсюда и из (3.11)
следует, что набор векторов е — это базис в ЛГ, что и требовалось
доказать.
Отметим, что так как число элементов базиса равно
размерности пространства, то из наших рассуждений следует, что при
выполнении (3.1)
т
dimAT = y^dim//,-,
т. е. сумма размерностей пространств Hi в прямой сумме (3.1) равна
размерности К.
§4. ПРОСТРАНСТВА
СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ
п.4.1. Изучаемые нами линейные пространства
моделируют многие конкретные пространства (см. § 1). Однако в
некоторых из них (например, V21 ^з) имеются понятия, аналоги которых
нами еще не вводились: это скалярное произведение, длина вектора
и ряд других. Введем их.
Определение. Говорят, что в пространстве К над полем F
задано скалярное произведение (х,у), если любой паре элементов
х,у € К ставится в соответствие число (х,у) е F и если это
соответствие обладает следующими свойствами: для Vx,y,z € К
и У А е F выполняется
2)
4) (х, х) > 0 при хфв.
Свойства 2) и 3) означают линейность скалярного произведения
по первому аргументу. Отметим, что в силу 1) из 2) следует, что
(х,у + г) = (у + г,х) =
§4. Пространства со скалярным произведением -J\y- 25
и что
(*, Ху) = (\уУх) = \(у,х) = Х(х,у).
Далее, в силу 3) для М х € К
(в,х) = (Ojc,x) = 0(х,х) = 0. (4.1)
Из свойств 1)-3) вытекает, что для \/xiyyj£K и a/t/3y€F,
/ = 1,..., я, / = 1,2,... ,р справедливо равенство
ЕЕ <*4(*Ы//). (4.2)
i=l у=1
Скалярное произведение определяется одинаково как в
конечномерном, так и в бесконечномерном пространствах и поэтому все
вышесказанное относится и к случаю dim К < +оо и к случаю dim К — +оо.
Если dim/С<+оо и вектора е\%..., еп образуют базис, то скалярное
произведение векторов х = X^Li &£i и # = ]C/=i ^/e/ B силу (4.2)
будет выражаться формулой
Приведем примеры скалярных произведений.
1. Пусть К = Кп. Тогда при х = (£ь .. .,£„), г/ = (тд, • • •, Чл).
^•,77/ € F, можно положить (jc, у) — Y2i=\ &Vi- Заметим, что если
поле F есть множество R вещественных чисел, то в обозначениях
вместо Кп иногда пишут /?л, а если F есть множество С
комплексных чисел, то вместо Кп часто пишут Сп.
2. К = C2[ab] = {*(*) | jba \x(t)\2dt < +00}3>, F = С. Тогда при
C2[ab] полагают
3. ЛГ= {;с(0 | \x(t) G Cl[ab]f x'{a) = x(a)}, F = C
3)B определении пространства Сч\аЬ\ интеграл берется в смысле
Лебега (Л) [7]. В нашем курсе мы ограничиваемся функциями из Сч\аЬ\
квадратично интегрируемыми по Риману (Р), учитывая, что
интегралы (Р) и (Л) для этих функций совпадают.
26
Глава I. Основные понятия теории линейных пространств
Задание
Проверить, что в приведенных'примерах формулы для (х,у)
действительно определяют скалярное произведение.
Разумеется, введение скалярного произведения в линейном
пространстве неоднозначно. Так, для х,у € Кп можно положить, например,
m=l
Задание
Найти необходимые и достаточные условия для набора чисел jm € F
для того, чтобы формула
т=1
определяла скалярное произведение в Кт.
п.4.2. Введем в произвольном линейном пространстве со
скалярным произведением понятие нормы вектора, обобщающее
понятие длины вектора в V<i и 1/з-
Определение. Нормой \х\ вектора х £ К называется корень
из скалярного произведения х на х:
В силу свойств скалярного произведения, ||х|| > 0 при х ф в и
| = 0. Для конкретных пространств имеем:
\\x\\ =
\
х =
о
\\x{t)\2dt при х£С2[а,Ь],
при хеКп.
i=\
Вектор х называется нормированным, если ||jc|| = 1. Если ||л:|| Ф 1
и х ф в, то вектор х можно нормировать, положив х = х- \\x\\~1.
Тогда \\x\\ = \/(jc,jc) = у(х,х) • ||x||~ = 1.
Выведем ряд полезных неравенств для скалярного произведения
и нормы.
§4. Пространства со скалярным произведением —'ь- 27
Утверждение 1. Для Ухуу€ К выполняется неравенство Коши-
Буняковского:
|(*,*/)| < 1И1 • \\y\\, (4.4)
где знак равенства имеет место только если вектора х и у линейно
зависимы.
Утверждение 2. Для Vjc,j/ e К выполняются неравенства
треугольника:
(4.5а)
(4.56)
где знак равенства имеет место, только когда вектора х и у линейно
зависимы и (х, у) > 0.
Докажем утверждение 1. Если вектора х и у линейно зависимы,
то в силу п. 1.44) или х = \\у или у = \2Х для каких-либо Ai, A2 £ F-
В обоих случаях, очевидно,
Далее считаем х и у линейно независимыми и положим z = ax+j3y,
где а = \\y\\ , /3 = — (хуу). Очевидно, ||г|| > 0, так как при ||г|| = О
мы имели бы z = в и в силу линейной независимости векторов х и у
выполнялось бы равенство а = 0, что невозможно, ибо у ф в
вследствие линейной независимости х и у. Имеем
||z||2 = (ах + 0у, ах + ру) =
= \а\2(ху х) + ра(у, х) + а0(х, у) + \Р\2{у, у) =
Так как ||г|| > 0, то выполняется ||jc|| \\y\\ — \(хуу)\ > 0 и (4.4)
доказано со знаком строго неравенства.
Применение неравенства (4.4) для конкретных пространств
приводит к ряду известных неравенств. Например, при х — (£ь ..., £п),
y = (rju ...,rfo) GA" имеем
1С*. 0)1 =
\
\
t=\
4) Напоминаем, что при ссылках внутри одной главы мы не указываем
ее номер. Поэтому п. 1.4 — это пункт 4 из §1 данной главы.
28 —м\шш Глава I. Основные понятия теории линейных пространств
npnx(t),y(t) €C2[ab]
о
= \^X{t)y{t)dt\<\\x\\-\\y\\ =
\
b
\x(t)\2dt
\
о
\\y(t)fdt
И Т. Д.
Докажем утверждение 2. Имеем
\\x ± yf = (x±y,x±y) = \\xf + \\yf ± (y, x) ± (*, y). (4.6)
Взяв в (4.6) знак (+) и оценивая там скалярные произведения (у,х)
и (х,у) по модулю с помощью (4.4), получим
(х + у, х + у) < \\xf + 2||*|| • \\y\\ + \\yf = (||*|| + \\y\\f. (4.7а)
Аналогично, взяв в (4.6) знак (-), получим
(х-у,х-у)> ||*||2 - 2||*|| • \\y\\ + \\y\\2 = (||*|| - Hi/ID2. (4.76)
Из неравенств (4.7а), (4.76) следуют неравенства (4.5а), (4.56) со
знаками < и > соответственно.
Если вектора х>у — линейно независимы, то |(х,у)\ < \\x\\ • \\y\\,
поэтому при переходе от (4.6) к (4.7а) и (4.76) мы получим
в (4.7а), (4.76), а значит и в (4.5а), (4.56) строгие неравенства.
Пусть теперь х и у — линейно зависимы. Покажем, что равенства
в (4.5а), (4.56) возможны лишь при (х,y)>0. Действительно, пусть
(х9у) > 0. Тогда при переходе от (4.6) к (4.7а), (4.76) (а значит
и к (4.5а), (4.56)) мы получим равенство, ибо {у,х) = (х,у) = (х,у)
и (лг,у) = \(х,у)\ = \\x\\ • ||у||. Пусть теперь в (4.5а), (4.56)
выполняются равенства. Возведя эти равенства в квадрат и приведя в
полученных соотношениях подобные члены, мы получим (с учетом
(4.6)), что Re(x,у) = ||х|| \\y\\. Но так как х и у линейно зависимы,
то \(х,у)\ = ||х|| \\y\l и, значит, Re(x,y) = \(x,y)\t откуда следует,
что \т(х,у) = 0 и (х,у) > 0. Утверждение 2 полностью доказано.
Неравенства (4.4), (4.5а), (4.56) являются естественным
аналогом известных из школьного курса неравенств для векторов. Пусть,
например, х,у е V2> т. е. х и у — вектора на плоскости и <р — угол
между ними. Тогда (х,у) = \х\ \у\ costp и, значит, |(jc,y)\ < \х\ \у\, и
\х + у\<\х\ + \у\,\х-у\>\\х\-\у\\.
п.4.3. В векторных пространствах V<i и Уз после введения
скалярного произведения было определено понятие ортогональности
векторов. Введем это понятие и в случае произвольного линейного
пространства.
§4. Пространства со скалярным произведением —fly- 29
Определение. Вектора х,у е К называются
ортогональными, если (х,у) = 0.
Для ортогональных векторов, очевидно, ||jc±(/|| = ||x|| 4- \\y\\
(теорема Пифагора).
Задание
Докажите, что взаимно ортогональные вектора xi,...,Jtm> xj Ф 0,
/ = 1,2,..., ту линейно независимы.
Определение. Система взаимно ортогональных и
нормированных векторов называется ортонормированной.
Опыт работы в векторных пространствах V% V3 показывает, что
очень удобно, когда базис в пространстве является ортонормиро-
ванным. Аналогичная ситуация имеет место и в любом
конечномерном пространстве К со скалярным произведением.
Действительно, пусть е — (ей ... ,еп) — базис в /С, лс, у € /f. Разложим
вектора х,у по базису е и найдем величины (х,у) и ||jc||.
При произвольном базисе е имеем:
1=1 /=1
п
4=1 4=1
А если базис ортонормированный, т.е. если {eiyej) = 8цъ\ то
Отметим также, что координаты векторов в ортонормированном
базисе легко находятся. Умножая скалярно разложения х и у по
базису е на вектор es, получаем
п п
(ху es) = ]Г &(eh es) =
1=1 i=i
п п
Координаты векторов в ортонормированном базисе иногда
называются обобщенными коэффициентами Фурье.
5) Напоминаем, что символ Кронекера 8ц = 0 при / Ф\, 8ц = 1.
30 JL Глава L Основные понятия теории линейных пространств
п.4.4. Ортогонализация векторов. Пусть е\, e<t,..., еп —
линейно независимые вектора в (не обязательно конечномерном)
пространстве К над полем F и Н — С{е\, ..., еп} — линейная оболочка
векторов еь ег» • • •»#«• Покажем, как, исходя из базиса е\,..., еп
подпространства НСК, можно построить в Н ортонормированный
^ _^ ^ 1 ^ I
базис. Пусть /i = e\f f\ = f\ \\f\\\ , /2 = е2 - (ег./О/ь /2 = /2 H/2II
и вообще
*./»)/.. (4.8а)
/*=7*1|7*|Г. А = 2,3,..., п. (4.86)
Определение (4.86) корректно, ибо ||Д|| ф 0 при V&, 1 < й < п. Чтобы
убедиться в этом, предположим, что 3 т, 2 < т < п, такое, для
которого ||/т|| = 0, \\fk\\ > 0 при 1 < k < m, и покажем, что это
невозможно. Действительно, в силу соотношений (4.8а) при k < m и (4.86)
при k < т — 1 вектора fm и /s, s < m — 1, выражаются через
линейные комбинации векторов е\ с номерами t не превосходящими
соответственно т и s. Поэтому, полагая в (4.8а) fe = m и выражая
там вектора Д через е\, е^ ..., es, s < m - 1, мы получим, что
Л1-1
где di,d2> • • • »^m-i — некоторые константы из поля F. Так как, по
предположению, ||/т|| = 0, то fm = в и, значит,
т-\
ет + Yldtet = в>
что противоречит линейной независимости векторов е\у ..., ет.
Следовательно, \\fk\\ > 0 при Vfe, fe < /г, и определение (4.86),
действительно, корректно при V&, 1 < k < п. По построению, вектора Д
нормированы. Покажем, что
(/ь//) = 0, / = 1,2 Л — 1 при 4 = 2,3....,л. (4.9)
Равенства (4.9) доказываются по индукции. Предположим, что
соотношения (4.9) выполняются для k = 2,3, ...,/?, где р —
произвольное число, р < п, и докажем (4.9) при k = р 4-1. В силу (4.8а)
с k — р 4-1 имеем
s=l
§4. Пространства со скалярным произведением —1\/- 31
По предположению индукции (/s,//) = SSj при у < s, s <p. Поэтому
правая часть в (4.10) равна нулю. Значит, равенства (4.9)
выполняются при k = р + 1, и, следовательно, при всех й, k = 1,2,..., п. По
доказанному, вектора /ь ... ,/„ образуют ортонормированный базис
в Я. Таким образом, исходя из произвольной линейно независимой
системы векторов е\, ... >еп мы построили ортонормированную
систему /ь ..., /л. Если вектора еь ..., еп образовывали базис в К, то
вектора /ь ... ,[п суть ортонормированный базис в К.
п.4.5. При разложении линейного пространства в прямую сумму
подпространств (см. §3) иногда возникает следующая задача. Дано
подпространство Я С К. Требуется найти подпространство Н\ так,
чтобы К = Н ф #i. В пространствах без скалярного произведения
для решения этой задачи мы выбирали базис е\,..., ет в Я,
достраивали его векторами вт+ь ...,ew до базиса всего пространства К
и в качестве Н\ брали линейную оболочку векторов ет+\> ...,еп.
Однако, если в К есть скалярное произведение, то построение
пространства Н\ упрощается. Имеет место
Лемма 4.1. Пусть К — конечномерное пространство над
полем F, Н с К — произвольное подпространство из К и
Н[=Н± = {у\у€К, (*/,*) = 0 \/х е Я}.
Тогда
Доказательство. Пусть z — произвольный вектор из К, ей ...
..., ет — ортонормированный базис в Я и
т
г± =z-^2(z,ek)ek.
Положим х = Y?!k=\(z'eb)ek- Очевидно, х € Я, a z± € H±, ибо
т
(г±,е() = (г, е() - (х, ег) = (г, е{) - ]T(z, ek)(eki eL) =
= (г, et) - (г, et) = 0, / = 1,2,..., m.
Значит, (zj_,jc) = 0. По построению
т.е. \/z € К представлен в виде суммы векторов из Я и Ях. Это
представление единственно, т.е. если г = И±+х, гдег_|_ €Н±,х£Н,
toz±=z± их = х. Действительно, поскольку
2_l4-jc, (4.11)
32 —'ь- Глава I. Основные понятия теории линейных пространств
то z± - z± = х - х. Умножая обе части этого равенства на (х-х),
получим
(х — х,х - х) = (z± — z±,х — х) = О
и, значит, х = х. В силу (4.11) z± =z±. Лемма доказана.
§5. ГИЛЬБЕРТОВО ПРОСТРАНСТВО
п.5.1. В настоящем параграфе обсуждается ряд
вопросов, относящихся в основном к бесконечномерным пространствам
со скалярным произведением. Обычно эти вопросы не включаются
в курс линейной алгебры — они ближе к курсам математического
или даже функционального анализа. Однако ответы на них
позволяют сделать переход от конечномерного случая к
бесконечномерному более естественным и понятным. Далее мы рассматриваем
пространства только над полями F = С или F = R.
Определение. Пространство К со скалярным произведением
называется предгильбертовым.
Наличие в пространстве скалярного произведения, а
следовательно и нормы, позволяет ввести в К метрику, т.е. определить
расстояние между элементами. В качестве расстояния между
элементами х и у из К возьмем ||х — #||. Последовательность {хт} € К
назовем сходящейся к предельному элементу хо е К и будем
писать хт —> xq при т —> оо, если ||лст — jco || —^ 0 при т —> оо.
Последовательность {хт} е К назовем фундаментальной, если
Ит \\хп-хт\\=0. (5.1)
п.т—*оо
Любая сходящаяся последовательность — фундаментальна, ибо
если хп —> хо, то, используя (4.5а), имеем
\\Хщ - Хп\\ = \\хт - XQ + Х0 - Хп\\ < \\хт - Х0\\ + ||Хо ~ Хп\\ -+О
при т,п—>оо. Однако, обратное утверждение, вообще говоря, не
верно, т.е. в предгильбертовом пространстве К фундаментальная
последовательность не обязательно сходится к элементу из К.
Приведем пример. Пусть К = С[0,2], и при x(t)yy(t) € К
2
= [*(0у(0Л, (5.2а)
о
ИОН =
|2
\x(t)\*dt. (5.26)
§5. Гильбертово пространство -Jl- 33
Рассмотрим последовательность функций xn(t)y xn(t) = 0 при
t € [0,1 - 1/л], xn(t) = n(t-l + \/n) при t G [1 - 1/л, 1], *„(*) = 1
при t G [1,2]. Вычисления показывают, что \\xm(t) - xp(t)\\ —► 0 при
т,р —► оо, т.е. последовательность лсл — фундаментальна.
Очевидно, что последовательность xn(t) в каждой точке t
сходится к функции
Функция yo(t) имеет разрыв при t = 1 и поэтому #о(О ^ С[0,2], но
это не мешает считать величину ||#о(О — *л(011 по формуле (5.26).
Имеем
О 1—1/л
Допустим теперь, что у последовательности хп существует
предельный элемент xq е К, т. е. \\хо — хп\\ —> 0, при п —> оо. Тогда
И*о - </о|| = Ibo -Хп+хп- уо\\ < \\у0 -хп\\ + \\хп - хо\\ — О
при п —> оо. Значит, ||#о - хо|| = 0, т. е. f0 |г/о - ^о|2^ = 0 и,
следовательно, уо = *о, что неверно, ибо хо е С[0,2], г/о 0 С[0,2]. Таким
образом, рассматриваемая фундаментальная последовательность хп
не имеет предельного элемента в пространстве К.
Определение. Пространство К, в котором любая
фундаментальная последовательность сходится к элементу этого
пространства, называется полным®.
Полное предгильбертово пространство называется гильбертовым.
Задание
Доказать, что любое конечномерное предгильбертово пространство над
полем F = R (или F = С) является гильбертовым.
6) Данное определение относится к любым линейным пространствам, в
которых определено расстояние между, элементами, а значит, и понятие
сходимости. Например, пространство С[0,2] является полным относительно
равномерной сходимости, т. е. если для какой-то последовательности
функций fn(t) е С[0,2] выполняется равенство lim max \fn(t)—fm(t)\=Ot
«,m—»oo f6(0,2]
то 3fo(t) € C[0,2] так, что max \fn(t) - fo(t)\ -> 0 при п -> oo.
34 —'Ь- Глава I. Основные понятия теории линейных пространств
п.5.2. Пусть К — гильбертово пространство и е\, e<i,..., еп,... —
бесконечная ортонормированная система векторов из К (т.е. (в/, в/-) = Д//-).
Для Уу е К числа с,- = (г/, е,-) называются обобщенными
коэффициентами Фурье. Составим ряд YltLi ck£k и определим его частную
сумму
Будем говорить, что ряд YlkLi ck^k сходится к вектору у и писать
оо
если
||^-Sn||-»0 при п -* оо.
Положим
Rn=y-Sn
и выясним некоторые свойства векторов Rn и Sn. Докажем, что
(Rn,e,) = O, / = 1,2,..., я, (5.3)
(Rn,Sn) = O, (5.4)
Имеем
(/?„, в/) = (y-Sn,ej) = {у, ej)~Y^Ck(ek> ej) = с;—
Равенство (5.3) доказано. Справедливость (5.4) следует из (5.3):
Далее,
||5n||2 = (Sn,5n) =
П
ST^ I |2
§ 5. Гильбертово пространство -J\y- 35
и (5.5) доказано. Наконец, (5.6) следует из (5.4), (5.5):
= \\Rnf + (Rn,Sa) + (Sn,Rn) + ||S«|f = \\Rn\f + £ М •
В силу (5.6)
IM|2>EN2. (5-7)
/5=1
Правая часть неравенства (5.7) есть неубывающая числовая
функция от п. Поэтому в (5.7) можно перейти к пределу при п —> оо.
Сделав это, получим
1М|2>1>*|2. (5-8)
£=1
Неравенство (5.8) называется неравенством Бесселя. Если в (5.8)
имеет место равенство, т. е.
\\y\\ =^2\ck\2* (5.9)
то его называют равенством Парсеваля. Из (5.8) следует, что ряд
Y^kL\ \ck\ сходится. Поэтому и в силу (5.6) существует предел \\Rn\\
при п —* оо. Имеем
с»
2 2 ' \ ■> 9
Равенство (5.10) показывает, что lim \\Rn\\ = 0 тогда и только то-
п—+оо
гда, когда для вектора у выполняется равенство Парсеваля.
п.5.3. Определение. Ортонормированная система векторов
e\,e<i,... называется полной в /С, если для У у € К ряд Y1^L\ ckek
сходится к у:
ОС
y = Y
Полная ортонормированная система в бесконечномерном
гильбертовом пространстве К является аналогом ортонормированного
базиса в конечномерном пространстве.
36 —«1^ Глава I. Основные понятия теории линейных пространств
Замечания
1. Ряд Y^L\cbek сходится' независимо от полноты системы
ь2
Действительно, сходимость ряда — это сходимость частных
сумм Sn. Чтобы доказать существование предела lim Sn достаточ-
но показать, что последовательность Sn — фундаментальна (так
как в гильбертовом пространстве любая фундаментальная
последовательность сходится). Имеем (считая п> т)
ц2
т,п
\\Sn-Smf = lim £ ckek
= lim
т,п
ибо в силу (5.7) ряд J^ij |^|2 сходится, а значит,
последовательность Sn сходится к некоторому вектору из К.
2. Не любая бесконечная ортонормированная система является
полной. Действительно, если еьег,--- ~~ полная
ортонормированная система, то, например, система ^2»^з»... не будет полной хотя
бы потому, что элемент е\ не может быть разложен по векторам
£2>£з> • • -у так как все его обобщенные коэффициенты Фурье равны
нулю.
ГЛАВА
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
И ИХ МАТРИЦЫ
§ 1. ОПРЕДЕЛЕНИЯ. ДЕЙСТВИЯ
НАД ЛИНЕЙНЫМИ ОПЕРАТОРАМИ
п.1.1. Пусть X и Y — не обязательно конечномерные
линейные пространства над полем F. Будем говорить, что в
пространстве X задан оператор А со значениями в пространстве Y и
писать X —► К, если задано отображение Л, ставящее в
соответствие каждому элементу х £ X какой-либо элемент у € Y. В этом
случае пишем у = Ах.
Определение. Оператор А называется линейным, если для
Ухих2 GX и /
А(ах\ + (3x2) = olAx\
(1.1)
В случае dim X < +оо для задания оператора А достаточно
задать его на базисе ей . • •, еп пространств X, т. е. задать вектора Ае]у
j = 1,2,..., п. Действительно, если х — £^=1 £7еу, то в силу (1.1)
Если dim X < -boo, dim Y < -J-oo и /i,.'.. ,/m — базис в
пространстве У, то, разлагая вектора Aej по этому базису, имеем
(1.2)
38
Глава II. Линейные операторы и их матрицы
где ац — числа из поля F, зависящие от оператора А и от
выбранных базисов е\, ..., еп и /ь ... ,/ш- Поместим числа а;/ в
таблицу ||Л || из т (= dim У) строк и п (= dimX) столбцов, записав в /-м
стобце коэффициенты пц, / = 1,2, ...,т разложения (1.2)
вектора Ле;- по базису fu ... ,/m. Таким образом, таблица ||Л|| имеет вид
ап
021
a2j
а21
ат\
Эта таблица называется матрицей оператора А. Для матрицы
используется также обозначение
или
Знание матрицы оператора А позволяет найти координаты
вектора Ах для любого х = Y%=\ &ei € Х- Действительно,
Таким образом, координаты 77/ вектора Ах = JZ/=i ^7* выражаются
формулами
(1.3)
/=>
п.1.2. Приведем примеры линейных операторов.
1. Пусть К = X = Y, dim/f = п, е\, ...9еп — базис в К и
Ae-i = А/в;, / = 1,2, ...,п,
где А,- € F. Оператор А и его матрица в этом случае назваются
диагональными, ибо матрица ||Л|| может содержать не нулевые
элементы только на диагонали:
(Г
An i
§1. Определения. Действия над линейными операторами —'Ь- 39
Если у диагонального оператора Ai = A2 = ... = А„ = 1, то
оператор называется тождественным (единичным) и обозначается через /,
а его матрица — через Е:
-
с
Очевидно, Ix = х для Ух £ К.
2. Оператор проектирования. Пусть п = dim К < +оо, Я —
подпространство К и т = dim Я < п. Обозначим через еь ..., ет базис
в Я и дополним его векторами ет+ь ...,ел до базиса в /С. Тогда
УхеК имеет вид jc = $Z"=1 6 в«- Положим
Яял::=
Оператор Я# называется оператором проектирования в К на
подпространство Я. Очевидно, Р2н — Рн^ матричные элементы pst
матрицы ||Ря|| оператора Рн имеют вид: рда = 1, s = 1,2,..., m, /?s/ = О
при Vs, t, s ^ t и при s = t > т.
К. Л^ = (77i, ...,/?„), где^ =
= XlLi ^/^/» ^i/ ~~ произвольные фиксированные числа из поля F.
Задания
1. Доказать линейность операторов в примерах 1-3.
2. Пусть X = Y = С[—1, +1], *(/) € X. Выяснить, являются ли
линейными следующие операторы А\-Аь:
a) Aix{t) = x2(t); б) A2x(t) = ^Щ\ в) Аъх{1) = |jc(0|1/2;
г) A\x(t) = a(t)x(t), где a(t) — фиксированная функция из Х\
д) Asx(t) = x(f)t е) Лб^(0 = x((p(t)), где у?(0 — фиксированная
непрерывная функция из X, — 1 < у>(0 < -fl.
п.1.3. Пусть линейный оператор А действует из пространства X
в пространство К, dimX, dim Y < +00 и АХ = {Лх | а: Е Л"}.
Определение. Будем говорить, что оператор А
осуществляет изоморфное отображение пространства X на
пространство Yy если АХ = Y и если отображение А взаимно однозначно.
Другими словами, линейное отображение А есть изоморфизм,
если для У у G Y 3 \х такой, что Ах = у.
При изоморфизме линейно независимые вектора переходят в
линейно независимые. Покажем это. Пусть вх и ву — нуль-вектора
40 —'ly- Глава II. Линейные операторы и их матрицы
пространств X и Y, х\, ..., хт — линейно независимые вектора из
пространства X, yi = Ахи i = 1,2,..., да. Если вектора у\,...,ут
линейно зависимы, то За/ € F так, что
т т
zY = ^2 ам = oY и J2 ы > °-
В силу линейности и взаимной однозначности отображения А
прообраз zx € X вектора zy € Y есть
т т
*X = Y1 а*Х* = **• ГДе J2 IQ'I > 0)
/=1 1=1
что невозможно в силу линейной независимости векторов х\,..., Jtm.
Значит, образы yi линейно независимых векторов хь линейно
независимы. С другой стороны, если "ух,... >ут — линейно независимые
вектора из Y, то их прообразы х\,... Лт при отображении А тоже
линейно независимы. Действительно, если бы вектора ]ci,...,jem
были линейно зависимы, то 3/3 £ F так, что
X>* = fr (1.4а)
(1.46)
i=i
Тогда, применяя оператор А к (1.4а), мы получили бы, что
что невозможно. Отсюда следует, в частности, что конечномерные
изоморфные пространства имеют одинаковую размерность. Более
того, любые два (конечномерных) пространства X и Y
одинаковой размерности — изоморфны. Действительно, пусть е\, ...,еп и
/ь • • •. fn — базисы в пространствах X и Y. Тогда изоморфизм
между Л" и К можно задать линейным оператором Ло, для которого
Задание
Проверить, что отображение Ло, X —^ Y — изоморфизм.
§ 1. Определения. Действия над линейными операторами —»Ь- 41
п.1.4. Пусть линейные операторы Л и В действуют из
линейного пространства X в линейное пространство У. Оператор С
назовем суммой операторов А и В и будем писать С = А + В, если для
УхеХ выполняется
Сх = Ах + Вх.
Оператор D назовем произведением числа a G F на оператор А и
будем писать D = аЛ, если для Ух € X
Dx = а Ах.
Очевидно, операторы С и D — линейные; кроме того, для Va, /? G F
легко проверяются равенства
а(А + В) = аА + аВ, (a + j3)A = оА + /ЗА.
Пусть К0П=К0П(Х, Y) — множество всех линейных операторов,
действующих из X в Y. Легко видеть, что это множество содержит
и нулевой оператор Л#, для которого А + Aq = А при У А Е Коп, и
противоположный для А оператор Л, такой, что Л 4-Л = Aq.
Действительно, пусть Оу — нуль-вектор пространства Y. Определим
операторы А$ и Л равенствами Aqx = ву, Ах = —Ах для Ух £ X.
Очевидно, что операторы Aq,A принадлежат АоП и имеют
требуемые свойства. Таким образом, множество линейных операторов
обладает свойствами линейного пространства.
Задание
Докажите, что Kon(X, Y) — линейное пространство над полем F.
Кроме операций сложения и умножения на скаляр, можно
определить операцию умножения линейных операторов.
Пусть X, Y,Z — линейные конечномерные пространства над
полем F, Л, В — линейные операторы, X —► У, Y —► Z.
Определение. Оператор С назовем произведением
операторов А и В и будем писать С = Л В, если для Ух еХ выполняется
Сх = А(Вх).
л ' С
Покажем, что оператор С — линейный, X —> Z. Пусть х\9Х2 € X,
ai,Q2 G /\ Тогда для
0:2*2) = А (В(а\Х\ + аг^г)) = А(а\Вх\
= а\АВх\
42 —i\y- Глава II. Линейные операторы и их матрицы
Аналогично определению произведения двух операторов можно
определить произведение любого конечного числа операторов. Пусть,
например, Х\,Х2, •• чХт+\ — линейные пространства, операторы
Ль Л2,..., Ат действуют согласно схеме
\г Ат v Ат — \ v Am—2 v v A% v A\ v
A\ > Л2 > Аз > Л4 .. .Am_i —> Am —► Am+i.
Полагаем С = A\A2...Am, если Cx = A\\A2(...(Amx) ...)V
n.1.5. В курсах линейной алгебры линейные операторы
изучаются обычно в конечномерных пространствах. Однако огромное
большинство операторов, встречающихся в приложениях,
действует в бесконечномерных пространствах. Поэтому необходимо
отметить возникающие здесь отличия, а также указать общие свойства
по сравнению с конечномерным случаем. В пп. 1.1 и 1.3 мы не
исключали случаи dim Л' = dim Y = -j-oo, но предполагали, что
оператор А определен на Vjc e X. Здесь мы начнем с того, что в
бесконечномерном пространстве оператор Л, как правило, определен не
во всем пространстве X, а в некотором его подпространстве
(обычно бесконечномерном), называемом областью определения
оператора Л и обозначаемом пд. При этом один и тот же оператор Л
в одном и том же пространстве может иметь различные области
определения в зависимости от рассматриваемой задачи.
. Например, пусть Х=£2[я, Ь\ = {x(t) | fa \xfdt < +00} (см. п. 4.1,
гл. I) и оператор Л = —cfi/dt2. Ясно, что оператор Л не может быть
определен на всем пространстве С2[а,Ь]. В качестве области
определения Л можно взять, в частности, любую из областей
DA = {x(t)\x(t)eC2[a,b]};
D{» = {x(t) I x(t) € DA, x(a) = x(b) = 0};
Df = {x(t) I x(t) € DA, x(a) = 0, x'(b) = 0} и т. д.
Далее, в бесконечномерном пространстве не существует базиса
и поэтому в рамках нашего курса мы не можем говорить, например,
о матрице рассматриваемого оператора.
Дадим строгие определения. Пусть X и Y — линейные
пространства над полем F, dim X = +00, dim У < +оо и D С X — некоторое
подпространство из X. Назовем оператор Л, действующий из D в Y
линейным, если для \/х\,Х2 € D и Va,/3 £ F выполняется
А(ах\ + (3x2) = olAx\
ный оператор, D —> У
сумму С\ = Л + В операторов Л и В и произведение Сг = аА ска-
Если В — линейный оператор, D —> У, то мы можем определить
§2. Матрицы и действия над ними —II- 43
ляра а на оператор А так же как в п. 1.3, но всюду вместо
включения х е X мы должны писать х е £>. Легко видеть, что множество
линейных операторов, действующих из D в Y является линейным
пространством (докажите это).
Следуя идеям п. 1.3, можно определить произведение
линейных операторов, действующих в бесконечномерных пространствах.
В дальнейшем изложении мы всюду будем отмечать, какие
результаты относятся только к конечномерному случаю, а какие верны и
для бесконечномерных пространств.
§2. МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ
п.2.1. Пусть X и Y — конечномерные пространства над
полем F, е\, ..., еп и f\, ..., fm — базисы в них, и А — произвольный
линейный оператор, X —> Y. В п. 1.1 мы установили, что
оператору А отвечает матрица ||Л|| = (ац)пт, в /-м столбце которой
записаны коэффициенты ац, i — 1,2, ...,m разложения (1.2) вектора Ае\
по базису /ь ... ,/т. Пусть линейный оператор В также действует
из А' в У и ||В|| = (Ьц)пт. Определим линейные операторы С = А+В,
D — (хА, а е F, согласно п. 1.3. В силу п. 1.1 этим операторам будут
отвечать матрицы ||С|| = (сц)пт и \\D\\ = (d//)^, элементы которых
определяются из соотношений:
ТП Ш Ш ТП
Cej = Aej + Bej = ^ аф + ^ ЬцЬ = ^(я// + 6//)// = ^ сц ft,
m
Отсюда
сц = ац + Ьц, dij = ааИ. (2.1)
Определение. Матрицы \\C\\ = {сц)пт и \\D\\ = Цц)пт с
матричными коэффициентами (2.1) называются соответственно
суммой ||Л|| + ||В|| матриц \\A\\ и \\B\\ и произведением а\\А\\
скаляра а на матрицу \\A\\, т. е.
\\C\\ = \\А + В\\ = \\A\\ + ||В||, ||D|| = ||оД|| = а||Л||. (2.2)
Другими словами, сумма ||Л|| + ||В|| матриц ||Л|| и ||В|| — это
матрица, отвечающая сумме А + В операторов Л и В, а
произведение скаляра а на матрицу ||Л|| — это матрица оператора аА.
44 —'l*- Глава II. Линейные операторы и их матрицы
Разумеется, определить сумму матриц и произведение скаляра
на матрицу можно было не вспоминая про операторы, а оперируя
только с матрицами. Именно так и делается в большинстве
руководств по линейной алгебре и это отнюдь не мешает работать с
матрицами. Более того, в практической работе не обязательно (а
иногда излишне) помнить о происхождении определений (2.1), а
надо просто их использовать. В то же время знать истоки
определения действий с матрицами весьма полезно. И особенно ясно мы
это увидим при определении произведения матриц в п. 2.3. Но пока
остановимся на других вопросах.
п.2.2. Пусть Кы{т,п) — множество матриц с т строками и
п столбцами с элементами из поля F и с операциями сложения
матриц и умножения матрицы на скаляр, определенными
согласно (2.1), (2.2).
Задание
Докажите, что Км(т,п) — линейное пространство над полем F.
Мы знаем (см. п. 1.4), что каждому линейному оператору,
действующему из X в К, отвечает матрица т х п пространства /fM(m, n)
(зависящая от выбора базисов в пространствах X и Y). Однако
верно и обратное. Каждой матрице из Км(т,п) можно сопоставить
единственный оператор из KQn(X, Y) следующим образом. Пусть
\\C\\ = (Cij)nm — некоторая матрица из /fM(m, n). Рассмотрим
произвольные n-мерное линейное пространство X и m-мерное
пространство Y и пусть в\, ..., еп и f\,..., fm — базисы в X и Y. Поставим
в соответствие матрице ||С|| линейный оператор С, X —* К,
определяемый равенствами
т
С*1 = Т,счЬ / = 1.2,..., л. (2.3)
Ясно, что это соответствие определяет оператор С однозначно и что
оно линейно, т.е. линейной комбинации а||Л|| -f ^||В|| матриц ||Л||
и ||В|| из Км(т,п) будет отвечать линейная комбинация aA + flB
отвечающих матрицам операторов Л и 5 из K0U{X\ Y). Кроме
того, разным матрицам отвечают разные операторы. Действительно,
если матрицам ||Л|| и ||В|| отвечает один и тот же оператор, то их
разности ||С|| = ||Л|| — ||В|| будет отвечать нулевой оператор, что в
силу (2.3) возможно только для матрицы ||С|| с нулевыми
элементами сц = пц — Ьц — 0, т.е. при ||Л|| = ||В||. Из проведенных
рассуждений следует, что пространство Км(т,п) матриц изоморфно
§2. Матрицы и действия над ними —fly- 45
пространству линейных операторов К0П(Х, У), действующих из п-
мерного пространства в m-мерное (см. п. 1.3). Этот факт можно
использовать, например, для нахождения размерности
пространства К0П(Х; У).
Задание
Найти d\mKon(X;Y).
п.2.3. Пусть XyYyZ — линейные пространства над полем F, А
В А
и В — линейные операторы: X —> Y —>Z, £/,//,gs, / = 1,2, ...,я,
/ = 1,2,..., т, 5 = 1,2,... ,р — базисы соответственно в
пространствах X, YyZ и
(п\\ ... а\т\ [Ъ\\ ...
, ||В||=
ар\ ... арт/ \Ьт\ ...
— матрицы операторов Л и В в этих базисах. Найдем матрицу ||С||
оператора С:=АВ. Имеем:
т т
Се} = ABej = А ]Г Ьф = ^ *Й/ЛД =
т р р т
т. е. матричные элементы сц матрицы ||С|| будут определяться
равенствами
т
Ч = !>»**/. « = 1-2 р, / = 1,2,...,п. (2.4)
fe=i
Определение. Матрица \\C\\ = (£//)", элементы которой
определяются формулами (2.4), называется произведением матриц
\\A\\ и \\B\\:
\\C\\ = 1И
Другими словами, произведением, [|Л|| ||В|| матриц ||Л|| и
называется матрица ||С||, отвечающая произведению С = АВ
соответствующих операторов. Согласно (2.4) элемент сц матрицы ||С||
получается умножением (как m-мерных векторов) i-Pi строки
матрицы ||Л|| на/-й столбец мат- рицы ||В||. Умножение матриц ||Л|| и ||В||
возможно, если число столбцов матрицы ||Л|| равно числу строк
46
Глава II. Линейные операторы и их матрицы
матрицы ||В||. Полученная в произведении матрица ||С|| = ||Л||
будет иметь столько строк, сколько их у матрицы \\A\\, и столько
столбцов, сколько их у матрицы ||В||. То есть ||С|| = (Cijf.
Отметим, что если определения суммы матриц и умножения матрицы на
скаляр (см. п. 2.1) были интуитивно предсказуемы без упоминания
операторов, то определение (2.4) произведения матриц без отсыла
к произведению операторов выглядело бы неожиданным.
Задание
Пусть ||Л|| и ||Б|| — квадратные матрицы порядка п. Найти
произведение ||Л|| ||Б|| в случаях, когда
1) Я'о/о = *' ач = ° ПРИ 0'»/) Ф («о,/о);
2) btojo = 1, bij = 0 при (/,/) Ф (/о, /о); здесь /о,/о — произвольные
числа 1 < /о,/о < п.
п.2.4. Умножение блочных матриц. В некоторых случаях
удобно перед умножением матриц разбить их на блоки. Пусть мы ищем
\\A\\ \\B\\. Проведя горизонтальные и вертикальные линии, разобьем
матрицы ||Л || и ||В|| на блоки, которые образуют суперстроки и
суперстолбцы этих матриц. Обозначим блоки матрицы ||Л|| через Ацч
а матрицы ||5|| — через BjS, Разбиение проведем так, что:
1) число суперстолбцов матрицы ||Л|| равняется числу
суперстрок матрицы ||В|| (т.е. число блоков Ац, j = 1,2,... ,ft в /-й
суперстроке совпадает с числом блоков Вцу j = 1,2,..., k в t-м
суперстолбце матрицы ||В||);
2) число столбцов в блоке Ац совпадает с числом строк в
блоке В^ для V/,/,t, т.е.
ИИ =
А»
А21
Ар\
Ai2
л22
АР2
Aik
Агк
Apk
и*» =
{Bki
B\2
B22
Bk2
Bi
Bksj
Тогда произведение ||Л|| ||В|| можно записать в виде
1И11НВ|| =
/ k
J2APiBn
k
J2APiBp
...
k \
Довольно часто встречается случай перемножения так
называемых блочно-диагональных матриц.
§3. Обратные операторы и матрицы —'1/- 47
Определение. Назовем квадратную матрицу \\C\\ = (сц) блоч-
но-диагональной, если все ее элементы равны нулю, кроме быть
может, элементов не пересекающихся квадратных блоков
произвольной размерности, диагонали которых лежат на
диагонали сп,С22, •..,спп матрицы \\C\\.
Если ||Л|| и ||В|| — блочно-диагональные матрицы, имеющие
одинаковое число блоков,
О Вр}
и блоки As и Bs имеют одинаковый порядок, s = 1,2,... ,р, то
(АхВх О
Ч
О ApBpj
При этом порядки блоков А\, . ..,АР могут быть произвольны.
§3. ОБРАТНЫЕ ОПЕРАТОРЫ И МАТРИЦЫ:
ОПРЕДЕЛЕНИЕ, СУЩЕСТВОВАНИЕ,
НАХОЖДЕНИЕ
п.3.1. Пусть X и Y — линейные не обязательно
конечномерные (если не сказано иное) пространства над полем F,
A R
А — линейный оператор, X —> У. Линейный оператор Вл, Y -А X,
называется левым обратным для Л если для Ух € X выполняется
ВлАх = х. (3.1)
Линейный оператор £п, У —^ -К» называется правым обратным для Л,
если для Vy e Y выполняется
АВПу = у. (3.2)
Обозначим через 1\ и /у единичные .(тождественные) операторы
соответственно на линейных пространствах X и У (т. е. /** = jc и
1гУ = У Для VxeX, Vye Y). Тогда равенства (3.1), (3.2) можно
переписать в виде
ЯлЛ=/х, ABn=IY. (3.3)
48 —'Ъ- Глава II. Линейные операторы и их матрицы
Если для оператора Л существуют и левый и правый обратные,
то они совпадают. Действительно, в силу свойств произведения
линейных операторов
ВлАВп=Вл(АВП)=Вл1у = Вл
и одновременно
откуда Вл = Вп. В этом случае в силу (3.3)
ВА=1Х, AB = IY, (3.4)
Определение. Оператор В, удовлетворяющий
соотношениям (3.4), называется обратным для оператора А и
обозначается через Л"1.
Таким образом, для обратного оператора Л"1 выполняется
A-lA=fXt AA~]=IY. (3.5)
Оператор Л, у которого существует обратный, называется обратимым.
Вопросы существования и нахождения обратного оператора
чрезвычайно важны для приложений. Действительно, очень многие
задачи нахождения неизвестной величины х по заданной величине у
сводятся (часто приближенно) к задаче решения уравнения
Ах = у,
где Л — известный линейный оператор. И если мы знаем Л"1, то
применяя Л"1 к обеим частям этого уравнения, сразу находим х:
х = А~1у.
п.3.2. Прежде чем формулировать и доказывать теорему о
существовании обратного оператора, рассмотрим два примера, в
которых обратный оператор не существует. Анализируя их, мы
попытаемся понять, какие условия должны выполняться для
существования обратного оператора.
Пример 1. Пусть
/=о
§3. Обратные операторы и матрицы —'!/• 49
— линейное пространство всех полиномов любых степеней с
вещественными коэффициентами и У = X. В бесконечномерном
пространстве X определим операторы Л и В формулами
APn(t) = tPn(t) € У, BPn(t) = (Pn(t) - РпЩ/t € X.
Тогда В будет левым обратным для Л, ибо
BAPn(t) = B(tPn(t)) = (tPn(t) -OPn(O))/t = Pn(t)
для VPn(t) € X. В то же время оператор В не является правым
обратным, ибо при Рп(0) Ф О
ABPn(t) =A(Pn(t) - Pn(O))/t = Pn(t) - Pn(0) ф Pn(t).
Заметим, что в данном примере множество значений
АХ = {APn(t) | Pn(t) €X} = {tPn(t) | Pn(t) € X}
оператора Л не совпадает с У = X, ибо АХ не содержит полиномов
нулевой степени, кроме Ро = 0.
Пример 2. Рассмотрим теперь ситуацию, когда АХ = У. Пусть
X = Кп = {х \х = (6,... ,&)• 6 € F, i = 1,2,..., л},
•уг if / *# I *# (in in \ in £Z F i 10 n 1 \
Для Vx = (£i,... y£n-\>€n) € X определим оператор Л равенством
Ак:=(£ь •••»^n-i)^ У. Очевидно, что ЛХ = {Лх |х е Кп}= У. Пусть
далее Д,... ,/Зп-\ — любые числа, /?,- € Т7, у = (/?ь ... ,/?n-i) € У,
]с = (/?!,...,/?л_ь0) е X. Определим оператор В на пространстве У
равенством By = х. Тогда В — правый обратный для оператора Л,
ибо
' = АВ(0и ..., А*-0 = А(ри • •., Рп-и 0) = (А, • • •,/?*-i) = F-
В то же время оператор В не является левым обратным, так как
при х0 = (А,..., /?„_!, /?п) имеем
= (/?,,...,/?„_,,О)^хо, если /3,^0.
Таким образом, хотя в данном примере АХ = У (чего не было в
примере 1), но обратный оператор Л"1 не существует.
Заметим, что в данном примере отображение X —> У не
является взаимно однозначным, ибо
Аха = Ахр
при Мха = (£ь ...,6i-i,a), *0 = (£ь ..-,^«-ь/3) для Va,/3 € F.
50 —'\/- Глава II. Линейные операторы и их матрицы
Таким образом, рассмотренные примеры подсказывают (но не
доказывают!), что в формулировке теоремы о существовании
обратного оператора желательно потребовать выполнения тех условий,
которые не выполняются в примерах 1 и 2, т. е. потребовать, чтобы
АХ = У и чтобы отображение X —» У было взаимно однозначным.
Оказывается, именно эти условия являются необходимыми и
достаточными для существования обратного оператора как в
конечномерном, так и в бесконечномерном случаях.
п.3.3. Теорема 3.1. Пусть линейный оператор А действует
из пространства X в пространство У. Тогда для существования
обратного оператора А~~1 необходимо и достаточно выполнение
условий
АХ = У, (3.6)
отображение X —> У взаимно однозначно. (3.7)
Замечание. Условия (3.6), (3.7) означают, что оператор А есть
изоморфизм пространства X на пространство У.
Доказательство. Необходимость. Пусть А~х существует.
Докажем справедливость требований (3.6), (3.7). Если (3.6) не
верно, то АХ с У и, значит, 3#о» Уо € У» Уо &АХ. Так как А~х
существует, то АА~хуо = уо- Полагая здесь хо =А~хуо, получаем
уо = Ахо € АХ, что противоречит выбору уо £ АХ. Поэтому не
существует г/о € У, уо & АХ, т. е. АХ = У и (3.6) доказано.
Докажем (3.7). Покажем, что если
Ах\ = Ах2, (3.8)
то х\ = Х2. Поскольку Л~! существует, то, применяя Л"1 к обеим
частям (3.8), получим требуемое равенство х\ = Х2.
Достаточность. Пусть условия (3.6), (3.7) справедливы. Тогда
для Vу G У, 3! х так, что Ах = у. Определим линейный оператор В
на пространстве У соотношением By = х и покажем, что В — А~х.
Имеем АВу = Ах — у и ВАх = By = x. Значит оператор В
удовлетворяет соотношениям (3.4) и поэтому В = А~К Теорема доказана
полностью.
Следствие. В случае конечномерных пространств X и У для
существования обратного оператора условие (3.7) можно
заменить на условие
dim* = dim У. (3.9)
§3. Обратные операторы и матрицы —f\y- 51
Для справедливости следствия покажем, что требования (3.6),
(3.9) эквивалентны (3.6), (3.7). Действительно, если условия (3.6),
(3.7) выполняются, то пространства X и Y изоморфны и,
следовательно, dimX — dim Y, т.е. (3.9) верно. Пусть теперь
выполняются условия (3.6), (3.9). Докажем (3.7). Если (3.7) не
выполняется, то 3*1,Х2 €:Х такие, что Ах\ =Ах2 и х\ Ф Х2. Положим
в\ = х\ — Х2 ф 9х и дополним этот вектор до базиса в\у ...,еп
пространства X (п = й\тХ= dim Y). Ясно, что Y=C{Ae\yAe2,.. .,Аеп}.
Но Ав\ = Ах\ — Ах2 = ву и поэтому dim Y < п — 1, что
противоречит (3.9). Значит, предположение о не справедливости (3.7) при
выполнении (3.6), (3.9) неверно.
Если X = У, то условие (3.9) выполняется автоматически и
остается только одно необходимое и достаточное условие
существования обратного оператора — условие (3.6) с Y = X.
Задание
Докажите, что при выполнении условия (3.6) условие (3.9)
эквивалентно условию линейно независимости векторов Ае\,..., Аеп, где в\, ..., еп —
базис в X.
п.3.4. Пусть X и Y — линейные пространства над полем F
соответственно с базисами е\у..., еп и /ь ... ,/m, A — линейный
оператор, X —► Y. Если т Ф /г, то в силу (3.9) обратный оператор А~{
не существует, поэтому далее считаем т = п.
Пусть матрица оператора А есть (а*/)". Тогда
Согласно заданию п. 3.3 для существования обратного оператора А 1
необходимо и достаточно, чтобы вектора Ае} были линейно
независимы. А для линейной независимости п векторов Ле7 в и-мерном
пространстве Y необходимо и достаточно, чтобы определитель,
составленный из координат этих векторов по базису пространства У,
не равнялся нулю (см. п.2.2, гл.1), т.е.
аи
(3.10)
аП2
Таким образом, обратный оператор А 1 существует тогда и только
тогда, когда Д ф 0.
52 т.i\f Глава II. Линейные операторы и их матрицы
Определение 1. Матрица \\А~{\\ обратного оператора
называется обратной для матрицы \\A\\ оператора А и обозначается
через ||Л ||" .
Поскольку
А'1 А =4, АА~] =IYi
то в силу п. 2.2
= £ и 1ИЦЦЛ1Г1 =Я, (3.11)
где Е — единичная матрица порядка п.
Понятие обратной матрицы можно ввести и без ссылок на
обратный оператор (что и делается во многих курсах линейной алгебры):
Определение 2. Для произвольных квадратных матриц \\Aq\\,
||Во|| с элементами из поля F назовем матрицу ||Во|| обратной
к || Л о || и будем писать ||Во|| = 1Ио||~ > если
||Во|||Ио|ЫИо||||£о||=£. (3-12)
Определения 1 и 2 — эквивалентны. Действительно, пусть ||Ло||
и ||Во|| — некоторые матрицы п-го порядка, удовлетворяющие (3.12).
В произвольных /1-мерных пространствах X и Y над полем F
выберем базисы и определим операторы А: X —+ Y и В: К—>Jf так,
чтобы их матрицы совпали соответственно с ||Ло|| и ||£о||- Тогда в
силу изоморфизма пространств матриц Км(п,п) и К0П(Х\ Y) будем
иметь
AB = IY, ВА=1Х. (3.13)
В силу (3.13) В = А~\ а ||В|| = ||В0|| = \\Ao\\~\ т.е. матрица ||В0||,
обратная для матрицы |Ио||, есть матрица оператора В, обратного
для оператора А с матрицей ||До||- Таким образом, эквивалентность
определений 1 и 2 доказана.
п.3.5. Нахождение обратной матрицы. Из рассуждений п. 3.4
следует, что условие существования матрицы ЦЛЦ"1 обратной для
матрицы ||Л || есть условие существования обратного оператора А~1
для оператора Л, X —► У, с матрицей ||Л||, т.е. условие
А := det ||Л|| ^ 0. (3.14)
Квадратная матрица, определитель которой не равен нулю,
называется не особенной. Пусть (3.14) выполнено. Положим В — А~х и
§ 3. Обратные операторы и матрицы
53
найдем ||В|| = \\A\\~1 = {bst)nn. Пусть <?,,... ,е„ и /,
в пространствах X и Y. В силу (3.5)
/„ - базисы
ABfs =
= l,2,...,л,
т.е.
= 1>2> ■■■•"■
/ / /
(3.15)
Фиксируем индекс s. Тогда в силу линейной независимости
векторов /ь ... ,/л из (3.15) следуют соотношения
« = 1,2, ...,Л.
(3.16)
/=!
Таким образом, неизвестные элементы bjS матрицы обратного
оператора Л"1 (т.е. обратной матрицы ||В|| = ЦАЦ"1) удовлетворяют
линейной алгебраической системе (3.16), определитель которой А Ф О
в силу (3.14). Поэтому по правилу Крамера
(3.17)
где ASj — алгебраическое дополнение элемента as/ матрицы
|AS/| — минор элемента as/-.
Формулы (3.17) дают выражения для матричных элементов
обратной матрицы (т.е. матрицы обратного оператора).
п.3.6. Обсудим теперь вопрос о существовании обратного
оператора для произведения С—АхА^.. .Аилинейных операторов,
действующих в линейных пространствах 'Xj, / = 1,2,..., k + 1 по схеме
\Г Aft чг Ak — \
Л\ —► Л2 ► ..."
54 —'Ь- Глава II. Линейные операторы и их матрицы
Рассмотрим сначала простой случай, когда dimA/=
/ = 2 Л+1.
Теорема 3.2. Пусть С = Л1Л2 ... Л&. 7Ъгда вела
dim Ai = dimX2 = ... = dimAfc+i,
mo для существования оператора С~1 необходимо и
достаточно , чтобы существовали обратные операторы Л"1, / = 1,2, ..., ft.
£Ъш Л г1 существуют, j = 1,2,..., k, то С~{ = А^ХА^]_Х... Лр1.
Доказательство. Достаточность. Пусть операторы Л~\
/ = 1,2,..., k существуют. Тогда непосредственная проверка
показывает, что оператор А^1А^ .. .Л}"1 есть С"1.
Необходимость. Пусть оператор С""1 существует. Выберем в
пространствах Xj произвольные базисы и заметим, что в силу
условия теоремы матрицы \\Aj\\ операторов Л/ — квадратные и имеют
одинаковую размерность. Поэтому
Так как оператор С~1 существует, то det ||С|| Ф 0. Но
/=1
и, следовательно, det ||ЛУ|| ^0, /=1,2 k. Поэтому обратные
операторы Л"1, /= 1, ...,fe существуют, т.е. необходимость условия
теоремы 3.2 доказана.
Следствие. Если матрица ||L|| есть произведение квадрат-
ных матриц ||L/||, / = 1,2,... ,6, одного и того же порядка, то
для существования обратной матрицы \\Ц\~Х необходимо и
достаточно, чтобы существовали обратные матрицы Ц^Ц"1.
Если они существуют, то
\\L\\-' = \\Lk\\-{\\Lk^\\-{ ...\\L2\\-{\\U\\-{.
п.3.7. Рассмотрим теперь общий случай. Пусть пространства Xj,
операторы As и С — те же, что в п. 3.7, но без условия
= ... = dim Xk+\.
§3. Обратные операторы и матрицы —f\y- 55
Положим
v' v W л v/ ; 1 о а 1 v' v
Aj=Ai, Л/+1 = Ak-j+\A:, I = 1,Z, . . . ,Л — 1, Afe+i = Л^+1
и обозначим через В£ оператор As на пространстве ^_s+1. Тогда,
очевидно, оператор С можно записать в виде
Теорема 3.3. Для существования обратного оператора С~х
необходимо и достаточно, чтобы существовали обратные
операторы BJX, / = 1,2, ...,&. Если эти операторы существуют,
тоС-1=В;{В^{...В^.
Доказательство. Достаточность условия теоремы очевидна.
Действительно, пусть операторы В~х существуют, 5 = 1,2,...ft, и
D:=B^XB^X...B^1. Тогда, очевидно, что
CD = В{В2... BkBtX... B2"V = &*+..
DC = Вь1Вь±{. ..ВъХВгхВхВ2 . ..Вк-хВк = /*,,
где 1х5 — единичный оператор в пространстве Xs.
Докажем необходимость. Пусть обратный оператор С"1
существует. Тогда в силу (3.6), (3.9) СХ\ = Хь+\ и dimA^ = dimX^-j-i. По
построению СХ\ =В\Х\ и значит В\Х\ = Х'к+{. Очевидно, что для
любого конечномерного пространства К и любого линейного
оператора L, определенного в Л", выполняется dim L/f < dim К. Поэтому
dimA:y-+1 = dimBk-.j+\X'j <dimAy, / = 1,2, ...,*.
Из написанных соотношений следует, что
dimХ[ > dim^ > ... > dim*; > dim^+1 = dimX[,
и, значит, размерности всех пространств X'v j = 1,2,..., k 4-1 совпадают.
Учитывая, что Х'+1 = Bk-j+\Xj и применяя следствие теоремы 3.1,
получаем существование обратных операторов В~х> s = 1,2,..., п. А
Замечание. Для существования оператора С"1 в общем
случае не требуется существование операторов А~х. Пусть, например,
С = A\A2, где оператор А2 действует из Кпх) в Кп+\ по закону
1) Напомним, что Кр = {х \ х = (й, • • •. Zp)> f/ € F}.
56 -Jb- Глава II. Линейные операторы и их матрицы
а оператор А\ действует из Кп+\ в Кп по закону
"1
Очевидно, что обратные операторы Л j"1 и Л^1 не существуют, а С
существует, ибо С осуществляет изоморфное отображение Кп-+Кп\
Задание
Построить С"1.
§ 4. ИЗМЕНЕНИЕ КООРДИНАТ ВЕКТОРОВ И МАТРИЦ
ОПЕРАТОРОВ ПРИ ИЗМЕНЕНИИ БАЗИСА.
ПОДОБНЫЕ МАТРИЦЫ
п.4.1. До сих пор мы работали с координатами
векторов и матрицами операторов, отвечающими произвольно
фиксированному базису в рассматриваемом конечномерном пространстве К
над полем F. Однако иногда бывает полезно перейти от
используемого базиса к другому. В связи с этим возникают вопросы: как
связаны между собой координаты одного и того же вектора и
матрицы одного и того же оператора, отвечающие разным базисам?
Ответы на эти вопросы даны ниже.
п.4.2. Пусть е = (е\,..., еп) и / = (f\,..., fn) — два базиса в я-мер-
ном пространстве К и пусть связь между ними дается соотношениями
(4.1)
где Р — некоторый линейный оператор, называемый оператором
перехода. Матрица ||Р|| = (Pij)nn оператора Р (в базисе ё) называется
матрицей перехода. С ее помощью равенства (4.1) можно записать
в виде
Так как вектора /у, / = 1,2,..., п линейно независимы, то det ||Я|| Ф 0.
Следовательно, оператор Р имеет обратный Р~\ который мы
обозначим через Q. По определению, ||Q|| = (qst)nn = \\P\\~1- Применяя
к обеим частям соотношения (4.1) оператор Q, получим
е, = Qfh (4.3)
§4. Изменение базиса линейного пространства —/\у- 57
т.е.
~ (4.4)
п.4.3. Обозначим координаты произвольного вектора х £ К ъ
базисе е через £ь ..., £я, в базисе / — через гц,..., rjn. Имеем:
Далее, если мы хотим получить выражение координат & через
координаты 7/s, то подставим в (4,5) выражение (4.2), а если хотим
получить значения щ через £s, то надо подставить в (4.5)
выражение (4.4). Сделаем и то и другое. Подставляя в (4.5) выражение /;
из (4.2), получим
п
х =
Приравнивая друг другу /-е координаты вектора х в базисе е в
обеих частях равенства (4.6), получаем:
6 = &*/Чл i=l,2,... . (4.7)
Или в матричной форме
(4.8)
Подставим теперь в (4.5) выражения еу- из (4.4) при / = s:
* = Ё es •.=Е б (Е ы) = Ё (Ё «*)// = Ё •» //•
s=l s=l /=1 /=1 $=1 /=1
Приравнивая друг другу /-е координаты вектора jc по базису / в
последних частях (4.9), получим
*7/ = Х>*&' / = 1.2 п (4.10)
s=l
58 -J ь- Глава II. Линейные операторы и их матрицы
или в матричной форме
= IIQII-I ; I- (4.U)
В (4.8) и (4.11) столбцы координат rj\... rjn и £i... £п мы
рассматриваем как одностолбцовые матрицы. Соотношения (4.7)—(4.11)
полностью решают задачу нахождения связи между координатами
вектора в разных базисах.
Замечание. После вывода соотношений (4.7), (4.8) можно было
не подставлять (4.4) в (4.5), а сразу получить равенство (4.11),
умножив равенства (4.8) слева на матрицу ||Q|| = ЦЯЦ"1.
п.4.4. Рассмотрим линейный оператор Л, действующий из К
в К и пусть ||Л||е = (ciij)nn и ||Л||^ = (bij)nn — матрицы оператора Л
соответственно в базисах е и /. Установим связь между ними. Для
этого найдем выражение Aft двумя способами. Первый: сначала
выразим fi согласно (4.2), а потом применим оператор Л. Второй:
сначала применим оператор Л к вектору /,-, а потом в полученном
выражении заменим вектора /у согласно (4.2). Первый способ дает
(
s=l s=l s=I /=l /=1 s=\
По второму способу
5=1 S=l /=1 /=1 S=l
Мы получили два разложения вектора Aft по базису е. Так как
координаты вектора по базису определяются единственным образом,
то
5=1 S=l
т.е.
Так как у и i — произвольные, то из (4.12) следует, что
1ИШ1 = \\p\\ 1ИИ/. (4-13)
§4. Изменение базиса линейного пространства —11^ 59
Поскольку обратная матрица \\P\\ 1 существует, то, умножая (4.13)
слева на ||Я||"~\ получим
ИИ/ = 1ИГ1И||в|И|, (4.14)
а умножив (4.13) справа на ЦЯЦ"1, имеем
1И11в = ||Я||И||/||Я|Г1. (4.15)
Формулы (4.14) и (4.15) дают искомые выражения матриц
оператора в разных базисах друг через друга.
п.4.5. Пусть ЦАЦ и ЦВЦ — произвольные матрицы порядка п.
Определение. Будем говорить, что матрица \\B\\ подобна
матрице ЦАЦ и писать \\B\\ ~ ЦАЦ, если найдется такая неособенная
матрица \\C\\ порядка п, что
\\в\\ = \\с\\-1\\а\\\\с\\. (4.16)
Если \\B\\ ~ \\A\\t то и \\A\\ ~ \\B\\ (свойство рефлексивности),
так как в силу (4.16)
где ||С|| = ЦСЦ-1.
Если ||В|| ~ ||Л|| и ||D|| ~ ||В||, то ||Х>|| ~ ||Л|| (свойство
транзитивности). Действительно, пусть матрицы ||Ci|| и ЦСгЦ таковы, что
, (4.17а)
. (4.176)
Подставив выражения \\B\\ из (4.17а) в (4.176) получим, что
IPINIICaH^IICiir^lilllllCillllCall. (4.18)
Положим \\C\\ = ||Ci|| ||С2||; тогда в силу (4.18)
\\D\\ = \\C\\-{\\A\\\\Cl
что и требовалось доказать.
Так как свойство подобия матриц рефлексивно и транзитивно,
то все квадратные матрицы порядка п можно разбить на классы без
общих элементов так, что в каждый класс войдут только подобные
друг другу матрицы. Покажем, что подобные матрицы можно
рассматривать как матрицы одного и того же оператора, записанные
60 —i\y- Глава II. Линейные операторы и их матрицы
в разных базисах. Пусть для матриц ||В||, ||Л|| и ||С|| выполняется
равенство (4.16), т.е. ||В|| ~ ||Л||. Выберем в /г-мерном
пространстве К произвольный базис е = (е\, -. •»вп) и базис / = (/ь... ,/п),
связанный с базисом е соотношениями
п
fi = ^2ci!ei> /=1,2,....д,
1=1
где Cj7- — матричный элемент матрицы ||С|| из (4.16). Рассмотрим
линейный оператор А, К—>К, матрица которого в базисе е есть ||Л||.
Тогда матрица ||Л||* оператора А в базисе / согласно (4.14)
запишется в виде
\Щ = \\С\Г1\\А\\\\С\\
и в силу (4.16)
11*11 = 1ИИ/,
т. е. ||£|| — матрица оператора А в базисе /.
§ 5. ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА.
СОБСТВЕННЫЕ ВЕКТОРА И СОБСТВЕННЫЕ
ЗНАЧЕНИЯ ЛИНЕЙНЫХ ОПЕРАТОРОВ
п.5.1. Пусть К — линейное пространство над полем /%
А — линейный оператор, К —► К,
Определение. Подпространство Н с К назовем
инвариантным для оператора Л, если для \/х £ Н справедливо включение
АхеН.
Приведем примеры инвариантных подпространств. Считаем в
них F = R.
1.ПустьK=(?[ab],H={Pn(t) \Pn(t) = Znk=odktkyn € N,VdkeF}.
Подпространство Н инвариантно, в частности для следующих
операторов Л]-Л4:
AxPn(t) = jt Pn(t), A2Pn(t) = tmPn(t),
m — фиксированное число, m e Z,
= (Pn(t) - РпЩ/U A4Pn(t) = J Pn(s) ds.
0
#5. Инвариантные подпространства
61
2. Пусть К= C[ab], H={x(t) \x(t)eК, x(a)=O},Ax(t)=f(t)x(t)y
где f(t) — фиксированная функция из К. Очевидно, что при x(t) € Я
функция A x(t) € Я, т. е. Я — инвариантно для оператора А.
3. Пусть К — произвольное л-мерное пространство, е—(е\, ..., еп) —
базис в Ку Я' = £{е\,... ,em}, m < п. Пространство Я будет
инвариантно для оператора проектирования Рн (см. п. 1.2).
Задание
Найти инвариантные подпространства в пространстве Кп (см. п. 1.1
гл. I) для операторов А\ и Лг, действующих по формулам:
- 26,6, • • • .61).
п.5.2. Обсудим вид матрицы оператора А в конечномерном
пространстве К при наличии инвариантного для А подпространства
Н\ с К. Пусть вь ... Ует — произвольный базис в Н\. Дополним его
векторами ет+\у... ,еп до базиса в К, и запишем матрицу ||Л||
оператора А в полученном базисе е\, ...,ет,ет+\, ...,еп. Так как в
силу инвариантности пространства Н\ для оператора А выполняется
Aej = Yl'iLi aijei ПРИ / < w, то в первых т столбцах матрицы ||Л||,
начиная со строки с номером т + 1, будут нули. Таким образом,
Ml ='
\
0
Если базис в Н\ может быть дополнен до базиса в К векторами
ет+\,..., еп таким образом, что подпространство Нъ = С{ет+\,..., еп }
тоже инвариантно для оператора Л, то тогда Aej — ]C"=m+i flve«»
у > m + 1. Поэтому в столбцах матрицы ||Л || начиная с (т + 1)-го
в первых т строках будут нули и матрица ||Л|| примет вид
(а\\ ...
ат\ ... атт
о
о
\
\
62
Глава II. Линейные операторы и их матрицы
где большой ноль обозначает, что все матричные элементы
данного блока равны нулю. Из сказанного следует, что если
пространство К разбивается в прямую сумму инвариантных для
оператора А подпространств Я{ и Яг, то в базисе /С, состоящем
из последовательно выписанных базисов пространств Н\ и Яг,
матрица ||Л|| имеет блочно-диагональный вид (см. п. 2.4), где
блоки на диагонали суть матрицы оператора ||Л|| в
пространствах Н\ и Яг. В общем случае, если пространство К разбивается
в прямую сумму ^=10Я/ инвариантных для оператора А
подпространств Я,-, с базисами е^\...,е^\ / = 1,...,/?, то в базисе
е = (е^\ ..., е^>..., е\р ,..., е^ ) пространства К, составленном
из выписанных подряд базисов подпространств Я,-, / = 1,2, ...,р,
матрица оператора А будет иметь блочно-диагональный вид
(Ах
О
А2
О
(5.1)
где A t — есть матрица оператора А в пространстве Я* в базисе е^ ,..., е\,.
При этом базисы подпространств Я,- могут быть выписаны в
любом порядке, а не только последовательно для / = 1,2,... ,р. Если
взять, например, в К базис
где /j, ..., ip — это числа 1,2,... ,p, переставленные в
произвольном порядке, то матрица ||Л|| примет блочно-диагональный вид
А,
О
о )
Л /о
где Л/;. — матрица оператора Л в пространстве Я;..
п.5.3. Пусть теперь пространство К над полем F не
обязательно конечномерно и линейный оператор А определен в некотором
подпространстве Da Я К, Da —► /f, которое может совпадать с /f.
Чрезвычайно важными для приложений являются такие инвари-
§ 5. Инвариантные подпространства —J\/- 63
антные для оператора А пространства U из Da, в которых оператор
действует как оператор умножения на константу, одну и ту же для
Ухе U.
Определение. Вектор х е Da называется собственным
вектором оператора А, отвечающим собственному значению А е F,
если
Ах = \х, хфв. (5.2)
Пространство U\C Da, состоящее из всех собственных
векторов х оператора А, отвечающих собственному значению А, и
нуль-вектора, называется собственным подпространством
оператора А, отвечающим собственному значению А. Таким образом,
цх = {х | х € DA, Ах = Хх, А € F}.
Замечание. Если пространство Da состоит из функций, то
собственные вектора называются собственными функциями.
Размерность собственного подпространства Ux называют
геометрической кратностью собственного значения А. Если
dim Ux > 2, то собственное значение А называется вырожденным.
Задание
Докажите, что Ux — действительно подпространство пространства DA.
п.5.4. Приведем примеры собственных векторов и собственных
подпространств, не останавливаясь пока на вопросе об их нахождении.
1. Пусть К = С[0,/], F = Rv A = -cf/dt2,
DA = {x(t)\x(t) e C2[0,l], x(0) = *(/) = 0}.
Прямая проверка показывает, что собственные значения А* и
собственные функции Uk(t) оператора А с областью определения Da
даются формулами
Uk = cikS\n— л, vdket, k =1,2,....
(об отсутствии других собственных функций и других
собственных значений и о способе нахождения^ указанных в примерах 1 и 2
см. п. 6.5).
2. Пусть по-прежнему К = С[0, /], F = Е и А = -cf/dt2, но в
качестве области определения оператора А возьмем
DA = {x(t)\x(t) e C2[0,/], jc'(O) = 0, *(/) = 0}.
64 -J\/> Глава II. Линейные операторы и их матрицы
Тогда собственные значения А^ л соответствующие собственные
функции tik суть
= ^ cos v 2/ ; /, VdkeF, k = О,1,2,...
Примеры 1 и 2 показывают, что в зависимости от области
определения один и тот же оператор в одном и том же пространстве может
иметь различные собственные значения и собственные вектора.
3. Пусть К — конечномерное пространство над полем F, еь ..., еп —
базис в /С, т е N — любое число, 1 < т <п, Н\ = С{е\,..., ет},
Яг = С{ет+\>.. .,еп}. Определим операторы проектирования Р#г.,
/ = 1,2 согласно п. 1.2. Тогда подпространства #ь Н% будут
собственными для обоих операторов Р#., причем для оператора Рщ
{Рн2} подпространство Н\ отвечает собственному значению Ai = 1
{Ai = 0}, а подпространство #2 — собственному значению М = 0
{А2 = 1}.
Собственные значения и собственные вектора имеются не у
любых операторов. Например, в пространстве К = С[0, /] у оператора
умножения на t нет собственных значений, ибо tx(t) ф Xx(t) при
x(t) ф 0 ни при каких А. Аналогично, в пространстве V<l векторов
на плоскости над вещественным полем оператор А^ поворота на
угол if около начала координат, 0 < <р < it, не имеет собственных
векторов, ибо если А^х = Ах, х е V**, хфв.ю вектор А^х должен
быть параллелен или антипараллелен вектору х, что невозможно
из геометрических соображений.
п.5.5. Свойства собственных векторов. Пусть Ai, ...,Am —
какие-либо различные собственные значения оператора А в
пространстве К над полем F, U\x,..., U\m — соответствующие
собственные подпространства.
Теорема 5.1, Собственные вектора, отвечающие различным
собственным значениям оператора А, линейно независимы.
Доказательство. Пусть Xj e U\j — произвольные
собственные вектора, / = 1,..., т. Покажем, что вектора Xj — линейно
независимы, т. е. что равенство
т
]Г CjXj = 0, cjGF (5.3)
выполняется только при с\ — c<i = ... = ст — 0. Пусть т = 2.
Тогда (5.3) принимает вид
С{Х\ + С2Х2 = в. (5.4)
66 JL Глава II. Линейные операторы и их матрицы
Теорема 5.2. Вектора системы е линейно независимы.
Доказательство. Рассмотрим произвольную линейную
комбинацию векторов ef и покажем, что обращение ее в нуль-вектор
возможно только при нулевых коэффициентах. Пусть
/=1 i=\
где cf e F. Положим х} = J^U cfef. Тогда z = Y^L\ */• Очевидно
Xj G U\r В силу теоремы 5.1 вектора Xj при Xj Ф в линейно
независимы и, значит, равенство z = в возможно лишь при xj = в для
всех у. То есть из равенства z = в следует, что
Х1 = Т,У^=в> / = Ь2,...,т. (5.8)
Поскольку вектора е^\ е% , ..., е% при V/, 1 < / < т, линейно
независимы, то все коэффициенты с,- в (5.8) равны нулю.
Следовательно, вектора системы е линейно независимы.
Замечание 1. Утверждение теоремы 5.2 справедливо и в
случае, когда
Yj
лр. ,
(m)\
рт ),
где х^\ ..., XpJ — произвольный набор pj линейно независимых
векторов из Uxjy возможно, не связанный с базисом.
Замечание 2. Теоремы 5.1 и 5.2 и их доказательства верны как
при dim К < -foo, так и при dim К = +оо.
п.5.6. Далее считаем п = dim К < +оо. Пусть Аь ..., Хт — это
все различные собственные значения оператора А в пространстве К и
£V (5.9)
Из теоремы 5.2 следует, что
5 < л, (5.10)
ибо число линейно независимых векторов в пространстве К не
может быть больше его размерности.
§5. Инвариантные подпространства —/\/- 65
Применив оператор А к обеим частям (5.4), имеем
С\Х\Х\ + С2А2Х2 = 0- (5.5)
Умножая (5.4) на Aj и вычитая из полученного соотношения
равенство (5.5), получим, что
Так как Х\ ^ Аг, то отсюда следует, что сг*2 = 0, а так как Х2 ф 0,
то С2 — 0. Поэтому и в силу (5.4) с\ — 0, т. е. вектора х\ и Х2 —
линейно независимы. Предположим, что линейная независимость
векторов jti,...,jtm доказана при m = k. Докажем, что вектора
х\,... ,хт линейно независимы при т = k + 1. Пусть для
некоторых с\ € Z7
*+1
^ад = 0. (5.6)
Применяя к равенству (5.6) оператор Л, получим
$>АЛ = 0. (5.7)
/=1
Далее действуем аналогично предыдущему: умножим
соотношение (5.6) на Ajfe+i и вычтем из полученного соотношения
равенства (5.7). Получим, что
1=1
Так как, по предположению индукции, вектора х\,... ,х^ линейно
независимы, то с,-(А,- — Ajfe+i) = 0, / = 1,..., k. Поскольку A*+i ф А,-,
/ = 1,2,..., kt то с,- = 0, i = 1,2,..., k. Учитывая это в (5.6),
получим Ck+\Xk+\ = в и, значит, Ck+\ = 0. Таким образом, все
коэффициенты С( в (5.7) равны нулю, и, следовательно, вектора х\, ...,хт
линейно независимы при т = Л+1. В силу индукции, вектора
хи • • •. *т линейно независимы при \/т. Теорема 5.1 доказана.
Пусть kj = dim U\j < +оо. Выберем в каждом из пространств U\}
базисы в| ,..., в^ , / = 1,2, ..., т, и положим
е - (J\) JX) J2) (2) (т) (т)ч
§ 5. Инвариантные подпространства -J\y- 67
Рассмотрим теперь случай, когда
S = n. (5.11)
Из теоремы 5.2 вытекает
Теорема 5.3. Условие (5.11) является необходимым и
достаточным для существования в пространстве К базиса из
собственных векторов оператора А.
Доказательство очевидно. Если S = п, то набор е из
теоремы 5.2 содержит п линейно независимых векторов и, значит, е есть
базис в К. С другой стороны, если в К имеется базис из
собственных векторов, то число So линейно независимых собственных
векторов в нем равно п, а так как S > So, то в силу (5.10) S = п.
Эквивалентным условию (5.11) является условие
>Ux.=K. (5.12)
Задание
Доказать равносильность требований (5.11) и (5.12).
Отметим, что если оператор А имеет п различных собственных
значений (т = п), то условие (5.11) выполняется и dimf/д. = 1,
у = 1,2,..., п. Действительно, в силу (5.10) и так как dim U\} > 1,
имеем п
откуда и следует наше утверждение.
п.5.7. Определение. Оператор А в пространстве К над
полем F назовем диагонализуемым, если в К существует базис
е\, ...,еп, в котором матрица \\A\\ = (ay) оператора диагональ-
нау т. е. ац = 0 при i Ф у.
Имеет место
Теорема 5.4. Оператор А диагонализуем тогда и только
тогда, когда в пространстве К есть базис из собственных
векторов оператора А.
Доказательство. Еслие = (еь ...,ея) — базис в/Си Ле,-=/?,•£,-,
pi £ F, / = 1,2,..., я, то матрица \\А \\е оператора А в базисе е имеет вид
68 —«1^ Глава II. Линейные операторы и их матрицы
С другой стороны, если в некотором базисе / = (/ь ... ,/я) матрица
\\A\\f оператора А имеет диагональный вид
°\
(5.13)
где а,- — некоторые числа из F, то, по определению матрицы
оператора, Aft = а,-/,-, т. е. базисные вектора — собственные.
В силу теоремы 5.3 условие (5.11) (или эквивалентное ему
условие (5.12)) является необходимым и достаточным для
диагонализуемости оператора Л. В частности, в силу п. 5.6 оператор,
имеющий п различных собственных значений, диагонализуем в
пространстве размерности п.
п.5.8. Интересна и полезна следующая нетривиальная
Теорема 5.5. Если оператор А диагонализуем в
пространстве К, то А — диагонализуем в любом подпространстве Я с /С,
которое инвариантно для оператора А.
Доказательство. Пусть Аь ..., Хт — все различные
собственные значения оператора А в К и U\i — соответствующие
собственные подпространства. Положим
VXi = UXiHH
и докажем, что
f> (5.14)
Поскольку подпространства V\i состоят из (попавших в Я)
собственных векторов оператора Л, то из (5.14) будет следовать
диагонализуемость оператора Л в Я.
Обозначим через е^\ i = 1,2,..., kj, (kj = dim U\.), базис в
подпространстве U\r В силу диагонализуемости оператора Л в А"
вектора е = (e{i\ ..., 4*\ ..., е\т\ ..., e{j£) образуют базис в К. Пусть
х € К. Тогда
* = £Х>Ре (5.15)
где of — координаты вектора х в базисе е. Положим
1=1
§ 5. Инвариантные подпространства —'ъ- 69
В силу (5.15)
* = Х>/, (5.16)
где, очевидно, Xj £ U\r Докажем, что если х £ Я, то х\ £ V\} и что
вектора Xj определяются по х однозначно. Отсюда и будет
следовать (5.14), а, значит, и утверждение теоремы 5.5.
п.5.9. Применим к равенству (5.16) операторы As, s = 1,2,..., т -1.
Тогда мы получим равенства
т
Asx = J2X$ixh s = l,2, ...,m-l. (5.17)
Соотношения (5.16), (5.17) можно рассматривать как систему т
линейных неоднородных уравнений относительно неизвестных век- .
торов Xj, j = 1,2,..., т. Ее определитель не равен нулю (это
определитель Вандермонда). Поэтому из (5.16) и (5.17) следует, что
т-\
Xj = J^ С4А'Х' / = 1,2,..., m, (5.18)
s=0
где cSj — некоторые числа из поля F> А° = /. Так как х £ Н и
подпространство Н инвариантно для оператора Л, то правые части
равенств (5.18), а, значит, и вектора Xj принадлежат пространству Н.
Поскольку Xj £ Н и Xj £ U\r то Xj £ Vj, / = 1,2,.... m. Покажем
теперь, что составляющие Xj вектора х в (5.16) определены
однозначно. Действительно, если бы существовало другое разложение
* = Е4 XjtVxn (5.19)
то приравнивая (5.16) и (5.19) мы получили бы
т-е-
Х>*;) = «. (5.20)
.. ,;■;•■
Но вектора х} — х^ j — 1,..., т при Xj — x'j Ф в суть собственные
вектора, отвечающие различным собственным значениям А7
оператора А и, значит, они линейно независимы. Поэтому из (5.20)
следует, что Xj — x'j = в, т. е. х} = x'j. A
70 —'l/- Глава II. Линейные операторы и их матрицы
п.5.10. В заключение рассмотрим вопрос об одновременной
диагонализуемости семейства диагонализуемых операторов Ль ..., Лр,
действующих из К в К.
Теорема 5.6. Для одновременной диагонализуемости
семейства диагонализуемых операторов А\А2> ---Ар, К —^ К,
необходимо и достаточно, чтобы они попарно коммутировали
между собой:
AtAj = A}Ah Ц =1,2, ... ,р.
Замечание. Утверждение теоремы означает, что в пространстве
К существует такой базис, в котором матрицы всех операторов
Ль A<i,..., Ар диагональны.
Доказательство. Необходимость почти очевидна.
Действительно, если операторы Л, одновременно диагонализируемы, то в
некотором базисе их матрицы ||Л,|| диагональны. Но диагональные
матрицы коммутируют между собой и, значит, операторы A(Aj и AjAt
имеют одну и ту же матрицу, ибо
Поэтому A(Aj = AjAi и необходимость доказана.
Докажем достаточность. Мы проведем рассуждения только
при р = 2. Пусть А/ и U\n j = 1,2,..., m, — собственные значения и
соответствующие собственные подпространства оператора Лг. Так
как оператор Лг диагонализуем, то
/f = tef/v (5.21)
Докажем, что подпространства U\j инвариантны для оператора Ль
Пусть хе U\r Тогда A2X — XjX. Применяя оператор А\ к обеим
частям этого равенства и учитывая, что Л1Л2 = ЛгЛь имеем
A\A<ix = АчА\х — \jA\x.
Следовательно, вектор у = А\х или равен в или является
собственным вектором оператора Лг, отвечающим собственному значению А;.
Поэтому А\х £ Uxj при V* € U\i и, значит, подпространство U\}
инвариантно для оператора Ль Так как оператор А\
диагонализуем в /С, то в силу теоремы 5.5 А\ диагонализуем в U\r
Выберем в подпространстве [/лу диагонализующий для оператора А%
базис е® = (efy . ..,ej^) и в качестве базиса е в К возьмем набор
§6. Отыскание собственных векторов и собственных значений —f\^ 71
базисов е® :=е= (е{!\ ..., е®,..., е\т\ ..., е^). Тогда в базисе е
оба оператора А\ и Л2 будут иметь диагональные матрицы в /С,
ибо каждый из них имеет диагональные матрицы в
подпространствах U\n а пространство К в силу (5.21) есть прямая сумма
подпространств U\r
Задание 1
Методом математической индукции доказать теорему для Vp > 2.
Задание 2
Объясните, каков точный смысл фразы: «коммутирующие между
собой операторы имеют общую систему собственных векторов». В
частности, верно ли утверждение, что если Л1Л2 = А^А\ их — собственный
вектор оператора А\у то х — собственный вектор оператора А%.
§6. ОТЫСКАНИЕ СОБСТВЕННЫХ ВЕКТОРОВ
И СОБСТВЕННЫХ ЗНАЧЕНИЙ
п.6.1. Пусть К — линейное пространство над полем F
и линейный оператор Л действует из К в К. В настоящем
параграфе мы покажем как находить собственные значения и
собственные вектора для любого оператора Л в случае п = dim/С < 4-оо
(пп. 6.1-6.3), а также для некоторых операторов Л в
бесконечномерных пространствах (см. пп.6.4 и 6.5). Пусть п = dim К,
е = (в[,..., еп) — произвольный базис в К и \\А\\ = (ац) — матрица
оператора Л в базисе е. Предположим, что А — собственное
значение оператора Л, а х — соответствующий собственный вектор, т.е. что
Ах = \х, хфв. (6.1)
Разложим вектор х по базису е\,... ,еп и вычислим Ах. Имеем
п
to, Ax =
Подставив выражения х и Лх в (6.1), видим, что
п . п v п
/=1 1=1 4 /
Приравнивая между собой коэффициенты перед базисными
векторами £у в правой и левой частях этого равенства, имеем
X>/iu = A£/. /=1,2,...,/г. (6.2)
72 —'Ъ- /лава //. Линейные операторы и их матрицы
Таким образом, для нахождения неизвестных координат £,-
собственного вектора х и собственного значения А мы получили
систему п однородных линейных уравнений относительно £ь£г, ...»£«♦
содержащую А в качестве параметра. Запишем систему (6.2) в виде
п = О I
> (Ь.З)
... + (апп ~ Жл = О
Так как собственные вектор хфв, то нас интересуют только не
нулевые решения системы (6.3). Для их существования
необходимо и достаточно, чтобы определитель А(А) системы (6.3) равнялся
нулю, т.е. чтобы
Д(А) = det |И - А£|| =
а\\ — А а\ч ... а\п
#21 Я22 — А ... а2п
ап\ аП2 • ♦ ♦ йпп - А
= 0. (6.4)
Уравнение (6.4) называется характеристическим и именно из него
находятся собственные значения оператора А. Раскрывая
определитель Д(А), запишем характеристическое уравнение (6.4) в виде
\п + М"-1 + ... + 6«-i А + Ьп = 0, (6.5)
где коэффициенты Ь{ выражаются через элементы матрицы
Нас интересуют только те корни А уравнения (6.5), которые
принадлежат полю F.
Определение. Алгебраической кратностью собственного
значения А называется алгебраическая кратность корня X уравнения (6.5).
Если уравнение (6.5) не имеет корней из поля F, то
оператор А не имеет собственных значений и собственных векторов в
пространстве К над полем F. В то же время над другим полем
оператор А может иметь собственные значения. Например, при
F = С — собственные значения существуют всегда.
Предположим, что характеристическое уравнение (6.5) имеет
корень А е F. Подставим это значение А в (6.3) и перепишем
систему (6.3) в виде
(6.6)
§6. Отыскание собственных векторов и собственных значений —'!/- 73
Пусть ранг матрицы \\А — ХЕ\\ равен р. Тогда согласно п. 2.4 гл. I
система (6.6) имеет ровно п — р линейно независимых решений, и,
значит, оператор А имеет п — р линейно независимых собственных
векторов, отвечающих собственному значению А. Другими
словами, размерность собственного подпространства U\ (т. е.
геометрическая кратность собственного значения А) равна п — р. Линейно
независимые решения системы (6.6), т. е. базис собственного
подпространства U\, можно найти по методике пп. 2.4, 2.5 гл. I.
п.6.2. Примеры. В конечномерном пространстве К над полем
F = R рассматривается линейный оператор Л, К —> К. Наша цель —
найти собственные значения и собственные вектора оператора А.
Пример 1. Пусть К = V2 — пространство векторов на
плоскости ху у, А = Ар — оператор поворота на угол <р, О < ip < 2тг, около
начала координат. Для получения матрицы ||Л^|| в базисе ех,еу,
вектора которого имеют единичные длины и направлены по
координатным осям х и у, находим
Арвх = cos <р • ех + sin ip • еу, А^еу = — sin <p • ех 4- cos <p • еу.
Следовательно,
и л ц _ /cosv? -sin^A
" ^ ysimp cos <pj
и характеристическое уравнение (6.5) запишется в виде
А)2 + sin2 ip = 0. (6.7)
При ф^0,(р^ж уравнение (6.7) не имеет вещественных корней и,
значит, при ip ф О,тг оператор А^ не имеет собственных значений
и собственных векторов (мы уже упоминали об этом в п. 5.3,
исходя из геометрических соображений). Пусть теперь ip = 0. Тогда
в силу (6.7) А = 1 и матрица ||Ло - А£|| будет нулевой. Поэтому
ранг р(||Ло - А£||) = 0 и, значит, размерность собственного
подпространства U\ = U\ равна 2 — 0 = 2. Но dim V2 = 2, и,
следовательно, U\ = V2, т.е. любой вектор лс, х € Уг> — собственный,
отвечающий собственному значению А = 1. Разумеется, это можно
было бы сказать и без вычислений, ибо А^ при tp = 0 — это
тождественный оператор /, для которого / •х = х при Vx e VV Пусть
теперь (р = тг. Тогда из (6.7) получаем А = — 1. Как и при <р = 0,
матрица \\А<р - ХЕ\\ = \\Ап - (-\)Е\\ — нулевая, поэтому dim U-\ = 2 и
£/_, = у2. Опять-таки, это можно было заметить сразу, ибо
оператор поворота на угол тг фактически есть оператор умножения на (-1).
74 —' w- Глава II. Линейные операторы и их матрицы
Пример 2. Пусть
Тогда характеристическое уравнение (6.5) есть уравнение
(1 — А) = 0 и, значит, матрица ||Л|| имеет единственное
собственное значение А = 1; его алгебраическая кратность q = 3. Матрица
(О 2 0\
0 0 3
О О
имеет ранг 2 и поэтому dim U\ = 3 - 2 = 1. Система (6.6) в данном
случае примет вид
26 = О,
36 = 0.
Значит £2 = 6 = 0, £i — произвольно и
Л)х = U\ = {л;|л: = (с,О,О), Vc€R}.
Отметим, что в данном примере геометрическая кратность k =
= dim U\ = 1 собственного значения А = 1 строго меньше его
алгебраической кратности q = 3.
Пример 3. Пусть
/2 1 0\
И11= 120
\0 0 l)
Тогда характеристическое уравнение (6.5) есть уравнение
Отсюда Ai = 1, А2 = 3. Алгебраические кратности qt корней А,- суть
q\ = 2, q<i = 1. Найдем собственные вектора, отвечающие этим
собственным значениям. Пусть А = Ai = 1. Тогда
р(\\А - ХЕ\\) = 1, и значит dim UXl = 2.
Система (6.6) принимает вид
§ 6. Отыскание собственных векторов и собственных значений —l\f 75
Отсюда £i = —£2- Действуем согласно пп. 2.4, 2.5 гл. I. При & = 1»
£3 = 0 получаем £i = — 1. При & = 0, £з = 1 получим £i = 0. Таким
образом собственные вектора, отвечающие А = 1, суть
Хх = (-1,1,0), Х2 = (0,0,1).
Пусть А = Л2 = 3. Тогда р(\\А - М\\) = 2. Значит, dim U\2 = l.
Система (6.6) принимает вид
-26 = 0.
Отсюда £i = £2» £3 = 0. Значит, в качестве собственного вектора
можно взять Y\ = (1,1,0). Задача решена полностью. Заметим, что
в данном примере для обоих собственных значений
геометрическая и алгебраическая кратности совпали. Кроме того, в примере 3
Й=1 dim U\i — dim/Г и, значит, матрица ||Л|| диагонализуема, в то
время как в примере 2 этого нет.
п.6.3. Докажем ряд простых утверждений о геометрической и
алгебраической кратностях собственных значений в
конечномерных пространствах.
Лемма 6.1. Алгебраическая и геометрическая кратности
собственного значения не зависят от выбора базиса в пространстве К.
Доказательство. Для геометрической кратности
утверждение очевидно, ибо число линейно независимых собственных
векторов оператора Л, отвечающих собственному значению А, есть
свойство оператора, которое не зависит от выбора базиса.
Докажем утверждение леммы 6.1 для алгебраической кратности. Пусть
/ = (/ь •.., /л) и е = (еь ..., еп) — базисы в К, \\P\\ — матрица
перехода от базиса е к базису /, ||Л||^ и ||Л||е — матрица оператора А
в базисах / и е. Тогда в силу (4.14)
1И11/ = 1НГ'|Иу/>||
и поэтому
IH-Afll^llPir'ili-AEIIJIPH, (6.8)
где Е — единичная матрица. В силу (6.8)
det \\A - XE\\f = det ЦРЦ"1 det \\A - А£||е det ||/>|| = det \\A - ХЕ\\е
76
Глава II. Линейные операторы и их матрицы
и, следовательно, характеристические уравнения для матриц ||Л||г
и ||Л||е совпадают. Поэтому алгебраическая кратность
собственного значения не зависит от выбора базиса.
Лемма 6.2. Геометрическая кратность собственного
значения не превосходит его алгебраическую кратность.
Доказательство. Пусть а — собственное значение
оператора Л, k — dim U\ и g\, ... ,gk — базис в собственном
подпространстве U\. Достроим этот базис векторами g£+i,...,gn до базиса
g = (gi,... ,gn) всего пространства. Тогда в базисе g матрицы \\A\\g
и \\А — А£|| соответственно примут вид:
о
а
О
О
О
dm
d2n
a dk,k+\ dk.k+2 ••♦
dk+\jk+\
dn,k+i dn,k+2 • • • dnn
a-vX 0 ... 0
0 a-X ... 0
0 a—A dk,k+i dk.k+2 .-.
0
Следовательно, характеристическое уравнение
dn,k+2 • • • dnn—X
запишется в виде
(а - А)*
= О,
(6.9)
где
= det
— X
dn,k
dn,k+2
— X
Пусть b > 0 — кратность корня X = а уравнения ^(А) = 0. Тогда
алгебраическая кратность собственного значения Х = а
оператора А в силу (6.9) равна k 4- b > k, что и требовалось доказать. А
§ 6. Отыскание собственных векторов и собственных значений
11
Лемма 6.3. Геометрическая кратность любого
собственного значения диагонализуемого оператора равна его
алгебраической кратности.
Доказательство. Пусть Aj,...,Ap — все различные
собственные значения оператора А в конечномерном пространстве К и
е\1\ ..., е® — базис в собственном подпространстве U\.y / = 1,2,..., р,
отвечающем собственному значению А,-. Так как оператор диаго-
нализуем, то вектора е^\ ..., е^\ ..., e*f \ ..., е% образуют базис
в /С. В этом базисе матрица оператора А имеет диагональный вид
О
О
Ар/
где число А, повторяется на диагонали kt раз. Поэтому
характеристическое уравнение det ||Л - А£|| = 0 имеет вид
Отсюда следует, что алгебраическая кратность собственного
значения А,- равна его геометрической кратности k\, i = 1,2,... ,р. В силу
леммы 6.1 это утверждение справедливо при любом выборе
базиса в К. А
п.6.4. В заключение рассмотрим два важных для приложений
примера нахождения собственных значений и собственных
векторов некоторых операторов в бесконечномерных пространствах. Пусть
1. Найдем собственные значения и собственный функции
интегрального оператора
ь
/=1
где <pi(x),i/;i(x) G C2[ab] — известные функции и ц>\,...,ч>п —
линейно независимы. Пусть А — собственное значение
оператора А и / — соответствующая собственная функция. Тогда
Af = \f,
78 Jl/i Глава II. Линейные операторы и их матрицы
т.е.
£ Ш Ш № dy = А/(х). (6.10)
Легко видеть, что одно из собственных значений — это А = 0 и что
соответствующее (бесконечномерное) собственное подпространство
Ux = Uo = {/(х) | /(х) € £2[a*], (A iM = 0, / = 1,2,..., л}.
Задания
1. Докажите, что подпространство Uo содержит все собственные
функции оператора Л, отвечающие нулевому собственному значению.
2. Найдите Uo в ситуации, когда функции (p\,...,ipn — линейно
зависимы.
Пусть теперь А ф 0. Тогда из (6.10) следует, что собственная
функция f(x) должна иметь вид
где & — неизвестные константы. Подставляя (6.11) в (6.10) и
приравнивая друг другу коэффициенты перед функциями <pj в обеих
частях полученного равенства, получим
J2aH^ = ^h /=1,2,...,д, (6.12)
где ац = jbaipj(y)<Pi(y)dy. Полученная система (6.12) совпадает с
системой (6.2) и, значит, ее решения (£ь •••.£«) и собственные
значения А можно найти так, как указано в п. 6.1.
Задание
Найдите условия существования у оператора А собственных
значений и собственных функций в области Da = C[a6], если в выражении Af
<pi€C[ab]% <p,tC[ab]J>2.
п.6.5. В пространстве £2[я&] над полем F = С найдем
собственные значения и собственные функции дифференциального оператора
Af=-ci£gf + c2f (6.13)
с постоянными вещественными коэффициентами с\ > 0, с^ в области
Da = {/(*)!/(*) € С2[0,/], /'(0) = 0, /(/) = 0}.
§ 6. Отыскание собственных векторов и собственных значений -J Ь- 79
Пусть А — собственное значение оператора А и / € Da —
соответствующая собственная функция. Имеем
Отсюда следует равенство
|./+Л^/ = 0. (6.14)
Покажем, что величина и; = (А — C2)cj~l — положительна.
Умножим равенство (6.14) на f(x) скалярно в С% [0,/] и проведем в
полученном соотношении интегрирование по частям. Получим
/ /" /
= -1 \rfdx + Пх)](х)(0 + J Z\f\2dx =
|2Л = 0, (6.15)
о о
ибо /'(О) = /(/) = О. В силу (6.15) uj > 0. Если и = О, то
вследствие (6.15) выполняется f (х) = О, т.е. f(x) = const. Но поскольку
f(x) & Da, to /(/) = 0 и значит f(x) = 0. Поэтому и) > 0. Положим
и2 = ш. Тогда из (6.14) следует, что
f(x) = A sin их + В cos ujx.
Так как / € Da, то /'(0) = Ла; = 0, откуда Л = 0. Из условия /(/) = О
имеем cos ul = 0 и, значит, ul = тг/2 -f тг£, £ = 0,1, Таким
образом, о; = о;* = тг(1 + 2£)/(2/) и, следовательно,
А — Со о
=о;| =
С\
откуда для собственных значений А^ оператора Л в Da получается
выражение:
Ajfe = С\ g—■—V С2, « = 0,1,2,....
4/
Соответствующие собственные функции Д = B^cos^jc, где В^ —
произвольные константы. Если нас интересуют нормированные
собственные функции, то из условия J0B|cos2 (Jkxdx = 1 получаем, что
О
т. е. Bk = y/2/l и fk(x) = л/2/7
80 —'is- Глава II. Линейные операторы и их матрицы
Замечание. Если оператор А, рассматривался на области
D'A = {fix) I f(x) € C2[ab], f(a) = 0, f(b) = 0},
то с помощью замены х' = x — а, мы получаем уже решенную
задачу с / = b - а.
Задания
1. Найти собственные значения и нормированные собственные
функции оператора А\ = А в области
DAl = {/(*) | fix) € С2[0, /], f(0) = /'(/) = 0}.
2. Действуя по схеме п. 6.5 убедиться, что в примере 1 п. 5.3 указаны
все собственные значения и собственные функции оператора А = -22
в области DA = {/(*) | /(*) € С2[0, /], /(0) = ДО = 0}.
ГЛАВА
III
ЖОРДАНОВА НОРМАЛЬНАЯ
ФОРМА МАТРИЦ
§1.
РАНГ И ДЕФЕКТ ЛИНЕЙНОГО ОПЕРАТОРА
п.1.1. Введем ряд важных понятий. Пусть К —
линейное пространство над полем F и В — линейный оператор,
действующий из К в К.
Определения
Множеством значений ВК оператора В называется линей-
ное пространство
ВК:={Вх\х€К).
Рангом г(В) оператора В называется размерность
пространства ВК:
r(B): = dim BK.
Ядром КегВ оператора В называется его собственное
подпространство, отвечающее нулевому собственному значению:
Дефектом d(B) оператора В называется размерность его ядра:
d(B): = dim KerB.
Теорема 1.1. Пусть линейный оператор В действует из К в К,
п = dim К. Тогда
r(B) + d(B) = n. (1.1)
Доказательство. Пусть d = d(B) и еь...,е<* — базис
ядра N = КегВ оператора В в пространстве К. Дополним этот базис
произвольным образом до базиса е\, ...,ед*в<*+ь • • •»£п всего про-
82 JU Глава III. Жорданова нормальная форма матриц
странства и пусть Н\ = £{е<н-ь^н-2. •••»^}, где C{x,y,z,...} —
линейная оболочка элементов х, tf, 2, Очевидно, iV=£{ei,..., ed}
и в силу п.3.3 (гл.1) K = N®H{.
Так как BN = {0}, то
ВК = ВН{. (1.2)
Значит, размерности пространств В/С и B#i совпадают. Докажем,
что
dimBtfi =dim//i. (1.3)
Тогда в силу (1.2)
что и требовалось доказать.
Итак, остается проверить (1.3). Для этого достаточно
убедиться, что вектора 5е</+ь . ..,Вел линейно независимы. Но если бы
вектора Веп j = d + 1,..., я, были линейно зависимы, то ЕЦ- е F
такие, что
т. е. что
(£)*. (1.4)
где не все числа с/, / = d + 1,..., п равны нулю. Но (1.4) означает,
что вектор у = XlLd+i c-fii принадлежит ядру, и, значит, у может
быть разложен по базису ядра, т. е. для некоторых чисел Cj G /\
/ = 1,2,....rf,
y = J2cier
/=1
Таким образом,
/=^+1 /=1
В силу линейной независимости элементов базиса е\,..., еп из (1.5)
следует, что все с7 = 0, / = 1... я, что невозможно для / = d4-1, ..., п.
Следовательно, предположение о линейной зависимости векторов Ве;,
/ = d + 1,..., п, ошибочно и равенство (1.3) верно. Теорема доказана.
§ L Ранг и дефект линейного оператора —/\/. 83
п.1.2. Следствия.
1. Дефект оператора В равен нулю тогда и только тогда, когда
ВК = К. (Доказать самостоятельно!)
2. Чтобы оператор В был обратим, необходимо и достаточно,
чтобы его дефект равнялся нулю.
Действительно, d(B) = 0 если и только если г(В) = п. Но
равенство г(В) = п означает, что dim ВК = dim К, т. е. что ВК = К, а
это равенство есть необходимое и достаточное условие
существования обратного оператора.
3. Ранг оператора равен рангу его матрицы.
Рассмотрим уравнение Bx — Q. Согласно п. 2.4 (гл.1) число
его линейно независимых решений равно п - р(||В||), где ||В|| —
матрица оператора В в произвольном базисе, а р(||В||) — ее ранг.
С другой стороны, решения уравнения Вх — 9 образуют ядро
оператора В, и, следовательно, число линейно независимых
решений этого уравнения равно размерности ядра, т.е. d(B). Поэтому
d(B) = п - р(||В||), а в силу теоремы 1.1 d(B) = п — г(В). Отсюда и
следует равенство р(||В||) = г(В).
Задание
Доказать, что подобные матрицы имеют одинаковый ранг.
п.1.3. Используя теорему 1.1, докажем очень важную лемму,
которая систематически будет применяться в дальнейшем.
Пусть К — линейное пространство над полем F и линейный
оператор В действует из К в К, п = dim К, ВК и N — множество
значений и ядро оператора В. Обозначим через М пересечение
пространств N и ВК:
M = Nf)BK. (1.6)
Очевидно, что М — линейное пространство. Выберем в М базис
х\у... ,хт и дополним его сначала до базиса х\, • • • >*т»*т+ь • • • >*d
ядра N (здесь d = d(B))> а потом до базиса х\,... ,xm, x'm+v ...yx'r
пространства ВК (здесь г = г(В)). Обозначим через у\,...,ут
прообразы векторов jti,...,хт и через гт+ь ..., zr — прообразы
векторов Jt^+i,... ,лс' при отображении оператором В, т.е.
= jc/, / = 1, ...,т; б)Вг^^=х-, / = т+1,..^г1*. (1.7)
0 Вектора # и z* определены не однозначно, но для нас это не
существенно.
84 —f \s- Глава HI. Жорданова нормальная форма матриц
Лемма 1.1. Вектора Г = (х\,,.. ,*</,*/!, ... ,y«,zm+i,... ,zr)
образуют базис в линейном пространстве К.
Замечание. Словесная формулировка леммы 1.1, облегчающая
ее понимание, может быть дана следующим образом. Мы строим
сначала базисы ядра и множества значений оператора В, начиная
каждый из них с базиса в М — N П ВК, а затем для базиса в ВК
берем прообраз — это г/ь ...,ут, zm+\y..., zr. Утверждение леммы 1.1
означает, что объединение Г базиса N и прообраза базиса ВК,
построенных таким образом, дает базис в пространстве К.
п.1.4. Доказательство леммы 1.1 проще, чем ее формулировка.
Действительно, общее число векторов в наборе Г равно d + г = п в
силу теоремы 1.1. Поэтому для справедливости леммы достаточно
установить линейную независимость векторов набора Г.
Предположим, что вектора Г линейно зависимы, т. е. что для некоторых
констант С(у i = 1,..., d, Ьи i = 1, ..., m, a*, i = т + 1,..., г, не все
из которых равны нулю, выполняется равенство
1=1 /=1 i=m+l
Применяя к обеим частям соотношения (1.8) оператор В и
учитывая (1.7), получим
т г
Y,biXt+ J2 ыА = в- (1.9)
i=l /=m+l
Но вектора Х\,Х2, . .-,xm,x'm+v ...,x'r образуют базис в
пространстве ВК и поэтому из (1.9) следует, что все числа bt и а,- равны
нулю. Но тогда в силу (1.8)
откуда в силу линейной независимости векторов х\, ..., Xd
следует, что ct = 0, i = 1,2,..., d. Таким образом мы получили, что все
числа сь Ь[ и а/ равны нулю, что противоречит их выбору.
Поэтому предположение о линейной зависимости векторов Г неверно и,
значит, они образуют базис в К.
Задание
Провести доказательство леммы 1.1 в случаях М = {в}, M=N и
М = ВК.
§ 2. Теорема о жордановой нормальной форме —»\у- 85
§ 2. ТЕОРЕМА О ЖОРДАНОВОЙ
НОРМАЛЬНОЙ ФОРМЕ
п.2.1. Рассматриваем далее только случай, когда F есть
поле С комплексных чисел. Пусть произвольное число Ао € С.
Назовем жордановой клеткой порядка р квадратную матрицу ||Qao||
порядка р, имеющую вид
/Ао 1 0 О \
О Ао 1 О
1К?АоИ=
О 0 Ао 1
\ О 0 О Ао/
В жордановой клетке ||Qao|| на главной диагонали находится одно
и то же число Ао, над главной диагональю расположена
диагональ из единиц, а все остальные элементы равны нулю, т. е. если
IIQaoII = (я*/)> то пц = Ао, / = 1,2,... ,р, ац+\ = М = 1,2,... ,р - 1,
aij = O при (*,/') ф (/,/), (i,i + 1). Если рассматривать жорданову
клетку как матрицу некоторого линейного оператора А в
произвольном базисе е\,...,ер некоторого р-мерного линейного
пространства К у то очевидно Ае\ = Ао^ь Aei = Ао#2 + е\... и
вообще Ае}- = Ао^у + ву_ь у = 2,... ,р. Характеристический многочлен
жордановой клетки, очевидно, равен (Ао — А)р и, значит, оператор
с матрицей ||Qao|| имеет в К единственное собственное значение Ао
и оно имеет алгебраическую кратность р и одномерное собственное
подпространство (последнее утверждение следует из равенства
p(||Qa0 ~ МЩ) — Р — !)• Поэтому при р > 1 жорданова клетка не
может быть диагонализована ни в каком базисе.
Если матрица ||Q|| состоит из жордановых клеток произвольных
порядков, расположенных на диагонали, а остальные элементы ||Q||
равны нулю, то говорят, что матрица ||Q|| записана в жордановой
нормальной форме. Другими словами, матрица в жордановой
нормальной форме имеет блочно-диагональный вид
где блоки Qa/ суть жордановы клетки каких-то порядков р;.
Отметим, что числа Аь Аг,..., As в жордановых клетках не обязательно
различны. Заметим также, что диагональная матрица — частный
случай жордановой нормальной формы, когда все жордановы
клетки одномерны.
86 -j\j- Глава Ш. Жорданова нормальная форма матриц
п.2.2. Теорема 2.1 (о жордановой нормальной форме).
Матрицу любого линейного оператора Л, действующего в
конечномерном пространстве Н над полем F = С, можно привести к
жордановой нормальной форме, выбрав в Н подходящий базис.
Доказательство теоремы о жордановой нормальной форме
(ЖНФ) сводится к построению базиса, в котором матрица
оператора Л будет иметь ЖНФ. Этот базис называется жордановым.
Докажем теорему 2.1, т.е. построим жорданов базис —
сначала в частном случае, когда оператор Л имеет в Н единственное
собственное значение а (а — произвольное фиксированное
число). Пусть Аа = A -otl (I — тождественный оператор). Так как
пространство #о = Н инвариантно для оператора Л, то оно
инвариантно и для оператора Аа. Рассмотрим последовательность
пространств #s = AaHs-\ = Asa Hq, s = 1,2, Почти очевидно, что
//о2Я,ЭЯ2Э... . (2.1)
Действительно, поскольку Hs+\ = Л^Ла#о> Hs = AsaHo и так как
АаНо С #о, то #s+i С HSy т. е. включение (2.1) доказано. Докажем,
что на самом деле если Hs ф {0}, то имеет место строгое включение
Я5+1 С Н8. (2.2)
Ранг и дефект линейного оператора В в произвольном линейном
пространстве К будем обозначать соответственно через г(В;К) и
d(B\K). По определению r(AaiHs) = dim#s+i. Оператор Аа имеет
в исходном пространстве Но единственное собственное значение —
число 0, ибо оператор Л имел в Но единственное собственное
значение а. Так как поле комплексное, то при Hs ф {в}
характеристический многочлен оператора Аа в Hs имеет хотя бы один корень,
который обязательно равен нулю, ибо Hs С Яо. Следовательно,
существует собственное подпространство оператора Аа в HSi
отвечающее его нулевому собственному значению, и d(Aa; Hs) > 1. В силу
теоремы 1.1
Поэтому и так как r(Aa;Hs) = dim#5+i, имеем
dim#s - dim//s+1 = d(Aa;Hs) > 12). (2.3)
2) Из равенства (2.3) видно, что при переходе от Hs к Hs+\ размерность
пространства уменьшается на величину размерности ядра оператора Аа
в пространстве #s.
§2. Теорема о жордановой нормальной форме -Jb- 87
Отсюда и из (2.1) следует справедливость включения (2.2).
Таким образом, мы получаем цепочку суживающихся вложенных друг
в друга подпространств Hs. Следовательно, найдется такое k > О,
что Hk ф {0}, Hk+\ = {0}. Заметим, что равенство AaHk = {0},
означает, что Л*+1#о = {0}» т. е. что Л*"1"1 — нулевой оператор в Н.
Обозначим через Ns ядро оператора Аа в пространстве Hs и
рассмотрим ядра No,N\t ...,Nk. N\ — ядро оператора Аа в Н\у состоит из
тех векторов ядра Л/о, которые оказались в Н\ = АаНо. И далее —
ядро Ns каждого «следующего» пространства Hs получается из
ядра Ns-\ «предыдущего» пространства #s_i, если взять те вектора
из Ns-\9 которые попали в пространство Hs, т.е.
Ns=Ns.{nHs. (2.4)
Это соотношение будет базовым в дальнейших рассуждениях.
п.2.3. Переходим к построению в пространстве Н базиса, из
которого перегруппировкой элементов мы получим жорданов
базис. Поскольку AaHk = {0}, то Nk — Hk. Строим базис х\у ♦.. ухРх в
пространстве Hk и дополняем его до базиса ядра Nk-\
«предыдущего» пространства Hk-\: пусть х\, ... ,xPl,xPl+\f... УхР2 — базис
ядра Nk-\ (p2 = dimNk-\). Обозначим прообразы элементовх\у ...УхРх
в Hk-\ через у\у... ууРхУ т. е.
Aayi = *i> i — 1,2, ...,рь
Тогда согласно лемме 1.1 вектора
образуют базис в пространстве Hk-\.
Пусть Hk-\ ф Но. Построим теперь базис в Нк-2- Для этого
дополним базис х\,...,хР2 ядра Nk-[ =Nk-2^Hk-\ до базиса ядра Л/*_2.
Пусть х\у... ,хР2+1, ... ухРг — базис в Л^_2. Далее возьмем
прообразы элементов базиса Г*-!.3* Прообразы векторов х\у... ухРх уже
определены — этоу\, ...ууРх\ прообразы векторовjcp,+i,...,хР2
обозначим через #р,+1,...,уР2У а прообразы векторов у\,...,yPl —
через Z\y ...yzPxy т.е.
Согласно лемме 1.1, вектора
образуют базис в пространстве Hk-2-
3) Прообразы векторов пространства Hs всегда берутся из пространства Я5_ь
88 —'Ь- Глава IIL Жорданова нормальная форма матриц
Если Hk-2 фЩ, то делаем следующий шаг аналогично
предыдущим. Берем базис х\у...,хРз яДРа ^k~2 и дополняем его до
базиса ядра Л/*_з «предыдущего» пространства. Пусть
полученный базис — это х\,...ухРг,хРъ+\, ...,хРА. Затем строим прообразы
векторов базиса Г^_2- Прообразы векторов х\, ...,хР2 и у\>... ,уР]
уже имеются: это соответственно у\,...,уР2 и г\,...,zPl.
Обозначим прообразы векторов #Р2+ь ...,хРз и z/p,+i, .. .,уР2
соответственно через Уръ+и^чУръ и zPl+u ... ,zP2, а прообразы векторов
г\,..., zPl — через ui, ..., uPl, т. е. теперь
Aayi = xh / = 1, ...,рз, Лаг/ = г/ь i = 1 Р2.
Аащ = zti i = I, ...,pi.
Согласно лемме 1.1, вектора
образуют базис в #^_з.
При #б_з ^ ^о мы повторяем аналогичную процедуру
построения базиса. А именно, дополняем базис х\, ...,хР4 ядра Л/^-з До
базиса х\,. ..,xP4+i, ...,л:р5 ядра A^fe_4, а затем берем прообразы
векторов из Г^_з, обозначая прообразы векторов х(, yt и z,-
соответственно через yi, Zi и щ, а прообразы W/ — через до,-. Согласно
лемме 1.1, вектора
образуют базис в пространстве #*_4, причем по построению
(2.5)
aWi = Ui, i = 1 pi J
Если Я^_4 т^ Яо, то, действуя аналогично, мы можем построить
базис в пространстве #^_5 и т. д. Для простоты мы ограничимся здесь
случаем k = 4, т. е. считаем, что #^_4 = Яо.
п.2.4. Исходя из базиса Г^-4 мы строим жорданов базис Г
следующим образом:
Г = (x\,y\,Z\,U\,Wu .••>*р,,#р,,2р!,Ир1,ДОр1,
§2. Теорема о жордановой нормальной форме —'Ь- 89
Этот базис состоит из р\ наборов (xt,yi, Ziy щ, до,-), i = 1,...,pi, по пять
векторов (5 = k + 1), р2 — р\ наборов х/, t/ьz-uщ, i = р\ + 1,...,рг,
по четыре вектора (4 = £),рз—рг наборов *,-,#,-, z,-, / = Р2 + 1, • .-,рз,
по три вектора (3 = k - 1), р4 - рз наборов xiyyiy i = p3 + 1,... ,Р4
по два вектора (2 = k - 2) и Р5 - Р4 наборов xiy i = р* + 1,... ,ps
по одному вектору (1 = k - 3). Найдем вид матрицы оператора Аа
в базисе Г. Для этого обозначим через L, линейную оболочку
векторов, имеющих номер / (и составляющих /-й набор). Так как Г
есть базис в Яо, то
Рь
H0 = J2®Li- (2.6)
Пусть \L(\ — размерность пространства Li. Из проведенных
рассуждений следует, что
\Li\ = k = 4 при р\ 4-1 < i < р2,
JLj.j = k - 1 = 3 при р2 + 1 < i < рз,
|L/| = k — 3 = 1 ПрИ Р4 + 1 < / < Р5-
Найдем матрицу оператора Аа в пространстве L/. Пусть,
например, i таково, что \Li\ = 4. Значит L/ = С{х1уу1Уг1ущ}. В базисе
<0 1 0 0\ /а 1 0 0>
0 0 10 1 „-.. _ 0 о 1 О
0 0 1' llAllei- 0 0 а 1
^0 0 0 0/ \0 0 0 а;
Таким образом, в пространстве L/ в базисе е, матрица ||Ла||е.
оператора Аа есть жорданова клетка. В силу (2.6) матрица ||Ла|| в
базисе Г будет состоять из жордановых клеток, причем мы получим р\
клеток размерности k + 1 (= 5), р2 — pi клеток размерности k (= 4),
Рз — Р2 клеток размерности k — 1 (= 3), р4 — рз клеток размерности
k - 2 (= 2), и наконец ps - Р4 клеток размерности k - 3 (= 1).
Таким образом, теорема о ЖНФ в рассматриваемом частном случае
доказана.
п.2.5. Прежде чем переходить к Примерам заметим, что
числа pi могут быть найдены без особых усилий. Дело в том, что
размерность каждого из пространств Hs = AaHs-\ выражается через
числа pi. Как следует из проведенных рассуждений,
= рь (ИтЯ^_1 =pi +P2, din\Hk~2 — Р\ +рг +Рз,
90 —'I/- Глава III. Жорданова нормальная форма матриц
и вообще
Поэтому ps+i = dimЯй_s - dim//*_s+L s > 1. А размерность
пространства Ht = AaHt-\ = AfaHo есть ранг г(Л^;Яо) оператора Л^
в Яо> который в силу следствия 3 к теореме 1.1 совпадает с рангом
р(||Л£Л) = ^(ИЛаН*) соответствующей матрицы и поэтому легко
может быть найден. Число k тоже элементарно находится, ибо k —
это наименьший показатель, для которого Aka ф 0, а Л^+1 = 0.
Зная k и размерности пространств Hs мы можем, не находя жор-
данов базис, найти ЖНФ матрицы оператора Аа.
Рассмотрим примеры.
Пример 1. Пусть матрица оператора А в некотором базисе еь #2, £з
трехмерного пространства Hq имеет вид
Требуется найти ЖНФ матрицы ||Л|| и построить жорданов базис.
Из характеристического уравнения det ||Л — А£|| = 0 получаем,
что единственное собственное значение оператора А равно 2.
Полагаем Аа = Лг = А — 21. Очевидно,
/О 1 -1
1И2||= о 1 -1
Имеем: /9(||Л2||) = 1 = dimЛ2Яo = dim^. Далее
(о о
о о о
О 0 Оу
Следовательно, k = 1, р\ = 1, р\ 4- /?2 = dim Но = 3 и, значит, /?2 = 2.
Число жордановых клеток максимальной размерности k +1 = 2
равно pi = 1, число клеток размерности k = 1 равно рг — Р\ = 1. Таким
образом, ЖНФ матрицы ||Л|| есть
§2. Теорема о жордановой нормальной форме -J\/- 91
Теперь найдем жорданов базис. Мы уже знаем, что размерность
пространства Н\ равна единице. Из вида матрицы \\A2\\ следует, что
все вектора Н\ кратны вектору х\ = (1,1,1), ибо A^e\ =0, А^е^ = (1,1,1),
А^еъ = (-1, —1, -1). Так как А^Н\ = {0}, toN\ = H\. За первый
вектор жорданова базиса возьмем х\ и теперь его надо дополнить до
базиса ядра No оператора Л 2 в пространстве Hq. Для
нахождения Л/о решаем уравнение
где £ь &, £з — неизвестные координаты векторов из Л/о. Получаем,
что & = £з- Так как один вектор из Л/о нами уже взят (это х\), то в
качестве второго базисного вектора в Л/о можно взять любой вектор
вида (а, 6,6), где афЬ. Положим *2 = (1,0,0) и таким образом
мы построили базис х\,Х2 в Л/о. Теперь надо найти прообраз у\
элемента х\. Имеем
А2у\=х{.
Полагая у\ — (гц, г/2, ?7з) получим условие щ - щ — 1. Поэтому в
качестве у\ можно взять у\ = (0,1,0). Таким образом жорданов базис
состоит из векторов (хьг/ьлсг).
Пример 2. Пусть матрица оператора А в некотором базисе e\,e<i, e$
пространства Но имеет вид
ИИ =
Требуется найти ЖНФ матрицы ||Л|| и жорданов базис.
Из характеристического уравнения \\А — \Е\\ = 0 получаем, что
оператор А имеет единственное собственное значение А = 1.
Полагаем Аа = А\ = А - I и Hs = А\Н$. Очевидно,
(О 3
О 3 -3
О 3 -3/
Ранг p(||i4i||) = 2 и, значит, dim#i = 2. Далее
(О 21 -20
0 0 0
0 0 0
92 —'Ь- Глава III. Жорданова нормальная форма матриц
Ранг p(||4i||2) = 1 и, значит, dimi/2 = 1. Очевидно,
О 0 0\
О О О
О О Оу
(
О О О
и, стало быть, #з = {#}• Следовательно, k = 2, а размер
наибольшей жордановой клетки равен k + 1 = 3. Поэтому матрица ||Л|| в
жордановой нормальной форме будет иметь вид
Построим жорданов базис. Предварительно заметим, что
поскольку dim Я] — dim Яг = dim#o - dim//i = 1, то в силу
равенства (2.3) ядра оператора А\ в #о и Н\ одномерны и, следовательно,
совпадают. Из вида матрицы ||^i|| следует, что А\в\ = 0, и,
следовательно, No = N\ = Л/2 = {de\ I Vd e F}. Поэтому мы можем взять
в качестве базиса в #2 = Л^г, например, вектор х\ = (21,0,0). Этап
дополнения х\ до базиса ядра в Н\ отпадает, ибо N\ =Л^.
Прообраз вектора х\, как следует из вида матрицы ||i4i||, есть вектор
у\ = (3,3,3). Таким образом, базис в пространстве Н\ есть х\,у\.
Далее, поскольку No = N\, то этап дополнения базиса ядра Л^ (т. е.
вектора х\) до базиса ядра Л^о отпадает, т. е. базис в No — это тот
же вектор х\. Находим прообразы векторов х\ и у\. Прообраз
вектора х\ есть у\. Из вида матрицы ||>4i|| следует, что прообраз у\ есть
z\ = 62 = (0,1,0), ибо Лo2i = у\. Таким образом жорданов базис —
это вектора {x\,y\yz\).
§ 3. ТЕОРЕМА О ЖОРДАНОВОЙ
НОРМАЛЬНОЙ ФОРМЕ (ОБЩИЙ СЛУЧАЙ)
п.3.1. Перед тем, как переходить к доказательству
теоремы о ЖНФ в общем случае, когда рассматриваемый оператор имеет
р > 1 различных собственных значений, установим важную лемму.
Именно на ее использовании будет основано наше доказательство.
Пусть а — собственное значение оператора А в линейном
пространстве Н над полем F = С, Аа = А — a/, q —
алгебраическая кратность а как корня характеристического уравнения
det \\А - аЕ\\ = 0, d(Aa) — дефект оператора Аа в Н.
Лемма 3.1. В пространстве Н1 = АаН алгебраическая
кратность а' собственного значения а оператора А есть q — d(Aa), a
§3. Теорема о жордановой нормальной форме
93
кратности всех остальных собственных значений оператора А
в Я' те же, что и в пространстве Я.
Доказательство. Пусть А — произвольный линейный
оператор в пространстве Я, а — какое-либо его сосбственное
значение, Аа = А - cJ, k = d(Aa\H) и е\, • •. >£* — базис ядра No в
Но = Я. Дополним базис ядра до базиса е\,..., еь>е^+ь • • •»вп
всего пространства Но. Тогда в этом базисе
(а 0 ...
0 Q ...
0 0 ...
0 0 ...
\fi 0 ...
0
0
a
0
0
ak,k+i ♦ • • ak,n
ak+\jt+\ . •. ak+\,n
an,k+\ • • • an.n
Характеристический многочлен ip(A) =det ||Л—А£|| матрицы
очевидно, имеет вид
(3.1)
где
— A
-A ...
... an,n — A
Пусть Я' = ЛаЯо. Из теоремы 1.1 следует, что г = dim Я' = п — k.
В качестве базиса в пространстве Я' можно взять любые г линейно
независимых векторов из набора Аав\,Аав2,...,Ааеп. Но
поскольку Аав{ = 0, i = 1,2,..., k, то вектора g/ = Aaet, i = k + 1,..., n —
линейно независимы. Найдем матрицу оператора А в
пространстве Я' в базисе g/, / = k + 1, ..., п. Имеем
s=l
ибо i4Qes = в, s = 1,2,..., k. Следовательно, матрица оператора А
в пространстве Я7 есть
94 —'b- Глава IIL Жорданова нормальная форма матриц
а характеристический многочлен равен ^(А). В силу (3.1)
(a-X)k
Сравнивая теперь характеристические уравнения для нахождения
собственных значений оператора А в пространствах Я и Я', т. е.
уравнения ip(\) = 0 и ^(А) = 0, мы получаем утверждения леммы 3.1.
Следствие. Если применить оператор Аа к векторам
пространства Я достаточное число раз, то мы получим
пространство Ну в котором ядро N оператора Аа будет содержать лишь
нуль-вектор, и поэтому АаН = Я.
Действительно, согласно лемме 3.1 в пространствах AsaH
алгебраическая кратность собственного значения а при росте s
будет последовательно уменьшаться до тех пор, пока для какого-то
s = so в пространстве Я = А%Н оператор А не будет иметь
собственного значения а (а все остальные собственные значения
согласно лемме 3.1 будут иметь ту же алгебраическую кратность,
что в пространстве Я). Так как мы рассматриваем комплексное
поле, то сумма алгебраических кратностей всех собственных
значений оператора А равна размерности пространства Я и поэтому
dim Я = dim Я -q (напомним, что q — алгебраическая кратность
собственного значения а). В силу леммы 3.1 при s > sq
выполняется dim AsaH = n — q = dim Я, и так как AsaH С Я при s > So, то
ASQH = Я при Vs > so и, значит, АаН = Я.
п.3.2. Переходим теперь непосредственно к доказательству
теоремы о ЖНФ в общем случае. Пусть оператор А имеет в
пространстве Я собственные значения од, ...,ар с алгебраическими крат-
ностями k\,... ,kp соответственно. Согласно следствию леммы 3.1,
укажем числа s\,S2,... ,sp так, что в пространстве А%.Н ядро
оператора Aat пусто4). Определим оператор В/ равенством
В, = А%А% ... А^ЛЙй • • -Аъ- (3-2)
В силу леммы 3.1 и следствия из нее в пространстве ДЯ оператор А
будет иметь единственное собственное значение А = а, и оно будет
иметь ту же кратность &,, что и в исходном пространстве Яо.
Поэтому dim B(H = k{.
4)Мы употребляем здесь слово «пусто» для краткости вместо слов
«содержит только нуль-вектор».
§3. Теорема о жордановой нормальной форме —/\/> 95
Установим два важных свойства операторов Д-:
В?Н = BtH, (3.3)
:W V/./V- (3-4)
Докажем (3.3). Пусть &,• — алгебраическая кратность собственного
значения а,- оператора А в пространстве Я. Так как в
пространствах BiH и В?Я оператор А имеет согласно лемме 3.1 единственное
собственное значение at и оно той же кратности, что и в Я, то
dim BiH = dim В? Я = *,. (3.5)
С другой стороны, поскольку BiH С Я, то
В?Я С BiH. (3.6)
Из (3.5), (3.6) следует (3.3). Равенство (3.4) будет вытекать из
соотношения
A%iBiH={e}, (3.7)
ибо оператор-сомножитель А%. входит в By при /' ф L А
справедливость (3.7) следует из того, что по определению числа s,- в
пространстве A%.BiH — BiA%.H оператор А не имеет никаких
собственных значений, а это возможно лишь при выполнении (3.7), ибо
поле комплексное.
Заметим, что из (3.3) в силу теоремы 1.1 следует, что
ибо г(В,-; ВгН) = dim BiH. Таким образом ядро оператора Д в
пусто.
Теперь мы без труда можем закончить доказательство теоремы о
ЖНФ в общем случае. По построению, в каждом из пространств В/Я
оператор А имеет единственное собственное значение а,-. Поэтому
на основании § 2 мы можем построить в каждом пространстве ВЬН
жорданов базис. Обозначим его через е\\ ...,е£? и покажем, что
если мы выпишем подряд базисы всех пространств В,Я, / = 1,2,... ,р,
то полученный набор векторов
е _ (JX) Л\) Л2) (2) (р) (р)ч
образует (жорданов!) базис в Я.
Общее количество векторов в наборе е равно сумме Y?i=\ k ал"
гебраических кратностей Л,- всех собственных значений
оператора Л в Я и, следовательно, равно dim Я. Поэтому для того, чтобы
96 Ju Глава III. Жорданова нормальная форма матриц
убедиться, что набор е образует базис в Я, нам достаточно доказать
линейную независимость векторов ej'\ /=1, ...,*,-, / = 1, ...,/?.
Чтобы сделать это, покажем, что равенство
р ki
может выполняться только при cil) = 0, 5 = 1,...,ku / = 1, ... ,р.
Положим g/ = X^s=i csf)4l)- Тогда (3.8) перепишется в виде
> = в. (3.9)
Применив к обеим частям (3.9) оператор В/, мы получим равенство
Bjgj = 0, (ЗЛО)
поскольку g/ е В(Н и так как в силу (3.3) Bjgi = 0 при / ^ /.
Далее, поскольку ядро оператора Bj в пространстве BjH пусто, то
из (3.10) следует, что gj = в. А поскольку gy есть линейная
комбинация базисных векторов из BjH, то из равенства gj = 9 вытекает,
что с^ = 0, s = 1,... ,kj при V/. Следовательно, вектора из
набора е — линейно независимы и, значит, образуют базис в Н. Отсюда
вытекает, что
Как мы уже отмечали, матрица Л, оператора А в пространстве ВХН
в базисе ei = (e\l\ ...,е®) имеет ЖНФ и поэтому матрица ||Л||в
оператора А в пространстве Н в базисе е будет иметь блочно-диа-
гональный вид, а блоками будут матрицы At в ЖНФ:
/Л, \
\\А\\е= ;;; м ;;;
V л'р/
Теорема о ЖНФ доказана полностью.
п.3.3. Приведем пример. Пусть матрица ||Л|| оператора Л в
некотором базисе четырехмерного пространства Н имеет вид
(О -2 1 2>
1 3-1-2
0 2 1-2
0-10 2;
§3. Теорема о жордановой нормальной форме —'w- 97
Находим корни характеристического многочлена ||А —А£|| =0.
Получим Ai = 1, k\ — 2; А2 = 2, &2 = 2 (напоминаем, кь —
алгебраическая кратность корня А,- характеристического уравнения). Теперь
построим операторы В\ = Л^2 и Вч = А*1, где Аа = А — ai, a = 1,2,
а показатели S2 и si надо найти. Очевидно
= \\А-\ХЕ\\ =
и p(||>4i||) = dimA[H = 2. Но 2 — это кратность собственного
значения А2 = 2 и поэтому дальнейшее применение оператора А\
к пространству А\Н не может уменьшить его размерность, т.е.
А\Н = А\Н. Значит s\ — 1 и B<i = A\. Далее,
поэтому мы можем взять s2 = 2. Заметим, что это можно было
утверждать и не вычисляя р(|И2|| ). Действительно, согласно
общей теории число 52 должно быть таким, что dimA^H = k\ =2
(кратность собственного значения Ai в Н). Но поскольку р(||Л2||) =3,
то р(||Л2||2) = 2. Таким образом, В\ = А|, Положим Н\=А\Н,
7^2 = А\Н. Согласно общей теории Н = Н\ Ф %•
Теперь построим ЖНФ для оператора в двумерных
пространствах Ни i = 1,2. Для этого заметим, что поскольку
dim АХН = 2 = dimH - dimKer(i4i;//),
■ /»
то ядро оператора А\ в Я — двумерно, т.е. Ai имеет два линейно
незвисимых собственных вектора в Я и в В\Н. Следовательно,
98 -J\y- Глава III. Жорданова нормальная форма матриц
Размерность пространства А^Н равна трем и,значит,
собственное пространство оператора Л, Отвечающее собственному значению
А = 2 — одномерно. Поэтому ЖНФ оператора Л в пространстве
= А\Н есть
и ЖНФ оператора А в Н имеет вид
J)
(1 0 0 0
0 0 0 2
Найдем жорданов базис. Базис в пространстве В\Н = А\Н — это
gi = (2,-1,2,-1) и #2 = (—1,1,-1,1). (Мы нашли его из вида
матрицы ||Л! ||, где столбцы есть коэффициенты разложения
векторов A\ej по базису вьв2,ез,в4.) Очевидно A\gi = 0 и значит
А\В\Н = {в}. Поэтому все пространство В\Н является ядром
оператора А\ и первые два вектора жорданова базиса это х\ = g\,
*2 =g2- Далее, базис в пространстве B<iH=A\H есть g$ = (-1,1,0,0),
g4 = (-2,2,2, —1). Применяя к этим векторам оператор Лг получим
вектора Лг£з = (0,0,2, -1), A%g\ = (0,0,4, -2). Поэтому можно
положить xs = A2g3 = (0,0,2, -1), y3=g3 = (-1,1,0,0).
Задание
Непосредственным применением оператора Л к базису Х\,Х2,хз,уз
проверить, что матрица ||Л|| в этом базисе имеет вид (3.11).
Замечание. В этой главе мы следовали [4], поскольку там
доказательство теоремы о ЖНФ является максимально операторным
и кроме того оно не использует результатов, не содержащихся в
главах I, II данной книги.
ГЛАВА
IV
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
В ПРОСТРАНСТВАХ
СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ
§ 1. СОПРЯЖЕННЫЕ, ЭРМИТОВЫ
И САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ
п.1.1. Пусть К — линейное пространство над полем /%
F = R или F — С, и пусть для Vjc, у £ К определено скалярное
произведение (jc, у) со значениями в F. Пусть А — линейный оператор,
действующий из К в К. Будем пока предполагать, что п — dim К < +оо.
Предположим, что для любого вектора у € К и всех х € /f найдется
такой вектор #, что
(A*,tf) = (x,if). 0.1)
Тогда вектор у называется значением сопряженного (к Л) оператора
на элементе у. Оператор, сопряженный к Л, обозначим через А* и,
следовательно, # = А*у и (1.1) запишется в виде
(Ах, у) = (х>А*у). (1.2)
Следующая теорема отвечает на вопрос о существовании
сопряженного оператора и о связи его матрицы с матрицей оператора Л.
Теорема 1.1. Для любого линейного оператора А в
пространстве К существует сопряженный оператор А*. В ортонорми-
рованном базисе матрица \\A\\ = (а,у). оператора А и матрица
И* || = (bst) оператора Л* связаны соотношением bst = atSj где
черта означает комплексное сопряжение.
Доказательство. Пусть е\, ...,еп — ортонормированный
базис в К, и В — некоторый оператор в К с матрицей (bst).
Попробуем найти элементы bst так, чтобы равенство (1.2) выполнялось с
100 —' Ь- Глава IV. Операторы в пространствах со скалярным произведением
А* = В. Пусть х = 53i=i 6 е*» # =>£/=1 ЧУ^У — произвольные вектора
из К. Очевидно,
п п п
\/л.Хт и) — / \C/.«iw», i)j(*i) ~~ s Cf '7/1 x &si@Si
^ш^ ^* 4 I' Z—^ I \ If 11/
i,/=l t,/=l s=l
Аналогично
(х,Ву) = £(Ье{,гцВе,) = £Щ(et,£V») =
i,/=l »,/==1 s=l ii/=l
Приравнивая правые части (1.3) и (1.4), мы видим, что полученное
равенство п п
выполняется при любых х,у (т.е. при любых 4ь^у) тогда и только
тогда, когда а$ = Ьц. к
Таким образом, мы одновременно доказали существование
сопряженного оператора Л* и нашли вид его матрицы (в ортонорми-
рованном базисе).
п.1.2. Обсудим свойства сопряженных операторов.
1. Для оператора А сопряженный оператор — единственный.
Действительно, единственность следут из доказательства
теоремы 1.1. Но мы докажем ее и по-другому. Пусть для оператора А
существуют два сопряженных оператора: А\ и Лг. Тогда в силу (1.2)
(Ахуу) = (х,А\у) при \/х,уеК, (1.5а)
(Ах9у) = (х,А2у) при Ух,уеК, (1.56)
вычитая из равенства (1.5а) равенство (1.56), имеем:
(х,{Ах-А2)у)=0 V*.
Взяв здесь х = (А\ — А^)у, мы получаем, что ||(j4i — A<i)y\ = 0 и,
значит, А\у =
2. Оператор, сопряженный к Л*, совпадает с Л.
Утверждение следует из вида матрицы ||Л*|| = (о),-), ибо ||Л**|| =
= (а/у) = ||Л ||. Но его можно доказать и по-другому. Имеем
(Ах,у) = {х,А*у) = (А*у,х) \/х,у.
Но тогда (А* у у х) — (Ах, у) — (у, Ах) и, по определению, Л = (Л*)*.
§1. Сопряженные, эрмитовы и самосопряженные операторы JL 101
3. Оператор, сопряженный к произведению АВ двух операторов,
равен произведению сопряженных в измененном порядке, т. е.
(ЛВ)*=В*Л*.
Действительно, полагая х' — Вх, у1 = Л*у, имеем
(АВх.у) = (Ах!, у) = (х',А*у) = (Вх,у') = (х,ВГА*у).
4. Лемма 1.1. Пусть А — линейный оператор в К, Н — и/*ва-
риантное для А подпространство из К и
Тогда подпространство Н± инвариантно для А*.
Доказательство. Пустьу€Н±. Покажем, что А*у€Н±, т.е.
что (Л*г/,х) = 0 при Ух е #. Имеем
ибо Ах е Н при \/х G Н по условию. ▲
Определение. Оператор Л, совпадающий со своим
сопряженным, называется эрмитовым или эрмитово-симметричным.
То есть условие (и определение) эрмитовости оператора Л есть
выполнение равенства
(Ах,у) = (х,Ау) Ух^уеК. (1.6)
Если пространство К — евклидово (F = R), то эрмитов оператор
назовем симметричным.
Матрица ||Л*|| сопряженного оператора в ортонормированном
базисе называется сопряженной к матрице \\А \\ и обозначается
через ||Л||*. Вследствие теоремы 1.1
||Л|Г:=|И1=РГ-
Здесь и далее для любой матрицы ||В|| матрица ||В||
получается из \\B\\ транспонированием и взятием комплексного сопряжения
всех элементов. Матрица эрмитова (симметричного) оператора Л в
ортонормированном базисе называется эрмитовой (симметричной).
То есть для эрмитовой матрицы \\A\\-' = \\A\\, а для симметричной
Т
Разумеется, определения сопряженной, эрмитовой и
симметричной матриц можно дать и без обращения к операторам, линейным
пространствам и базисам, а используя только свойства матричных
102 —f \y- Глава IV. Операторы в пространствах со скалярным произведением
элементов. А именно, пусть ||В||, — (&Sf)J[. Матрица ||С|| = (cst)
называется сопряженной к матрице ||В|| и обозначается через ||В||*,
_ —— у
если cst = bts> т.е. если ||С|| = ||В|| . Матрица ||В|| называется
эрмитовой (симметричной), если bst = &rs, т.е. если ||В|| = ||В||* (если
bst = ft,s = bts, т. е. если ||В|| = ||В||Т).
Легко видеть, что определения сопряженной, эрмитовой и
симметричной матриц, введенные без помощи операторов или с их
помощью — эквивалентны. Чтобы убедиться в этом достаточно в
произвольном линейном пространстве К со скалярным произведением
выбрать ортонормированный базис и определить оператор В так,
чтобы его матрица совпала с матрицей ||5||. Тогда ||В||* = ||В*|| и
оператор В будет эрмитов (симметричен), если матрица ||В||
эрмитова (симметрична).
п.1.3. Мы определили сопряженный оператор в
конечномерном пространстве. Рассмотрим теперь бесконечномерный случай.
В этом случае оператор Л, как правило, определен не во всем
пространстве, а в некоторой области Da С К. Например,
оператор Aq = —d2/dt2 в пространстве C2([ab]) квадратично
интегрируемых функций на отрезке [ab] можно определить на множестве
Da0 = \x{t) \x{t) £ C2[ab\) (могут быть и другие области
определения). При dim/С =+оо значение # сопряженного оператора на
элементе у определяется формально тем же равенством (1.1), что и
раньше:
(Ах,у) = (х,у) \/x£DA, (1.7)
но теперь его справедливость требуется только для х £ Da- При
выполнении (1.7) имеем у = А*у. Обозначим через Da* множество
тех у £ К, для каждого из которых найдется у £ К так, что
равенство (1.7) выполняется при Vx £ Da-
Можно доказать, что сопряженный оператор существует и
определен однозначно, если область Da плотна в К в норме
пространства К. Оператор А называется самосопряженным, если Da* = Da
и А*у = Ау, у £ Da- В конечномерном случае понятие
самосопряженности совпадает с понятием эрмитовости (ибо Da = Da* — К).
В бесконечномерном случае представляется очень полезным
выделить множество операторов, для которых Da* 2 Da и Ay = А*у при
у £ Da, т.е. операторы Л, для которых
Vx,y£DA. (1.8)
Такие операторы мы будем называть эрмитовыми.
§1. Сопряженные, эрмитовы и самосопряженные операторы -J\y- 103
Приведем примеры эрмитовых и не эрмитовых операторов в
бесконечномерных пространствах; некоторые из этих примеров важны
для математической физики.
Пусть £2([ab]) — пространство квадратично интегрируемых
функций x(t) на отрезке [ab] над полем F = С со скалярным
произведением
и А — линейный оператор, определенный на некоторой области
Da С К со значениями в К. Мы рассмотрим несколько различных
операторов А и различных областей определения D^. Для
каждого случая мы будем проверять справедливость равенства (1.8) при
произвольных х,у е Da,t. e. выяснять — эрмитов оператор А в Da
или нет. Заметим, что для дифференциальных операторов такая
проверка в существенном сводится к /w-кратному интегрированию
по частям, где т — порядок дифференциального оператора.
LA=Al=i(d/dt)iDA=DAl={x(t)\x(t)GC{[ablx(a)=x(b) = O}.
При x(t)ty(t) Е Da{ имеем
ь ь
{Ах, у) = I ijf-ydt = ixy ^ - i\ x^y = (х,Ау).
а а
Оператор А в Dax — эрмитов.
2. А = А2 = djdty Da2 = DAr При x(t),y(t) e DA{ имеем
ь ь
(Ax,y) = J jtx -ydt = xy ^ - J xjjydt = -(x,Ay).
a a
Оператор А^ в Da2 — не эрмитов. Отметим, что операторы А\ и Л2
определены в одной и той же области и отличаются один от другого
только числовым множителем. Тем не менее А\ — эрмитов, a A<t —
нет. Причина в том, что этот множитель — чисто мнимый.
Задание
Пусть А и В — линейные операторы,*определенные в некоторой
области Da, и В = olA. Докажите, что
а) при вещественном а операторы А и В или одновременно эрмитовы,
или одновременно не эрмитовы;
б) при чисто мнимом а операторы Л и Б не могут одновременно быть
эрмитовыми.
104 —' Ь- Глава IV. Операторы в пространствах со скалярным произведением
3. А = Лз = -d2/dt2 + P{t), где Р(0 — вещественная
непрерывная функция
DA, = {*(0|*€ С2[а6], х(а) = 0, х'(Ь) = /ЗД, /3 € R}.
Пусть x(t),y(t) € D,42. Очевидно
(P(t)x,y) = (x,P(t)y)
и поэтому нам надо проверить только равенство (А^хуу) = (х,А4у),
где А\ = —cfi/dt2. Имеем
(Л4Х,у) = -
Из этих равенств видно, что для выполнения (1.8) надо, чтобы
Подставив сюда х'(Ь) = /Зх(Ь), у'{Ь) = /Зу(Ь), х(а) = у(а) — 0
убеждаемся, что это равенство справедливо и, значит, оператор Лз в D$
эрмитов.
Задание
Пусть А = Аг и DA = {x(t) \ x e C2[ab)% x'(a) = fx(a), x(b) = 0}.
Выяснить, будет ли оператор А эрмитов а) при 7 = 2 + /; б) при 7 = я"-
п.1.4. Выясним свойства эрмитовых операторов, не предполагая
для свойств 1), 2) конечномерность пространства К.
1. Собственные значения эрмитова оператора вещественны.
Действительно, пусть при некотором А € F и х Ф в,
выполняется Ах = \х. Умножая это равенство на х скалярно, получим
(Ах,х) = \(х,х).
Но (Ахух) = (х, Ах) в силу (1.8), а (х,Ах) = (Ах,х). Таким образом,
Х(хух) = (Ах,х) = (Ах,х),
откуда и следует вещественность А.
2. Собственные вектора эрмитова оператора, отвечающие
различным собственным значениям, взаимно ортогональны.
Действительно, пусть Ах\=\\Хи Ax2 = \2*2i М ФМ, A,-€f, Х[фв.
Отсюда (Ах\,Х2) = Ai(ati,-^2)» где в силу эрмитовости оператора А
(Ахих2) = (хиАх2) = (х\, \2х2) = A2(xi,x2).
Следовательно, \\(х\ух2) = \2(х\>Х2) и так как Ai ^Аг, то (jci,X2) = 0.
§ 1. Сопряженные, эрмитовы и самосопряженные операторы —'1/- 105
3. Следующее свойство относится только к эрмитовым
операторам в конечномерных пространствах.
Лемма 1.2. Пусть оператор А эрмитов в пространстве К
над полем F и Н — инвариантное для А подпространство К,
Н ф {в}. Тогда оператор А имеет в Н по крайней мере одно
собственное значение.
Доказательство. Пусть ||А||Я = (я//)™ — матрица
оператора Л в ортонормированном базисе"£ь ...,ет подпространства Н.
Для отыскания координат & собственного вектора хо = Yl?=\ &et
оператора А в Я, отвечающего собственному значению А, мы из
равенства Axq = А*о получаем систему уравнений (см. §6, гл. II)
т
Е£ \ £ • \ О rn (\ Q^
»/S/ S* * »>•••»» V*/
где число А должно удовлетворять характеристическому уравнению
det ||Л - А£||я = 0. (1.10)
В силу основной теоремы высшей алгебы, уравнение (1.10) над
комплексным полем имеет хотя бы один корень; обозначим его
через Ао. Покажем, что Ао — вещественное число и, следовательно,
Ао € F и при F = C и при F = l и тем самым лемма 1.2 будет
доказана. Подставим в (1.9) А = Ао, умножим i-e уравнение из (1.9)
на £,- и просуммируем по всем L Получим
Число Q — вещественно, ибо поскольку Щ = а;ь то
Значит, и Ао — вещественно. ▲
п.1.5. Теорема 1.2. В конечномерном пространстве К можно
построить базис, состоящий из ортонормированных
собственных векторов эрмитова оператора, действующего из К в К.
Замечание. Другая формулировка теоремы 1.2. Матрица
эрмитова оператора в конечномерном пространстве диагонализуема.
Доказательство. Пусть Ai,...,Am — все различные
собственные значения эрмитова оператора А в пространстве К, U\.
106
Глава IV. Операторы в пространствах со скалярным произведением
/ = 1,2, ...,т — соответствующие.собственные подпространства,
Л :=£ILi ©*/*,. Н± = {У\У£ *> (У**) = 0 V* е Я}. В силу
леммы 4.1 (гл. I) К = Я ф Я_|_. Так как подпространства £/д,
инвариантны для оператора Л, то и подпространство Я инвариантно для Л.
В силу леммы 1.1 пространство Н± будет инвариантно для Л*,
но так как Л* = Л, то пространство #х инвариантно для Л. Если
#1 ^ {0}, то в силу леммы 1.2 оператор Л имеет в пространстве Н±
хотя бы одно собственное значение, которое мы обозначим i/.
Пусть хо € Н± — отвечающий ему собственный вектор. Поскольку
набор Aj, ..., \т содержал все собственные значения оператора Л в
пространстве /f, то 3/ такое, что v = А7 и, следовательно, хо € U\r
Таким образом, с одной стороны хо € U\f С Я, а с другой хо € Н±.
Поэтому вектор xq ортогонален к самому себе, т.е. (лсо,л:о) = О
и, значит, хо — в, что невозможно. Противоречие возникло из-за
предположения, что Н± Ф {в}. Значит, Н± = {в} и следовательно,
Выберем теперь в каждом собственном подпространстве U\i op-
тонормированный базис е^\ ... ,в^, где k( = dim U\r Тогда набор
векторов
(2)
(т)
будет ортонормированным базисом в пространстве К (см. §3, гл. I)
и матрица оператора Л в базисе е будет иметь диагональный вид:
/А,
о
А,
А2
А2
0
Хт
Теорема доказана.
§2. Положительно определенные операторы JL 107
Следствие. У эрмитовых операторов алгебраическая и
геометрическая кратности собственных значений совпадают.
Вопрос о возможности одновременной диагонализации
семейства эрмитовых операторов Ль ..., Ар решается следующей
теоремой 1.3, которая следует из теоремы 5.6 (гл. II).
Теорема 1.3. Пусть в пространстве К над полем F
определены эрмитовы операторы Aiy / = 1,2,... ,р, действующие из К в К.
Тогда для существования в К базиса, в котором матрицы всех
операторов А( будут диагональными, необходимо и
достаточно, чтобы операторы А[ попарно коммутировали друг с другом,
т.е. чтобы
AiAj = AjAi, /,/ = 1,2, ...,р. (1.12)
§ 2. ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ ОПЕРАТОРЫ
п.2.1. Пусть К — конечномерное пространство над
полем F = С и А — эрмитов оператор, действующий из К в К.
Определение. Оператор А называется положительно
определенным, если существует такая константа 7 > 0, что для
всех х £ К,
(Ах,х) > 7|М|2. (2.1)
Оператор А называется положительным, если для всех х £ К,
хфв,
(Ах,х)>0. (2.2)
Очевидно, что положительно определенный оператор является
положительным. Однако верно и обратное: положительный
оператор всегда положительно определен, т.е. множество
положительных операторов совпадает с множеством положительно
определенных 1К Это утверждение вытекает из следующей простой леммы
Лемма 2.1. Для справедливости каждого из неравенств (2Л),
(2.2) необходимо и достаточно, чтобы все собственные
значения оператора А были положительными.
Доказательство. Достаточность. Пусть все собственные
значения оператора А положительны. Так как оператор эрмитов,
то в пространстве К можно построить ортонормированный базис
/ь ..-•/«• состоящий из собственных векторов оператора А. Пусть
бесконечномерных пространствах это не верно: см. п. 2.7.
108 —'I/- Глава IV. Операторы в пространствах со скалярным произведением
А/ — собственное значение, которому отвечает вектор /,-, /=1, 2,..., п
и х = £?=1 otifi — произвольный вектор из К. Очевидно,
(Ах,х) = (£аД/ьЕе*///) = £ afffyXt = £,\Ы2.
Пусть 7 = min А/. По условию, 7 > 0. В силу (2.3)
i=\
т. е. неравенство (2.1) доказано. Докажем необходимость. Пусть
выполняется неравенство (2.2). Тогда все собственные значения
оператора А положительны, ибо в силу (2.2)
Лемма доказана.
Замечание. Так как для эрмитова оператора А определитель
det \\A\\ его матрицы равен произведению собственных значений, то
для положительно определенных операторов 1) det ||Л|| > 0, 2)
существует обратный оператор.
п.2.2. Установим необходимое и достаточное условие
положительной определенности эрмитовых операторов. Пусть А —эрмитов
оператор, действующий из К в К, F = С,
Iа\\
а\п\
\ап\ ... ank ... ап
... CL\k
Ak= det
an ... a\k
Q>k\ • • •
— суть соответственно матрица оператора А в произвольном ор-
тонормированном базисе е = (е\, ...,еп) пространства К и угловой
минор &-го порядка матрицы \\А ||, k = 1,2, ..., п.
§2. Положительно определенные операторы —f\^ 109
Теорема 2.1. (Критерий Сильвестра). Для того, чтобы
оператор А был положительно определен, необходимо и
достаточно выполнение неравенств
Д*>0, ft = 1,2,..., п. (2.4)
Доказательство. Необходимость. Пусть оператор А
положительно определен в пространстве К. Докажем справедливость
неравенств (2.4). Пусть Hk = С{е\,,.. ,е*} — линейная оболочка ft
первых векторов базиса е пространства К и Pk — проектор в К на
подпространство Hk (т. е. при х — Y11=\ Wiei> по определению,
РкХ = Ylki=\ Чеи или, что эквивалентно, Р*е,- — еи i = 1,2,..., ft,
Pei=e i=k+\, ..., n). Очевидно, при x G Hk выполняется PkX = x.
Пусть Ak = PkA. Легко видеть, что матрица |И*||//Л оператора Ak в
подпространстве Hk в базисе е\,..., ek есть
a\k
\\Ак\\нк = \\PkA\\Hk = '
Оператор Л^ — положительно определен на Hk. Действительно,
так как оператор Pk — эрмитов, а оператор А — положительно
определен, то при х е Hk
(PkAx,x) = (Ax,Pkx) = (Ах,х) ^ 7IMI2-
В силу замечания к лемме 2.1 Д^ = det ||/V4|| > 0.
Необходимость условий (2.4) доказана.
п.2.3. Достаточность. Пусть неравенства (2.4) выполняются.
Докажем, что оператор А положительно определен.
Доказательство проведем индукцией по размерности пространства К. Пусть
dim К = 1. Тогда оператор А есть оператор умножения на число аи,
т.е. Ах — а\\х и (Ах,х) = ац||х||2. В силу (2.4) Ai = аи > 0 и,
значит, оператор А положительно определен. Таким образом, при
dim/C= 1 достаточность условий (2.4) доказана. Пусть п= dim К > 2.
Предположим, что достаточность условий (2.4) для положительной
определенности оператора А доказана для любых операторов в
пространствах размерности т = 1,2,..., п - 1, п > 2, и докажем
ее для оператора А в пространстве К размерности т = п. Пусть
||Л|| = (а,у)2. Рассмотрим оператор Ап-\ = Рп-\А в пространстве
Нп-\ = С{еи ... ,еп-\} (Рп-\ — проектор на #л_ь см. п.2.2).
Матрица оператора Ап-\ в подпространстве Нп-\ в базисе в\, ...,еп-\
110
Глава IV. Операторы в пространствах со скалярным произведением
есть
Так как, по условию, для матрицы ||Л|| выполняются
неравенства (2.4), то по предположению индукции оператор Ап-\
положительно определен в Нп-\ и, значит, все его собственные значения
положительны. Выберем в пространстве Нп-\ ортонормированный
базис /ь/г,... ,fn-\ из собственных векторов оператора Ап-\ и
обозначим через I/,- собственное значение, которому отвечает вектор /,-,
/ = 1,2,.. .,я —1. В силу леммы 2.1 имеем: i/j>0, / = 1,2, ...,я — 1.
Пусть [п — произвольный нормированный вектор из /С,
ортогональный к /ь ...,/„_!. Примем систему векторов / = (/ь/2,.. .,fn-ufn)
за базис в К (вектора / образуют базис в силу леммы 2.2 гл. I).
В этом базисе матрица ||Л||/ примет вид
(2.5)
где bin = bni, i = 1,2,..., n — координаты вектора Afn в базисе /.
Задание
Проверить, что матрица ||Л||/ имеет вид (2.5).
Пусть х = Y%=\ aih- В силу (2.5) имеем
п-\ п-\ п
АХ = ^ aiAfi + ariAfn
п-\
f V\
0
0
0
\bn\
0
0
0
Ьгй
0
0
0
bnZ
... 0
... 0
... 0
... fn-i
• • • Ьп.п-1
bin
b2n
bzn
bni>
btin
i=\
Так как вектора /ь ... ,/Л — ортонормированы, то
л-1 п
(Ах,х) = ^(а/1/,- + апЬш)а1 + ^о
n-l
n-\
n. (2.6)
§2. Положительно определенные операторы
111
п.2.4. Для доказательства неравенства (Ах, х) > О дополним
в (2.6) содержащие а, выражения для каждого i = 1,2,..., п - 1 до
квадрата модуля. Для этого сначала вынесем j/, за скобки и затем
добавим в полученное выражение слагаемое \binan\2 (и вычтем его
для сохранения равенства в (2.6)). Получим
п-\
(Ахух) =
cinan\2 + vn\an
i=i
п-1
i=i
Cin =
Если
(2.7)
vn > 0,
то, очевидно, (Ax,x) > 0 и равенство (Ах,х) = 0 возможно лишь
при ап = 0, \oti + cinan\ = 0, *' = 1,2,..., п - 1, т. е. при ai = п2 — ...
... = ап = 0. Значит, при х ф В (Ахух) > 0 и (Аху х) > 7Ц7Ц2 Для
некоторого 7 > 0. Таким образом, для завершения доказательства
теоремы остается установить неравенство (2.7). Для этого
достаточно показать, что
An = det\\A\\ = vvV2->-'Vn-vVn, (2.8)
ибо Дл > 0 по условию, а щ > О i = 1,2,..., п — 1 по
предположению индукции. Для локазательства (2.8) заметим, что det||y4|| не
зависит от выбора базиса в пространстве К, и поэтому в силу (2.5)
Дп = det \\A\\e = det ||Л||/, т. е.
щ О ... О Ь\п
О Щ 0 bin
= det|H||/ =
(2.9)
) 0 ... Vn-l Ьп-т
il ЬП2 ♦ • • Ьп,п-1 Ьпп
Для вычисления Д„ мы в определителе (2.9) последовательно
вычтем из П'ГО столбца сначала первый, умноженный на С\п, затем
второй, умноженный на С2П и т.д. до (п - 1)-го столбца
включительно, умноженного на сп-\я. Тогда получим
vx 0 ... О
О 1/2 .... О
О ... vn-i О
Ьп1 ..• 6/i,n-l Vn
Откуда и следует (2.8). Достаточность условий (2.4) доказана.
112 —fly- Глава IV. Операторы в пространствах со скалярным произведением
Замечание. Если оператор А — симметричный (F = R), то
доказательство сохраняется с естественными упрощениями. Но
для симметричных операторов будет дано и другое доказательство
критерия Сильвестра, основанное на теории квадратичных форм
(см. §4 гл. V).
п.2.5. Аналогично положительно определенным и
положительным операторам можно ввести отрицательно определенные и
отрицательные операторы. Для этого знак неравенства в
соотношениях (2.1), (2.2) надо изменить на противоположный и в (2.1)
заменить 7 на (—7), 7 > 0- Очевидно, что оператор А отрицательно
определен (отрицателен) тогда и только тогда, когда оператор -А
положительно определен (положителен). Таким образом, для
отрицательной определенности оператора А необходимо и
достаточно, чтобы все собственные значения оператора —А были
положительными, т. е. чтобы все собственные значения оператора А были
отрицательными. Из критерия Сильвестра следует, что для
этого необходимо и достаточно, чтобы для угловых миноров
матрицы ||Л|| выполнялись условия: Д* < 0 при не четном k и Д* > О
при четном k.
п.2.6. Приведем пример применения критерия Сильвестра.
Рассмотрим систему п линейных обыкновенных дифференциальных
уравнений
^ = £>/*/, « = 1,2 я, (2.10)
/=1
где Xj(t) — неизвестные функции, / = 1,2 п,ац = а^ —
вещественные числа. Выясним, при каких ограничениях на матрицу
коэффициентов (aij)% все решения системы (2.10) будут стремиться
к нулю при t —► оо. Решение системы ищется в виде xj = £/еЛ/, где
£7 и А — неизвестные числа, / = 1,2,..., п. Подставляя выражения
для xj в (2.10) и сокращая на ext, получим
!>/£/ = Afc, / = 1,2,..., п.
Таким образом, для существования не нулевого решения
системы (2.10) надо, чтобы А было собственным значением
матрицы {пц)^. А для убывания решений (2.10) на бесконечности все А
должны быть отрицательными. Согласно критерию Сильвестра,
§2. Положительно определенные операторы —i\y- ИЗ
необходимым и достаточным условием этого являются неравенства
Ak < О при не четных Л, А^ > 0 при четных £, где
М ♦ ♦ • CL\k
Q>k\
п.2.7. Рассмотрим теперь положительно определенные и
положительные операторы в бесконечномерном пространстве К. При
dim К = -Нэо оператор Л чаще всего бывает задан не во всем
пространстве К, г в некоторой области определения Da С К.
Положительно определенные и положительные операторы определяются
как и раньше требованиями (2.1) и (2.2), но теперь эти
неравенства должны выполняться не для Vx € К, а только при х € пд.
Как и в конечномерном случае, здесь положительно определенный
оператор является положительным. Однако в отличие от
конечномерного случая положительный оператор в бесконечномерном
пространстве может не быть положительно определенным (т. е.
неравенство (2.1) не следует из (2.2)). Приведем пример такой
ситуации. Пусть К = £2 [0, /], x(t) £ К и оператор А определяется
равенством
Ax(t) = tx(t).
Ясно, что Бд = К и что
(Аха) = [f|x(0|2 А > 0 при x(t) ф 0, x(t) £ К.
о
Значит, оператор А — положительный. В то же время он не
является положительно определенным. Действительно, взяв функцию
xa(t) = 0 при а < t < U где а — произвольное положительное
число, мы получим
а
(Axaixa) = \t\xa(t)\2dt<a\\xa\\2
о
и поэтому ни при каком фиксированном 7 > 0 не может выполняться
(Ах,х)>ч\\х\\2 \/x(t)eC2[0J)
так как при х = ха мы имели бы 7||*а||2 < а||ха||2, где а можно
взять сколь угодно малым.
114 —/\/- Глава IV. Операторы в пространствах со скалярным произведением
Отметим еще одно отличие бесконечномерного случая от
конечномерного: для положительного оператора в К обратный может
не существовать. Как мы знаем (см. гл. II §3), для существования
оператора А~1 надо, чтобы оператор А осуществлял взаимно
однозначное отображение и чтобы АК = /f. Первое требование
выполняется, ибо если х\ Ф Х2> то и Ах\ Ф Ax<l, так как если Ах\ = Ах2,
то х — х\ — Х2 ф 0 и (Ах, х) = 0 и, значит, неравенство (2.2) не
имеет места. А требование АК = К может не выполняться. Для
рассмотренного выше оператора Ax(t) = t • x(t) множество АК не
содержит, например, функций x(t) = £а, 0 < а < 1/2 (проверить
самостоятельно).
п.2.8. В заключение параграфа приведем пример положительно
определенного оператора в бесконечномерном пространстве.
Пусть
К = C2[ab], A = -^, DA = {x(t) | x(t) € С2[аЫ х(а) = x(b) = 0}.
Интегрируя по частям выражение
имеем
b b
2 Л ч2 *
(Ах,х) = -x'(t)x(t)\a + \x'(t)\ldt = \x'(t)\'dt. (2.11)
J J
a a
Далее по неравенству Коши-Буняковского
b
<\\x'(s)\2ds-(b-a).
a a a
Интегрируя это неравенство по t, получим с учетом (2.11)
ь
\\x(t)\2dt<(b-a)2-(Ax,x),
а
откуда и следует (2.1) с 7 = (Ь — я)"2. Таким образом, оператор А
положительно определен в DA.
§3. Унитарные и ортогональные операторы и их матрицы —fly- 115
Задание
Проверить, будет ли положительно определен оператор А — -d2/dt2 в
области DA, если там вместо условия х(а) = х(Ь) = 0 взять любое из
условий: 1) х'(а) = х(Ь) = 0; 2) х'(а) = х'(Ь) = 0; 3) х'(а) + ах(а) = 0, а > О,
*(*) = 0.
§3. УНИТАРНЫЕ И ОРТОГОНАЛЬНЫЕ ОПЕРАТОРЫ
И ИХ МАТРИЦЫ
п.3.1. Пусть К — линейное конечномерное
пространство над полем F = С. Оператор (/, действующий из К в /С,
называется унитарным, если он сохраняет скалярное произведение, т. е.
если
(x,y) Vx,yeK. (3.1)
Дадим и другое определение. Оператор U называется унитарным,
если он переводит ортонормированный базис е\,..., еп
пространства К в ортонормированный.
Задание
Доказать эквивалентность обоих определений.
Примеры унитарных операторов.
1. Пусть р — произвольная перестановка п элементов:
/1 2...п \
Р \h i2...in)9
где /ь ..., in — различные числа из набора 1,2,..., п. Положим
Uek = eik, k = 1,2, ...,л.
Оператор U унитарен по второму определению.
2. Пусть ||В|| = (Ьц) — квадратная матрица порядка л, элементы
которой удовлетворяют условию
X>As = <*/sV/,s (3.2)
и пусть е\9 ...fen — произвольный ортонормированный базис в
линейном пространстве К над полем./7 — С. Положим
п
Щ = ^2 bileu / = 1.2,..., л.
1=1
Оператор U унитарен по второму определению.
116 JL Глава IV. Операторы в пространствах со скалярным произведением
п.3.2. Матрица унитарного оператора в ортонормированном
базисе называется унитарной. Пус1ъ е\, ...,еп —ортонормированный
базис в К и Uei = X)"=i Psi es- Выясним свойства матрицы || U\\ = (рц).
Поскольку (Uei, Uej) = 8ц, то
Отсюда, учитывая, что (es, et) = 8st, мы получаем равенство
п
Y = *ih *\/ = 1,2,...,л. (3.3)
5=1
Таким образом, у унитарной матрицы столбцы являются ортонор-
мированными векторами.
Разумеется, определение унитарной матрицы можно дать не
обращаясь к операторам, линейным пространствам и базису:
Определение. Матрица \\ W\\ — (pSi)nn называется унитарной,
если ее матричные элементы pst удовлетворяют условиям (3.3).
Это определение эквивалентно предыдущему. Действительно,
выберем в произвольном я-мерном пространстве со скалярным
произведением произвольный ортонормированный базис и определим
оператор U так, чтобы \\U\\ = \\W\\. Тогда оператор U будет
унитарным (см. п.3.1) и, значит, его матрица \\U\\ — \\W\\ унитарна по
определению п. 3.2.
Заметим, что поскольку UK С К и dim UK = dim/С, то UK = К.
Отсюда, в частности, следует существование для унитарного
оператора U обратного оператора U"1 и для матрицы \\U\\ — обратной
матрицы
п.3.3. Рассмотрим теперь случай бесконечномерных пространств.
Если мы определим унитарный оператор U так же, как в
конечномерном случае, то обратный оператор С/"1 может не существовать.
Действительно, рассмотрим, например, пространство
в котором скалярное произведение элементов х = (&,..., £п,...) и
У = (*7ь • • •, Vn, •. •) определяется равенством
§3. Унитарные и ортогональные операторы и их матрицы —1\у- 117
Пусть оператор U задается соотношением
1Л = (0,6,6,...,{„,...).
Тогда, очевидно, (Ux, Uy) = (x,y) при Vjc, у. В то же время в силу
теоремы 3.1 (гл. II) оператор U~x не существует, поскольку
множество значений {Ux\x € £2} ф £2, ибо оно не содержит векторов
z = (аи ..., ал,...), у которых а\ Ф 0.
Поэтому, если мы хотим, чтобы-в бесконечномерном
пространстве К унитарный оператор обладал свойствами, аналогичными
случаю dim К <+оо, то мы должны кроме требования (3.4)
наложить дополнительное ограничение. Мы запишем его в виде
UK —К. Это условие вместе с (3.1) обеспечивает существование
обратного оператора U~x.
Задание
Докажите, что если оператор U обладает свойством (3.1) и если кроме
того UК = К, то U~x существует.
п.3.4. Свойства унитарных операторов.
1. Основное свойство унитарных операторов: сопряженный к
унитарному оператору существует и равен обратному.
Действительно, пусть у €К, U — унитарный оператор, К —> К
и z = U~xy. Тогда
(Ux,y) = (Ux9 Uz) = (х,г) = (x, U~xy) Vx, y,
что и доказывает свойство 1.
Иногда свойство 1 используется как определение унитарного
оператора. А именно, пусть у оператора £/, действующего из К в /С,
существуют обратный U~x и сопряженный /У*. Тогда если U* = U~X,
то оператор U — унитарный.
Действительно, из существования U~x следует, что UK = К.
Далее
(l/x, Uy) = (jc, U*Uy) = (х, U~xUy) = (xfy)
и, значит, оператор U — унитарный.
Если dim К < +оо, то существование U* предполагать не
нужно, ибо U* существует по теореме 1.1.
2. Обратный оператор к унитарному является унитарным.
Пусть xfy € К. Имеем (U~lx, U~xy) = (UU'lx9 UU~xy) = (x,y).
В бесконечномерном пространстве мы должны добавить, что из
равенства UK = К и существования обратного оператора U~x
следует, что K=U~lK, т.е. для U~x выполнены оба условия унитарности.
л
118 —'!/- Глава IV. Операторы в пространствах со скалярным произведением
3. Произведение унитарных операторов есть унитарный
оператор (проверить самостоятельно).
4. Собственные значения унитарных операторов по модулю
равны единице.
Действительно, если Ux = А*, то (Ux, Ux) = |Л| (х,х). Но
(Ux, Ux) = (х,х) и, значит, (х,х) = |А| (х,х), откуда |А| = 1.
5. Собственные вектора унитарных операторов, отвечающие
различным собственным значениям, взаимно ортогональны.
Пусть Ау, / = 1,2, — произвольные собственные значения
унитарного оператора U, Ai ф Аг, и xj — соответствующие
собственные вектора. Так как |АУ| = 1, то можно указать такие углы tp\9 <p2,
Ч>\ Ф V2. VI € [О,2тг), что Л/ = еЧ / = 1,2.
Имеем Ux\ = AjXi, (7^2 = А2Х2. Перемножая эти равенства ска-
лярно, получаем, что (Ux\, Ш2) = AiA2(xi,jC2). Отсюда в силу
унитарности оператора U
и, значит,
(х\х2)(1 - AiA2) = 0.
Но AiA2 = ei{^-*2) ф 1; следовательно, (х\ух2) = 0.
6. Следующее свойство относится к унитарным операторам
только в конечномерных пространствах.
Теорема 3.1. В конечномерном пространстве К можно
указать ортонормированный базис, состоящий из собственных
векторов унитарного оператора, действующего из К в К.
Замечание. Другая формулировка теоремы 3.1. Матрица
унитарного оператора в конечномерном пространстве диагонализуема.
Доказательство теоремы 3.1 следует схеме и идеям
доказательства теоремы 1.2. Пусть Аь ..., \т — все различные
собственные значения оператора U в пространстве К, U\. —
соответствующие собственные подпространства,
В силу леммы 4.1 (гл. I), К = Н®Н±. Если х£ U\n то U~xx = \ {x
(здесь важно, что А/ Ф 0). Следовательно, подпространства U\., a
значит и их сумма Н, будут инвариантны для оператора U~l. В
силу леммы 1.1, примененной к оператору U~\ подпространство Н±
Л-
§3. Унитарные и ортогональные операторы и их матрицы —»\/- 119
будет инвариантно для оператора (U~1)* = U. Если Н± ф {0}, то
поскольку поле F = С, оператор U имеет в Н± хотя бы одно
собственное значение; обозначим его через i/, а отвечающий ему
собственный вектор через xq. Дальнейшее доказательство дословно
повторяет вторую часть доказательства теоремы 1.2 и мы его опускаем. А
Далее совершенно аналогично п. 1.5 устанавливаются свойства.
7. Для унитарного оператора алгебраическая кратность
собственного значения совпадает с геометрической.
8. Семейство унитарных операторов можно диагонализовать
одновременно тогда и только тогда, когда операторы этого семейства
попарно коммутируют между собой.
п.3.5. Установленные в п. 3.4 свойства 1-8 унитарных
операторов порождают аналогичные свойства унитарных матриц. Чтобы
получить соответствующие формулировки достаточно всюду в п. 3.4
вместо слова «оператор» записать слово «матрица».
Задание
"На основе п. 3.4 описать свойства унитарных матриц и их
собственных значений и векторов и доказать справедливость соответствующих
утверждений.
Мы остановимся только на свойстве 1 ввиду его важности. Итак,
для унитарных операторов U* = U~{ и, значит, для унитарных мат-
риц \\U\\* = \\U\\-\ Но \\U\f =Щ\\ и поэтому ||£/|Г' =Ш\Т-
Таким образом, для нахождения обратной матрицы \\U\\ 1 для
произвольной унитарной матрицы \\U\\ достаточно ее
транспонировать и заменить все элементы на комплексно-сопряженные.
п.3.6. Ортогональные операторы и их матрицы. Рассмотрим
теперь линейное пространство К над вещественным полем /7 = М. Если
dim К < +оо, то линейный оператор А,К —* К, назовем ортогональным,
если он сохраняет скалярное произведение. Если dim/Г = +оо, то к
этому требованию надо добавить условие АК — К. При dim К < -foo
матрица ортогонального оператора в ортонормированном базисе
называется ортогональной.
Ортогональные операторы и матрицы обладают теми же
свойствами, что и унитарные, кроме свойств 6-8. Причина этого
состоит в том, что операторы в пространствах над вещественным полем
могут вообще не иметь собственных значений. Например,
оператор Ау вращения на угол (р (0 < ц> < 2тг, <р^7г) в пространстве
K=V2 векторов на плоскости не имеет собственных векторов.
120 -J\y- Глава IV. Операторы в пространствах со скалярным произведением
Таким образом, ортогональный оператор не обязательно диа-
гонализуем. В то же время, если ортогональный оператор диаго-
нализуем, то алгебраическая и геометрическая кратности каждого
собственного значения совпадают. Для диагонализуемости
семейства ортогональных операторов Ль ..., Лр, кроме требования
коммутации (AiAj — AjAi) необходима диагонализуемость каждого из
операторов Л; (в случае унитарных операторов это условие
выполняется автоматически в силу теоремы 3.1).
Разумеется, при переформулировании результатов пп. 3.1-3.5 для
ортогональных операторов и их матриц мы должны везде убрать
черту — знак комплексного сопряжения, ибо поле вещественно.
Кроме того, унимодулярность (|А| = 1) собственных значений, если
они существуют, означает теперь, что А = ±1.
п.3.7. Для приложений часто представляет интерес множество
ортогональных операторов 0(3) в пространстве #3.
При Л е 0(3), очевидно, АА* = /, и так как det ||Л|| = det ||Л*||,
то (det ||Л||)2 = 1 и det||i4|| =±1.
Пусть 0+(3) = {Л | Л € 0(3), det ||Л|| = +1}.
Теорема 3.2. Множество 0+(3) — это множество всех
вращений в /?3 относительно любых осей, проходящих через начало
координат.
Доказательство. Пусть Л — произвольное вращение на угол (р,
О < <р < 2тг, около оси а. Выберем правую ортогональную систему
координат так, чтобы ось z совпала с а. Тогда матрица оператора Л
в ортонормированном базисе, образованном ортами выбранных
координатных осей, примет вид
(.
sin (p cos у? О
О 0 1
Эта матрица — ортогональная, значит, оператор Л —
ортогональный. Кроме того det ||Л|| = 1 и, значит, Л € 0+(3).
Пусть теперь Л Е 0+(3). Докажем, что Л — вращение около
некоторой оси. Пусть еь£2>ез ~ ортонормированный базис в /?3 и
||Л|| = (ац)\. Характеристическое уравнение для нахождения
собственных значений оператора Л имеет вид
где /Зз = det ЦАЦ = 1. Так как уравнение (3.5) кубическое, то оно
заведомо имеет хотя бы один вещественный корень А\, А\ = +1 или
§3. Унитарные и ортогональные операторы и их матрицы —'w- 121
Ai = -1 и кроме того еще два корня А2, Аз, зкоторые или
вещественны (и равны ±1) или комплексные и Аз = А2.
Из уравнения (3.5) следует, что
А!А2А3 = 1. (3.6)
Если Аз = Аг, то поскольку |А,-| = 1, то А2А3 = 1 и в силу (3.6) Ai = +1.
Если все А/ вещественны (и значит равны ±1), то хотя бы один
корень А, должен равняться +1. Обозначим этот корень через Х\.
Пусть х\ — собственный вектор, отвечающий Аь Выберем новую
(правую) ортогональную систему координат, направив ось z по
направлению вектора х\. Тогда в новом базисе /ь/2,/3, образованном
ортами координатных осей, матрица оператора А примет вид
(а\ п2 0N
ЬХ h О
С\ С2 1
Так как матрица ||Л||г — ортогональная, то ее столбцы
(а^
суть ортонормированные вектора, т.е. (dudj) — 8ц. Значит
и, следовательно,
diuj + bity = 8ц. (3.7)
В силу (3.7) можно указать углы {р и ф, О < ipt ф < 2к так, что
а\ = cos (p, b\ = sin ipt п2 = sin ф, &2 = cos ф.
и
cos <p sin ф + sin <p cos ф = О,
т. е. sin(^ + <р) = 0. Следовательно, или ф = —<р или ф = —(р + тг.
Второй вариант отпадает, ибо при нем det||yl||^ = —1, что
невозможно. Значит ф = -tp и
/ cos ip — sirup 0
\\A\\f = sin<^> cosv? 0 ,
V о о 1 '
т.е. ||Л||г — матрица вращения на угол (р около оси z (около
вектора х\). Значит, оператор А есть вращение и теорема 3.2 доказана.
122 —'Ь- Глава IV. Операторы в пространствах со скалярным произведением
п.3.8. Рассмотрим теперь произвольный оператор Ао из 0(3),
не принадлежащий 0+(3), т.е..До'— ортогональный оператор, для
которого det ||Ло|| = —1. Пусть i = (—1)/, где / — тождественный
оператор. Оператор / называют инверсией, ибо ir = —г для Vr € Л3.
Очевидно, / € 0(3) и det ||;|| = —1. Поэтому оператор Bo:=Aoi —
ортогональный и
Значит, Во € 0+(3). Очевидно, Ао = B$L Таким образом, любой
оператор Ао из 0(3), Ао & 0+(3), есть произведение некоторого
оператора из 0+(3) на инверсию.
Итак, мы установили состав множества 0(3): показано, что
ортогональные операторы в /?3 — это вращения из 0+(3) и
произведения всех этих вращений на инверсию.
ГЛАВА
V
ЛИНЕЙНЫЕ, БИЛИНЕЙНЫЕ
И КВАДРАТИЧНЫЕ ФОРМЫ
§1-
ЛИНЕЙНЫЕ И БИЛИНЕЙНЫЕ ФОРМЫ
п.1.1. Пусть К — произвольное конечномерное
линейное пространство над вещественным полем F = R и К1 = R.
Линейный оператор L, действующий из К в К' называется линейной
формой. Как мы знаем (§ 1 гл. II), для задания линейного
оператора достаточно задать его значения на базисных векторах. Пусть
ii,..., 0Л —базис в К и U — L(e,-), / = 1,2,..., п. Тогда для Vjc £ К,
х = ElLi 6*i. очевидно,
(1.1)
Формула (1.1) дает общий вид линейной формы. Любой набор
вещественных чисел /i,/2, ...,/n в формуле (1.1) определяет линейную
форму, для которой L(ei) = //. Действительно, взяв х = (£ь &♦ • • • ♦ 6*)
с £ = 1, £у- = 0,/ =^ /, мы получим jc = в( и L(£;) = //.
Приведем примеры линейных форм. Пусть К —
предгильбертово конечномерное пространство, С, D — линейные операторы,
действующие из К в /Г, F = К. Тогда для Vjc, у е К скалярное
произведение (СХу Dy) — есть линейная форма по х (по у) при
фиксированном у (х) для любых операторов С и D. Простейший случай:
С = D = I — единичный оператор и тогда (Cx,Dy) = (x,у).
Задание
Доказать, что множество линейных форм над полем R образует
линейное пространство по сложению и найти его размерность.
124 -Jb- Глава V. Линейные, билинейные и квадратичные формы
п.1.2. Билинейные формы
Определение. Билинейной формой называется такая
числовая функция В{х,у), определенная на парах элементов х,у из К,
которая является линейной формой по х при фиксированном у
и линейной формой по у при фиксированном х.
Примером билинейной формы может служить рассмотренное
выше скалярное произведение (Сх, Dy) (конечно без фиксации х или у).
Билинейной формой является и произведение двух любых
линейных форм L\(x)L2(y). Найдем общий вид билинейной формы. Пусть
еи ..., еп - базис в К, х = £?=| £&, у = £ул=| гце} - любые вектора
из К. Тогда, используя сначала линейность формы В(х,у) по
первому аргументу при фиксированном втором, а потом линейность по
второму аргументу при фиксированном первом, мы получим
/,/=1
(1.2)
Положим bij=B(ei,ej). Тогда общий вид билинейной формы (1.2)
запишется так:
В(х,у) = £ьП1Ьц. (1.3)
С другой стороны, пусть bfj — произвольные вещественные
числа и задана функция
Легко видеть, что В°(х,у) — билинейная форма в
пространстве К и Ь°ц = BQ(ei,ej). Таким образом, любая билинейная форма
в К имеет вид (1.3), где Ьц = В(е/, е7). Числа Ьц образуют матрицу
билинейной формы, которую мы будем обозначать через В или
через Ве, если надо указать, в каком базисе записана форма В(х,у),
т.е.
§ 1. Линейные и билинейные формы —'Ь- 125
Билинейная форма называется симметричной, если В(х, у) = В(у, х)
при Ух, у € К, Отсюда следует, что у симметричной билинейной
формы
9д = Ь,ъ (1.4)
т. е. матрица симметричной билинейной формы симметрична. С
другой стороны, если матрица В симметрична, то
Ьц = B(ei, ej) = bji = B(eh et)
и поэтому
B(x,y) = B(y,x) Vx,y€K.
Так как справедливость равенства В(х> у) = В(у, х) не зависит от
выбора базиса пространства К, то матрица симметричной
билинейной формы будет симметрична в любом базисе.
п.1.3. Выясним, как меняется матрица В = Ве билинейной
формы В(х,у) при переходе в пространстве К от базиса е = (е\, ..., еп)
к базису / = (/ь ... ,/„), определенному с помощью какой-либо
матрицы перехода Р = (рц)%:
// = Ер^ /=1.2,...,л. (1.5)
s=\
Пусть Bj = (bst)^ — матрица билинейной формы В(х, у) в
базисе /, х = ZU <*ifi*y = EJLi Pjfl- Тогда В(хуу) = ZlM афц* r*e
^ = В(/,-,//).Всилу(1.5)
IZO = H PsiPtjB(es,et) =
s=l /=1
Обозначим транспонированную к Р= (р//)" матрицу через Рг = {pfX
где pfj^pji. Тогда
^ lbipt, = (РтВеР)ц. (1.6)
Так как равенство (1.6) верно для V/,/, то оно означает, что
Bf = PTBeP. (1.7)
126 —/\у- Глава V. Линейные, билинейные и квадратичные формы
Это и есть искомая формула, связывающая матрицы Bf и Ве
билинейной формы В(х,у) в базисах f и е.
п.1.4. Сравним формулу (1.7) с формулой, дающей связь
матриц Af и Ае линейного оператора А в базисах f не (см. (4.14) гл. И):
Af = p-{AeP, (1.8)
Мы видим, что матрицы операторов и билинейных форм при
изменении базиса в общем случае преобразуются по разному.
Однако, если матрица перехода Р — ортогональная (это имеет место,
если оба базиса е и / — ортонормированы), то РТ = Р~1 (см. §3
гл. IV) и формула (1.7) принимает вид
Bf = p-{BeP, (1.9)
аналогичный (1.8).
Это обстоятельство наводит на мысль, что может существовать
какая-то связь между билинейными формами и операторами. И
такая связь действительно существует. Найдем ее. Пусть в
конечномерном предгильбертовом пространстве К с ортонормированным
базисом е = (е\, ...,еп) задана билинейная форма В{х,у) и пусть
В = (bst)" — матрица формы В{х,у). Тогда для оператора С,
действующего из К в К с матрицей ||С|| = Вт выполняется равенство
В(х,у) = (Сх,у) Vx,yeK. (1.10)
Действительно, пусть х = X^=i &e«» У = X)/=i Ще\- Обозначим
матричные элементы матрицы ||С|| через сц. Тогда
. (Ml)
Для выполнения равенства В(х,у) = (Cx,#) при любых x,i/ в
силу (1.3) и (1.11) необходимо и достаточно, чтобы сц = Ьц, т.е.
чтобы ||С||=ВГ.
Замечание. Если билинейная форма симметрична, то при ||С|| =
= Вт = В равенство (1.10) можно записать в виде
). (1.12)
(Сх,у) = (£ ) (
/=1 *,/=1 5=1
§2. Диагонализация билинейных форм —lly- 127
§2. ДИАГОНАЛИЗАЦИЯ БИЛИНЕЙНЫХ ФОРМ
п.2.1. Будем говорить, что билинейная форма В(хуу)
диагонализуема в пространстве К, если в К существует такой
базис / = (/ь ... ,/л), в котором матрица Bf формы В(х,у) будет
диагональной, т.е. такой, что 6i/:=B(/i,//) = 0 при гф\. Поэтому в
базисе / при х = £"=| а///, */ = £?=| /?/// будем иметь
£ (2.1)
где Ьц =B(fi,fi). Вид (2.1) билинейной формы В(х,у) называется
диагональным, а базис / = (/ь ... ,/„), в котором форма В(х,у)
принимает вид (2.1), называется диагонализуюшим. Как мы уже
говорили, базис /ь ... ,/л —диагонализующий, если
£(/*.//) = О, кф\. (2.2)
Покажем, что любая симметричная билинейная форма
диагонализуема. Не ограничивая общности, считаем, что базис е=(е\,... ,£„),
в котором задана билинейная форма, ортонормирован (если бы это
было не так, то мы предварительно перешли бы к ортонормиро-
ванному базису; при этом матрица билинейной формы осталась бы
симметричной (см. §1)). Далее, в пространстве К построим орто-
нормированный базис / = (/ь ...,/«) из собственных векторов
матрицы В = Ве билинейной формы В(х, у) и пусть Р — матрица
перехода от базиса е к базису /. По определению, матрица Р —
ортогональна, и, значит, Рт = Р"1. Поэтому формула (1.7) примет вид
Bf = P~lBeP. (2.3)
Bf — матрица В в базисе из собственных векторов и поэтому она
диагональна и на диагонали находятся собственные значения Аь ..., Ал,
которым отвечают собственные вектора /ь ..., [п. Поэтому для любых
выполняется
Таким образом, симметричная билинейная форма B(xty) диагона-
лизована.
128 —'ь- Глава V. Линейные, билинейные и квадратичные формы
Описанный метод диагонализации билинейных форм
называется методом ортогонального преобразования (иногда — методом
приведения к главным осям).
Замечание. После выбора ортонормированного базиса из
собственных векторов матрицы В можно было закончить
доказательство по другому. А именно, так как матрица Ве — симметрична, то
в силу (1.12) В(х,у) = (Вх,у). Взяв х = /,-, у = /у мы получим, что
Ъц =
и, значит, базис /ь ... ,/„ — диагонализующий.
п.2.2. Здесь и в п. 2.3 мы приведем примеры диагонализации
билинейных форм методом ортогонального преобразования. Пусть
в двумерном пространстве К с ортонормированным базисом е = (е\, ei)
— произвольные вектора и
В(х,у) = 2&7/1 +
Матрица Ве формы В(хуу) есть
2
и собственные значения матрицы В находятся из
характеристического уравнения
2-А л/15
4-А ~U>
т. е. из уравнения
А2 - 6А - 7 = 0.
Отсюда Ai = 7, А2 = — 1. Таким образом, диагональный вид формы
В(хуу) есть
где (аьаг) и (/?ь/32) — координаты векторов х и у в ортонорми-
рованном базисе /ь/г из собственных векторов матрицы 5. Най-
§ 2. Диагонализация билинейных форм
129
дем их. Ищем вектора // в виде /; = XIs=i7s*£s> / = 1,2 и тогда
(см. (6.3), гл. II)
(2 - \ihu + vT5t2* = ol . = l2
V1571,-+ (4 - A/)72i = OJ '
Находим отсюда 7s/ и нормируем полученные вектора /,-. Получим
вектора диагонализующего базиса
f - {JL
- (л!
~\Д6
Таким образом, матрица перехода
/3 -5
у/15 л/15
V\/24
= (o -°.)-
п.2.3. Рассмотрим еще один пример. Пусть К — трехмерное
пространство над вещественным полем Е, е = (еье2>ез) — ортонорми-
рованный базис в /С, х = 5^f=1 &£ь у = Z}Li ty/e/ — произвольные
вектора из К и билинейная форма fi(jc, f/) задается равенством
B(x,y) = ±(fr
Матрица В — Ве этой формы
Собственные значения матрицы Ве находятся из
характеристического уравнения
-А ! ±
А 2 2
^ -А ~
2 2 "А
= 0,
130
Глава V. Линейные, билинейные и квадратичные формы
т. е. из уравнения
Откуда А, = -1/2, А2 = А, = -1/2, А3 = 1. Пусть / = (/,,/2,/з) -
ортонормированный базис из собственных векторов матрицы Ве,
где fi отвечает собственному значению А,-. Тогда для произвольных
* = £L ".-Л. </ = Е?=. #//из А"
В{х,у) = -^
Найдем собственные вектора /,-. Пусть fi = J2i=\ Упе\- При А = Ai = —1/2
ранг матрицы В - ХЕ равен 1 и поэтому из системы (В - X\I)fi = 0
(см. (6.3), гл. II) мы должны взять лишь одно уравнение
7и + 721 + 731 = 0.
Отсюда находим два линейно независимых решения, ортогонализу-
ем и нормируем их и подставляем в выражения для f\ и /2. Получим
1\ = -
-е2
V2
/2 =
е\ 4- в2 -
V6
При А = Аз = 1 ранг матрицы В — ХЕ равен двум, поэтому в
системе (В — Аз/)/з = 0 (см. (6.3), гл. И) берем два уравнения
-713 + 723/2 + 7зз/2 = 0, 71з/2 - 723 + 7зз/2 = 0.
Отсюда находим 713» 723, 7зз, нормируем вектор (713>723>7зз) и
подставим его компоненты в выражение для /з. Тогда получим
/з =
е\ + #2 4-
Таким образом, диагонализующий базис найден. Матрица
перехода Р от базиса е к базису / есть
_L _L J_\
у/2 л/б у/г
1_ J_ J_
~V2 л/б у/г
о -4 4
р =
§2. Диагонализация билинейных форм —fly- 131
Задание
Проверить прямым вычислением, что
2
О 1,
п.2.4. Метод ортогонального преобразования является
универсальным методом диагонализации симметричных билинейных
форм. Однако он требует нахождения собственных значений и
собственных векторов матрицы билинейной формы, а это при
dim A" ^ 4 в общем случае возможно лишь численно.
Ниже рассматривается другой метод диагонализации
билинейных форм — метод Якоби, который требует для своего применения
только решения систем линейных алгебраических уравнений и
вычисления определителей. Однако этот метод применим не всегда.
Метод Якоби. Пусть К — линейное пространство над полем F=R,
е = (еь ..., еп) - базис в К, х = $^"=1 £&, у = £JL, *1& —
произвольные вектора из К, В(х, у) = X)i\=i ZiVjbij ~~ билинейная форма
на К. Обозначим угловые миноры матрицы В через Д&:
Ь\\
bk\
A = 1,2 п.
Теорема 2.1. Пусть Ak ф 0, k = 1,2,..., n - 1. Тогда
1) можно найти диагонализующий базис / = (/ь ... ,/л), я
лагая f\= е\ и решая для нахождения каждого Д /г/ш /г ^ 2 c
стему из (k-\) линейных уравнений',
2) в этом базисе диагональные элементы B(fm,fm) матрицы
равны
Дт/Д«-ь т = 2Д...,л, B(/i,/i)
Доказательство. Вектора диагонализующего базиса
/=(/l. vV./»)
должны удовлетворять (по определению) требованиям (2.2):
B(fk,f,) = O, кф\.
Так как билинейная форма симметрична, то нам достаточно для
каждого k ^ 2 рассмотреть только случай у < /г, т. е. / = 1,2, ..., k—1.
132 —*\у- Глава V. Линейные, билинейные и квадратичные формы
Будем искать вектора Д в виде линейных комбинаций векторов
е\,..., ek с неопределенными коэффициентами р&\
k-\
е г . X ^ t q Q /Л Л \
S=l
где числа pSk должны обеспечивать выполнение (2.2) при / < k.
Фиксируем далее какое-либо значение k,k^2. Так как каждый
вектор /у зависит только от векторов es с номерами, не
превосходящими /, то равенства (2.2) будут вытекать из равенств
£(/*,*/) = 0, у = 1,2 Л — 1. (2.5)
Подставляя выражение вектора Д из (2.4) в формулу (2.5), получим
k-\
х =0, /= 1,2 Л —1,
откуда следует, что
k-\
bkj + 52p*kb8j = 0, /=1.2 Л — 1. (2.6)
s=l
Учитывая, что bSj = bjS и перенося свободные члены Ьщ в правые
части уравнений (2.6), получим итоговую систему (k — 1)
уравнений с \k — 1) неизвестными pSk, s — 1,2,..., k — 1:
k-\
Y,Pskbjs = -bkh / = 1.2 Л — 1. (2.7)
s=l
По условию теоремы определитель этой системы Д^_1 не
равен нулю и поэтому из нее мы можем найти числа р5ь а,
значит, можем построить вектор /* диагонализующего базиса
согласно (2.4). Полагая k = 2,3, ...,л, получаем диагонализующий
базис / = (/ь ...,/п). Диагональные элементы А^ матрицы Ве
определяются формулами Afe = B(fk,fk), k = 1,2,..., п. Таким образом,
утверждение 1) теоремы 2.1 доказано.
п.2.5. Докажем утверждение 2). Пусть число т фиксировано и
Нт = С{е\,..., ет} — линейная оболочка первых т векторов
базиса е пространства К. Обозначим через В^(х,у) билинейную
форму В(х,у) на векторах пространства Нт. При
i=\
§ 2. Диагонализация билинейных форм
133
очевидно,
и, значит,
\f h ef) = B(eh e}) = bih ij = 1, ..., т.
Поэтому матрица В^ билинейной формы В^(х,у) есть
... Ь1т
В{т)=
(2.8)
Ьт\
Так как для матрицы В^ выполняются условия теоремы, то мы
можем диагонализовать форму В{т)(х,у), построив диагонализую-
щий базис
так же, как мы строили базис /= (/ь/г, ...,/п) для матрицы В.
Полагаем
Am) л Am)
k-\
s=l
(2.9)
где p]fo — неизвестные коэффициенты, которые для каждого fe,
k = 2,..., т определяются из условий
B{m)(f^\ej)=Oy /=1,2 Л — 1.
Отсюда, подставляя выражение f^ из (2.9), мы аналогично
предыдущему получим систему уравнений относительно р^
k-\
Е^Оя) Wm) __ ±Ат) / = 19 k 1 (2. 10^
* sk js kj ' •» »»•••» • V • /
s=l
Так как 6J. = 6y при 1 < /, / < m, то система (2.10) при
фиксированном k совпадает с системой (2.7). Поэтому решения р^
системы (2.10) совпадают с решениями pSk системы (2.7), а значит,
в силу (2.4) и (2.7) выполняется /^ = Д при любом k < ти любом
т< п. Так как Д € Ят, fe = 1,2,..., т, то
134 Ju Глава V. Линейные, билинейные и квадратичные формы
и поэтому матрица Bim) имеет вид
0
0
0
A2
0
0 ..
0 ..
Аз ..
0
. 0
. 0
\о о о ... лт/
Обозначим через Рт матрицу перехода от базиса е = (е\,...,ет) к
базису / = (/i fm). Тогда в силу (1.7)
Bf] =РТтВ{т)Рт. (2.11)
Из системы (2.9) видно, что матрица Рт — верхняя треугольная с
единицами на главной диагонали. Поэтому detPm = detP;£ = 1 и в
силу (2.11)
} = det PTm det Bim) det Рт = det B(m) = Дт,
т.е.
А1А2 -.. Ат = Дт.
Отсюда Ai = Д1 и Ат = Дт/Дт_ь т = 2,3,..., п.
Теорема 2.1 доказана полностью.
. п.2.6. Приведем пример диагонализации билинейных форм
методом Якоби. Рассмотрим ту же билинейную форму В(х,у), что и
в п. 2.2:
В(х, у) = 2&7/1 + л/15 6
Так как А\ = Ь\\ = 2 ф 0, то метод Якоби применим. Очевидно,
Дг = —7 и поэтому диагональный вид формы В(хчу) есть
где ai, Q2 и /?i, /?2 — координаты векторов х и у в якобиевом диа-
гонализующем базисе /ь/г- Найдем его. Полагаем
А = ей /2 = ^2 +Р12^ь
где константа р\2 находится из условия
B(/2,/i) = В(е2+р\2е\,е\) = 621 +P12&11 = 0.
Отсюда pi2 = -b2\/b\\ = -VT5/2. Поэтому
§3. Квадратичные формы и их диагонализация —'!#- 135
п.2.7. Обсудим вопрос об одновременной диагонализации
нескольких билинейных форм. Пусть Bi(x,y) i = 1,2,... ,р —
симметричные билинейные формы и В, i = 1,2,... >р — их матрицы в каком-
либо ортонормированном базисе е = (е\> e<i,..., еп) пространства К.
Теорема 2.2. Билинейные формы В((х,у) можно диагонализо-
вать одновременно, если матрицы В\,..., Вр попарно коммутируют.
Доказательство следует из аналогичного утверждения для
операторов — из теоремы 5.6 гл. И. В силу этой теоремы в
пространстве К можно построить ортонормированный базис / из векторов
/ь • • • ,/л> каждый из которых является собственным для всех
матриц В(. Очевидно, что все матрицы Btj в этом базисе — диагональ-
ны, а так как оба базиса — и е\,..., еп и f\.. ./л — ортонормиро-
ваны, то в силу (2.3) матрицы Вц и будут матрицами билинейных
форм Bi(x,y) в базисе /. Теорема 2.2 доказана.
§ 3. КВАДРАТИЧНЫЕ ФОРМЫ
И ИХ ДИАГОНАЛИЗАЦИЯ
п.3.1. Определение. Квадратичной формой А(х)
называется билинейная форма B(xty) с совпадающими
аргументами, т. е. А(х) - В(хух).
Таким образом, если е\%... ,еп — базис в пространстве К,
то общий вид квадратичной формы до приведения подобных членов
есть
A(x) = B(x,x) = £bl№h (3.1)
'./=1
а после приведения
А(х) = £ atMh (3-2)
где
ац = Ьц + bji при i ф /, аи = Ъй /, / = 1,2,..., п. (3.3)
Из формул (3.3) видно, что однозначное нахождение билинейной
формы В(х, у), порождающей при у = х данную квадратичную,
невозможно без дополнительных ограничений на форму В(х,у). Далее
136 -J\^ Глава V. Линейные, билинейные и квадратичные формы
всегда считается, что квадратичная форма порождается
симметричной билинейной формой и поэтому в силу (3.3) коэффициенты
порождающей формы В(х,у) определяются равенствами
Ъц = Ьр = ац/2 при / ф /, Ьц = аи, i, j = 1,2,..., п. (3.4)
Матрицей А произвольной квадратичной формы (3.2) мы будем
называть матрицу порождающей билинейной формы, т.е.
матрицу В с элементами (3.4).
п.3.2. Диагонализация квадратичных форм.
Определение. Говорят, что квадратичная форма А(х)
записана в диагональном виде, если для \/х = ]Г*=1 £zet- е К
выполняется А(х) = Х)Г=1 £?"«» г^е ^ ~ некоторые числа. Базис, в
котором форма А(х) имеет диагональный вид, называется диагона-
лизующим.
Так как для порождающей билинейной формы В(х,у)
выполняется А(х) =В(х,х), то для приведения квадратичной формы к
диагональному виду достаточно привести к диагональному виду
порождающую билинейную форму В(х,у) и потом положить у = х.
Это приведение можно сделать, например, методом ортогонального
преобразования (см. п. 2.1), или, если Д* ф 0, k — 1,2,..., п - 1,
методом Якоби (см. п. 2.4). Приведем примеры.
Пример 1. Рассмотрим квадратичную форму
Порождающая ее симметричная билинейная форма есть
В(х, у) = 2£i77i + >/15 ft»» + VI5 &»й + 4£2%. (3.5)
А эту форму мы уже приводили к диагональному виду методом
ортогонального преобразования в п. 2.2. Получили, что диагона-
лизующий базис f\, /2 задается равенствами
, = 3gj vT5g2 1 = Ьех
\/24 \/24 \/40
и что диагональный вид формы В{х,у) при
х — a\f\ + #2/2» # = ^1/1 4
есть
§3. Квадратичные формы и их диагонализация —'b- 137
Значит, диагональный вид квадратичной формы А(х) при диагонали-
зации методом ортогонального преобразования дается равенством
Теперь приведем ту же квадратичную форму А(х) к
диагональному виду методом Якоби. Для этого надо диагонализовать
методом Якоби форму (3.5). Но это было сделано в п. 2.6. Диагонализу-
ющий по Якоби базис — это /i = ей h — e2 — VT5ei/2,
диагональный вид формы (3.5) в этом базисе
Значит, диагональный вид квадратичной формы А(х) при диагона-
лизации методом Якоби дается равенством
Пример 2. Пусть в линейном пространстве К с ортонормиро-
ваннымм базисом е = (еь ег> ез), х = Y^=\ 6*/ ~" любой вектор из /Г,
квадратичная форма А(х) задается равенством
Порождающая ее билинейная форма
В(х9у) = ^\т + ^т + 2&*? + 64 + ^^7 +
Но форму В(х,у) мы уже диагонализовали методом ортогонального
преобразования в п. 2.3. Мы получили, что в диагонализующем
базисе
f e\ -e2 f e\+e2- 2e3 f e\+e2
/l = ^r- /2= ve • h = -^fi
при х — $3/=1 Qj/i, у = ]С/=1 /'//у выполняется
В(х,у) = -1- - 1
2
и, значит,
п.3.3. Наряду с методами диагонализации квадратичных форм,
основанными на построении диагонализующего базиса
порождающей билинейной формы, существует метод, в котором
диагонализация проводится непосредственным построением диагонализующих
координат. Это — метод Лагранжа (метод дополнения до полного
квадрата), к описанию которого мы переходим.
138 —'l/- Глава V. Линейные, билинейные и квадратичные формы
Метод Лагранжа. Рассмотрим произвольную квадратичную
форму (3.2) и пусть значение i такоёо, что пц^О (случай, когда ass = О,
5 = 1,2, ..., п будет рассмотрен позже). Не ограничивая общности,
можно считать / = 1. Перепишем равенство (3.2), выделяя в
форме А(х) члены, содержащие £i и вынося в них а\\ за скобки. Тогда
(п п
/•2 I NT""4 ~ ~—1 **• f \ i \~^ ~ t t /о а\
S1 "г / ^а\]а\\ sls/j • У. ^i/sis/' W-4J
/=2 /,/=2
Дополним выражение в скобках до полного квадрата, добавляя
(и вычитая — для сохранения равенства) подходящие члены. Получим
п п
/=2 /=2
/=2
) (
/=2 /=2
Подставляя это выражение в (3.6) и приводя подобные члены, имеем
А(х) = (
/=2
К/
где aj^ — известные коэффициенты.
Положим т/1 = £ + J3JUаф/2а\и Vs = 6»5 = 2,3, ...,/г. Тогда
квадратичную форму /4(лс) можно записать в виде
f (3.7)
где
Al(x)=J2<$)ViVr (3.8)
4=2
i<i
Таким образом, мы перешли от задачи диагонализации
квадратичной формы А(х) от п переменных £ь ...,£л к задаче
диагонализации квадратичной формы А\(х) от (п — 1) переменных г/2, ... ,г/л.
Прежде, чем продолжить процесс диагонализации, применяя описан-
§3. Квадратичные формы и их диагонализация —/\у- 139
ный выше метод к форме А\(х), рассмотрим случай, когда в
исходной квадратичной форме А (х) выполняется а\\—а<п— ... = апп = О
и, следовательно, наш подход не применим. В этой ситуации
надо с самого начала сделать промежуточную замену переменных.
А именно, находим в (3.2) коэффициент aiojo Ф О и полагаем
Тогда квадратичная форма (3.2) запишется в виде
4=1
в котором 2/0t0 = Щф ф 0, и к которому, следовательно, наш подход
применим (пример такой ситуации разобран в п. 3.7).
п.3.4. Возвратимся теперь к квадратичной форме А\(х) (см. (3.8)).
Находим такое /, / > 2, что aff ^ 0 (если все а\^ = 0, t = 2,3,..., л,
то сначала делаем промежуточную замену переменных аналогично
описанной в п. 3.3). Не ограничивая общности, можно считать, что
/ = 2. После этого выделяем в форме А\(х) члены, содержащие щу
выносим за скобки а^ и дополняем полученное выражение до
полного квадрата аналогично п. 3.3. Получим
Ах(х) = a
/=3 /
где коэффициенты а|у2) известны.
Положим
71 = 41. 72 = 42 + X^a2jVj/2a22> Ъ =
/=з
Тогда в силу (3.7)-(3.9)
где
i./=3
140 —'ly- Глава V. Линейные, билинейные и квадратичные формы
Таким образом, задача диагонализации исходной формы А(х) от п
переменных £ь ...,£« сведена к Аналогичной задаче для формы Лг(х)
от (п - 2) переменных.
Действуя описанным методом, мы за конечное число шагов
приведем форму А(х) к диагональному виду
(3.10)
где dk — известные коэффициенты (некоторые, может быть,
нулевые), а /?1,...,/?л — координаты вектора х в неизвестном пока
диагонализующем базисе / = (/ь .. .,/„).
п.3.5. Установим, в каком базисе / форма А(х) имеет вид (ЗЛО).
Для этого сначала выразим «последние» координаты (3\,..., (Зп
вектора х через его координаты £ь ...,£п в исходном базисе е\, ...,еп.
Получим
А = 1>/& ' = 1.2 л. (3.11)
где цц — известные числа. Пусть
(<7п on ... Яы\ Iр\\ Р\2 ... Р\пл
, P = Q-l = [
Яп\ Qn2 ... Qnn) \Рп\ Рп2 ... Рпп;
Тогда в силу (3.11)
£/ = &/<•#' / = 1,2,..., п. (3.12)
Но в силу соотношений (4.8) и (4.2) §4 гл. II, матрица Р есть
матрица перехода от базиса е — (е\,... ,е„), в котором х = 5^?=1 ^^,
к базису / = (/ь ... ,/„), в котором л: = J^yLi A7/- Поэтому диагона-
лизующий базис / связан с исходным базисом е равенствами
п
s = / ^Ptset S — 1» ^> • • •, Л.
п.3.6. Рассмотрим примеры применения метода Лагранжа.
Пример 1. Начнем с квадратичной формы
§3. Квадратичные формы и их диагонализация —*\/- 141
которую мы раньше диагонализовали другими методами. Выделяя
слагаемые, содержащие &, имеем
Подставляя это выражение в форму А(х) и полагая
»й = ft + "2~&, m = и,
получим
Л(jc) = 2ч? - 7f5tji + 4q§ = 2ч? - 3,5ч22.
Для нахождения диагонализующего базиса выразим £ь£г через чьЧ2:
. \/15 t
Поэтому матрица перехода от базиса е\,в2 к диагонализующему
базису /ь/г равна
и, значит,
, , \/15
/1=*!, /2 = ^2 J-ei.
Отметим, что этот диагонализующий базис случайно совпал с диа-
гонализующим базисом, полученным по методу Якоби.
п.3.7. Пример 2. Пусть в трехмерном пространстве К выбран
какой-либо базис е = (е\ув2,ез), х = !C/=i &е* "" ЛК)бой вектор из К
и квадратичная форма А(х) задается равенством
Л(*) = 66 + 6& + й&- (3.13)
Так как аи = а^г = азз = 0, то необходима предварительная замена
переменных. Полагаем
Тогда в переменных £/
142 —i\j- Глава V. Линейные, билинейные и квадратичные формы
Дополняем члены, содержащие £ь до полного квадрата, добавляя
(и вычитая) (6 + 2£з)2/4. Получим, что
А(х) = £? + 6(6 + 2&) + (6 + 26)2Л " (6 -
Полагая
г}\ = I + (6 + 2|з)/2, ?72 = 6.
имеем
Таким образом, мы диагонализовали квадратичную форму (3.13)
методом Лагранжа. Для нахождения диагонализующего базиса
/= (/ь/г,/з) согласно общей теории выразим сначала координаты
Щ^ЩтЩ через исходные координаты £ь^2>£з- Получим
Ч2 = 6 = 6-Й. Г/з =6-
Отсюда
6 = т - ?72/2 - г/з, 6 = V\ + W2 - *7з* 6 = ^з.
Следовательно, матрица перехода Р есть
Р= ' 2 -1
\0 О 1/
и диагонализующий базис / задается равенствами
/l = 01 + 02, /2 = -01/2 + 02/2, /3 = -01 - 02 + 03.
Задание
Непосредственным вычислением проверить, что базис /ь/г,/з будет
диагонализующим для порождающей форму А(х) билинейной формы В(х,у).
п.3.8. Сравним результаты диагонализации квадратичных форм
разными методами. Для формы (3.5) — методами ортогонального
преобразования и Якоби (п. 3.2), для формы (3.13) — методами
ортогонального преобразования (п. 3.2) и Лагранжа (п. 3.7). Мы
§3. Квадратичные формы и их диагонализация —'w- 143
видим, что в рассмотренных примерах диагонализующие базисы и
соответственно диагональный вид одной и той же квадратичной
формы зависят от метода диагонализации. Этот факт не
является неожиданным уже потому, что если вектора любого диагонали-
зующего базиса /= (/ь ...,/я) умножить на произвольные
вещественные константы di, di ф О, * = 1,2, ..., л, то полученный базис
g = (^1/1,^2/2,... ,dnfn)> во-первых, как и /, будет диагонализую-
щим, ибо B(difi,djfj) = didjB{fi,fj) =-0 при 1ф\, и, во-вторых, в этом
базисе коэффициенты в диагональном виде формы А(х) = В(х,х)
будут отличаться от соответствующих коэффициентов в базисе /
множителями df.
В то же время во всех разобранных случаях число
положительных, отрицательных и нулевых коэффициентов в диагональном
виде квадратичной формы не зависело от выбранных базисов. Этот
факт не является случайным. Имеет место
Теорема 3.1. Число положительных (л+), отрицательных (п-)
и нулевых (по) коэффициентов в диагональном виде
квадратичной формы определяется только самой квадратичной формой и
не зависит от диагонализующего базиса.
Замечание. Числа п+> п_, по называются соответственно
положительным, отрицательным, и нулевым индексами инерции
квадратичной формы, а теорема 3.1 — законом инерции квадратичных форм.
п.3.9. Доказательство. Пусть для произвольной квадратичной
формы А(х), определенной в пространстве К с базисом е = (ей • • •»еД
базисы / = (/ь ... ,/я) и g = (gj,... ,#„) — диагонализующие. Тогда
для любого вектора х G К,
выполняется
А(х) = Х>^- = £#л/- (3.14)
i=i /=i
Обозначим через р+, р_, ро и #+, #_, qo соответственно
число положительных, отрицательных и нулевых
коэффициентов щ и цг в (3.14). Надо доказать, что р+ = q+, р_ = #_, Ро = Qo-
Установим сначала, что р+ = <7+- Не ограничивая общности,
будем считать, что положительные коэффициенты щ имеют
номера 1,2,... ,р+, отрицательные р+ + 1,р+ + 2,... ,р+ +/?-,
аналогично, пусть положительные числа щ имеют номера 1,2,. ..,#+,
144 JL Глава V. Линейные, билинейные и квадратичные формы
отрицательные q+ + 1, q+ + 2,.. ., #+ + #_ (этого можно добиться
перенумеровав при необходимости базисные вектора /i,...,/n и
gb --->gn)- Перепишем равенство (3.14) в виде:
? + £ /Э?№. (3.15)
Перенесем в (3.15) сумму с отрицательными vx в правую часть
равенства, а сумму с отрицательными щ — в левую. Получим
соотношение
Р+ Q++Q- Q+ Р++Р-
X>,2t,1+ J2 /??(-№) = Х>?м,+ Е о?(-^), (зле)
i=l i=q++1 х=1 i=P++l
где каждая из сумм не отрицательна. Предположим, что р+ < </+
и покажем, что это невозможно. Попробуем найти такой вектор
л: = Х^Г==1 &ei €&>x фв,у которого в базисе / равны нулю первые р+
координат а/, а в базисе g — координаты /?/, начиная с / = q+ + 1,
т. е. такой вектор х, у которого
ах = а2 = ... = ар+ = 0, Д^+i = Д^+2 = ... = 0п = 0. (3.17)
Так как координаты ось и /3/ являются линейными комбинациями
исходных координат £s, то требования (3.17) можно записать в виде
= 0, i = 1,2,
71
где C/s, rf/7 — некоторые числа. Таким образом, координаты £i, £г» • • • i £я
искомого вектора jc должны удовлетворять системе (3.18) из р++(п—q+)
однородных линейных уравнений. Так как р+ < #+, то число
уравнений р+ + м - q+ меньше числа п неизвестных £ь&* ... ,£л-
Следовательно, у системы (3.18) существует не нулевое решение
£ь£2> ...,£«> т.е. вектор х,хфв с требуемыми свойствами (3.18)
может быть найден. Подставим его координаты в равенство (3.16).
Тогда левая часть (3.16) (а значит и правая) обратится в ноль. Но
каждая из сумм в правой части (3.16) не отрицательна, и поэтому
каждая равна нулю. Для нас важно, что
Х>?М/ = 0. (3.19)
4=1
§3. Квадратичные формы и их диагонализация —ft/- 145
Таккак/х/>0 /=1,2, ...,<7+, то в силу (3.19) (3\=/?2= ••• =^+ = 0.
Таким образом, у не нулевого вектора х все координаты А, /?2, •••>/?/*
в базисе g равны нулю, что невозможно. Значит неравенство р+ < q+
не верно. Невозможность противоположного неравенства р+ > #+
доказывается аналогично. (Надо найти вектор х, для которого Д- = О,
i = 1,..., 4+ и а<: = 0, / = р+ + 1,..., п\ координаты &,...,£„
этого вектора будут удовлетворять системе q+ + (п - р+) < п
однородных уравнений и т.д.) Следовательно, мы доказали, что
число п+ = р+ = q+ положительных коэффициентов в диагональном
виде формы А(х) не зависит от выбора диагонализующего базиса,
т. е. является инвариантом квадратичной формы.
Чтобы доказать равенство р_ = #- рассмотрим квадратичную
форму А-(х) = — А(х). Для формы А-(х) число положительных
коэффициентов в диагональном виде при диагонализации в
базисах / и g есть соответственно р_ и ^_. По доказанному, р_ = q-.
Наконец, так как р+ = q+ и р- = q-> то
ро = п - р+ - р- = qo = п - q+ - q-.
Теорема 3.1 доказана полностью.
п.ЗЛО. Закону инерции квадратичных форм можно придать
простой геометрический смысл. Пусть в пространстве К с базисом
е\,02, • • •»£п задана квадратичная форма
4=1
«</
Равенство Л (jc) = 1 задает поверхность в пространстве переменных
£ь ••-,^я- Тип этой поверхности определяется индексами инерции
формы А(х) и не может зависеть от выбора базиса. Так, например,
квадратичная форма
после приведения к диагональному виду имеет вид (см. п. 3.3)
А(х) = -~а\ - -а\ + а\.
А это значит, что поверхность А(х) = 1 — это двухполостной
гиперболоид (л_ = 2, п+ = 1) и никаким выбором базиса мы не
превратим поверхность Л(лс) = 1 в другую поверхность, например, в
эллипсоид (п+ = 3).
146
Глава V. Линейные, билинейные и квадратичные формы
§ 4. ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ
КВАДРАТИЧНЫЕ ФОРМЫ
п.4.1. Определение. Квадратичная форма А(х)
называется положительно определенной, если
А(х) > О Ухе К,
(4.1)
Так же, как для положительно определенных операторов (см.
§2 гл. IV), необходимым и достаточным условием положительной
определенности квадратичной формы А(х) является
положительность всех собственных значений ее матрицы. Докажем это.
Приведем форму А(х) к диагональному виду методом
ортогонального преобразования. Пусть /= (/ь ...,/я) — базис в К, состоящий
из ортонормированных собственных векторов матрицы А и пусть
Aj,..., Ап — соответствующие собственные значения. Тогда при х£К
имеем х = Y%=\ aifi и
где А/ = A{fi), Ясно, что если все А,- > 0, то А(х) > О при х ф в.
С другой стороны, если А(х) > О, то А,- = А(/,•) > 0, i = 1,2,..., п.
Утверждение доказано. Необходимые и достаточные условия
положительности собственных значений матрицы нам известны. Они
даются критерием Сильвестра, доказанным нами на языке
операторов в §2 гл. IV. Здесь мы повторим формулировку этого критерия,
но доказательство дадим другое — на языке квадратичных форм.
п.4.2. Пусть
А = В =
(Ь\\
... b\n\
bk\ ...
\Ьп\ ...
и Ak =
— соответственно матрица квадратичной формы А{х)х) и ее
угловой минор &-го порядка.
!) Напоминаем, что матрица А квадратичной формы А(х) — это
матрица В порождающей симметричной билинейной формы В(х,у), см. п. 3.1.
§ 4. Положительно определенные квадратичные формы —'Ь- 147
Критерий Сильвестра. Для положительности собственных
значений матрицы А необходимо и достаточно, чтобы
выполнялись неравенства
Д*>0, * = 1,2,...,л. (4.2)
Доказательство. Достаточность. Так как Д* ф О, k =
= 1,2,..., п — 1, то применим метод Якоби диагонализации
квадратичной формы А(х). Согласно ему (см. п. 3.2), в диагональном виде
где числа щ = Д//Д/_ь i ^2, i/j = Д1 = 6ц. В силу (4.2) щ > О,
/ = 1,2,..., л. Следовательно, форма А(х) положительно
определена и, значит, собственные значения матрицы А — положительны.
Достаточность условий (4.2) доказана.
Необходимость. Пусть все собственные значения матрицы А по*
ложительны. Тогда квадратичная форма А(х) положительно
определена в пространстве К а, следовательно, и в любом
подпространстве Н С К. Пусть е =(е\, . ..,ел) —базис в KnHk = C{e\, ...,£*} —
линейная оболочка первых k векторов базиса е. Матрица А^
квадратичной формы А(х) в пространстве Ни есть
bk\ • • •
Так как квадратичная форма А(х) положительно определена в
пространстве Hk, то собственные значения \f\ ..., А^ матрицы A^k) —
положительны. Но Д* = det Л(/5) = AJ*) • А^ • ... • \{® и, значит, Д* > 0.
Необходимость доказана.
Замечание. Приведенное доказательство безусловно проще, чем
данное в пп. 2.2-2.4 гл. IV доказательство критерия Сильвестра
на языке операторов. Однако надо понимать, что эта простота
достигнута за счет использования разобраного ранее метода Якоби
диагонализации квадратичных форм. Отметим также, что
доказательство критерия Сильвестра в §2 гл. IV работает и при F = С и
при F = R, в то время как доказательство на основе теории
квадратичных форм предполагает F = R.
п.4.3. Аналогично положительно определенным квадратичным
формам мы можем ввести отрицательно определенные, потребовав
для них выполнение неравенства
А(х)<0 УхеК, х^в. (4.3)
148
Глава V. Линейные, билинейные и квадратичные формы
Если форма А(х) отрицательно определена, т. е. верно (4.3), то
форма —А(х) — положительно определена и, значит, у матрицы —А все
собственные значения положительны. Поэтому, если
А =
то, чтобы форма — А(х) была положительно определена,
необходимо и достаточно, чтобы выполнялись неравенства
—Ь\\ —Ь\2
т. е. чтобы
-bk\ ~
(-0*
>0, 4 = 1,2, ....n,
bkk
Таким образом, необходимое и достаточное условие
отрицательности квадратичной формы (оно же — условие отрицательности
собственных значений матрицы А) можно записать так:
Д* > 0 при четном &, Д* < 0, если k не четно, k — 1,2,..., п.
п.4.4. В заключение рассмотрим вопрос об одновременном
приведении к диагональному виду двух квадратичных форм, одна из
которых положительно определена.
Пусть е=(е\, ..., еп) — произвольный базис в К,х= Ya=\ £iei ^^>
А (х) > 0 — положительно определенная квадратичная форма, В(х, у) —
порождающая для А(х) билинейная форма, С(х) — произвольная
квадратичная форма, Се — ее матрица в базисе е (т.е. матрица
порождающей билинейной формы). Введем в пространстве К
скалярное произведение
(x,y)i:=B(x,y). (4.4)
Так как билинейная форма В(х,у) линейна по каждому из
аргументов и В(х,х) > 0 при х Ф в, то определение (4.4) скалярного
произведения корректно. Пусть / = (/ь ... ,/л) — ортонормирован-
ный в скалярном произведении (•, -)i базис в /С. Тогда, если
§4. Положительно определенные квадратичные формы —»\у- 149
то
)
1=1 /=1 i,/=l 1=1
Таким образом, в любом ортонормированном (•, ♦ )i базисе билинейная
форма В(х, у), а значит, и квадратичная форма А (х)=В(ху х) = Y%=i °$
имеют диагональный вид. Пусть Р = (pst)n ~ матрица перехода от
базиса е к базису /: /,- = Y%=\Psies~B базисе / согласно (1.7)
С/ = РТСеР.
Матрица С/ — симметрична, ибо симметрична матрица Се.
Выберем теперь в пространстве К ортонормированный (-,-)i базис
gb • • • >gn из собственных векторов матрицы С/. В этом базисе
матрица Cf диагональна, а, значит, и квадратичная форма С(х) примет
диагональный вид. В то же время при
n
B(x,y) = (X,y)\ = ^
/,/=1
и, значит,
Таким образом, обе квадратичные формы А (х) и С(х) диагонализованы.
п.4.5. Рассмотрим пример. Пусть в двумерном пространстве К
с базисом е = (еьвг) заданы произвольные вектора
и квадратичные формы
Очевидно, форма Л(х) положительно определена. Обозначим
через В(х,у) и С(х,у) билинейные формы, порождающие
соответственно квадратичные формы А(х) и С{х). Тогда
В(ху у) = 4&771 + £it?2 4- &П\ + Ьт* с(х> У) =
150 _II- Глава V. Линейные, билинейные и квадратичные формы
Введем в пространстве К скалярное произведение
(х9у)ц=В(х,у).
Тогда ||jc||? = В(х,х) = А(х). Строим ортонормированный в
скалярном произведении (•, • )i базис в К по рецепту п. 4.4 гл. I. Имеем
Ъ=еи Л=иТр т'е- Л = (1.0),
ИЛИ? = 4 и /, = | = (1/2,0).
Далее
h~e<i- te»/i)i/b где в2 — (0,1), (^2, /i)i = B{e2,e\j2) = 1/2.
Значит
/2 = *2-l/2/i= e2-l/4ei = (-1/4,1), и И? =Л1(/2) = 3/4.
Поэтому k = 77ГГ = [-Trm* -72 )• ]
х = ai/i + a2f2, У = 0\f\ + &7.Ы
В(х,у) = (х,у)\ = аф\ + а2&2, А(х) = а? 4- а^.
Найдем теперь вид матрицы Cf билинейной формы С(хуу) в
базисе /ь/г- Согласно (1.7)
Cf = PrCP, (4.5)
где Р — матрица перехода от базиса е к базису /, С — матрица
квадратичной формы С(х) в базисе е:
V о 2(V5)-7f L~\-i о)'
В силу (4.5)
С =( °'25 -5(4л/3)
; V-5(4\/3)"1 0,75
и, значит,
Диагонализуем форму Cf{x,y) методом ортогонального
преобразования. Для этого находим собственные значения матрицы С/ \\%2 и
§4. Положительно определенные квадратичные формы —'ь- 151
соответствующие нормированые собственные вектора g\ и g2- Тогда
при л: = 7igi 4- 72^2 мы получим
С(х) =
а так как вектора gi, g2 — ортонормированы, то
Таким образом, обе квадратичные формы А(х) и С(х) диагонали-
зованы одновременно.
Задание
Найти Ai, Аг, g\, g2.
ПРИЛОЖЕНИЕ
п.1. Почему для матрицы а = (а//)", у которой для элементов
s-й строки и каких-то чисел 0j и 7/ выполняется aSj = fy + 7/,
/ = 1,2, ..., я, определитель а равен сумме определителей
матриц ар и а7, полученных из матрицы а соответственно при
&sj = 0\ (для ар) и при aSj = 7/ (для а7), / = 1,2,..., я?
Пусть 0 = (/?ь/%, ...,/?„), 7 = (7i>72, ...,7л).
ац ai2
h-\,\ Cks-1.2
+ 71 02 + 72
= a(J3;O9O, .. .,0), а7 = а(0,0, ...,0;7).
Утверждается, что
det a = det a$ + det a7.
(П.1)
Действительно, пусть Л5/ — алгебраическое дополнение
элементов as/, 0j и 7/ соответственно в матрицах а, а/? и а7 (оно одно
и то же). Тогда, разлагая det a, deta/з и deta7 по элементам 5-й
строки, мы получим в левой части равенства (П.1) ]T)Li(/?/ + 7/Ms/»
а в правой Xl/=i A^s/ + Z)/=i 7/^s/« Значит, равенство (П.1) верно.
п.2. Почему определитель матрицы не меняется, если к
любой ее строке добавить другую, умноженную на произвольную
константу}
Приложение
153
Пусть s, t — фиксированные числа, s Ф /, 5, t € [1,2,..., л],
аи п\2 ... п\п
п\\ ... а]Л
as,\ ... а5|л
аЯ| ... аПп
, в =
^s—1,1 as_i,2 ... as-\,n
i 4- pan aS2 + pa^2 •. • a$n + pa
as+i,i as+i,2 ••• as+i.n
(П.2)
Утверждается, что
Равенство (П.2) следует из (П.1). Действительно, пусть
an ai2 ... a\n
C =
Тогда в силу (П.1) с a = В, а$ = Л, а7 = С, т. е. при as/ = as/ 4- pat\,
/3/ = as/, 7/ = ре*/. / = 1,2,..., л имеем
detB = deM + detC. (П.З)
В матрице С две строки отличаются только множителем р: одна —
это строка с номером /, а другая — строка с номером s,
состоящая из элементов patupaa, ...>patn- Поэтому detC = O и (П.2)
следует из (П.З).
Замечание. Так как при транспонировании матрицы ее
определитель не меняется, то из проведенных рассуждений следует, что
определитель матрицы не меняется, если к любому ее столбцу
добавить другой столбец, умноженный на произвольную константу.
п.З. Почему определитель произведения двух квадратных
матриц равен произведению определителей этих матриц?
Пусть А = (fl//)2, В = (bik)»9 С = (ctk)nn = A • В.
Утверждается, что
detC = detA-detB. (П.4)
Доказательство. Согласно п.2.3 главы II
/, & = 1,2,..., n.
(П.5)
154
Приложение
Фиксируем любое значение t = / и подставим
/-ю строчку матрицы С. Получим
= 1,2,...,/! в
С =
Ci+\,\
Cn\
С\п
)s=l aisbsn
Ci+ltn
Cnn
(П.6)
Обозначим через B(s) и C(t) строки с номерами s и t
соответственно матриц В и С, 1 < s, t < п. Тогда в силу (П.5) строка C(t) есть
линейная комбинация строк B(s) с коэффициентами п(8:
C(t) =
= E <*tstB(st).
(П.7)
Здесь мы переобозначили индекс суммирования, взяв s* вместо s, и
тем самым «привязав» его к номеру t строки, для которой написано
разложение (П.7)2\ В силу (П.7) с t — i мы можем применить для
нахождения detC равенство (П.1). Сделав это, получим
det С = ^2 aiSi det
С\\
ci+\,\
Cn\
C\n
(П.8)
Применим теперь аналогичный подход последовательно для всех
остальных строк определителей в (П.8), подставляя в них
разложение (П.5) и используя затем равенство (П.7) при t = 1,2, ...,/- 1,
i + 1,..., п. Тогда получим
det С =
l a2s2... anSn det
S\,...,Sn
♦ . . b
S2.n
Ьв,Л ...
(П.9)
2) Переобозначение сделано чтобы избежать путаницы с индексами
суммирования, так как при рассмотрении других строк определителя
появятся аналогичные суммы.
Приложение
155
Так как каждый из индексов sj пробегает значения 1,2, ...,/z,
то в сумме в (П.9) есть слагаемые, в которых sj = sp для каких-то
/ и р. Но в таких слагаемых определитель равен нулю, так как
он содержит две одинаковые строки: B(Sj) и B(sp). Поэтому можно
считать, что в каждом слагаемом суммы (П.9) числа S\,S2, ..-,sn
различны. А так как 1 < S\,S2,... ,sn < n, то каждый такой набор
sj,S2, ...,5„ в (П.9) получается из набора 1,2, ...,/г с помощью
перестановки
/12 3 ... п\
S2 S3
Sn j
Обозначим через N(s) число транспозиций, переводящих набор
s = (si,52,...,sn) в набор (1,2,...,п). Так как при каждой
перестановке строк B(sj) «■+ B(sp) определитель меняет знак, то
Ьп\
Ьп,п
= (-l)ms)detB.
Подставляя это выражение в (П.9), получим
det С = £(-l)Arwau,a2e... а^„ detB = det A detB,
так как здесь суммирование идет по всем наборам s = (s\,... ,srt),
полученным из набора (1,2, ...,л) всевозможными
перестановками. Утверждение (П.4) доказано.
п.4. Почему у системы п линейных уравнений с ненулевым
определителем существует единственное решение и как его найти}
Рассмотрим систему п линейных уравнений с п неизвестными
хих2, ...,*„:
022*2
... + аппхп = Ьп л
где пц и bi> /,/ = 1,2,..., п — известные числа. Пусть
... аХп
an ...
an\ ...
(П.11)
156
Приложение
Для решения системы (П. 10) применим хорошо известный
метод Гаусса. Выберем в первом уравнении (П. 10) коэффициент ац
не равный нулю. Для простоты считаем, что это а\\. После этого
первое уравнение (П. 10) умножим на п2\/а\\ и вычитаем из
второго, затем его же умножим на а^\/а\\ и вычитаем из третьего
уравнения системы и т. д. до n-го уравнения включительно. Тогда
система (П. 10) перейдет в систему
■ а\пХп = b\
(П.12)
где пц = пц — #1/0(1 /п\\, 6j- = &j — (0/i/0n)&i, /,/ = 2,3,..., п. Далее
во втором уравнении системы (П.12) выберем коэффициент а^ ^0.
Для простоты предположем, что это 022- После этого
последовательно умножим второе уравнение сначала на 032/022 и вычтем
из третьего уравнения (П.12), затем умножим на 042/022 и вычтем
из 4-го уравнения и т.д. до п-го уравнения включительно. Тогда
получим систему
= ьх
(П. 13)
rnea(2)-aa) fl(1)fl(1)/a(l) b(2)-bm (a(l) /a{l))b{l) i i - 3 4 n
Продолжая действовать аналогично, мы в итоге придем к системе
(П.14)
+...+4% =
где все коэффициенты aj;s), b\s\ i,j = 2,3,..., n\ s = 1,2,..., я - 1
известны.
Приложение
157
Прежде чем решать систему (П.14) отметим, что определители
систем (П.12)-(П.14) совпадают с определителем Д Ф 0 исходной
системы (П.10). Это следует из того, что матрица каждой
следующей системы получается из матрицы предыдущей вычитанием из
некоторых строк одной, умноженной на какие-то константы. А
такое преобразование в силу п.2 не меняет определитель матрицы.
Отсюда вытекают два важных следствия.
1. Ни на одном шаге мы не можем столкнуться с ситуацией,
когда все коэффициенты aft~~1^ = О, t — k, k 4- 1,..., n\ k = 2,3,..., л,
ибо это привело бы к равенству нулю определителя системы.
2. Величина
и, значит, а|{ ф 0, / = 2,3,..., п.
В силу сказанного из системы (П. 14) неизвестные х\,Х2,... ,хп
легко находятся: из я-го уравнения находим хп, затем подставляем
найденное значение хп в (п — 1)-е уравнение и оттуда находим хп~\,
затем, подставив найденные значения хп и хп-\ в (п — 2)-е
уравнение, находим оттуда хп-2 и т.д. (Здесь важно, что aft~l) фО.)
Таким образом, мы дали способ отыскания решения системы (П. 10)
и одновременно доказали его существование и единственность.
п.5. Как выглядит формула для решения системы (П. 10)?
Зная, что решение системы (П. 10) существует, выведем
формулу для его нахождения, не проводя процедуру п.4.
Пусть A(k) — это определитель А системы (П. 10), в котором
ft-й столбец заменен столбцом свободных членов системы:
A(k) =
Докажем, что
аи ... aitk-i b\
021 • • • <L%k-\ &2
... (ln,k-\ Ьп an,k+l ...
(П.15)
Существует изящное доказательство формулы (П.15). Приведем
его. Пусть Х\,Х2, ...,*« — решение системы (П.10). Очевидно,
a\n
Cln\
CLn,k-\ CLnkXk ClnA+l • • •
(П.16)
А
158 _IX- Приложение
Обозначим через Aj и Bj j-e столбцы соответственно
определителей (П.11) и (П.16), / = 1,2,'... ,/г. Очевидно Bj=Aj1 j Ф k, и
Bk = XkAk. Прибавим к &-му столбцу определителя (П.16)
линейную комбинацию ]£"_1,/^л *И/ остальных столбцов. Тогда в
полученном определителе k-й столбец будет равен Y?j=\ xjAj- Элементы
этого столбца совпадают с левыми частями уравнений (П. 10) и,
следовательно, с правыми частями, т.е. соответственно с
числами &ь&2, ...,Ьп. Поэтому определитель в правой части (П.16)
равен A(k) и из равенства х*Д = A(k) мы получим формулу (П.15).
п.6. Почему определитель Вандермонда не равен нулю?
Пусть Аь ..., Ал — я различных чисел, п > 2 и
1 1 ... 1
А? А| '.'.[ А . (П.17)
Определитель V(Ai,..., А„) называется определителем
Вандермонда. Покажем, что V(X\,..., Ап) Ф 0, если все числа А/
различны. Доказательство проведем по индукции. При п — 2
Пусть F(Ai,..., А„) ф 0 для любых различных Аь ..., А„ при п =
= 2,3,..., т и докажем, что V(X\,..., \п) ф 0 для различных Аь .. • • А„
при п = т +1. Фиксируем А2,..., Am+i и рассмотрим V(\\,..., Am+i)
как функцию от Х\. Раскладывая определитель (П.17) при п =
по элементам первого столбца, получим
где d\ =
По предположению индукции d\ фО, тогда У(Аь ...,Am+i) —
это полином степени т относительно Aj. Он не может иметь
больше т корней. Но мы знаем, что V(\\, ...,Am+i) = 0 при Aj = Ay,
/ = 2,3,..., m, m 4-1, т. е. т корней известны. Следовательно,
никаких других корней нет и поэтому, если А2, ..., Am+i различны и
А! ф А/, / = 2,3, ..., т 4-1, то V(Ai, А2,..., Am+i) Ф 0. Что и
требовалось доказать.
Замечание. Можно доказать, что
но этот результат нами не используется.
СПИСОК ЛИТЕРАТУРЫ
1. Ильин В. Л., ПозднякЭ.Г Линейная алгебра. — М.: Наука, 1999. —
296 с.
2. Беклемищев Д. В. Курс аналитической геометрии и линейной
алгебры. - М.: ФИЗМАТЛИТ, 2001. - 376 с.
3. Апатёнок Р. Ф. и др. Элементы линейной алгебры. — М.: Наука,
1987. - 273 с.
4. Головина Л. И. Линейная алгебра и некоторые ее приложения. — М.:
Наука, 1985. - 392 с.
5. Крутицкая //., Шишкин А. Линейная алгебра в вопросах и задачах. —
М.: ФИЗМАТЛИТ, 2002. - 248 с.
6. Канатников А. //., Крищенко А. П. Линейная алгебра. — М.: Изд-во
МГТУ им. Н. Баумана, 2006. - 335 с.
7. Натансон И. П. Теория функций вещественной переменной. — М.:
Наука, 1974. - 480 с.
Учебное издание
Заявки на книги присылайте по адресам:
zakaz@id-intellect.ru
solo@id-intellect.ru
id-intellect@mail.ru
тел. (495) 579-96-45
В заявке обязательно указывайте
свои реквизиты (для организаций) и почтовый адрес!
Подробная информация о книгах на сайте
http://www.id-intellect.ru
Книжный магазин в МФТИ
тел. (495) 408-73-55
Григорий Моисеевич Жислин
ЛЕКЦИИ
ПО ЛИНЕЙНОЙ АЛГЕБРЕ
ДЛЯ ФИЗИКОВ И МАТЕМАТИКОВ
Компьютерная верстка — ИД «Интеллект»
Корректура автора
Ответственный за выпуск — Л.Ф. Соловейчик
Формат 60x90/16. Печать офсетная.
Гарнитура Ньютон.
Печ. л. 10. Зак. №
Бумага офсетная №1, плотность 80 г/м2
Издательский Дом «Интеллект»
141700, Московская обл., г. Долгопрудный,
Промышленный пр-д, д. 14,
тел. (495) 617-41-85
Отпечатано ООО «Мэйл Текнолоджи»
Московская область, г. Подольск, ул. Комсомольская, д.
Сайт: www.book-expert.ru, E-mail: info@book-expert.ru
тел. +8(495) 212-91-99; +7(926) 204-49-31