Предисловие
Глава 1. Определители
§ 1.2. Основные задачи теории систем линейных уравнений
§ 1.3. Определитель n -го порядка
§ 1.4. Свойства определителей
§ 1.5. Алгебраические дополнения и миноры
§ 1.6. Практическое вычисление определителей
§ 1.7. Правило Крамера
§ 1.8. Миноры произвольного порядка. Теорема Лапласа
§ 1.9. О линейной зависимости между столбцами
Задачи
Глава 2. Линейные пространства
§ 2.2. Линейная зависимость
§ 2.3. Базис, координаты, размерность
§ 2.4. Подпространства
§ 2.5. Линейные оболочки
§ 2.6. Гиперплоскости
§ 2.7. Морфизмы линейных пространств
Задачи
Глава 3. Системы линейных уравнений
§ 3.2. Нетривиальная совместность однородной линейной системы
§ 3.3. Условие совместности общей линейной системы
§ 3.4. Общее решение линейной системы
§ 3.5. Геометрические свойства совокупности решений линейной системы
§ 3.6. Методы вычисления ранга матрицы
Задачи
Глава 4. Линейные функции векторного аргумента
§ 4.2. Линейные операторы и их матричная запись
§ 4.3. Действия над линейными операторами
§ 4.4. Соответствующие действия над матрицами
§ 4.5. Дальнейшие свойства умножения матриц
§ 4.6. Область значений и нуль-многообразие линейного оператора
§ 4.7. Линейные операторы, переводящие пространство К_n в себя
§ 4.8. Инвариантные подпространства
§ 4.9. Собственные векторы и собственные значения
Задачи
Глава 5. Преобразования координат
§ 5.2. Последовательные преобразования
§ 5.3. Преобразование координат вектора при изменении базиса
§ 5.4. Преобразование коэффициентов линейной формы
§ 5.5. Преобразование матрицы линейного оператора
§ 5.6. Тензоры
Задачи
Глава 6. Каноническая форма матрицы линейного оператора
§ 6.2. Алгебры; алгебра многочленов от одного переменного
§ 6.3. Каноническая форма матрицы произвольного оператора
§ 6.4. Элементарные делители
§ 6.5. Некоторые следствия
§ 6.6. Вещественная жорданова форма
§ 6.7. Спектры, корпусы и многочлены
§ 6.8. Функции от оператора и их матричная запись
Задачи
Глава 7. Билинейные и квадратные формы
§ 7.2. Квадратичные формы
§ 7.3. Приведение квадратичной формы к каноническому виду
§ 7.4. Канонический базис билинейной формы
§ 7.5. Построение канонического базиса по методу Якоби
§ 7.6. Сопряженные линейные операторы
§ 7.7. Изоморфизм пространств с выделенной билинейной формой
§ 7.8. Полилинейные формы
§ 7.9. Квадратичные и билинейные формы в вещественном пространстве
Задачи
Глава 8. Евклидовы пространства
§ 8.2. Определение евклидова пространства
§ 8.3. Основные метрические понятия
§ 8.4. Ортогональный базис
§ 8.5. Задача о перпендикуляре
§ 8.6. Общая теорема об ортогонализации
§ 8.7. Определитель Грама
§ 8.8. Несовместные системы линейных уравнений и метод наименьших квадратов
§ 8.9. Сопряженные операторы и изометрия
Задачи
Глава 9. Комплексные пространства со скалярным произведением
§ 9.2. Скалярное произведение в комплексном пространстве
§ 9.3. Нормальные операторы
§ 9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве
Задачи
Глава 10. Квадратичные формы в евклидовом и унитарном пространствах
§ 10.2. Экстремальные свойства квадратичной формы
§ 10.3. Задача о паре квадратичных форм
§ 10.4. Приведение общего уравнения поверхности 2-го порядка к каноническому виду
§ 10.5. Геометрические свойства поверхностей 2-го порядка
§ 10.6. Анализ поверхности по ее общему уравнению
§ 10.7. Эрмитово-квадратичные формы
Задачи
Глава 11. Конечномерные алгебры и алгебры матриц
§ 11.2. Представления абстрактных алгебр
§ 11.3. Неприводимые представления и лемма Шура
§ 11.4. Основные типы конечномерных алгебр
§ 11.5. Строение левого регулярного представления простой алгебры
§ 11.6. Структура простых алгебр
§ 11.7. Структура полупростых алгебр
§ 11.8. Строение представлений простых и полупростых алгебр
§ 11.9. Некоторые дальнейшие результаты
Задачи
Глава 12. Категории конечномерных пространств
§ 12.2. Случай, когда все данные алгебры Re_alpha - полные
§ 12.3. Все данные алгебры Re_alpha - одномерные
§ 12.4. Все данные алгебры Re_alpha - простые
§ 12.5. Все данные алгебры Re_alpha - полные алгебры диагональных матриц
§ 12.6. Категории и прямые суммы
Ответы и указания к задачам
Предметный указатель
Text
                    Г. Е. ШИЛОВ
МАТЕМАТИЧЕСКИЙ
АНАЛИЗ
КОНЕЧНОМЕРНЫЕ
ЛИНЕЙНЫЕ
ПРОСТРАНСТВА
Допущено Министерством
высшего и среднего специального образования CCQP
в качестве учебного пособия
для студентов университетов
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
MOCK В А 19 6 9


517.2 Ш59 УДК 517 Математический анализ (конечномерные линейные пространства). Г. Е. Шилов. Книга представляет собой существенно переработанный вариант книги того же автора «Введение в теорию линейных пространств» (Гостехиздат, 1952 и 1956). Издание соответствует в основном программе университетского курса линейной алгебры и рассчитано в первую очередь на студентов математических, физических и других естественнонаучных специальностей. Для ее чтения необходимо, как правило, владение лишь элементарной математикой; в отдельных случаях используются сведения из математического анализа с соответствующими, отсылками. В главе 1 излагается теория определителей. В главах 2—7 рассматривается аффинная теория линейных пространств (над произвольным числовым полем), в главах 8—10 — теория евклидовых и унитарных пространств. В главе 11 описываются алгебры линейных операторов в конечномерных пространствах и в главе 12 — соответствующие категории. Георгий Евгеньевич Шилов МАТЕМАТИЧЕСКИЙ АНАЛИЗ Конечномерные линейные пространства М., 1969 г., 432 стр. с илл. Редакторы: М. С. Агранович, //. П. Рябенькая Техн' редакторы: В. Н. Крючкова, Л. А. Пыжова. Корректор Т. С. Вайсберг. Сдано в набор 3/111 1969 г. Подписано к печати 2/VI 1969 г. Бумага 84хЮ81/32. Физ. печ. л. 13,5. Условн. печ. л. 22,68. Уч.-изд. л. 21,25. Тираж 75 000 экз. T-06953. Цена книги у2 коп. Заказ №35 19. Издательство «Наука» Главная редакция физико-математической литературы Москва, В-71, Ленинский проспект, 15. Ордена Трудового Красного Знамени Первая Образцовая типография имени А. А. Жданова Главполиграфпрома Комитета по печати при Совете Министров СССР Москва, Ж-54, Валовая, 28 22-69
ОГЛАВЛЕНИЕ Предисловие 7 Глава 1. Определители 9 § 1.1. Числовые поля 9 § 1.2. Основные задачи теории систем линейных уравнений 11 § 1.3. Определитель п-го порядка 13 § 1.4. Свойства определителей 17 § 1.5. Алгебраические дополнения и миноры 21 § 1.6. Практическое вычисление определителей 25 § 1.7. Правило Крамера 26 § 1.8. Миноры произвольного порядка. Теорема Лапласа 30 § 1.9. О линейной зависимости между столбцами .... 33 Задачи 39 Глава 2. Линейные пространства 42 § 2.1. Определение 42 § 2.2. Линейная зависимость 47 § 2.3. Базис, координаты, размерность 51 § 2.4. Подпространства 55 § 2.5. Линейные оболочки 64 § 2.6. Гиперплоскости 66 § 2.7. Морфизмы линейных пространств 69 Задачи 73 Глава 3. Системы линейных уравнений 74 § 3.1. Еще о ранге матрицы 74 § 3.2. Нетривиальная совместность однородной линейной системы 76 § 3.3. Условие совместности общей линейной системы ... 78 § 3.4. Общее решение линейной системы 79 § 3.5. Геометрические свойства совокупности решений линейной системы 81 § 3.6. Методы вычисления ранга матрицы 83 Задачи 88 Глава 4. Линейные функции векторного аргумента 91 § 4.1. Линейные формы 91 § 4.2. Линейные операторы и их матричная запись ... 94 1*
4 ОГЛАВЛЕНИЕ § 4.3. Действия над линейными операторами 98 § 4.4. Соответствующие действия над матрицами 101 § 4.5. Дальнейшие свойства умножения матриц 106 § 4.6. Область значений и нуль-многообразие линейного оператора 112 § 4.7. Линейные операторы, переводящие пространство Кп в себя 118 § 4.8. Инвариантные подпространства 127 § 4.9. Собственные векторы и собственные значения . . .129 Задачи 135 Глава 5. Преобразования координат 140 § 5.1. Формулы перехода к новому базису 140 § 5.2. Последовательные преобразования 142 § 5.3. Преобразование координат вектора при изменении базиса 143 § 5.4. Преобразование коэффициентов линейной формы . . 146 § 5.5. Преобразование матрицы линейного оператора . . . 147 § 5.6. Тензоры 149 Задачи 155 Глава 6. Каноническая форма матрицы линейного оператора 157 § 6.1. Каноническая форма матрицы нильпотентного оператора 157 § 6.2. Алгебры; алгебра многочленов от одного переменного 161 § 6.3. Каноническая форма матрицы произвольного оператора 167 § 6.4. Элементарные делители 172 § 6.5. Некоторые следствия 179 § 6.6. Вещественная жорданова форма 181 § 6.7. Спектры, корпусы и многочлены 186 § 6.8. Функции от оператора и их матричная запись . . . 196 Задачи 204 Глава 7. Билинейные и квадратные формы 207 § 7.1. Билинейные формы 207 § 7.2. Квадратичные формы 211 § 7.3. Приведение квадратичной формы к каноническому виду 214 § 7.4. Канонический базис билинейной формы 220 § 7.5. Построение канонического базиса по методу Якоби 223 § 7.6. Сопряженные линейные операторы 227 § 7.7. Изоморфизм пространств с выделенной билинейной формой 231 § 7.8. Полилинейные формы 235 § 7.9. Квадратичные и билинейные формы в вещественном пространстве 237 Задачи 244
ОГЛАВЛЕНИЕ 5 Глава 8. Евклидовы пространства 246 § 8.1. Введение 246 § 8.2. Определение евклидова пространства 248 § 8.3. Основные метрические понятия 249 § 8.4. Ортогональный базис 256 § 8.5. Задача о перпендикуляре 257 § 8.6. Общая теорема об ортогонализации 261 § 8.7. Определитель Грама 266 § 8.8. Несовместные системы линейных уравнений и метод наименьших квадратов 271 § 8.9. Сопряженные операторы и изометрия 274 Задачи 278 Глава 9. Комплексные пространства со скалярным произведением 284 § 9.1. Эрмитовы формы 284 § 9.2. Скалярное произведение в комплексном пространстве 292 § 9.3. Нормальные операторы 298 § 9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве 302 Задачи 312 Глава 10. Квадратичные формы в евклидовом и унитарном пространствах 313 § 10.1. Основная теорема о квадратичных формах в евклидовом пространстве 313 § 10.2. Экстремальные свойства квадратичной формы . . .316 § 10.3. Задача о паре квадратичных форм 325 § 10.4. Приведение общего уравнения поверхности 2-го порядка к каноническому виду 329 § 10.5. Геометрические свойства поверхностей 2-го порядка 333 § 10.6. Анализ поверхности по ее общему уравнению . . . 345 § 10.7. Эрмитово-квадратичные формы 354 Задачи 356 Глава 11. Конечномерные алгебры и алгебры матриц .... 358 § 11.1. Еще об алгебрах 358 § 11.2, Представления абстрактных алгебр 359 § 11.3. Неприводимые представления и лемма Шура . . . 360 § 11.4. Основные типы конечномерных алгебр 362 § 11.5. Строение левого регулярного представления простой алгебры 365 § 11.6. Структура простых алгебр 368 § 11.7. Структура полупростых алгебр 371
6 ОГЛАВЛЕНИЕ § 11.8. Строение представлений простых и полупростых алгебр 376 § 11.9. Некоторые дальнейшие результаты 381 Задачи 382 Глава 12. Категории конечномерных пространств 384 § 12.1. Введение 384 § 12.2. Случай, когда все данные алгебры £>а— полные . . . 388 § 12.3. Все данные алгебры $Ва— одномерные 391 § 12.4. Все данные алгебры $За— простые 397 § 12.5. Все данные алгебры 33а— полные алгебры диагональных матриц 405 § 12.6. Категории и прямые суммы 411 Ответы и указания к задачам 415 Предметный указатель 430
ПРЕДИСЛОВИЕ Эта книга предназначена в качестве учебного пособия для студентов младших курсов математических и физических специальностей. В ней излагается материал, обычно входящий в курс линейной алгебры и в дальнейшем обслуживающий различные разделы математического анализа. Следует заметить, впрочем, что название «линейная алгебра» давно уже не соответствует реальному содержанию курса, который представляет собой синтез идей алгебры, геометрии и анализа. И хотя анализ в точном смысле слова (т. е. отдел математики, связанный с пределами, дифференцированием, интегрированием) присутствует в книге явно лишь на втором плане, на самом деле он-то и является настоящим организатором курса, поскольку проблемы «линейной алгебры» можно считать «конечномерными проекциями» основных проблем анализа и в то же время «опорой» для них. Книга написана на основе нашей старой книги «Введение в теорию линейных пространств» (Гостехиздат, 1952 и 1956; далее ее именуем ВЛП). Различие между ВЛП и новой книгой, в кратких словах, следующее. В ВЛП речь шла исключительно о вещественных пространствах; в новой книге рассматриваются пространства над произвольным числовым полем, вещественный и комплексный случаи излагаются как специфические случаи общей теории, находящиеся в тесной связи друг с другом. Введена глава о жордановой форме матрицы линейного оператора в комплексном и вещественном пространстве. Для комплексного пространства со скалярным произведением рассмотрены канонические формы матриц нормальных операторов, из которых, как частные случаи, получаются канонические формы матриц эрмитовых, антиэрмитовых и унитарных операторов и их вещественных аналогов. Книга ВЛП заканчивалась большой главой о геометрии бесконечно-мерного гильбертова пространства; здесь такой главы нет (в ряде
8 ПРЕДИСЛОВИЕ других книг можно найти более систематическое изложение этого материала, относящегося скорее уже к функциональному анализу). Зато добавлены две новые главы, непосредственно примыкающие к основному содержанию курса: глава о структуре матричных алгебр (написанная по просьбе автора А. Я. Хелемским) и глава о строении матричных категорий (содержание которой взято из статьи И. М. Гель- фанда и автора, Вестник МГУ, Математика и механика, 1.963, № 4). Эти две главы, хотя и вполне элементарны по методам, все же несколько выше но уровню, чем остальные; они представляют линейную алгебру в ее развитии и могут быть использованы в факультативных занятиях. Каждая глава книги заканчивается рядом задач. В некоторой, но весьма небольшой мере они помогают выработке необходимых технических навыков (для этой цели лучше использовать ряд распространенных задачников с богатым выбором упражнений). В основном имеющиеся в книге задачи предназначены для иллюстрации и некоторого развития основного текста; циклы из некоторых задач могут служить темами для докладов на семинарах. Для этой же цели предназначены отдельные необязательные параграфы основного текста, выделенные звездочкой. Автор считает своим приятным долгом отметить тщательную работу М. С. Аграновича и принести ему благодарность за ряд весьма ценных замечаний. Автор благодарит также И. Я. Дорфман за проверку всех задач. Автор
ГЛАВА 1 ОПРЕДЕЛИТЕЛИ § 1.1. Числовые поля 1.11. Как и большая часть математики, линейная алгебра использует числовые системы (числовые поля). Числовым полем называют всякую совокупность К объектов, называемых числами, в которой можно производить с этими объектами четыре арифметических действия. Перечислим необходимые сведения об этих действиях (аксиомы поля). а. Каждой паре чисел а и Р отвечает число а+р, называемое суммой чисел а и Р, причем 1) а + (3 = Р + а для любых а и Р из К (переместительность, или коммутативность сложения); 2) (а 4- (3) +7==а+ (P + Y) Для любых а, р, у из К (сочетательность, или ассоциативность сложения); 3) существует число 0 (нуль) такое, что 0 + а = а для любого а из К; 4) для любого а из К существует число (3 из К такое, что a+[3 = 0 (противоположный элемент). Разрешимость уравнения а-|-[3 = 0 при любом а позволяет ввести операцию вычитания: разность а— [3 по определению есть сумма числа а и решения у уравнения (3 + у = 0. б. Каждой паре чисел а и Р отвечает число а-[3 (или оф), называемое произведением чисел а и р, причем 5) ар = Ра для любых а и Р из /^ (коммутативность умножения); 6) (а$)у = афу) для любых a, P, у из К (ассоциативность умножения); 7) существует число 1 (=^=0) такое, что l-a = a для любого числа а из К; 8) для любого а=£0 существует число у из К такое, что ау=1 (обратный элемент),
10 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.12 Разрешимость уравнения a^^l при любома=^=0 позволяет ввести операцию деления на число а=^=0: частное ftyoc есть произведение числа (3 и решения у уравнения ау— 1. Числа 1 — 1=2, 2-j-l=3 и т. д. называются натуральными; предполагается, что ни одно из них не равно 0*). Натуральные числа, им противоположные и 0 образуют, по определению, совокупность целых чисел поля К. Частные p/q, где р и q — целые и (]Ф0, образуют совокупность рациональных чисел поля К. Два поля К и К' называются изоморфными, если между ними можно так установить взаимно однозначное соответствие, что сумма и произведение чисел поля К соответствуют сумме и произведению соответствующих чисел поля /<". (В этом случае результаты остальных операций — разности и частного — также будут соответствовать друг другу.) 1.12. Наиболее часто встречаются следующие примеры конкретных числовых полей. а. Поле рациональных чисел, т. е. отношений p\q, где р и q ф. 0— обычные целые числа с обычными арифметическими правилами действий. (Заметим, что одни только целые числа не образуют числового поля, так как в этом случае не выполнена аксиома 8).) Из сказанного выше следует, что в каждом поле Л'имеется часть (подполе), изоморфная полю рациональных чисел. б. Поле вещественных чисел, имеющее геометрическим образом совокупность всех точек прямой. Аксиоматика поля вещественных чисел получается добавлением к аксиомам 1)—8) аксиом порядка и аксиомы о точной верхней грани**). в. Поле комплексных чисел a-^-ib, где а и Ь вещественны (символ / не есть вещественное число), с правилами *) Из двух элементов, положим N и £, можно устроить поле по правилам /V + /V-/V, #+-£ = £, £ + £ = #, N-N--=N, N ■£ --=- N, £•£ — £. В соответствии с нашими обозначениями мы должны положить /V = 0, £=1, и тогда 2 = 1-|-1=0. Для исключения таких числовых систем мы и требуем, чтобы все натуральные элементы поля были бы отличными от 0. **) Теория вещественных чисел подробно излагается в нашей книге «Математический анализ (Функции одного переменного)», «Наука», 1969, гл. I. В дальнейшем обозначаем эту книгу через ФОП,
1.21] § 1.2. ЗАДАЧИ ТЕОРИИ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ И действий (ФОП, 2.71): (аг + ibx) + (а2 -4- ib2) = (ах + а2) + / (Ьг + ft2), (аг + ibx) • (а2-;- ib2) = {ala2 — blb2) + i{axb2 + a2bx). Для чисел вида а + /0 эти действия приводятся к одноименным действиям над вещественными числами а\ мы пишем коротко а -г /0 — а и называем эти комплексные числа вещественными. Можно сказать, что поле комплексных чисел содержит часть (подполе), изоморфную полю вещественных чисел. Комплексные числа вида 0-\-ib называются (чисто) мнимыми и короче обозначаются ib. Из правила умножения следует, что /2 = /./ = (0 + /1)(0 + Л)= —1. 1.13. Поле вещественных чисел в дальнейшем обозначается через R. Поле комплексных чисел обозначается через С. Согласно так называемой основной теореме алгебры (ФОП, 4.86), в поле С не только выполнимы четыре арифметические операции, но и разрешимо любое алгебраическое уравнение z» + fll2»-l+...+fl||==(). Поле R вещественных чисел не обладает этим свойством: например, уравнение л:2 + 1 = 0 не имеет решений в поле R. Многие из дальнейших построений справедливы для любого числового поля. Любое числовое поле мы будем обозначать в дальнейшем буквой К. Если некоторое предложение верно для поля /С, оно автоматически верно для поля R и поля С, которые являются частными случаями поля К. § 1.2. Основные задачи теории систем линейных уравнений 1.21. В этой и двух следующих главах мы будем заниматься изучением систем линейных уравнений. В самом общем случае такая система имеет следующий вид: апх1 -f а12х2 + . . . + а1пхп = blt \ «*i*i + Д*2*2 + • . . + aknxn - bk.
12 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.21 Здесь через xY, х2, . . . , хп обозначены неизвестные (элементы поля К), подлежащие определению (заметим, что число неизвестных не предполагается обязательно равным числу уравнений). Числа аи, а12, . . . , акпУ взятые из поля Ку называются коэффициентами системы. Первый индекс коэффициента указывает номер уравнения, в котором фигурирует данный коэффициент, а второй индекс—номер неизвестного, при котором этот коэффициент поставлен*). Числа Ьъ Ь2} . . . , bky стоящие в правых частях равенства (1), ввятые из того же поля /С, называются свободными членами системы; как и коэффициенты, они предполагаются известными. Решением системы называется всякая совокупность чисел съ с2, . . . , сп из того же поля /С, которая, будучи подставлена в систему (1) на место неизвестных х1у х2} . . . , хп, обращает все уравнения системы в тождества **). Не всякая система линейных уравнений вида (1) имеет решение. Например, система 2^ + 3*2 = 5, \ 2*!+ 3*2 = 6 J ( ' заведомо не может иметь ни одного решения. Действительно, какие бы числа сь с2 мы ни подставили на место неизвестных х1} х2у левые части уравнений системы (2) окажутся совпадающими, в то время как правые части различны. Поэтому оба уравнения системы (2) такой подстановкой не могут быть одновременно обращены в тождества. Систему уравнений вида (1), имеющую (хотя бы одно) решение, мы будем называть совместной; систему, не имеющую решений, будем называть несовместной. Совместная система может иметь одно решение или более чем одно; в последнем случае для различения решений мы будем указывать их номера индексами наверху в скобках; например, первое решение с^\ с21}, . . . , с£\ второе решение с[2\ с{2\ . . . , с{2) и т. д. Решение с{?\ с(21}, . . . , с{пи и с[2\ с22), . . . , с{2) считаются различными, если хотя бы одно из чисел c\v не совпадает с соответствующим числом *) Поэтому, например, запись a3i должна читаться так: «а—три — четыре» (а не «а — тридцать четыре»). **) Подчеркнем, что совокупность чисел съ с2, ... , сп составляет одно решение системы (а не п решений).
1.31] § 1.3. ОПРЕДЕЛИТЕЛЬ tt-ГО ПОРЯДКА 13 cj2) (/=1, 2, ..., п). Например, система 2л:1 + 3л:2 = 0, (3) имеет различные решения с\ (1) (1). о, з, .(2) — 2 (а также бесконечное множество других решений). Если совместная система имеет единственное решение, она называется определенной; если совместная система имеет по крайней мере два различных решения, она называется неопределенной. 1.22. Мы можем сформулировать теперь те основные задачи, которые возникают при изучении системы (1): I. Выяснить, является система (1) совместной или несовместной. II. Если система (1) совместна, то выяснить, является ли она определенной. III. Если система (1) совместна и определенна, то найти ее единственное решение. IV. Если система (1) совместна и неопределенна, то описать совокупность всех ее решений. Основным математическим инструментом для изучения линейных систем является теория определителей; мы переходим теперь к ее изложению. § 1.3. Определитель л-го порядка 1.31. Пусть дана квадратная матрица, т. е. таблица из я2 чисел (элементов поля К) я,у(*\ У=1, 2, .. . , п): -1/1 (4) Число п, указывающее количество строк и столбцов матрицы (4), называется ее порядком. Числа а/у- называются элементами матрицы А\ первый и второй индексы у элемента а^ указывают соответственно номер строки и столбца, в которых расположен этот элемент. Элементы ап, а22, . . . , апп образуют главную диагональ матрицы Л. Рассмотрим любое произведение п элементов, расположенных в различных строках и различных столбцах матрицы (4),
14 ГЛ. 1. ОПРЕДЕЛИТЕЛИ 11.31 т. е. по одному в каждой строке ив каждом столбце. Такое произведение можно записать в виде <*«,! Яа,2 • • • <**„„• (5) Действительно, в качестве первого сомножителя мы всегда можем взять элемент, стоящий в первом столбце матрицы (4); если обозначить через аг номер строки, в которой находится этот элемент, то индексы этого элемента будут ах и 1. Аналогично в качестве второго сомножителя можно взять элемент, стоящий во втором столбце; его индексы будут а2 и 2, где а2—номер той строки, в которой расположен этот второй элемент; и т. д. Таким образом, индексы а1? а2, . . . , ап являются номерами строк, в которых расположены сомножители произведения (5), в соответствии с принятым порядком их записи по возрастанию индексов столбцов. Так как по условию элементы аа1, а0 2, . . ., аа п расположены в различных строках матрицы (4), по одному в каждой строке, то числа а1у а2, . . . , ап все различны и представляют собой некоторую перестановку чисел 1, 2, ..., п. Назовем «беспорядком) в этой последовательности аь а2, . . . , ап такое расположение индексов, когда старший индекс стоит раньше младшего. Число всех «беспорядков» обозначим через N(а1у а2, ... , ап). Например, в перестановке четырех цифр 2, 1, 4,3 — два «беспорядка» (2 впереди 1, 4 впереди 3); таким образом, N(2, 1, 4, 3) = 2. В перестановке 4, 3, 1, 2 — пять «беспорядков» (4 впереди 3, 4 впереди 1, 4 впереди 2, 3 впереди 1, 3 впереди 2); поэтому tf(4, 3, 1, 2) = 5. Если число беспорядков в последовательности а1у .. . , ап четно, поставим перед произведением (5) знак-}-; если это число нечетно, поставим перед этим произведением знак — . Иными словами, условимся перед каждым произведением вида (5) писать знак, определяемый выражением (_ \у\т «zlf а2, ... , а;1).
Число всех произведений вида (5), которые можно составить из элементов данной матрицы /z-ro порядка, равно числу всех возможных перестановок чисел 1, 2, . . . , п, которое, как известно, равно п\. Теперь введем следующее определение: Определителем матрицы (4) называется алгебраическая сумма, состоящая из п\ всевозможных произведений вида (5), перед каждым из которых поставлен знак, определенный по указанному выше правилу: D = 2J(-l)"(ai'a|i -'a»}aailaa22...aann. (6) В дальнейшем произведения вида (5) мы будем называть членами определителя. Элементы a(j матрицы (4) будем называть элементами определителя. Определитель матрицы (4) обозначается одним из следующих символов: D- Лп 21 а., о. •п\ . а, = det|!ai}|| = detj|a/y.[!/,/= i,2, ...,«■ (7) Например, для определителей 2-го и 3-го порядка мы получаем следующие выражения: ап аи ап апа22—а21а121 — ДцЙ.22^33 ~Г #21С32Й13 "f" Й31^12Й23 —031^22^13 — ^21^12^33 ^11^32^23* Роль определителей при решении систем линейных уравнений мы покажем на примере системы из двух уравнений с двумя неизвестными. Если дана система ^21*^1 ~~Г~ ^22*^2 =~ ^2' то, исключая обычным образом одно из неизвестных, можно легко получить формулы bia-i-i — b.2al2 ы _ onb2 — о.пЬг *\ = «11^22 —a21«12 *., #11^22— a21012 в предположении, что знаменатели этих отношений отличны от нуля. Числители и знаменатели получающихся дробей представляют собой
16 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.32 определители 2-го порядка: ^1^22 — ^2<312 — Оказывается, что аналогичные формулы имеют место и для решения систем с любым числом неизвестных (см. § 1.7). #21 #22 t>2 Я2о 1.32. Правило для определения знака данного члена определителя можно сформулировать несколько иначе, в геометрических терминах. В матрице (4) в соответствии с нумерацией элементов естественно выделяются положительные направления: слева направо — вдоль строк, сверху вниз — вдоль столбцов. Вместе с этим и косые отрезки, соединяющие два каких-либо элемента матрицы, можно снабдить указанием направления: будем говорить, что отрезок, соединяющий элемент а^ с элементом akm} имеет положительный наклон, если его правый конец расположен ниже левого, и отрицательный наклон, если его правый конец лежит выше, чем левый. Теперь проведем мысленно в матрице (4) все отрезки, соединяющие попарно элементы attli, #а22, ••• , #апл произведения (5) и при этом имеющие отрицательный наклон. Будем ставить перед произведением (5) знак +, если число всех таких отрезков четно, и знак—, если их число нечетно. Например, в случае матрицы 4-го порядка перед произведением а21а12<243Яз4 должен быть поставлен знак +, так как в матрице имеется два отрезка отрицательного наклона, соединяющих элементы данного произведения: Яи fe>) ^13 Ям &2П U22 #23 ^24 Й41 С42 ^4з) #44 а перед произведением ^4iQ32ai3a24 должен быть поставлен знак —, так как в матрице имеется пять отрезков с отрицательным
1.41] § 1.4. свойства определителей 17 наклоном, соединяющих его элементы: В этих примерах количество отрезков отрицательного наклона, соединяющих элементы данного члена, равно числу «беспорядков» в расположении первых индексов элементов, составляющих в произве- нии данный член: в первом примере последовательность первых индексов 2, 1, 4, 3 имеет два «беспорядка», во втором примере последовательность первых индексов 4, 3, 1,2 имеет пять «беспорядков». Покажем, что второе определение знака члена определителя равносильно первому. Для этого достаточно показать, что число «беспорядков» в последовательности первых индексов элементов данного члена (при натуральном порядке вторых индексов) всегда равно числу отрезков отрицательного наклона, соединяющих элементы данного члена в матрице. Но это почти очевидно: наличие отрезка отрицательного наклона, соединяющего элементы aaii и aa.jy означает при / < у, что а,- > а,-, т. е. наличие «беспорядка» в расположении первых индексов. См. задачи 1—3 (в конце этой главы). § 1.4. Свойства определителей 1.41. Операция транспонирования. Определитель \ап а21 . #12 #22 • а1п а2п . . • аш\ • Я/12 • апп\ полученный из определителя (7) заменой строк на столбцы с теми же номерами, называется транспонированным по отношению к определителю (7). Покажем, что величина транспонированного определителя совпадает с величиной исход- ного определителя. Действительно, определители (7) и (8) состоят, очевидно, из одних и тех же членов; поэтому нам
достаточно показать, что одинаковые члены обладают в определителях (7) и (8) и одинаковыми знаками. Транспонирование матрицы определителя, очевидно, есть результат ее поворота (в пространстве) на 180° вокруг диагонали яп, д22, . . ., апп. При этом повороте каждый отрезок с отрицательным наклоном (например, образующий угол а < 90° со строками матрицы) переходит снова в отрезок с отрицательным наклоном (именно, образующий со строками матрицы угол 90° — а). Поэтому число отрезков с отрицательным наклоном, соединяющих элементы данного члена, после транспонирования не изменится; следовательно, не изменится и знак этого члена. Таким образом, знаки всех членов сохранятся; тем самым величина определителя остается неизменной. Доказанное сейчас свойство определителя устанавливает равноправие его строк и столбцов. Поэтому дальнейшие свойства определителей мы будем формулировать и доказывать только для столбцов. 1.42. Свойство антисимметрии. Под антисимметрией относительно столбцов понимают свойство определителя менять знак при перестановке двух столбцов. Рассмотрим сначала случай, когда переставляются два соседних столбца определителя, например у'-й и (у+1)-й. Определитель, полученный после перестановки столбцов, будет состоять, очевидно, из тех же самых членов, что и исходный определитель. Рассмотрим какой-нибудь из членов исходного определителя. Этот член в своем составе имеет элемент из у'-го столбца и элемент из (y-f-l)-ro столбца. Если отрезок, соединяющий эти два элемента, имел отрицательный наклон, то после перестановки столбцов его наклон станет положительным, и наоборот. Что же касается остальных отрезков, соединяющих попарно элементы выделенного члена, то после перестановки столбцов характер наклона каждого из них останется неизменным. Следовательно, количество отрезков с отрицательным наклоном, соединяющих элементы данного члена, при перестановке столбцов заведомо изменяется на единицу; поэтому каждый член определителя, а следовательно, и сам определитель, при перестановке столбцов меняет знак. Пусть теперь переставляются не соседние столбцы, а, например, у-й столбец с &-м столбцом, причем между
Ь44] § 1.4. свойства определителей 19 ними находится т других столбцов и у<&. Эту перестановку можно осуществить последовательными перестановками соседних столбцов в следующем порядке: сначала у-й столбец переставляется с (у + 1)-м, далее с (у+2)-м, (у + 3)-м,... . ..,&-м, затем получившийся (k— 1)-й столбец (ранее бывший &-м) переставляется с (k — 2)-м, (&— 3)-м, ..., у-м. Всего понадобится т-\- 1 + т--= 2т-~-1 перестановок соседних столбцов; после каждой из них, по доказанному, определитель изменяет знак и, следовательно, после конца процесса будет иметь знак, противоположный начальному (поскольку 2т-\-\ при любом целом т есть нечетное число). 1.43. Следствие. Определитель, имеющий два одинаковых столбца, равен нулю. В самом деле, переставляя эти столбцы, мы не изменим определителя; с другой стороны, по доказанному, он должен изменить свой знак. Таким образом, D= —D, откуда следует, что D = 0. См. задачу 4. 1.44. Линейное свойство определителя. Это свойство формулируется следующим образом: а. Если все элементы j-го столбца определителя D представлены в виде «линейной комбинации» двух слагаемых djj.^Xbi + iiCi (/-1, 2, . . ., п) (к и (я — фиксированные числа), то определитель D равен такой же линейной комбинации двух определителей: D^KD^-ixD^ (9) причем у каждого из этих двух определителей все столбцы, кроме j-го, такие же, как у определителя D, а j-й столбец состоит у определителя Dx из чисел bi} у определителя D2 — из чисел ct. Действительно, всякий член определителя D можно представить в виде <1ах\а*г2- • -До,-/. • -йапп = ^1^2. • •(^boLj + V'Caj). . . аапП = = kaai\aa22. . -bay • • Я«пл+ Н'ла11Да22- • -Caj- • -^апп- Собирая вместе первые слагаемые (с теми знаками, которые
20 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.45 имели соответствующие члены первого определителя) и вынося за скобки число %} получим в скобках, очевидно, определитель Dx; аналогично, собирая вторые слагаемые и вынося за скобки число |1, получим определитель D2. Таким образом, формула (9) установлена. Эту формулу удобнее записать в несколько ином виде. Пусть D — произвольный фиксированный определитель. Обозначим через Dj(pf) определитель, который получается при замене элементов у-го столбца определителя D на числа pi (/=1, 2, ..., п). Исходный определитель можно записать в форме D (djj). Тогда доказанное нами равенство (9) принимает вид Dj(ibi + iLci) = %Dj(bi) + \JiDj(ci). б. Линейное свойство определителя без труда распространяется на тот случай, когда каждый элемент у-го столбца есть линейная комбинация любого фиксированного числа слагаемых: <*ij=bbi + iLci+...+%fi; в этом случае D; (atJ) = Dj (Ui + №+ ... + т/,.) = = bDJ(bi) + \iDJ(ci)+ ...+TDj(fi). (10) 1.45. Следствие. Общий множитель всех элементов некоторого столбца определителя можно вынести за знак определителя. В самом деле, если aij~'kbi, то по формуле (10) DJ(aiJ)=Dj(Ui)^%Dj(bi), что и утверждается. 1.46. Следствие. Если некоторый столбец определи- теля состоит целиком из нулей, то определитель равен нулю. В самом деле, 0 есть общий множитель элементов данного столбца; вынося его за знак определителя, получим Dy(0) = Dy(0.1) = 0-Dy(l) = 0. См. задачу 5. 1.47. Прибавление к одному столбцу другого столбца с произвольным множителем. а. Определитель не изменится, если к элементам одного из его столбцов прибавить соответствующие элементы любого другого столбца, умноженные на фиксированное число.
1*51] § 1.5. АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ И МИНОРЫ 21 Пусть к у-му столбцу прибавляется &-й (кф]), умноженный на число \. В полученном определителе у-й столбец будет состоять из элементов вида а^--\-Ха{к (/=1,2, . . ., я). В силу формулы (9) Dj (au+%aik) = Dj (а„) + X Dj (aik). Во втором определителе у-й столбец состоит из элементов aik} т. е. совпадает с k-м столбцом. По следствию 1.43 Df(aik) = 0, откуда Dj{aij+'kaik) = Dj{aij)i что и требуется. б. Разумеется, свойство а можно сформулировать в более общей форме: определитель D не изменится, если к элементам его j-го столбца прибавить соответствующие элементы k-го столбца, умноженные на число Ху затем элементы 1-го столбца, умноженные на число [X, . . ., элементыр-го столбца, умноженные на число т (кф], I ф], . .., рф})- См. задачу 6. 1.48. Все свойства, доказанные нами в этом параграфе для столбцов определителя, в силу неизменности определителя при транспонировании (1.41) остаются справедливыми и для его строк. § 1.5. Алгебраические дополнения и миноры 1.51. Рассмотрим произвольный, например у-й, столбец определителя D. Пусть а/у-—некоторый элемент этого столбца. В правой части равенства (6) задающего определитель D, соберем все члены, содержащие элемент а,-., заключим их в скобки и вынесем за эти скобки элемент а/у-. Величина, оставшаяся в скобках, обозначается через Atp она называется алгебраическим дополнением элемента atj- в определителе D. Так как в каждый член определителя D входит элемелт из у-го столбца, то равенству (6) можно придать теперь вид D = ауАг/ + a2JA2/ + . . . + anJAnJ, (11)
22 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.52 Формула (11) называется формулой разложения определителя D по элементам j-го столбца. Разумеется, аналогичную формулу можно написать и для любой строки определителя D; например, для /-й строки мы получим такое равенство: D = anAil + ai2Ai2+ . . .+ainAin. (12) Мы получили теорему. Теорема. Сумма всех произведений элементов какого* нибудь столбца (или строки) определителя D на соответствующие алгебраические дополнения равна самому определителю D. Формулы (11) и (12) можно использовать для вычисления определителя. Но при этом необходимо уметь вычислять алгебраические дополнения; правила для их вычисления мы приведем в 1.54. 1.52. Отметим одно следствие формул (11) и (12), которое будет в дальнейшем использовано. Равенство (11) выполняется тождественно относительно величин aljy a2j-, . . ., anj\ поэтому оно останется справедливым, если заменить в нем а/у.(/=1, 2, ..., п) на любые другие величины. При такой замене величины Л1у-, Л2у-, . . ., Ап} остаются неизменными, поскольку они не зависят от элементов a{j. Заменим в правой и левой частях равенства (11) элементы а1у., а2,, . . ., anj- на соответствующие элементы какого-нибудь другого, например /е-го, столбца. Тогда определитель слева в (11) будет иметь два одинаковых столбца и по 1.43 будет равен нулю. Мы получаем равенство (при k ф j) aikAl/+a2kA2/ + • • •+ankAn/=°- (13) Аналогично из формулы (12) при / Ф i получаем <*iiA-i + <*i2Ai2+ • • • +amAin = °- О4) Итак, мы доказали теорему: Теорема. Сумма всех произведений элементов какого- нибудь столбца (или какой-нибудь строки) определителя D на алгебраические дополнения соответствующих элементов другого столбца (строки) равна нулю. 1.53. Если зачеркнуть в матрице л-го порядка некоторую строку и некоторый столбец, то оставшиеся элементы, ее-
1-53] § 1.5. АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ И МИНОРЫ 23 тественно, образуют некоторую матрицу (п—1)-го порядка. Определитель этой матрицы называется минором данной матрицы п-го порядка (а также минором ее определителя D). Если были зачеркнуты /-я строка и у'-й столбец, то полученный минор обозначается через M{j- или M(j(D). Мы докажем, что имеет место равенство Аи=(-\)*Ши, (15) с помощью которого вычисление алгебраических дополнений сводится к вычислению соответствующих миноров. Доказательство равенства (15) проведем сначала для случая /=1, у=1. Соберем в правой части равенства (6) все члены, содержащие элемент аХ1. Рассмотрим один из таких членов. Очевидно, что произведение всех его элементов, за исключением аП} дает некоторый член с минора Ми. Так как в матрице определителя D нет отрезков с отрицательным наклоном, соединяющих элемент ап с остальными элементами выделенного члена, то знак, который приписывается члену а1Хс определителя D, совпадает со знаком, который приписывается члену с в миноре Мп. Выбирая должным образом член определителя D, содержащий элемент а11} и зачеркивая alv можно получить любой член минора Мп. Поэтому рассматриваемая алгебраическая сумма всех членов определителя D, содержащих ап, равна произведению ПцМп. Но согласно 1.51 эта сумма равна произведению апАп. Следовательно, Ли = МП} что и требуется. Теперь мы докажем формулу (15) при любых / и у. То обстоятельство, что при /=у=1 эта формула справедлива, будет нами существенно использовано. Рассмотрим элемент a{-j=ay расположенный на пересечении /-й строки и у-го столбца определителя D. Переставляя последовательно соседние строки и столбцы, мы можем перевести элемент а в левый верхний угол матрицы; для этого понадобится /—1+у—1— / + у — 2 перестановок. В результате мы получим определитель Dx с теми же членами, какие будет иметь исходный определитель D, если его умножить на (—1)|Ч-/-2=(—1)|ЧЛ Минор Mn(Dl) определителя Dx, очевидно, совпадает с минором M{j(D) определителя D. По доказанному, в определителе Dx члены, содержащие элемент а, составляют в сумме величину аМп (Ог). Поэтому в составе исходного определителя D члены, содержащие элемент at-= a,
24 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.54 образуют в сумме величину (_1 )i+/aMn (DJ = atJ (-\)i+mu (D). Но согласно 1.51 эта же сумма равна произведению fl/уДу. Следовательно, А^-=(—\)Hj'Mij'f тем самым формула (15) доказана полностью. 1.54. Формулы (11) и (12) можно теперь записать соответственно в форме D= (_1)1+Ув1уЖ1у+ (-\)*+/atjMy+ ...+ (-1)»+ЧД/, 0=(-\У+1апМп + {-\)"-*а,,Мь+ .. . +(-\)'+»aiaMia, в которой они обычно и употребляются. 1.55. Примеры. а. Определитель третьего порядка допускает шесть различных разложений (три по строкам и три по столбцам). Например, разложение по первой строке имеет вид «11 «12 «13 «21 «22 «23 «31 «32 «33 б. Определитель п-го порядка = «11 «22 «23 «32 «33 — «12 «21 «23 «31 «33 + «13 «21 «22 «31 «32 Dn О О «21 «22 0 ... О «31 «32 «33 • • • ° Я/11 «Л2 ««3 • • • «; называется треугольным. Разлагая его по первой строке, получим, что определитель Dn равен произведению элемента ап на треугольный определитель (п—1)-го порядка 022 0 • • • О «32 «33 • • • ° Яп-: 1п2 ипЗ Определитель D„_i снова разложим по первой строке; получим /)w_1 = (222Dw_2, где D„«2 — треугольный определитель (п — 2)-го порядка. Продолжая таким образом далее, в конце концов получим Dn = all a22 ... апп, т. е. треугольный определитель равен произведению элементов, стоящих на его главной диагонали.
Ь62] § 1.6. ПРАКТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ 25 § 1.6. Практическое вычисление определителей 1.61. Формула (12) приобретает особенно простой вид, когда все элементы /-й строки, кроме одного, например aik, равны нулю. В этом случае D=aikAih, (16) и вычисление определителя D п-го порядка непосредственно приводится к вычислению определителя (п — 1)-го порядка. Но если при а;кфО в /-й строке есть элемент а/у-, также не равный нулю, то мы можем вычесть из у-го столбца опре- aif делителя D k-Pi столбец, умноженный на X— —; в резуль- aik тате мы получим определитель, равный исходному (1.47), у которого у-й элемент /-й строки уже равен нулю. Повторяя аналогичные операции, мы можем от любого определителя с фиксированным элементом а1кФО перейти к определителю, у которого все элементы /-и строки, кроме aik, равны нулю, и вычислить его по формуле (16). Разумеется, аналогичные преобразования можно производить и со столбцами определителя. 1.62. Пример. Вычислим определитель 5-го порядка D = В третьем столбце этого определителя уже имеется два нуля. Чтобы получить в этом столбце еще два нуля, нужно ко второй строке прибавить утроенную пятую, а из четвертой строки вычесть учетверенную пятую. После этой операции и разложения определителя по третьему столбцу мы получаем 2 1 3 2 0 5 0 — 1 6 —3 0 3 0 —4 — 1 — 1 7 5 1 2 3 —2 с; о 2 3 =(-1) 2 5 ( 1 —9 ( 3 -1 ( 2 18 ( 0 -3 - 3 + 5.(-1) 3 —1 3 3 13 7 3 5 —5 3 —7 —10 1 2 3 —2 5 —1 1 —9 \2 3 —1 £ 2 18 —7 = 3 \ 7 ) -5 ' —10 = — -2 5 -1 1 —9 13 3—1 5 2 18 —7 3 7 —5 — 10
26 ГЛ. I. ОПРЕДЕЛИТЕЛИ [1.71 Теперь проще всего получить три нуля в первом столбце: для этого мы прибавим к первой строке удвоенную вторую, а из третьей и четвертой строк вычтем вторую, соответственно утроенную и удвоенную: D = 2 5 1 —9 3 —1 2 18 1)1 + 2 — 1 3 13 7 5 -5 —7 —10 -13 25 26 —34 36 —33 = — 17 —26 —24 0 1 0 0 • — 13 -9 26 36 25 13 —34 —33 17 7 —26 -24 Чтобы легче было вычислить полученный определитель 3-го порядка, постараемся уменьшить абсолютные величины его элементов. Для этого после вынесения из второй строки общего множителя 2 прибавим вторую строку к первой и из третьей строки вычтем удвоенную вторую: D = 2 13 25 13 —17 36 —33 17 -13 -24 -2 0 13 - 10 8 -17 1 4 — 13 2 = 2-4 0 13 10 2 -17 1 1 -13 2 В первой строке имеется уже один нуль. Чтобы получить еще один нуль, вычтем из второго столбца удвоенный третий; после этого определитель легко вычисляется до конца: D = 8 = 8-3 О 13 10 13 10 2 1 17 —13 1 2 3 -1 -8 0 13 10 8(—1)1 + 3 13 9 10 —3 8-3(—13—30) = —8-3-43 = —1032. См. задачи 7—10. § 1.7. Правило Крамера 1.71. Мы можем перейти теперь к решению систем линейных уравнений. Рассмотрим сначала систему специального вида апх1 + а12х2-\ ...+а1пхп =Ьг, \ «21*1 + а22х2 4- . . . + а2пхп - ft2, { ani*i + 0*2*2 + • • • + аппхп = Ьп ) с числом неизвестных, равным числу уравнений. Коэффициенты a{j (/, У=1, 2, . . ., п) образуют основную матрицу системы, относительно которой мы предположим, что ее определитель D отличен от нуля. Мы покажем, что такая (17)
1.71] § 1.7. ПРАВИЛО КРАМЕРА 27 система всегда совместна и определенна, и получим формулу для вычисления ее единственного решения. Допустим сначала, что система (17) имеет некоторое решение с1У с2, ..., сп\ справедлива, следовательно, система равенств allcl + аис2 + . . . -[- а1псп = bv ^21^1 "i- ^22^2 i • • • ~Т ^2п^п — 2» (18) anlCl "Г ««2С2 -Г annCn = t>n. Умножим первое из равенств (18) на алгебраическое дополнение Ап к элементу ап в матрице системы, далее умножим второе равенство на Л21, третье — на А31 и т. д., пока не дойдем до последнего равенства; затем все полученные равенства сложим. В результате мы получим следующее соотношение: (апАп + а21А.п fl«Ai)crr Ь(Й12^11 + й22^ 21 <Wl,l)C2T + (ainAll + «2,И21 + • • • + ^,Al) Сп = = Mn-!-M2i-r...+M«i- (19) В силу теоремы 1.51 коэффициент при сх в соотношении (19) равен самому определителю D; в силу теоремы 1.52 коэффициенты при всех остальных су- {]ф\) обращаются в нуль. Выражение в правой части есть разложение определителя Di = In a« rrt по первому его столбцу; поэтому равенство (19) можно теперь записать в виде D-c^^ — D^ откуда fl~ D ■ Совершенно аналогично можно получить выражение (У=1, 2, ..., п), (20) D
28 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.72 где DJ = *l,/-l bl aUJ '2,/-1 ' + 1 ^2 Й2,/+1 In '2л '/ii/-l ^71 Й«,/+1 = Я/&) есть определитель, полученный из определителя D заменой его /-го столбца на столбец из чисел bly Ь2, ..., Ьп. Мы получили следующий результат: Если решение системы (17) существует, то оно выражается через коэффициенты системы и правые части по формулам (20). В частности, мы получаем, что решение системы (17), если оно существует, единственно. 1.72. Теперь остается показать^ что решение системы (17) всегда существует. Подставим величины */ = %• (7=1, 2, ..., п) в систему (17) на место неизвестных х1у х2, ..., хп. Покажем, что все уравнения системы (17) при этом обращаются в тождества. Действительно, для /-го уравнения мы получаем 0i D, Dn ailcl + ai2c2+ . ..+аысп = ап — +а!2-^+ ...+ain — = = ~о K'l (Мп + М21 + • • • + M„i) + + А/2 (Ml2 + М22 Т ■ • • + Мя2) + + ain (Ml„ + М*. + • • • T MnJ] = "д [&1 («/ИИ + fl/2^12 + • • • + */,A>i) + + */(в/И/1+А|.2/1|.. + *B(fl«A + e/A2 + А/И/я) + fl/AB)]- Из всех скобок, служащих коэффициентами при величинах bv b2, ..., £„, отлична от нуля в силу теорем 1.51 и 1.52 только одна, именно та, которая стоит при величине Ь(\
1.74] § 1.7. ПРАВИЛО КРАМЕРА 29 она равна самому определителю D. Следовательно, полученное выражение приводится к виду т. е. совпадает с правой частью /-го уравнения системы, 1.73. Итак, величины Cj действительно образуют решение системы (17). Тем самым мы установили следующее правило для получения решения системы (17) [правило Крамера): Если определитель системы (17) отличен от нуля, то она имеет одно и только одно решение: значение неизвестного Xj равно дроби, знаменателем которой является определитель системы (17), а числителем — определитель, получающийся заменой j-го столбца в определителе системы (17) на столбец из правых частей системы (/'=1, ..., /z). Отыскание решения системы (17), таким образом, сводится к вычислению определителей. См. задачу 11. Способы решения более общих систем (с определителем, равным нулю, или с числом уравнений, не равным числу неизвестных) будут даны в двух следующих главах. 1.74. Замечание. Иногда встречаются системы линейных уравнений, свободные члены которых являются не числами, а векторами (в аналитической геометрии, в механике). Теорема Крамера и ее вывод остаются справедливыми и для этого случая; следует иметь только в виду, что и значения неизвестных хъ х2} ..., хп также будут не числами, а векторами. Например, система x1 + x2 = i — 3j\ x1 — x2 = i + 5j имеет решение (единственное) cx = i + j\ c2 = — 4j.
30 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.81 § 1.8. Миноры произвольного порядка. Теорема Лапласа 1.81. Теорема 1.51 о разложении определителя по строке или столбцу является частным случаем более общей теоремы о разложении определителя по целой совокупности строк или столбцов. Прежде чем сформулировать эту общую теорему (теорему Лапласа), введем некоторые новые определения. Пусть в квадратной матрице п-го порядка указаны произвольно k^n различных строк и столько же различных столбцов. Элементы, стоящие на пересечениях этих строк и столбцов, образуют квадратную матрицу порядка k; ее определитель называется минором k-го порядка данной матрицы /z-ro порядка (а также минором &-го порядка определителя D) и обозначается через где iv /2, . . ., ik — номера выделенных строк, a jv /2, . . ., jk — номера выделенных столбцов. Если зачеркнуть в исходной матрице строки и столбцы, в которых лежит минор Ж, то оставшиеся элементы снова образуют квадратную матрицу порядка п — k\ ее определитель называется минором, дополнительным к минору М, и обозначается символом Тл ._ Тл [и (г, • • •. h m — m Ju j2 /fc, где индексы указывают номера вычеркнутых строк и столбцов. В частности, если исходный минор имеет порядок 1, т. е. совпадает с некоторым элементом ai}- определителя D, то дополнительный минор совпадает с минором Ж/у-, о котором шла речь в 1.53. Рассмотрим минор м1 = ж!; !•.;:;;£, лежащий в первых k строках и первых k столбцах определителя D; минор, дополнительный к нему, есть минор Af^Af^Aflii;:::;^. Выделим в правой части формулы (6) все те члены определителя, в которых первые k элементов принадлежат ми-
1.81] § 1.8. миноры произвольного порядка 31 нору М1% а следовательно, остальные п — к элементов — минору Мх. Фиксируем сначала один из таких членов с тем, чтобы определить знак, который должен быть ему приписан; обозначим этот члеп через с. Первые к элементов этого члена определяют некоторый член сл минора Мг; обозначим через Nx число соответствующих отрезков отрицательного наклона; тогда знак, который должен быть поставлен перед членом сл в миноре уИх, определяется выражением (— 1)лг». Остальные п — к элементов члена с определяют некоторый член с2 минора М2\ знак, который должен быть поставлен перед этим членом в миноре Л42, определяется выражением (—1)^2, где N2— число соответствующих отрезков отрицательного наклона в миноре М2. Поскольку в матрице определителя D нет ни одного отрезка с отрицательным наклоном, который соединял бы элемент минора М1 с элементом минора М2У общее число отрезков отрицательного наклона, соединяющих элементы члена с, равно сумме N1J-N2. Поэтому знак, который следует поставить перед членом с в определителе D, определяется выражением (— 1 )A'i+ Л"г ^ следовательно, равен произведению знаков членов сг и с2 в минорах Мх и М2. Заметим, далее, что произведение любого члена минора М1 на любой член минора М2 дает нам один из выделенных членов определителя D. Отсюда вытекает, что сумма всех выделенных членов в выражении определителя D по формуле (6) равна произведению миноров Мх и М2. Теперь мы получим похожий результат для произвольного минора АД _ АЛ1У '.2 '> с дополнительным минором Л12. Переставляя последовательно соседние строки и столбцы, мы можем минор Мх перевести в левый верхний угол определителя D; для этого понадобится всего (/j—l)-i-'(/2 -2) 4- ... +(/* — k) + (j\—\) + + (у2 — 2) 4 • • • + (Л — ^) перестановок. В результате мы получим определитель Dx с теми же членами, какие будет иметь исходный определитель D, если его умножить на (— 1)'Ч где / = /\ + '2+ ••• +''*, У = Л +Л+ ••• +Л- По доказанному, в определителе Dx сумма всех тех членов, первые к элементов которых входят в минор Mv равна произведению МХМ2. Отсюда следует, что сумма соответ-
32 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.81 ствующих членов определителя D равна произведению (-1)'+У^2=^И2, где величина Л2= (—\)i+fМ2 называется алгебраическим дополнением минора Мх в определителе D. Иногда употребляют обозначение а — 1М' h '> л2 — ^/i, /2 /л • Фиксируем теперь в определителе D строки с номерами *i> **2> • • •> h- ^ каждый член определителя D входят некоторые элементы из этих строк. Если собрать вместе все такие члены, у которых элементы выделенных строк принадлежат к фиксированным столбцам с номерами j\, /2, . . ., jk, то, по доказанному, сумма всех этих членов будет равна произведению минора м1у {? '> /w/i. и. •••, ik на соответствующее алгебраическое дополнение. Все члены определителя, таким образом, можно разбить на группы, каждая из которых определяется заданием k столбцов. Сумма членов в каждой группе равна произведению соответствующего минора и его алгебраического дополнения. Поэтому весь определитель представляется в виде суммы Д=2(-1)/+/^:±::::/^;±::::& (21) причем суммирование производится при фиксированных индексах iv /2, . . . , ik (индексы выбранных строк) по всем возможным значениям индексов столбцов j\} /2, . . . , jk (1^У1<у2< ... <Jk^n). Свойство определителя D, выражающееся равенством (21), и называется теоремой Лапласа. Очевидно, формула (21) действительно является обобщением формулы разложения определителя по одной строке, полученной в 1.54. Аналогичная формула справедлива для разложения определителя D по фиксированной системе столбцов.
1-91] § 1.9. о линейной зависимости между столбцами 33 1.82. Пример. Определитель вида D а1г . °21 • 0 .. • a2k . 0 ai,k+i a2, k + l ak,k+l ak + l, k+l 0 0 a «, k+i In '2n 'kn 'k+l, n все элементы которого, находящиеся в первых к столбцах и последних п — к строках, равны нулю, называется квазитреугольным. Для его вычисления разложим определитель по первым k строкам с помощью теоремы Лапласа. В сумме (21) останется только одно слагаемое, и мы получим Я = и ki ik kk а ft+i./f + i п, k + l k + l, n См. задачу 12. § 1.9. О линейной зависимости между столбцами 1.91. Пусть нам дано несколько, например т} числовых столбцов по п чисел в каждом: А = «и «21 • ki ' ^2 — Д12; j «22 • \ап*\ !» • • • » Лл ~ а1т } а2т\ • ! апт \ Умножим каждый элемент первого столбца на некоторое число Ях, каждый элемент второго столбца — на число Я2, . . . . . . , каждый элемент последнего, /#-го, столбца на число Хт и сложим соответствующие элементы полученных столбцов. В результате получится некоторый новый числовой столбец, элементы которого мы обозначим буквами с1у с2, . . . , сп. Все эти действия можно наглядно представить с помощью 2 Г. Е. Шилов
34 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.92 следующей схемы: к «11 [Й21 Г i U/n I ] l |-fX2! 1 1 au\ 22 апъ\ + +к Лт 2 т С, или, короче, MitM2+ ••• + **A» = C где через С обозначен получившийся столбец. Этот столбец С называется линейной комбинацией взятых столбцов А1У А2у . . . , Ат\ числа Хх, Х2, . . . , \т называются коэффициентами этой линейной комбинации. Частными случаями линейной комбинации являются сумма столбцов (когда коэффициенты Xv . . . , Xm равны 1) и произведение столбца на число (когда пг—\). Теперь представим себе, что наши столбцы взяты не сами по себе, а входят в состав некоторого определителя D п-го порядка. Докажем следующую теорему. Теорема. Если один из столбцов определителя D является линейной комбинацией других столбцов, то D —0. Доказательство. Пусть, например, q-Pi столбец определителя D является линейной комбинацией /-го, &-го, . . . . . . , р-го столбцов этого определителя с коэффициентами, соответственно, Ху, \k, . . . , X Тогда, вычитая из q-ro столбца у'-й столбец, умноженный на Ху, затем k-Pi столбец, умноженный на ^, . . . , наконец, р-й столбец, умноженный на Хр, мы согласно 1.476 не изменим величины определителя D; но в результате q-Pi столбец будет состоять из одних нулей, откуда вытекает, что D = 0. Замечательно, что справедлива и обратная теорема: если заданный определитель D равен нулю, то один (по меньшей мере) из его столбцов является линейной комбинацией других столбцов. Доказательство этой теоремы требует некоторых предварительных построений, к которым мы и переходим. 1.92. Пусть опять имеется m числовых столбцов по п элементов в каждом. Мы можем записать их в виде матрицы
1-93] § 1.9. о линейной зависимости между столбцами 35 с п строками и т столбцами: IKl а\2 • • • Я1т| ап1 йп2 • • • ^«т Если фиксировать некоторое число к столбцов этой матрицы и такое же число к ее строк, то элементы, стоящие на пересечениях указанных столбцов и строк, образуют квадратную матрицу &-го порядка. Ее определитель называется минором к-го порядка матрицы А; он может быть равен нулю или отличен от нуля. Если среди чисел atj есть отличные от нуля (что мы всегда будем предполагать), то всегда можно указать натуральное число г, обладающее такими свойствами: а) у матрицы А имеется минор г-го порядка, отличный от нуля; б) всякий минор матрицы Л, имеющий порядок г-\-\ или выше (если вообще таковые существуют), равен нулю. Число г, обладающее указанными свойствами, называется рангом матрицы А. Если все aik равны нулю, то ранг матрицы считается равным нулю (г = 0). В дальнейшем мы предполагаем, что г > 0. Тот минор г-го порядка, который отличен от нуля, называется базисным минором матрицы А. (Разумеется, у матрицы А может быть и несколько базисных миноров; но все они имеют один и тот же порядок г.) Столбцы, на которых построен базисный минор, называются базисными столбцами. 1.93. Имеет место следующая важная теорема: Теорема (о базисном миноре). Любой столбец матрицы А является линейной комбинацией ее базисных столбцов. Доказательство. Предположим для определенности, что базисный минор матрицы А расположен в первых г строках и первых г столбцах матрицы А. Пусть 5 — любое целое число от 1 до т, а к — любое целое число от 1 до п. 2*
36 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.93 Рассмотрим определитель (r-fl)-ro порядка \ап «21 ап aki «12 ' а22 . «г2 • ak2 . . • «ir • «2r • arr • Чг «15 «25 flrs «*5 Если k^r} определитель D, очевидно, равен нулю, так как в нем имеются две одинаковые строки. Аналогично D — 0 при s^r. Если k > г и s > г, то определитель D также равен нулю как минор (г-\-\)~го порядка матрицы ранга г. Следовательно, D — 0 при любых значениях k и 5. Разложим определитель D по последней строке; мы получим равенство akiAhi + akiAkz + • • • + akrAkr + aksAks = 0, (22) где числа Akl> Ak2, ..., Акг, Aks означают соответственно алгебраические дополнения элементов ак1, ak2J ..., akr aksy находящихся в нижней строке определителя D. Эти алгебраические дополнения не зависят от числа ky так как образуются с помощью элементов я,-• с i^Lr\ поэтому мы можем ввести обозначения Ak\ — cv Ak2= c2, ..., Akr=cr, Aks = cs. Подставляя в равенство (22) последовательно значения /5=1, 2, ..., /z, получим систему равенств с1а11 + с2а12 + . . . + cralr + ^яи = О, С1«21 "Г ^2«22 + • • • + Сга2Г + Csa2s = °> сгап1 + с2ап2 + . . . + cranr + c6ans = 0. Число с5 = Л^5 отлично от нуля, так как Aks есть базисный минор матрицы А. Разделив каждое из равенств (23) на с5, перенеся все слагаемые, кроме последнего, в правую С) часть и обозначив через %f (y=l,2, ..., г), мы получим «15=^1«11 + ^2«12 + • • • + ^г«1г> ) ««5 = Ми1 + Кап2 + ' • • + Капг- ' (23)
1-95] § 1.9. о линейной зависимости между столбцами 37 Эти равенства показывают, что s-Pi столбец матрицы А является линейной комбинацией первых г столбцов этой матрицы (с коэффициентами Xlt Х2, . . ., Хг). Поскольку 5 может быть любым числом от 1 до т, наша теорема полностью доказана. 1.94. Мы можем теперь доказать сформулированное в конце 1.91 обращение теоремы 1.91. Теорема. Если некоторый определитель D порядка п равен нулю, то у него имеется столбец, который является линейной комбинацией других столбцов. Доказательство. Рассмотрим матрицу определителя D. Поскольку D = 0, базисный минор этой матрицы имеет порядок г < п. Поэтому после выделения г базисных столбцов мы сможем найти еще по меньшей мере один столбец, не попавший в число базисных. В силу теоремы о базисном миноре он представляет собой некоторую линейную комбинацию базисных столбцов. Итак, мы нашли в определителе D столбец, который является линейной комбинацией других столбцов, что и утверждалось. Заметим, что в состав этой линейной комбинации можно включить и все оставшиеся столбцы определителя D, поставив перед ними, например, нулевые коэффициенты. 1.95. Полученные результаты можно сформулировать в несколько более симметричном виде. Если коэффициенты %lt Я2, . . ., %т линейной комбинации т числовых столбцов Аъ Л2, ..., Ат (1.91) взять равными нулю, то очевидно, что в результате получится нулевой столбец, т. е. столбец, состоящий из одних нулей. Но возможно, что нулевой столбец получается из заданных столбцов не только таким способом, а и с помощью коэффициентов Хх, Х2, ..., Хт, из которых не все равны нулю. В этом случае взятые столбцы Аг, Л2, ..., Ат называются линейно зависимыми. Например, столбцы I1! 2 3 .141 » ^2 — |2 4 6 |8 » ^з — 1 Ml 1 1 lj
38 ГЛ. I. ОПРЕДЕЛИТЕЛИ [1.9F линейно зависимы, так как нулевой столбец равен линейной комбинации 2.Л1-1-Л2 + 0-Л3. Определение линейной зависимости можно сформулировать более подробно так: столбцы А = 11 «о 21 п\ А2 = 1/я '2т называются линейно зависимыми, если существуют величины Kv %2, ..., Хт, не все равные нулю, такие, что удовлетворяется система уравнений Vn + V12 + • • • + Kaim = О, ^21 + ^2^22 + • • • + hma2m = О, Kani + Кап2 + • • • + Капт = °> гли, что то же самое, £суш одия из столбцов Лг, А2, . . ., Лт, например последний, является линейной комбинацией остальных, 4. = Mi + Mi+---+b«-i4.-i, (25) то столбцы Аг, А2, ..., Лт линейно зависимы. Действительно, соотношение (25) равносильно соотношению Mi + Mi+•■•+*—И«-1 + (-1М» = 0; следовательно, существует линейная комбинация столбцов Аг, Л2, ..., Ат, коэффициенты которой не все равны нулю (в частности, последний коэффициент равен —1) и которая дает в результате нулевой столбец; это и означает линейную зависимость столбцов Ах, А2, ..., Ат. Обратно, если между столбцами Av А2, . . ., Ат имеется линейная зависимость, то (по меньшей мере) один из этих *) Здесь в правой части символ 0 означает нулевой столбец.
ЗАДАЧИ 39 столбцов является линейной комбинацией остальных. В самом деле, пусть в равенстве М, + Ц+... + 1..Л.1ти = о. . (26) выражающем линейную зависимость столбцов Аг, А2, . . ., Ат, отличен от нуля, например, коэффициент Кт. Тогда соотношение (26) равносильно соотношению А — h. Л hi. Л ^т-\ д которое показывает, что столбец Ат является линейной комбинацией столбцов Ах, А2, ..., Am_v Итак, столбцы А}, А>, ..., Ат линейно зависимы тогда и только тогда, когда один из этих столбцов является линейной комбинацией остальных столбцов. 1.96. Теоремы 1.91 и 1.94 показывают, что определитель D равен нулю тогда и только тогда, когда один из его столбцов является линейной комбинацией остальных столбцов. Используя полученный в 1.95 результат, мы можем сформулировать следующую теорему: Теорема. Определитель D равен нулю тогда и только тогда, когда между его столбцами существует линейная зависимость. 1.97. Так как при транспонировании определителя его величина не меняется (1.41), а столбцы заменяются строками, то во всех формулировках настоящего параграфа столбцы можно заменить на строки. В частности, имеет место следующий результат: Определитель D равен нулю тогда и только тогда, когда между его строками существует линейная зависимость. См. задачи 13—14. ЗАДАЧИ 1. С каким знаком в определитель 6-го порядка входят члены: 3) tf23tf3ltf42tf5etfl4tf65» б) a92a49aiAanaMa2-9? 2. Выписать все члены, входящие в состав определителя 4-го порядка со знаком — и содержащие множителем а2%.
40 ГЛ. 1. ОПРЕДЕЛИТЕЛИ 3. С каким знаком входит в определитель n-го порядка член А = 4. Показать, что из п\ членов определителя ровно половина /л' \ ( -^ J получает по определению § 1.3 знак + , а вторая половина — знак —. . .5. Вычислить определитель am -\-bp an-\- bq cm -)- dp en + dq разложив его на слагаемые. 6. Числа 20 604, 53 227, 25 755, 20 927 и 78 421 делятся на 17. Доказать, что определитель 2 0 6 0 4 5 3 2 2 7 2 5 7 5 5 2 0 9 2 7 7 8 4 2 1 также делится на 17. 7. Вычислить определители Д,= 246 427 327 1014 543 443 -342 721 621 8. Вычислить определитель 1 2 1111 13 111 114 11 1115 1 11116 Я(х) = 2 3 1 2-х2 2 3 2 3 15 2 3 1 9 — х* 9. Вычислить определитель л-го порядка х а а ... а Д = а х а а а х а а а . х 10. Вычислить определитель Вандермонда A (*i. #2» • • •» хп) ~~ 1 1 Х\ Х2 2 2 Xi Х2 Л-1 Л-1 Xi х% .. 1 .. хп . xl • хп
ЗАДАЧИ 41 11. Решить систему уравнений *i + 2*2 + 3*з + 4*4 + 5*5 = 13, 2*i + *2 + 2*з + 3*4 + 4*5 = 10, 2*!+ 2*а+ *3 + 2*4 + 3*5 = 11> 2*х+ 2*2+ 2*3+ *4 + 2*5= 6, 2*!+ 2*2+ 2*3+ 2*4+ *5= 3. 12. Сформулировать и доказать теорему, находящуюся в таком же логическом отношении к теореме Лапласа, в каком теорема 1.52 находится к теореме 1.51. 13. Построить четыре столбца из четырех чисел в каждом, которые не были бы линейно зависимыми. 14. Показать, что если строки некоторого определителя п-го порядка линейно зависимы, то линейно зависимы и его столбцы.
ГЛАВА 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА §2.1. Определение 2.11. В аналитической геометрии и в механике используются направленные отрезки — векторы. Для векторов установлены по определенным правилам действия: известно, что означает сумма двух векторов и что означает произведение вектора на вещественное число*). При этом выполняются обычные законы арифметики. Определение линейного пространства обобщает определение совокупности всех векторов. Обобщение производится, во-первых, путем отвлечения от конкретной природы объектов (направленных отрезков) с сохранением свойств действий над ними, во-вторых, путем отвлечения от конкретной природы допустимых множителей (вещественных чисел). Таким образом, получается следующее определение: Множество К называется линейным (аффинным) пространством над полем /\, если а) имеется правило (прав и л о сложения), которое позволяет для каждых двух элементов х и у из К построить третий элемент z £ K*;i:), называемый суммой элементов х пуп обозначаемый х-^у\ б) име- *) Мы не касаемся пока других векторных операции — скалярного и векторного произведений. Во всяком случае оба эти произведения не могут играть той роли, которую играет обычное произведение в поле вещественных чисел; скалярное произведение векторов уже не есть вектор; векторное произведение векторов хоть и есть вектор, но эта операция, в отличие от умножения вещественных чисел, некоммутативна. **) Мы используем здесь и в дальнейшем некоторые обозначения теории множеств. Запись а£А означает, что элемент а входит в множество Л; запись B<z.A означает, что множество В является частью множества А (причем В может и совпадать с А). Два соотношения BczA, Ad В равносильны утверждению, что множества А и В совпадают. Знаки £, с называются знаками включения.
2.14) §2.1. ОПРЕДЕЛЕНИЕ 43 ется правило (правило умножения на число), которое позволяет построить для каждого элемента х £ К и любого числа X g К элемент и g К, называемый произведением элемента х на число К и обозначаемый Хх; в) правила а) и б) удовлетворяют аксиомам, перечисленным в 2.12— 2.13. Элементы линейного пространства мы будем называть векторами, невзирая на то, что по своей конкретной природе они могут быть вовсе и не похожи на привычные нам направленные отрезки. Геометрические представления, связанные с названием «векторы», помогут нам уяснить и часто предвидеть нужные результаты, а также находить прямой геометрический смысл в различных фактах из алгебры и анализа, который без того не был бы очевидным. В частности, в следующей главе мы получим простую геометрическую характеристику всех решений однородной или неоднородной системы линейных уравнений. 2.12. Предполагается, что правило сложения обладает следующими свойствами: 1) х-\-у=у + х для любых х и у из К; 2) (x-\-y)+z = x + (y + z) для любых х, у, z из К; 3) существует элемент 0 (нуль-вектор) такой, что х -j- 0 = х для любого х g К; 4) для каждого х g К существует элемент у £ К такой, что х-{-у = 0 (противоположный элемент). 2.13. Предполагается, что правило умножения на число обладает следующими свойствами: 5) \-х—х для любого х £К; 6) а($х) = (оф) х для любого х g К и любых а и Р из К\ 7) (а+ Р) х — ах~- $х для любого дг^К и любых а и р из К\ 8) а (х -\~у) = ах -р ау для любых х и у из К и любого 2.14. Из аксиом 1) — 8) можно получить в первую очередь следующие теоремы: а. Теорема. В любом линейном пространстве существует единственный нуль. Доказательство. Существование хотя бы одного нуля утверждается в аксиоме 3). Допустим, что в пространстве К
44 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.14 имеются два нуля: 0Х и 02. Полагая в аксиоме 3) х = 0lf 0 = 02, мы получаем Ох + 02 = 0!. Полагая в той же аксиоме * = 02, 0 = 01? мы получаем 02 + 01 = 02. Сравнивая первое из полученных равенств со вторым и пользуясь аксиомой 1), находим 01 = 02, что и требовалось. б. Теорема. В любом линейном пространстве для каждого элемента существует единственный противоположный элемент. Доказательство. Существование хотя бы одного противоположного элемента утверждается в аксиоме 4). Допустим, что для некоторого элемента х имеется два противоположных элемента ух и у2. Прибавим к обеим частям равенства #-1-^ = 0 элемент у2\ используя аксиомы 2) и 3), мы получаем у2 + (* +уг) = (у2 -\-х) +уг = 0 +уг =уъ у2+{х+у1)=у2-^0=у2, откуда уг=у21 что и требовалось. в. Т е о р ем а. Для всякого элемента х в любом линейном пространстве имеет место равенство 0-д: = 0 (в правой части равенства 0 означает нуль-вектор, в левой — число 0). Доказательство. Рассмотрим элемент О-лг+1-д:; используя аксиомы 7) и 5), мы получаем 0.х+\-х = (0+\)х=\-х = х, 0-х+\-х = 0-х + х9 откуда х = 0-х + х; прибавляя к обеим частям равенства противоположный к х элемент у, находим 0 = х+у = (0-х + х)+у = 0-х+(х+у) = 0-х + 0 = 0-х,
2.15] §2.1. ОПРЕДЕЛЕНИЕ 45 откуда 0 = 0-х, что и требуется. г. Теорема. Для всякого элемента х в любом линейном пространстве противоположным элементом служит Доказательство. Составим сумму х -\-у; используя аксиомы и теорему в, находим х+у=\-х + (—\)-х = (\—\)-х = 0.х = 0, что и требуется. д. Мы будем обозначать теперь элемент, противоположный к данному элементу х} через —х; доказанная теорема г делает естественным это обозначение. Наличие противоположного элемента позволяет ввести операцию вычитания. Именно, разность х—у определяется как сумма х и —у. Это определение согласуется с определением вычитания в арифметике. 2.15. Линейное пространство над полем R вещественных чисел мы будем называть вещественным и обозначать через R. Линейное пространство над полем С комплексных чисел мы будем называть комплексным и обозначать через С. Если указаны 'природа элементов х, у, z, ... и правила действий над ними [причем должны быть выполнены аксиомы 1) — 8)], мы будем называть линейное пространство конкретным и использовать для него, как правило, индивидуальное обозначение. В дальнейшем для нас будут особенно важны следующие три типа конкретных пространств: а. Пространство V3. Элементы этого пространства— свободные векторы в пространстве, рассматриваемые в аналитической геометрии. Каждый вектор характеризуется длиной и направлением*). Сложение векторов определено обычным образом по правилу параллелограмма. Умножение вектора на вещественное число К определено также обычным образом (именно, длина вектора умножается на |Х|, *) За исключением нуль-вектора, длина которого равна нулю4 а направление произвольно.
46 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.16 направление при к > 0 остается неизменным, при X < О заменяется на противоположное). Легко проверить, что все аксиомы 1)—8) здесь выполнены. Аналогичные совокупности векторов на плоскости и на прямой, также представляющие собой линейные пространства, обозначим соответственно через V2 и Vx; Vly V2} V3—линейные пространства над полем R. б. Пространство Кп. Элемент этого пространства — любая совокупность х = (Ъ>1, |2, . . ., |;|) n чисел из поля К. Эти числа £х, |2, ..., £;1 будем называть координатами элемента х. Действия сложения и умножения на число Х£К производятся по следующим правилам: (li, £2> •••> £„) + (Л1» л2* • • •> л«) = Легко проверить, что аксиомы 1) — 8) удовлетворены. В частности, элемент 0 есть совокупность п нулей: О = (0,0, ...,0). Фактически мы имели дело с элементами этого пространства в § 1.9; только мы записывали тогда их не в форме числовой строки, а в форме столбца. Если К есть поле R вещественных чисел, обозначение Кп заменяется на Rn. Если К есть поле С комплексных чисел, обозначение Кп заменяется на Сп. в. Пространство R(a,b). Элемент этого пространства— любая вещественная непрерывная функция x = x(t), определенная на отрезке a^.t^b. Действия сложения функций и умножения их на вещественные числа определяются по правилам анализа; выполнение аксиом 1)—8) очевидно. При этом элемент 0 есть функция, тождественно равная нулю. Пространство R (ау Ь) есть линейное пространство над полем R вещественных чисел. г. Пространство С(а,Ь) соответственно есть пространство всех комплекснозначных непрерывных функций на отрезке a^t^b. Это пространство есть линейное пространство над полем комплексных чисел. 2.16. Заметим, что все свойства элементов конкретных пространств (например, векторов пространства V3), основанные только на аксиомах 1) — 8), справедливы и для элементов любых линейных пространств. Например, анализируя
2.21] § 2.2. линейная зависимость 47 доказательство теоремы Крамера о решении системы линейных уравнений Я 11*1 "Г Я 12*2 + • • • + а1пХп ^ К \ «21*1 + «22*2 + ' ' ' + 4n*n = bV I anlXl "Г ап2Х2 ~Г • • • + Янн*/! — */и J мы можем заметить, что в той части, которая касалась величин Ьъ Ь2, ..., Ью оно основывалось только на том факте, что эти величины можно было складывать и умножать на числа из К, причем использовались правила 1)—8). Это позволило обобщить теорему Крамера на системы, в которых величины Ьг, Ь2, ..., Ьп суть векторы (элементы пространства \/3), как мы уже указывали в 1.74. Это позволяет, далее, утверждать, что теорема Крамера справедлива и для систем, в которых величины bv b2, . . ., bn являются элементами произвольного линейного пространства К. Отметим только, что значения неизвестных хъ х2, ..., хп будут тогда также элементами этого пространства К, линейно выражающимися через величины bv b2, ..., bn. См. задачи 1—3. 2.17. Замечание. В аналитической геометрии иногда бывает удобно рассматривать векторы не свободные, а закрепленные своим началом в начале координат. Такое рассмотрение удобно тем, что при этом каждый вектор ассоциируется с некоторой точкой пространства — своим концом и каждая точка пространства может быть определена соответствующим вектором — так называемым радиусом-вектором этой точки. Имея в виду эту картину, мы будем иногда называть элементы линейного пространства не векторами, а точками. Разумеется, такая перемена названия не сопровождается никакими изменениями в определениях и апеллирует лишь к нашим геометрическим представлениям. § 2.2. Линейная зависимость 2.21. Пусть xv х2% ..., xk — векторы линейного пространства К над полем К и av a2, ..., ал — числа из поля К. Вектор у - аххх + а2х2 + . . . + a^xk
48 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.22 называется линейной комбинацией векторов xv х2, ..., xk; числа av а2, ..., ал— коэффициенты этой линейной комбинации. Если а1 = а2= . . . =aft = 0, то в силу теоремы 2.14 в мы получаем, что у = 0. Но может быть и так, что существует линейная комбинация векторов xv x2, ••-, xki в которой не все коэффициенты равны нулю и которая, тем не менее, дает в результате нуль-вектор; в этом случае векторы xv х2у ..., xk называются линейно зависимыми. Иными словами, векторы xv х2} .. ., xk называются линейно зависимыми, если существуют числа av a2, . .., ak, не все равные нулю и такие, что агхг + а2х2 + . . . + akxk = 0. (3) Если же равенство (3) возможно в единственном случае, когда a1 = a2= . . . =ал = 0, векторы хъ х2, ...yxk называются линейно независимыми. 2.22. Пример ы. а. В линейном пространстве V3 линейная зависимость двух векторов означает, что они параллельны одной и той же прямой; линейная зависимость трех векторов — что они параллельны одной и той же плоскости. Всякие четыре вектора линейно зависимы. б. Выясним, что означает линейная зависимость векторов xv х2} ..., xk линейного пространства Кп. Пусть вектор х{ имеет координаты \([\ £2/}, ..., \{£ (/=1, 2, ..., k)\ тогда линейная зависимость «1*1 + а2*2 -г • • • + akxk = О означает, что выполняется п равенств «^"Н-а^'Ч--.-+«*&*' = О, [ (4) Ъ&+а№+ .'••'+*£}?> = 6, J причем среди постоянных alt a2, ..., ak имеются отличные от нуля; это — то самое определение линейной зависимости, которое мы дали в 1.95 для числовых столбцов.
2.22] § 2.2. линейная зависимость 49 Таким образом, вопрос о линейной зависимости векторов xv х2, . .., хк в общем случае сводится к вопросу о существовании ненулевого решения у однородной системы уравнений с коэффициентами, равными соответствующим координатам данных векторов. В следующей главе этот вопрос будет полностью решен (3.21), и тем самым будет получено правило, позволяющее судить о линейной зависимости или независимости данных векторов пространства Кп по их координатам. в. Но в некоторых случаях мы можем и теперь уже делать выводы о линейной зависимости или независимости данной системы векторов. Пусть, например, в пространстве Кп взяты п векторов ^ = (1,0,0, ...,0), е2=(0, 1,0, ...,0), ... ..., *„=(<>, 0,0, ...,0, 1). Система (4) для этих векторов принимает вид a1-l+a3-0+a3-0+...-fa/I-0 = 0> \ а1.0 + а2-1+а3-0+...+а/1-0 = 0> 1 а^О + о^.О + ад-О-г- . . . +ая.1 =0 J и, очевидно, допускает единственное решение а1 = а2=... . . . =ап — 0. Таким образом, векторы е19 е2, .. ., еп в пространстве Кп линейно независимы. См. задачу 4. г. Линейная зависимость векторов хх — хх (t)y x2 = = д:2 (/), ..., xk = xk (t) пространства R(a,b) (или С (a, b)) означает, что между функциями xx(t), x2(t)y ..., xk (t) имеется соотношение а1х1 (t) + a2x2 (/)+...+ akxk (t) = 0, причем вещественные (комплексные) постоянные а1у а2, ... . . ., ak не все равны нулю. Например, функции хх (t) = cos2 /, Ar2(0 = sin2/, x3 (t) = 1 линейно зависимы, так как имеет место соотношение *1(0 + *2(0-*8(0 = о.
50 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.23 Проверим, что функции 1, t, t2} . .., tk линейно независимы. Допустим, что существует соотношение (Vl+cV+...+а^ЕЕЕЕО. (5) Тогда, последовательно дифференцируя k раз равенство (5), мы получим систему k-\-\ уравнений относительно величин а0, а1} . . ., ak с определителем, заведомо отличным от нуля (1.556); решая систему по правилу Крамера (1.73), мы получаем, что а0 = <хг = ... = ak = 0. Следовательно, функции 1, t, t2} . . ., tk линейно независимы в пространстве R(ayb), что мы и утверждали. См. задачу 5. 2.23. Отметим два простых свойства систем векторов, связанных с линейной зависимостью. а. Лемма. Если некоторые из векторов х1} х2, . . ., xk линейно зависимы, то и вся система х1у хъ . . ., xk линейно зависима. Доказательство. Без ограничения общности можно принять, что линейно зависимы векторы xv х2У ..., х.- U < &)\ таким образом, имеет место соотношение аххх + а2х2 + . . . + ajXj = 0, где среди постоянных av a2, ..., а- имеются отличные от нуля. В силу теоремы 2Л4в и аксиомы 2.12 3) справедливо равенство аххг-!-а2х2 + . . . -\-a/xJ+0-x/+1+ . . . +0-x/j = 0; оно показывает, что векторы xv л*2, ..., xk также линейно зависимы, так как среди постоянных аъ а2, . . ., ау, 0, . . ., 0 имеются отличные от нуля. б. Лемма. Векторы хх, х2} . .., xk линейно зависимы тогда и только тогда, когда можно представить один из этих векторов в виде линейной комбинации других. Предложение, аналогичное сформулированному, уже встречалось нам прежде: мы доказывали его в 1.95 для числовых столбцов. Если мы просмотрим еще раз это доказательство, то увидим, что оно основано только на возможности производить со столбцами операции сложения и умножения
2.32] § 2.3. БАЗИС, КООРДИНАТЫ, РАЗМЕРНОСТЬ 51 на число. Следовательно, это доказательство можно провести для элементов любого линейного пространства. Вместе с этим и наша лемма оказывается справедливой для любого^ линейного пространства, что нам и требуется. § 2.3. Базис, координаты, размерность 2.31. Система линейно независимых векторов ev е2, . .., еп некоторого линейного пространства К образует, по определению, базис пространства К, если для всякого вектора л;£К существует разложение * = &i*i + S2'2+- ••+&„'„ (£,€*, У=1, .... л). (6) Легко видеть, что при указанных условиях коэффициенты разложения (6) определяются единственным образом. Действительно, если бы для некоторого вектора х можно было написать два разложения * = £i*i+E2*2+ •••+£,,*„. * = Л1*1 + Л2*2+--- +ЛА> то, вычитая почленно, мы получили бы равенство О = (Si —Лх) ei + (£2 — Л2) е2+ ...+ (£„ —л„) еп, из которого в силу предположенной линейной независимости векторов ev е2, ..., еп мы получили бы, что Si = 4i. i2 = л2, • ••> £я = л„- Эти единственным образом определяемые числа |х, £2, . . ., %п называются координатами вектора х относительно базиса ev е2у . . ., еп. 2.32. Примеры. а. В пространстве V3 хорошо известный базис образует тройка единичных взаимно ортогональных векторов *, /, k. Координаты |х, £2, £3 вектора х относительно этого базиса суть проекции вектора х на координатные оси. б. В пространстве К,, примером базиса служит система векторов *?! = (!, О, ..., 0), е2 = (0, 1, ..., 0), ... . . ., е;| = (0, 0, . . ., 1), рассмотренная уже нами в 2.22в. Действительно, для любого вектора x = (%lii)2, ...,£„)£#„,
52 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.33 очевидно, имеет место равенство jc = 61(1,0, ...,0) + £2(0, 1, .... 0) + ...+g„(0, 0 1), которое и доказывает в соединении с уже известной линейной независимостью векторов ev е2у ..., епУ что эти векторы образуют базис в пространстве Кп. В частности, оказывается, что числа %v |2> •••» 6л являются как раз координатами вектора х относительно базиса ev е2} ..., еп. в. В пространстве R (а, Ь) базиса — в том смысле, как он нами здесь определен,— не существует; доказательство этого утверждения будет дано в 2.36в. 2.33. Основное значение базиса линейного пространства состоит в том, что линейные операции в пространстве, вначале заданные абстрактно, при задании базиса становятся обычными линейными операциями с числами — координатами взятых векторов относительно этого базиса. Именно, имеет место следующая теорема: Теорема. При сложении двух векторов пространства К их координаты (относительно любого базиса) складываются. При умножении вектора на число все его координаты умножаются на это число. Действительно, пусть * = 6l*l + &2*2 + • • • + £„*„, У = T)l*l + ^2 + • • • + Чпеп* Тогда в силу аксиом 2.12—2.13 Хх = %1ге1 + М2е2 + ... + №>пеп> что и требуется. См. задачи 6—7. 2.34. Если в линейном пространстве К можно найти п линейно независимых векторов, а всякие л+1 векторов этого пространства линейно зависимы, то число п называют
2.35] § 2.3. базис, координаты, размерность 53 размерностью пространства К; само же пространство К называют n-мерным. Мы будем в дальнейшем для п-мерного пространства над полем К использовать обозначение К„ (над полем R — соответственно R„, над полем С — соответственно Сп). Линейное пространство, в ^котором можно указать сколь угодно большое число линейно независимых векторов, называется бесконечномерным. Теорема. В пространстве К размерности п существует базис из п векторов; более того, любая совокупность из п линейно независимых векторов пространства К является базисом этого пространства. Доказательство. Пусть е1У е2, ..., еп — система из п линейно независимых векторов заданного я-мерного пространства К. Если х — некоторый вектор пространства К, то совокупность из /2-f-1 векторов ху е1У е2, ..., еп линейно зависима; существует соотношение вида а0х + ахех + .. . -f anen = О, (7) причем среди коэффициентов а0, av . .., ап имеются отличные от нуля. Можно утверждать, что коэффициент а0 заведомо отличен от нуля: действительно, в противном случае мы получили бы линейную зависимость между векторами ег, е2У ..., еп, которая, по предположению, не имеет места. Но в таком случае обычным путем, т. е. разделив уравнение на а0 и перенеся все остальные члены вправо, мы получим, что х линейно выражается через векторы е1у е2у . .., еп. Поскольку х — любой вектор пространства К, мы доказали, что векторы ev е2, ..., еп образуют базис в этом пространстве, что и требовалось. 2.35. Следующая теорема является обратной по отношению к теореме 2.34. Теорема. Если в пространстве К имеется базис, то размерность этого пространства равна числу базисных век* торов. Доказательство. Пусть векторы ev е2} ..., еп образуют базис пространства К. По самому определению базиса векторы еъ е2} ..., еп линейно независимы; следовательно, у нас уже имеется п линейно независимых векторов. Покажем, что всякие п-\-\ векторов пространства К линейно зависимы.
54 гл. 2. линейные пространства [2.36 Пусть в пространстве К заданы п-\-\ векторов %2 = Ь1 в1 ~Г Ъ2 в2 \ • • • "Т ЪП еПУ п + 1 Z<r1,el + Vr"e2+ . .. +1Гие„. Выписывая в отдельный столбец координаты каждого из этих векторов, составим матрицу с п строками и п+1 столбцами А = (Л+1) 1 I? IIs (1) £(2) £(Л+1) »2 Ь2 • • • Ь2 (1) t(2) £(/ Ъл • • • Sn П+1) Базисный минор {1.92) матрицы А имеет порядок г^Сл. Если г = 0, то линейная зависимость очевидна. Пусть г > 0. После указания г базисных столбцов мы сможем найти еще по меньшей мере один столбец, не попавший в число базисных. Но тогда согласно теореме о базисном миноре этот столбец является линейной комбинацией базисных столбцов. Соответствующий вектор пространства К является линейной комбинацией других векторов (из числа заданных xv х2} ..., хп + 1). Но в таком случае векторы xv х2у ... •••> xn + v согласно 2.236, линейно зависимы, что и требовалось. 2.36. Примеры. а. Пространство V3 трехмерно, поскольку оно обладает базисом из трех вектороз *, у, k (2.32а); соответственно V2 двумерно, Vx одномерно. б. Пространство Кп /г-мерно, поскольку оно обладает базисом из п векторов ev e2J ..., еп (2.326). в. В пространствах R(ayb) и С (ау Ь) имеется сколь угодно большое число линейно независимых векторов (2.22г), и, следовательно, эти пространства бесконечномерны. Поэтому они не имеют базиса: наличие базиса привело бы к противоречию с теоремой 2.35. г. Всякое комплексное линейное пространство С является, очевидно, и вещественным, поскольку область комплексных
2.42] § 2.4. ПОДПРОСТРАНСТВА 55 чисел включает в себя область вещественных чисел. Однако размерность пространства С как комплексного пространства не совпадает с размерностью того же С как вещественного пространства: если векторы ev ..., еп линейно независимы в С как в комплексном пространстве, то в С как вещественном пространстве будут линейно независимы векторы ev iev ..., еп, ienJ так что размерность С как вещественного пространства (если она конечна), вдвое больше, чем размерность С как комплексного пространства. См. задачу 8. § 2.4. Подпространства 2.41. Допустим, что некоторая совокупность L элементов линейного пространства К обладает следующими свойствами: а) если лг^Ь, у £ L, то x-'ry£L; б) если x£Ly X— элемент поля К, то Хх G L. Таким образом, нам задана совокупность элементов, и в ней определены линейные операции. Покажем, что мы получаем здесь также л и н е й н о е пространство. Для этого нужно проверить для совокупности L с операциями а) — б) выполнение аксиом 2.12— 2.13. Аксиомы 1), 2), 5)—8) удовлетворяются, поскольку они удовлетворяются вообще для всех элементов пространства К. Остается проверить аксиомы 3) и 4). Пусть .v — любой элемент из L; тогда по условию Хх £ L при любом вещественном X. Возьмем Х = 0; тогда, поскольку по теореме 2.14в 0-.*:=: О, нуль-вектор принадлежит совокупности L. Тем самым выполнена аксиома 3). Возьмем теперь X =—1; поскольку по теореме 2.14г (—1) х есть элемент, противоположный элементу х} совокупность L вместе с каждым элементом х содержит и противоположный элемент. Таким образом, выполнена и аксиома 4), и наше утверждение полностью доказано. Поэтому всякая совокупность LciK, удовлетворяющая условиям а) и б), называется линейным подпространством (или просто подпространством) пространства К. 2.42. При м с р ы. а. Нуль-вектор пространства К образует, очевидно, наименьшее возможное подпространство пространства К.
56 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.42 б. Все пространство К — наибольшее возможное подпространство пространства К. Эти два подпространства — нуль-вектор и все пространство— называют иногда тривиальными подпространствами; и тогда все остальные подпространства называют нетривиальными. в. Пусть Lx и L2— два подпространства одного и того же линейного пространства К. Совокупность всех векторов лг^К, принадлежащих одновременно к Lx и L2, образует подпространство, называемое пересечением подпространств Lx и L2. Совокупность всех векторов вида y-\-z, где^уёЦ, г^Ц, образует подпространство, называемое суммой подпространств Ц и L2. г. В пространстве V3 все векторы, параллельные какой- либо плоскости (или какой-либо прямой), образуют подпространство. Если говорить не о векторах, а о точках (2.17), то подпространствами пространства V3 являются совокупности точек, расположенных на плоскости (или прямой), проходящей через начало координат. д. В пространстве Кп рассмотрим совокупность L тех векторов д; = (^1, £2, ..., |Л), координаты которых удовлетворяют системе линейных уравнений tfn*i + 012*2 + • • • + а1пхп = О, 021*1 ~Ь 022*2 + • • • + а2пХп — 0> 0*1*1 + 0*2*2 + • • • + Чп*п = О с коэффициентами из поля К и со свободными членами, равными 0. Такая система называется однородной линейной системой. Однородная линейная система всегда совместна, так как имеет очевидное «нулевое» решение хх = х2 = • .. = = *я = 0. Пусть с?\ с(}\ . . . , с%} и с[2\ 42\ • • • 1 ^ii2) —два решения такой системы; образуем числа с1 — с1 ^Г Ll > с2 — с2 Ч с2 > • • • » сп — сп ~Тсп • Утверждается, что сх> с2, . . . , сп снова образуют решение системы (8). Действительно, подставляя эти числа в /-е (8)
2.43] § 2.4. ПОДПРОСТРАНСТВА 57 уравнение этой системы, мы получаем с/1с1 + с,-2с2+ ...+aiacn = = ап (с'1' + с?>) + ai2 (с',1» + 42') +...+ain (c«> + с|») =, = (fl/1ciu + алс™ + • • • + «/„с"') Н- + (a.^ci" + crtc«> + ... + e,„c<») = О, что и требовалось. Это решение мы будем называть суммой решений ci1*, с[1\ . . . , с^ и с[2\ с[2\ . . . , с^2). Аналогично, если ^1, с^ • • • » с« — произвольное решение системы (8), то числа Кс1у Хс2, . . . , Хсп при фиксированном Я £ Л" образуют также решение системы (8); это решение мы будем называть произведением решения clt с2, . . . , сп на число к. Таким образом, решения однородной системы с коэффициентами из поля К можно складывать друг с другом и умножать на числа из того же поля К. Тем самым совокупность L есть подпространство пространства Кп и, следовательно, является линейным пространством. Мы будем называть его пространством решений системы (8). В 3.41 мы вычислим размерность этого пространства и построим его базис. См. задачу 9. 2.43. Отметим некоторые свойства подпространств, связанные с определениями §§ 2.2—2.3. Прежде всего, всякое линейное соотношение, связывающее векторы х, у, . . . , z в подпространстве L, справедливо и во всем пространстве К, н обратно; в частности, факт линейной зависимости векторов х> у, . .. , z £ L выполняется одновременно в подпространстве L и в пространстве К. Если, например, в пространстве К всякие п-\-\ векторов линейно зависимы, то это утверждение и подавно будет выполнено в подпространстве L. Отсюда вытекает, что размерность любого подпространства L в n-мерном пространстве К не превосходит числа п. В этом случае согласно теореме 2.34 в каждом подпространстве LcK можно построить базис из такого числа векторов, какова размерность под прост ран-, ства L.
58 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.44 Если в пространстве К выбран базис ev еъ . . . , еп, то в общем случае, разумеется, нельзя выбрать базисные векторы подпространства L прямо из числа векторов ev е2, . . . , еп хотя бы потому, что в подпространство L может не входить ни один из них. Но можно утверждать, что если выбран базис /\, /2, . . . , fL в подпространстве L [имеющем для определенности размерность I < п)} то всегда можно дополнительно выбрать векторы fl + 1> . . . , /;/ во всем пространстве К так, что система fv /2, ...,//, . . . , fn будет базисом во всем К. Для доказательства будем рассуждать так. В пространстве К существуют векторы, которые линейно не выражаются через Д, /о, . . . , ft\ действительно, если бы таких векторов не было, то векторы /х, /2, . . . , /\ — но условию линейно независимые — составляли бы базис пространства К и по теореме 2.35 размерность К была бы равна /, а не п. Обозначим через // + 1 любой из векторов, не выражающихся линейно через Д, /2, . . . , /,. Система fv /2, . . . , /,, /1 + 1 линейно независима; в самом деле, если бы существовало соотношение вида то при а/ + 1=т^0 мы получили бы, что вектор // + 1 можно линейно выразить через /х, /2, . . . , fh а при <%1 + 1 = 0 получили бы, что векторы /х, /2, . . . , ft линейно зависимы; оба эти вывода противоречат построению. Если теперь всякий вектор пространства К линейно выражается через /1} /2, . . . , /1У fl + v то система /lf /2, . . . , flt // + 1 образует базис в К (и / —J— 1 = /г), и наше построение закончено. Если /+1 < п> то имеется вектор // + 2, не выражающийся линейно через fv /2» • • • у //> fi + i- Таким образом можно продолжить построение; в конечном счете (через п — / шагов) мы получим базис пространства К- См. задачу 10. 2.44. Будем говорить, что векторы gly ... , gk линейно независимы над подпространством LcK, если из соотношения «ift + • • • т ak%k € L, аъ . . . , ak G AT, следует аг = . . . = ak = 0. Если L — нулевое подпространство, то линейная независимость над L означает обычную линей-
2.45] § 2.4. ПОДПРОСТРАНСТВА 59 ную независимость. Линейная зависимость векторов^, . . . , gk над подпространством L означает, что существует линейная комбинация ^-1^1+. . .+^/г^/г, лежащая в L, причем среди коэффициентов а1у . . . , ak имеются отличные от 0. Наибольшее возможное число векторов пространства К, линейно независимых над подпространством LcK, называется размерностью К над L. Если векторы gv . . . , gk линейно независимы над пространством LcK, a /l5 . . . , fL — векторы, линейно независимые в подпространстве L, то векторы gl} . . . , gk, /x, . . . , ft линейно независимы в пространстве К- Действительно, если бы имело место равенство ai/l+ . . . -f-a//i + pift + ... +P/kft = 0, то, написанное в форме Pift + • • • + Р*& = - (a/i + • • • + «,/,) € L, оно привело бы к заключению, что рх = . . . = pft = 0 в силу предположенной линейной независимости векторов gly . . . , gk над L; отсюда аг= . . . =af = 0 в силу линейной независимости векторов /г, . . . , ft. Векторы // + 1, ...,/„, построенные в 2.43, линейно независимы над подпространством L: действительно, если бы имело место равенство ai + ifi + i+ • • • +*nfn = <hfi+ • • • +<*//i. причем среди чисел а/ + 1, . . . , aw были бы отличные от 0, то векторы fv ...,/„ оказались бы линейно зависимыми в противоречии с построением. Размерность пространства К над L, следовательно, не меньше, чем п — /. С другой стороны, она не может быть и больше, чем п — /, так как если бы нашлось п — /+1 векторов, например, hly ... , hn_l+ly линейно независимых над L, то в пространстве К были бы линейно независимы векторы hv . . . , hn_l + ly fly . . . , fu число которых больше, чем п. Таким образом, размерность К над L в данном случае равна п — /. 2.45. Прямая сумма. Говорят, что пространство L является прямой суммой своих подпространств Ц, . . . , Lmt если:
60 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.46 а. Для всякого x£L существует разложение х = хг-\- . . . -у-хтУ хх £ Ц, . . . , хт £ Lm. б. Это разложение единственно: если * = *!+... +Хт=Уг+ . . . +^, где Xj £ LJy у; £ Ly, у=1, . . . , /и, то аг1=^1, . .. , Дги=^|Я. Впрочем, справедливость последнего условия следует из более простого требования: б'. Если имеется разложение 0 = гг+...+гт, где ^СЦ, ... , гт €ЬЯ, то Zl= ...=*m = 0. Действительно, пусть выполнено условие б' и дано разложение б. Вычитая, находим 0 = {х1-у1)+... + (хт-Ут); применяя б',-получаем xx=yv ..., хт—ут. Обратно, б' следует из б, если положить дг = 0, atx— . . . = хт = 0. Из б следует, что всякие два из подпространств Lx, . . . , Lm имеют общим один лишь элемент 0. Действительно, если бы мы имели z £Lk и z£L-y то из сравнения двух разложений z = z+0y z£Lj, 0€Ц, z = 0 + *, 0€Ly> *€Ц, и условия б вытекало бы, что z = 0. Так, /г-мерное пространство К„ есть прямая сумма п одномерных подпространств, определенных любыми п линейно независимыми векторами. Кроме того, пространство К„ можно представить разными способами в форме прямой суммы и неодномерных подпространств. 2.46. Пусть в /г-мерном пространстве К„ фиксировано подпространство L. Покажем, что всегда существует подпространство МсК„, которое в прямой сумме с L дает все К„. Для доказательства используем векторы /i + 1, . . . , /„, построенные в 2.43, линейно независимые над подпространством L. Пусть М — подпространство, составленное из всех
2.47] § 2.4. ПОДПРОСТРАНСТВА 61 линейных комбинаций векторов // + 1, . . . , /„; покажем, что оно удовлетворяет нашему требованию. Действительно, поскольку векторы /ъ . . . , /п образуют базис в К„ {2-43), каждый вектор х £ L допускает разложение *^<Vi+ • • • +<*ifi + <*i + ifi + i+ • • • +<*>г/п=У + г> где у = а^ + • • • +oclfl £ L, z = al + 1fl + 1 + ... + «,/„ € M. При этом из х — 0 следует ау. = 0 (/=1, . . . , /z) в силу линейной независимости векторов /\, . . . , //г Следовательно, условия 2.45а,б' выполнены, и К„ есть прямая сумма L и М. 2.47. а. Если размерность пространства Lk равна rk (Л=1, ... , т) и в каждом пространстве ЬЛ выделены гй линейно независимых векторов fkv .. . fkr то каждый вектор х суммы L = Lx-f-. . .+Ц можно линейно выразить через все эти векторы. Следовательно, размерность суммы пространств Ц, . . . , Lk не больше суммы их размерностей. Если сумма Lx+ . . . + Ц прямая, то все векторы/Л1, . . . , fkr (k—\} . . . , m) линейно независимы, так что в этом случае размерность суммы равна сумме размерностей. б. В общем случае размерность суммы определяется через размерности слагаемых более сложным образом; мы рассмотрим только вопрос о размерности суммы двух конечномерных подпространств Р и Q пространства К. Пусть р и q обозначают размерности этих подпространств. Обозначим через L пересечение подпространств Р и Q и через / его размерность. Выберем в L базис ev еъ .. . , et и, используя соображения 2.43, дополним его векторами fi + i, Л+2» • • • > fp до полного базиса подпространства Р и векторами gl + v ^+2, • • • , gq ДО полного базиса подпространства Q. Каждый вектор суммы P + Q по самому определению есть сумма вектора из Р и вектора из Q и поэтому может быть линейно выражен через векторы ev е2у . .. , eL9 fi + ъ • • • , /я» gi + v • • • » £q- Покажем, что эти векторы образуют базис подпространства P + Q. Для этого нам остается проверить их линейную независимость. Допустим, что существует линейное соотношение вида (*!*!+ • • • +а^-гР* + 1Л+1+ • • -+Ыр + + yi + igi + i+ • • - +yqgq = 0, (9)
62 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.48 причем среди коэффициентов а1} . . . , уд имеются отличные от нуля. Мы можем тогда утверждать, что имеются отличные от нуля числа в совокупности у1 + 1} . . . , уду так как в противном случае векторы ev е2} . . . , el} fi + v • • • > fp оказались бы линейно зависимыми, что невозможно ввиду того, что они образуют базис подпространства Р. Следовательно, вектор -^ = 7^4-1^4-1+ •••+yqgq¥=0, (10) иначе векторы gt + v . . . , gq оказались бы линейно зависимыми. Но из (9) вытекает, что в то время как (10) показывает, что at^Q- Таким образом, х принадлежит и Р и Q и, следовательно, входит в подпространство L. Но тогда Поскольку векторы ev еъ . . . , еь, gL + 1, . . . , gq линейно независимы, у1 + 1 = . . . = yq = 0. Полученное противоречие показывает, что векторы ev е2У . . . , еь // + 1, . . . , /ру gi + u • • • у £q действительно линейно независимы. Согласно теореме 2.35 размерность подпространства P + Q равна числу базисных векторов еъ . . . , ely /f + 1, ...,/_, Sl + ъ ••• » Sq\ но это числ0 равно p-\-q—/. Итак, размерность суммы двух подпространств равна сумме их размерностей за вычетом размерности пересечения. в. Следствие. Если в n-мерном пространстве Rn выделены два подпространства Rp и R , размерности которых р и q в сумме превышают число п, то пересечение R и Rq имеет размерность не меньшую, чем p-\-q— п. 2.48. Фактор-пространства. а. Пусть в линейном пространстве К выделено подпространство L. Назовем элемент х £ К сравнимым с элементом у £ К (точнее, сравнимым относительно L), если х—у g L. Очевидно, в этом случае иу сравним с х, так что отношение сравнения симметрично. Всякий лг^К сравним сам с собою. Далее, если х сравним с у, а у сравним с z, то и х сравним с zy так как *_z = (x— y) + (y—2)gL.
2.49] § 2.4. ПОДПРОСТРАНСТВА 63 б. Совокупность всех элементов у£К, сравнимых с данным элементом х £ К, называется классом и обозначается через X. В силу сказанного класс X содержит сам элемент дг, и всякие два элемента j/gX, z g X сравнимы друг с другом. Наконец, если ы(£Х, то и не сравним ни с одним элементом из класса X. Поэтому два класса X и Y или не имеют общих элементов, или полностью совпадают. Одним из классов является все подпространство L; поскольку оно содержит нулевой элемент пространства К, этот класс обозначается через 0. в. Все пространство К разбивается в совокупность непересекающихся классов X, Y, ... Эту совокупность классов мы обозначим через K/L. Введем в множестве К L линейные операции следующим образом. Пусть X и Y — классы, а и Р — элементы поля /С; мы желаем определить класс aX + PY. Для этого выберем произвольно элементы х £ X и у £ Y и найдем класс Z, который содержит элемент z = ах -\- $у; этот класс и обозначим aX-r($Y. Проверим, что он определен однозначно. Если в классе X мы возьмем элемент хъ а в классе Y—элемент у1у то (axY + Р^) — (ах + рдг) = а (хх — х) + Р (уг—у) лежит в подпространстве L вместе с хг — х и уг—у; это означает, что ахх -j- $уг лежит в том же классе, что и ах -Ь $у. В частности, мы определили сложение классов X, Y и умножение их на числа а£К. Покажем, что эти операции удовлетворяют аксиомам линейного пространства 2.12—2.13. Действительно, из справедливости 2.12 1)—2) и 2.13 5)—8) для элементов пространства К следует сразу выполнение этих же свойств для классов. Нулем пространства K/L является класс 0 (состоящий из всех элементов пространства L). Противоположным к классу X является класс, состоящий из элементов, противоположных к элементам класса X. Таким образом, для совокупности классов выполнены и аксиомы 2.12 3)—4). Построенное здесь линейное пространство K/L называется фактор-пространством пространства К по подпространству L. 2.49. Теорема. Пусть К = Кп есть п-мерное линейное пространство над полем К\ L = LLc:K есть 1-мерное подпро-
64 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.51 странство в К. Тогда фактор-пространство K/L имеет размерность п — /. Доказательство. Выберем произвольно базис fiy • • • у fi B подпространстве L и дополним его, как в 2.43, векторами /1 + г, ...,/„ до базиса всего К. Рассмотрим классы Х/ + 1Э/ль ••• > Х„ЭЛ и покажем, что они образуют базис в пространстве K/L. Для любого х £ К существует представление п поэтому для класса X Э * существует представление Х= 2 aftXft. Покажем, что классы Х/ + 1, . . . , Хп линейно независимы. Если бы мы имели при некоторых сс/ + 1, . . . , ап из К «(+A+1+...+a,X„ = 0€K/L, то, в частности, выполнялось бы соотношение az + i// + i+-..+aii/n€L; но так как // + 1, ..., /„ линейно независимы над L (2.44), то а/ + 1 == . . . =а/1 = 0, что и требовалось. Таким образом, Х/ + 1, ..., Хл образуют базис в K/L; но тогда их число п — / есть размерность пространства K/L (2.35). Теорема доказана. § 2.5. Линейные оболочки 2.51. Важным способом построения подпространств является образование линейной оболочки заданной системы векторов. Пусть х, уу z} ...—некоторая система векторов линейного пространства К; линейной оболочкой системы х, у, z, ... называется совокупность всех (конечных) линейных комбинаций ax+$y+yz+... (И) с коэффициентами а, [5, у} ... из поля К. Легко проверить, что для этой совокупности выполнены условия 2.41 а, б; поэтому линейная оболочка системы х, у, z, ... есть под
2.53] § 2.5. ЛИНЕЙНЫЕ ОБОЛОЧКИ 65 пространство пространства К. Это подпространство, очевидно, содержит векторы ху уу zy ... С другой стороны, всякое подпространство, содержащее векторы ху уу zy ..., содержит и все их линейные комбинации (И); следовательно, линейная оболочка векторов х, у, z, ... есть наименьшее подпространство, содержащее эти векторы. Линейная оболочка векторов ху уу zy ... обозначается через L(xyyy z, .. .). 2.52. Пример ы. а. Линейная оболочка векторов е1у е2У ..., ^образующих базис некоторого пространства К, очевидно, совпадает со всем пространством К. б. Линейная оболочка пары (неколлинеарных) векторов пространства V3 состоит из всех векторов, параллельных плоскости этих векторов. в. Линейная оболочка системы функций 1, ty t2y . . ., tk пространства К(ау b) (К есть R или С) совпадает с совокупностью всех многочленов от t не выше &-й степени. Линейная оболочка бесконечной системы функций 1, ty t2y . . . состоит из всех многочленов (любой степени) от переменного t с коэффициентами из поля К. 2.53. Отметим два простых свойства линейных оболочек. а. Лемма. Если векторы х'у у'у ... принадлежат к линейной оболочке векторов ху уу . . ., то вся линейная оболочка L(x'y у'у ...) содержится в линейной оболочке Ч*. У, ...)• Действительно, поскольку векторы х'у у'у ... принадлежат к подпространству L(xy yy ...), все их линейные комбинации, совокупность которых и составляет линейную оболочку L(x'y у'', ...), также принадлежат к подпространству Ь(дг, уу .. .). б. Лемма. Всякий вектор системы ху уу ..., линейно зависящий от остальных векторов этой системы, можно из нее исключить без изменения линейной оболочки. Действительно, если, например, вектор х линейно зависит от векторов уу zy . . . , то это означает, что х £ L (yy zy. ..). Отсюда и из леммы а вытекает, что L(xy yy zy ...)cz ^ I- Cv, z, . • .)• С другой стороны, очевидно, Цуу zy . . . )<z czL(xyy} z, ...). Оба включения вместе показывают, что L {уу z, . . ,) = L(x, у, z, ...), что и требуется. 3 Г. Е. Шилов
66 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.54 2.54. Поставим вопрос о построении базиса линейной оболочки и определении ее размерности. При решении этого вопроса мы будем предполагать, что число векторов ху уу . . ., порождающих линейную оболочку L(xy уу ...), конечно (хотя некоторые из заключений и не будут существенно требовать такого предположения). Допустим, что среди векторов ху уу ..., порождающих линейную оболочку L(ху уу . . .), мы смогли найти г линейно независимых векторов,— обозначим их через х1у х2У ... , хГУ— через которые может быть линейно выражен любой вектор из системы х, уу . .. В этом случае мы можем утверждать, что векторы х1у х2у ...ухг образуют базис пространства L (ху уу . . .). Действительно, всякий вектор z с L (ху уу . . .) по самому определению линейной оболочки линейно выражается через конечное число векторов из системы х, уу . . .; но каждый из векторов этой системы по условию линейно выражается через х1у х2у . . ., хг; поэтому в конечном счете и вектор z может быть линейно выражен непосредственно через векторы х1у х2У ..., хг. В соединении с предположенной линейной независимостью векторов х1у х2, ...ухг мы получаем выполнение для них обоих условий, содержащихся в определении базиса (2.31)у что и требовалось. Согласно теореме 2.35 размерность пространства L(xyyy ...) равна числу г. Поскольку в г-мерном пространстве не может существовать более чем г линейно независимых векторов, мы можем сделать относительно размерности г пространства L(xy уу ...) следующие выводы: а. Если число порождающих векторов ху уу ... больше числа г, то векторы ху уу ... линейно зависимы; если их число равно числу г, то они линейно независимы. б. Всякие г-\-\ векторов из системы ху уу ... линейно зависимы. в. Размерность пространства L(xy yy ...) можно определить как максимальное число линейно независимых векторов в системе ху уу ... § 2.6. Гиперплоскости 2.61. Как мы уже видели в 2А2гу геометрический образ, соответствующий понятию подпространства, для пространства V3 в «точечной» (а не «векторной») интерпретации есть
2.62] § 2.6. ГИПЕРПЛОСКОСТИ 67 плоскость (или прямая), проходящая через начало координат. Но плоскости и прямые, не проходящие через начало координат, желательно было бы также включить в круг наших рассмотрений. Замечая, что такие плоскости и прямые получаются из плоскостей и прямых, проходящих через начало координат, параллельным перемещением в пространстве, т. е. сдвигом, мы естественно приходим к следующему общему построению. Пусть L — некоторое подпространство линейного пространства К и х0— фиксированный вектор, вообще говоря, не принадлежащий L. Рассмотрим совокупность Н всех векторов х, которые получаются по формуле х = х0+у, когда вектор у пробегает все подпространство L. Совокупность Н называется результатом сдвига подпространства L вдоль вектора х0 или гиперплоскостью. Заметим, что гиперплоскость сама, вообще говоря, не образует подпространства. 2.62. Примеры. а. В пространстве \/3 совокупность всех векторов, выходящих из начала координат и кончающихся на некоторой плоскости y> образует гиперплоскость. Легко проверить, что эта гиперплоскость является подпространством в том и только в том случае, когда плоскость у проходит через начало координат. б. В пространстве Кп рассмотрим совокупность Н тех векторов х = (£,1У £2, ..., £„), координаты которых удовлетворяют совместной системе линейных уравнений «11*1 + ^12*2 + • - • + fliA = К аЪ\*\ ~\~ ai2X2 "Г" • - • ~t~ a2nXn ~ ^2» ■aklXl+ak2X* + '• -+aknXn-bk, и совокупность L тех векторов у = (%, г]2, ..., r]J, координаты которых удовлетворяют однородной системе линейных (12) 3*
2.72] § 2.7. морфизмы линейных пространств 69 элемент подпространства L', можно представить в виде хг-\-у1, где уг g L (поскольку V есть сдвиг подпространства L на вектор д^); отсюда следует, что хг= —ух и поэтому х1 входит в L, что мы и утверждали. Но в таком случае и всякий вектор у' £ L' входит в подпространство L, так как представляется суммой вектора хг£ L и некоторого вектора y£L. Следовательно, имеет место включение L'cL. В силу полной симметрии условия аналогично можно доказать, что LcL', откуда вытекает, что L = L', что и утверждалось. В дальнейшем гиперплоскости размерности 1 будем называть прямыми линиями, гиперплоскости размерности 2 — плоскостями. См. задачи 11—14. § 2.7. Морфизмы линейных пространств 2.71. Пусть каждому вектору х' линейного пространства К' по некоторому правилу со поставлен в соответствие вектор х" линейного пространства К". Правило со называется морфизмом (или линейным оператором), если выполняются следующие соотношения: а) со (х' -г у') =:со (*')-]- со (у') для любых х\ у' из К'; б) со (ал:') ~а со (х') для любых лг'ёК' и любого а£Л\ Если морфизм со отображает пространство К' на все пространство К'', он называется эпиморфизмом. Если морфизм со отображает пространство К' хотя бы и не на все К", но взаимно однозначно (так что из х' Фу' следует со {х') Ф ф<£>{у')), он называется мономорфизмом. Если морфизм со отображает пространство К' взаимно однозначно на все пространство К'', т. е. является одновременно моно- и эпиморфизмом, он называется изоморфизмом, а сами пространства К' и К" называются изоморфными (точнее, К-изоморфными). Общепринятое обозначение морфизма: со: К'-* К". 2.72. П'р и м е ры. а. Пусть L есть подпространство пространства К. Отображение со, которое каждому вектору х £ L ставит в соответствие этот же вектор х в пространстве К, есть морфизм
70 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.73 L в К, и именно мономорфизм (причем, если L^=K, не эпиморфизм). Этот морфизм со называется вложением L в К. б. Пусть L есть подпространство пространства К и K/L — фактор-пространство пространства К по подпространству L (2.48). Отображение со, которое каждому вектору л* € К ставит в соотвегствие класс XcK/L, содержащий элемент х, есть морфизм К в К/Ь, и именно эпиморфизм (причем, если L^O, не мономорфизм). Этот морфизм со называется каноническим отобраокением К на K/L. 2.73. а. Пусть пространство К' /2-мерно и обладает базисом е[, ..., е'п. В пространстве К" выберем произвольно векторы е\, .... е"п. Поставим в соответствие любому век- п тору х = У £*<?*€ К' вектор *>(*') = *" = 2**4; с теми же коэффициентами \k(k—A, ..., п). Покажем, что отображение (й(х')-х" есть морфизм про* странетва К' в пространство К". Пусть в пространстве К' выбраны два вектора п гг_ тогда по 2.33 Согласно определению отображения со /е= 1 /г= 1 Далее, /о=1 /г=1 ^1
2.74) § 2.7. морфизмы линейных пространств 71 так что условие 2.71а) выполнено. Аналогично при любом а е к о) (ад;') = о (a jg lke'k) = <*>('£ a\keh n n = 2 alke"k = а 2 £/A = а со (д:'), Л = I /V = I так что выполнено и условие 2.716). Следовательно, со (х') = #" есть морфизм К' в К", что и утверждалось. б. Выясним, при каком условии морфизм со, описанный в а, является эпиморфизмом. Очевидно, необходимым и достаточным условием для этого является возможность представ- п ления в форме V \ке\ любого вектора х" £ К", иными сло- вами, тот факт, что К" совпадает с линейной оболочкой векторов е"1} . . ., е"п. в. Выясним, при каком условии морфизм о), описанный в а, является мономорфизмом. Для этого необходимо и достаточно, чтобы векторы ^^ke'k\ ]£] т]^', различающиеся хотя бы по одной паре координат (т. е. такие, что \k Ф \\k хотя бы при одном значении &), были бы различными векторами пространства К". Но это равносильно линейной независимости векторов ё[, ..., е"ПУ следовательно, морфизм со тогда и только тогда является мономорфизмом, когда векторы е\, . . ., е"п линейно независимы. г. Как следствие получаем: морфизм со, описанный в а, является изоморфизмом тогда и только тогда, когда векторы е"и ..., е"п линейно независимы и их линейная оболочка совпадает со всем пространством К". Иначе говоря, морфизм со является изоморфизмом тогда и только тогда, когда векторы el, . . ., е"п образуют базис пространства К". 2.74. Теорема. Любые два n-мерных пространства К' и К" (над одним и тем же полем К) К-изоморфны. Доказательство. Пусть е[, ..., е'п — базис в пространстве К' и е"1у . .., е"п — базис в пространстве К". С помощью этих систем векторов построим морфизм со, как указано в 2.73а. В силу 2.7Зг он является изоморфизмом, что и требуется.
72 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА |2.?5 2.75. Следствие. Всякое л-мерное линейное пространство над полем К /С-изоморфно пространству Кп (2.156). В частности, всякое л-мерное комплексное пространство С-изоморфно пространству Сп; всякое л-мерное вещественное пространство /^-изоморфно пространству Rn. 2.76. Дальнейшие свойства моно- и эпиморфизмов. а. Пусть имеется морфизм со: К'—►К". Рассмотрим совокупность всех векторов co^'JgK", когда х' пробегает все К'. Эта совокупность есть, очевидно, подпространство L"с: К"'. Оно называется областью значений морфизма со. Ясно, что отображение со пространства К' в L" является эпиморфизмом. Если морфизм со: К'—*К" был мономорфизмом, то морфизм со: К'—>L" есть изоморфизм. б. Пусть имеется морфизм со: К'—*К". Рассмотрим совокупность L' всех векторов лг'£К', для которых со(лг') — 0. Совокупность L' есть, очевидно, подпространство в пространстве К'; оно называется ядром, или ну ль-многообразием морфизма со. Построим фактор-пространство K7L' (2.48). Все элементы х', лежащие в одном и том же классе X'gK'/L' переводятся морфизмом со в один и тот же элемент пространства К"; действительно, для двух таких элементов х' и у' мы имеем х'—у' =z'£L', откуда со (х') — со (у') = со (zf) = 0, со (х') = = со {у'). Поставим в соответствие каждому классу X' £ К'/Ь' элемент х" = со (xf) £ К", где х' g X'—любой элемент; мы только что видели, что х" определен при этом однозначно. Положим х" = Q(X'). Отображение й, как легко видеть, есть морфизм пространства K7L' в К"; он является мономорфизмом, так как из X'^=Y', x'gX', у' £Y' следует Q (X') — Q (У) = со (*') — со {у') = со (*' —у') Ф 0. Таким образом, любой морфизм со: К'—*К" порождает мономорфизм Q: K7L'—*-К". Если морфизм со был эпиморфизмом, то, очевидно, и мономорфизм Q является эпиморфизмом, так что эпиморфизм со: К'—*К" порождает изоморфизм Q: K7L'—*К". Мы продолжим изучение м орфизмов в гл. 4.
ЗАДАЧИ 73 ЗАДАЧИ 1. Образует ли совокупность векторов на плоскости, начала которых находятся в начале координат, а концы — в пределах первой четверти, линейное пространство (с обычными операциями)? 2. Образует ли линейное пространство совокупность всех векторов на плоскости с исключением векторов, параллельных некоторой заданной прямой? 3. Рассмотрим совокупность Р одних положительных вещественных чисел. Введем операции по следующим правилам: под •сложением» двух чисел будем понимать их (обычное) умножение, а под произведением элемента г £ Р на вещественное число Я будем понимать (обычное) возведение числа г в степень Я. Является ли Р с указанными операциями линейным пространством? 4. Показать, что в случае п заданных векторов в пространстве Кп критерием линейной независимости их служит неравенство нулю определителя, составленного из координат этих векторов. 5. Показать, что в пространстве R (а, Ь), где 0 < а < Ь, функции /ai, /*2, ..., t*k линейно независимы, если аъ а2, ..., ak — различные вещественные числа. 6. Относительно системы векторов ех, е2, ..., еп линейного пространства К известно следующее: а) Каждый вектор х £ К допускает разложение * = ll«l + S2*2+ ■••+£,,*«■ б) Для некоторого фиксированного вектора х0 £ К это разложение единственно. Доказать, что система elf ..., еп образует базис пространства К. 7. Существует ли базис у пространства Р (задача 3)? 8. Какова размерность пространства Р (задача 3)? 9. В пространстве V3 взяты два различных двумерных подпространства Li и L2 (две различные плоскости, проходящие через начало координат). Что собой представляют их пересечение и сумма? 10. Доказать теорему: если размерность подпространства LcK совпадает с размерностью пространства К, то L==K. П. Определен ли однозначно самой гиперплоскостью вектор сдвига *0, фигурирующий в ее построении? 12. Показать, что всякая гиперплоскость НсК обладает следующим свойством: если х £ Н, у £ Н, то ах-\-(\—а) у £ Н при любом вещественном а. Обратно, если некоторое подмножество Н CZ К обладает сформулированным свойством, то Н есть гиперплоскость. Какая геометрическая характеристика гиперплоскости содержится в этом свойстве? 13. Гиперплоскости Нх и Н2 имеют размерности соответственно р и q. Какой (наименьшей) размерности нужно взять гиперплоскость Н3, чтобы она, будучи должным образом расположена в пространстве, содержала в себе и Hx и Н2? 14. Аналогичная задача для трех гиперплоскостей Hlf H2, Н3 с размерностями р, q и г. 15. Согласно теореме 2.74 одномерные пространства Rx и Р (задача 3) изоморфны. Как можно осуществить этот изоморфизм?
ГЛАВА 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ §3.1. Еще о ранге матрицы 3.11. Мы уже несколько раз встречались с матрицами в нашем изложении. В этом параграфе мы остановимся более детально на тех свойствах матрицы, которые связаны с понятием ранга {1.92). Это позволит нам дать общее решение задачи о системах линейных уравнений, сформулированной в § 1.2. Напомним основные определения из § 1.9. Пусть дана матрица с п строками и к столбцами, заполненными числами a(j (i — индекс строки, j—индекс столбца, /=1, 2, ... , пу j=\, 2, . . . , к) из поля К: ап а12 . . . alk д _ a2i агг • • • a2k || ап1 ап2 . . . ank Если в этой матрице выбрать произвольным образом т строк и т столбцов, то элементы, стоящие на пересечениях этих строк и столбцов, образуют квадратную матрицу порядка т. Определитель этой матрицы называется минором т-го порядка матрицы А. Натуральное число г называется рангом матрицы Л, если у нее имеется минор порядка г, отличный от нуля, а все имеющиеся миноры порядка г + 1 и выше равны нулю. Если матрица А имеет ранг г > О, то всякий ее минор r-го порядка, отличный от нуля, называется базисным минором. Столбцы и строки матрицы, на пересечениях которых находятся элементы базисного минора, называются базисными столбцами и строками. Наши дальнейшие рассмотрения будут основаны на возможности придать любому столбцу из п чисел геомет- • (1)
3.12J §3.1. ЕЩЕ О РАНГЕ МАТРИЦЫ 75 рический смысл вектора в л-мерном пространстве Кп (2.156). Сама матрица А в этой геометрической трактовке отвечает определенной совокупности k векторов пространства Кп\ обозначим через х;- вектор, соответствующий у-му столбцу матрицы А (у=1, 2, . . . , k). Любое линейное соотношение между столбцами матрицы мы можем истолковать как такое же линейное соотношение между соответствующими векторами (2.226). Образуем в пространстве Кп линейную оболочку векторов xv x2J . . . , xk (2.51). Покажем, что векторы, отвечающие базисным столбцам матрицы А,—пусть для определенности первые г ее столбцов являются базисными — образуют базис этой линейной оболочки. Для этого достаточно показать, во-первых, что векторы xv дг2, . . . , хг линейно независимы и, во-вторых, что через них может быть линейно выражен любой из оставшихся векторов хг+1у . . . , xk (2.54). Проверим сначала первое из этих утверждений. Линейная зависимость векторов хъ х2, . . . , хг была бы равносильна линейной зависимости г первых столбцов матрицы А. Но тогда в силу теоремы 1.96 любой определитель г-го порядка, построенный на этих столбцах и каких-нибудь г строках матрицы А, был бы равен нулю. В частности, был бы равен нулю базисный минор матрицы А, что противоречит его определению. Таким образом, первое утверждение доказано. Второе утверждение мы фактически доказали в 1.93; сформулированное там для столбцов матрицы А} оно составило содержание «теоремы о базисном миноре». Тем самым мы полностью доказали, что векторы xv х2> . . ., хг образуют базис пространства L(x1} х2, ... , xk). В силу теоремы 2.35 размерность этого пространства равна числу г, т. е. равна рангу матрицы А. Мы получили следующий важный результат: Теорема. Размерность линейной оболочки векторов, определенных столбцами матрицы А, равна рангу этой матрицы. Векторы, отвечающие базисным столбцам матрицы А, образуют базис линейной оболочки. 3.12. Дальнейшие предложения представляют собой очевидные следствия из 2.54а — в. а. Теорема. Если ранг матрицы А меньше, чем число ее столбцов (г < k), то столбцы матрицы А линейно зависимы.
76 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 13.13 Если ранг матрицы А равен числу столбцов (r = k), то столбцы матрицы А линейно независимы. б. Теорема. Всякие г + 1 столбцов матрицы А ранга г линейно зависимы. в. Теорема. Ранг любой матрицы равен максимальному числу ее линейно независимых столбцов. Это последнее предложение имеет большое принципиальное значение, так как оно содержит в себе новое определение ранга матрицы. 3.13. Если транспонировать матрицу Ау т. е. перейти от матрицы А к матрице А', строки которой являются столбцами матрицы А, то ранг транспонированной матрицы А' будет, очевидно, таким же, каков был ранг матрицы А. Но согласно теореме 3.12в ранг матрицы А равен максимальному количеству ее линейно независимых столбцов, или, что то же самое, строк матрицы А'. Мы приходим к несколько неожиданному заключению: Теорема. Максимальное количество линейно независимых строк любой матрицы совпадает с максимальным количеством ее линейно независимых столбцов. Заметим, что эта теорема нетривиальна; любое прямое ее доказательство потребовало бы цепи рассуждений, эквивалентной доказательству теорем 1.93 и 3.11. 3.14. Отметим еще следующий результат, который вытекает из теоремы 3.11 и леммы 2.536: Теорема. Если один из столбцов матрицы А является линейной комбинацией других ее столбцов, то его можно вычеркнуть из этой матрицы, не меняя ее ранга. См. задачи 1—2. § 3.2. Нетривиальная совместность однородной линейной системы 3.21. Пусть дана однородная линейная система апхг + а12х2 + . . . + а1пхп = О, а2\Х1 ~Г Я 22*2 ~Г • • • "Т а2пХп == О» ahlxi + ак2Х2 + • • • + aknxn — О- (2)
3.22) § 3.2. НЕТРИВИАЛЬНАЯ СОВМЕСТНОСТЬ 77 Как мы уже знаем, эта система всегда совместна, так как обладает нулевым решением хг = х2 = . . . =хп = 0. Основная задача, с которой приходится встречаться при изучении однородных линейных систем, следующая: при каких условиях однородная система «нетривиально совместна», т. е. имеет, кроме нулевого, еще другие решения'? Результаты § 3.1 позволяют сразу решить эту задачу. Действительно, существование ненулевого решения системы (2), как мы видели в 2.226, равносильно линейной зависимости столбцов матрицы II «И «12 • ' • а\п 1 л «21 «22 * * * а2п || ukl uk2 * * * ukn [I а по теореме 3.12а эта линейная зависимость имеет место тогда и только тогда, когда ранг матрицы А меньше числа столбцов. Итак, мы получаем следующую теорему: Теорема. Если ранг матрицы А равен числу я, система (2) не имеет ненулевых решений; если же ранг матрицы А меньше /г, ненулевые решения системы (2) заведомо существуют; в этом и только в этом случае наша система нетривиально совместна. 3.22. В частности, если число уравнений в системе (2) меньше числа неизвестных (k < я), то ранг матрицы А заведомо меньше п и ненулевые решения всегда существуют. Если k — n} то решение вопроса о существовании ненулевых решений зависит от величины detA: если deM^O, ненулевых решений нет (г = п)} если det A = 0, ненулевые решения есть (г < п). При k > n нужно рассмотреть все возможные определители /2-го порядка, которые получаются при выборе п произвольных строк матрицы А; если все эти определители равны нулю, то г < п и имеются ненулевые решения; если же среди этих определителей есть хотя бы один отличный от нуля, то г = п и имеется только нулевое решение. См. задачу 3.
78 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ I3-3* § 3.3. Условие совместности общей линейной системы 3.31. Пусть дана общая линейная система уравнений «Ц-^1 ~~Г #12*2 ••• | а1пХп ^11 "i~ "-о*)"^ ь 22^2 «2пХn — ^2> (3) + aknXn = h> С этой системой мы сопоставим две матрицы: матрицу i4--= j/i <721 <722 «о, [| ак\ ак2 к и «11 «21 йк\ «12 ' «22 ' «*2 ' • • «1// . . а.2„ • акп ', &2 »* называемую основной матрицей системы (3), и матрицу А = называемую расширенной матрицей системы (3). Важная теорема о совместности системы (3) гласит: Теорема (Кронекер и Капе л л и). Система (3) сов- местна тогда и только тогда, когда ранг расширенной матрицы, этой системы равен рангу основной матрицы. Доказательство. Допустим сначала, что система (3) совместна; если с]? с2, ..., сп — некоторое ее решение, то имеют место равенства Япс1 + «12с2+ • •• + <*1псп = Ь19 «21С1 — «22С2 'Г • • • + а2пСп == «2> aklCl + ak2C2+ • I К U И R Но эти равенства означают, что последний столбец матрицы Ах есть линейная комбинация остальных столбцов этой матрицы (с коэффициентами cv c2, ..., сп). В силу теоремы 3.14 последний столбец матрицы Ах можно вычеркнуть без изменения ее ранга. Но при вычеркивании последнего столбца
3.41] § 3.4. ОБЩЕЕ РЕШЕНИЕ ЛИНЕЙНОЙ СИСТЕМЫ 79 матрица Ах переходит как раз в матрицу А. Следовательно, если система (3) совместна, матрицы А и Ах имеют одинаковый ранг. Допустим теперь, что матрицы А и Ах имеют одинаковый ранг, и покажем, что система (3) совместна. Пусть г — ранг матрицы А (следовательно, и матрицы Ах). Рассмотрим г базисных столбцов матрицы А; они будут базисными столбцами и матрицы Av По теореме 1.93 последний столбец матрицы AY есть линейная комбинация базисных столбцов, а следовательно, и линейная комбинация всех столбцов матрицы А. Если мы коэффициенты этой последней линейной комбинации обозначим через съ с2, ..., сПУ то получим, что выполняются равенства апс1+а12с2 + .. . +а1псп = Ь1ч а21с1 --}- о22с2 4- . . . 4- а2псп == /;2, afclCl "Г Я*2С2 "Г • • • + aknCn = &к' J Таким образом, система (4) удовлетворяется значениями Х\ — Cl> X2~ C2i • • • •> Хп= Сп и, следовательно, совместна. Теорема доказана. § 3.4. Общее решение линейной системы 3.41. Теорема Кронекера — Капелли, устанавливая общее условие совместности линейной системы, не дает способа, получения решений этой системы. В этом параграфе мы выведем формулу, заключающую в себе общее решение линейной системы. Общим решением системы (3) называется совокупность выражений вида (у=1, . .. , п), где в правых частях стоят функции, зависящие от коэффициентов a{j системы (3), ее свободных членов bj и неопределенных параметров д1у . . . , qs, такие, что при произвольно фиксированных значениях параметров q. (из поля К) получающиеся величины Xj= сj (j= 1, ,,. , п) образуют решение системы (3), (4)
80 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.41 причем любое решение системы (3) получается этим путем при некотором выборе значений параметров qly . . . , qs из К, В 2.626 мы видели, что совокупность всех сумм вида х0-~уу где х0— какое-либо частное решение этой системы, а у пробегает совокупность всех решений соответствующей однородной системы, есть совокупность всех решений системы (3). Теперь этот факт можно выразить следующим образом: общее решение неоднородной системы (3) есть сумма какого-либо частного решения этой же системы и общего решения соответствующей однородной системы. Пусть дана совместная линейная система (3) с основной матрицей Л^Ца^Ц ранга г. Можно предположить, что базисный минор М матрицы А расположен в ее левом верхнем углу; если бы это было не так, мы смогли бы достичь желаемого расположения некоторой перестановкой строк и столбцов матрицы Л, что равносильно некоторой перестановке уравнений и неизвестных в системе (3). Рассмотрим первые г уравнений системы (3), причем перепишем их следующим образом: апх1 + а12х2+ ... +alrxr =bl — alt r+1xr + 1 — ... — alnxn, ^21^1 I &2<1Х2 I • • • I ^2ГХГ == ^2 ^2, Г + \ХГ + 1 * * • ^2пХП » аг1Х1~\~аг2Х2~\- • • • -\~агГХГ — "Г ar, Г + 1ХГ + 1 ' * ' аГПХП- Придадим неизвестным xr+l} . . . , xn совершенно произвольные значения cr + 1, . . . , cn. Тогда система (5) превращается в систему г уравнений для г неизвестных xiy х2У . . . , хг с определителем М} отличным от нуля (базисным минором матрицы А). Эту систему можно разрешить по правилу Крамера 1.73; существуют, следовательно, числа cv с2, . . . , спУ которые при подстановке их в систему (5) на место неизвестных х1У х2у . . . , хп обращают все уравнения этой системы в тождества. Покажем, что эти значения cv с2, . . . , сп удовлетворяют и всем прочим уравнениям системы (3). Первые г строк расширенной матрицы Аг системы (3) являются базисными строками этой матрицы, так как ранг расширенной матрицы в силу условия совместности равен г и в первых г строках матрицы Ах содержится отличный от нуля минор М. В силу теоремы 1.93 (в применении к строкам) каждая из последующих строк матрицы Аг есть линейная комбинация ее первых г строк. Для системы (3) это означает, что каждое уравнение системы (3), начиная с (г-[- 1)-го, есть (5)
3.51] § 3.5. свойства совокупности решений 81 линейная комбинация первых г уравнений этой системы. Следовательно, если первые г уравнений системы (3) удовлетворяются значениями х1 = с1, ..., хп=^спУ то все остальные ее уравнения также удовлетворяются этими значениями. 3.42. Чтобы записать построенное решение системы (3) в виде некоторой формулы, обозначим через My (а,) определитель, получающийся из базисного минора М — det||a/;-|| (iy у=1, 2, . . . , г) заменой его у-го столбца на столбец из величина^ а2, . . . , ah . .., аг Тогда, записывая решение системы (5) с помощью формул Крамера, мы получим *j = "лГ Ml Wi ~" ais + icr + i - • ' ' — aincn) = (7=1, •••> г), Xj==cf(j=r+\y . .. , h). Эти формулы выражают значения неизвестных Xj=c, (у=1, 2, . . . , г) через коэффициенты системы, свободные члены и произвольные величины (параметры) сг + 1, сг+2, . . . , сп. Покажем, что в формулах (6) содержится любое решение системы (3). Действительно, пусть cj, с°, . . . , с°+1, . . . , с°— произвольное решение системы (3). Очевидно, оно является также решением системы (5). Но по правилу Крамера из системы (5) величины с?, с\, . . . , с? определяются через величины с°+1, . . . , с„ однозначно и именно по формулам (6). Таким образом, при cr+1 = cj!+1, ..., сп = с\ формулы (6) дают нам как раз взятое решение с?, с°, . . . , с°, что и требовалось. Таким образом, формулы (6) дают общее решение системы (3). См. задачи 4—7. § 3.5. Геометрические свойства совокупности решений линейной системы 3.51. Рассмотрим сначала случай однородной линейной системы (2); мы уже знаем, что совокупность всех решений такой системы образует линейное пространство (2.42д). Обозначая это пространство через Z., вычислим его размерность и построим его базис.
82 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.52 Формулы (6) в данном случае приобретают вид — Мс~ cr + 1Mf(aijr+1)+ . . .+c„M;(ain) (У= 1, 2, ...,г), (7) так как M/(bi)^M/(0) = 0. Каждому решению (cv с2, . . . , сг, сг+1, . . . , сп) системы (2) поставим в соответствие вектор (сг+1, . . . , сп) пространства Кп_г. Так как числа сг+1, . . . , сп могут быть взяты произвольно и однозначно определяют решение системы (2), то соответствие между пространством решений системы (2) и пространством Кп__г получается взаимно однозначным. Поскольку при этом соответствии, как легко проверить, сохраняются линейные операции, это соответствие является изоморфным. Итак, пространство L решений однородной системы линейных уравнений с п неизвестными и с рангом г матрицы коэффициентов изоморфно пространству Кп_г. В частности, размерность пространства L равна числу п — г. 3.52. Любая система из п — г линейно независимых решений однородной линейной системы уравнений, являющаяся вследствие теоремы 2.34 базисом в пространстве всех решений, называется фундаментальной системой решений. Для построения фундаментальной системы решений мы можем воспользоваться любым базисом пространства Кп_г\ в силу изоморфизма соответствующие решения системы (2) будут образовывать базис и в пространстве всех решений этой системы. Простейший базис пространства Кп_г образуется векторами еЛ = (1, 0, ..., 0), е2 = (0,1, ..., 0), ..., еп_г = — (0, 0,. . . , 1) (2.326). Чтобы получить решение системы (2), соответствующее, например, вектору ev нужно в формулах (7) подставить сг + 1 — 1, сг+2 = . . . = сп = 0 и определить соответствующие значения с( = с^ (/=1, 2, ... , п). Аналогично строится решение, соответствующее любому другому вектору ej (/ =2, . . . , п — г). Построенная так совокупность решений системы (2) называется нормальной фундаментальной системой решений. Если обозначить эти решения через ха\ х{-\ ..., х(п~г\ то по определению базиса для любого решения х мы будем
3.61J § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 83 иметь равенство х = агх{1) + а2х{2) + . . . + ап_гх{п~г). (8) Поскольку в формуле (8) заключено любое решение системы (2), эта формула дает общее решение системы (2). См. задачу 8. 3.53. Переходим теперь к рассмотрению неоднородной системы (3) в общем случае. Как было показано в 2.626, геометрический образ Я, отвечающий совокупности всех решений неоднородной системы, есть гиперплоскость в я-мерноу пространстве Кп, полученная сдвигом подпространства L решений соответствующей однородной системы (по доказанному изоморфного пространству Rn_r) на некоторый вектор х0, являющийся произвольным частным решением неоднородной системы. Из этого мы выводим прежде всего, что размерность гиперплоскости Н совпадает с размерностью подпространства L. Далее, если г — ранг основной матрицы системы (3), то любой вектору подпространства L можно представить в виде суммы У = *1У{1) + ЪУ{*)+ • • • +*п-гУ{п~г)> где у1}, у2), . . . , у(п~г) — базисные векторы подпространства L (фундаментальная система решений). Следовательно, любой вектор х гиперплоскости Н можно представить в виде суммы х = Хо+У = Хо + а1у{1) + а2у™+...+ап_гу<»-гК Этот результат на языке решений систем (3) и (2) согласуется с принципом, установленным в 3.41: Общее решение неоднородной системы (3) равно сумме любого частного решения этой системы и общего решения соответствующей однородной системы (2). См. задачу 9. § 3.6. Методы вычисления ранга матрицы 3.61. Для практического использования развитых в предыдущих параграфах методов решения систем линейных уравнений необходимо уметь вычислять ранг матрицы и находить ее базисный минор. Очевидно, что определение ранга матрицы,
84 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3-61 данное в 1.92, само по себе не может служить разумным способом практического вычисления ранга; например, в квадратной матрице 5-го порядка можно выделить один минор 5-го порядка, 25 миноров 4-го порядка, 100 миноров 3-го порядка и 100 миноров 2-го порядка; понятно, что если бы мы пожелали найти ранг этой матрицы с помощью прямого вычисления величины всех ее миноров, это была бы весьма трудоемкая задача. В этом пункте будут даны простые способы подсчета ранга матрицы и определения ее базисного минора. Эти способы основаны на изучении некоторых операций со столбцами и строками матрицы, которые не изменяют ее ранга; мы будем называть эти операции элементарными операциями. Поскольку ранг матрицы, как мы уже указывали, не меняется при транспонировании, мы будем определять эти операции только для столбцов матрицы. В связи с этим при доказательствах мы будем использовать геометрическую интерпретацию матрицы с п строками и к столбцами как матрицы из координат некоторой системы k векторов х1} х2у •. . , хк л-мерного пространства R„ и теорему 3.11} согласно которой ранг этой матрицы равен размерности линейной оболочки векторов xv х2} . . . , xk. а. Перестановка столбцов. Пусть в матрице А произвольно переставлены ее столбцы; покажем, что эта операция не изменяет ее ранга. Действительно, размерность линейной оболочки векторов х1У х2> - • • , хк не зависит от того, в каком порядке они записаны; следовательно, и ранг матрицы не зависит от порядка ее столбцов. б. Отбрасывание ненулевого общего множителя элементов данного столбца. Допустим, что речь идет об отбрасывании общего множителя X Ф О у элементов первого столбца матрицы А Эта операция равносильна замене системы векторов Xxv х2} - - - , xk на систему xv х2у . . . , хк\ но очевидно, что размерности линейных оболочек этих систем одинаковы (так как сами линейные оболочки совпадают). Поэтому ранг матрицы А не меняется в результате этой элементарной операции. в. Прибавление к одному столбцу другого столбца с произвольным множителем. Пусть к у-му столбцу матрицы А прибавлен /я-й столбец этой же матрицы, умноженный на число X. Это означает, что система векторов хъ . . . , Хр . . . , хт, . .. , xk заменена на систе-
3.62) § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 85 му #i, • • • , xf+Xxmy ..., хтУ ..., xk. Покажем, что линейные оболочки LY и L2 обеих этих систем совпадают. Действительно, все векторы второй системы входят в линейную оболочку векторов первой системы; поэтому в силу леммы 2.53а L2czL1. С другой стороны, равенство xf = (Xj+Kxm) — Xxm показывает, что вектор Xj входит в линейную оболочку векторов второй системы; так как все остальные векторы первой системы, очевидно, также входят в эту линейную оболочку, то L1c:L2. Отсюда вытекает, что Ll=^L2. Поэтому ранг матрицы А не меняется в результате рассматриваемой элементарной операции. г. Зачеркивание столбца, состоящего из одних нулей. Столбец из одних нулей отвечает нулевому вектору пространства Rn. Очевидно, что от зачеркивания нулевого вектора в системе х1} х2} . . . , xk линейная оболочка L (х1у х2у . . . , xk) не может измениться; вместе с нею не может измениться и ранг матрицы А. д. Зачеркивание столбца, являющегося линейной комбинацией других столбцов. Законность этой элементарной операции была доказана в 3.14. Подчеркнем еще раз, что все предложения, доказанные в а — д для столбцов матрицы Д справедливы также и для ее строк. 3.62. Подсчет ранга матрицы и отыскание базисного минора. Покажем,, как можно подсчитать ранг заданной матрицы А и найти ее базисный минор, используя операции, перечисленные в а — д. Если матрица А состоит из одних нулей, то ее ранг, очевидно, равен нулю. Допустим, что в матрице А имеется элемент, отличный от нуля; тогда, переставляя строки и столбцы, можно перевести этот элемент в левый верхний угол матрицы. Затем, вычитая из каждого столбца первый столбец с некоторым коэффициентом, можно обратить в нуль все остальные элементы первой строки. Больше мы не будем менять элементы первой строки и первого столбца *). Если среди остальных элементов (т. е. не принадлежащих к первой строке или к первому столбцу) нет *) Но, может быть, будем переставлять их.
86 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.62 элементов, отличных от нуля, то ранг матрицы Д очевидно, равен 1. Если среди них имеется элемент, отличный от нуля, то, переставляя строки и столбцы, можно перевести его на пересечение второй строки и второго столбца и, так же как и раньше, обратить в нуль все следующие за ним элементы второй строки; отметим, что указанные операции не затрагивают первой строки и первого столбца. После этого вторую строку и второй столбец мы оставляем в покое. Продолжая таким образом далее, мы приведем матрицу А к одному из следующих двух видов (считая, что количество столбцов матрицы А не больше количества ее строк, чего всегда можно добиться транспонированием): а= ИЛИ о^ С21 1 С31 сп ck + l, 1 1 °nl At" С ) а2 С32 Ck2 Ck + 1, Сп2 04 ^21 СЯ1 ! Ст\ С„1 0 0 а3 CkS 2 Ck + 1, 3 ' СпЗ 0 0 . а2 0 сЯ2 а3 . ст2 Ст?, ' Сп2 СиЗ ' . 0 . 0 . 0 . ak • • С/г + 1, • Cnk .. 0 . . 0 . . 0 . . . 1 • • ал • • Спт 0 .. 0 . . 0 . . 0 . . ,0 .. 0 ... J 0 о 0 0 0 0 причем числа а1У а2, ... отличны от нуля. В первом случае ранг матрицы А1 равен k и базисный ми нар (в преобразованной матрице) стоит в левом верхнем углу; во втором случае ранг матрицы А2 равен т (числу столбцов) и базисный минор (в преобразованной матрице) стоит в первых т строках. Ранг матрицы Ау таким образом, определен; положение базисного минора можно восстановить, если проследить в обратном порядке за всеми операциями, которые производились с матрицей А.
3.62] § 3.6. методы вычисления ранга матрицы 87 Для примера рассмотрим следующую матрицу с пятью столбцами и шестью строками: А —2 —1 0 1 2 6 3 1 —1 — 10 2 — 1 —2 —7 —2 —2 -5 -5 -1 | —2 —1 8 1 -4 —1 3 2 -1 1 — 1 —2 2 1 1 3 0 -1 !—2 —1 1—2 —2 0 -5 6 —2 — 1 8 2 —4 —7 3 —5 —1 — 1 — 1 1 — i 2 1 1 2 6-2—1 _2 —1 0 —5 —1 3 1—18 1 __1 о 2—4 —1 __1 _2—7 3 2 —2 —2 —5 —1 1 Во второй строке матрицы А имеется один нуль; используя общий метод, мы можем получить в ней еще три нуля. Для удобства вначале переставим вторую строку с первой, а затем первый столбец со вторым (чтобы в левом верхнем углу оказался наименьший по абсолютной величине элемент—1). Мы получаем*): А ~ Теперь для получения трех новых нулей в первой строке вычтем из второго, четвертого и пятого столбцов первый столбец с множителями 2, 5 и 1: А~ Далее проще всего добиваться новых нулей в третьей строке; мы вначале переставим ее со второй строкой, затем прибавим к третьему и четвертому столбцам второй со множителями 1 и —3: 0 0 -3 -1 4 3 1-1 2 1 0 -2 1 ~2 0 —3 1 —1 3 2 0 6 — 1 2 —7 —5 0 — 12 3 —4 • 13 9 °11 -3 0 -1 4 3 1 А ~ 1 ~1 1 1 2 1 0 —2 —2 0 1 —3 — 1 3 2 0 — 1 6 2 —7 -5 0 3 — 12 —4 13 9 I 1-1 0 1 1 2 —3 ! о -1 i-2 3 1—2 2 0 0 3 1 -4 -3 0 0 -3 —1 4 3 0 0 —3 — 1 4 3 = АХ. *) Знак - между двумя матрицами означает в данном случае равенство их рангов.
88 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Четвертый и пятый столбцы полученной матрицы А1 пропорциональны третьему, и их можно зачеркнуть. Оставшаяся матрица имеет, очевидно, ранг 3; вместе с ней имеет ранг 3 и исходная матрица А. Базисный минор матрицы Ах расположен в ее первых трех строках и первых трех столбцах. Возвращаясь по цепочке преобразованных матриц к исходной матрице, мы легко можем проверить, что все произведенные преобразования не влияют на абсолютную величину этого минора. Следовательно, и в исходной матрице минор, стоящий в первых трех строках и первых трех столбцах, является базисным. См. задачу 10 *). ЗАДАЧИ 1. Доказать теорему: для того чтобы матрица m-го порядка || а,у | f имела ранг г «^ 1, необходимо и достаточно, чтобы существовали числа аъ ...,ат и blt b2t ..., bm такие, что а,-у=а,-&;- (/, / = 1, 2, ..., т). 2. В я-мерном пространстве Кп взяты k линейно независимых векторов Хц *2, ...,*£. Показать, что линейная оболочка L = = L (*!, *2, •••» *k) определена однозначно, если известны значения всех миноров fc-ro порядка матрицы Л = ||а//)|| из координат векторов хъ *2, ..., xk в некотором базисе ev еъ ..., еп. 3. Показать, что система (2) при k — n имеет решение ci = ^/i» c2=Ai2i ... t cn = Ain (Ki</z), где Aik—алгебраическое дополнение элемента a[k (i фиксировано), если ранг матрицы А меньше п. Примечание. Это обстоятельство позволяет легко строить ненулевые решения системы (2) в случае, когда ранг матрицы системы равен п— 1. 4. Решить систему уравнений *1+ *2 + *3 + *4 + *5= 7, 3*! + 2*2+ *з + *4-—3*5 = — 2, х2 +2*з+ 2х4+ 6*5= 23, 5*! + 4*2 + 3*з + 3л:4— *5 = 12. 5. Исследовать решения системы te+ У + 2=1, * + ^/ + г = %, х+ y + Kz = X2 в зависимости от значения X. 6. При каком условии три прямые а^ + б^+^а-О, ctoX-^b2y-{- + с2 = 0, а3х-\-Ь3у-\-с3 = 0 проходят через одну точку? 7. При каком условии п прямых alx-{-b1y-\-cl = 0, й2х + Ь2у-\- + с2 = 0, ..., anx-{-bfly + cn = 0 проходят через одну точку? *) Далее в книге указания на относящиеся непосредственно к тексту задачи уже не делаются.
ЗАДАЧИ 89 8. Написать нормальную фундаментальную систему решений для системы уравнений *1+ *2 + *3+ *4 + *5 = 0, Зхх + 2х2+ *3 + *4 —3*5 = 0, х2 + 2*з + 2*4 + 6*5 = О» 5*! + 4*2 + 3*з + 3*4— *5 = 0- 9. Написать 'общее решение системы задачи 4, используя нормальную фундаментальную систему решений соответствующей однородной системы, найденную в задаче 8. 10. Определить ранг и базисный минор следующих матриц: л= 11. Пусть в матрице Л имеется минор М r-го порядка, отличный от нуля, а всякий минор (г + 1)-го порядка, включающий все элементы минора М, равен нулю. Доказать, что тогда ранг матрицы А равен числу г. 12. Построить матрицу 1 —2 2 —1 —2 -5 6 0 — 1 —1 3 1 8 -1 1 — 1 0 —4 2 — 1 — 1 —2 | -2 -2 3 —1 —7 —5 2 1 ;• А*А 10 10 0 110 0 0 0 110 0 0 0 1 10 0 10 11 А = |Дц а12 1 Q21 °22 013 023 с заданными значениями миноров ап а12 а21 а22 =р, ! 0ц Qi3 021 ^23 = Q. 13. Для квадратной системы уравнений п 2 k = ] ajkxk-- 1 = bj (/ = l, . 012 013 fl22 023 ... n) R. (9) доказать «альтернативу Фредгольма»: или система (9) имеет решение, притом единственное, для любых bv ..., bn, или однородная система 2 0/Л 0 (/=1, ...,л) имеет ненулевое решение. 14. Доказать, что система уравнений 0ii*i+• Лплп = Ьи °/*+1, 1*1+ ••• +0/1 + 1, л*л =^/1+1
90 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ при условии ап ... а1п . а, 7^0 разрешима тогда и только тогда, когда . fli bi = 0. ап\ • •• апп °п а/; + 1, 1 • • • ап + 1, п bn+i 15. (Задача об исключении неизвестных.) Доказать, что содержащая параметры уъ ..., yk система .Y, 4- . . . + 0„ f t n Xn = bn 4. г l IJ] + . . . + &/l+ lf д, [Jk ~T Cw + 1 tf/z + l, 1 -M при условии -/о A«/z I разрешима тогда и только тогда, когда параметры yv ..., у^ удовлетворяют уравнению Ух bi • (*пп bnl + ---+УМ «11 • • • «i,i . . . О, 1ЛМ а« + 1. 1 • • • аи + 1. п Ьп+1. 1 '//+1, 1 ... а Лк 'nk nil, п ип + 1, k + Oil + .. . fli . о, fl«rl, 1 • • • an + l. П CH + l
ГЛАВА 4 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА В общем курсе математического анализа изучаются функции одного или нескольких вещественных переменных. В случае функции, например, трех вещественных переменных можно говорить о функции, аргументом которой является вектор пространства V3. Мы будем здесь изучать функции, аргументом которых будет вектор произвольного линейного пространства. При этом мы ограничимся пока простейшими типами таких функций, а именно, линейными функциями. Мы будем рассматривать линейные числовые функции векторного аргумента, т. е. функции, значения которых суть числа, и линейные векторные функции векторного аргумента, значения которых суть векторы. Векторные линейные функции, называемые иначе линейными операторами, имеют важное значение в линейной алгебре и ее приложениях. §4.1. Линейные формы 4.11. Числовая функция L (х) векторного аргумента ху определенная на линейном пространстве К над числовым полем /С, называется линейной формой^ если она удовлетворяет следующим условиям: а) L (х-\-у) — L (x)-\-L(y) для любых х, у £К; б) L (ax) = aL (х) для любого х £К и любого а£К. Иначе говоря, линейная форма L(x) есть морфизм линейного пространства К в одномерное пространство К1 = К. (2.71). Из условий а) — б) по индукции легко получить формулу £-(ai*i+a2*2+ ... + akxk) = = a1L(x1)-\-a2L(x2)+ . . . +akL(xk), (1)
92 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.12 справедливую для любых xv x2, . ..,л:л€К и любых чисел а1у а2, .. ., ak из К. 4.12. Примеры. а. Пусть в /г-мерном пространстве К выбран базис, так что каждый вектор х £ К может быть задан своими координатами £х, £2, ...,£„. Тогда Ь(х) = £,г (первая координата) есть, очевидно, линейная форма от х. б. Более общей линейной формой в том же пространстве является выражение с произвольно фиксированными коэффициентами 1А, /2, . . ., 1п. в. В пространстве К (а, Ь) (где К есть R или С) примером линейной формы является выражение L(x)=x(tQ), где /0 — фиксированная точка отрезка а^!/^#. г. В том же пространстве можно рассматривать линейную форму вида ь L (x) = [l(t)x{t)dt, а где / (/)— фиксированная непрерывная функция. д. В пространстве V3 скалярное произведение (х, х0) вектора х с фиксированным вектором #0g Учесть линейна-я форма от х. Линейные формы, заданные в бесконечномерных пространствах, обычно называют линейными функционалами. 4.13. Найдем общий вид линейной формы L (х) в л-мер- ном линейном пространстве К„. Пусть ег, е2, ...,еп — произвольный базис пространства К„. Обозначим число L (ek) п через lk (k = 1, 2, . .., п). Тогда для любого х = 2 lkek B СИЛУ формулы (1) /(*) = /(£ tkek)= 2 £*/(«*) = 2 Iklk* \k=i J k=\ k=\
4.15] §4.1. ЛИНЕЙНЫЕ ФОРМЫ 93 т. е. значения линейной формы f(x) линейно выражаются через координаты вектора х с фиксированными коэффициентами /1? /2, . . ., 1п. Таким образом, в примере 4.126 мы имели самый общий вид линейной формы в /z-мерном пространстве. 4.14. В комплексном линейном пространстве С рассматривают еще один вид линейной формы, называемый линейной формой 2-го рода. Линейная форма, определенная в 4.11, называется в этом случае формой 1-го рода. Числовая функция L (х) аргумента х, определенного на комплексном линейном пространстве С, называется линейной формой 2-го рода, если она удовлетворяет следующим условиям: а) L (x+y) = L (x) + L (у) для любых х,у£С; б) L (ах) = a L (х) для любого х g С и любого комплексного числа a = a1 + *ot2; число a = ax — la2 есть здесь комплексно сопряженное к числу а. Формула, аналогичная (1), в случае формы 2-го рода имеет вид L(a1x1+ ... + akxk) = a1L(x1)+... + akL(xk) (2) для любых хх, . .., xk из С и любых комплексных ах,. . ., ад. 4.15. Примером линейной формы 2-го рода в /z-мерном комплексном пространстве Сп с базисом е1У ...,£„ служит функция п L (х) = 2 lk 1» k=\ где /х, . . ., ln — произвольно фиксированные комплексные числа, а £х, . . ., \п— координаты вектора х в базисе ег, . . ., еп. Покажем, что эта формула дает общий вид линейной формы 2-го рода на пространстве Сп. Пусть L (х) — произвольная линейная форма 2-го рода; положим 1г —L (г1), . . ., /л = L (еп). Тогда для любого х g Cn по формуле (2) что и требуется.
94 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.21 § 4.2. Линейные операторы и их матричная запись 4.21. Линейная форма L(x), определенная в линейном пространстве К, как мы указывали, является морфизмом пространства К в одномерное пространство Kv Рассмотрим теперь морфизм А — А (х) линейного пространства X в любое линейное пространство Y над тем же самым полем К. Будем писать иногда короче: Ах вместо А (х). Согласно определению, функции А (х) удовлетворяет условиям: а) А {х -\-у) = Ал* -- ку для любых х и у из X; б) к(ах)--акх для любого х g X и любого числа а. Как и для линейных форм, из условий а), б) следует более общая формула в) А (аххх -j- • • • + oikxk) = alkxl --...-}- ockkxk для любых хъ . . ., хк из X и любых ctj, . . ., ак из К. Морфизм А называют также, как отмечено в 2.71, ли*, нейным оператором, действующим из X в Y. 4.22. Пример ы. а. Оператор, который каждому вектору х пространства X ставит в соответствие нуль-вектор пространства Y, является, очевидно, линейным оператором. Он называется нулевым оператором. б. Пусть имеется некоторый линейный оператор А, действующий из пространства X в пространство Y. Положим по определению Вх -——Ал*. Полученный оператор В, как легко видеть, также является линейным оператором, переводящим X в Y; он называется оператором, противоположным оператору А. в. Пусть векторам базиса е1у ...уеи пространства X произвольно поставлены в соответствие векторы Д,...,/„ пространства Y. Тогда существует и единствен линейный оператор А, переводящий X в Y и при этом каждый вектор ek переводящий в соответствующий вектор fk(k^\, . . ., п). Действительно, если искомый оператор А существует, то п для любого вектора х = У %кек £ X выполняется равенство А* = А ( 2 1кек) - 2 lkhek = 2 "V*.
4.23] § 4.2. линейные операторы и их матричная запись 95 чем доказана единственность оператора А. С другой сто- п роны, для любого х= 2 \иек € X мы можем положить по определению п k=\ Получающийся при этом оператор А, как легко проверить, является линейным оператором, переводящим X в Y и при этом переводящим каждый вектор ek в соответствующий вектор fk{k~\, . . ., /г), что нам и требуется. г. Поставим в соответствие каждому вектору х пространства X этот же вектор х. Мы получим линейный оператор И, действующий из X в X. Этот оператор называется тождественным, или единичным, оператором. 4.23. Матричная запись линейных операторов. Пусть А есть линейный оператор, действующий из пространства X размерности п в пространство Y размерности т. Фиксируем в пространстве X базис еъ ..., еп и в пространстве Y базис /\, . . . ,//л. Вектор ех переводится оператором А в некоторый вектор кех пространства Y, который, как всякий вектор этого пространства, мы можем разложить по базисным векторам: Аналогично оператор А действует на остальные базисные векторы: Ae2 = aiI>/i + <42)/2+---+«i?)/„, Эти формулы можно записать короче: т Afy=2fl</>/J- (у =1,2, ...,«). (3) Коэффициенты а\]) (/= 1, . . ., т, j— 1, . . ., п) определяют
96 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.23 матрицу из т строк и п столбцов или, короче, /я хл-матрицу А= А <*./> г(1) „(2) аа) а12) (П) которая называется матрицей оператора А в базисах {е\ = = \ег, . . ., еп) и {/} = {/х, . . ., fm). Столбцами этой матрицы служат координаты векторов Аех, Ае2, . . ., Аеп относительно базиса /ь ...,/m. Пусть теперь * = 2 £/*V— произвольный вектор и у=> 3= 1 m = A^=2T)///J выясним, как выражаются координаты т],. /= 1 вектора у через координаты £. вектора х. Мы имеем /71 / П \ П У = .2 Л/Л = А* = A J £/у = 2 S/A, 1=1 \J=1 / J=l л /7i m f n \ = 2£/2«;V,= 2 2«;%-k ■'/ Сравнивая коэффициенты при векторе /,-, находим Л,= 2«<% (1 = 1,2, .... да). (4) ; = В раскрытом виде аПоЛ 42 — а2 bi • I "2 Ъп> (5) Г]И=<1^1 + Й^2+ •••+«„. Следовательно, зная матрицу оператора А в базисе е1у е2у . . ., еПУ можно определить результат применения опера- п тора к любому вектору х = 2 lkek пространства X: координаты, вектора у = Ах линейно выражаются через координаты вектора х по формулам (5). Заметим, что матрица коэффициентов в формулах (5) совпадает с матрицей А{е^)ш
4.24] § 4.2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ II ИХ МАТРИЧНАЯ ЗАПИСЬ 97 Пусть теперь || я^ || *) — произвольная /я хя-матрнца. Если п т х = У] \,е,, мы можем построить вектор у = 2 %Лпо Ф°Рг мулам (5). Легко проверить, что оператор А, задающий этот переход от вектора х к вектору у, является линейным оператором. Построим матрицу оператора А в базисе е1у с2, ..., еп. Вектор ех имеет координаты \х — 1, £2 = ... =$п = 0; в силу формул (5) координатами вектора f1 = Ae1 будут числа а{^\ а£\ . . ., а£\ так что Д = Аег = а^ег + а™е2 + . . . + а<»еп. Аналогично fJ = AeJ=ape1 + ape2+...+a<!>en (у=1, 2, ..., т). Следовательно, матрица оператора А совпадает с исходной матрицей || a(J} \\. Итак, каждая тхп-матрица является матрицей некоторого линейного оператора А, действующего из п-мерного пространства X в m-мерное пространство Y, с фиксированными базисами е1} ..., еп в пространстве X и /х, . . ., fm в пространстве Y. Тем самым между линейными операторами, действующими из пространства X (с фиксированным базисом е1у ...уеп) в пространство Y (с фиксированным базисом /х, . ..,/от), и /wx/z-матрицами, заполненными числами из поля К} устанавливается взаимно однозначное соответствие, осуществляемое с помощью формул (3) или, что то же, (4). Заметим, что оператор А можно было бы восстановить по матрице Л — || яУ> || (и притом однозначно), исходя непосредственно из формул (5). В этих формулах /-й столбец матрицы А представляет собой набор координат вектора /j = Aej. 4.24. Примеры. а. Матрица нулевого оператора (4.22а) в любом базисе пространства X и любом базисе пространства Y, очевидно, состоит из одних нулей. *) Верхний индекс — номер столбца, нижний — номер строки. 4 Г. Е. Шилов
98 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.31 б. Если ]| а{р || есть матрица оператора А, то матрицей противоположного оператора (4.226) является, очевидно, матрица || — а\'} ||. в. Пусть т^п и оператор А переводит векторы базиса е1у ..., еп пространства X в линейно независимые векторы '/г, ...,/„ пространства Y. Дополним векторы /х, ...,/„ до полного базиса пространства Y векторами /„ + 1, . . ., f,;r Тогда матрица оператора А в базисах е примет, очевидно, следующий вид: 1' еп « fv •••> fn т / 1 / п \ / ii о . |(0 1 . 1 \ \ 0 0. joo . 0 0 . . 0 1 • ° • 1 '1 • о) • 0 ; г. В частности, матрица тождественного оператора в базисе ev . . . , еп пространства X, как области он пня, и в том же базисе е области значений, имеет вид И 0 0 1 1» еп пространства 0 0 (4.22г) редсле- X. как (5') ли еди- Матрица Е вида (о') называется тождественной и ничной пх л-матрицей. § 4.3. Действия над линейными операторами Мы рассмотрим зДесь действия сложения операторов, умножения оператора на число и умножения операторов друг на друга. Два оператора А и В, действующих из пространства X в пространство Y, будем считать равными (и писать А = В), если Ax=B.v для каждого х£Х. 4.31. Сложение операторов. Пусть даны два линейных оператора А и В, отображающих пространство X
4.32] § 4.3. действия над линейными операторами 99 в пространство Y. Оператор С = A-f В определяется по формуле Слг = (А -г В) х = Ах -f Bx. (6) Очевидно, что С также отображает пространство X в пространство Y. Покажем что С — снова линейный оператор. Пусть х — a,1x1Jra2x2; тогда С (аххг -у- а2х») = А (а1х1 + а2лг2) -|- В (а1х1 + а2х2) = = ах Ajq -— а2Ал:2 -}- с^Вл^ + а2Вл;2 = = ах (Ахг -г Вхг) -f а2 (Ал:2 -f Вл:2) = 0^0^ -f- а2Сл;2. Таким образом, оба условия 4.21а)—б) выполнены. Линейный оператор С, определенный равенством (6), называется суммой операторов А и В. Легко проверить следующие равенства: A-f В = В + А, (А + В)+С = А + (В + С), A-f 0 = А, A-f (—А) = 0. Здесь А, В, С — произвольные линейные операторы, 0 — нулевой оператор (4.22 а), — А — оператор, противоположный к оператору А, т. е. переводящий каждый вектор х£Х в Еектор—Ал: (4.22 6). 4.32. Умножениеоператора на число. Если А — линейный оператор, действующий из пространства X в пространство Y, и к— число из поля /С, то оператор В = Я,А, называемый произведением оператора А на число Я, определяется формулой Вх = (КА)х = 'к(Ах). Легко проверить, так же как в 4.31, что построенный оператор является линейным. При этом имеют место соотношения ММ)'=(ЬЛ2)А, ЬА = А, (*,!-!-Х«) А = Х1А-гЛ2А, к (A -\-B) = kA-lrkB. 4* (7) (7';
100 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.33 Соотношения (7) — (7') показывают, что совокупность всех линейных операторов, действующих из линейного пространства X в линейное пространство Y, образует новое линейное пространство. 4.33. Умножение операторов. Если А — линейный оператор, действующий из пространства X в пространство Y, а В — линейный оператор, действующий из пространства Y в пространство Z (все пространства над одним и тем же числовым полем /С), то мы определяем оператор Р = ВА, называемый произведением оператора В на оператор А, как оператор, действующий из пространства X в пространство Z по формуле Р* = (ВА)л; = В(Ал;) (т. е. сначала на вектор х действует оператор А, а затем на результат, лежащий в пространстве Y, действует оператор В). Построенный оператор Р является снова линейным, так как Р (ос^ + о^лгз) = В [A (a1x1Jra2x2)] = В (с^Ал^-г-о^Ал^) = = ахВ Ахх + а2ВАл;2 = о^Рл^ -|- ос2Рл;2. 4.34. Легко проверяются следующие соотношения: а) X (ВА) = (ХВ) А для любых операторов А и В с указанными свойствами и любого Х£К; б) (А + В) С = АС-{-ВС для любых операторов А и В, действующих йз пространства Y в пространство Z, и любого С, действующего из X в Y; в) А (В + С) = АВ + АС для любых операторов В и С, действующих из X в Y, и любого А, действующего из Y в Z; г) (АВ)С=А(ВС) для любых операторов: С — из пространства X в пространство Y, В — из пространства Y в пространство Z, А — из пространства Z в пространство W. Проверим, например, равенство г). В соответствии с принятым нами определением равенства операторов мы должны для любого вектора х£Х доказать равенство [A (BC)]*==[(ABJC]*.
4.42] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ 101 По по самому определению произведения операторов [А (ВС)] х = А [(ВС) х] = А [В (С*)], [(АВ)С]а: = (АВ)(Сл;)> откуда и вытекает требуемое равенство. Справедливость всех остальных равенств проверяется аналогично. § 4.4. Соответствующие действия над матрицами Выясним, как отражаются действия над операторами, описанные в § 4.3, на матрицах этих операторов. 4.41. Сложение операторов. Пусть даны два линейных оператора А и В, отображающих пространство X с базисом ех, . . . , еп в пространство Y с базисом /х, . . . ,fm. Пусть, далее, оператору А в этих базисах соответствует матрица А=\\а(;п\\, а оператору В — матрица fi=||ft^')||; следовательно, т т Kej = 2 а? /,-, Be, = £ #'Л (У = 1, 2, . . . , я). ; I = 1 * = 1 В таком случае т (А + В)еу=А*у + В*у= S (ap + bp)U J J J i=\ откуда следует, что оператору A-j-В соответствует матрица Wa\j) Л-Ь(Р\\. Такая матрица называется суммой матриц \\а(с]'у\\ и \\Ь(1П'\\. Таким образом, сумма А-\-В определена для всяких двух матриц А и В с одинаковым числом строк и с одинаковым числом столбцов. 4.42. Умножение оператора на число. При тех же условиях m Следовательно, оператору Л-А соответствует матрица Цл-арН, получающаяся умножением всех элементов матрицы Ца^Н
102 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ СЕКТОРНОГО АРГУМЕНТА [4.43 на число К. Такая матрица называется произведением матрицы Ия/'Ч! на число X. Поскольку /гахя-матрицы и линейные операторы, действующие из /z-мсрного пространства в /«-мерное, соответствуют друг другу взаимно однозначно (4.23), действия с операторами соответствуют одноименным действиям с матрицами и действия с операторами подчиняются правилам (6)—(7), мы можем сделать вывод, что действия с матрицами также подчиняются правилам (6) — (7), что, впрочем, легко было бы проверить и непосредствен.но. Тем самым мы получаем, что совокупность всех m X п-матриц образует линейное пространство. По самому построению оно изоморфно линейному пространству всех линейных операторов, действующих из л-мер- ного пространства X в /и-мерное пространство Y. 4.43. Умножение операторов. Выберем в пространствах X, Y, Z базисы: в пространстве X — базис ех, . . ., е1:, в пространстве Y — базис Д, . . . ,/т, в пространстве Z — базис gi, . . . , gq. Пусть оператор В, действующий из X в Y, имеет тхл-матрицу ||^у)Ц, так что m B^=S»|/,/i (У =1,...,/!), а оператор А, действующий из Y в Z, имеет <7Х/я-матрицу ||ЯдР||, так что /:=1 Для произведения Р = АВ мы получаем m (АВ)*у=А(Веу) = А £ #>/,■ = J J i=\ m m q q / m \ = 2*W,= 2 bf 2 ei"^= 2 ( 2 af b<J>)gk. Следовательно, элементы p(^ матрицы Р оператора Р = АВ имеют вид m P& = 2 4" W> (j=\,2,...,n;k=\,...,q). (8)
4.44] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ 103 Это и есть интересующий нас результат. Его можно выразить так: элемент матрицы Р, стоящий на пересечении ее k-u строки и j-го столбца, равен сумме произведений всех элементов k-й строки матрицы А на соответствующие элементы j-го столбца матрицы В. Матрица Р=\\р{^\\, которая получается из матриц \\а^]\\ и \\Ь1!)\\ по формуле (8), называется произведением первой из этих матриц на вторую. Заметим, что число столбцов первой матрицы должно быть равно числу строк второй матрицы, иначе произведение матриц не будет иметь смысла. При выполнении этого условия матрица-произведение имеет столько строк, сколько их имеется у первой матрицы, и столько столбцов, сколько их имеется у второй матрицы. Более выразительна mxn-заиисъ: произведение ^х/-матрицы А на /яхл-матрицу В определено, если /=/и, и в этом случае произведение АВ есть #х л-матрица. Оба произведения АВ и ВА определены, если l — m,q — n\ в этом случае АВ есть квадратная пхл-матрица, а ВА есть также квадратная mx/я-матрица. Если, наконец, п = m=p = q, т. е, обе матрицы А и В суть квадратные п хл-матрицы, то АВ и ВА — также квадратные п хя-матрицы. Однако они не обязаны быть равными. Например, 10 111 |l Of 111 О1 И 0 0 = 0 0 1 0 J 11 0| |о о] 1° Ml 1 0 1|| |0 0| Таким образом, умножение квадратных матриц, вообще говоря, некоммутативно. Что касается сочетательного и распределительного законов, то здесь положение более благополучное: умножение операторов, как мы видели в 4.34, подчиняется сочетательному и распределительным законам; поскольку матрицы и операторы находятся во взаимно однозначном соответствии и умножение матриц соответствует умножению операторов, мы можем сделать вывод, что сочетательный и распределительные законы удовлетворяются также и для умножения матриц. 4.44. Примеры. В следующих примерах индексы элементов матриц пишутся внизу, так что элемент ajk матрицы Л=||ЯуЛ|| стоит на пересечении ее j-Pi строки и /е-го столбца. Формула
104 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.44 умножения Р=АВ [см. 4.43 (8)] в этих обозначениях принимает вид т / = i а. Умножим /ихя-матрицу Л=||яу.л|| слева на тхт-мат- ри-цу 5Г5=||^уЛ||, в которой все элементы bjk равны 0, кроме одного элемента brs, равного 1. По общему правилу (8) мы получим /яхл-матрицу (s) Д.И = И 'rs 1 * ... 1 ... flllfl12 * • • ain fl5l a52 ' • • asn amiam2' ••<*mn\ = (r) 0 0 . .. 0 a5l a82 • . . Ur. **sn | 0 0 . .. 0 так что в г-й строке матрицы BrsA стоят элементы 5-й строки матрицы Л, а остальные элементы матрицы BrsA равны 0. б. Умножим /яхл-матрицу Л = ||ЯуЛ|| справа на лхл-мат- рицу Сд1=\\с-к\\, в которой все элементы с;7г равны 0, кроме одного элемента cqt, равного 1. По общему правилу (8) мы получим /#Хя-матрицу АС gt 12д ' • ат\ • • • amq * * * атп i (?) (t) . .1. . о . о . (О '1<7 0 ... атд ... 0 так что в ^-м столбце матрицы AC t стоят элементы q-ro столбца матрицы А, а остальные элементы матрицы ACqt равны 0.
4.44] § 4.4. соответствующие действия над матрицами 105 в. При тех же Brs, A, Cgt получае: Br,ACqi = (г) 'rs' it) о sq О ... О ... О так что операция BrsACqt приводит к /#Х л-матрице, в которой все элементы равны нулю, кроме стоящего на пересечении г-й строки и /-го столбца, который равен asq. г. На какую /wX/w-матрицу D нужно умножить слева /wx/z-матрицу Л, чтобы матрица DA совпала с матрицей Л, в которой переставлены местами г-я и 5-я строки? Пример а показывает, как получить матрицу, в которой г-я строка есть 5-я строка матрицы Л,— умножением слева на /ях/я-матрицу Brs. Но остальные строки в результате равны 0. Теперь ясно: чтобы получить требуемую матрицу, нужно матрицу А умножить слева на тх/^-матрицу (г) (s). 1 (г) D = Brs + Bsr+2BjV J ^=r (s) . 0 . 1
106 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.51 д. На какую п хя-матрицу G нужно умножить справа т х /z-матрицу А, чтобы матрица AG совпала с матрицей Л, в которой переставлены местами q-Pi и t-Pi столбцы? Аналогично г мы получаем o=cgt + ctq+ 2cftft. Ьфц е. На какую /я X/я-матрицу F нужно умножить слева /ихя-матрицу Л, чтобы получившаяся матрица совпала с матрицей Л, в которой к г-й строке прибавлена s-я строка с коэффициентом А,? После сказанного в а ответ очевиден: F=E-\-'kBrs. ж. На какую лхл-матрицу Н нужно умножить справа /яхя-матрицу Л, чтобы получившаяся матрица совпала с матрицей Л, у которой к ^-му столбцу прибавлен q-Pi столбец с коэффициентом \х? Ответ очевиден: Н = E-\-\iCgt. § 4.5. Дальнейшие свойства умножения матриц 4.51. Умножение матриц, разбитых на блоки, В некоторых случаях бывает удобно разбивать перемножаемые матрицы на блоки и действовать далее с блоками. Предположим, что нам дана /яхл-матрица Л и лхр-мат- рица £, которые разбиты на блоки: А = (т) * 11 21 Л12 Л 22 , В = (п) \ В 11 в 21 В12 в 22 Предположим, что в каждой блок-строке матрицы А столько же блоков, сколько в блок-столбцах матрицы Ву и при этом
4.52] § 4.5. дальнейшие свойства Умножения матриц 107 ширина люборо блока AJk матрицы А совпадает с высотой любого блока Bks матрицы В. Тогда все произведения AJkBks имеют смысл; это — прямоугольные матрицы, размеры которых зависят от индексов у и s, но не зависят от индекса k. Интересующее нас правило умножения матриц состоит в следующем: матрицу АВ можно составить из блоков, построенных из блоков матриц А и В так же, как элементы матрицы АВ составляются из элементов матриц А и В: \AnBll + AliBn+... Л Я J- |/i21 пп ... АпВ12+ ... . . . 1 ' ' ' Действительно, пусть / — номер блок-строки матрицы А, содержащей k-ю строку самой матрицы А, и у—номер блок-столбца матрицы В, содержащего </-й столбец матрицы В. По общему правилу 4.43 элементы матрицы Р = АВ имеют вид Pkq=ak\blq + '•• +aknhng = = (G*i<4+ ••• +<*kpbpq)+ ... +(akrbrg+ ... +aknbng)t где скобки расставлены в соответствии с шириной блоков матрицы А (и высотой блоков матрицы В). Будем нумеровать строки и столбцы блоков теми же номерами, что и в самой матрице А. В первой скобке стоит элемент, стоящий на пересечении k-й строки и q-\o столбца блока AilB1J-, во второй скобке — элемент, стоящий на пересечении k-Pi строки и q-ro столбца блока Ai2By, и т. д.; в результате получается элемент, стоящий на пересечении &-й строки и q-vo столбца блока АпВу+ ... -\-AirBr-, что и утверждалось. 4.52. Умножение квази дна тональных матриц. Матрица называется квазидиагональной, если она
108 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.52 имеет вид А = 41 L22 причем необозначенные блоки состоят из нулей. Предположим, что блок Akk представляет собой mk х/^-матрицу (4=1, ..., s). Рассмотрим квазидиагональную матрицу 8 = В 11 В 22 у которой блок Bkk представляет собой /^Х/^-матрицу (k = \, ... , s). Матрицы А и В можно перем-ножить по правилу 4.51, которое в данном случае немедленно приводит к результату ^iAi АВ A R \£ss (9)
4.54] § 4.5. ДАЛЬНЕЙШИЕ СВОЙСТВА УМНОЖЕНИЯ МАТРИЦ 109 Таким образом, в данном случае матрица АВ снова есть квазидиагональная матрица, причем блок AkkBkk имеет mk строк и pk столбцов. 4.53. Произведение транспонированных матриц. Пусть дана /яхл-матрица А = \\a.-k\\. Транспонированной по отношению к А называется пх/я-матрица A' =||^pg|[", для которой а'ря=адр (/> = 1, . . . , л; q = 1, . . • , m). Пусть А есть /яхл-матрица и В есть п хр-матрица, так что произведение Р = АВ определено и является тхр-мат- рицей. Определено и произведение транспонированных матриц В'А', которое представляет собой /?х/«-матрицу. Покажем, что справедлива формула В'А' = (АВ)'. (10) Для доказательства обозначим элементы матриц А, В, Р = = АВ, А\ В', Р' соответственно через о,,.-, b;-, /?,у, a}}- = :==ajh Ь'ц — Ъ^, Pij=Pji. Равенство (8), определяющее элементы pik, мы можем переписать в виде п п п Pik=Pki= 2 aijbjk= 2 Я/**л/= 2 b'kia)i. / = 1 / = 1 /=.1 Суммирование проводится по индексу у при фиксированных индексах / и k. Фиксированные индексы указывают, что для образования элемента ры в матрице В' используется k-я строка, а в матрице А'—/-й столбец. В результате образования суммы произведений соответствующих элементов получается элемент p'kh лежащий на пересечении &-й строки и /-го столбца матрицы Р'. Но по определению произведения матриц это и означает, что матрица Р' есть произведение матрицы В' на матрицу А'. Тем самым равенство (10) доказано. 4.54. Миноры произведения двух матриц. Пусть даны /ихл-матрица Л = ||ау7г|| и лхр-матрица £ = ||&у7г||; построим /wxp-матрицу p = AB = ^p-k\\. Фиксируем в матрице Р строки с номерами ах ^ . . . ^ak и столбцы с номерами Pi^...^P* (k^m; k^p) и поставим себе
110 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.54 целью вычислить минор М = Af^[ [ [ [ ^';. (АВ), построенный на фиксированных строках и столбцах: л*з::::::йия) = я«,Ар, + • • • -Т-Я^л&лр» • • • Яа, Ар/, -f . . . -frt^Aft,, ^/.■APi + * * * + UQLknbn$x • • • #«;,-АР/ + a<xknbn$i; Для вычисления используем линейное свойство определителя (1.44). Столбец минора Ж с номером v является суммой к «элементарных» столбцов с элементами вида До^Ар (r#e индексы столбца / и v фиксированы, индекс строки у изменяется от 1 до к). Поэтому весь минор М равен сумме кк «элементарных» определителей, составленных только из «элементарных» столбцов. В каждом из элементарных столбцов множитель Ь-,л вдоль столбца не V меняется и его можно вывести за знак «элементарного» определителя. После этого каждым из «элементарных» определителей принимает следующий вид: */iPA.P.- • А.Р/ ... а, ■OL2ii: &OL};ix ^a/-/2 • • • aaf.ik (12) где /1? ... , ik — некоторые числа от 1 до п. Если среди этих чисел есть одинаковые, то соответствующий элементарный определитель равен 0. Между прочим, так всегда будет, если п < к. Поэтому если в матрице АВ есть вообще миноры порядка k > п, то все они равны 0. Возвращаясь к случаю k^.n, мы видим, что следует рассматривать лишь такие элементарные определители, для которых все индексы /х, . . . , ik различны. В этом случае определитель ^i'/; at, Щ: . а «2*/с -a/f«k
4.54J § 4.5. дальнейшие свойства умножения матриц 111 с точностью до знака совпадает с минором ^7tV °/V. " •" ' 7л" » где A^A^S • • • ^Л СУТЬ индексы /15 . . ., ik, переставленные в порядке возрастания. Выясним, какой именно знак нужно поставить перед минором А1^\\' \ \ \ \ °^, чтобы получить в точности минор AtfW ;;; ;^ . Для этого будем последовательно переставлять в миноре Ж*1; \t \ \\ \ ?£ соседние столбцы с тем, чтобы в результате получить их нормальное расположение (т. е. совпадающее с расположением столбцов в самой матрице А). При каждой перестапозке двух соседних столбцов минор Ж*1/"*; ;;; ; ?п" изменит знак; с другой стороны, при этом число «беспорядков» в перестановке индексов /х, /2, . . . , in изменится на единицу. Так как в окончательном расположении столбцов нижние индексы идут в натуральном порядке, без ((беспорядков», то число последовательных перемен знака равно числу «беспорядков:, в перестановке индексов /х, /2, ..., /„*). Обозначим это число через N(i). Тогда выражение (12) приобретает следующий вид: (-i)'V(,',*«lPA-p, • • • bh3Ml:::.\t W- (Щ Чтобы получить величину М, мы должны сложить все выражения вида (13). Будем сначала складывать выражения с одним и тем же набором ix < . . . < ik, так что числа /х, . . . , ik представляют некоторую перестановку в этом наборе. При этом общий множитель М"у '.'.'.', ?* (Л) можно вынести за скобки. В скобках остается величина 2(-,)л,(0^рЛ.р. •■■*«•*»*. которая, очевидно, есть минор Ml$[t \\\ \ \fl: (В). Окончательно мы получаем формулу Mrt:::; ft (АВ) = 2<-/ ;::; ?* (АЩ\, ;:;; & (В). (14) Суммирование производится здесь по всем наборам номеров h < i-i < • - • < hi причем сами эти числа могут изменяться . *) Предполагается, что при каждой перестановке индексов меньший индекс становится впереди большего и тем самым число беспорядков уменьшается ровно па единицу.
112 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА (4.61 от 1 до п. Общее число слагаемых в этой сумме равно п k\(n — k)\ ' Сформулируем результат в виде теоремы. Теорема. Каждый минор k-го порядка матрицы АВ может быть выражен через миноры того же порядка матриц А и В по формуле (14). § 4.6. Область значений и нуль-многообразие линейного оператора 4.61. Пусть дан линейный оператор А, действующий из линейного пространства X в линейное пространство Y. Мы используем здесь обозначение 2.71 А: X—>Y. Пусть п — размерность пространства X, a m — размерность пространства Y. Выберем произвольно базис ех, . . . , еп в пространстве X и базис Д, . . . , fm в пространстве Y. Тогда оператору А можно поставить в соответствие по правилу 4.23 /яХл-матрицу А = || а^ || , / = = 1, . . . , m, j— 1, . . . , п. Обозначим через Т (А) область значений оператора А, т. е. совокупность всех векторов у = Ах, х£Х. Поставим задачу: вычислить по матрице А размерность подпространства Т(А). Полагая п мы получаем п у = Ах=% lkkek; k= l следовательно, область значений оператора А совпадает с линейной оболочкой векторов Аех, Ае2, . . . , Аеп. Размерность линейной оболочки L(Ael5 Ae2, ... , Аеп) согласно 2.54в равна максимальному количеству линейно независимых векторов в системе Аеъ Ае2, . . . , Аеп. Мы знаем, что в столбцах матрицы оператора А выписаны координаты векторов Aei относительно базиса {/}; таким образом, вопрос о максимальном количестве линейно независимых векторов в системе Аеу. (у=1, 2, . . . , п) немедленно сводится к вопросу о максимальном количестве линейно независимых столбцов у матрицы оператора А. Но это послед-
4.63] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 113 нее в силу 3.12в равно рангу матрицы оператора А. Итак, размерность области значений линейного оператора А, действующего из n-мерного пространства X в m-мерное пространство Y, равна рангу матрицы оператора А в любом базисе {р.} пространства X и любом базисе {/} пространства Y. Заметим, что выбор базисов в данном случае безразличен: следовательно, ранг матрицы оператора А не зависит от выбора базисов, т. е. зависит только от самого оператора А. В дальнейшем мы будем ранг матрицы оператора А (в любых базисах) называть просто рангом оператора А и обозначать через Гд. 4.62. Теперь обозначим через N (А) нуль-многообразие оператора А, т. е. совокупность всех тех векторов лг£Х, для которых Алг^О. Поставим задачу: по матрице А = || ар \\ оператора А вычислить размерность подпространства N (А). Пусть х = 2 \iei £N (А). Тогда система (5] мает вид а^+а'П*+.••+«„ = О, в?,£1+в(,*,Е2+---+в(.п,5в = 0> прини- (15) Очевидно, что и обратно, всякий вектор х£Х, координаты которого удовлетворяют системе (15), входит в нуль-многообразие оператора А. Таким образом, вопрос о размерности нуль-многообразия оператора А равнозначен вопросу о размерности подпространства решений системы (15). В силу 3.51 размерность лА этого подпространства равна числу п — г, где г — ранг матрицы из коэффициентов системы, или, что то же самое, ранг оператора А; таким образом, пА =п — гА. Итак, размерность нуль-многообразия оператора А равна дополнению ранга оператора А до размерности пространства X, из которого действует оператор А. 4.63. В частности, если морфизм А: X—► Y есть эпиморфизм, то T(A) = Y и, следовательно, rA—m. Если
114 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.64 морфизм А: X—>Y есть мономорфизм, то N(A) —Ои, следовательно, Га^п. Верны и обратные утверждения. Именно, если ранг матрицы А равен числу т ее строк, то размерность Т(А) совпадает с размерностью всего Y, откуда следует, что T(A) = Y. Поэтому морфизм А есть эпиморфизм тогда и только тогда, когда r\--m. Если ранг матрицы Л равен числу п ее столбцов, то векторы fl~Ael, ... ... , fH — Aen являются линейно независимыми и, следовательно, оператор А является мономорфизмом (2.73в). Поэтому морфизм А есть мономорфизм тогда и только тогда, когда г\ —п. 4.64. Следующее предложение есть обращение результатов 4.61—4.62: Теорема. .Пусть X есть n-мерное пространство, Y — произвольное пространство. Каковы бы ни были подпространства NcX и Тс Y, сумма размерностей которых равна /z, существует линейный оператор А: X—*Y, для которого N (А) - N* Т (А) = Т. Доказательство. Обозначим размерности подпространств N и Т соответственно через k и m — n — k. В подпространстве Т выберем т линейно независимых векторов /l5 /о, . . . , fm. Выберем, далее, произвольный базис ех, *\>, . . . , еп в пространстве X так, чтобы первые k векторов базиса лежали в подпространстве N (2.43). Определим оператор А условиями Ае( -О (/=1, 2, ... , k), \ A*/ + *=/i U-1, 2, ... , /я). / ( } Покажем, что оператор А удовлетворяет поставленным требованиям. Прежде всего, очевидно, что Т (А) есть линейная оболочка векторов //(/ — 1, 2, ..., т) и, следовательно, совпадает с подпространством Т. Затем всякий вектор подпространства N по условию принадлежит к N(A); нам остается показать, что любой вектор пространства N (А) входит в N. Допустим, что для некоторого п х = 2 i^t С-!
4.66] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 115 будет Алс = 0. Используя условия (16), мы получаем О = Ах = A (g^ +...+ l„en) = lk + 1A +...+ %„fa. Поскольку Д, /2, • • • , fm линейно независимы, мы имеем S* + i = •• • =£,,="0. Но тогда ^ = ^it...t^^N, что и утверждалось. 4.65. Следующая теорема о ранге произведения двух матриц вытекает из свойств только что введенных геометрических характеристик. Теорема. Ранг произведения АВ матриц А и В не превосходит ранга каждого из сомножителей. Доказательство. Естественно, мы предполагаем, что число столбцов матрицы А совпадает с числом строк матрицы В, иначе их нельзя было бы перемножить. Пусть А есть /их л-матрица, а В есть п Х/?-матрица. Введем в рассмотрение линейные пространства X, Y, Z с размерностями, соответственно, п, m и р. В пространстве X выберем базис е1ч . . . , еп, в пространстве Y — базис /\, . . . , /т, в пространстве Z — базис gly . . . , g Используя их, можно матрице А поставить в соответствие линейный оператор А: X—*Y, а матрице В — линейный оператор В: Z—>Х. Произведению АВ матриц А и В отвечает линейный оператор АВ: Z—*Y. Область значений оператора АВ в силу самого его определения содержится в области значений оператора А. Поскольку согласно 4.61 размерность области значений любого оператора равна рангу соответствующей матрицы, мы получаем, что ранг произведения двух матриц не превосходит ранга первого множителя. Чтобы доказать, что он не превосходит также и ранга второго множителя, перейдем к транспонированным матрицам; используя 4.53, мы получим ранг АВ = рангу (АВ)' ярангу В'А' Яранга В' = рангу В, что и требуется. 4.66. Ранг произведения двух матриц может быть и меньше, чем ранг каждого из сомножителей. Например, матрицы ]1 0! J0 0 , в = 10 11 0 0
116 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [467 обе имеют ранг, равный единице, а их произведение II О О II ЛНоо| имеет нулевой ранг. Поэтому представляет интерес следующая теорема, дающая оценку ранга произведения двух матриц не сверху, а снизу. Теорема. Пусть А есть mxn-матрица ранга гл и В есть пхр-матрица ранга гв. Тогда ранг mXp-матрицы АВ не меньше гЛ + гв — п. Доказательство. Покажем сначала, что любой оператор А: X —> Y ранга г переводит всякое ^-мерное подпространство Х'сХ в подпространство Y'czY, размерность которого не ниже г — (п — k). Выберем базис ех, е.2, ...,еп> в пространстве X так, чтобы первые k векторов базиса лежали в подпространстве X' (2.43). Координаты векторов Аех, Ае2, ..., Аек, порождающих подпространство Y', в матрице оператора А занимают k первых столбцов. По условию в матрице оператора А имеется г линейно независимых столбцов. Эти столбцы разобьем на две группы: в первую группу отнесем те, которые имеют номера от 1 до k, а во вторую группу — те, которые имеют номера от k-\-\ до п. Численность второй группы не больше п—k\ следовательно, численность первой группы не меньше г — (п — k). Таким образом, подпространство Y' имеет не менее г — (п — k) линейно независимых векторов, что и утверждалось. Пусть теперь А: X —> Y и В: Z —> X — линейные операторы, соответствующие перемножаемым матрицам. Оценка ранга матрицы оператора АВ согласно 4.61 есть оценка размерности области значений этого оператора. Оператор В переводит все пространство Z в подпространство Т(В)сХ размерности гв. По доказанному оператор А переводит подпространство Т (В) в подпространство, размерность которого не ниже гА — (п — rB) = rA-\-rB— п. Таким образом, область значений оператора АВ, а с ней и ранг матрицы АВ, имеют величину не ниже гА-\-гв—п, что и требовалось. 4.67. Следствие. Если одна из перемножаемых матриц, т. е. тхп-матрица А или п Хр-матрица В, имеет ранг, равный п, то ранг произведения равен рангу второй матрицы.
4.68] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 117 Действительно, в этом случае оценки ранга произведения сверху и снизу, полученные в теоремах 4.64 и 4.65, дают одинаковый результат, равный рангу второй матрицы. 4.68. Пусть дан линейный оператор А, переводящий линейное пространство X в линейное пространство Y. Линейный оператор В, переводящий линейное пространство Y в линейное пространство X, называется левым обратным к оператору А, если ВА-Е есть единичный оператор в пространстве X. Оператор А в этом случае называется правым обратным к оператору В. В каком случае оператор А(В) имеет левый (правый) обратный? На этот вопрос отвечает теорема: Теорема. Оператор А: X —► Y имеет левый обратный тогда и только тогда, когда А есть мономорфизм. Оператор В: Y—*Х имеет правый обратный тогда и только тогда, когда В есть эпиморфизм. Доказательство. Пусть А есть мономорфизм и Т (A)cY — его область значений. Каждому у £ Т (А) отвечает х £ X, для которого Ах=у, причем х определяется однозначно по у в силу предположенной мономорфности А. Пусть QcY есть подпространство, дающее в прямой сумме с Т (А) все пространство Y (2.46). Определим оператор В: Y—► X по следующему правилу. Для у £ Т (А) положим By равным тому (единственному) х, для которого Ах~у\ для у £ Q положим В^ = 0; для у=Ух-\-у2, где ^i€T(A), y2 £ Q, положим Ву=Ву1. Оператор В, как легко видеть, линейный, и для каждого х £ X мы имеем ВАл; = л:, так что В есть левый обратный для А. Если А не есть мономорфизм, то существует вектор х £ X, отличный от 0 и такой, что Ад: = 0. Тогда для любого В: Y—*Х мы имеем (BA)j; = B(Aa;) = B(0) = 0> так что левого обратного для оператора А заведомо не существует. Пусть В: Y—>Х есть эпиморфизм и пусть N (В) с Y есть нуль-многообразие оператора В, a QcY в прямой сумме с N(B) дает все пространство Y. Так как Х = B(Y) = B(N(B) + Q) = = B(Q), то отображение В: Q —-* X есть также эпиморфизм и, более того, изоморфизм, так как никакой элемент у £ Q, отличный от 0, не переходит при воздействии оператора В
118 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.69 в нуль. Определим оператор А: X —+ Y по следующему правилу: для любого х £ X вектор Ах есть тот (единственный) вектор у £ Q, для которого tiy = x. Оператор А, очевидно, линеен, и для каждого х £ X мы имеем ВАд: = х, так что А есть правый обратный для В. Если В: Y —*■ X не есть эпиморфизм, то для вектора х £ X, не входящего в Т (В), и любого оператора А: X—>Y мы имеем ВАдг^д:, так что В не имеет правого обратного. Теорема доказана. 4.69а. Мы знаем (4.43), что результатом умножения /zx/w-матрицы Р на т х /z-матрицу А является квадратная /zx/2-матрнца S = PA. Если S — единичная лхл-матрица (4.24г), то матрица Р называется левой обратной для матрицы А. Аналогично результатом умножения /юхл-матрицы А на п X /«-матрицу Q является квадратная m X /«-матрица T=AQ, и если Т—единичная тх/«-матрица, то Q называется правой обратной для матрицы А. б. Используя результаты 4.63, можно сформулировать теорему 4.68 в терминах ранга матрицы. Теорема. Тогда и только тогда некоторая m X п-матри- ца А имеет левую обратную, когда ее ранг равен числу п\ тогда и только тогда она имеет правую обратную, когда ее ранг равен числу т. § 4.7. Линейные операторы, переводящие пространство К„ в себя 4.71. Рассмотрим линейный оператор А, переводящий пространство X в себя (так что в 4.21 следует положить Y = X). Будем называть такой оператор А действующим в пространстве X. Пусть оператор А действует в /z-мерном пространстве X — К„. Выберем в пространстве X базис ег, ..., еп и этот же базис в X используем для построения матрицы операто-
4.72] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 119 ра А. В соответствии с 4.22, матрица Л оператора А строится по формулам п Aek = ^a^eh (17) /=i так что коэффициенты а(У образуют на этот раз квадратную п х/г-матрицу; она называется матрицей оператора А в базисе {е} = \ег, ..., еп}. Мы будем ее иногда обозначать через Л(е). Соответствующая формула для координат вектора у = Ах, у = Ут1^у, *=.2£ чег имеет вид (4.23): / = 1 18) При фиксированном базисе (ev ..., £j={е} получается взаимно однозначное соответствие между всеми линейными операторами, действующими в пространстве К„, и всеми квадратными п хя-матрицами, заполненными элементами из поля К. 4.72. Примеры. а. Оператор, который каждому вектору пространства X ставит в соответствие нуль-вектор, очевидно, является линейным. Он называется нулевым оператором (ср. 4.22а). Матрица нулевого оператора в любом базисе, очевидно, состоит из одних нулей. б. Единичный или тождественный оператор Е, ставящий в соответствие каждому вектору х £ X сам вектор х, мы рассмотрели в 4.22г. Матрица единичного оператора имеет вид (4.24г) Е = 1 О О О 1 О О 0 1 0 0 0 Такая матрица называется единичной.
120 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.72 в. Оператор А, который переводит каждый вектор х в %х, где К — фиксированное число из поля К, очевидно, линеен; он называется оператором подобия (с коэффициентом подобия X), Аналогично предыдущему матрица оператора подобия в любом базисе имеет вид IU 0 ... О II о а, ... о 0 0 ... к\\ II II г. На евклидовой плоскости V2 векторы можно определять полярными координатами: л; = {ф, р}. Оператор А, переводящий вектор д: = {ф, р} в Ал; = {ф4-фо> р} (Фо — Фик_ сированный угол), является, как легко проверить с помощью чертежа, линейным. Этот оператор называется оператором поворота на угол ф0. Для построения матрицы оператора поворота выберем в плоскости V2 базис из двух единичных взаимно ортогональных векторов ег, е2. Построив чертеж, легко проверим, что вектор ех после поворота на угол ф0 перейдет в вектор созф0 ^1 + з1пф0 £2, а вектор е2—в вектор — sin ф0 £]_-(-созф0 е2. Следовательно, матрица оператора поворота в любом из указанных базисов имеет вид | cos ф0 — sin ф0 || I sin ф0 cos ф0 |" д. Пусть еи е2, ..., еп — некоторый базис в я-мерном п пространстве К„. Поставим в соответствие вектору х = 2 \kek m вектор Рх = y\'E)kek, где m < п. Оператор Р—линейный оператор; он называется оператором проектирования на подпространство Кот, порожденное векторами е1? е2, ..., ет. Для построения матрицы оператора проектирования заметим, что под его воздействием векторы е1? е2, . .., ет переходят в себя, а векторы ет+1, ..., еп — в нуль. Поэтому матрица оператора проектирования в базисе е1? е21 . . ., еп
4.73] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 121 имеет вид m-я строка 1 * ° 0 1 0 0 0 0 0 0 ... 0 0 . ... 0 0 . ...10. ... 0 0 . ...0 0. . 0 1 • ° .. 0 . 0 . 0 е. Пусть еъ е2, ..., еп — базис в /z-мерном пространстве Кл и даны п фиксированных чисел л^, К2, ..., Кп. Определим оператор А для векторов базиса условиями Ае1 = 'к1е1, Ае2 = Х2е2, ..., Аеп — %пеп и для любого другого вектора п п x = y\c,kek, естественно, по линейности условием Ал'^'УА,^^. Полученный оператор называется диагональным относительно базиса еъ . . ., еп или диагонализируемым оператором. Матрица диагонального относительно базиса еъ . . ., еп оператора в этом же самом базисе е1? е2, " Кг 0 ... 0 0 А. о 0 0 ... К Элементы, отличные от нуля, могут находиться в этой матрице только на главной диагонали. Такая матрица называется диагональной; отсюда и название оператора. Заметим, что в другом базисе /1? . .., /„ матрица оператора, диагонального относительно базиса е1? ..., еп1 уже не будет, вообще говоря, диагональной. 4.73а. Линейные операторы, действующие в пространстве X, можно по общим правилам 4.3 J—4.32 складывать друг с другом и умножать на числа, причем снова получаются линейные операторы, действующие в X. Равенства (7) и (7') показывают, что при введенных там операциях сложения и умножения на числа совокупность всех линейных операторов, действующих в пространстве X, сама становится линейным пространством над тем же полем К. Кроме того, для операторов, действующих в простран-
122 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.73 стве X, всегда определена и операция умножения 4.33, в результате которой также получается оператор, действующий в пространстве X. В частности, если В — любой оператор, то (BE) х = В (Ел:) = Вл; = Е (В*), так что ВЕ=ЕВ=В. Определим степени данного оператора А по правилам А1-А, А2=АА, А3 = А2А = (АА) А = А (АА) =-- АА2, •••••• Ам = An_1A = АА""1. При этом имеет место формула km+n = kmkn (/я, /i=l,2, ...), (19) которую легко доказать по индукции. Еще положим по определению А0 = Е (тождественный оператор). Очевидно формула (19) остается справедливой и в том случае, когда один из показателей обращается в нуль. б. Пусть пространство X конечномерно, Х = К„. Фиксируем в пространстве X произвольно базис еъ . .., еп. Тогда каждому линейному оператору А, действующему в пространстве X, можно поставить в соответствие матрицу оператора А в этом базисе. В соответствии с правилами 4.41—4.43 вместе с операторами складываются, умножаются и возводятся в степени и соответствующие им матрицы. В этом случае легко можно найти размерность линейного пространства всех матриц /2-го порядка. Именно, матрицы Ejk, имеющие один-единственный элемент, отличный от нуля, для определенности 1, на пересечении у-й строки и /г-го столбца, очевидно, линейно независимы; с другой стороны, каждая матрица /2-го порядка есть линейная комбинация указанных матриц Ejk. Таким образом, матрицы E-k образуют базис в пространстве всех матриц /2-го порядка. Поскольку число
4.74] § 4.7. операторы, переводящие пространство в себя 123 матриц Ejk равно л2, это число п2 и есть размерность пространства всех матриц /2-го порядка (2.35). Ту же размерность пл имеет, очевидно, и пространство всех линейных операторов, действующих в пространстве К„. 4.74. Примеры. а. Умножение на комплексное число со=а + *Р есть линейное преобразование на плоскости z — л: + iy, которое можно записать с помощью вещественной матрицы 2-го порядка. Из формулы умножения (а+/р) (x-\-ly) = {ax—$y)-\-i ($x-\-ay) следует, что в базисе 1, / соответствующая матрица имеет вид Таким образом, комплексным числам со = а + *Р взаимно однозначно ставятся в соответствие вещественные матрицы со 2-го порядка; нетрудно видеть, что при этом сумме и произведению чисел отвечают сумма и произведение соответствующих матриц. Говорят, что вещественные матрицы со образуют точное представление поля комплексных чисел. б. Обозначим через ВЛ(&^0) оператор «сдвига на k шагов по индексу»; по определению, он переводит каждый базисный вектор ет в базисный вектор етл_к, если т — k > О, и в 0, если т — k^O. Очевидно, В0 = Е, ВЛ-ВГ^ВЛ+Г; в частности, Bi = B^. Матрица оператора Вх имеет вид 10 1 0 ... О || 0 0 1 ... О 0 0 0 ... 1 ||о о о ... оI Матрица оператора Bk имеет вид (k < п) 1° ' 0 . 1° ' |о . ..10.. ..0 1 .. .. 0 0 .. .. 0 0 .. • ° . 1 • о|
124 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.75 4.75. Определитель произведения двух мат- р и ц. Пусть А 7* B = \\bjk,h — две произвольные пхп- матрицы, С = АВ—их произведение. В силу теоремы 4.54, примененной к минору Л4}*---»л (АВ), т. е. к самому опреде- 1 , . . . , П. лителю матрицы АВ, мы получим det AB = det Л- del В. Таким образом, справедлива теорема: Теорема. Определитель произведения двух п X п-матриц равен произведению определителей этих матриц. Существуют и прямые (т. е. не опирающиеся на предложения типа 4.54) доказательства этой теоремы. Вот одно из них. Рассмотрим определитель порядка 2п D = В силу 1.82 определитель D равен произведению определителей матриц Ьц • ь21 . Ьп\ • 0 . 0 . 0 . .. ь1п • • ь2п • • ьпп . 0 . 0 . 0 — 1 0 0 «11 а21 в/11 0 . -1 . 0 . а12 . а22 .. ап2 . .. 0 . 0 ..—1 • • а\п • а2п • а>пп А--= «и \ап1 и В = 'и ... ь1п ьп1 ... ьпп Но можно и другим путем получить величину определителя D. Используя числа —1, стоящие в первых п строках и в последних п столбцах определителя D, можно обратить в нуль все элементы, лежащие в последних п строках и в последних п столбцах определителя D. Для этого нужно к (я+1)-й строке определителя D прибавить первую, умноженную на ап\ затем вторую, умноженную на а12; ... ...; я-ю, умноженную на а1п, далее к (я + 2)-й строке прибавить первую, умноженную на а21, вторую, умноженную на а22, ...; 2я-ю, умноженную на а2п и т. д., пока не дойдем до последней, 2я-й, строки. В результате мы получим D = bn ... bin -1 0 ... 0 b2l ... b2n 0—1 ... 0 bnl ... bnn 0 0 ...-1 bnan + b21a12+ ... +bnlaln ... Ь1пап+...+Ьппа1п 0 0 ... 0 bua21+b2la22+...+bnla2n ... bVla21+ .. .+bnna2n 0 0 ... 0 Ьцап1+Ь21ап2+ .. .+bnlann ... binanl+... + bnnann 0 0 ... 0
4.76) § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 125 откуда по теореме Лапласа 1.81, разлагая определитель D по последним п строкам, мы будем иметь D=(-l) _1\1 + ... + Л -1 0... 01 0-1 ... 0 о о —i | \bnan+... + bnlaln ... blnan+... + bnnaln \bna21 + ... + bnla2n ... blna21+... + bnna2n \bnanl+... + bnlann... blnanl+...+ bnnann nPnn nPnl • • • a2lbln+ • •• +<*2nb nn <*mbii+ ---+annbnl ... anlbln + ...+annbnn = det(i4, B). Сравнивая этот результат с полученным выше значением определителя D, убеждаемся в справедливости теоремы. В частности, отметим, что если обе перемножаемые матрицы Л и В невырождены (т. е. deM=^=0, det£=^0), то и матрица ЛВ невырождена; если хотя бы одна из матриц, например Л, вырождена, det Л = 0, то и detAB=0. Впрочем, это утверждение можно вывести и из 4.67. 4.76. Обратный оператор. В соответствии с определением 4.68 оператор В, действующий в пространстве X, называется левым обратным к оператору А, действующему в том же пространстве X, если ВА = Е. Оператор А в этом случае называется правым обратным к В. а. Возможно, что оператор А имеет много левых обратных и ни одного правого, или наоборот, много правых обратных и ни одного левого (см. задачу 25). Допустим, что оператор А обладает левым обратным Р и правым обратным Q; тогда справедливо равенство Р = РЕ = Р (AQ) = (PA) Q = EQ = Q. (20) Фиксируем Q; мы видим, что любой левый обратный оператор Р совпадает с Q и тем самым определен единственным образом. Точно так же в рассматриваемом случае правый обратный Q также определен единственным образом. Этот оператор P = Q, определенный единственным образом и одновременно и правый, и левый обратный к оператору А, называется обратным оператором к оператору А и обозна-
126 гл. 4. линейные функции векторного аргумента [4.77 чается через А"1. Сам оператор А, обладающий обратным, называется обратимым оператором. б. Рассмотрим случай оператора А в л-мсрном пространстве Х^К„. Пусть А — матрица оператора А в некотором фиксированном базисе еъ . .., еп. Возможно одно из двух: или det/l=7^0, или det^ = 0. В первом случае ранг матрицы А равен п и по 4.696 матрица А обладает и левой обратной матрицей, и правой обратной матрицей. Соответственно и оператор А обладает и левым обратным, и правым обратным. По а оператор А является обратимым оператором. Если же det^=^-0, то по тому же 4.696 матрица А не имеет ни левой, ни правой обратной; так же и соответстт вующий оператор А, действующий в пространстве К„, не имеет ни левого, ни правого обратного. 4.77. Матрица обратного оператора. Пусть А — обратимый оператор в /2-мерном пространстве X и В —А"1 — его обратный оператор. Выберем базису, . . ., еп и обозначим через Ца^Ц vi \Ь{'1-\ матрицы операторов А и В в этом базисе. Найдем явное выражение элементов Ь(!/ через элементы а(/\ Фиксируя номер строки /, последовательно выписываем выражения элементов /-й строки матрицы Е—АВ по формулам (8): ft(})«(i)-r*(?)fl(2)+ • • • +*(7)я(А) = 0, b^a^ + bfa^ + . .'. +b(Ta(!l) = Г, Ь^а^ + Ь{¥а{? +.'..+ Vfa™ = 0. Неизвестные Ь(}\ . . . , b(f определяются из этой системы уравнений по правилу Крамера 1.73, так как по условию (let А Ф0. Разлагая определитель в числителе по у-му столбцу, получаем где A(f — алгебраическое дополнение элемента a{f в матрице А. Итак, элемент Ь(р обратной матрицы равен отношению алгебраического дополнения элемента a(j] исходной матрицы к ее определителю.
4.82] § 4.8. инвариантные подпространства 127 Ми получаем теорему: Теорема. Для всякой невырожденной матрицы А = \\а(Р\\ существует и единственна обратная матрица B = \\bi!i\\, для которой АВ = ВА = Е. Элементы матрицы В вычисляются по формулам (21). 4.78. Оператор, обратный к оператору А, мы обозначили через А""1. Далее, (А-1)* обозначается через A~k. Легко доказать по индукции, что формула (19) распространяется также и на все отрицательные показатели. Аналогичные обозначения применяются для степеней обратной матрицы. Распространение формулы (19) на отрицательные показатели для матриц вытекает непосредственно из справедливости этого распространения для операторов. § 4.8. Инвариантные подпространства 4.81. Пусть в линейном пространстве К задан линейный оператор А. Введем следующее определение. Подпространство К' пространства К называется инвариантным относительно оператора А, если из х £ К' следует AxgK'. В частности, тривиальные подпространства — нулевое, и все пространство — являются инвариантными для всякого линейного оператора; нас будут интересовать, естественно, нетривиальные инвариантные подпространства. 4.82. Рассмотрим с этой точки зрения примеры линейных операторов, указанные в 4.72. а — в. Для операторов в примерах 4.72а — в (нулевой оператор, тождественный оператор и оператор подобия) каждое подпространство является инвариантным. г. Оператор поворота (4.72г) на угол (р0фщтс, m целое— не имеет нетривиальных инвариантных подпространств. д. Оператор проектирования (4.72д) имеет, например, следующие инвариантные подпространства: подпространство m К' из векторов х — 2 $ье*и которые не изменяются, и
128 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.83 п подпространство К" из векторов у= 2 ^>kek> которые k = m+ 1 переходят в нуль. е. Каждое подпространство, порожденное некоторыми из базисных векторов еъ £2, . . . , еп1 является инвариантным для диагонального оператора (4.72е). 4.83. Пусть оператор А имеет в л-мерном пространстве Кп инвариантное /w-мерное подпространство Кт. Выберем базис еъ ... , еп пространства К„ так, чтобы его первые т векторов еъ . . . , ет лежали в подпространстве Кт. Тогда мы будем иметь и, следовательно, матрица оператора А в указанном базисе будет иметь вид < . . 0 . 0 . n(l) n (1) п(т) п(т) \j и m+1 0 п(п) v ит+1 а(1) 1 аШ) • • ип а(п) В первых m столбцах матрицы все элементы (гп-\-\)-и и следующих строк равны 0. Обратно, если матрица оператора А имеет такой вид, то подпространство, определяемое векторами еъ . . . , ет, является инвариантным для оператора А. 4.84. Предположим, что пространство К„ можно представить в виде прямой суммы инвариантных подпространств Е, F, . . . , Н (2.45). Выберем базис пространства Кп так, чтобы векторы elt . . . , ег лежали в Е, Л, • • • , Л » » F> hv . . . , ht » » Н.
4-91) § 4.9. СОБСТВЕННЫЕ ВИКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 129 Тогда матрица оператора А примет квазидиагональный вид Ае А! II I Ah \ Диагональные квадраты матрицы А заполняются элементами a(lk}, b(l\ . . . , c('k} в соответствии с формулами а/у= 2 <л- /5=1 аау=2 4'а*; Jfe=l вне диагональных квадратов в матрице Л всюду стоят нули. Обратно, если матрица оператора А в некотором базисе имеет квазидиагональную структуру, то пространство К„ разлагается в прямую сумму подпространств, порожденных соответствующими группами базисных элементов. § 4.9. Собственные векторы и собственные значения 4.91. Особую роль играют одномерные инвариантные подпространства оператора А; они называются иначе инвариантными, или собственными, направлениями. Всякий (ненулевой) вектор, принадлежащий к одномерному инвариантному направлению оператора А, называется собственным вектором оператора А; иначе говоря, вектор хфО называется собственным вектором оператора А, если оператор А переводит вектор х в коллииеарный ему вектор: Ах = Хх. (22) 5 Г. Е. Шилов
ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4-92 Число Я, фигурирующее в этом равенстве, называется собственным значением [собственным числом) оператора А, соответствующим собственному вектору х. 4.92. Обратимся опять к примерам 4.72. а — в. В примерах 4.72а — в каждый ненулевой вектор пространства есть собственный вектор соответствующего оператора с собственными значениями соответственно 0, 1, X. г. Оператор поворота (4.72г) на угол, не равный /ил с целым ш, не имеет собственных векторов. д. Оператор проектирования (4.72д) имеет собственные m n векторы вида х = 2 \ьеъ. и У~ 2 ^Л с собственными k— I k-m+\ значениями соответственно 1 и 0. Можно проверить, что иных собственных векторов у оператора проектирования нет. е. Диагональный оператор (4.72е) по самому определению имеет собственные векторы ev е2, . . . , еп с собственными значениями соответственно Xv Х2, . . . , Хп. 4.93. Укажем два простых свойства собственных векторов. а. Лемма. Собственные векторы хъ х2, ... , хт оператора А с попарно различными собственными значениями Х1у Я2, ... , Хт линейно независимы. Это утверждение мы докажем индукцией по числу т. Очевидно, что для т=\ лемма верна. Допустим, что лемма верна для всяких т—1 собственных векторов оператора А; покажем, что она продолжает оставаться верной и для всяких т собственных векторов оператора А. Предполагая противное, допустим, что между т собственными векторами оператора А имеется линейная зависимость агхг + ос2л;2 + . .. + ятхт = 0, где, например, ах^=0. Применяя к этому равенству оператор А, получаем а1Х1х1 + а2К2х2 + . . . + ат\тхт = 0. Умножим первое равенство на Хт и вычтем из второго; мы получим «1 (*1 — Хт) Х1 + «2 (*2 — Ю Х2 + • • • •••+a*-i(*«-i —*J*«-i = °.
4.94J § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 131 откуда по индуктивному предположению все коэффициенты должны быть равны нулю. В частности, ах (Ах — Х/я) = 0, что противоречит условиям ахФ®, Хх фХт. Следовательно, наше предположение неверно и векторы хг, х2, . . . , хт линейно независимы. В частности, в n-мерном пространстве линейный оператор А не может иметь более п собственных векторов с различными собственными значениями. б. Лемма. Все собственные векторы линейного оператора А, отвечающие данному собственному значению X, образуют подпространство К(Х) с К • В самом деле, если Ах1 = Кх1 и Ад:2 = Ял:2, то А (ахх + рл:2) = аАл^ -f Р Ал;2 = аКх1 + рАл;2 = X (axL + Рл;2), чем утверждение леммы доказано. Подпространство К(Х) называется собственным подпространством оператора А, отвечающим собственному значению X. 4.94. Мы укажем здесь, как можно вычислить координаты собственных векторов оператора А, заданного своей матрицей в некотором базисе еъ ..., еп пространства К„. Допустим, п что вектор х= 2 \kek есть собственный вектор оператора А, /5=1 так что Ах = Кх с некоторым К. Используя формулы 4.23 (5), мы можем это равенство переписать в координатной форме: 4i = <ti + a?%+■■■ + <%„ •••••••• или аПх +(ei2,-A.)ga+...+ «„ =0, I (23) «i + «* + • • • + «' - M i„ = o. J Эта однородная система уравнений относительно величин £ь £2, . . ., |„ допускает ненулевое решение в том и только 5*
132 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА И-95 в том случае, когда ее определитель равен нулю (3.21): а^ — Х а[2) ... а[п) I а(2и а^ — Х . . . a<m L=o. (24) п(1) />(2) п(П) 1 Многочлен /2-й степени относительно X, стоящий в левой части этого уравнения, называется характеристическим многочленом матрицы Л. Всякому его корню Х0 £ К отвечает собственный вектор, который определяется после подстановки в (23) вместо X величины Х0 путем решения получившейся совместной системы относительно величин gl512, . . ., £м. Полученный результат показывает, между прочим, что хотя матрица оператора А зависит от выбора базиса е1у . . ., сп, но корни характеристического многочлена этой матрицы уже не зависят от выбора базиса. Мы еще вернемся к этому вопросу в 5.53. 4.95. Разберем некоторые возможности, которые могут представиться при решении характеристического уравнения (24). а. Случай отсутствия корней в поле К. Если уравнение А (X) в поле К вовсе не имеет корней, то линейный оператор А не имеет в пространстве К„ собственных векторов. Например, оператор поворота на угол ц>0фтп (т = 0, ±1, ±2, ...) на плоскости ]/2, как мы уже отметили, не имеет собственных векторов. Этот факт, геометрически очевидный, легко устанавливается алгебраически. В самом деле, уравнение (24) для оператора поворота имеет вид I cos ф0 — X — sin ф0 I 0 I sin ф0 cos ф0 — ^| или после раскрытия определителя 1 —2Х cos ф0 -!- >.2 = О, и если у0ф пт(т = 0, ±1, ±2, ...), то это уравнение не имеет вещественных корней. б. Если К=С есть поле комплексных чисел, то в силу основной теоремы алгебры уравнение (24) всегда имеет корень Д(Ь) =
4.95] § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 133 Х0£К. Таким образом, в пространстве Сп всякий линейный оператор имеет (хотя бы один) собственный вектор. в. Случай наличия п различных корней. Если все п корней Хх, Х2, ..., Хп уравнения Л (К)> = 0 лежат в поле К и различны, то мы сможем в пространстве Кп найти п различных собственных векторов оператора А, решая систему (23) последовательно при Х = ХЬ Х2, . . ., Хп. В силу леммы 4.93а собственные векторы /х, /2, ..., fn будут линейно независимы. Примем их за новый базис и построим матрицу оператора А в этом новом базисе. Поскольку А/2 - Ь2/2, А/„ = hfn> матрица A(f) имеет вид !| >-i о ... о || j 0 0 ... i., I Используя определение диагонализируемого оператора (4.72е), мы можем сформулировать полученный результат следующим образом: в пространстве К„ всякий линейный оператор, характеристический многочлен матрицы которого (в каком-либо базисе) имеет п различных корней в поле К, является диагонализируемым; матрица этого оператора, построенная в базисе из его собственных векторов, диагональна, и ее диагональные элементы суть собственные значения оператора. г. С другой стороны, если оператор А в некотором базисе Д, ..., /п пространства К„ имеет диагональную матрицу (25) с произвольными, необязательно различными числами А,1? . . ., Хп на диагонали, то векторы fx, . . ., fn — собственные, а числа %х, ..., Хп — соответствующие собственные значения. Покажем, что у оператора А в этом случае нет иных собственных значений (отличных от чисел XL, ..., Хп). Действительно, если X—собственное значение, отвечающее
134 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.95 собственному вектору /= 2 Р///» то> ВЬ1леляя в равенстве А/= А (| Ру//.) = | Р/.А/} = S f}/Vy = слагаемое по вектору /., мы получаем Щ=Щ (У=1, •••>")• (26) Среди чисел pif ..., р^ есть хотя бы одно отличное от нуля; пусть, например, pj^O. Тогда равенство (26) при j — 1 дает ?ъ — Xl5 что и требуется. д. Случай кратного корня. Пусть X — Х0 — некоторый корень уравнения (24) кратности г^\. Возникает следующий вопрос: какова размерность соответствующего собственного подпространства К(Х°\ или, иными словами, сколько линейно независимых решений допускает система (23) при Х = Х0? Зная ранг матрицы системы, мы бы могли точно ответить на этот вопрос (3.51). Но мы желаем связать этот ответ только с кратностью г корня ^0. В примерах 4.72а—в и е, как легко убедиться, размерность каждого собственного подпространства K(Xq) совпадает с кратностью соответствующего собственного значения Х0 как корня характеристического многочлена оператора А. Однако в общем случае это не так. Рассмотрим оператор А в R2, заданный матрицей А = К о с произвольным [д, =т^0. Характеристический многочлен имеет вид (Х0 — X)2; он имеет двойной корень Х = Х0. Система (23) в данном случае принимает вид 0.^ + 0.^ = 0, li-Sx + O-^O и имеет единственное (с точностью до числового множителя) решение &i = 0, &2=1.
Таким образом, собственное подпространство оператора А, соответствующее собственному значению Х = Х0, имеет размерность 1, меньшую, чем кратность корня Х0. Можно доказать, что в общем случае размерность собственного подпространства K(Xq) не превышает кратности корня Х0 (см. задачу 11 к гл. 5). Полный ответ на вопрос о размерности пространства Кх для случая К—С мы дадим в гл. 6 в результате определения канонической формы матрицы оператора А. ЗАДАЧИ 1. Определив естественным образом сложение линейных форм и умножение линейной формы на вещественное число, построить из линейных форм, определенных на линейном пространстве К, новое линейное пространство К*. Какова размерность пространства К*, если размерность пространства К равна я? 2. Выяснить, какие из следующих векторных функций в пространстве У3 являются линейными операторами: а) Ах = х-\-а (а—фиксированный ненулевой вектор); б) Ах = а\ в) Ах = (а, х)а*)\ г) Ах = (а л') х *)' д) Ах = Ц, Ь + Ез. &}). где х = Ц1, £2, У; е) A^ = (sing1, cos S2» 0)'» ж) A^ = (2g1-g2, Ь + Ез. Ei). 3. Будут ли линейными операторами в пространстве всех многочленов от t а) умножение на t, б) умножение на t2, в) дифференцирование? 4. Составить матрицу оператора А в У3» переводящего векторы *! = ((), 0, 1) в £/! = (2, 3, 5), *2 = (0, 1, 1) в у2 = (\, 0, 0), *з = 0, 1, 1) в и, = (0, 1, -1) в базисе а) е1 = (1, 0, 0), е2 = (0, 1, 0), е3 = (0, 0, 1); б) Xi, А'2, Х3. 5. В трехмерном пространстве обозначим через А оператор поворота на 90° вокруг оси ОХ (от OY к OZ), через В — оператор поворота на 90° вокруг оси OY (от 01 к ОХ), через С—на 90° вокруг *) Здесь (а, х) означает обычные скалярные произведения векторов а и х, т. е. число, равное произведению их длин и косинуса угла между ними.
136 ГЛ. 4. ЛННКЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА оси OZ (от ОХ к OY). Показать, что А4 = В4=С4--Е, АВ ф ВА, А2В2 = В2А2. Имеет ли место равенство АВАВ-=А2В2? 6. В пространстве всех многочленов от t обозначим через А оператор дифференцирования, а через В—оператор умножения на независимое переменное: АР(0 = Я'(0. ВР(0 = *Р(/). Имеет ли место равенство АВ = ВА? Найти оператор АВ—ВА. 7. В предположении, что АВ = ВА, доказать формулы (А + В)2 = А2 + 2АВ + В2, (А + В)3 = А3 + ЗА2В + ЗАВ2 + В3. Как следует изменить эти формулы, когда АВ Ф ВА? 8. В предположении, что АВ — ВА = Е, доказать формулу А'ЛВ — BAm = mAm-1 (m=l, 2, ...). 9. Найти размерность линейного пространства L (К,;, Кт) всех линейных операторов, действующих из /i-мерного пространства Кп в m-мерное пространство К,л, н построить базис пространства L(K„, Km). 10. Найти произведение матрицы Л на матрицу В: 1 2 3'i (1—1 —2 —4 А = 2 4 6 3 6 9 В —2 2 11. Выполнить действие возведения в п-ю степень матриц |j 1 1 jj jj cos ф —sin ф j] II0 1 il |] sin ф cos ф ii 12. Найти все матрицы А 2-го порядка, удовлетворяющие условию Л2 = |;0 о \:0 О 13. а) б) ычислить АВ —ВА, || 1 2 2 Л = ||2 1 2 [12 3 Л = ' где j ;!• Н ii i 2 1 о ; || 1 121 -12 1 и В — \\ | 4 1 1' —4 2 0 1 2 1 * 3 12 3—2 4 -3 5 - -1 14. Сумма диагональных элементов ап-\-... -\-апп матрицы А = !| ajk [называется следом матрицы А и обозначается sp А. Проверить формулы sp (Л + В) = sp A-Y sp Б, sp (АВ) = sp (ВА). 15. Используя задачу 14, доказать, что для операторов А и В, действующих в пространстве К;|, равенство АВ—ВА —Е невозможно.
ЗАДАЧИ 137 Примечай и е. Результат задачи 6 показывает, что в рассматриваемом случае предположение о конечномерности пространства Кп существенно. 16. Для данной- квадратной матрицы С 2-го порядка с spC = 0 (см. задачу 14) найти представление в форме С = АВ — ВА, где А и В — (неизвестные) матрицы 2-го порядка. 17. Пусть в я-мерном пространстве даны т линейно независимых векторов п i-\ и оператор А действует в линейной оболочке L(xlt ..., хт) по формулам У/ = Ах; 2 аЦ\ (/=1. 2, m). Показать, что каждый минор m-го порядка в матрице из координат векторов у J (относительно базиса е1у ег, ..., еп) равен произведению соответствующего минора в матрице из координат векторов х,- на detail. 18. Доказать, что если в матрице А ранга г базисный минор расположен в левом верхнем углу, то отношение любого минора М r-го порядка к минору, находящемуся в тех же столбцах, что и минор Л1, но в первых г строках, зависит только от номеров столбцов минора М. 19. Доказать, что если А — матрица ранга г, то любой определитель 2-го порядка, составленный из миноров r-го порядка матрицы Л, вида M'i\:li\ ':' М ky, kn k, ' t » 2' •' ■ » 7* 1 ' •'' равен нулю. 20. Доказать, что каждый минор k-vo порядка матрицы ABC равен сумме произведен nii некоторых миноров /г-го порядка матриц А, В и" С. 21. Для матриц 1 21] 2 5||' !] V. V, V» - V* • 1 н i Чг хи - -1и -'/■> - 12—3] 0 1 2 0 0 l| V-2 V»j -V* -Vs V» -V2 ■V. 7S найти обратные матрицы,
138 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА 22. Для любой невырожден иной матрицы А доказать равенство (Л')-* = (Л-1)'. 23. Найти все решения уравнения ХА = 0, где А — данная матрица 2-го порядка, X — искомая матрица 2-го порядка, 0— нулевая матрица (матрица, все элементы которой равны нулю). 24. Пусть А = \а{р \ — л юб а я квадратная матрица /z-ro порядка и А\]) — алгебраическое дополнение элемента я{-7) в определителе матрицы А. Матрица Л = ||Л")|| называется присоединенной для матрицы А. Показать, что АА = АА = (det А)-Е. 25. Пусть Р — линейное пространство всех многочленов от аргумента t. Рассмотрим операторы А и В, определенные условиями A [a0 + ait+.. .+antn] = al + a2t+... +ant"-\ В [a0 + ait+... + ant"] = a0t + a1t*-+-... +aHt" + K Показать, что А и В — линейные операторы и что АВ = Е, ВА ф Е. Обладает ли оператор А обратным? 26. Показать, что оператор В в задаче 25 имеет бесконечное число левых обратных. 27. Если А — невырожденный линейный оператор в я-мерном линейном пространстве, то всякое подпространство, инвариантное относительно А, будет инвариантным и относительно А-1. 28. Если линейные операторы А и В перестановочны (т. е. АВ = ВА), то всякое собственное подпространство оператора В является инвариантным подпространством для оператора А. 29. Если прямая сумма (2.45) собственных подпространств оператора А совпадает со всем пространством К и каждое собственное подпространство оператора А является инвариантным для оператора В, то А и В перестановочны. 30. Если х и у — собственные векторы оператора Ас различными собственными значениями, то ах-\-$у(а ^ О, р ф. 0) заведомо не является собственным вектором оператора А. 31. Если каждый вектор пространства К является собственным вектором для оператора А, то А = КЕ (А£/С). 32. Если линейный оператор А перестановочен со всеми линейными операторами, действующими в данном пространстве, то А = ЯЕ. 33. Если линейный оператор А имеет собственный вектор е0 с собственном значением Я.с, то для оператора А2 вектор е0 также является собственным с собственным значением, равным Ко. 34. Если линейный оператор А не имеет собственных векторов, то оператор А2 может их иметь (пример: оператор поворота на 90° в плоскости). Показать, что если оператор А2 в пространстве Rn имеет собственный вектор с неотрицательным собственным значением Я = |л2, то оператор А также имеет собственный вектор.
ЗАДАЧИ 139 35. Найти собственные значения и собственные векторы операторов, заданных следующими матрицами: а) 1| 2 -1 0-1 II0 2 12 —1 0 1 0 1 — 1 0 1 0 —1 3 I || !; б) i ; и Г) — 1 —2 2 0 1 0 0 0 1 ; | 0 0 1—1 — 1 0 1 —1 i 0 0 0 0 0 0 0 1 в) 36. Проверить выполнение следующих фактов: а) соотношение N (A) ZD Т (А) необходимо и достаточно для того, чтобы имело место равенство А2 = 0; б) для любого оператора А имеем N (А) с N (А2) с N (А3) с ...; в) для любого оператора А имеем Т (A) ZD T (A2) ZD T (A3) ZD...; г) если Т (А*) с N (Ат), то Т (А) с N (A"2**-*), T (A" + *-i) с N (А). 37. Показать, что каждый линейный оператор А ранга г может быть представлен в виде суммы г линейных операторов ранга 1. 38. Найти все инвариантные подпространства диагонального оператора с различными диагональными элементами и доказать, что их число равно 2п.
ГЛАВА 5 ПРЕОБРАЗОВАНИЯ КООРДИНАТ Известно, какую большую роль при решении геометрических задач средствами аналитической геометрии играет правильный выбор системы координат. В значительно более обширном круге вопросов, которые открываются в связи с геометрией я-мерного линейного пространства, роль правильного выбора системы координат будет также весьма велика. Эта глава посвящена правилам, по которым совершается преобразование координат в я-мерном линейном пространстве. Результаты, полученные здесь, послужат, в частности, основой для классификации квадратичных форм, которая будет проведена в седьмой главе. §5.1. Формулы перехода к новому базису 5.11. Пусть { е } = { еъ е2, . .., еп } — некоторый базис в л-мерном пространстве Кп и {/} = {Д, /2, . . ., fn } —некоторый другой базис в том же пространстве. Векторы системы {/} однозначно определяются своими разложениями по векторам исходного базиса: Л Prt)el-}rP(l)e2 + f„=PlVe1 + plVe2-{ J- пС1)Р i P n *nJ (i) или, короче, //=2р7Ч- (7=1, 2, ..., п). /=1 В формулах (1) или (2) коэффициенты /;(/} (i, j— l, 2, определяют матрицу (2) р=\\р1Н = Р(Г р? ■ р1Т „(1) „(«) ■ К'
5.13) § 5.1. ФОРМУЛЫ ПЕРЕХОДА К НОВОМУ БАЗИСУ 141 которая называется матрицей перехода от базиса {е} к базису {/}. Как и ранее в аналогичных случаях (§ 4.2 и далее), мы выписываем координаты векторов/• (относительно базиса { е }) в столбцах матрицы Р. Определитель D матрицы Р отличен от нуля; действительно, в противном случае ее столбцы, а с ними и векторы /1? /2, . . ., /„ были бы линейно зависимыми (3.12а). Матрицу с определителем, отличным от нуля, мы уже назвали ранее невырожденной. Таким образом, переход от одного базиса n-мерного пространства К„ к другому базису всегда осуществляется с помощью некоторой невырожденной матрицы. Формулы (1) вместе с матрицей Р задают и соответствующий линейный оператор Р, определяемый из соотношений f- = Рв;(i = 1, 2, ..., п). Он также называется опера- тором перехода от базиса { е} к базису {/}. 5.12. Обратно, пусть ^e} = {ev e2, ..., еп} — заданный базис /z-мерного пространства К„ и Р=\р(?1 — невырожденная матрица порядка п. Построим по формулам (1) систему векторов /]_, /2, . . ., /м. Очевидно, что эти векторы линейно независимы, поскольку столбцы всякой невырожденной матрицы линейно независимы (З.Г2а). Следовательно, векторы /и Л» •••»/« образуют новый базис пространства К„. Итак, всякая невырожденная матрица Р = \\р{^\ определяет по формулам (1) переход от одного базиса n-мерного пространства Кп к другому базису. 5.13. Отметим один частный случай перехода к новому базису: именно, тот, когда каждый из векторов fk совпадает с соответствующим вектором ek, умноженным на некоторое число У^кфО (k=\, 2, ..., п). Формулы (1) принимают вид /i= Vi. /„ = Ке,„
142 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5-21 и матрица Р имеет диагональную форму В частности, при Хг = Х2= . . . = Хп = 1 получаем матрицу тождественного преобразования — единичную матрицу (3) при тождественном преобразовании исходный базис не изменяется. § 5.2. Последовательные преобразования 5.21. Пусть p = \\p(pj— матрица перехода от базиса {е} = {е1, е2, ..., еп) к базису {/} = {/lf /2, ..., /п\ и Q = 1я{)У\\ — матрица перехода от базиса {/} к базису {g\ = = {gi, g2, • • • , gn}- Определим матрицу перехода от базиса {е) непосредственно к базису {g}. Формула перехода от базиса {е} к базису {/} имеет вид (2) /,= 2/>(/Ч- (У=1, 2, .... п) 1=1 и от базиса {/} к базису {g} соответственно Подставляя (4) в (5), получаем (*=1, 2, .... л). (4) (5) (6)
5.31] § 5.3. ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 143 С другой стороны, если Т=[^\ означает искомую матрицу перехода от базиса {е\ к базису {g}, то мы можем написать 4k=%tf*i (*=1.2, -.., п). (7) Сравнивая (6) и (7), мы получаем t<? = %РЧУ)} (I, А=1, 2, ..., п). (8) Полученная формула (8) только обозначениями индексов (но не их ролью) отличается от формулы 4.43 (8). Следовательно, искомая матрица Т есть произведение матрицы Р на матрицу Q. 5.22. Рассмотрим следующий частный случай последовательных преобразований. Систему уравнений (1), поскольку матрица Р не вырождена, можно разрешить относительно векторов ev ..., еп\ получающаяся при этом система равенств вида ^а1тй72т-та, I (9) определяет, очевидно, переход от базиса {/} к базису {е}. Последовательный переход от базиса {е} к базису {/} с помощью матрицы Р и затем от базиса {/} к базису \е} с помощью матрицы Q=||^/')|| есть переход от базиса \е\ к нему же самому, т. е. в конечном счете тождественное преобразование с единичной матрицей; поэтому здесь PQ — E. § 5.3. Преобразование координат вектора при изменении базиса 5.31. Пусть {е} = {е19 е2, . . ., еп) и {/} = {/1>/2> ...,/„}- два базиса в л-мерном линейном пространстве Км. Для любого вектора х £ К„ имеют место разложения ^ = 5Л + 52^2+---+5/,^ = Л1/1+Л2/2+---+Л;,/и. (Ю)
144 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.31 где £15 £2, ..., £„— координаты вектора х относительно базиса {е} и r^, rj2, ..., г\п — его координаты относительно базиса {/}. Поставим задачу вычислить координаты вектора х относительно базиса {/} по известным его координатам относительно базиса {е}. Пусть нам дана матрица Я=||у;0|| перехода от базиса {е\ к базису {/}. Тогда векторы \е\ выражаются через векторы {/} по формулам (9) или, короче, п е /=2^/}Л (7=1. 2, ..., л), (11) k=l где Q^U^II — матрица, обратная к матрице Р. Подставляя формулы (11) в разложение (10), мы получаем п п х = 2 l/ej = 2 4kfk = /=i /\k=\ j k=\ \/ = i V откуда в силу единственности разложения вектора х по базису {/} п Л* = 2 ?i/}£/ (ft=l, 2, ..., л). (12) /=i В раскрытом виде получается система равенств Ли — Чп Ъ1 "Г Уя Ь2 I '"Т 7л 5/z- Таким образом, координаты вектора х относительно базиса {/} линейно выражаются через координаты вектора х относительно базиса {е\; коэффициенты этих линейных выражений образуют матрицу, транспонированную по отношению к матрице перехода от базиса {/} к базису {е} (т. е. транспонированную по отношению к матрице, обратной к матрице Р). Используя обозначение обратной матрицы Р~1 и транспонированной Р', можно записать матрицу S, определяемую соотношениями (12), формулой S = (Р~1)'.
5.33] § 5.3. ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 145 5.32. Имеет место и обратная теорема: Пусть £15 £2, ..., 1п — координаты произвольного вектора х относительно базиса {е\ — {е1, е2, ..., еп) п-мерного пространства К„ и величины г^, г|2, . . ., цп определены посредством равенств Л1 — 5llSl + ^l2b2"i" • • • -TSln$ni TJ2 = ^21bi "Г ^22b2 "Г • • • ~T S2nbn> Цп — Snlbl + Sn2b2 + • • • + Snribm где det || sjk || Ф 0. Тогда в пространстве Kv/ можно найти новый базис {/} — {/*!, /2, ..., /„} таким образом, чтобы числа г]!, г|2, ..., Л,! стала координатами вектора х относительно базиса {/}. Доказательство. Введем матрицу S =\\ sjk || и матрицу Р^=(6")"1, элементы которой обозначим через р(-1\ С помощью матрицы Р построим новый базис по формулам (1). Утверждается, что этот базис и есть искомый. Действительно, составим формулы перехода (12) к координатам вектора х относительно нового базиса. Как мы видели, эти формулы записываются с помощью матрицы (Я-1)'. В данном случае эта матрица совпадает с матрицей S, так как (/>-1)' = ([(5')-1]-1)' = (5')' = 5. Следовательно, величины 1]1, rj2, . . ., цп и координаты вектора х относительно базиса {/} — одни и те же для любого вектора х, что и требовалось. 5.33. Аналогично 5.21 можно построить матрицу последовательного преобразования координат. Пусть £15 £2, ...,£„ — координаты вектора х относительно базиса {е} и величины г|1? г)2, . . ., цп и тх, т2, . . ., %п определены посредством равенств л), Л/= IjPjili / = 1 п ч = 2 яим (7=1, 2, (*=1, 2,
146 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.33 соответственно с невырожденными матрицами Р=||р.. || и Q=i\\qkj [|. Тогда можно выразить величины {т} непосредственно через величины {£} по формулам п п п **=2 2qkjPjili= 2 tkiit (*=i, 2, ..., л), «■ = 1 /=1 « = 1 где величины tki (/, &=1, 2, . . ., /г) образуют матрицу 7\ равную произведению матрицы Q на матрицу Р. § 5.4. Преобразование коэффициентов линейной формы Пусть в пространстве К„ задана линейная форма L (х). Как мы видели в 4.13, когда в пространстве К,, выбран базис {е\ = {е1, е2, . .., еп}, значения формы L (х) можно вычислять по формуле /5=1 где %k(k=\, 2, ..., п) — координаты вектора х относительно базиса {е}, a lk — L(ek) (я—1, 2, ..., п). Коэффициенты lk, очевидно, зависят от выбора базиса {е}. Мы выведем здесь правило, по которому совершается преобразование коэффициентов линейной формы при переходе к новому базису. Допустим, что формулы п /,= 2/>!'Ч- (y=l, 2, ...,п) (13) «=1 определяют переход от базиса {е\ к новому базису {/}. Найдем коэффициенты линейной формы L (х) в базисе {/}. Эти коэффициенты суть числа Xy = L(/y); вычисляя эти числа с помощью формулы (13), находим K-L(ff)=tp(ii)L(ei)=tp'ihlr i=I i=l Таким образом, коэффициенты линейной формы преобразуются так же, как преобразуются базисные векторы.
5.51] § 5.5.ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА 147 § 5.5. Преобразование матрицы линейного оператора 5.51. Пусть дан линейный оператор А в л-мерном пространстве К„. Обозначим через А{е) = || а\!) || матрицу оператора А относительно базиса {е} = {ev e2, . .., еп) и через А/)= II aqp) II его матрицу относительно базиса {/} = = {/i» /2» •••» /«}• Предположим, далее, что формулы перехода от базиса {е} к базису {/} имеют вид п Д=2Р/*'^ (*=», 2, .... л). (Н) /=1 Матрицу перехода ||р(/Л)|| обозначим через Р. Установим связь между матрицами A{e)i A{f) и Р. Матрица Л(/?) = || а\^ \\ определяется из системы равенств Ае~ 2 аФе( (у = 1, 2, ..., л), (15) а матрица Аф — ||oc(/Jm || — из системы равенств А/. = 2 «Г/* («=1, 2, ..., п). Заменим в последней формуле векторы fk их выражениями через векторы е. по формулам (14), изменив индекс суммирования j на /: А/, = 2 аГ 2 Р',4 = 2 ( 2 /f Ч"") <"/• Теперь применим оператор А к обеим частям формулы (14) и используем выражение векторов Аеу- из (15): п п п п /=1 /=1 /=1 /=1 п / п \ *=1 \/=i /
148 гл. 5. преобразования координат [5.52 Сравнивая коэффициенты при et в двух последних разложениях, находим п п к=\ /=1 или в матричной форме РАф = А{е)Р. (16) Это и есть искомая связь между матрицами А{е), A{j) и Р. Умножая обе части слева на матрицу Я"1, получаем выражение матрицы Ацу Аф — Р А{е)Р. 5.52. Используя теорему о произведении определителей (4.75), получаем из (16) следующее соотношение: detPdeM(/) = deM(e)detP или, так как detP=^0, det Л(<?) = det Аф. Итак, определитель матрицы оператора не зависит от выбора базиса в пространстве. Поэтому мы можем говорить об определителе оператора, подразумевая под ним определитель матрицы этого оператора в произвольном базисе. 5.53. Кроме определителя, существуют и другие функции от элементов матрицы оператора, остающиеся неизменными при переходе к новому базису. Чтобы построить такие функции, рассмотрим оператор А — ХЕ, где X— параметр, взятый из поля К. Матрицей этого оператора в базисе {е} является, очевидно, матрица А(е) — ХЕ, а в базисе {/}—■ матрица Аф — ХЕ. По доказанному, при любом X det (А{е) — ХЕ) = del (Аф—\Е). Справа и слева стоят многочлены n-Pi степени от X. Так как эти многочлены совпадают тождественно, то у них коэффициенты при любой степени X должны быть одинаковыми. Эти коэффициенты суть некоторые функции от элементов матрицы оператора, которые, следовательно, остаются неизменными при изменении базиса. Выясним вид этих
$.61] § 5.6. ТЕНЗОРЫ 149 функций. Определитель матрицы А(е) — КЕ имеет вид И])- а<1) аа) -к а[» а\? • — X . , . а[т . . а™ а(п)- -к Коэффициент Дг при Я"-1, как легко вывести из определения определителя, равен (со знаком (—I)""1) сумме диагональных элементов a[v — й? +...+ а^\ это число называется следом оператора А. Коэффициент Д2 при Я""2 есть сумма всех диагональных миноров 2-го порядка*), взятая со знаком (—1)"~2; аналогично коэффициент ДЛ при \n-k есть сумма всех диагональных миноров k-vo порядка, взятая со знаком (—\)n~k. Наконец, коэффициент Дп при К° — свободный член — равен, очевидно, самому определителю оператора. Многочлен det (А(е) — ХЕ), который, как мы доказали, не зависит от выбора базиса в пространстве, называется характеристическим многочленом оператора А. § 5.6*. Тензоры 5.61. Координаты вектора, коэффициенты линейной формы, элементы матрицы линейного оператора являются примерами геометрических величин, называемых тензорами. Прежде чем перейти к соответствующему определению, несколько рационализируем нашу систему обозначений. Векторы базиса /z-мерного пространства К„ будем обозначать, как и раньше, символами еъ е2, ..., еп (с индексами внизу). Координаты векторов х,у, . . . будем обозначать соответственно символами I1, £2, ..., |и; г]1, Г]2, ..., ту1, ... (с индексами вверху). Коэффициенты линейной формы L (х) обозначим lv /2, . . . ,1п (с индексами внизу). Элементы матрицы линейного оператора обозначим через а\\ при этом верхний индекс обозначает номер строки, *) Минор М1^ {•*; ;;;• \к называется диагональным, если ii = j\,
150 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5-61 нижний — номер столбца (в отличие от обозначений, принятых в 4.23). . Целесообразность такого расположения индексов определяется следующим соглашением о суммировании: если имеется сумма п одночленных выражений, причем индекс суммирования / встречается в общем члене суммы два раза—один раз наверху, другой раз внизу,— знак суммы мы будем опускать. Например, разложение вектора х по базису {е1? еъ . . ., еп) после нашего соглашения приобретает вид x = Ve{ (знак суммирования по / опущен, но подразумевается). Выражение линейной формы / (х) через координаты вектора и коэффициенты формы принимает такой вид: f{x) = l,V. Результат применения оператора А к базисному вектору е{ принимает следующий вид: Ае{ = a[ej (подразумевается суммирование по индексу у). Координаты y\J вектора Ад: выражаются через координаты вектора х следующим образом: (подразумевается суммирование по индексу /). Величины, относящиеся к новой системе координат, мы будем обозначать теми же символами, но со штрихами при индексах. Так, новые базисные векторы мы будем обозначать через ех>, е2', . .., еп>, новые координаты вектора х — через I1', £2', ..., Ъ/1' и т. д. Элементы матрицы перехода от базиса ei к базису е^ обозначим через р\,, так что et-=Pli-et (17) (суммирование по индексу /). Коэффициенты матрицы обратного перехода обозначим через gf: ei = ql'er (18)
5.62] § 5.6. ТЕНЗОРЫ 151 (суммирование но /'). Матрица q\' обратна к матрице р[, что можно записать в виде равенства , f 0 при ьф), 111 { 1 при i =j х или равенства f 0 при i ф)\ М = , _. „ i (20) \ 1 при i =j . Для сокращения записи величину, зависящую от индексов / и у так, что она равна нулю при различных значениях индексов и единице при совпадающих значениях индексов, обозначают 6J-; таким образом, равенство (19) можно записать в виде (21) а равенство (20)- -В ?Wi виде Ml =ц, = б{:. (22) 5.62. Чтобы показать преимущества пользования новыми обозначениями, выведем заново формулы преобразования координат4 вектора, коэффициентов линейной формы и элементов матрицы оператора при переходе к новому базису. Пусть х = Ъ)(е1• — \vev. Подставляя вместо величин еи равные им величины ql-er (18), получаем x = ll'qi;ei. = li'ei: Поскольку ег—базис, £'' = #£'• (23) Это и есть формула преобразования координат вектора. Пусть дана линейная форма L (х). Числа 1Г определяются, как обычно, равенствами l., = L(er). Подставляя вместо ег выражение р\,е{ (17), получаем h = L(p\.ei)=p\.L(ei)^piidi. Итак, li>=P\>li\ (24) это и есть интересующая нас формула.
152 гл. 5. преобразования координат [5.63 Наконец, пусть дан оператор А. Элементы его матрицы в новом базисе определяются из равенств Аег - а£ег. Подставив сюда вместо ег (е^) равные им величины Pr^iiP^j) О?), получим Рг^1=4р)'^г Но ке( = a[ej, так что в результате $-<>{*/== al'-P're/. Поскольку е-—базисные векторы, pii.a{ = a{:pir. Чтобы получить отсюда я£, умножим обе части равенства на q)' и по индексу j произведем суммирование. В силу формулы (22) мы получим p\.a\q)' = a}:.p\.q)' - a[.bk^ Согласно определению величины Щ'. при суммировании по у" нужно учесть только одно слагаемое, отвечающее значению / = k'. При этом б**' — 1 и, следовательно, ai:=p',qfai. (25) Это и есть искомая формула. Нетрудно проверить, что все три полученные нами теперь формулы преобразования совпадают с формулами, полученными нами ранее обычным путем (§§ 5.3, 5.4, 5.5). Формулы (23,) (24) и (25) имеют много общего. Прежде всего, эти формулы линейны относительно преобразуемых величин. Далее, коэффициентами этих формул служат или элементы матрицы перехода от старого базиса к новому, или элементы матрицы обратного перехода, или, наконец, и те и другие. 5.63. Теперь можно перейти к определению тензора. Тензоры разделяются на ковариантные, контравириантные и смешанные. Кроме того, каждый тензор имеет определенный ранг. Начнем с определения ковариантного тензора, для определенности, третьего ранга^
5.63] § 5.6. ТЕНЗОРЫ 153 Пусть имеется правило, позволяющее в каждой системе координат л-мерного пространства К,; построить п3 чисел T;jk (составляющих), каждое из которых определяется при придании индексам /, у, k определенных значений от 1 до п. Эти числа Tijk образуют по определению ковари- антный тензор третьего ранга, если преобразование величин Tljk при переходе к новому базису производится по формуле Ti'i'k'=plp[pkk'TiJk. Аналогично определяется ковариантный тензор любого другого ранга: тензор /я-го ранга имеет не п3, а птп составляющих, и в формуле преобразования стоит не три множителя вида pj/, a m таких множителей. Коэффициенты линейной формы, которые преобразуются, как мы видели, по формуле (24), дают пример ковариант- ного тензора первого ранга. Определим теперь контравариантный тензор третьего ранга. Пусть имеется правило, позволяющее в каждой системе координат построить п3 чисел TiJk, каждое из которых определяется при придании индексам /, у, к числовых значений от 1 до /2. Эти числа T'Jk образуют по определению контр авариантный тензор третьего ранга, если преобразование величин TlJk при переходе к новому базису производится по формуле T£'i'k' = tfqj'qkk'TV>', Аналогично определяется контравариантный тензор любого другого ранга. В частности, координаты вектора х образуют контравариантный тензор первого ранга. Введенные нами термины «ковариантный) и (^контравариантный) объясняются очень простым образом. «Ковариантный > означает (изменяющийся так же/, как изменяются базисные векторы, т. е. с использованием коэффициентов р\,. (Контравариантный) означает «изменяющийся в обратном направлении/, т. е. с использованием коэффициентов <#'. Существуют еще и смешанные тензоры. Например, п3 чисел Тф заданные в каждой системе координат, образуют смешанный тензор третьего ранга, два раза ковариантный и один раз контравариантный, если преобразование этих величин при переходе к новому базису производится но
ЗАДАЧИ 155 Здесь по индексу / подразумевается суммирование; в итоге величины Tj~Tjj зависят только от индекса j. В результате свертывания снова получается тензор, ранг которого на две единицы меньше исходного. Проверим это на рассмотренном примере. Мы имеем Здесь при суммировании по индексу k достаточно ограничиться только значением k=i; поскольку 6j'=l, мы получаем Tj, = pirTi£!=p!rT/f что и требовалось. Что получится, если свернуть смешанный тензор второго ранга Т[ по его двум индексам? Величина Т= Т/уже не имеет ни одного индекса, т. е. в каждой системе координат она образует только одно число. Это число — одно и то же в любой системе координат; действительно, т = ?Li>=Mi rj=6<r';=г j = г. Такая числовая величина, не зависящая от системы координат, называется инвариантом. Следовательно, операция свертывания дает возможность получать инварианты тензоров. Например, если тензор а\, соответствующий линейному оператору А, свернуть по его индексам, то полученный инвариант ali будет следом — суммой диагональных элементов матрицы оператора А. Инвариантность этой величины была уже доказана нами другим способом (5.53). Еще пример: матрица с{- произведения двух операторов с матрицами соответственно af и Ь\ есть смешанный тензор второго ранга, который получается при свертывании тензора четвертого ранга afb[ по индексам k и /. ЗАДАЧИ 1. Вектор х £ К,; имеет относительно базиса elt е2, •••, вп координаты аъ £2» •••» £л- Как построить базис в Км, чтобы координаты вектора х относительно этого нового базиса стали равными 1, 0, 0, ... ..., О? 2. В л-мерном пространстве Кп выбран базис elt е.ъ ..., еп. Доказать, что каждое подпространство К' С К„ может быть задано как совокупность всех векторов х £ К„, координаты которых (относи-
156 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ тельно базиса el9 е2, ..., еп) удовлетворяют системе уравнений вида 2 fl//5/ = 0 (i=1, 2, ..., Л). 3. (Продолжение.) Доказать, что каждая гиперплоскость НсК„ может быть задана как совокупность всех векторов .v £ K;|, координаты которых (относительно базиса еъ е2, ..., еп) удовлетворяют системе уравнений вида п 2 aijlj=bi (/=1, 2, ..., Л). 4. На плоскости выбрано три базиса; координаты вектора х относительно каждого из них равны соответственно £1э £2; 1li> Л*; Ti» тг» Дано *h = anli + ai2?2' t! = бц?! -4- 612t2; % = ctnix + fl-22|2; t2 = b2llt -f b22§2; Л = ||а|У||, B = ||ftl7||. Выразить координаты tx, т2 через координаты %, rj2. 5. Для данной линейной формы / (л;) ~ 0 в пространстве К« выбрать базис gv g.2, ..., gn так, чтобы для всякого вектора п х~ V r^g^ имело место равенство 6. Пусть оператор А, действующий в /г-мерном пространстве R, имеет /г-мерное инвариантное подпространство R'. Тогда, считая временно, что оператор А определен только в подпространстве R', мы можем построить для пего характеристический многочлен /г-й степени. Показать, что этот многочлен является делителем характеристического многочлена оператора Л, действующего во всем пространстве R. 7. Пусть X --=- Х() есть /-кратный корень уравнения с1е{||Л((,) — кЕ1\==0. Показать, что размерность т собственного подпространства #(/'о) оператора А, отвечающего корню А,0, не превышает г. 8. Показать, что величины 6/ образуют тензор второго ранга, один раз ковариаитный и один раз контравариантпый. 9. Система величин Sjj определяется в каждой системе координат путем решения системы уравнений T'*Sl7 = 6*, где T'lk — ковариаитный тензор второго ранга, причем det ![ Tik \\ ф 0. Показать, что S,,- — ковариаитный тензор второго ранга. 10. Если /,- и Z' имеют тот же смысл, что и в тексте, какоц геометрический смысл имеет свертка теняора по обоим его индексам?
ГЛАВА 6 КАНОНИЧЕСКАЯ ФОРМА МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА Два оператора А и В, действующие в я-мерном пространстве К„, называются эквивалентными, если существуют такие два базиса в К„, что матрица оператора А в первом базисе совпадает с матрицей оператора В во втором базисе. Очевидно, что эквивалентные операторы определяют в пространстве K,z одинаковые по своим свойствам линейные преобразования. Но как узнать по матрицам операторов А и В в одном и том же базисе, являются ли они эквивалентными? В этой главе для данного линейного оператора А в л-мер- ном пространстве (комплексном или вещественном) мы укажем базис, в котором матрица А оператора А примет <канонический > вид — в некотором смысле наиболее простой из всех возможных. При этом канонический вид может быть получен непосредственно по элементам матрицы оператора А в произвольном базисе. И оказывается, что если операторы А и В эквивалентны, то канонический вид их матриц совпадает. Таким образом, необходимым и достаточным условием эквивалентности операторов является совпадение их канонических матриц. Мы начинаем построение с одного частного класса операторов (§ 6.1); общий случай будет рассмотрен в § 6.3. §6.1. Каноническая форма матрицы нильпотентного оператора 6.11. Линейный оператор В, действующий в я-мерном пространстве K,z, называется нильпотентным, если при некотором натуральном г выполняется равенство W = 0, иначе говоря, если Вгд:---0 при любом лг£К„. Предположим, что В — нилыютентный оператор и Вг = 0; будем считать при
158 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.11 этом, что Вг-1^0, т. е. имеются векторы х £К,п для которых ВГшт1хфО. Назовем высотой вектора х £ К„ наименьшее из чисел т, при которых Втх — 0. Все векторы х £ К„, но нашему предположению, имеют высоту ^г, причем имеются векторы с высотой, равной г. Для любого k^r обозначим через Hfe совокупность всех векторов высоты ^ k. Очевидно, Hfe есть подпространство в К„: если х £ Hk и ,у6Нл, то Влл; = 0, Bky = О, откуда при любых a g К и Р £ /С также В* (ал; 4- Р^у) — 0> так чт0 высота вектора ах + |3у не превосходит /г и ал; + Рз> 6 Hfe. Очевидно, далее, что Hr —K„ и 0 = Н0 ^ Нх ст . . . ^ НГ_Х <^ НГ = К„. Размерности этих пространств обозначим соответственно через т0 = 0 ^ ^я^^. . .^тг = п. Будем строить базис в пространстве Кп следующим образом. Как мы видели, Иг_1 не совпадает со всемК„ = Нг. Поэтому можно найти векторы /\, ..., fPi, лежащие в Нг и линейно независимые над Нг_1 (2.44) (p1 = mr — /«r_i). Векторы B/l5 ..., B/Pi лежат в Hr-1 и линейно независимы над Нг_2: действительно, если бы мы имели \ъ/г + . . . + cPlB/Pi = g£ Hr_2, то, применяя ВГ~2, мы получили бы, что c1B-1/1+...+cPiB-1/Pi^0, или, что то же, Ci/i+...+cPi/p.€H'-\ что по построению не имеет места. Отсюда видно, что размерность тг_1 — /яг_2 пространства Ыг_г над Нг_2 равна или больше размерности тг — тг_1 пространства Нг над Нг_1. Дополним векторы B/l5 . . ., B/Pl векторами fPl + \, •••, fPi в Hr-1 до максимальной системы, линейно независимой над Нг-2 {Р2 = mr-i — mr-2l- Применяя ко всем этим векторам оператор В, получаем векторы в Нг_2 в2Л, .... в%,, в/Р1+1, ..., в/р„ линейно независимые над Нг_3, что доказывается аналогично предыдущему. Отсюда тг_2—тг_3^тг_1 — тг_2, и можно построить в пространстве Нг_2 векторы /P2_|_i, ..., /Рз, образующие вместе с предыдущими полную систему, линейно независимую над Нг_3.
6ЛЗ) § 6.1. ФОРМА НИЛЬПОТЕНТНОГО ОПЕРАТОРА 159 Переходя таким же образом в подпространства Нг_3, . . . ..., Н0 — (0), мы и получаем, в конце концов, полную систему п линейно независимых векторов. 6.12. Полученную систему векторов можно записать в таблицу /i> • • • > Ipx > B/i,...,B /Pt, /Pl+i,..., fPif B-1/!, ...,B-yPi,B-2/Pl+1, ...,B-%2, ... Векторы, стоящие в первой строке таблицы, имеют высоту г, векторы следующей строки — высоту г—1 и т. д.; векторы последней строки имеют высоту 1, т. е. оператором В переводятся в 0. Каждый столбец таблицы определяет инвариантное подпространство оператора В; первые рг инвариантных подпространств имеют размерность г (каждое), следующие Рч—Pi подпространств — размерность г—1 (каждое) и т. д. Последние (одноэлементные) столбцы определяют одномерные инвариантные подпространства. Все пространство К„ есть прямая сумма рг указанных подпространств. 6.13. Напишем матрицу оператора В в подпространстве, определяемом векторами первого столбца. В качестве базиса возьмем векторы Br~1f1, Br~2/Il ..., B/l5 /x; в таком порядке они располагаются по возрастанию высоты. В этой записи первый вектор базиса оператором В переводится в 0, второй — в первый, . .., г-н переводится в (г—1)-й: поэтому матрица оператора В согласно 4.23 содержит по г строк и столбцов и имеет вид 10 10 0 0 1 0 0 0 | 0 0 0 . . . 0 0 1 ..00 . . 0 1 ... о о ||
160 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.14 с отличными от нуля элементами, именно, равными 1, над главной диагональю. Аналогичный вид имеет матрица оператора В в остальных инвариантных подпространствах, соответствующих остальным столбцам таблицы; отличие от матрицы (1) может состоять лишь в числе строк и столбцов. 6.14. Матрица оператора В во всем пространстве К„ будет квазидиагональной (-4.52) с указанными блоками на диагонали: В = 0 10. 00 1. 000 . 000 . ..0 0 ..00 ..0 1 ..00 0 10. 0 0 1. 00 0. 0 0 0. .00 .00 ..0 1 .00 !о 1 0 0 0 •(2) Число блоков размера г равно ръ число блоков размера г—1 равно р2—ръ ..., число блоков размера 2 равно рг_г—рг_2> число блоков размера 1 равно pr—pr_i- Разумеется, если для некоторого j мы имеем pr_J + 1 = pr„j, то в матрице (2) блоков размера j не будет вовсе.
6.21] § 6.2. алгебры; алгебра многочленов 161 § 6.2. Алгебры; алгебра многочленов от одного переменного 6.21. Приведем некоторые определения из теории алгебр. Линейное пространство К над числовым полем К называется алгеброй (точнее, алгеброй над К), если в К установлена операция умножения, приводящая в соответствие каждой паре элементов х, у из К элемент z £ К (обозначаемый Х'у или ху) и удовлетворяющая следующим условиям: 1) а (ху) = (ах) у = х (ау) для любых х и у из К и а £ К\ 2) (xy)z = x(yz) для любых х, у, z из К (ассоциативный закон); 3) (х +у) z = xz+yz для любых х, у, z из К (дистрибутивный закон). Вообще говоря, умножение может не быть коммутативным, так что хуФух. Если умножение коммутативно, т.е. выполнено условие 4) ху=ух для любых х и у из К, то алгебра К называется коммутативной. Пусть 0 есть нуль-вектор пространства К. Тогда для любого х£ К 0-л::=(0 + 0)л: = 0-л;+0.л;, откуда следует, что 0-л; = 0. Элемент е£К называется левой единицей, если ех = х для любого х £ К; правой единицей, если хе = х для любого х £ К; двусторонней единицей, или просто единицей в К, если ех = хе = х для любого х g К. Элемент х £ К называется левым обратным к элементу у £ К, если .эту есть единица алгебры К; в этом случае^ называется правым обратным к х. Если элемент z обладает и левым и правым обратными, то они могут быть лишь единственными и совпадают друг с другом (ср. 4.76а). Элемент z называется в этом случае обратимым, ему обратный обозначается через z'1. Произведение zu обратимого элемента z и обратимого элемента и есть обратимый элемент с обратным u~1z~1. Если элемент и обратим, то уравнение ux — v имеет решение х — u~xv\ поскольку оно получается из самого уравнения 6 Г. Е. Шилов
162 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.22 умножением на и *, оно единственно. В коммутативном случае употребляют запись х = — или x — v\u\ этот элемент называют частным элементов v и и. Для частных справедливы обычные арифметические правила действий: -)—- = -i-^ v—t (если их и и2 обратимы); их ш U2 UiU-2 (если их и */2 обратимы); (если uv u2, v2 обратимы), доказательства которых мы предоставляем читателю. Алгебра К по определению имеет размерность п, если эту размерность п имеет соответствующее линейное пространство К. 6.22. Пример ы. а. В любом линейном пространстве К положим х*у = О для любых х£К, у£ К. Мы получим алгебру. Такая алгебра называется тривиальной. б. Примером нетривиальной коммутативной алгебры над полем К является совокупность П всех многочленов с коэффициентами из К, с обычными операциями сложения и умножения. В этой алгебре есть единица, именно, многочлен е(%), у которого л0--1, а остальные коэффициенты равны 0. р. Линейное пространство L (К„) из всех матриц п-го порядка с элементами из К с обычным матричным умножением дает пример конечномерной некоммутативной алгебры размерности п2 (4.736). Эта алгебра обладает единицей, которой является единичная матрица Е. г. Более общим примером некоммутативной алгебры с единицей является линейное пространство В (К) всех линейных операторов, действующих в линейном пространстве К, с обычным для операторов действием умножения (4.33). 6.23а. Пространство LcK называется подалгеброй алгебры К, если из х £ Ь, .у € L следует xy£L. Подпро-
6-24l § 6.2. алгебры; алгебра многочленов 163 странство Lc К называется правым идеалом в К, если из *€L, у £ К следует ху £ L, и левым идеалом в К, если из *£L, y£K следует yx£L. Идеал, одновременно левый и правый, называется двусторонним идеалом. В коммутативной алгебре нет различия между левыми, правыми и двусторонними идеалами. Во всякой алгебре К. имеются два очевидных двусторонних идеала: один, обозначаемый (0),— состоящий из единственного элемента 0, второй — состоящий из всех элементов х g К. Все остальные идеалы, односторонние и двусторонние, называются собственными идеалами. Всякий идеал есть подалгебра; обратное, вообще говоря, несправедливо. Так, совокупность всех многочленов Р(^), удовлетворяющих условию Р(0) = Р(1), есть подалгебра алгебры П, не являющаяся идеалом. Совокупность всех многочленов Р(Х), удовлетворяющих условию Р (0) — 0, есть собственный идеал в алгебре П. б. Пусть LcK есть подпространство в алгебре К. Рассмотрим фактор-пространство K/L (2.48), т. е. линейное пространство из классов X элементов х £ К, взаимно сравнимых относительно подпространства L. Если L — двусторонний идеал в К, то для классов X £ K/L, кроме линейных операций, можно ввести операцию умножения. Именно, имея классы X и Y, выберем произвольно элементы дг£Х, y£Y и под произведением XY будем понимать класс, содержащий произведение ху. Проверим однозначность этого определения. Если в классе X мы возьмем элемент х', а в классе Y элемент у', то мы будем иметь х'у' — ху = х' (у'—у)-\~ (х' — х)у; этот элемент лежит в идеале L вместе с у'—у и х' — X. Из условий 6.21, 1) — 3), выполненных в алгебре К, немедленно следует выполнение аналогичных условий для классов Х£К/Ь; поэтому фактор-пространство K/L с введенным в нем умножением является также алгеброй. Алгебра K/L называется фактор-алгеброй алгебры К по двустороннему идеалу L. Очевидно, она коммутативна, если коммутативна алгебра К. 6.24. Пусть имеются две алгебры К' и К" над полем /С. Морфизм со линейного пространства К' в пространство К* (2.71) называется морфизмом алгебры К' в алгебру К", если 6*
164 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.25 наряду с условиями морфизма пространств (2.71) а) со (х' +у') = со (х') + со (у') для любых х\ у' g К', б) со (ах') = асо (х') для любого х' £ К' и любого а£К выполняется также условие в) со (х'-у') = со (л;')-со (у') для любых л;', УёК'. Если морфизм со есть эпиморфизм или мономорфизм, или изоморфизм пространства К' в пространство К" (2.71), то при выполнении условия в) он соответственно называется эпиморфизмом, мономорфизмом, изоморфизмом алгебры К' в алгебру К". 6.25. Приме ры. а. Пусть L—подалгебра алгебры К. Отображение со, которое каждому вектору х £ L ставит в соответствие этот же вектор х в алгебре К, есть морфизм алгебры L в алгебру К, и именно мономорфизм. Как и в аналогичном случае в 2.72, этот мономорфизм называется вложением L в К. б. Пусть L — двусторонний идеал алгебры К и K/L —■ соответствующая фактор-алгебра (6.236). Отображение со, которое каждому вектору х £ К ставит в соответствие класс XgK/L, содержащий элемент х, есть морфизм алгебры К в алгебру K/L, и именно эпиморфизм. Как и в аналогичном случае в 2.726, этот эпиморфизм называется каноническим отображением К на K/L. в. Пусть имеется мономорфизм со алгебры К' в алгебру К". Совокупность всех векторов со(д;')£К" есть подалгебра L"аК"', и мономорфизм со есть изоморфизм алгебры К' в алгебру L". г. Пусть имеется морфизм со алгебры К' в алгебру К". Покажем, что совокупность L' всех векторов х' £К', для которых со (л;') —0, есть двусторонний идеал алгебры К'. Действительно, L' есть подпространство в К' (2.766); далее, если Jt'gL', /еК', то со (лЛ/) = со (*') •(!)(/) = О, так что х'-у' £ L' и аналогично y'-x'^U, что и требовалось. Далее, мономорфизм Я пространства К!/V в пространство К", ставящий в соответствие каждому классу X' g K/V элемент со (л;'), х' gX' (2.766), в данном случае есть мономорфизм алгебры K'/L' в алгебру К". Действительно, выбирая х' £Х', /6 Г, мы имеем *'/£ Х'У и Q (Х'У) = со (*'/) - со (*') X
6.25] § 6.2. алгебры; алгебра многочленов 165 XG) (у') = Q (X') Q (Y'). В частности, если морфизм о> есть эпиморфизм алгебры К' в алгебру К", то морфизм Q есть изоморфизм алгебры K/Lf с алгеброй К". д. Пусть А — линейный оператор, действующий в пространстве К. Так как для линейных операторов в пространстве К определены операции сложения и умножения, то т каждому многочлену Р (X) = V акХк £ П мы можем поставить /5 = 0 в соответствие оператор т k = o действующий в том же пространстве К. При этом соответствии сложению и умножению многочленов отвечает сложение и умножение соответствующих операторов в смысле § 4.3. В самом деле, пусть т m m р (К)=рх (К)+р2 (X) = ^ а^к + 2 ьк%* = 2 («*+**) **; Л = 0 Л = 0 & = 0 тогда m m m ^(А)= 2 («* + »*)А*= 2 «*А*+ 2 »*А*=/>1(А)+/>а(А). £=0 Л=0 А = 0 Аналогично пусть m m mm q (К) = px (X) />2 (X) = ^ «**■* 2 biy = 22 fl**A*+/; /г = 0 /=0 k = 0 /=0 тогд.а по распределительному закону для операторов (4.33) mm mm Q(A)= 2 2 «**/*+'= 2 a*A* 2 */a>=p1(A)p2(A). Л = 0 /=0 & = 0 /=0 В частности, операторы Р(А) и Q(A) всегда коммутативны, каковы бы ни были многочлены Р(к) и Q(K). Мы получили морфизм алгебры многочленов П (6.226) в алгебру линейных операторов В (К) (6.22г). Вообще говоря, этот морфизм не есть эпиморфизм (хотя бы потому, что операторы вида Р (А) коммутируют друг с другом, а вся алгебра В (К), за исключением тривиального случая К = К1, некоммутативна).
166 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.26 е. Существует изоморфизм между алгеброй В (Кп) всех линейных операторов, действующих в пространстве Кп, и алгеброй L (Кп) всех матриц п-\о порядка с элементами из поля К; мы осуществляем его, фиксируя в пространстве Кп базис е1} . .., еп и ставя в соответствие каждому оператору А £ В (Кп) его матрицу в этом базисе. Обе эти алгебры имеют одинаковую размерность п2. 6.26. В коммутативной алгебре П всех многочленов Р{Х) с коэффициентами из поля К (6.226) совокупность всех многочленов вида P(X)Q0(X), где Q0(X)—фиксированный многочлен, а Р(X)— любой многочлен, очевидно, является идеалом. Мы покажем, что каждый идеал 1=^0 алгебры П имеет такую структуру, т. е. получается из некоторого многочлена Qo (M умножением на любой многочлен Р(Х). Для доказательства найдем в идеале / отличный от 0 многочлен наименьшей возможной степени, например q, и обозначим его через Q0{X). Мы утверждаем теперь, что любой многочлен Q(X)£I имеет вид P(X)Q0(X), где Р(Х)£П. Действительно, по правилу действий с многочленами*) можно написать Q(X)^P(X)Q0(X) + R(X), (3) где Р(Х)— частное от деления Q (X) на Q0(X), a R (X) — остаток, имеющий степень, меньшую степени делителя, т. е. меньшую, чем число q. Многочлены Q (X) и Q0 (X) принадлежат идеалу /. Но тогда, как видно из равенства (3), и многочлен R (X) принадлежит идеалу /. Так как степень R {X) меньше q, а многочлен Q0 (X) в идеале имеет наименьшую возможную степень q среди многочленов, отличных от 0, то R {X) = 0, что и утверждалось. Многочлен Q0 (X) называется порождающим идеал /. 6.27. Многочлен Q0 (X) определяется идеалом I единственным образом с точностью до числового множителя. Действительно, если бы наряду с С?0 (X) тем же свойством *) См., например, А. Г. К у р о ш, Курс высшей алгебры, «Наука»» 1965, гл. 5.
6.31] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 167 обладал многочлен Qt(X), то, по доказанному, мы имели бы Q1(l) = P1('k)Q0(X), Qofr) = P0(b.)Q1{b). Из этих равенств вытекает, что степени многочленов Ql (X) и Q0 (X) одинаковы и что Рх (к) и Р0 (X) не содержат X, т. е. являются числами; это и утверждалось. 6.28. Пусть имеются многочлены Qx (X), ...tQm(X), не все равные 0 и не имеющие общего делителя степени ^ 1. Покажем, что существуют такие многочлены РЧ(Х), ... ..., Р°т(Ь), ЧТО Действительно, пусть /—совокупность всех многочленов вида P1(X)Q1(X)+...+Pm(X)Qm(X) при любых Рх (X), . . ., Рт (X) из П. Очевидно, совокупность / есть идеал в П. По 6.26 идеал / порожден одним многочленом т QoM=2PlMQk{b)- (5) При этом, в частности, Q, (X) = S, (X) Q0 (Я), ..., Qm (X) = Sm (X) Q0 (X), где Sx (X), .. . ,£,л (X) — некоторые многочлены. Эти равенства показывают, что С?0 (X) есть общий делитель многочленов Qi(X), ..., Qm(X). Но тогда из предположения следует, что степень многочлена С?0 (X) равна 0, т. е. что С?0 (X) есть постоянная а0. При этом а0фО, так как иначе /--0. Умножая (5) на 1/«0, получаем (4), что и требуется. § 6.3. Каноническая форма матрицы произвольного оператора 6.31. Рассмотрим линейный оператор А в л-мерном пространстве К„. Указанное в 6.25д отображение со (Р {X)) = Р (А) есть эпиморфизм (6.23) алгебры П всех многочленов с коэффициентами из поля К в алгебру Пд линейных операторов вида
168 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.32 Я (А) в пространстве К„. В силу 6.25 г алгебра Пд изоморфна фактор-алгебре П/7, где /—идеал, состоящий из всех многочленов Р (X), для которых (о (Р (X)) — Р (А) — 0. Мы выясним сейчас структуру этого идеала. 6.32. В 6.22 мы видели, что совокупность всех линейных операторов, действующих в пространстве К„, представляет собой снова алгебру над тем же полем К, размерности л2. Фиксируя оператор А, рассмотрим последовательность операторов В этой последовательности первые п2-\- 1 членов линейно зависимы. Пусть, например, т ^ ckAk = 0 (m^n2). Это означает, что в установленном выше соответствии (6.31) т многочлену Q (X) — V ckXk соответствует нулевой оператор. k = 0 Всякий многочлен Q(X), для которого оператор Q(A) есть нулевой оператор, будем называть аннулирующим многочленом оператора А. Мы доказали, что у всякого оператора А есть аннулирующий многочлен степени ^ п2. 6.33. Совокупность всех аннулирующих многочленов оператора А есть идеал в алгебре П. В силу 6.26 имеется многочлен Q0(X), определенный с точностью до множителя, такой, что все аннулирующие многочлены имеют вид P(X)Q0(X), где Р(X)—любой многочлен из П. В частности, Q0 (X) сам является аннулирующим многочленом. Среди всех аннулирующих многочленов он имеет наименьшую степень и поэтому называется минимальным аннулирующим многочленом для оператора А. 6.34. Т е о р е м а. Пусть аннулирующий многочлен Q (X) оператора А разложен в произведение двух взаимно простых множителей: Q(X) = Q1(X)Q2(X).
6.34] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 169 Тогда пространство К„ можно разложить в прямую сумму двух подпространств, К„ = Т\ + Т2, инвариантных относительно оператора А [так что АТ^сТ^ AT2czT2), причем для любых хх £ Tl5 л:2 £ T2 Q1(A)x2^0, Q2(A)x1^0) та/с что Qx (Я,) [Q2 (X)] есть аннулирующий многочлен для оператора А, действующего в подпространстве Т1[Т2]. Доказательство. В силу 6.28 существуют такие многочлены Рг{Х) и Р2(Х), что Используя морфизм 6.25д, находим P1(A)Q1(A) + P2(A)Q2(A)^E. Обозначим через ТЛ (Л = 1,2) область значений оператора Qk (А), т. е. совокупность векторов вида Qk (A) х, x £ К„ {4.61). Очевидно, из j/ = Qfe (A) x £ ТЛ следует А^у =■- Qfe (А) Ад; £ ТЛ, так что подпространство Tk инвариантно относительно оператора А. Мы имеем для любого хх £ Тх и некоторого _у £ Kn Q2 (А) хг = Q2 (A) Qx (A)y = Q (А)у = О, и аналогично для любого х2 £ Т2 и некоторого г £ Kn Q1(A)^2 = Q1(A)Q2(A)2r=Q(A)2r = 0. Далее, для любого х £Кп имеет место равенство * = (?! (А) Рх (А) д:+ Q2 (A) P2 (A) x = хх + х2, где xk = Qk(A) Pk(A) х £Tk(k=], 2), оно показывает, что подпространства Т1 и Т2 в сумме дают все К„. Пусть х0£Т1Г[Т2. Тогда Qx (A) x0 = Q2(A) *0 = 0 и, Следовательно, д:0 = Рг (A) Q, (А) х0 + Р2 (A) Q2 (А) х0 = 0.
170 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.35 Таким образом, T1f|T2^-0 и сумма К„ = Т1 + Т2 — прямая. Разумеется, не исключена возможность, что одно из подпространств Tj, To состоит только из одного нулевого вектора. 6.35. 3 а м е ч а н и е. По построению оператор Qx (А) аннулирует подпространство Т2, а оператор Q2 (А) аннулирует подпространство Тх. Покажем, что всякий вектор х, аннулируемый оператором Qr (А), лежит в Т2 и всякий вектор х, аннулируемый оператором Q2{А), лежит в Tj.Пусть Q1(A)x = 0. Мы имеем х = хх--х2, где хх £ Tl5 х2 £ Т2. Так как Ql(A)x2 = 01 то и Q1(A)xl^Ql(A)x — Ql(A)xl = 0". Но и Q2(A)x1 = 09 поскольку ^i6^i- Следовательно, хх = Рг (A) Qx (А) хх + + Р2 (A) Q2 (A) xi -= 0, х = х2 £ Т2. Аналогично из Q2 (А) л: = О следует л*£Ть что и утверждалось. 6.36. Разлагая многочлены Qx (X) и Q2 (X) далее на взаимно простые множители, получаем возможность разбивать пространство Кп на более мелкие инвариантные относительно оператора А подпространства, аннулируемые соответствующими множителями многочленов Qx (К) и Q2{'k). Пусть многочлен Р (К) допускает в поле К разложение вида m жм = п (*-*/'. (в) y' = i где %j — все (различные) корни многочлена, а гу.—их кратности. Такое разложение всегда возможно, в частности, в поле С комплексных чисел. Разложение (6) есть разложение на m попарно взаимно простых множителей (X — KjYj. Применяя результат 6.34, получаем следующее утверждение: Теорема. Если аннулирующий многочлен оператора А имеет вид (6), то пространство Кп разлагается в прямую сумму m подпространств Тх, . . ., Т/л, инвариантных относительно оператора А, причем подпространство Tk аннулируется оператором В&', где Вл-А — ХкЕ. 6.37. В каждом ненулевом пространстве Tft, согласно 6.14у можно выбрать базис, в котором матрица оператора Bk (по построению нильпотентного в пространстве Tk) примет канонический вид (2). В этом же базисе матрица оператора
6.37] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 171 A = Bk-\-XkE примет вид К 1 о . 0 %k 1 . 0 0 0. 0 0 0. ..0 0 ..0 0 ■ • К 1 К 1 о . 0 кк 1 . 0 0 0. 0 0 0. .00 .00 ■ ■К 1 . . 0 Кк \ К (7) Матрица оператора А во всем пространстве Кп = Т1~ . . . -\-Тт в базисе, который получается объединением всех канонических базисов, построенных в пространствах Тх, .... Тт, приобретает окончательную форму 1^1 ... 0 о хг... о 7(A) 0 0 ... 1 0 0... А,! К 1 ох, . о . о о о . о о . . А,, *i \К 1 • о хт. 0 0. 0 0. 1 .. 0 .. 0 .. 1 (8)
172 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.41 Формулируем окончательный результат: Теорема. Для любого оператора А в n-мерном пространстве К„, имеющего аннулирующий многочлен вида (6) (в частности, для любого оператора А в n-мерном комплексном пространстве CJ, существует базис, в котором матрица оператора А записывается в форме (8). Матрица (8) называется нормальной формой Жордана оператора А, а соответствующий базис — базисом Жордана. В случае К„ — Сп комплексные числа Хи . .., Хт можно упорядочить по какому-либо правилу: например, в порядке возрастания модулей, а при равных модулях — в порядке возрастания аргумента G, меняющегося в промежутке 0^6 < 2я. Для оператора А, действующего в пространстве КпфСпУ представление (8) возможно не всегда. Мы рассмотрим в § 6.6 каноническую форму матрицы оператора А, действующего в пространстве KW = R/Z. § 6.4. Элементарные делители 6.41. Матрицу (8) можно задать таблицей К "i1'- ■■-, пм \ %2; п<?\ ..., пЫ I ^ ^ д w ^ ^ л(*, j ^ до в которой для каждого диагонального числа %k указаны размеры п^\ ..., п^г) ^соответствующих «элементарных жордановых клеток» вида \К i о oa,fci 0 0 0 1 0 0 0 ... 0 ... 0 ... 1 • •• к встречающихся в матрице (8). Мы хотим выяснить, как построить таблицу (9) и тем самым восстановить вид матрицы J (А) оператора А по известной его матрице Л в каком-либо базисе пространства К„. j> nSp строк, (Ю)
6.43] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 173 6.42. Как мы знаем (5.53), характеристический многочлен оператора А не зависит от выбора базиса. Составим его для жорданова базиса; так как под главной диагональю стоят нули, мы получаем det(A — XE) = dei\\J(A) — ХЕ \\ = к=\ Мы видим, что числа Xk суть корни характеристического многочлена, а суммы гк = n[k) + • • • + n{rk) — их кратности. Таким образом, вычисляя характеристический многочлен (что можно сделать по матрице А) и находя его корни, мы получаем величины Xk и rk = n{k) -f- .. . -(- nS^ таблицы (9). 6.43. Далее (здесь и в 6.44) мы укажем, как по матрице А оператора А в исходном базисе вычислить сами числа n{jk). Поскольку J (А) и А — матрицы одного и того же оператора А, взятого в разных базисах, согласно 5.51 справедливо равенство У(А) = Т"МГ, где Т—невырожденная матрица. Поэтому и J(A) — XE=T~1 (А — ХЕ) Т. Миноры фиксированного, например р-го, порядка матрицы А—ХЕ представляют собой некоторые многочлены от X степени ^р. Обозначим через / (А) идеал в алгебре П, порожденный всеми этими минорами. Аналогичный смысл имеет идеал Ip(J(A)). Покажем, что эти идеалы совпадают. Действительно, каждый минор р-го порядка матрицы J (А) — ХЕ согласно 4.54 является суммой произведений миноров р-го порядка матриц А — ХЕ, 7"1 и Т. Но элементы матриц Т и Т"1 суть числа; таким образом, всякий минор р-го порядка матрицы J (А) — ХЕ есть просто линейная комбинация миноров р-го порядка матрицы А — ХЕ и тем самым входит в идеал 1р(А). По симметрии каждый минор р-го порядка матрицы А — ХЕ входит в идеал / (У(А)). Тем самым / (А) = = /я(/(А)), что и утверждалось. Пусть D (X) — порождающий многочлен этого идеала; он может быть определен как общий наибольший делитель
174 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНКЙНОГО ОПЕРАТОРА [6-43 многочленов, порождающих идеал / (А) (6.26). Таким образом, наибольший общий делитель миноров p-vo порядка у матрицы J (А) — ХЕ тот же, что и у миноров р-го порядка матрицы А — ХЕ, и поэтому может считаться известным. Вычислим непосредственно наибольший общий делитель миноров /;-го порядка матрицы J (A) — ХЕ. Опять-таки вместо матрицы J (А) — ХЕ при этом можно рассматривать матрицу вида P(J(A) — XE)Q, где Р и Q — обратимые числовые матрицы (не содержащие X). Операции перестановок строк, столбцов, прибавления к одному столбцу другого с произвольным множителем в матрице ./(А) — ХЕ приводят как раз к такого рода матрицам (4.44). Мы утверждаем, что элементарную клетку Хк — Х 1 0 . 0 Хк — X 1 . 0 0 0. 0 0 0. 0 0 1 .. Хк- указанными операциями можно преобразовать к виду (*> и (*) строк. (12) А именно, для получения требуемого результата следует вначале из второй строки вычесть первую, умноженную на Xk — X, из третьей — вторую, умноженную на Xk — X, и т. д.; (А>) мы получим матрицу {р = пу}) Xk-X -(Х,-Х)« 1 0 0 1 (—\)р-2(Хк — Х)Р~1 0 0 ... 1 (—))!'-1(Хк — Х)Р 0 0 ... 0 Если теперь из первого столбца вычесть второй, умноженный на Xk — л, затем третий, умноженный на — (Хк — а)2, ... . . ., (р— 1)-й, умноженный на (— \)г~2 (Хк — а)^"1, мы получим
6.43] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 175 матрицу 1 О О 1 О О к)г О О (13) (-1К_1(А/г из которой матрица (12) получается перестановкой столбцов. Теперь подсчитаем общий наибольший делитель миноров р-го порядка у матрицы J (К) с клетками вида (12) на главной диагонали. Так как у этой матрицы вне главной диагонали стоят нули, то отличными от нуля могут быть лишь миноры с одинаковым набором номеров строк и столбцов; такой минор равен произведению своих диагональных элементов. В матрице J (к) среди элементов на главной диагонали имеется некоторое число, положим N, биномов вида а остальные п — N элементов главной диагонали равны 1. Число N есть полное число жордановых клеток в матрице J (А), т. е. N--rl-\- . . . -\-rtn. С другой стороны, среди миноров до порядка п — N заведомо имеются равные 1, откуда следует, что D (к) ^ 1 при р^п — ЛЛ Можно заменить матрицу J (X) более простой диагональной матрицей Л(1) {kk-k)ni /(*) = (*1-м .(1) (К-Ъ)п (9) (К-*) Am) тогда многочлен Dp(k), сосчитанный для матрицы J (к), будет совпадать с многочленом Dv _ (п_А)(к), сосчитанным для матрицы J (к). Очевидно, наибольший общий делитель
176 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.44 миноров р-го порядка матрицы I(X) имеет вид т Д,М = П(л,—ХГЛ''), (14) где rrij^O. Спрашивается, каково значение, например, показателя т1(р). Эта величина есть наименьший показатель, с которым К1 — X входит во все миноры р-го порядка. Пели p^/z(2)-f- ... -\-п{т\ то имеется минор р-го порядка, не содержащий вообще К1 — Я, так что при этих р мы имеем т1(р) = 0. Дляр = /2(2)+ ••• -\-п{т)-\-\, учитывая, что по- казатели п^,..., п^ идут в убывающем порядке, мы имеем В дальнейшем на каждую единицу увеличения р показатель т1(р) будет увеличиваться соответственно на л^1р ^г'-г» *• » наконе1*> ПРИ Р = п мы получим т1{р)^п[^+ ... +/|П>. Аналогично, mj(p) = n^+ ...+п^ (1<у<т). 6.44. Отношение Е (X) = ,.ч называется элементар- У Dp \К) ным делителем оператора А; вместе с многочленами D (К) элементарные делители не зависят от выбора базиса, и их можно вычислять по матрице оператора А в любом базисе. Из сказанного в 6.43 видно, что элементарные делители имеют вид m 0) с корнями, кратности которых равны размерам (последовательных) жордановых клеток. Таким образом, вычислив эле-
6.45] § 6.4. элементарные делители 177 ментарные делители, мы получаем числа /г(/) и тем самым решаем задачу, поставленную в 6.43. 6.45. Приме ры. а. У жордановой матрицы 10-го порядка 1 1 О О 1 1 О 0 1 1 1 О 1 2 1 О 2 2 1 О 2 имеются три клетки, отвечающие корню Я,1=1, размеров две клетки, отвечающие корню Х2 — 2, раз- 3, 2 и 1 меров 2 значения поэтому элементарные делители имеют E9Ck) = (\-k)s(2-\)*, Ев(Х) = (\-\)*(2-%)\ Еч{\)=\-к, £,(Х)=...=£1(Х)=1. б. У некоторой матрицы Л = ||а/7г|| 10-го порядка элементарные делители (вычисленные, как указано в 6.43 и 6.44, по минорам матрицы А—ХЕ) оказались равными £9(Х) = (3-Х)*(4-Х)3, £8(Х) = (3-Х)8(4-Я,), £,(%) = 4 Е6 (к) = 4 К = Е1(Ь) = \.
178 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.46 Напишем выражение матрицы У (А). В соответствии с результатом 6.44 матрица У (А) имеет две клетки, отвечающие корню Х1 = 3, размеров 2 и 2, и четыре клетки, отвечающие корню Х2 — 4, размеров 3, 1, 1, 1. Таким образом, мы имеем /(А) = 3 1 О 3 3 1 О 3 4 1 4 1 4 4 4 6.46. Итак, зная элементарные делители оператора А, мы можем определить все величины nf\ а вместе с ними—■ структуру жордановой матрицы оператора А. В частности, мы видим, что жорданова матрица оператора А определяется однозначно самим оператором А. С другой стороны, поскольку элементарные делители оператора А определяются через миноры матрицы А—ХЕ в любом базисе, два эквивалентных оператора А и В, т. е. имеющих в двух (разных) базисах одну и ту же матрицу, имеют одну и ту же каноническую жорданову форму. Очевидно и обратное: если два оператора имеют одну и ту же каноническую форму, то они эквивалентны. Тем самым проблема эквивалентности линейных операторов (в комплексном пространстве), поставленная в начале этой главы, полностью решена.
6.52) § 6.5. НЕКОТОРЫЕ СЛЕДСТВИЯ 179 § 6.5. Некоторые следствия 6.51. Если известно, что оператор А приводится к диагональному виду, т. е. его матрица в некотором базисе имеет вид a-i то матрица Л и есть жорданова матрица оператора А (все жордановы клетки имеют размер 1). В частности, все элементарные делители имеют простые корни. Обратно, если все элементарные делители некоторого оператора А имеют только простые корни, жорданова матрица У (А) имеет клетки только размера 1 и, следовательно, диагональна. 6.52. Имея жорданову форму оператора А, можно написать его минимальный аннулирующий многочлен. Пусть оператор В в некотором базисе ег, .. . , ер имеет матрицу 0 1 0 0 0 1 | 0 0 0 0 0 0 ... 0 0 ...0 0 ...0 1 ..0 0 Это означает, что Вех = 0, Ве2 — еъ ... откуда следует, что В?х = 0 при любом х = \ckek. Та B^ = Vi» КИМ
180 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.52 образом, аннулирующий многочлен оператора В имеет вид №. Минимальный аннулирующий многочлен, как делитель №, должен иметь вид Х'л, т^.р\ но поскольку ВР'1ер = ехФ 0, мы видим, что %р и есть минимальный аннулирующий многочлен. Пусть оператор А в том же базисе еъ .. матрицу е имеет К 1 о 0 Х0 1 0 0 0 0 0 0. ..0 0 ...0 0 • ■и .. 0 Х0 так что A = B-f^0E. По доказанному (А — ХоЕ)р=Вр = 0, так что для оператора А аннулирующим многочленом является (К0 — К)Р; он является и минимальным в силу той же аргументации. Пусть оператор А имеет матрицу к 1 0 %п 0 0 0 0 0 . 1 . ^о • 0 . .. 0 1 .. 0 .. о • V \ %0 1 . о К . 0 0. .. 0 .. 0 • • ^0 причем числа p1^p27^ • • • 7^РГ СУТЬ Разм^ры ее диагональных клеток. Многочлен Q(X), аннулирующий оператор А, должен по отдельности аннулировать каждую его клетку (ср. 4.52). Этим свойством обладает многочлен (Х0 — Х)р1. По указанным выше причинам он является и минимальным аннулирующим многочленом. Наконец, в общем случае, когда оператор А обладает жордановой матрицей с таблицей *i; л!Х)> ^Х)> 5^ UPi » К\ п[г > П(от) >
6.61] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 181 аннулирующим многочленом является многочлен т , <?(*.)= П(Ь*-Ь) 1 • (15) k=l Он является и минимальным аннулирующим многочленом оператора А, так как ни один из показателей n[k) не может быть здесь понижен по указанным выше соображениям. Итак, минимальный аннулирующий многочлен матрицы А есть многочлен (15). Его степень равна п{^ + ...-{-п[т) — сумме размеров максимальных жордановых клеток, отвечающих каждому корню характеристического многочлена. Заметим, что это число не превосходит размера всей матрицы А (т. е. числа п — размерности пространства, в котором действует оператор). Характеристический многочлен det (А— ХЕ) оператора А (6.42) содержит многочлен Q(X) в качестве делителя и поэтому также является аннулирующим (это утверждение называется теоремойГамильтон а — К эли). Вообще говоря, характеристический многочлен det (Л — КЕ) не является минимальным аннулирующим многочленом оператора А. Если оказывается, что минимальный многочлен совпадает с характеристическим, то это означает, что каждый характеристический корень используется только в одной жордановой клетке, размера, равного кратности корня. § 6.6. Вещественная жорданова форма 6.61. Рассмотрим оператор А в вещественном л-мерном пространстве Яп. Канонический базис, в котором матрица оператора А записывалась бы в жордановой форме (8), вообще говоря, не существует, хотя бы потому, что характеристический многочлен оператора А может иметь невещественные корни. Тем не менее в вещественном пространстве можно найти некоторую замену жордановой матрице (8). Пусть Л— \\а^}\\ есть матрица оператора А в некотором базисе еъ ... ,еп пространства R„. Рассмотрим комплексное л-мерное пространство С^, состоящее из векторов х = а1е1+...-\-апеп, где ах, ..., ап — произвольные комплексные числа. Матрица Л
182 ГЛ. 6. КАНОНИЧКСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-62 задает в пространстве С;| линейный оператор А по формулам п п / п \ /=1 / = 1 \*=1 / для векторов х с вещественными составляющими а- эти формулы определяют сам оператор А. 6.62. Начнем с оператора А, у которого аннулирующий многочлен имеет специальный вид где т —положительное число. Для оператора А определены операторные полиномы Q (А ) с комплексными коэффициентами. В частности, имеют смысл многочлены (A-j-/т E)f и (А — /тЕ)Л Полином Р(^)— = (к2-\-х2)Р остается аннулирующим и для оператора А. Разложению (Х2^-х2)р = (Х— ix)P (к -|- 1т)Р, согласно 6.34, отвечает разложение пространства Сп в прямую сумму инвариантных относительно оператора А подпространств С1п и Q, в которых он имеет аннулирующие многочлены соответственно (л — h)P и (Х-\-п)Р. Более того, если подпространство С„ состоит из векторов х=а1е1+...+апеп с некоторыми аъ . . ., а„, то подпространство Q состоит из векторов х = cXi^i -f- . . . -f- <xnen, где числа а- комплексно сопряжены к числам а-. Действительно, если (А — 1хЕ)р х = 0, то, переходя к комплексно сопряженным числам во всех членах левой части, получаем, что (A -\-ix ЩРх = 0, и обратно; последним равенством, по 6.35, однозначно определяется подпространство С~. Отсюда следует, между прочим, что п четно, п — 2т, где т — размерность каждого из подпространств С„ и С~. Пусть ff — жорданов базис оператора А в пространстве С* (6.37). Поскольку в этом базисе матрица опера-
6.62] § 6.6. ВЕЩЕСТВЕННАЯ Ж0РДАИ0ВА ФОРМА 183 тора А имеет вид [6.37 (7)] п. /т 1 /т 1 /х IX 1 /х /X оператор А действует на базисные векторы по формулам А/1 -/т/1, .... АД = 1т/1 A/J =/?+/тД ..., А/?^Л-г/тЛ, А/^Д.х + гхД, ...,A/^=/nV,+'Vv Для совокупности сопряженных векторов /* £ С£ справедливы сопряженные формулы А/| = -/т/},_ .... АЛ =—«7?^ A/J-Zi-ix/i, ..., АЛ=Л-*тЛ, А //г, —УА1,_ 1 1^ Jnx, • • • 5 А/П|, — /л7_ 1 LTfn(/' Мы видим, что, векторы /^ образуют жорданов базис для оператора А в пространстве С~. Таким образом, векторы/^ и ff образуют жорданов базис для оператора А во всем пространстве Сп. Мы построим теперь базис в вещественном пространстве R„, заменяя каждую пару комплексных векторов ff и ff на пару вещественных векторов gf = = у (/f + If) и А? - ^ (/f-7f)• Из формул A/f^/ti-Hx/f (/J =75 = 0), PJf=ft-i-itT$
184 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.62 получаем А{у(//Ч7/) }=Ag? = gf-i-rhf (£* = й* = 0), А {Ti Vi -W}s AA*=-A*-* +T*?- Поэтому для векторов £•*, /г* получаются формулы Agi = — Th\, А/г? = xgl А^ = rf —тА*. АА* = А# Пк g^-i —тА*, nnk-i +1gnk. (16) AAK„fc = При этом, обратно, /f = gf + lhf, Jf=gf-ihf. Таким образом, линейная (комплексная) оболочка всех векторов gf и hf та же, что и линейная оболочка всех векторов ff и ff. А так как число тех и других одинаково, то векторы gf и Щ линейно независимы над полем С вместе с векторами ff и ff. Тем более векторы gf и Щ линейно независимы над полем /?, т. е. в вещественном линейном пространстве Rn. Из формул (16) следует, что матрица оператора А в базисе gf, hf состоит из диагональных клеток вида О — т т 1 О О О — т О 1 т 1 О О о — т размеров соответственно 2пх, О — т 2/2, т 1 О О О — т (17)
6.63] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 185 6.63. Переходим к рассмотрению общего случая. Пусть А —линейный оператор в вещественном /2-мерном пространстве Rn и Р(X)— его аннулирующий многочлен. В вещественной области многочлен Р(к) допускает разложение вида т s k=i /=i где Xk (k = 1, . .., т) — различные вещественные корни многочлена Р(Х), а ау. + /Ту=Ау; а-— /ту.= Яу—различные невещественные корни; все числа ту- положительны. В соответствии с общей теорией (6.36) пространство R„ допускает разложение в прямую сумму инвариантных относительно А подпространств m s R=2 e,+ 2f,, причем аннулирующим многочленом для оператора А в подпространстве Е^ служит многочлен (X— Хк)г^, а в подпространстве F-— многочлен [(X— о )2-гт*]р1. В подпространстве Ek оператор А приводится к жордановой форме вида (7). В подпространстве Fy- обозначим Ву—- А — ауЕ; тогда для оператора Ву. в подпространстве Fy- многочлен (X2-\-T*)pJ будет аннулирующим и по предыдущему можно будет построить базис, в котором матрица оператора Ву. будет состоять из клеток вида (17) (с заменой т на ту). В этом же базисе матрица оператора А = Ву.-г-а-Е будет состоять из клеток (18) Итак, в пространстве Яп можно выбрать базис, в котором матрица оператора А состоит из диагональных клеток вида (10) и (18). Обозначим эту матрицу через JR(A) (вещественная жорданова матрица). оj т,. 1 0 -т, ст, 0 1 оj %j l 0 -т, Oj 0 1 • • • °/ ri -1j О j
186 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.64 6.64. Структуру матрицы JR (А) можно восстановить по элементарным делителям оператора А, вычисленным по минорам матрицы А — ХЕ в исходном базисе (§ 6.4). Поскольку многочлены Dp(k) и Ер(к) получаются из миноров матрицы Л — ХЕ рациональными операциями, многочлены Ер(Х) имеют вещественные коэффициенты и, следовательно, имеют вид т , s k=l /' = 1 (?=1,2, ...,/1—1). Каждому показателю nqk) отвечает жорданова клетка вида (10) размера nqk). Каждому показателю/^ отвечает клетка вида (18) размера 2p(J}. 6.65. Формулируем окончательный результат в виде следующей теоремы: Теорема. Для любого оператора А в вещественном п-мерном пространстве Rtl существует базис, в котором матрица JR(A) оператора А квазидиагональна и состоит из диагональных клеток вида (10) и (18). Здесь Xk— вещественные характеристические корни оператора А, а/Г1т- и о.— iX-— комплексные его корни. Размеры клеток однозначно определяются по элементарным делителям оператора, как указано в 6.64. § 6.7. Спектры, корпусы и многочлены В различных вопросах анализа и алгебры встречается необходимость вычисления различных функций, в частности, многочленов, от заданных линейных операторов в конечномерном пространстве. Функции от операторов обладают рядом специфических свойств. В ближайших двух параграфах строится исчисление таких функций. Естественной арифметической моделью для функций от одного оператора является алгебра корпусов, с которой мы и начинаем теорию. 6.71. Будем называть спектром и обозначать символом S конечную совокупность точек Х1у . . ., Хгп. При этом будем считать, что каждой точке Xk приписано под названием «кратности» некоторое натуральное число rk (k=\, ...,/я).
6.71] § 6.7. спнжтры, корпусы и многочлены 187 Все это будем записывать так: s^iK1' ■■■>Kr]. Предположим, что каждой точке Xk поставлен в соответствие набор из rk чисел из К, которые мы обозначим /(Ял), /' (^/с)> • • •» /{П:~1) (Хл). Такой набор чисел мы будем называть корпусом/, заданным на S*). Пусть Q (S) — совокупность всех корпусов на множестве S. Введем в Q (S) следующие операции: а. Сложение. Суммой двух корпусов /= \/М (Kk)\ и g= {gti) (Xk)} будем называть корпус / + £\ определенный набором чисел (f+g)u4h)=fU)(h)+g{i)(h)> * = 1, -..,/», у=1, ...,гл —1. б. Умножение на ч и с л о. Пусть а £ К; произведением а/ корпуса /=[/"(/) (Xk)\ на число а будем называть корпус, определяемый набором чисел (*f)«4h)=*fU)(h). Очевидно, операции а и б превращают совокупность Q (S) в линейное пространство. Нулем этого пространства являются корпус 0 со всеми нулевыми составляющими. в. Введем теперь операцию умножения. Произведением /g корпусов /— {/О (Kk)\ и g = {g{i) (Xk)} называется корпус, определяемый формулами (fg)' ih) =/(Ю g (h) +f (K)g(K) / = o A = l, .. P = 0, 1, r' — Cp-j ., m, ...,/■*- p! ! (P - /)! -1, Легко проверить, что операция умножения коммутативна и удовлетворяет условиям 6.21 Г) —3). Таким образом, Q(S) — коммутативная алгебра над полем К. В этой алгебре есть единица, корпус с, который обладает свойством е/ = / для *) Принят также термин джет (англ. jet означает «струя»).
188 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-72 любого /£ Q (S). Именно, можно положить { 1 при у = 0, /г=1, ...,/я, еуп ал = > *' \ О при 0<у<гл> *=1, ..., т. Для случая, когда точки Хг, . . ., Хт принадлежат полю Ку мы свяжем в этом параграфе алгебру Q(S) с алгеброй всех р многочленов P(k)= ^ akXk с коэффициентами из поля К. 6.72. Будем предполагать, что поле К содержит бесконечное множество различных элементов. При этом условии установим вначале некоторые теоремы о восстановлении коэффициентов многочлена по его значениям. р а. Пусть Р(К)= 2 ak№— многочлен с коэффициенте тами из поля К, аргумент которого X также может принимать значения в поле К. Покажем, что значения Р(К) позволяют однозначно восстановить его коэффициенты я0,. . ., ар. Пусть Х0, %!, . . ., X —различные элементы поля К; рассмотрим равенства Эти равенства можно рассматривать как уравнения относительно величин а0, av . . ., а с определителем, отличным от 0; по теореме 1.73 она обладает единственным решением, что и требуется. б. Отсюда следует, что если два многочлена Р(К) = р р = 2 ak^k и Q(^)~ 2 bk№ совпадают при каждом значено k=o нии Х£К, то ak = bk (& = 0, 1, ...,/5). 6.73. Далее нам понадобится понятие производной от многочлена P(k), понятие высших производных и формула Тейлора. R анализе эти понятия вводятся для случая многочлена Р(К) от вещественного (или комплексного) аргумента.
6.73] § 6.7. спектры, корпусы и многочлены 189 Здесь мы рассматриваем многочлены с аргументом X, меняющимся в произвольном поле К; поэтому мы должны ввести соответствующие определения независимо (причем не опираясь на понятие предела, которого в поле К может и не быть). а. Фиксируем точку (i g К и напишем равенство Ё«^*= £«*№+(*—!*)]*= £Ц£>(а.-ю\ (19) k = 0 k=0 k = 0 где ■ fe. t (k — 0, 1, ...,/?) — многочлены от ц, которые получаются после развертывания [|i-|-(>v — \i)]k по степеням (i и (X — (i) и приведения подобных членов. Многочлены bk(\i) получают следующие наименования: р bQ(\i)= 2 ak\ik^^>(\i) —сам многочлен P(|i); р b1(\i)^ 2 kak\ik'1 = Р' (|i) —первая производная ^=1 многочлена P(|i), р Ь2 (|i) = 2 /г (/г—1) afe|.i*~2 = P" (\i) — вторая производная k = 2 многочлена P(|i), b (\i)^p(p—1) ... \ - а р = PW (\i)—р-я производная многочлена P(|i). Для многочлена степени р положим Р{^ (|i) = 0 при д > р. Равенство (19) в приведенных обозначениях принимает форму р W = E-Fp(W(|A)(b-|i)* (2°) и называется формулой Тейлора для многочленов Р(Х). б. В частности, для многочлена Р (к) = (X—а)Р (а£К) мы имеем Р(а) = Р' (а)= .. .=Р{Р~1] (fl) = 0, P^)(A,)=p!f P(*>(b) = 0 при ? >/?.
190 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.74 в. Более общим образом, если Р (X) = (X— a)PQ(X), мы имеем также Q (%) = 2 bk (к - а)\ Р (к) = 2 Ьк (X - а)к+Р, 6=0 /г = 0 так что р (а) = Р' (а) = . . . = Р{р~1) (а) = 0. (21) г. Обратно, если известно, что выполнены условия (21), то это означает, что s РМ = 2*-^Р{к)(а)(Ь-а)к = s ^(Х-а)Р^ ^-P{k)(a)^-a)k-P=(K-a)PQ(X)9 где Q{X)— некоторый новый многочлен. 6.74. Заметим, что представление многочлена Р {X) в форме где bk(\i) — некоторые многочлены от jli, может быть лишь единственным. Действительно, зафиксируем \i = \i0 и придадим величине X последовательно различные значения Я„, ... , X . Тогда т -— X— \i примет последовательно различные значения Х0— |и0, XY— |и(), ... , Хр — |л0, и при этих значениях т оказываются известными значениями многочлена р У1 Ьк (fi0) %k (которые равны Р(Х0), ..., Р(к))\ в силу 6.72а величины bk (ц0) определены однозначно. Так как это верно при любом \х = \i0 £ /Г, то однозначно определены и сами многочлены £fr (\i) (& = 0, 1, ... , р). 6.75а. Пусть даны два многочлена Р (X) и Q(X). Проверим справедливость формул (P + Q)(W(|A) = ^fc,(fi)H-Q(*>(|i)> (22) к (PQYk) (ц) = 2 с£р'/> (Ю Q(*~y) (и), (23) /=o гле С/ = 7П|5=77! (* = 0, 1, ...).
6.75] § (3.7. спектры, корпусы и многочлены 191 Действительно, мы имеем по определению р (Р + Q) (К) = £ -L (Р + СГ (ц) (% - ц)*, fe=0 />(^) = Етг'>,*)(|*)(^-|А)*, k=0 k\ р ^ 1 0(М = Х^<?(*}(ЖЬ-|*)\ А' = О Р fe! /5=0 В силу теоремы единственности 6.7^ получаем формулы (22). Далее, аналогично р fe= 0 с другой стороны, р р /=0 '' s = 0 S- РIX) Q (I) = V V 1 р«/. (и) qw) (|i) (Х-,*)•'+/ = / = 0 А' = 0 ''' в силу теоремы единственности 6.74 имеем к -1- («?)'*> (|х) = X j!(^y)! Р"> (n)Q«*"'> (ц), откуда и вытекает (23). б. В частности, из формулы (23) вытекает следующее важное предложение: Если P(k)(\i) = 0 при /^ = 0, 1, . . . , т, то для любого многочлена Q(k) также (PQ){k) (\х) = 0 при k = 0, 1, . . . , m.
192 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.76 6.76. Пусть теперь заданы некоторый спектр S^l^i1, ... , Я^}, Xj£K, и алгебра соответствующих корпусов Q(S) (6.71). Каждому многочлену Р(к) отвечает следующий корпус Р из Q(S): точке Xk ставятся в соответствие числа Р(кк), Я'(*л). ••• , P'^-^ih), ™е р(у) (*) — производные от многочлена Р(Я), определенные в 6.73а. Формулы (22) и (23) показывают, что обычным действиям сложения и умножения многочленов отвечают определенные в 6.71 действия над корпусами. Таким образом, отображение Р (к)—>Р есть морфизм (6.24) алгебры многочленов П в алгебру корпусов Q(S). Покажем, что этот морфизм является эпиморфизмом; иначе говоря, для любого корпуса / можно найти такой многочлен Р(Х), что (k=\, ... , т). Достаточно рассмотреть случай, когда числа /{J) (kk) отличны от нуля только для какого-нибудь одного значения к — къ а для остальных значений равны 0; если мы решим поставленную задачу для такого случая, т. е. для каждого А=1, ... , т построим многочлен Рк(к), удовлетворяющий условиям Р% (Ю =/(**), • • • . Р^~1] (К) =f{r"-1) (Xk), (24) П''(^) = 0. s^k, j=\, ... , rs-\, (25) то искомое решение можно будет получить по формуле Р(к) = Р1(Ъ.)+...+Ра(%). Итак, нам требуется найти многочлен Pk (К), удовлетворяющий условиям (24)—(25). Будем искать его в форме Pk(b) = Qk(b)Rk(b), (26) где Qk (X) — новый искомый многочлен, а Я*М=П <*-**)"• (27) В силу 6.726 и 6.756 мы имеем /#'(*,)= 0 {зфк, /=0, 1, ..., rs-V;
6.77] § 6.7. спектры, корпусы и многочлены 193 отсюда, каков бы ни был многочлен Qk(k), мы получаем, снова применяя 6.756, что Р^(К) = 0 (s^k, у=0, 1, ... , rs—\), так что условие (25) заведомо выполнено. Мы должны подчинить многочлен Рк(Х) условиям (24). Заметим, что Поэтому из условия величина Qk(Kk) однозначно определяется. Далее из условия /' (Хк) = Р'к(кк) = Q'k (кк) Rk (Кк) + Qk (Kk) R'k (kk) при известном уже Qk (Kk) однозначно определяется Q'k (кк)\ продолжая таким образом дальше, мы получаем возможность однозначно определить все числа Qk (А,л),ф*(А.л), • • ., Qkr'!~1) Скк). А имея их, мы можем определить и искомый многочлен Qk (X) по формуле Тейлора <?* М = L jr <ЯР (К) ^-КУ- (28) Возвращаясь по цепочке наших рассуждений, мы видим, что многочлен Рк (к), определенный формулами (26) — (28), удовлетворяет требуемым условиям (24) — (25). 6.77. Применяя 6.25г, получаем, что алгебра Q(S) всех корпусов на данном спектре изоморфна фактор-алгебре П/7, где /—идеал в П, образованный теми многочленами, для которых /х/>(Ьл) = 0, А=1, ... , т, у=1, ... , rk. Из 6.73г следует, что каждый многочлен Р (X) £ / делится на многочлен m Т(Х) = Ц (K-XkYK (29) /г=1 из 6.73в следует, что каждый многочлен Р(Х), делящийся на Т(к), входит в /. Идеал /, как и всякий идеал в алгебре П, порождается входящим в него многочленом наименьшей 7 Г. Е. Шилов
194 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА |6.78 степени (в.26). Таким многочленом является сам многочлен Т(Х). Следовательно, алгебра Q{S) изоморфна фактор-алгебре П//, где /—идеал, порожденный многочленом Т(Х). 6.78. Применим результат 6.77 к решению следующей задачи: описать все обратимые (6.21) элементы алгебры Q(S). Очевидно, корпус /, для которого хотя бы при одном значении у имеет место равенство f (Xk) -= 0, не может быть обратимым, поскольку в этом случае для любого корпуса g мы имеем (fg) (К) =f(h) g (К) = 0ф\=е (Xk). Рассмотрим корпус /, для которого /(Хк)фО (k= 1, ... , m). Пусть Р (X)— многочлен, для которого (6.76) f(bk) = P(h), •-.,firi<-1)(h) = Pirk-1)(h) (*=*. ... ,/и). Этот многочлен, таким образом, не имеет общих множителей с многочленом Т (X) (29); поэтому, согласно 6.28, существуют такие многочлены Q(X) и S(X), что P(X)Q(X)+T(X)S(X) = \. (30) Пусть q — корпус, отвечающий многочлену Q(X). Применяя к равенству (30) эпиморфизм П—+Q(S), построенный в 6.76, и используя тот факт, что при этом эпиморфизме многочлен Т (X) переходит в 0, мы получаем /4=1, т. е. корпус /обратим в алгебре Q(S). Итак, корпус f £Q(S) обратим. Как мы знаем из 6.21, для обратимого корпуса и разрешимо, притом единственным образом, любое уравнение вида их = v, где v — известный корпус, а х— неизвестный корпус. Для частного х = — можно найти явное выражение, последова-
6.79[ § 6.7. спектры, корпусы и многочлены 195 тельно решая уравнения. uCkk)xCkk)=v(kk), /=0 /5=1, . . . , /Я, Г = 0, 1, . . ., Гл. 6.79а. Спектр 5={Х[1, ... , Я,г™} с комплексными Я15 . . . , Я^ называется симметричным, если для любого невещественного Ял — ал-| ixk в 5 содержится и комплексно сопряженное число Хк = ок — iik с той же кратностью rk. Корпус / = {/{J) (Xk)\ на симметричном спектре S называется симметричным, если числа /(у) (Я*) комплексно сопряжены числам f(J) (Ял) (у = 0, 1, ... , гл). Если Р (Я)— многочлен с вещественными коэффициентами, то на симметричном спектре S корпус, образованный числами P(J) (Kk) (&= 1, ... , m, у—1, • •• , гк), симметричен, поскольку производные P{J) (к) также имеют вещественные коэффициенты и поэтому р^(11г)=1*Щ~к). (31) Обратно, для симметричного корпуса /={/(у)(^л)} на симметричном спектре S~{Xi\ ... , Я^?1} всегда можно найти многочлен Р0 (Я) с вещественными коэффициентами, для которого Р^ (Ял)=/(у) (ЯА) (£ = 1, . . . , /я, у = 1, . • ., гк). Действительно, по 6.76 можно построить многочлен Р(Я) с комплексными коэффициентами, удовлетворяющий требуемым условиям. Обозначим через Р (Я) многочлен с комплексно сопряженными коэффициентами. Тогда -1 [/*> (Я,) + Р</> (Я,)] = 1 [/*/> (Я,) +Р^МЯ,)] - = у[/;у)(Я,)+/уЧЯ,)]^Л')(Я,), т. е. многочлен Р0 (Я) = у [Р(Я) + Р(Я)], имеющий вещественные коэффициенты, удовлетворяет требуемому условию. б. Симметричные корпусы / на симметричном спектре S, очевидно, образуют алгебру над полем вещественных чисел. 7*
196 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.81 В силу б.25г эта алгебра изоморфна фактор-алгебре П//, где П — алгебра всех многочленов с вещественными коэффициентами, а /сП — идеал, образованный теми многочленами Р (К) £ П, для которых Р(/)(^) = 0, А=1, ... , тп, у=1, ... , rk, т. е. идеал, порожденный (вещественным) многочленом m /е=1 § 6.8. Функции от оператора и их матричная запись В этом параграфе строится исчисление функций от операторов: для каждого линейного оператора А, действующего в л-мерном пространстве Сп (или RJ, указываются матрицы Р (А) любого многочлена Р(А) или рациональной функции п,Лч- 0. (А) и правила действий над ними. В последнем пункте дается расширение операторного исчисления на аналитические функции. 6.81. Пусть дан оператор А в пространстве К,г Алгебра Пд всех операторов Р(А), где Р (К) есть некоторый многочлен, как мы знаем из 6.31—6.33, изоморфна фактор- алгебре П//д, где П — алгебра всех многочленов, а /А — идеал, порожденный минимальным аннулирующим многочленом Т(Х) оператора А. Пусть известно, что многочлен Т (Х) допускает в поле К разложение на множители m Т(К) = Л (X-XkY*. (32) /е=1 В силу 6.77 фактор-алгебра П//д изоморфна алгебре Q (S) всех корпусов, определенных на спектре S = Sa = = {Хгг1, .. . , К?) (спектре оператора А). Следовательно, и алгебра Пд изоморфна алгебре Q(Sa)» Явный вид этого изоморфизма можно получить следующим образом: каждому корпусу /£Q(Sa) отвечает класс много-
6.821 § 6.8. функции от оператора 197 членов Р(Х)£П таких, что (А=1, ... , т, у=0, 1, ... ,гк_г), (33) и каждому из этих многочленов отвечает один и тот же вполне определенный оператор Я (А) £Пд, который мы будем обозначать /(А). Далее мы укажем явный вид матрицы оператора Р(А) при заданных значениях (33), если матрица А дана в жор- дановой форме. 6.82. Пусть известно, что в некотором базисе пространства К„ оператор А записывается матрицей /2-го порядка специального вида (34) Х0 1 . 0 Х0 . 0 0 . 0 0 . .. 0 .. 0 .. 1 .. X, г. е. имеет вид X0E-f В, где В имеет матрицу В = 10 1 . 0 0 . 10 0 . 0 0 . . 011 . 0 . 1 . 0 Из 4.746 мы знаем, что матрица Bk имеет вид В* = 0 . 0 .. 0 .. 0 . k+1 .010. .001. .000. .000. . 0 . 0 . 1 . 0 k+1 (диагональ из единиц удалена от главной диагонали на k шагов).
198 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.83 Пусть PiX) — произвольный многочлен степени р; применяя формулу Тейлора (20), мы можем написать рм= E>*w^--v. k = 0 Заменяя X на символ оператора А, получаем равенство р р m=L рР,*)(^)(А-Х0Е)* = £ ±я<*>(Ь0)В*. к=0 ' к=0 Учитывая выражения матриц Вк, находим матрицу Р(А) = 2! (n-l)!^"1'^) 0 Р(Х0) Р'(Х0) ... j-L-/>(»-« (я,0) о о о Р(К ■ (35) Заметим, что для построения матрицы Р(А) от многочлена Р (X) нам понадобились только значения Р(Х0), Р' (Х0), ... ..., Р(п~1] (к0), где /г — порядок матрицы А. 6.83. Пусть теперь А записывается квазидиагональной матрицей А п-го порядка, состоящей из т диагональных клеток вида (34), где XQ пробегает значения Xl5 ..., Хт1 с размерами соответственно пх, ..., пт. В силу правил действий с квазидиагональными матрицами (4.52) вычисление Р(А) можно вести независимо для каждой диагональной клетки. Применяя 6.82, получаем: матрица Р(А) получается путем замены каждой диагональной клетки (34) матрицы А на клетку (35). Таким образом, для построения матрицы Р(А) нам требуются в данном случае значения P{J) (kk), k= 1, . . ., /и, j= 1, . . ., nm. 6.84. Пусть К—С есть поле комплексных чисел. Тогда для любого оператора А, действующего в пространстве К„ = Сп, минимальный аннулирующий полином имеет разложение (32), и существует базис, в котором матрица оператора А записывается квазидиагональной матрицей
6.85J § 6.8. функции от оператора 199 с клетками вида К 1 0 . 0 0 0. 0 0 0. . 0 . 0 . 1 . к (36) размера n)l)^,rk (6.37). Таким образом, оператор А определяет спектр Sa =■ {^Л . . •, km}. Если /—любой корпус на спектре Sа, то соответствующий оператор /(А) в силу рассуждений 6.81—6.83 имеет вид квазидиагональной матрицы, в которой каждая клетка вида (36) заменена на клетку ПК) ПК) ^/"(К) •■■ о /(К) ПК) ••• -J—/К-0 |i] <л'* —2>1 / К-«) (L (37) о оо ... /{К Этим задача изоморфизма алгебры Пд с алгеброй Q(S^) решена в явном виде. 6.85а. Остановимся еще на функциях от оператора, матрица которого в некотором базисе имеет вид (6.62) сг т 10 —т а 0 1 о т —т а (38) а т —т о где а и т — элементы из поля К.
200 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-85 Положим 1 0 0 1 л а т т а Матрицу Л можно записать в форме блок-матрицы с двустрочными квадратными блоками: Л 0 0 0 Е 0 Л Е 0 0 0 0 0 0 0 0 Л Е 0 Л Л 0 0 0 0 Л 0 0 о о о о Л О О Л + 0£ 0 . 0 0 Е . 0 0 0. 0 0 0. . . 0 0 [ .00 . 0£ . оо| Поэтому, так же как и выше, и на основании правила умножения блок-матриц (4.51) матрицу Р (А) можно записать в форме блок-матрицы с блоками того же размера р(к) Р(Л) Р'(Л) уР"(Л) ... ^^/><«-*> (Л) 0 Р(Л) Р'(Л) ... Im 1 оиР(и-2)(Л) (т — 2)! 0 0 О Р(Л) . (39) б. Если матрица Л квазидиагональна и состоит из диагональных клеток вида (34) и (38), то, так же как в 6.83, выводим, что матрица Р (А) получается заменой каждой диагональной клетки матрицы А на соответствующую клетку вида (35) или (39). в. Отметим случай, когда в a K—R и числа а и т вещественны. В этом случае для вещественного многочлена Р (к) можно явно указать в;-ц матриц Р(к) (Л), фигурирующих в формуле (39). Действительно, если ввести матрицу 0 1 — 1 0 то, как легко проверить, мы имеем /2=—Е> так что алгебра вещественных матриц Re X ImA, A = aE + xI о т — т о — \тХ ReX X = G -f- /T,
6.87J § 6.8. функции от оператора 201 изоморфна обычной алгебре комплексных чисел X (ср. 4.74а). Поэтому для любого многочлена Р (X) с вещественными коэффициентами Р(А) = Р(оЕ + %1)=: и соответственно pto(A) = P{k)(aE + xI) = ReP(X) \тР(Х) — \тР(Х) ReP(X) X = о + /т, RqP^(X) Im/**>(X) — \тР^(Х) Re/><*>(*,) 6.86. Пусть K=R; тогда для любого оператора А, действующего в пространстве K„ = R„, минимальный аннулирующий многочлен Т(Х) имеет вещественные коэффициенты и, следовательно, определяет симметричный спектр 5д. Алгебра операторов Р (А) изоморфна фактор-алгебре П//г, где П—алгебра многочленов с вещественными коэффициентами, а /г — идеал, порожденный многочленом Т(к). Эта фактор-алгебра изоморфна алгебре симметричных корпусов на спектре ST (6.79). С другой стороны, для оператора А существует базис, в котором матрица А оператора А ква- зидиагональна с диагональными клетками вида (34) или (38). Если теперь /—любой симметричный корпус на спектре 6"д, то соответствующая ему матрица f(A), в соответствии со сказанным выше, получается заменой каждой клетки (34) на (37) и каждой клетки (38) размера, положим, 2/я, на блок- матрицу 1 /(«-1>(Л) /(Л) /' (Л) 0 /(Л) (/71-1)! 1 (т — 2)! /(«-«) (Л) 0 0 ... /(Л) где двустрочные квадратные блоки f(k) (Л) имеют вид /(*>(Л) Refk)(l) 1т/(*>(Л) Im/<*>(&') Re/l*>(X) 6.87. Пусть А — линейный оператор в пространстве С„; какие операторы Р (А) (где Р (К) многочлен) обратимы?
202 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.88 Из выражения матрицы оператора Я (А) в жордановом базисе оператора А (36) видно, что т k detP(A)= П ^ (**)]"*, 2 пь = п. к• = 1 /1=1 Поэтому оператор Р (А) обратим в алгебре В (Сп) всех линейных операторов, действующих в пространстве Ся, тогда и только тогда, когда Р(Хк)фО, k---\, . .., т. Покажем, что при выполнении этого условия обратный оператор [Я (А)]"1 имеется уже в алгебре Пд. Действительно, в данном случае корпус р, отвечающий многочлену Р (X) в алгебре корпусов Q(S\), т. с. составленный из чисел гк-\ обратим в алгебре Q(Sa) (6-78); а так как алгебра Q(Sa) изоморфна алгебре Пд (6.81), то оператор Я (А) обратим в алгебре Пд. По тем же соображениям изоморфизма между алгебрами Q(Sa) и Пд в этом случае для любого многочлена Q(X) разрешимо в алгебре 11 д уравнение P(A).z(A)= 0(A) с неизвестным многочленом z (а). В соответствии с результатами 6.78 и 6.84 матрица искомого оператора z (А) в жордановом базисе оператора А клетки (36) на клетку вида 0.(Ял) [<Ш\ P(h) получается заменой каждой 0 P(h) 0 ОЛХ) [p(Dj}.=ik (40) истолковать еще и \ 6.88. Полученный результат можно следующим образом. Пусть S = \ХГХ\ ..., Хг,™\— некоторый спектр в комплексной плоскости. Обозначим через Т (S) совокупность всех комплексных рациональных функций f(X)=^*, где Q (X) и Р (X)—многочлены, причем МНОГОГО)
ft.891 § 6.8. функции от оператора 203 член Р (а) не имеет корней в точках множества 6*. В совокупности Т {S) введем по обычным правилам операции сложения, умножения на комплексные числа и умножения функций друг на друга, после чего совокупность Т(S) становится алгеброй над полем С. Далее заметим, что каждая функция /(а) £ Т(S) обладает производными /' (а), /"(X), ... в обычном смысле анализа. Если поставить в соответствие каждой функции /(a) £ T(S) корпус где f(J) (а) означает обычную производную от функции/(Л), то это соответствие будет морфизмом алгебры T(S) рациональных функций в алгебру Q (S) корпусов на спектре 6*, и именно эпиморфизмом, поскольку корпусы, отвечающие даже только многочленам Q(X), заполняют всю алгебру Q{S) (6.76). Пусть теперь спектр S = Sa есть спектр некоторого оператора А, действующего в пространстве Сп. Тогда алгебра Пд операторов Р (А) изоморфна алгебре корпусов Q(6*a), и мы можем имеющийся эпиморфизм Т (S a)—>Q(Sa) продолжить до эпиморфизма T(Sa) —*Па- Иными словами, мы можем поставить в соответствие каждой рациональной функции f (к) £ Т(S) линейный оператор /(А) £ Пд так, что соответствие /(а) —>/(А) будет снова эпиморфизмом. Матрица оператора /(А) строится по приведенному выше правилу (40). 6.89*. Вместо алгебры рациональных функций мы можем рассмотреть алгебру аналитических функций. Именно, пусть W(S) — совокупность функций /(а), аналитических в точках ^■1» • • •» ^т (т- е- аналитических каждая в некоторой окрестности указанных точек). Совокупность W(S) с обычными операциями сложения и умножения есть снова алгебра над полем С (содержащая алгебру T(S)). У аналитических функций также имеются производные любого порядка (в обычном смысле анализа); пользуясь ими, мы можем распространить эпиморфизм T(Sa)—*Па, построенный в 6.88, до эпиморфизма W (Sа) —► Па-Существенно, что в сферу действия этого эпиморфизма втягиваются теперь многие трансцендентные функции, встречающиеся в анализе, например, eu, sin оЛ, cosg)a и др. Если обозначить через /(А) оператор, отвечающий функции /(а)£№ (Sa), to матрица его в жордановом
204 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА базисе оператора А вычисляется по тому же правилу (37). Отметим, например, формулу e(tx+tt)k — etxkettk вытекающую непосредственно из тождества e^ti + t^ *• = е^хе(^ и из того факта, что отображение W(Sa)~► Па является эпиморфизмом. Результаты 6.87— 6.89, относящиеся к линейным операторам в комплексном пространстве, можно перенести на линейные операторы в вещественном пространстве, используя вещественную жорданову форму и метод 6.85 — 6.86. В таком переносе уже не требуется использование никаких новых идей и мы можем предоставить его читателю. ЗАДАЧИ 1. Матрица оператора А в некотором базисе еъ ...,еп имеет вид II % II U U II 1 к II В каком базисе она будет иметь нормальную жорданову форму? 2. Доказать, что матрица А и матрица А' (полученная транспонированием матрицы А) всегда эквивалентны. 3. Найти жорданову форму матрицы || __2 —1—13 2 || —4 1—1 3 2 1 1 о —3 —2 . —4 —2—1 5 1 II 1 1 1 —3 0 || 4. Эквивалентны ли операторы, заданные матрицами 1 1 0 0 1 0 0 0 2 . в = \
ЗАДАЧИ 205 5. Найти элементарные делители матриц п-го порядка Аг = Ал = 0 0 /г —1 п — 2 п п— 1 О п Л,= 112 3.. 0 12.. 0 0 1. J 0 0 0 . п II . п — \ . 0 1 | 0 0 0 ... п 6. Показать, что все матрицы > -™4 — 111. 0 2 2. 0 0 3. 0 0 0. . 1 II . 2 . 3 • п 1! А = элементами а™ а аи 0 а 0 0 0 0 > а13> ^13 • я2з • а . 0 . • «1Л .. а2п • а3п .. а квивал с любыми элементами д12, fli3, • • • эквивалентны, если элементы а12, д23, ..., ап_1п отличны от нуля. 7. Найти жорданову форму матрицы Л, удовлетворяющей уравнению Р(А) = 0у где многочлен Р (X) не имеет кратных корней. 8. Найти жорданову форму матрицы Л, удовлетворяющей уравнению Р(Л) = 0, где Р (К) — произвольный многочлен. 9. Если аннулирующий многочлен оператора А есть многочлен 2-й степени, то любой вектор х пространства R лежит в инвариантной (относительно А) плоскости или прямой. 10. Найти все матрицы, коммутирующие с матрицей а 10 ... 00 0 а 1 ... 0 0 Ат(а) = 0 0 0 0 0 0 . а 1 . 0 а т строк. 11. Найти все тХя-матрицы В> удовлетворяющие условию ВАп(а) = Ат(а)В. 12. Найти все матрицы, коммутирующие с квазидиагональными матрицами вида [а) (а) ... •• АтЛа) тк
206 ГЛ. 6. КАНОНИЧЕСкАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА 13. Найти все матрицы, коммутирующие с квазидиагональными матрицами вида Mm.W 0 ... О II О Ат2(а2) ... о II о о ••• лт,.М1 где все числа а1у а2, ..., ak различны. 14. Найти все матрицы, коммутирующие с общей жордановои матрицей (8). 15. При каком условии всякая матрица, коммутирующая с некоторой матрицей А, есть многочлен от Л? 16. Показать, что в вещественном пространстве R„ размерности л^2 каждый линейный оператор имеет инвариантную плоскость.
ГЛАВА 7 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ В этой главе мы будем изучать числовые линейные функции двух векторных аргументов. В отличие от случая линейных числовых функций одного аргумента теория линейных числовых функций двух аргументов — билинейных форм — имеет богатое геометрическое содержание. Положив в выражении билинейной формы второй аргумент равным первому, мы получаем новый важный класс функций одного переменного, уже нелинейных — квадратичных форм. В §§ 7.1—7.8 рассмотрения ведутся в линейном пространстве К над произвольным числовым полем /С, в § 7.9 — в вещественном линейном пространстве. § 7.1. Билинейные формы 7.11. Числовая функция А (л:, у) от двух векторных аргументов л*, у в линейном пространстве К называется билинейной функцией или билинейной формой, если она является линейной функцией от х при каждом фиксированном значении у и линейной функцией от у при каждом фиксированном значении х. Иными словами, А (л*, у) есть билинейная форма от х и у, если для любых х, у и z из К и любого а£К удовлетворяются равенства А (* +z, у) = А (х, у) + А (z, у), А (ал% у) = аА(х, у), А(х, y + z) = A(x, у)+А(х, г), А (х, осу) — а А (л*, у). Первые два из этих равенств означают линейность функции А (л:, у) по первому аргументу, последние два—линейность по второму аргументу. (и
208 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.12 Из определения билинейной формы, используя равенства (1), легко получим общую формулу / k m \ k m А 2 «,*„ 23 Р/У/ =22 «/Ру А (х,, Л.), (2) \/=1 j= 1 / /=|j=l в которой ATj, х2, ..., хл, д^, .., ут— произвольные векторы пространства К, а ах, а2, .. . ., ал, рх, Р2, ..., $т — любые числа из К. Билинейные формы, заданные в бесконечномерных пространствах, называют обычно билинейными функционалами. 7.12. Приме ры. а. Если L1(x) и L2(x)—-линейные формы, то А(х, у)~ = LL (x)-L2 (у) является, очевидно, билинейной формой от х и у. б. В л-мерном линейном пространстве с фиксированным базисом еъ е2, ..., еп примером билинейной формы является функция п п где х = 2 S/^m .У — 2 ЛЛ — произвольные векторы и я//г (/, &=1, 2, ..., л)— фиксированные числа. 7.13. Общий вид билинейной формы в л-м е р- ном линейном пространстве. Пусть в л-мерном линейном пространстве Кп задана билинейная форма А (л:, у). Выберем в К„ произвольный базис еъ е2, ..., еп. Положим A(eh ek) = aik(i, k = 1, 2, ..., л). Тогда для любых п п *= 2 heh У=1& 4kek согласно формуле (2) I п п А(х, у) = А 2 Б,-*/, 2 ЛЛ \ / = 1 а? = i п п п п = 23 23 1,-л*А(*,-. <у = S S «,•*!,•%; (3)
7.14) § 7.1. билинейные формы 209 Таким образом, в примере б мы имели самый общий вид билинейной функции в л-мерном линейном пространстве. Коэффициенты aik образуют квадратную матрицу. ап а12 ... а1п а2Х а22 • • • а2п i а„л а„0 . . . а„„ которую мы будем называть матрицей билинейной формы А(х, у) в базисе {е} = {elt e2, ..., еп). 7.14. Симметричные билинейные формы. Билинейная форма называется симметричной, если для любых векторов х и у А(х, у) = А{у, х). Если билинейная форма А (х, у) в л-мерном пространстве К„ симметрична, то aik = A(eh ek) = A(ek, e()=aki; следовательно, матрица Л{е) симметричной билинейной формы в любом базисе ev е2, . .. , еп пространства К„ совпадает с транспонированной матрицей Л{е). Легко проверить, что верно и обратное: если в некотором базисе {е} = = {ег, е2, ... , еп} А{е)=Л(е), то форма А (х, у) симметрична; в самом деле, в этом случае п А (.у, х)= 2 aikr\ilk = i, k=\ п п = 2 <tkii\ilk= 2 а'£к1мк = А(х, у), i, k=l k, l=\ что и утверждалось. В частности, мы получаем: если матрица билинейной формы А(х, у), вычисленная в некотором базисе, совпадает с транспонированной матрицей, то в любом другом базисе пространства Кп матрица этой фор,мы также совпадает с транспонированной. Матрицу, совпадающую с транспонированной матрицей, мы будем называть в дальнейшем симметричной. =н«»и,
210 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (7.15 7.15. Преобразование матрицы билинейной формы при переходе к новому базису. а. При переходе к новому базису матрица билинейной формы, разумеется, изменяется; найдем закон ее изменения. Пусть А(е) = || dji || — матрица билинейной формы А (л:, у) в базисе {e\ = {ev е2, ..., еп} и Л(/) =-1| Ь/л ||— матрица той же формы в базисе {/} = {/lf /2, ..., fn) (/, у, /г, /=1, 2, ..., п), и пусть формулы перехода от одного базиса к другому имеют вид п /,= 2^4 (/=1, 2, ...,я) с матрицей перехода Р=^\\р(Р\\. В таком случае */* = А (fn А) = А ( S />}% S Р\к}е) = \/=i /=i / = 2 Pfp^(ej% eL)= 2 P}Vi%. Полученную формулу мы запишем в виде ** = 2 2р;/,Ч^). (*) где р//')'=р}/) — элемент матрицы Р', транспонированной по отношению к матрице Р. Формула (4) отвечает следующему соотношению между матрицами (4.43): Аф = Р'АмР. (5) б. Так как матрицы Р и Р' невырождены, то в силу 4.67 ранг матрицы Аф равен рангу матрицы А(е)\ следовательно, ранг матрицы билинейной формы не зависит от выбора базиса. Поэтому имеет смысл понятие ранга билинейной формы, определяемого как ранг матрицы этой формы в любом базисе пространства К„. Если форма А (х, у) имеет ранг п, равный размерности пространства К„, она называется невырожденной формой. в. Пусть А(х,у) — невырожденная форма; покажем, что для каждого вектора х0Ф0 существует вектор у0 £ К„, для которого А (д:0, у0)ф0. Допустим противное, т. е. что
7.15] § 7.2. квадратичные Формы 211 А (л*0, у) ^ О при каждом у£К,г Построим базис еъ . . . , еп в пространстве К„ так, что ег = х0. Тогда в матрице формы А (л:, у) в этом базисе мы будем иметь при любом т= 1, . . . , п fli« = A(e1> ет) = к(х0, ет) = 0, так что вся первая строка матрицы состоит из нулей. Но тогда ранг этой матрицы < я, что противоречит предположению о невырожденности формы. Это доказывает утверждение. г. Заметим, что форма А (х, у), невырожденная во всем пространстве К, может быть вырожденной на подпространстве К' с К. Так, в пространстве R2, где x = (%v 52)> ^ = 011» %)> форма А(л-, у) = 11Ц1 — 12Ц2 невырождена; однако на подпространстве R'2 с R2, где £1 = £а (и % — г|2), она тождественно равна 0. д. Для определителей наших матриц в силу теоремы об определителе произведения матриц (4.75) получается соотношение deM(/) = deti4(e)(detC)2. (6) § 7.2. Квадратичные формы В аналитической геометрии на плоскости одна и? основных задач состоит в приведении общего уравнения кривой 2-го порядка к каноническому виду путем перехода к некоторой новой системе координат. Уравнение центральной кривой 2-го порядка с центром в начале координат * = 0, у = 0, как известно, имеет вид Ах'* + 2Вху + Су* = D. (7) Преобразование координат производится по формулам х = апх' + а12у\ у=апх' +а2*у', где а1Ъ а12, a2i» а22 — некоторые числа (обычно синусы и косинусы угла поворота осей)- В результате уравнение (7) приобретает более простой вид: Л'*'24-ВУ2 = 0. Аналогичная задача может быть поставлена в пространстве любого числа измерений. Теория квадратичных форм, излагаемая далее, основной своей целью имеет решение этой задачи и задач, связанных с нею.
212 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.21 7.21. Введем следующее определение. Квадратичной формой в линейном пространстве К называется функция А (дг, х) от одного векторного аргумента дг£К, которая получается из произвольной билинейной формы А (дг, у) заменой у на х. В л-мерном линейном пространстве К„ с фиксированным базисом { е } = { ev е2, .. ., еп } каждая квадратичная форма в силу формулы (2) имеет вид А (х, х) = 2 2 alkUk, (8) /=1 /5=1 где £х, £2, ..., £„ — координаты вектора д; относительно базиса {е}. И наоборот, если задана функция А (дг, д:) от вектора х, определяемая в базисе {е} формулой (8), то эта функция представляет собой квадратичную форму от вектора х. Действительно, мы можем ввести билинейную форму п п /=1Л=1 где %, т]2, . • • , т)л — координаты вектора ^у относительно базиса {е}; тогда очевидно, что квадратичная форма В(дг, дг) совпадает с функцией А (л;, л;). 7.22. Заметим, что в двойной сумме (8) можно совершить приведение некоторых подобных членов: при i=fck мы имеем aikhlk + akilkli = i<*ik + aki) hh = biblilb где bik = aik + aki- Для i~k полагаем bu=au- В результате двойную сумму можно записать с меньшим числом слагаемых: п А (х, дс) = 2 2 */»5Д*. k-l i <&
7.22] § 7.2. КВАДРАТИЧНЫЕ ФОРМЫ 213 Отсюда следует, что 'две различные билинейные формы п п А (х, у) = S aikli4k и С (*, jO = 2 сд&ти можно иногда после замены у на х привести к одной и той же квадратичной форме; для этого нужно только, чтобы имело место равенство aik-\- aki = cik-\- cki для любых / и k. Таким образом, вообще говоря, нельзя однозначно восстановить по квадратичной форме породившую ее билинейную форму. В одном случае исходная билинейная форма восстанавливается однозначно: именно, если известно, что она была симметричной. В самом деле, если aik = aki, то из уравнения aik-\- aki — bik (при i Ф k) коэффициенты aih однозначно определяются: bik (9) и при / = А аи = bih а вместе со всеми aik однозначно определяется и вся билинейная форма. Это утверждение можно доказать и не прибегай к базису и координатам; в самом деле, по определению билинейной формы А(х+у, х+у) = А(х, х) + А(х, у) + А(у, х)+А(у, у) и при условии симметрии А(аг, <у)=у[А(дг> у) + А(у, *)]=" = -%[А(х+у, х-\-у) — А(х, х) — А(у,у)]\ таким образом, значение билинейной формы А (дг, у) для любой пары векторов дг, у однозначно определяется по значениям квадратичной формы на векторах дг, у и х-{-у. С другой стороны, чтобы получить из билинейных форм все возможные квадратичные формы, достаточно иметь одни лишь симметричные билинейные формы. В самом деле, если А(х, у) — произвольная билинейная форма, то Ai (*> У) = т [А (*> У) + А 0>> *)]
214 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.23 есть симметричная билинейная форма, и А^х, *) = y[A(*, *) + A(*, *)] = A(*, л:), т. е. квадратичные формы Ах (х, л:) и А (х, х) совпадают. 7.23. В силу всех этих соображений при использовании билинейных форм для изучения свойств квадратичных форм достаточно ограничиться рассмотрением одних только симметричных билинейных форм и соответственно симметричных матриц ||аул|[, aJk = akJ. Симметричная матрица Л = ||ау7г|| симметричной билинейной формы А (х, у), отвечающей квадратичной форме А (х, х), называется матрицей формы А(х, х). При изменении базиса матрица А квадратичной формы А (х, х), совпадающая с матрицей соответствующей симметричной билинейной формы А (х, у), меняется так же, как и эта последняя: Аф — Р А{е)Р, где Р—матрица перехода от базиса {е} к базису {/}. В частности, ранг матрицы квадратичной формы не зависит от выбора базиса. Поэтому можно говорить о ранге квадратичной формы А (х, JC), подразумевая под ним ранг матрицы этой формы в любом базисе пространства К„. Квадратичная форма ранга л, равного размерности пространства, называется невырожденной. § 7.3. Приведение квадратичной формы к каноническому виду 7.31. Пусть дана произвольная квадратичная форма А (я, л;) в я-мерном линейном пространстве К„. Покажем, что в пространстве К„ существует базис {/} = {/х, /2, ... , /п\, п в котором для каждого вектора х = 2 Лл/л значение квад- k= 1 ратичной формы А (х, х) вычисляется по формуле А(х, х) = ^1 + ^1)1+ ... +X,rfn, (10) где Х1? К2у ••• 1 кп —некоторые фиксированные числа.
7.31] § 7.3. приведение формы к каноническому виду 215 Всякий базис, обладающий этим свойством, будем называть каноническим базисом формы А (х, х), а выражение (10) — каноническим видом формы А (л\ х); в частности, числа Кх, к.>, . . . , %п будем называть каноническими коэффициентами формы А (л:, х). Пусть {еъ е2, ..., еп} — произвольный базис про- п странства К„; если х — 2 £а» то» как мы Уже знаем, форма А (л:, х) имеет следующий вид: А(х, х)=2 2 bikUk- (И) Согласно 5.32 наше утверждение будет доказано, если мы сможем написать формулы *ll =Pllll+Pl2%2+ • • ' +РшЪпЛ 42=^2151+^2^2+ ' '• + />2«S/«» I (1Г) Tl/i=Ail5l + /^2 + ' ' ' + Ai«£« J с невырожденной матрицей P=||/?/.fe|| и такие, что, выражая координаты {£} в формуле (11) через величины {г|}, мы преобразуем формулу (11) к виду (10). Будем вести доказательство индукцией но числу координат, фактически входящих в формулу (11) (т. е. с отличными от нуля коэффициентами). Предположим, что каждая форма, содержащая m—1 координат (например, с;,, |.2, ..., |W_A), может быть приведена к каноническому виду (10), с п = т—1 преобразованием (1Г), также с п-=/п—\. Если в формулу (11) фактически входит лишь одна координата, например £1? т. е. формула (11) имеет вид А (а:, х)-ЬпЦ то это предположение, очевидно, выполняется (можно взять рпф0 произвольно). Пусть теперь имеется форма (11),фактически содержащая/» координат |ъ £2, . . . , £/Л. Допустим вначале, что среди чисел Ьп, &32, . . . , Ьтт имеется число, отличное от нуля; предположим для определенности, что Ьтгп^-0. Выделим в форме (11) группу членов, содержащих координату £Л;
216 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (7.31 эта группа имеет вид ЬщЛгЪт + ^2тЪ2Ът + • • • +^-1, т Ъ/л-15/я ~Г" ^тпЛт =* — /7 ( ^1т £ I ^2/я i I I bm-Um* it ^2 _r + A1(*, *) (12) где через Ах (л:, л:) обозначена квадратичная форма, зависящая только от величин £х, £2, . . . , \m_v Рассмотрим следующее преобразование координат: Т2 = Ь2» Тю-1 — Ь/л-1» т ^1/я £ | ^2/я £ | | ^m-Urn £ it 1/л оь bl ~Г Ob Ъ2 "Г • • • "Г 9Ь 5/я-1 "Г Ъ/я- ^итт ^итт ^итт Матрица этого преобразования невырождена (ее определитель равен 1). В новых координатах форма А (л;, лг) очевидно, принимает вид А(лг, лг) = В(*, х) + Ьятх*1, где квадратичная форма В (л:, л:) зависит только от величин xv т2, ..., гт_1. В силу предположения индукции существует новое преобразование Л1 =Pli*l+Pl2X2+ • • • +Ph m-lXm-l, ^ =P21T1+/?22T2+ • • • +Р2, т-1Хт-Ъ (13) Л/л-г —Рт-1, 1Т1 "ЬЛя-1, 2Т2+ • • • +Р/Я-1, /я-1Т/л-1 с невырожденной матрицей Р= Ц/^.Ц , которое приводит форму В (л:, х) к каноническому виду В (л:, х) = X^f + Vl* + • • • + ^-ii-i. Если мы добавим к равенствам (13) еще одно равенство то получим невырожденное преобразование координат х1у
7.31] § 7.3. приведение формы к каноническому виду 217 форма А (л:, х) примет канонический вид А(х, *) = В(*, х)+Ьттт*1=> Прямой переход от координат {£} к координатам { ц} в силу 5.33 осуществляется с помощью матрицы, равной произведению матрицы перехода от координат {т} к координатам {г\\ на матрицу перехода от координат {£ } к координатам {т}. Так как обе эти тхт- матрицы невырождены, то и тхт- матрица-произведение тоже невырождена. Нам остается рассмотреть случай, когда в форме А(х, х) с т координатами \х, £2, . .. , \т все числа аи, а22' • • • » атт равны нулю. Рассмотрим один из членов Д/у-ъ/Е/ с отличным от нуля коэффициентом а/;-; например, пусть а12ф0. Произведем следующее преобразование координат (для удобства рассуждения выпишем переход от новых координат к старым): u = i\-vt, \ <14> gy=£j (j=3,...,m). ) Определитель матрицы преобразования (14) равен —2, и, таким образом, это преобразование снова невырожденное. Член a12Si^2 преобразуется следующим образом: а12^1^2 = а12^1 #12^2 \ поэтому в преобразованной форме появятся сразу два квадрата координат с ненулевыми коэффициентами (очевидно, что сократиться с остающимися членами эти квадраты не смогут, ибо все остающиеся члены содержат координату \] с />2). Таким образом, в координатах \'( к форме (11) уже можно применить наш индуктивный метод. Итак, форма (11), с любым числом т^п фактически входящих в нее координат £., приводится к виду (10) преобразованием (1Г), где п заменено на т. Дописывая при необходимости равенства г\т + 1 = 1т + 1, •••,'Пл==1л» мы можем дополнить систему (И') до требуемой системы из п уравнений с невырожденной матрицей Р=\\ p(j- || , ij= 1, . . ., я, чем доказательство и завершается.
218 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.32 Идея нашего доказательства — последовательное выделение полных квадратов — может быть применена и для фактического приведения данной квадратичной формы к каноническому виду. В § 7.5 будет описан другой метод, позволяющий непосредственно получить векторы искомого канонического базиса и канонический вид формы. 7.32. П р и м е р. Приведем к каноническому виду форму А(*. *) = Ei + 66!g2+ 5El-46,E3-12S263+4g;-4g2g4-8g8E4-6!- Дополняем группу членов, содержащую |ь до полного квадрата и полагаем *h = £i + 3?2-2!3. Тогда форма преобразуется к виду А(*. дг) = л! — 4Б5 — 4£2g4 — 86sg4-й- Далее дополняем группу членов, содержащую |2, А° полного квадрата и полагаем после чего мы будем иметь А(х, х) = и}\ — гЦ — 86з64- Квадраты координат |3 и g4 отсутствуют. Поэтому мы полагаем так что lili = r)t—r\l Таким образом, форма А (х, х) приведена к каноническому виду А(х, x) = K\i — t\l — Sr\l + Sr\i преобразованием 4i = 5i + 3Eo-258, ti2-2g2 + g4f « - 1 * 1 ! - « - ! * _L ! P ЛЗ — ТГ S3 ■ "2" S4> 44 ~-— ~ ЪЗ + 7Г ^4» которое, как видно из построения, невырождено. 7.33а. Ни канонический базис, ни канонический вид квадратичной формы не определены однозначно. Например, любая перестановка векторов канонического базиса приводит вновь к каноническому базису. В § 7.5, между прочим, будет показано, что для данной квадратичной формы можно построить канонический базис, взяв первый вектор этого базиса
7.33] § 7.3. приведение формы к каноническому виду 219 в пространстве произвольно (за некоторыми редкими исключениями). Далее, если форма А (л;, х) записана в каноническом виде (Ль Лг> • • • »Лл — координаты вектора л:), то преобразование координат т]1 = а1т1, Л„ = аптп (cq, а2, . .. ,а„— фиксированные числа, все отличные от нуля, т1? т2, . ..,тл — новые координаты) приводит форму А (л:, л:) к новому виду, также каноническому, но с другими коэффициентами: А (*, *) = (К,а\) т{ + (12а\) т; + . .. + (кп*\) х\. Поэтому встает вопрос об описании всех канонических видов, к которым можно привести данную квадратичную форму. Этот вопрос будет уточнен, если мы сузим определение канонического вида (например, как это будет сделано в вещественном пространстве, 7.93) или сузим класс допустимых преобразований координат (например, как это будет сделано в евклидовом пространстве (10.12)). б. Заметим, что в приведенном примере число коэффициентов, отличных от 0, осталось неизменным. Вообще, число ненулевых канонических коэффициентов, очевидно, есть ранг матрицы квадратичной формы в соответствующем каноническом базисе. Поскольку ранг матрицы квадратичной формы не зависит от выбора базиса (7.23), число ненулевых канонических коэффициентов квадратичной формы не зависит от выбора канонического базиса. Это число, очевидно, совпадает с рангом квадратичной формы (7.23). Зная матрицу формы А(х,х) в каком-либо базисе {е}, мы можем предсказать число ее ненулевых канонических коэффициентов— это число есть ранг формы А (л:, л:), который можно вычислить как ранг матрицы формы А (х, х) в базисе \е\. В частности, у невырожденной формы (7.23) в любом каноническом базисе все ее канонические коэффициенты отличны от 0.
220 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.41 § 7.4. Канонический базис билинейной формы 7.41а. Вектор хг называется сопряженным с вектором^ относительно билинейной формы А(х,у), если A(*i,.yi) = 0. б. Пусть \\а;-к\\—матрица формы А(х,у) в каком-либо базисе е1у ...,еп. Если x1 = ^llkekJ Уг^^^/у то условие сопряженности векторов хг и уг записывается в виде п А(х1,у1) = 2 aJkljr\k = 0. /. k=\ в. Если векторы хг, х2, ... , xk сопряжены с векторомylf то также сопряжен с вектором уг любой вектор подпространства L(xv х2, . . ., xk) — линейной оболочки векторов Xi, Х2, « « • , Xfo. Действительно, в силу свойств билинейной формы A(a1*1 + a2*2+ ... +cckxk,y1) = = аг А (хг, уг) + а2А (х2, уг) + ... + алА (хк, уг) = 0. Если вектор у1 сопряжен с каждым вектором некоторого подпространства K'czK, мы будем называть этот вектор сопряженным к подпространству К'. г. Совокупность К" всех векторов у1 £ К, сопряженных к подпространству К', очевидно, является, подпространством пространства К. Это подпространство К" мы будем называть сопряженным к К'. 7.42. Базис ег, е2, ---,еп пространства К называется каноническим базисом для билинейной формы А(х,у), если базисные векторы взаимно сопряжены: A {eh ek) — 0 при / Ф k. Пример. В пространстве V3 в качестве билинейной формы А (дс, у) рассмотрим скалярное произведение векторов х и у. Сопряженность векторов относительно этой билинейной формы равнозначна, очевидно, их ортогональности. Каноническим базисом в этом случае служит любой ортогональный базис пространства V3. 7.43. Матрица билинейной формы в каноническом базисе имеет диагональный вид, так как aik = A (eh ek) = 0 при 1фк. Диагональная матрица совпадает со своей транспонированной, поэтому билинейная форма, обладающая канони-
7.44) § 7.4. канонический базис билинейной формы 221 ческим базисом, должна быть симметричной*). Покажем, что каждая симметричная билинейная форма А(х,у) обладает каноническим базисом. Рассмотрим квадратичную форму А (х, х), соответствующую данной билинейной форме А(х,у). Мы знаем, что в пространстве К существует базис ех, е2, ...,еп, относительно которого квадратичная форма А (л:, х) записывается в каноническом виде п А(х, *)=2Щ Соответствующая симметричная билинейная форма А(х,у) согласно формуле (9) имеет канонический вид A(x,y)=flXilir]i. (15) п \ где д>= 2 Л/^/)» ее матрица, следовательно, диагональ- /=i / ная. Но это и означает, что базис еъ е2, . . ., еп является каноническим для формы А(х,у). 7.44. В аналитической геометрии доказывается, что геометрическое место середин хорд кривой 2-го порядка, параллельных заданному вектору, есть прямая линия. Приведем доказательство этой теоремы. На плоскости хъ х2 уравнение кривой 2-го порядка имеет вид anxl + 2а12хгх2 + а22х\ + Ь1х1 + Ь2х2 + с = 0> или А (л;, x) + L(x) + c = 0, где А (*, х) = апх\ + 2а12ххх2 + а22х\ есть квадратичная, а L(x) = b1x1 + b2x2 — линейная форма от вектора х = (лг1? х2). *) Вспомним, что симметричность или несимметричность билинейной формы — факт, не зависящий от выбора базиса (7.14).
222 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.45 Пусть вектор х определяет середину хорды, параллельной фиксированному вектору е. Это означает, что для некоторого /=^=0 удовлетворяются равенства А (х Н- te, x + te) + L(x + te) + c = 0, \ A(x — te, x — te) + L(x — te) + c--=0. J ^ Пусть A(x,y)— симметричная билинейная форма, отвечающая квадратичной форме А(х, х); тогда равенства (16) можно записать так: А (д:, х) + 2/ А (х, е) + t2A (е,е) + L (*) + t L (е) + с = 0, А (я, х) — 2/ А (х, е) + /2А (е,е) + L (х) — / L (е) + с = 0. Вычитая второе из первого и сокращая на 2/, находим 2A(jc, e)+L(e) = 0. (17) Полученное уравнение линейно относительно х и, следовательно, определяет прямую в плоскости хг, х2, что и доказывает теорему. Если х' — другая точка этой же прямой, так что 2А(х\е)+Це) = 0, (18) То, вычитая (17) из (18), мы получаем А (х — х\ е) = 0, т. е. вектор е и вектор х — х', определяющий направление полученной прямой, сопряжены друг другу в смысле 7.4J относительно билинейной формы А(х,у). 7.45. Пусть еъ . . ., ek — канонический базис формы А (х,у) в ^-мерном подпространстве К'с:К. Пусть еъ . . . , гк — соответствующие канонические коэффициенты. Выразим числа A(x,ej) через координаты вектора лг£К'. Мы имеем / * \ A(xf ej) = Al 2 l)er */) = k = 2 lj A (*/, *,-) = lt A (eh et) = е&, /=' так что числа А (х, efi однозначно определяются координа-
7.52] § 7.5. построение базиса по методу якоби 223 тами вектора х. Если форма А (х, у) невырождена в подпространстве К', то числа Е; отличны от нуля; в этом случае справедливо и обратное—значения формы k{x,ei) однозначно определяют координаты вектора х. § 7.5. Построение канонического базиса по методу Якоби 7.51. Построение канонического базиса, приведенное в 7.31, имеет тот недостаток, что оно не дает возможности непосредственно, по элементам матрицы Аф симметричной билинейной формы А {х,у) в заданном базисе {/} = {/\//2, • • -,/п} указать коэффициенты Xi и координаты векторов канонического базиса. Метод Якоби, излагаемый далее, позволяет находить эти коэффициенты и координаты векторов искомого канонического базиса. Но при этом на матрицу Л{^ мы наложим следующее дополнительное условие: угловые миноры матрицы A(f) до (п—1)-го порядка включительно У) 6i «11. б2 А-1 11 а с 21 12 '22 1, п-1 '2, п-1 1,2 п-1, п-1 все должны быть отличными от нуля. 7.52. Векторы ех, е2, • . ., еп мы построим по формулам *i=/i. ^2=ail)/i+/2. ^s = ai27i + a(22,/2+/3, лк) (к) ек + 1 = «Г/\ + <>А + аУА+ ••• +а{*>Л+Д+1, г/Ш-1) Л +аГ1,Л+аГ1,/з+ • • • +<п-Г/п-1+/п, J (19) где коэффициенты a\k) (i—\,2,...,k; k= 1, 2, . . ., п—1) еще должны быть определены.
224 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.52 Заметим прежде всего, что Л.Л» ••■»/* к векторам помощи матрицы 1 0 а<Х) 1 а^"Х) а^~1) е1? е2, . . 0 0 r,(k-l) u-з . • • переход •I Ч 0 0 ak-l от векторов совершается при 0 0 1 с определителем, равным единице; поэтому для k= 1, 2, . . ., п векторы /1? Д, . . ., Д могут быть линейно выражены через /г» L [Л, Л, ■ • •, Л] следовательно, совпадает с линейная линейной оболочка оболочкой ц, 1' г2> ■)■ Коэффициенты a$k) (I = 1, 2, . . . , k) мы подчиним условию, чтобы вектор ££+1 был сопряжен с подпространством 2 » * ■Л + 1 Для этого необходимо и достаточно, чтооы выполнялись равенства A (ek + 1, Д) = О, А (еА + 1> /2) = 0, . . ., A (ek+l, Д) = 0. (20) Действительно, из условий (20) вытекает, что вектор ек+1 сопряжен с линейной оболочкой векторов Д, Д, . . . , Д, которая но доказанному совпадает с линейной оболочкой векторов еъ е2, . . ., ek. Обратно, если вектор ek + 1 сопряжен с подпространством L [еъ е2, . . ., ek], то он сопряжен с каждым вектором этого подпространства и, в частности, с векторами Д, Д, ..., Д; поэтому выполняются равенства (20). Подставляя в формулы (20) выражение ek + 1 (19) и пользуясь определением билинейной формы, получаем систему уравнений относительно величин а^)(/=1, 2, . . ., k): А (ек+1. Д) = а* А (Л, Л) + а</> А (Д, Д) + ... ••• + <4*,А(Д,Д) + А(Д+1)Д) = 0, А (ек+1, /2) = < А (Д, Д) + а<2*> А (Д, Д) + . .. .. . + < А (Д, Д) + А (Д+1, Д) = 0, А*(е*+1, Д) ='oi*» А (Д,'Д) + а<*> А (Д, Д) +.'..' •••+^,А(Д,Д) + А(Д+1)Д) = 0. Эта неоднородная система уравнений с коэффициентами А (//, /}) = Я//(*\ У= 1, 2, . . . , /г) имеет по условию отличный (21)
7.53] § 7.5. построение базиса по методу якоби 225 от нуля определитель и поэтому однозначно разрешима; следовательно, можно определить величины а^ и тем самым построить искомый вектор ek+1. Для определения всех коэффициентов a\k) и всех векторов ek нужно при каждом k разрешить соответствующую систему (21), следовательно, всего разрешить п—1 систем линейных уравнений. 7.53. Обозначим координаты вектора х в построенном базисе еъ е2, . . ., еп через £1? £2, . . ., £я и координаты вектора у в этом базисе соответственно через г)х, т]2, . . . , г\п. Билинейная форма А (х, у) в этом базисе принимает вид п А(*,.У)=2*/5«Л/. (22) Чтобы вычислить коэффициенты hj, будем рассуждать следующим образом. Рассмотрим нашу билинейную форму А(х,у) только в подпространстве Lm = L(el, е2, . . ., ет)} где т^п. Форма А(х,у) в базисе /i,/2, . . . , fm подпространства Lm имеет, очевидно, матрицу IIаг1 а12 ... а1т [I #21 #22 * * * а2т II ит\ ит2 * * * итт а в базисе еъ е2, . . ., ет — матрицу Матрица перехода от базиса /х,/2, . . .,/т к базису еъ е2, ...,ет, отвечающая формулам перехода (19), имеет, как мы видели, определитель, равный 1. В силу формулы 8 Г. Е. Шилов
226 ГЛ. 7. БИЛИШ-ЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.54 7.15 (6) мы должны иметь det tfoi a 22 1/л 2/л = dct \ или, используя обозначения угловых миноров 7.51, Sm = Kh ---К (/и=1, 2, .. ., /г). Из формулы (23) непосредственно вытекает, что &2 л Йя л б, Х1 = б1 11 ^ к = 1 кп fi/i-i (23) (24) Формулы (24) позволяют найти коэффициенты билинейной формы в каноническом базисе, не вычисляя самого базиса. 7.54. Обратим внимание на /мо формулу в системе (19); запишем ее в форме Л + 1 = -аГ/1 аГЛ + ^1 = йт«| В этой формуле вектор gk лежит в подпространстве L (/*1? ...,Д), а рл + 1 сопряжен к этому подпространству. Коэффициенты a[k), . . ., a(kk) определяются, причем единственным образом, из системы (21), при условии, что detHA^/^H^O (/, у=1, ...,Л), или, что то же, при условии, что форма А (х,у) на подпространстве L (/х, . . . ,/л) невырождена. Так как вектор /л + 1 был в этом построении произвольным, то, обозначая f = fk + li g=gk, h — ek + 1, L (Л,... ,Д) = K'cK, мы приходим к следующей теореме: Теорема. Пусть вектор / не принадлежит к подпространству К'сК, на котором форма А(х,у) невырождена. Тогда существует (и единственно) разложение f=g+h, (25) где g(zK', a h сопряжен с пространством К'. 7.55. Обозначим через К" подпространство, сопряженное к подпространству К' относительно формы А(х,у). Наличие разложения (25) вместе с его единственностью показывает, что все пространство К есть прямая сумма подпро-
7.61 J § 7.6. СОПРЯЖЕННЫЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 227 страпств К' и К" (2.45). Итак, имея подпространство К'сК, на котором (заданная во всем пространстве К) форма А(х,у) невырождена, можно осуществить прямое разложение К-К' + К", где подпространство К" сопряжено с К' относительно формы А (х, у). § 7.6. Сопряженные линейные операторы 7.61. Фиксируем в пространстве К„ билинейную невырожденную симметричную форму, которую будем обозначать в этом параграфе через (х,у). Пусть А и В — линейные операторы, действующие в пространстве К„. Образуем функции А (л*, У) и В(х,у) от двух векторов х,у по формуле А (а:, у) = {Ах, у), В (*, у) = (*, By). Проверим, что полученные функции А(х,у) и В(х,у)— билинейные формы. Действительно, на основании определений линейного оператора [4.21) и билинейной формы (7.11) имеют место равенства A (atx + х2,у) --= (А (хг + х2),у) = (Ахг + Ах2,у) = -■= (А*ъ у) + (А*2, у) -= А (л-1? у) + А (*2, у)9 А {ах, у) = (А (ал;), у) = (а А (л:), у) = а (Ал:, j/)--=aA (л:, у), которые показывают, что А(х,у) линейна по первому аргументу. Линейность А (л;, у по второму аргументу следует из того, что (х,у) линейна по у. Таким образом, А (л;, у—- билинейная форма. Аналогично и В (л;, у— билинейная форма. Пусть е1, ...,еп — канонический базис для формы (х,у): (ер ек) = О при )фк, (е,„ ет) = вт £К,гтф 0. Сравним в этом базисе матрицу оператора А и формы А {х,у). Матрица Цд^Ц оператора А определяется из формул п Ае = 2 alkheki у = 1, ... , /г (здесь верхний индекс указывает номер строки, нижний—- номер столбца). Матрица \\aJk\\ формы А (л;, у (первый индекс— номер строки, второй — номер столбца) определяется 8*
228 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7-62 из формул а/т = А («/. ет) = (А ер е,п) = ( 2 < ек, е,Л = = а$ (ет, ет) = ета£. (26) Следовательно, m-ti столбец матрицы \\а-т\\ получается умножением т-го столбца матрицы Ня^П при каждом т=\, . . ., п на канонический коэффициент гт формы (х,у). Для матрицы Hft^H оператора В (в том же базисе ех, ..., еп) и матрицы \\bjkW формы В(х,у) аналогично получаем = [ер £{ ЬГе?) = bfl) (e;, еу) = еу^'»\ (27) т. е. у-я строка матрицы || bjm || получается умножением у-го столбца матрицы оператора В при каждом j= 1, . . . , п на соответствующий канонический коэффициент еу-. 7.62. Пусть, обратно, в пространстве К„ заданы билинейные формы А (а:, у) и В(х, у); мы утверждаем, что существуют линейные операторы А и В такие, что А(х, у) = (Ах, у), В(х, у) = (х, By), причем они определены единственным образом. Для доказательства зададим операторы А и В в каком- либо базисе еъ . . . , еп матрицами соответственно из чисел По этим операторам построим формы Ах (х, у) = (Ах, у) и Bi (х, у) = (х, By). По доказанному, в базисе ех, . . . , еп матрица формы А1(х} у) совпадает с матрицей формы А (х, у), а матрица формы В1 (х, у) совпадает с матрицей формы В (л;, у). Но тогда для любых х и у из Кл (Ах, у) = Аг (х, у)^А (х, у), (х, By) = Вх (х, у) = В{х, у), так что операторы А и В удовлетворяют требуемым условиям. Для доказательства единственности нам достаточно
7.63] § 7.6. СОПРЯЖЕННЫЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 229 проверить, что если некоторый оператор А удовлетворяет условию (Ал:, у) = 0 (при любых х, у из KJ, (28) то АлгееееО (29) при каждом лг£К„, т. е. А — нулевой оператор. Пусть для некоторого х0£Кп мы имеем Ал:0=^=0. Тогда, поскольку форма (л:, у) невырождена, в силу 7.15в существует вектор у0€Кп такой, что (Ал:0, у0) Ф 0; это противоречит (28), откуда и следует требуемая единственность. 7.63. Теперь мы установим следующую важную теорему. Теорема. Если в пространстве К„ выделена невырожденная билинейная симметричная форма (х, у), то для каждого линейного оператора А существует и единствен линейный оператор А', удовлетворяющий уравнению (Ах,у) = (х, А'у) при любых х и у из Кп. Матрица оператора А' в любом каноническом базисе формы (л:, у) получается из матрицы оператора А транспонированием, умножением т-й строки на гт и делением j-го столбца на еу- (у, т= 1, . . . , п). Доказательство. По заданному оператору А построим форму А (х, у) — (Алг, у) и затем определим оператор А' из уравнения (Ал:, у) = А(х, у) = (х, А'у). Существование и единственность оператора А' следуютиз 7.62. Матрица || а^ || оператора А, матрица || ajm || формы А (х,у) и матрица ||а/(т)|| оператора А' связаны в любом каноническом базисе формы (л:, у) формулами (26)—(27) так что ajm em ч ь а/'(т) = ^ = 77<, (3°) и теорема полностью доказана,
230 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.64 Оператор А' называется сопряженным к оператору А относительно формы (х, у). 7.64. Операция перехода к сопряженному оператору А —► А' обладает следующими свойствами: а) (А')' —А для любого оператора А; б) (А + В)' = A'-i-B' для любых А и В; в) {ХА)' = КА' для любого оператора А и любого хек-, г) (АВ)' = В'А' для любых А и В. Равенство а) вытекает из определения (А')': (х, (А'Уу) = (А'х,у) = (х, Ау) и единственности оператора, определяемого билинейной формой (7.62). Аналогично получаются и остальные утверждения; так, б) вытекает из соотношений (л, (А + В)'у) = ((А + В) х, у) - (Ах, у) + (В*, у) = = (*, А'у) + (х, В'у) = (х, (А' + В')у); в) вытекает из соотношений (л, CkA)'y) = (kAx, у) = Х(Ах, y) = K(x, A'y) = {xt ХА'у), и, наконец, г) — из соотношений (х, (АВ)'у) = (АВх, у) = (Вх, A'y)--=(x, В'А». 7.65. Отметим еще одну связь между операторами А и А'. Пусть подпространство К'сКи инвариантно относительно оператора А; это означает (4.81), что каждый вектор х £ К' переводится оператором А снова в вектор из того же подпространства К'. Пусть К" — подпространство, сопряженное к К' (7.41 г). Покажем, что оператор А' инвариантен относительно подпространства К". Пусть ^уё К", так что (у,х) — 0 для любого л£К'. Мы имеем (А'у, х) = (у, Ал) = 0, так как Ал* вместе с х лежит в К'; но это означает, что вектор А'у сопряжен всем векторам х £ К' и входит тем самым в К", что и требуется.
7.72] § 7.7. изоморфизм пространств 231 § 7.7. Изоморфизм пространств с выделенной билинейной формой 7.71. Определение. Два линейных пространства К' и К" над одним и тем же числовым полем К с выделенными в них билинейными симметричными формами A(xf, у') и А (х", у") называются А-изоморфными, если они изоморфны как линейные пространства над полем К (2.71), — т. е. существует взаимно однозначное отображение (морфизм) (ах' = х", сохраняющее линейные операции,—и, кроме того, для соответствующих друг другу пар элементов сол*' —л;", coy' =у" значения форм А (х', у') и А [х", у") совпадают: А (сод:', coy') = А (xf, у'). 7.72. Имеет место следующая теорема: Теорема. Для того чтобы конечномерные линейные пространства К' и К", снабженные формами А (х', у') и A(v", у'|, были А-изоморфны, необходимо и достаточно, чтобы К' и К" были равной размерности п и чтобы в К' и К" существовали канонические базисы форм А (х', у') и А (х", у") с одинаковым набором канонических коэффициентов ех, . . . , е„. Доказательство. Предположим, что пространства К' и К", снабженные формами А (х', у') и А{х",у"), являются А-изоморфными. Тогда они изаморфны как линейные пространства и, следовательно, имеют равную размерность (2.71). Возьмем произвольный канонический базис ех, . . ., еп формы А (л:', у') в пространстве К'. Мы имеем ' { £; ПРИ I — }. Пусть е[, ..., е'п — векторы в К", отвечающие векторам е[, . . ., еп пространства К' в силу имеющегося А-изомор- физма. По условию А „ „ | ° ПРИ %1Фи A (eh е.) = ■ . V ' ( Е{ При I rrry. Мы видим, что у формы А (х", у") имеется канонический базис в пространстве К" с тем же набором канонических
232 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.73 коэффициентов е1? . . . , е„, что и у формы А (х', у'). Таким образом, необходимость условия теоремы установлена. Для доказательства достаточности рассмотрим канонические базисы е[, . . ., е'п (в К') и^[, . . ., е"п (в К") с одинаковым набором канонических коэффициентов, так что Г 0 при ьф], А(". '/) = А (".'/) =\в/ при, = у. Положим для любого лг'=2£/в/€К' ** = <D(*') = 2V]f6K' с теми же координатами £.. Такое соответствие определит изоморфизм пространств К' и К" (2.74). Мы имеем, далее, при у' = 2л***. /' = ю (.у') = 21л*^ А (х', Л = 2е&т1* = А(Л Л. так что изоморфизм со является и А-изоморфизмом. Теорема доказана. 7.73. Пусть имеется /z-мерное пространство Кп с фиксированной невырожденной билинейной формой А (д;, у). Рассмотрим А-изоморфизм пространства К„, т. е. линейное обратимое отображение у—-+Qx, не изменяющее форму А(дг, у): A(Q*, Q^f) = A (jc, у). (31) Будем далее форму А (д;, у) короче обозначать через (дг, у). Обозначая через Q' оператор, сопряженный к оператору Q относительно формы (дг, у) (7.63), имеем (Q*, Qy) = (Q'Qx, у). (32) Так как оператор Q' невырожден вместе с оператором Q, из (32) следует Q'Q = E, (33) т. е. Q' является обратным оператором для оператора Q. Обратно, из (33) следует (32) и далее (31), так что равенство (33) полностью определяет класс операторов, не изменяющих форму (д:, у). Эти операторы будем называть инвариантными относительно формы (д:, у).
7.76] § 7.7. изоморфизм пространств 233 7.74. Вместе с оператором Q обратный оператор Q"1 = Q' также является инвариантным, так как для любых х и у (Q'x, Q'y) = (QQ'x, у) = (х, у). Произведение двух инвариантных операторов Q и Т также является инвариантным оператором, так как для любых х иу (QT*, QTy) = (Tx, Ту) = (х, у). 7.75. Применяя инвариантный оператор Q к векторам еъ . . ., еп канонического базиса формы (х, у) с коэффициентами в!, ..., ея, мы получаем векторы /^Q^, ...,f„ = Qe„. (34) При этом ( 8, При k=j, </„/»> = «*„ Qek) = (ef, ek)= ( Q' ^ кф. Таким образом, /ь • -.,/„ естб также канонический базис формы (х, у) с теми же каноническими коэффициентами ei> • • •» 8«- Обратно, если /ь ..., /„ есть канонический базис формы (л:, у) с теми же каноническими коэффициентами ех, ..., ея, что и в базисе ех, ..., ея, то оператор Q, определенный по формулам (34), является инвариантным. Действительно, мы имеем ( е- при k = j, (Q'/.Q'*) = (/y./») = ^'») = {onPH*^y. Мы видим, что равенство (31) справедливо для любой пары базисных векторов. Отсюда, по линейности, оно справедливо для любой пары векторов х, у из К„, что и требуется. Итак, инвариантный оператор Q характеризуется тем, что всякий канонический базис пространства Кп (относительно формы (х, у)) он переводит снова в канонический базис с теми же самыми каноническими коэффициентами. 7.76. Найдем условия, определяющие матрицу любого инвариантного оператора в каноническом базисе формы (х,у). Пусть еъ ..., еп — такой базис и е1? ..., гп — соответствующие канонические коэффициенты. Пусть, далее,
234 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.76 Q-s= \\ q(J> \\—матрица оператора Q в этом базисе. Матрица сопряженного оператора имеет вид (7.63) .</> </) е J „«) Q' = \\<ii !l, 4i -j-яТ- Равенство (33) теперь можно записать в координатной форме 2-'Л <7* -2-е^/ ^* -6/ -\ о при у=И=*. Иначе говоря, Lrtfw /=l — при у = А, [ 0 при ]ф k. (35) Равенство (35) эквивалентно (33) и поэтому также может служить определением инвариантного оператора Q. Итак, матрица инвариантного оператора в любом каноническом базисе формы (л:, у) {инвариантная матрица) характеризуется тем, что сумма квадратов элементов ее у-го столбца с коэффициентами ej-1, •••, е^1 равна числу еу1 (у=1, ..., п), а сумма произведений соответствующих элементов двух различных столбцов с коэффициентами еь . . ., гп равна 0. Так как из (33) следует также QQ' = Е, то имеют место и равенства m m 2^4 kllm — 2^ 1—4k(l k — °m> k=i fe=i или (35') Мы получаем вторую характеристику инвариантной матрицы: сумма квадратов элементов ее у'-й строки с коэффициентами Ej, . . . , гп равна числу еу-, сумма произведений соответствующих элементов двух различных строк также с коэффициентами гъ . . . , гп равна 0,
7.82] § 7.&. полилинейные формы 235 § 7.8*. Полилинейные формы 7.81. По аналогии с билинейными формами можно рассматривать линейные функции от большего числа векторов (трех, четырех и более). Все они называются полилинейными формами. Определение. Функция А (хъ . . ., xk) от к векторных аргументов хъ xk, меняющихся в линейном пространстве К, называется полилинейной (точнее, k-линейной) формой, если она линейна по любому аргументу Xj(j— 1, . . . , k) при фиксированных значениях остальных аргументов хъ ... • • • » -^/-1» -*7Ч1' • • • > xk- Полилинейная форма A(jcx, х2, •••, xk) называется симметричной, если она не изменяется при перемене местами любых двух своих аргументов, и антисимметричной, если при перемене местами двух своих аргументов она изменяет знак. Примером полилинейной антисимметричной формы от трех векторов х, у, z (трилинейной формы) в пространстве V3 является смешанное произведение этих векторов. Примером полилинейной антисимметричной формы от п векторов в пространстве КУП xi — \а\ъ й12» . . . , а1п), X2z= )#2l» fl22» ' * • » ^2и|» Хп ~ \ап1> ап2> • • • » апп) является определитель А (х1, х2, • • • , хп) 11 12 "In п\ (36) Несколько более общим примером является произведение определителя (36) на фиксированное число а £ К- 7.82. Покажем, что всякая полилинейная антисимметричная форма А (хг, х2, хп) от п векторов хх, х{ . . . , хп в n-мерном линейном пространстве К„ с фиксированным базисом ех, е2, . . . , еп равна определителю (36) с некоторым постоянным множителем а£/(.
236 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.82 Обозначим через а величину А (е1г е2, ... , еп). Тогда легко подсчитать величину А (е^, е{^ . . . , ei ), где /1? /2, . .. ... , /„ — любые целые числа от 1 до п. Если среди этих чисел имеются два равных, то величина А (е,-, eiy ... , е( ) равна нулю, ибо при перестановке соответствующих аргументов она не изменяется, в то время как по свойству антисимметрии она должна изменить знак. Если все числа /1? /2, . . . , in различны, то, произведя столько перестановок соседних аргументов, сколько беспорядков в последовательности индексов /1? /2, ..., /„*),— обозначим это число через 7V, — можно добиться нормального расположения аргументов; отсюда А К, eit, .... *,и) = (-!)%. Пусть теперь п xi=2aVej (/=1> 2, ... , л) /=i есть произвольная система п векторов пространства К„. Составим полилинейную форму А (лг1? х2, ..., хп): А (х1, х%, • • • , хп) = Vi = l '2=1 «n=l J n «i, /2. .... /n=l Так как в каждом слагаемом получившейся суммы N означает число беспорядков в расположении вторых индексов элементов при нормальном порядке первых индексов, то каждое слагаемое есть один из членов определителя (36) с положенным этому члену знаком. Сумма всех этих членов равна поэтому самому определителю (36). Таким образом, наше утверждение доказано. *) Ср. доказательство теоремы 4.54.
7.91) § 7.9. формы в вещественном пространстве 237 В частности, мы показали, что смешанное произведение трех векторов х, у, z пространства V3 в любом базисе записывается как определитель 3-го порядка из координат этих векторов с коэффициентом, равным смешанному произведению базисных векторов. § 7.9. Квадратичные и билинейные формы в вещественном пространстве 7.91. У вещественных чисел определены знаки (-[-или —), поэтому для билинейных и квадратичных форм в вещественном пространстве теория может быть продвинута несколько далее, чем в пространстве над произвольным полем К. Согласно общей теореме 7.31 квадратичная форма А (х,х) в некотором базисе приводится к каноническому виду А(х, x) = X1r\l+...+kni\*. Среди чисел Kv . . . , Хп имеется столько отличных от нуля, каков ранг формы А (х, х) (7.33 б). Они положительны или отрицательны. Оказывается, что число положительных и число отрицательных канонических коэффициентов также не изменяются при изменении канонического базиса. Теорема. (Теорема инерции квадратичных форм.) Число положительных и число отрицательных коэффициентов в каноническом виде квадратичной формы А(х, х) являются инвариантами формы (т. е. не зависят от выбора канонического базиса). Доказательство. Пусть задана квадратичная форма А(х, х). В некотором базисе {е\ = {ev e2t ..., еп) она имеет вид А (*, *) = 2 aikUkf Л k=i где £1? £2, ..., \п— координаты вектора х относительно базиса {е\. Допустим, что она обладает двумя каноническими базисами {/} = {Д, /2, . . . , /„} и {g} = {gv g2, . . . , gn). Обозначим через v)v т)2, . .. , г\п координаты вектора х в базисе {/} и через хъ т2, ... , хп — в базисе {g}. Соответствующие формулы преобразования координат пусть
238 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.91 будут следующими: Л1 = Ьп1х-\- Ьи1»-\- .. . +blnt„; t1 = c115i ~\-cl2lo + ... +cln%n, Л Г)2 = ^2l?l~i_^2-2r-2-i- • • • -\-Ь?п±П> Т2 — С21*1 + С22*2 + • • • + С2//£//» I /37) Ч/ = b,llU 'I" ^,/2?2 -Г . • • -f ^,«S/i'. T;l = Crtlg! + C„2g.2 + . . . + Cn„g„. ; В базисе {/} форма А (х, х) имеет вид А(*, х) = ахЛ1+ • •• Н-алПл — a^ + i^+i—• • • — «яЛт> (3^> а в базисе {^j соответственно А (х, а:) ^ - PiT?^P2x?+ . . . + Рят*-Ря + 1т«+1- . . . -IV*- (39) Числа ах, а2, . . . , ат, рх, р.2, . . . , Р^ пред платаются поло ж и т е л ь н ы м и. Мы покажем, что к = р, т — q. Приравнивая правые части равенств (38) и (39) и перенося отрицательные члены в противоположные части равенства, мы получаем a^i + aoiiH- . . . +а,г!| + Ря+1^+1+ . . . + Р,т5 = - a* + i*lLi + • • • + «яЛт -!- Pit! + • • . + Ря^. (40) Допустим, что &</?. Рассмотрим тогда векторы х, удовлетворяющие условиям: 4i = 0, Л2 = 0, ... , Ла = 0. \ (4П Vi = 0' ••• ' ^ = °» Vi = 0' ••- тя = °- I Этих условий, очевидно, меньше чем л, так как к <р. Подставляя выражения y]1? . . . , г]^, т +1, . . . , tw через координаты {£} по формулам (37), мы получаем однородную систему линейных уравнений относительно координат {£}; число уравнений меньше числа неизвестных, и, следовательно, эта однородная система допускает ненулевое решение х~ {^i, ?2> • • • ■> £,/}• Но, с ДРУГОЙ стороны, всякий вектор х, удовлетворяющий условиям (41), в силу равенства (40) удовлетворяет и условиям т1 = т2= . .. =тя = 0. Вектор, для которого тх = т2 = . . . = хр = тр+1 — . . . = тп = 0, необходимо есть нуль-вектор, и для него все координаты {£} также должны быть равны нулю. Полученное противо-
7.92] § 7.9. ФОРМЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 239 речие показывает, что предположение k <C p не может осуществиться. В силу полной симметрии чисел k и р в рассматриваемой задаче также не может осуществиться и предположение /? < &. Отсюда k=p. Далее, если рассмотреть условия *i = 0, т2 = 0, . .. , хр = 0, *!* + ! = 0. ■■-.Л« = 0. Ля + 1 = 0, • .-,Л|, = 0, тем же приемом можно опровергнуть предположение т < q и по симметрии q < /я. Таким образом, окончательно получаем, что k=p, m = q, что и требовалось. 7.92. Полное число членов, входящих в канонический вид квадратичной формы А (х, х), т. е. ее ранг (7.336), называется также се индексом инерции; число положительных членов называется положительным индексом инерции, число отрицательных членов — отрицательным индексом инерции. Если при этом положительный индекс инерции равен размерности пространства, форма называется положительно определенной; иными словами, квадратичная форма положительно определенная, если все п ее канонических коэффициентов положительны. Тем самым положительно определенная форма в каждой точке пространства, кроме начала координат, принимает положительное значение. И обратно, если некоторая квадратичная форма в /z-мерном пространстве принимает всюду, кроме начала координат, положительные значения, то ее ранг равен п и положительный индекс инерции также равен п, т. е. форма положительно определенная. Действительно, для формы ранга, меньшего п, или имеющей меньшее, чем я, число положительных канонических коэффициентов, легко указать точки в пространстве, отличные от начала координат, где эта форма принимает отрицательное значение или нулевое. Например, форма ранга 2 в трехмерном пространстве А (л:, х) = Ц + Ц принимает нулевое значение на любом векторе с координатами сх-^0, 12ф0, £3 = 0. Форма ранга 3 в трехмерном пространстве А (л, х) = Ц-Ц + и принимает на тех же векторах отрицательные значения.
240 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.93 7.93. Теорема инерции, доказанная нами для квадратичных форм, непосредственно переносится и на симметричные билинейные формы: именно, число положительных и отрицательных коэффициентов канонического ей а (22) билинейной формы А (л:, у) не зависит от выбора канонического базиса. Поэтому для симметричной билинейной формы имеют смысл понятия положительного и отрицательного индексов инерции. Значения положительного и отрицательного индексов инерции билинейной формы А (х, у) и, следовательно, квадратичной формы А(х, х) могут быть определены по знакам угловых миноров матрицы формы в каком-либо базисе (если только эти миноры отличны от нуля) по формулам (24). Заметим, что в вещественном пространстве Rn всегда можно для данной квадратичной формы А (а:, х) найти канонический базис такой, что все канонические коэффициенты будут числами -\-\ или —1. Для этого, приведя форму А (л:, х) к виду А (л:, дг) = Х1т?+ ••• +^Др — — l^iTp+i— • • • — JVp+<7> г^е К • • •» V M-i. • • •» Vq положительны, мы совершим еще одно преобразование координат bp + i=l H-l^ + l» •••> Ър + д = V V'q^p + q* После этого преобразования форма принимает вид А (Л*, X) — С>1 -(-•••+ §р Ър+1 • • • Ьр+<7« Отсюда легко следует, что числа р и q в вещественном пространстве — единственные инварианты квадратичной фор' мыА(х,х) и соответствующей билинейной формы А(х,у): Теорема. Два пространства R' и R" с выделенными в них симметричными билинейными формами А {х', у') и А (х", у") являются А-изоморфными тогда и только тогда, когда пространства R' и R" имеют одинаковую размерность, а индексы инерции р', q формы А{х',у') совпадают соответственно с индексами инерции р", q" формы А (х", у"). Доказательство непосредственно следует из приведенных выше соображений и теоремы 7.72. 7.94. Следующие определения соответствуют определениям, приведенным в 7.92 для квадратичных форм.
7.95] § 7.9. формы в вещественном пространстве 241 Билинейная форма А (х, у) называется невырожденной, если ее ранг равен числу измерений пространства, иными словами, если в канонической записи формы А (х, у) А(х, у) = Л^ть + . .. + КЪпЧп все коэффициенты А,1? А,2, . .., Хп отличны от нуля. Если все эти коэффициенты, кроме того, положительны, форма А(х,у) называется положительно определенной. Положительно определенная билинейная форма А (х, у) характеризуется тем, что соответствующая квадратичная форма А (х, л:), согласно 7.92, принимает при каждом х фО положительное значение. По самому определению положительно определенная форма в пространстве Rn невырождена. Но так как в силу свойства А (л:, л;) > 0 она остается положительно определенной и на любом подпространстве R'c:R„, то в отличие от общей билинейной формы (7.15г) положительно определенная форма остается невырожденной на любом подпространстве R'c:R„. Если /х, ..., fk — любые k линейно независимых векторов, определитель D а (Л, Л) ... л (Л, Д) заведомо отличен от нуля. Ниже мы увидим, что число D всегда положительно. 7.95. Одним из важных примеров симметричной положительно определенной билинейной формы в пространстве V3 является скалярное произведение векторов х и у. Действительно, из определения скалярного произведения непосредственно вытекают соотношения (*, у) = (у, х), (х, х) = \х\2 > 0 при х Ф 0; первое из них показывает, что билинейная форма (л;, у) симметрична; второе — что соответствующая квадратичная форма принимает при каждом х т= 0 положительное значение и, следовательно, билинейная форма (ху у) положительно определена. В дальнейшем симметричные положительно определенные билинейные формы будут играть исключительную роль: именно, используя такие формы, мы в общем линейном пространстве получим возможность ввести понятия длин векторов и углов между векторами (гл. 8).
7.98J § 7.9. формы в вещественном пространстве 243 Lm тоже положителен. Но определитель формы А (х, у) в исходном базисе подпространства Lm есть как раз минор М. Следовательно, М > 0, и теорема полностью доказана. 3 а м е ч а м и е. Вместо углового минора во второй части доказательства можно было взять любой диагональный минор (5.53) без существенного изменения рассуждений. Таким образом, у матрицы положительно определенной формы любой диагональный минор положителен. 7.97. Для положительно определенной формы А (х, у) всегда существует канонический базис ег, ...,etn в котором все канонические коэффициенты равны -f- 1 (7.93). Поэтому два n-мерных вещественных пространства R'n и R"n с выделенными в них положительно определенными формами А (х\ у') и А (л*", у") в силу теоремы 7.72 всегда к-изоморфны. 7.98. В приложениях линейной алгебры к анализу (именно, в теории условных экстремумов) часто требуется решить следующую задачу: зная матрицу /4=||а;к|| билинейной симметричной формы А (дг, у), узнать, будет ли эта форма положительно определенной на подпространстве, заданном системой k независимых линейных уравнений 2 М/=о (i = l, 2, .... к\ к < п). Оказывается, что необходимым и достаточным условием для этого является положительность угловых миноров матрицы О 0 ... О Ьп Ьп ... bln А = (-1)* О Ь2\ Ь^ 0 *11 ьи 0 . h\ • ьгг • • • 0 bkl bk2 . .. bkl an al2 . .. bfo2 a2\ o.22 . • bkn . aln • <hn • • bkn anl an2 порядка 2fc + l, 2fc + 2, ..., k + n *) См. заметку Р. Я. Шостака в журнале «Успехи математических наук», 1954, т. 9, вып. 2 (60), стр. 199—206.
244 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ ЗАДАЧИ 1. Образуют ли элементы матрицы билинейной формы тензор (5.61), и если да, то какого типа? 2. Преобразовать квадратичную форму Ъ&ЛЫя + ЪЛх к каноническому виду. 3. Пусть р — положительный индекс инерции квадратичной формы A (jc, х) (заданной в пространстве R„) и q — ее отрицательный индекс инерции. Пусть заданы р положительных чисел Ях, Я2, ..., кр и q отрицательных чисел \лъ |о12, ..., \iq. Показать, что существует базис, в котором форма A (jc, jc) принимает вид А (*, x) = Xix\+ *2т| +... + VJ+ ^iTp+i+ • • • +N*l+g- 4. Показать, что у квадратичной формы ранга г всегда имеется по крайней мере один диагональный минор ранга г, отличный от нуля. 5. Преобразовать билинейную форму А (*, у) = £i% + Ел* + £2% + ЗЕоЛг + 2^з + 2?зЛ2 + 5?3Лз к каноническому виду. 6. Применить метод Якоби для преобразования билинейной формы А (*, у) = E^i —1^2 — ?гЛ 1 + 1хЪ + £зЛ 1 + 25аЛз + 2?зЛг + £зЛз + 5гЛ2 к каноническому виду. 7. Сформулировать условия, при которых симметричная матрица II Я/б II определяет отрицательно определенную билинейную форму. 8. Дана симметричная матрица А = \\ aik ||, обладающая свойствами flu > О, аи а12 #21 fl22 >0, ..., det||fl/fc|| >0. Доказать, что апп > 0. 9. Доказать теорему: полилинейная антисимметричная форма от /г + 1 векторов в /г-мерном пространстве Кп тождественно равна нулю. 10. Доказать теорему: полилинейная антисимметричная форма A (jcl, ..., jc„_j) от /г—1 векторов в /г-мерном пространстве записывается в любом базисе как определитель, первые п — 1 строк которого заполнены координатами векторов-аргументов, а последняя, /г-я, строка заполнена п фиксированными числами. И. Доказать, что всякая антисимметричная билинейная форма A (jc, y)^0 может быть всегда приведена к «каноническому виду» А (*, у) = охх2 — о2г1 + а3т4 — а4т3 + ... + o2k _ xx2k + o2kx2k _ х. 12. Доказать теорему: вещественная квадратичная форма А (х, #) = = Zj cifkXfXk неотрицательна при всех x£Rn тогда и только тогда, когда все диагональные миноры матрицы ^ = ||a;fe|| неотрицательны.
ЗАДАЧИ 245 Примечание. Для матрицы L . угловые миноры 6Х и ба равны 0, а соответствующая форма не является неотрицательной. Таким образом, условия 6L ^^ 0, б2^0 недостаточны для неотрицательности формы. 13. Пусть в пространстве Кл задана невырожденная билинейная симметричная форма A (jc, у). Пусть К'сК— подпространство размерности г. Доказать, что сопряженное подпространство К"сК имеет размерность п — г. 14. В пространстве R2 задана симметричная билинейная форма (jc, y) = %{(\i—^V Найти оператор, сопряженный (относительно этой формы) к оператору поворота с матрицей А = cos a sin а -sin а cos а 15. Пусть в пространстве К« выделена невырожденная форма (jc, у). Для квадратной системы линейных уравнений п 2 *//£*=*/ (/=1. ••■•п) (43) доказать «теорему Фредгольма»: система (43) имеет решение для тех и только для тех векторов b={bu ...,&„}, которые сопряжены ко всем решениям однородной системы 2*/*Л* = 0. (44) где || a)k || — матрица, сопряженная с || ajk \\ относительно формы (jc, у). Отсюда вывести, что число независимых линейных условий на вектор Ъ, необходимое и достаточное для разрешимости системы (43), равно размерности пространства решений однородной системы п 2*/*Б*=0 (/=1, ... , п). (45) k= 1 Примечание. Для общей системы j±aJklk=bj (/=1, ... , т) (46) k=i две указанные характеристики уже не совпадают: их разность, называемая индексом системы (46), равна т—п. 16. Показать, что всякая неотрицательная билинейная форма ранга г в пространстве R„ может быть представлена как сумма г неотрицательных билинейных форм ранга 1. 17. Показать, что всякая билинейная форма ранга 1 в пространстве К/; имеет вид A (jc, y) = f (x)-g(y), где / (jc) и g(x)— линейные формы. 18. Если А(х, у) = 2 ajkij^k и В (jc, y) = 2Libjkljr[k — неотрицательные билинейные формы в пространстве R„, то форма С (jc, y)=* ~^jajkbjk^jr\k также неотрицательна.
ГЛАВА 8 ЕВКЛИДОВЫ ПРОСТРАНСТВА §8.1. Введение Большое многообразие фактов, которыми богата геометрия, в значительной мере объясняется возможностью различных измерений — в основном возможностью измерения длин отрезков и углов между прямыми. В общем линейном пространстве мы еще не имеем способа производить такие измерения; и это, разумеется, суживает область нашего исследования. Желая наиболее естественным образом распространить на общие линейные пространства методы, связанные с возможностью измерений, мы обратимся к определению скалярного произведения двух векторов, принятому в аналитической геометрии (и пригодному, конечно, только для обычных векторов — элементов пространства V3). Это определение гласит: скалярное произведение двух векторов есть произведение длин этих векторов и косинуса угла между ними. Следовательно, это определение уже основано на возможности измерения длин векторов и угла между ними. Но, с другой стороны, зная скалярное произведение любой пары векторов, мы можем восстановить длины их и угол между ними; действительно, квадрат длины вектора равен скалярному произведению этого вектора с самим собой, а косинус угла между двумя векторами — отношению их скалярного произведения к произведению их длин. Следовательно, в понятии скалярного произведения потенциально заключены и возможность измерения длин, и возможность измерения углов, а вместе с ними и вся область геометрии, связанная с измерениями («метрическая геометрия»). В общем линейном пространстве нам легче будет сначала ввести понятие скалярного произведения двух векторов и затем из имеющегося уже понятия скалярного произведе-
§8.1. ВВЕДЕНИЕ 247 ния получить определения длины вектора и угла между векторами. Посмотрим, какие свойства обычного скалярного произведения можно использовать для построения аналогичной величины в общем линейном пространстве. Вначале ограничимся случаем вещественных пространств. В 7.95 мы уже видели, что в пространстве V3(2.15 a) скалярное произведение (х, у) есть билинейная форма от векторов х и у, симметричная и положительно определенная. Формы с такими свойствами, вообще говоря, имеются и в общем вещественном линейном пространстве. Рассмотрим в вещественном линейном пространстве произвольную фиксированную билинейную форму А (х,у), симметричную и положительно определенную. Назовем ее (скалярным произведением» векторов х и у. После этого определим длину каждого вектора и угол между каждыми двумя векторами по тем же правилам, по которым длина вектора и угол между векторами вычислялись через скалярные произведения в пространстве V3. Разумеется, только дальнейшее исследование может показать, насколько удачно это определение; и мы увидим на протяжении этой и следующих глав, что приведенное определение на самом деле позволит распространить на общие линейные пространства методы метрической геометрии и тем самым значительно усилить средства исследования математических объектов, встречающихся в алгебре и анализе. Отметим здесь одно существенное обстоятельство. Исходную билинейную и положительно определенную форму можно выбрать в данном линейном пространстве многими различными способами. Длина некоторого вектора л', вычисленная с помощью одной такой формы, будет отличаться от длины этого же вектора х, вычисленной с помощью другой формы; то же относится и к углу между двумя данными векторами. Таким образом, длина вектора и угол между векторами не определяются однозначно. Но эта неоднозначность не должна нас смущать; ведь ничего нет удивительного в том, что одному и тому же отрезку на прямой, измеренному различными масштабами, приписываются в результате этих измерений в качестве его длины различные числа. Можно сказать, что выбор исходной билинейной Симметричной и положительной формы аналогичен выбору
248 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.21 такого «масштаба» для измерения длин векторов и углов между ними. Вещественное линейное пространство с выбранной в нем «масштабной» билинейной симметричной положительно определенной формой будем в дальнейшем называть евклидовым. Линейное пространство без заданной «масштабной» формы будем называть аффинным. Случай комплексного пространства мы рассмотрим в гл. 9. § 8.2. Определение евклидова пространства 8.21. Вещественное линейное пространство R называется евклидовым, если 1) имеется правило, которое позволяет построить для каждых двух векторов х иу из R вещественное число, называемое скалярным произведением векторов х и у и обозначаемое (х, у); 2) это правило удовлетворяет следующим требованиям: а) (х, у) = (у, х) (переместительный закон), б) (х, y-{-z) = (x, у)-\-(х, z) (распределительный закон), в) (Хх, у) = Х(х, у) для любого вещественного числа X, г) (х, х)уО при хфО и (х, х) = 0 при х = 0. Аксиомы а) — г) утверждают в совокупности, что скалярное произведение векторов х и у есть билинейная форма (б — в), симметричная (а) и положительно определенная (г). И обратно, всякая форма, обладающая этими свойствами, может быть принята за скалярное произведение. Поскольку скалярное произведение векторов х иу является билинейной формой, для него имеет место формула 7.11(2). В данном случае эта формула принимает следующий вид: (k m \ k m 1 а,-*,, 2 P/Jy =2 2 «/Ру (*/. У;)- 0) Здесь хъ х2, ... , xk, yv y2, ... , ^ — произвольные векторы евклидова пространства R, av a2, ... , ал> Pi, Рг> •••» Р/л — любые вещественные числа. 8.22. Примеры. а. В пространстве V3 свободных векторов (2.15а) скалярное произведение вводится по правилам аналитической геометрии. Условия а) — г) выражают собой основное
8.31] § 8.3. основные метрические понятия 249 свойства скалярного произведения; они доказываются в векторной алгебре. б. В пространстве Rn (2.156) мы введем скалярное произведение векторов х=(1г, £2, ... , 1п) иу = (г)г, г|2, .. . , г\п) так: (*, у) = 1^ + 12Ц2 + . . . + lnt]n. (2) (Это определение обобщает известную формулу выражения скалярного произведения векторов в трехмерном пространстве через координаты сомножителей в ортогональной системе координат.) Легко проверить, что требования а) — г) удовлетворяются. Заметим, что формула (2) — не единственный способ введения скалярного произведения в Rn. Все возможные способы введения скалярного произведения (т. е. симметричной билинейной положительно определенной формы) в пространстве Rn мы описали фактически в 7.96. в. В пространстве /?(а, Ь) вещественных непрерывных функций на отрезке а^^^£ (2.15в) мы можем ввести скалярное произведение функций х (t) и у (t) по формуле ь (*, у) = J х (t) у (t) dt. (3) а Легко проверить, применяя основные правила интегрирования, что требования а) — г) удовлетворяются. В дальнейшем будем обозначать пространство R(a, Ь) со скалярным произведением по формуле (2) через /?2 (#, Ь). § 8.3. Основные метрические понятия Имея скалярное произведение, мы можем дать определение и основных метрических понятий — длины вектора и угла между двумя векторами. 8.31. Длина вектора. Длиной вектора х в евклидовом пространстве R мы будем называть величину \x\=+VWx). (4)
250 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.32 Примеры. а. В пространстве V3 наше определение длины вектора приводит к обычному значению длины вектора. б. В пространстве Rn для вектора х = (\±, £2, ..., £л) получается выражение длины в виде 1*1=+КБ!+£!+■•• + &;;. в. В пространстве R2(a, b) длина вектора х = д;(/) оказывается равной а Эту величину обозначают иногда || х (t) \\ и называют нормой функции х (t) (чтобы избежать ложных ассоциаций, связанных со словами <длина функции.)). 8.32. Из аксиомы г) вытекает, что у каждого вектора х евклидова пространства R существует длина; у всякого вектора х Ф 0 длина положительна, у нуль-вектора длина равна нулю. Равенство | ах | = V(ax, ах) = V&2 (х, х) = \ a \V{x, x) = \a\\x\ (5) показывает, что абсолютную величину числового множителя мож*о выносить за знак длины вектора. Вектор х, имеющий длину 1, называется нормированным. Всякий ненулевой вектор у можно нормировать, т. е. умножить на такое число А,, чтобы в результате получился нормированный вектор. Действительно, уравнение (^1=1 относительно X имеет решение, например, Множество FczR называется ограниченным, если длины всех векторов х £ F ограничены фиксированной константой. Примерами ограниченных множеств являются единичный шар пространства R — совокупность всех векторов х £ R с длиной, не превышающей единицы, а также единичная сфера — совокупность всех векторов х £ R с длиной, равной 1.
8.34] § 8.3. основные метрические понятия 251 8.33. Угол между векторами. Углом между парой векторов х и у мы будем называть тот угол (в пределах от 0 до 180°), косинус которого равен отношению т—j-\—i • I х II У I Для обычных векторов (в пространстве V3) наше определение согласуется с обычным выражением угла между векторами через скалярное произведение. Чтобы это определение можно было применить в общем евклидовом пространстве, необходимо доказать, что указанное отношение по абсолютной величине не превосходит единицы, каковы бы ни были векторы х и у. Для доказательства этого утверждения рассмотрим вектор Хх—у, где X— вещественное число. В силу аксиомы г) при любом X (Хх—у, Хх—у)^0. (6) Используя формулу (1), мы можем написать это неравенство в виде Х*(х, х)-2Х(х,у) + (у,у)^0. (7) В левой части неравенства стоит квадратный трехчлен относительно X с постоянными коэффициентами. Трехчлен этот не может иметь различных вещественных корней, так как тогда он не мог бы сохранять знака для всех значений X. Поэтому дискриминант {х,у)2 — (х, х) (у, у) этого трехчлена не может быть положительным. Следовательно, {х,у)2<{*, х) {у, у), откуда, извлекая квадратный корень, получаем К*. .у)К1*1Ы. (8) что и требовалось. Неравенство (8) называют неравенством Коша — Буня- ковского. 8.34. Выясним, когда в неравенстве (8) возможен знак равенства. Если векторы х и у коллинеарны, т. е., например, у = Хх, X£R, то, очевидно, \(х,у)\ = \(х,Кх)\ = \Ц(х,х) = \Х\\х\* = \х\\у\.
252 гл. 8. евклидовы пространства [8.35 Покажем, что и обратно, если неравенство (8) для некоторой пары векторов х и у обратилось в равенство, то эти векторы х и у коллинеарны. Если имеет место равенство К*..у)1 = МЫ. то дискриминант квадратного трехчлена (7) равен нулю и, следовательно, трехчлен имеет один вещественный корень XQ. Мы получаем, таким образом, V0(x, х) — 2Х0(х,у) + (у,у) = (Х0х—у, Кх—у) = °, откуда в силу аксиомы г) находим, что Х0х—у = 0, или у = XQx. Итак, абсолютная величина скалярного произведения двух векторов тогда и только тогда равна произведению их длин, когда эти векторы коллинеарны. Примеры. а. В пространстве V3 неравенство Коши — Буняковского, очевидно, вытекает из самого определения скалярного произведения как произведения длин векторов и косинуса угла между ними. б. В пространстве Rn неравенство Коши — Буняковского имеет вид |svJ<l/ tv,y £л?; (9) оно справедливо для любой пары векторов л: = (^1, £2, •••» £«) и У — Oli» Лг» •••>г\п) или» чт0 то же самое, для любых двух систем вещественных чисел |1? £2, ..., \п и r\v r]2, ..., г\п. в. В пространстве /?2 (я, Ь) неравенство Коши — Буняковского имеет вид I ь ^x(t)y(t)dt Iа 8.35. Ортогональность. Векторы х и у называются ортогональными, если (х,у) = 0. Таким образом, понятие ортогональности векторов х и у совпадает с понятием сопряженности (7.41а) этих векторов относительно билинейной формы (х,у). Если х Ф 0 и у Ф 0, то это определение в соответствии с общим определением угла между < x2(t)dt V] y*(t)dt. (Ю)
8.36] § 8.3. основные метрические понятия 253 двумя векторами (8.33) означает, что х и у образуют угол в 90°. Нулевой вектор оказывается ортогональным к любому вектору х £ R. Примеры. а. В пространстве Rn (8.22 б) условие ортогональности векторов х = (llt 52 L) и У = Oil» Лг, • • •, Л«) имеет ВИД Si^i + Е2Л2 + ... + Е«*Пи = о- Например, векторы ех= (1, 0, . . ., 0), е2 = (0, 1, 0, . . ., 0), ... ...5 etl~(0, 0, ..., 1) попарно взаимно ортогональны. б. В пространстве /?2(#, Ь) условие ортогональности векторов x — x(t) ny—y(t) имеет вид ъ ^x(t)y(t)dt = 0. а Читатель легко проверит, вычислив соответствующие интегралы, что в пространстве R2(—я, я) любые два вектора «тригонометрической системы/; 1, cos/, sin/, cos 2/, sin 2/, ..., cos nt, sin/z/,... взаимно ортогональны. 8.36. Приведем несколько простых утверждений, связанных с понятием ортогональности. а. Лемма. Взаимно ортогональные ненулевые векторы xv x2, • • •, xk линейно независимы. Доказательство. Допустим, что эти векторы линейно зависимы; тогда имеет место равенство С1х1 + С2х2 -f . . . + Ckxk = 0, где, например, Схф0. Умножим это равенство скалярно на л:1; в силу предположения о взаимной ортогональности векторов хъ х2, ..., xk мы получим С1(х1, х1) = 0. Отсюда (х1х1) = 0 и, следовательно, хг есть нулевой вектор в противоречие с предположением. Результат этой леммы мы будем тогда использовать в такой форме: если сумма взаимно ортогональных векторов равна нулю, то каждое из слагаемых равно нулю.
254 гл. 8. евклидовы пространства [8.37 б. Лемма. Если векторы yL, у2, ..., ук ортогональны к вектору х, то любая линейная комбинация о.хух -- сх,.,у2 + . .. *..-\-akyk также ортогональна к вектору х. Действительно, (aj>'i + . . . + akyk, x) = аг (уъ х) + . . . + ак (yk, x) = 0; следовательно, вектор а1у1-\- . . . -ra,kyk ортогонален к вектору х, что и утверждалось (ср. 7Ale). Совокупность всех линейных комбинаций а1у1-\-а2у2-\-... . . . + cx,kyk образует подпространство L = L (yv у2, . . ., yk)— линейную оболочку векторов уъ у2, . .., yk (2.51). Следовательно, вектор х ортогонален к каждому вектору подпространства L. В таких случаях мы будем говорить, что вектор х ортогонален к подпространству L. Вообщ,е, если F cz R — произвольное множество векторов в евклидовом пространстве R, то мы будем говорить, что вектор х ортогонален к множеству F, если он ортогонален к любому вектору из F. Совокупность G всех векторов jt, ортогональных к множеству F, в силу той же леммы б сама составляет подпространство в пространстве R. Чаще всего такая ситуация встречается в том случае, когда F есть подпространство; тогда подпространство G называется ортогональным дополнением подпространства F. 8.37. Теорема Пифагора и ее обобщение. Пусть векторы х и у ортогональны; тогда по аналогии с элементарной геометрией вектор х -гу можно называть гипотенузой прямоугольного треугольника, построенного на векторах х и у. Умножая х-~у скалярно на себя и Используя ортогональность векторов х и у, мы получаем I х +у |2 - (х + у, х +у) = (х, х) + 2 (х, у) + (у, у) = = (*> *) + (}>,У)=-\х\2+\у\2. Мы доказали тем самым в общем евклидовом пространстве теорему Пифагора: квадрат гипотенузы равен сумме квадратов катетов. Нетрудно обобщить эту теорему на случай любого числа слагаемых. Именно, пусть векторы хъ х2, • . . ..., хк взаимно ортогональны и z — хг~\- х2-[г . . . -J- хк\
8.39J § 8.3. основные метрические понятия 255 тогда М2=(*1 + *2+ • •• +*Л, *! + Х2+ ... +Xk) = = |^l|2+l*2|2+... + l^|2. ("J 8.38. Неравенства треугольника. Если х и у — произвольные векторы, то по аналогии с элементарной геометрией вектор х-\-у естественно называть третьей стороной треугольника, построенного на векторах х и у. Используя неравенство Коши — Буняковского, мы получаем | х +у |2 = (х+у, х +у) = (х, х) + 2 (х, у) + (у, у), <\х\* + 2\х\\у\ + \у\*=(\х\ + \у\)*9 >\х\*-2\х\\у\+\у\*=(\х\-)у\)*9 или 1*+.У|<И + Ы. (12) \х^У\>\\х\-\у\\. (13) Неравенства (12) — (13) называются неравенствами треугольника. Геометрически они означают, что длина любой стороны всякого треугольника не больше, чем сумма длин двух других сторон, и не меньше, чем абсолютная величина разности длин этих сторон. 8.39. Мы могли бы, далее, последовательно переносить на евклидово пространство остальные теоремы элементарной геометрии. Но в этом нет нужды. Введем понятие евклидова изоморфизма между евклидовыми пространствами R' и R": именно, мы будем говорить, что R' и R" евклидово- изоморфны, если они изоморфны как вещественные линейные пространства (2.71) и, кроме того, для любой пары соответствующих векторов х', у' в R' и х", у" в R" выполняется равенство (*', /) = (х", у"). Очевидно, что всякая геометрическая теорема, — так мы будем называть теорему, основанную на понятиях линейного пространства и скалярного произведения, — доказанная для пространства R', будет справедлива и для изоморфного ему пространства R". Теперь заметим, что в силу теоремы 7.97 всякие два евклидова пространства равной размерности
256 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.41 п евклидово-изоморфны. Следовательно, всякая геометрическая теорема, справедливая в /z-мерном евклидовом пространстве R^ будет справедливой и в любом другом л-мер- ном евклидовом пространстве R'„. Геометрические теоремы элементарной геометрии, т. е. геометрические теоремы в пространстве R3, по доказанному, остаются справедливыми в любом трехмерном подпространстве любого евклидова пространства. Таким образом, все геометрические теоремы элементарной геометрии справедливы в любом евклидовом пространстве. § 8.4. Ортогональный базис 8.41. Теорема. В n-мерном евклидовом пространстве Кп существует базис из п ненулевых взаимно ортогональных векторов. Доказательство. Для билинейной формы (х, у), как и для всякой симметричной билинейной формы в /2-мерном пространстве, существует канонический базис (7.43) Уъ Уъ •••» Уп- Условие {У{,Ук)~® каноничности базиса при 1ф\г есть в данном случае условие ортогональности векторов у{ и yk\ таким образом, канонический базис Уъ Уъ •••» Уп образуется в данном случае из п взаимно ортогональных векторов. Это и доказывает теорему. В § 8.6 мы рассмотрим способы эффективного построения ортогонального базиса. 8.42. Векторы уъ у2, . . ., уп ортогонального базиса удобно нормировать, разделив каждый из них на его длину. Мы получаем после этого в пространстве R ортогональный и нормированный базис (иногда говорят «ортонормирован- ный» или «ортонормальный» базис). Пусть еъ е2, ..., еп — произвольный ортогональный нормированный базис в евклидовом пространстве Rn. Каждый вектор х £ Rn можно представить в виде x = l1e1 + l2e2+...+lnen1 (14) где £1? £2, ..., \п— координаты вектора х. Мы будем также называть эти координаты коэффициентами Фурье вектора х относительно ортогональной и нормированной системы еъ е2, ..., еп. Умножая равенство (14) скалярно на
8.51] § 8.5. задача о перпендикуляре 257 €iy находим выражение коэффициента ?-,•: &,•=(*,*/) (/= 1, 2, ...,л). (15) Если ^ = T]i^i + rl2^2+ • • • + rbA*— любой другой вектор пространства Rn, то по формуле (1) мы получаем (*, У) = li*\i + h^2 + • • • + 5„ЛЛ- (16) Итак, в нормированном ортогональном базисе скалярное произведение двух векторов равно сумме произведений их соответствующих координат — коэффициентов Фурье. В частности, полагая у — х, получим \х\* = (х,х) = Ц + Ц+...+11 (17) § 8.5. Задача о перпендикуляре 8.51. Рассмотрим в евклидовом пространстве R некоторое конечномерное подпространство R' и вектор /, вообще говоря, не входящий в подпространство R'. Поставим задачу найти разложение /=*+А, (18) где вектор g принадлежит подпространству R', а вектор h ортогонален к этому подпространству. Вектор g, участвующий в разложении (18), называется проекцией вектора f на подпространство R', а вектор h — перпендикуляром, опущенным из конца вектора f на подпространство R'. Такие названия связаны с привычными нам геометрическими ассоциациями*). Решение этой задачи фактически было дано еще в 7.54, для любой симметричной билинейной формы, невырожденной на подпространстве R'. Так как положительно определенная форма (х, у) невырождена на любом подпространстве R'czR (7.94), то существование решения нашей задачи, вместе с единственностью, следует из 7.54. Как мы видели в 7.55, наличие разложения (18) показывает, что все пространство R есть прямая сумма подпространства R' и его ортогонального дополнения R". *) И предназначены только для того, чтобы вызывать такие ассоциации. Поскольку понятие «конец вектора» не фигурирует в пашей аксиоматике, не следует искать в этом названии логического смысла. 9 Г. Е. Шилов
258 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.52 Прямая сумма, слагаемые которой ортогональны, называется ортогональной прямой суммой; мы построили, таким образом, разложение R в ортогональную прямую сумму R' и R". Если размерность пространства R равна п, а размерность R' равна &, то размерность R" равна п — k, поскольку размерность прямой суммы есть сумма размерностей слагаемых (2.47а). Заметим, что задача решается и в том случае, когда вектор / лежит в подпространстве R'. В этом случае решение имеет вид /=/+о. Другого решения, очевидно, нет: если бы мы имели / = g-\-h, g€.R', h£R", то было бы также h=f—g£R', откуда h = 0, g = f. 8.52. Применяя к разложению (18) теорему Пифагора (8.37), получаем 1/12 = кГ2+И2. (19) откуда вытекает, что справедливо неравенство 0<|А|<|/|, (20) геометрически выражающее тот факт, что длина перпендикуляра не превосходит длины наклонной. Отметим те случаи, когда в одном из неравенств (20) имеет место знак равенства. Условие 0 -- \h\ равносильно условию /= g-{- 0 = g, которое означает, что/ входит в подпространство R'. Условие |/z| = |/|, согласно теореме Пифагора, показывает, что g—О и, следовательно, /=0 + й = й; таким образом, / ортогонален к подпространству R'. Итак, равенство \h\~0 означает, что вектор / входит в подпространство R'; равенство |/&| = |/| означает, что вектор/ ортогонален к этому подпространству. При всяком ином расположении вектора / длина вектора h будет положительной величиной, меньшей чем длина вектора /.
8.53] § 8.5. задача о перпендикуляре 259 Пусть теперь еъ ..., ek — ортонормальный базис в под- k пространстве R' и пусть g = ^a-gj. Тогда по 8.42 (17) /=1 Подставляя это значение \g\2 в равенство (19), получаем В частности, для любой (конечной) ортогональной нормированной системы £1? е21 . . ., ek и любого вектора / мы получаем неравенство 2>К1Л2. которое называется неравенством Бесселя. Геометрический смысл его очевиден: квадрат длины вектора / не меньше, чем сумма квадратов его проекций на любые k взаимно ортогональных направлений. 8.53. В приложениях требуется иногда дать эффективное решение задачи о перпендикуляре, когда в подпространстве R' дан некоторый (вообще говоря, не ортогональный и не нормированный) базис {Ьъ /?2, •••, bk} — {b\. Чтобы получить это решение, разложим искомый вектор g по базису {/;}, и подчиним вектор h=f—g условию ортогональности со всеми векторами Ьъ Ь2, ..., bk. Мы получим следующую систему уравнений: {b,bl) = (f-g,bl) = = (/, *i) - Pi Фъ bt) - р2 (Ьг, Ьг) - ... - pft (bk, bt) = 0, (h,b2) = (f-g,b2) = = (/, b2) - Px (blt 1>г) - р2 (b,, bt)—...— p, (bk, bt) - 0, [h,bk) = (f-g,bk) = = (/. bh) - Pi (bt, bk) - p2 (bi% bk)-...-fo (bk, bk) = 0 9*
260 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.54 с определителем I (*1, Ьг) (ft2> Ьг) ... (&л, Ьх) I д I (*1, &2) (*2> &2> • '• (*А> &2> - \(bi,bk) \blih)\\.\bhX) I Определитель D, как определитель матрицы положительно определенной формы (х, у) в базисе Ьъ ..., йл, отличен от нуля (7.96). Разрешая систему по правилу Крамера, получаем выражения для коэффициентов |J. (у'=1, 2, ..., п): (Ьг, Ьг) ... (/>,•_!, Ьг) (/, Ьг) (&/+1> ftx) ... (ft*, &х) I (*1,*2) ••• (&/-1, »2) (f,b2)(bJ+1,b2) ... (ft„ft2) (их, ftk)'.!. '(ft,_lf йа)' i/,'ftA') (&/+1i ьк)'..'. \bk, ьк) I 8.54. Задачу о перпендикуляре можно поставить не только для подпространства, но и для гиперплоскости. В этом случае она формулируется так: в евклидовом пространстве R даны гиперплоскость R", полученная параллельным сдвигом некоторого подпространства R', и вектор /; требуется доказать, что существует и единственно разложение /=g+h, (21) где g принадлежит гиперплоскости R"*), а вектор h ортогонален подпространству R'. Геометрический смысл этого разложения ясен из рис. 1,я. В разложении (21) слагаемые, вообще говоря, уже не ортогональны. Эту задачу легко свести к задаче 8.51. Действительно, если в гиперплоскости R" фиксировать любой вектор /0 и вычесть его из обеих частей равенства (21), то мы получим задачу о разложении вектора /—/0 на слагаемые g—/0 и /г, первое из которых принадлежит подпространству R', а второе ортогонально к этому подпространству (см. рис. 1, б). В силу результата 8.51 такое разложение существует; *) Геометрически это означает, что конец вектора g лежит в гиперплоскости R" (а его начало, как всегда,— в начале координат). Не следует представлять себе весь вектор g лежащим в гиперплоскости R"! h=i
8-6,l § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 261 Двух разложений указанного™ { h СЛУЧЗе НЗЛИЧИЯ мы „мели бы /=^ + А1 = ^ + й2 ° = tei—gi) + {hl — ha). Здесь gl-gi принадлежит подпространству R', a h __h ортогонально этому подпространству. Отсюда * „ с=А1—А, = о, что и требуется. отсюда ft_g^ § 8.6. Общая теорема об ортогонализации вом?ро;т^анстТеСг1Н1еОРзТн0ач0енаЛЬНЫХ СИСТем В ев™" теорема: основное значение имеет следующая общая Пу1?°£Х' (ТГРеМа °б оР.^гоналнзации.) 2. -., хк, ...-некоторая последовательность
262 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.61 векторов евклидова пространства R (конечная или бесконечная). Обозначим через Lk — L (хх, х.2, ..., хк) линейную оболочку первых k векторов этой системы. Утверждается, что существует система векторов уг, у2, ..., yk, ..., обладающая следующими свойствами: 1) Для любого натурального k линейная оболочка L'k векторов у1} у2, ..., yk совпадает с подпространством Lk. 2) Для любого натурального k вектор yk + i ортогонален к подпространству Lk. Доказательство. Положим yx = xv Очевидно, что при этом выполнено условие Далее будем доказывать теорему по индукции: предположим, что уже построено k векторов уъ у2, . . ., ук, удовлетворяющих поставленным условиям, и построим вектор ук + 1 так, чтобы он также обладал требуемыми свойствами. Пространство Lk конечномерно, и поэтому в силу 8.51 существует разложение **+1 = Л + А*. (22) где вектор gk входит в подпространство Lk, а вектор hk ортогонален к этому подпространству. Мы положим yk + 1 — hk. Проверим выполнение условий теоремы ортогонализации для определенного таким образом вектора yk+v Подпространство Lk, по предположению индукции, содержит векторы уъ у2, . . ., ук; поэтому и более широкое подпространство Ц + 1 содержит эти векторы; кроме того, из формулы (22) вытекает, что Ц + 1 содержит вектор hk=yk + 1. Таким образом, подпространство Lk + 1 содержит все векторы Уъ • • •» Ук + ъ а вместе с ними и всю их линейную оболочку L'k+1. Но и обратно, подпространство L'k+1 содержит векторы Хц х2, ..., хк и, как показывает равенство (22), содержит и вектор хклЛ\ отсюда вытекает, что L'k+1 содержит все подпространство Lk + 1. Следовательно, Lk+1 = Lk + lJ и первое условие теоремы ортогонализации выполнено. Выполнение же второго условия очевидно по самому построению вектора yk + 1 = hk. Индукция, таким образом, проведена, и тем самым теорема полностью доказана.
8.64] § 8.С. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 263 8.62. Неравенство (20) в данном случае принимает вид 0<l.V* + i|<|** + i|- (23) При этом, как показано в 8.52, равенство 0 = |j;fe + 1| означает, что вектор xk + l принадлежит к подпространству Lk и, следовательно, связан линейной зависимостью с векторами хъ х2, ..., хк. Противоположное равенство \Ук + \ I ~ I xk-\ 11 означает, что вектор xk + 1 ортогонален к подпространству Lk, и, следовательно, ортогонален к каждому из векторов xv х2, ..., xk. 8.63. Заменами е. Всякая система векторов гъ z2, ... .. ., zk, . . ., удовлетворяющая условиям теоремы ортогонализации, совпадает с точностью до числовых множителей с системой з>1, >'-2, • • •, У^ - - - ■> построенной при доказательстве этой теоремы. Действительно, вектор zk + l должен принадлежать к подпространству Lk + 1 и при этом должен быть ортогонален к подпространству Lk. Первое из этих условий приводит к существованию разложения *А + 1 = С1У1 + С'2У2 + ••• + Ckyk + Ck + 1yk + 1 =yk + Ck + 1yk + l9 ™e Ук = с1Ух+ • • - + с^леЦ, a ck + 1yk + 1 ортогонален к Ц. Второе условие в силу 8.52 приводит к утверждению, что yk = 0 и, следовательно, Zk + 1~ Ск + 1Ук + И что и требуется. 8.64*. Многочлены Лежандра. Рассмотрим в евклидовом пространстве /?2 (—1, -;-1) систему функций x0(t)=^\, x1(t) = t, . .., xk(t) = tk, ... и применим к ней теорему ортогонализации. Подпространство Lk = L (1, t, ... ..., fk) в данном случае, очевидно, совпадает с совокупностью всех многочленов степени n^k. Функции л:0(/), ... ..., xk(() линейно независимы (2.22г), поэтому функции «Уо(0, ЗМО* •••> получаемые путем ортогонализации, все отличны от нуля в силу 8.52. По самому построению функция yk (/) должна быть многочленом k-vi степени от t. В частности, непосредственное вычисление по методу
264 гл. 8. евклидовы пространства [8.64 теоремы ортогонализации дает J>o(0 = l, yi(*) = t, y2(t) = t*-±, y3(*) = t*-jt и т. д. Эти многочлены были введены в 1785 г. французским математиком Лежандром в связи с задачами теории потенциала. Общая формула для многочленов Лежапдра была найдена Родригом в 1814 г. Именно, оказалось, что многочлен yn(t) с точностью до числового множителя равен многочлену Рп W ■■= Щй №-')"] (л = 0, 1, 2, ... )• (24) Мы воспользуемся для доказательства этого предложения замечанием 8.63. Именно, мы покажем, что многочлен pn(t) удовлетворяет условиям теоремы ортогонализации; в силу указанного замечания мы будем для каждого п иметь равенство Pn(t) = cnyn(t), что нам и нужно. а. Линейная оболочка векторов pQ(t), Pi(t), ..., pn(t) совпадает с совокупностью всех многочленов до п-й степени. В самом деле, как видно из формулы (24), многочлен pk(t) есть, очевидно, многочлен точно k-Pi степени от t; в частности, Ро (0 = Яоо> с2 \ (25) Рг (0 = а2о + а2^ + <W Pk (О = аы + ak\t + ■■■+ akktk, • •• •• Pn (0 = *n0 + *Ш* + • • • + ***** + • • • + в«/. причем старшие коэффициенты aQQ, alv . .., ann отличны от нуля. Таким образом, все многочлены Ро(0>/МО> • • •» Рп (0 входят в линейную оболочку функций 1, t, ...,/", которая, очевидно, есть совокупность Ln всех многочленов от t не выше п-и степени. Так как матрица линейных соотношений (25) имеет определитель а00аи. . .апп, отличный от нуля, то и, обратно, функции 1, /, /2, ..., tn могут быть линейно выражены через pQ(t), Pi(t), • •-, Р,Л*)> поэтому линейная оболочка L[p0(t), Pi(t), ..., Pn(i)\ совпадает
8.64] § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 265 с линейной оболочкой 1(1, t, t2, ..., tn) и, следовательно, совпадает с совокупностью Lm что и требовалось. б. Вектор pn(t) ортогонален к подпространству Ln_v Достаточно проверить, что многочлен рп (t) ортогонален в /?2(—1, 1) к функциям 1, t, ..., tn~x. При доказательстве мы будем использовать формулу интегрирования по частям в определенном интеграле, предполагаемую известной из анализа. Производные, входящие в эту формулу, для многочленов суть те же самые производные, которые мы рассматривали в 6.73а с чисто алгебраической точки зрения. В частности, многочлен [(*а-1)»] = (*-1)»(*+1)» в силу 6.7Зв при t = ±\ имеет равные 0 производные порядков 0, 1, . . ., п— 1. Итак, будем вычислять скалярное произведение tk и pn(t). Интегрируя по частям, мы получаем + 1 (tk,PnV))= ^tk[(t*-\)»}Mdt = -1 +1 Внеинтегральный член полученного выражения в силу сказанного выше обращается в нуль. Оставшийся интеграл снова берем по частям, и продолжаем этот процесс, пока показатель при t не снизится до нуля: (<*, рп(0) = -«*-1 [са- 1)"](п_2)|!| + +1 + ft(ft —1)J t*-*[{p — !)»]<»-»<tt + 1 ±k\ \{{t2— 1)"]<в-*>Л = ±Л![(^— l)»]«»-ft-n ::-<>, - 1 что и требуется.
266 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.71 Итак, мы доказали, что для каждого п многочлен yn(t) с точностью до числового множителя совпадает с многочленом pn(t)--=[(t2—\)"]{n). Вычислим значение рп(\). Для этого применим к функции (t2—\)п = (t - - \)п (t—\)п правило /z-кратного дифференцирования произведения: [(t+l)»(t-\)»]™ = ==(^+i)"[(^-i)«]t«> + ci[(^+i)"n^-1)1(,I"1,+ "-=i = (t+\)nn\-rClnn(t+\)n"1n(n—\). . .2{t— 1) + ... При подстановке / = 1 все члены этой суммы, начиная со второго, обращаются в нуль. Мы получаем, следовательно, Pj\) = 2nnl. Для вычислительных целей удобнее иметь значения наших ортогональных функций равными 1 при / = 1. Чтобы достичь этого, мы должны ввести числовой множитель :—-. . Именно 2пп\ полученные после этого многочлены и называются многочленами Лежандра; многочлен Лежандра степени п обозначается символом Pn(t), так что Рп Ю = 2^ [С8-!)"]01*. § 8.7. Определитель Грама 8.71. Определителем Грама называется определитель вида (*i> *i) (#1, х2) • . • (л'^. xkl G (хг, х2, ..., х, \ = I(л"2' х^ (ЛГо-' х^ " ' (ЛГ2' х^ \*ki XV (Xjii x2i (**. Xk) где .v1} х2, ..., xk — произвольные векторы евклидова пространства R. Мы знаем, что в случае линейно независимых векторов хъ Хо, ..., хп этот определитель положителен (7.96). Для вычисления определителя Грама применим к векторам xLj х2, • • •, хк процесс ортогонализации. Пусть, на-
8.71] § 8.7. определитель грама 267 пример, з>1 = *i " вектор у., ■= a1yl -f х2 ортогонален к^. Заменим на всех местах определителя вектор х1 на ух. Далее прибавим ко второму столбцу первый столбец определителя Грама, умноженный на аг (отнеся аг ко второму множителю скалярных произведений), и затем прибавим ко второй строке первую строку определителя, умноженную на аг (отнеся аг к первому множителю скалярных произведений). В результате на всех тех местах определителя, где был вектор х2, будет находиться вектор у2. Далее, пусть у3 —- Р1вух -|- $2у., ~|- х3 ортогонален к ух и у2\ прибавим к третьему столбцу первый, умноженный на (515 и второй, умноженный на |$2; ту же операцию произведем со строками. В результате х3 на всех местах будет заменен на у3. Мы можем продолжать этот процесс далее, пока не дойдем до последнего столбца. Так как наши операции не изменяют величины определителя, то в результате мы получим 0>i, уг) 0 ... О О (у2, у2) ... О и (xv х2, . . ., xk) — О 0 ... (yk,yk) = (Уг> Уг) (У* У2>- • Лук> У к)- (26) В силу результата 8.62 мы получаем следующее неравенство: 0<G(xl5 х2, ..., xk)^(xv хх)(х2, x2)...(xk, xk). (27) Выясним, в каких случаях величина G(xvx2, ...,xk) может принимать крайние значения 0 или (хг, хг) . . . (xk, xk). Из выражения определителя Грама (26) вытекает, что он равен нулю в том и только в том случае, когда один из векторов yv у2, . . ., ук равен нулю. Но в силу 8.62 это эквивалентно линейной зависимости векторов xv х2, . . ., хк. С другой стороны, равенство определителя Грама правой части неравенства (27) возможно в силу формулы (26) и 8.62 только в том случае, когда векторы хг, х2, ..., хк взаимно ортогональны. Итак, мы доказали следующую теорему: Теорема. (Теорема об определителе Грама.) Определитель Грама векторов хх, x2, ..., xk равен нулю^
268 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.72 если эти векторы линейно зависимы, и положителен, если они линейно независимы; он равен произведению квадратов длин векторов хг, х2, ..., xk, если они взаимно ортогональны, в противном случае он меньше этой величины. 8.72. Объем ^-мерного гиперпараллелепипеда. Площадь параллелограмма, как известно из планиметрии, равна произведению его основания на высоту. Если параллелограмм построен на двух векторах хъ х2, то можно принять за основание длину вектора xv за высоту — длину перпендикуляра, опущенного из конца вектора х2 на ось вектора х±. Аналогично объем параллелепипеда, построенного на векторах xv x2, х3, равен произведению площади основания на высоту; площадь основания есть площадь параллелограмма, построенного на векторах хъ х2, а высота есть длина перпендикуляра, опущенного из конца вектора х3 на плоскость векторов хъ х2. Эти соображения делают естественным следующее индуктивное определение объема ^-мерного гиперпараллелепипеда в евклидовом пространстве. Пусть дана система векторов хъ хъ . . ., xk в евклидовом пространстве R. Обозначим через hj перпендикуляр, опущенный из конца вектора х.-+1 на подпространство L(xt, х2, ..., Xj) (у=1, 2, ...,&—1). Введем, далее, следующие обозначения: Vi= \xi\ (одномерный объем — длина вектора хг), V2 = V'^- J /гх J (двумерный объем — площадь параллелограмма, построенного на векторах хг, х2), V3= V2-\h2\ (трехмерныйобъем — объем параллелепипеда, построенного на векторах хъ х2, х3), Vk= Vk_l-\hk_1\ (^-мерный объем — объем гиперпараллелепипеда, построенного на векторах хг, х2, ... .. ., xk). Очевидно, что объем Vk может быть вычислен по формуле Vk=v[xi,x2, ..., *a] = |*iMaiI---Ia*-iI-
8.73] § 8.7. ОПРЕДЕЛИТЕЛЬ ГРАМА 269 Используя формулу (26), мы можем выразить величину Vk через векторы xv х2, .. ., xk: VI \xli xv \xi, X2) (x2, xi) (x2, x2) .. (xl} xk) • • (X2i Xk> \Xk> XV \Xfr X2/ • • • \Xk> Xk) образом, определитель Г рама от k векторов xk равен квадрату объема k-мерного гиперпа-, Таким раллелепипеда, построенного на этих векторах, 8.73. Пусть Ър ортогонального и нормированного базиса координаты вектора Xj относительно *i, *2, •••» еп (У=1» 2, —, Л; /= 1, 2, —, л). Выражая скалярные произведения векторов через координаты, мы получим следующую формулу: VI Бда+.-.+Бда Si Si -r (k)t(k) + IPZX Матрица определителя VI, как легко убедиться, есть из координат векторов произведение &х#-матрицы А х1> XD • • •> хк si1' й1» t(2) t(2) bl b2 £<*) £(*> £(*) bl b2 • • • 5я _ и транспонированной к ней ях&-матрицы t(i) b?i £(2) Ь/г (28) Л' = Е1" Е1г) • • • If £<1) £(2) £(Л) Ь2 Ь2 ' * ' Ь2 £(1) 6(2 Ья Ья £(/ Ьл (Л)
270 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.74 Применяя формулу 4.54 (\4) к определителю V\, находим vl = M\\ \\ \\\\\(АА') = 2 м};/;;:\(А)М\\;;;:1к(А'), где суммирование распространяется на все наборы номеров ix < . . . < ik, принимающих значения от 1 до п. Так как м',*;:::;^ и') = <•.•■::** И), то vl= S [м1;::::Х(А)]*. h Ч,- Итак, квадрат объема k-мерного гиперпараллелепипеда, построенного на векторах х- (j■-- 1, 2, . . ., k), равен сумме квадратов всех миноров k-го порядка в матрице из координат векторов х- относительно (любого) ортогонального и нормированного базиса еъ е2, ..., еп. 8.74. В случае k = n матрица || ^/} || имеет только один минор &-го порядка, равный определителю матрицы || ^у) ||. Поэтому объем n-мерного гиперпараллелепипеда, построенного на векторах хи х2, • • •, хп, равен (по абсолютной величине) определителю из координат векторов х{ (/ = 1,2, . . ., п) относительно (любого) ортогонального и нормированного базиса. 8.75. Неравенство Ада мара. Из результата 8.74 можно получить одну важную оценку абсолютной величины произвольного определителя k-vo порядка I fell fet2 * * * fel/г r\ »21 fe22 • • ' fe2/e I fefcl fe/z2 • • • fefc/г I Будем рассматривать числа |а, |/2, . . ., lik (l= 1, 2,. . ., k) как координаты вектора xi в ортогональном нормированном
8-81] § 8.8. несовместные системы 271 базисе ^-мерного евклидова пространства. Результат 8.74 дает нам возможность истолковать абсолютную величину определителя D как объем /^-мерного гиперпараллелепипеда, построенного на векторах хг, х2, . .., хк, и использовать выражение объема через определитель Грама D2— = G(x1, х2, ..-, xk). Применяя теорему 8.71, получаем k к D2 < (х\, xj (х2, л\2) . . . (хк, хк)=- П 2 ЪЬ- Это неравенство носит название неравенства Лдамара. Отметим, что оно обращается в равенство в силу теоремы 8.71 в том и только в том случае, когда векторы xv x.y, ..., хк взаимно ортогональны. Неравенство Адамара имеет прозрачный геометрический смысл: объем гиперпараллелепипеда не превосходит произведения длин его ребер; он равен этому произведению в том и только в том случае, когда его ребра взаимно ортогональны. § 8.8. Несовместные системы линейных уравненлй и метод наименьших квадратов 8.81. Пусть дана несовместная система линейных уравнений 011*1 + «12*2 +•••-!- «1,Л = *1, \ #21-^1 ~Г Я22*2 ~Г ' ' ' ~Г a2mXm ™ ^2> I /ОП\ ап1Х1 + аи2*2 + • ' ' + anmXm ~ bп' ) Поскольку она несовместна, ее нельзя решить, т. е. нельзя найти такие числа сг, с2, ..., ст, чтобы при подстановке этих чисел вместо неизвестных хх, х2, ..., хт удовлетворялись бы все уравнения системы (29). Если подставить какие-нибудь числа \х, \2, . .., \т вместо неизвестных хх, х2, ..., хт в левые части уравнений (29), то мы получим результаты ух, у2, ..., уп, отличные от чисел ЬЛ, Ь2, ..., Ьп. Поставим себе задачу: при известных значениях чисел ajk и bk(k=\, . .., п\ у'=1, ..., т) определить числа |l5 £2, ..., \m так, чтобы
272 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.82 квадратичное уклонение результатов у1? у2, . .., уп от дан* ных величин bv b2, . . ., bn> определяемое выражением 6Я= 2 (?/-*/)", (зо) оказалось наименьшим из возможных, а также найти это минимальное уклонение. Такая задача возникает на практике, когда, например, коэффициенты \f линейной зависимости величины b от величин alt а2, ..., ат b = lia1 + l2a2+ ... +Ътат должны быть найдены из результатов измерений величин Ау(/=1, 2, ..., т) и соответствующих значений Ь. Если при i-м измерении получены значения а,у для величины а}- и &,- для величины Ь, то мы должны составить уравнение Eifl/i + 52fl|2+ • • • +E«fl/i« = Ь/; (31) п измерений приводят к системе п уравнений (31), т. е. к системе вида (29). Эта система вследствие неизбежных ошибок измерений будет, вообще говоря, несовместной, и задача определения коэффициентов £i» £2» •••» 5/я» таким образом, не сводится к задаче решения системы уравнений (29). Возникает задача определить коэффициенты 5/ так, чтобы каждое уравнение удовлетворялось, хотя бы и приблизительно, но с общей наименьшей погрешностью. Если за меру погрешности взять среднее квадратичное из уклонений величин т i = l от известных bj, определяемое формулой (30), то мы и придем к сформулированной выше задаче. Знание величины б"2 в этом случае также полезно: оно помогает оценить надежность измерений. 8.82. Решение получается немедленно, если истолковать задачу геометрически в вещественном пространстве Rn. Рассмотрим т векторов а1У я2, ..., ат, компоненты которых выписаны в столбцах системы (29) Составляя линейную комбинацию \1а1 + . . . + \тат, мы получим вектор V^iVi» •••» Чт)- Нужно определить числа £х, . .., 1^т так, чтобы вектор у по норме имел наименьшее возможное отклонение от заданного вектора Ь= [Ьъ Ьъ . . ., Ьп}.
8.84] § 8.8. несовместные системы 273 Совокупность всех линейных комбинаций векторов av . . ., ат образует подпространство L = L (аъ а2, . . ., ат). В этом подпространстве наименьшее расстояние до вектора b имеет проекция вектора Ь на подпространство L. Числа £1? ..., \т, следовательно, должны быть выбраны так, чтобы линейная комбинация t)1al -\- . . . -\-\тат привела к проекции вектора b на подпространство L. Но решение этой задачи нам известно; оно дается формулами 8.53, именно, мы имеем (а19 аг) ... (fly.!, аг)(Ь, аг) (fl/+1, аг)...(ат, Ьг) *j D (аг, ат) ... (fly.!, flj (*, flj (fl/+1, flj. . .(am, bm) где D — определитель Грама G(a1, fl2, ..., am). 8.83. Результаты 5.72 дают нам возможность оценить и само уклонение б. Действительно, величина б есть высота (/»+ 1)-мерного параллелепипеда, построенного на векторах а1} ..., flOT, b, и равна поэтому отношению объемов V(аъ а2, ..., ат, Ь) V(av a2, ..., ат) Записывая каждый из объемов с помощью определителя Грама, находим окончательно g2_G(flt, g2, ..., ат% b) G(fllt fl2. •••• аю) Тем самым поставленная нами задача полностью решена. 8.84. В вычислительной практике часто встречается следующая задача (интерполирование с наименьшей квадратичной погрешностью): на отрезке a^^t^b дана функция fo(t)\ указать многочлен Р (t) степени k, k < n, для которого квадратичное уклонение от функции f0 (/), измеряемое величиной &2(fo> P)=2 [fo(tj)-P(tj))2* /=о становится наименьшим. Здесь /0, tv .., ^ — некоторые фиксированные точки отрезка а<Ц*^Ь. Простое решение этой задачи на основании геометрических соображений было предложено М. А. Красносельским.
274 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.91 Бредем евклидово пространство R, образованное из функций f (t), рассматриваемых только в точках tlh tv ..., tn, со скалярным произведением п (Л й=2 fVj)e(tj). / = 0 Тогда наша задача сводится к определению проекции вектора f0(t) на подпространство всех многочленов степени, не превосходящей к. Коэффициенты искомого полинома Р0 (/) ---£0-t-£if-r • • • +6/^Л даются теми же формулами, что и в разобранной выше задаче: 6/= D (1, 1) (/, 1) ... (//-1, 1) (/0, 1) (*/+i, 1) ... (t\ 1) (1, О (Л о ... (/'-1, о (/0, t) (t'4 0 ... (**, О (1, **) а, **) . . . (<>-!, <*) (/0, /*) (/А 1, **). . . (/*', **) где D определитель Грама D(l, /, ..., tk). Само наименьшее квадратичное уклонение б2 можно вычислить по формуле § 8.9. Сопряженные операторы и изометрия 8.91. Операторы, сопряженные относительно форм ы (л:, у). Сформулируем здесь результаты § 7.6 о связи между линейными операторами и билинейными формами в применении к случаю, когда фиксирована форма (л;, у) — скалярное произведение векторов л: и у. Пусть А и В — линейные операторы в евклидовом пространстве Rrr Образуем билинейные формы А (х, у) и В (л;, у) по формулам А (х, у) - (А*, у), В (х, у) - (х, By). (32) Так как каноническим базисом формы (х, у) является любой ортонормальный базис пространства и канонические коэффициенты формы (х, у) в любом таком базисе все равны 1, то в силу 7.61 матрица || aJfi \\ формы А (л*, у) в любом ортонормальном базисе совпадает с матрицей || а)Р \\ оператора А, а матрица \\bJk\\ формы В (л;, у) транспонирована по отношению к матрице || Щк) || оператора В. Обратно (7.62), если в пространстве Rn заданы билинейные формы А (х, у) и В (л:, у), то существуют и единственны такие
8-93] § 8.9. сопряженные операторы и изомётрия 275 линейные операторы А и В, что выполнены равенства (32). Далее, применяя результаты 7.63 к форме (х, у), получаем следующий результат: Теорема. Для каждого линейного оператора А в евклидовом n-мерном пространстве R;/ существует и единствен сопряженный оператор — линейный оператор А', удовлетворяющий уравнению (Ах, у) = (х, к'у) при любых х и у из Rn. Матрица оператора А' в любом ортогональном и нормированном базисе пространства Rn транспонирована по отношению к матрице оператора А. 8.92. С помощью операции сопряжения в евклидовом пространстве вводятся следующие классы операторов. а. Симметричные операторы, определяемые равенством А'=А. Симметричный оператор характеризуется тем, что в орто- нормальном базисе его матрица не меняется при транспонировании. б. Антисимметричные операторы, определяемые равенством А'- —А. Антисимметричный оператор характеризуется тем, что в ортонормальном базисе его матрица после транспонирования изменяет знак. в. Нормальные операторы, определяемые равенством А'А = АА\ Очевидно, нормальные операторы включают в себя и симметричные и антисимметричные. Изучение введенных классов операторов будет произведено в § 9.4. 8.93. Теперь сформулируем для евклидова пространства R„ результаты 7.73—7.76 относительно инвариантных операторов. Рассматриваются линейные обратимые отображения Q пространства R,; в себя, не изменяющие скалярного произведения: (Qx, Qy) = (x} у).
276 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.94 Эти отображения, названные в 7.73 инвариантными относительно формы (дс, у), здесь будем называть изометрическими. Изометрический оператор Q характеризуется равенством 7.75(33) Q'Q = E, где Q' — оператор, сопряженный к Q относительно формы (х, у), т. е. оператор, сопряженный к Q в смысле 8.91. Обратный оператор Q-1 = Q' к изометрическому оператору Q также изометричен. Произведение двух изометрических операторов является изометрическим оператором (7.74). Согласно 7.75 изометрический оператор Q характеризуется тем, что любой ортонормированный базис еъ ..., еп переводится этим оператором снова в ортонормированный базис /х = Q^i, ..., fn = Qen- Матрица Q=|[^')|] изометрического оператора Q в любом ортонормированном базисе называется ортогональной матрицей. Ортогональная матрица характеризуется условиями 7.76(35), имеющими в данном случае вид &4<qk ~\ 0 при ;фк, или же условиями 7.76(35'), имеющими вид [ 1 при j=mi 2 4k4k \ 0 при j-фт, т. е. сумма квадратов элементов любой строки (любого столбца) равна 1, сумма произведений соответствующих элементов двух разных строк (столбцов) равна 0. 8.94. В силу равенства Q~1 = Q\ обращением формул перехода от ортонормального базиса е19 ..., епк другому ортонормальному базису /1? ..., /п f1 = q?e1+...+fl>en, \ \ (33)
8.95] § 8.9. сопряженные операторы и изометрия 277 служат формулы [ (34) В силу 5.31 координаты r\k вектора х в базисе fv ..., fn выражаются через координаты £у этого же вектора в базисе ev ..., еп по формулам \ (35) Ч„ = <№+...+«„ ) с обратными формулами \ (36) ln = tiPr\1+...+<tf>1]n. ) 8.95. Рассмотрим здесь еще следующую задачу. Пусть заданы т < п числовые строк q{p (/= 1, ..., п; /=1, ...,/#), удовлетворяющих условиям <£..., f 1 при У=А, у д(/>д(/о = <' ^ у ,tift'4 \ 0 при у^А. Требуется найти еще п — т числовых строк q{f\ s=m+\, .. ., п, так, чтобылхл-матрица Ц^'ЧК*, У= 1, • • •, л) была ортогональной. Решение получается просто из геометрических соображений. Интерпретируя заданные строки q{/} как координаты т векторов в евклидовом пространстве Rn со скалярным произведением (8.226) п (№i. •••, У, (Ль ••., т|и))= 2 S/Л/, мы видим, что нам заданы т ортогональных и нормированных векторов qv ...yqmw задача состоит в том, чтобы дополнить их до ортонормального базиса в пространстве Rn. В этой геометрической формулировке задача становится очевидно разрешимой: например, можно дополнить векторы
278 Гл. 8. евклидовы пространства [8.96 Яъ •••» Ят произвольно до системы п линейно независимых векторов и далее провести ортонормализацию. 8.96. Рассмотрим еще некоторые свойства симметричных операторов. а. Если подпространство R'ciR инвариантно относительно оператора А, то ортогональное дополнение подпространства R', на основании 7.65, инвариантно относительно сопряженного оператора А'. Поэтому, если А — симметричный оператор, то из инвариантности относительно А подпространства R' следует инвариантность относительно А и ортогонального дополнения к подпространству R'. б. Покажем, что на плоскости (п = 2) всякий симметричный оператор имеет собственный вектор. Действительно, в данном случае уравнение для собственных значений |аи — К а12 I I а21 °22 ^ I есть квадратное уравнение с дискриминантом (ап + а22)2 —4(ona2, —a21a12) = (air-a22)2 + 4af2>0, поэтому его корни вещественны. в. Пользуясь а и б и существованием инвариантной плоскости у всякого оператора в вещественном пространстве (вытекающим из выражения вещественной жордановой формы 6.63 (18)), можно доказать, чтов пространстве Y((l всякий симметричный оператор имеет ортогональный базис из собственных векторов. Мы в дальнейшем получим этот результат из общих соображений, не опираясь на вещественную жорданову форму (9.45). ЗАДАЧИ 1. Назовем скалярным произведением двух векторов пространства V3 произведение их длин. Будет ли пространство евклидовым? 2. А если назвать скалярным произведением двух векторов того же пространства произведение их длин на куб косинуса угла между ними? 3. А если назвать скалярным произведением удвоенное обычное скалярное произведение этих векторов? 4. Найти угол между противоположными ребрами правильного тетраэдра.
ЗАДАЧИ 279 5. Найти углы в треугольнике, образованном в пространстве R2 (—1, 1) векторами xl(t)--\, x2(t) — t и x.A(t)—\—t. 6. Написать неравенства треугольника в пространстве С2 (я, Ь). 7. Определить косинусы углов между прямой £i —£о-—... =£„ и осями координат в пространстве Rn. 8. В пространстве Rx разложить вектор / на сумму двух векторов, один из которых лежит в линейной оболочке векторов/?/, а другой ортогонален к этому подпространству: а) / = (5, 2, -2, 2)\ Ьх-:{2, 1,1, -1), Ь2 = (\, 1, 3, 0); б) /-(-3, 5, 9, 3), V-(l, !• !• 0. Ь2 = (2, -1, 1, 1), Ь8 = (2, -7, -1, -1). 9. Доказать, что из всех векторов подпространства R'(8.51) наименьший угол с вектором / образует вектор g. 10. Доказать, что если вектор gu в подпространстве R' ортогонален к проекции g вектора / на это подпространство, то g0 ортогонален и к самому /. 11. Показать, что перпендикуляр, опущенный из начала координат на гиперплоскость Н, имее! наименьшую длину из всех векторов, соединяющих начало координат с этой гиперплоскостью. 12. В пространстве V.A с базисом I, у, k задана система векторов *! = /, x2 = 2i, x3 = 3i, xA = 4i — 2j, x& = — i + \0j\ xC} = i+J+bk. Построить ортогональные векторы уъ у2, ..., уг, (8.61). 13. В трехмерном подпространстве пространства /?4, порожденном векторами (1, 2, 1, 3), (4, 1, 1, Г), (3, 1, 1,0), построить ортогональный базис, используя метод теоремы ортогонализацми. 14. Пусть даны подпространства R' и R" евклидова пространства R. Рассмотрим перпендикуляры, опущенные из концов единичных векторов e'£R' на R", и пусть т (R', R")— максимум из их длин; аналогично определяем величину т (R", R'). Неотрицательная величина 0 = max {m(R', R"), m (R", R')} называется раствором подпространств R' и R". Показать, что при 0 < 1 размерности подпространств R' и R" равны (М. А. Красносельский и М. Г. Крейн). 15. Найти старший коэффициент Ап многочлена Лежандра Pn{t). 16. Показать, что многочлен Лежандра Р;/(/)ссть четная функция при четном п и нечетная функция при нечетном п. Найти, в частности, 17. Доказать, что в разложении многочлена tPn^1(t) по многочленам Лежандра tPn_1(t) = a0Pu(t) + a1Pl(t)+...+anPn(t) коэффициенты д0, аг, ..., аи_3 и ап_х равны нулю. 18. Найдя коэффициенты ап_.2 и ап в разложении многочлена tPn-i(t) из задачи 17, получить рекуррентную формулу nPn(t) = (2n-l)tPn_1(t)-(n-l)Pn_2(t)-
280 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА 19. Найти многочлен Q (t) = tn-{-b1tn-1+ ... +bn_1t-{-bn, для которого интеграл + 1 J Q2(t)dt -1 достигает наименьшего значения. 20. Найти норму многочлена Лежандра Рп (t). 21. Показать, что для любого линейного оператора А, действующего в я-мерном евклидовом пространстве R„, отношение k(A)=V^AXl' A*2' "•' А*я1 V[xlt х2, ..., хп] постоянно (т. е. не зависит от выбора векторов хъ х2> . ..,*„), и найти его величину («коэффициент искажения»). 22. Показать, что для любых двух линейных операторов А и В имеет место равенство k (AB) = 6 (A) k (В). 23. Пусть хъ х2, ..., xk> t/, г—векторы евклидова пространства R. Доказать неравенство У[хъ х2, ..., xk, у, г] ^ V [х1у х2у ..., xk, г] V [хъ х2, ..., xki у] ^ V [х19 хъ ..., xk] 24. Пусть хъ х2, ..., хт — векторы евклидова пространства R. Доказать неравенство V [хъ х2, ..., хм] < Д {V [хъ ,,.txk^xk+1 хт]}т . k=i Каков его геометрический смысл? 25. (Продолжение.) Доказать неравенства, уточняющие неравенство Адамара: 1 т —— У[хъ Ч ^л]<П{^[^1. •••♦ Ч-ъ Xk + b •••• Хт]}™ < 1-2 XI к[*1» ••• ♦ хк-ъ хк + ъ •••» xl-i> х1+ъ •••» хт\) ^ 1<&</<т < П {Vl*s»Xs2, ...,^г]} 1 <: St < «2 < • • .<sr<m 1-2. . .(я-г) (m- 1) (m-2) ... г < П {п**- **,1Г~'<11>«1 l<S!<s2<m s=l (М. К. Фаге).
ЗАДАЧИ 281 26. Если \а{-к]^М, то по неравенству Адамара det || a;k || ^ <Ai"ii"/2. Показать, что эта оценка не может быть улучшена для п = 2т. 27. Если N (А) и Т (А) — соответственно нуль-многообразие и область значений оператора А, то ортогональные дополнения этих подпространств суть соответственно область значений и нуль-многообразие оператора А. 28. Показать, что для каждого элемента a;k ортогональной матрицы А соответствующее алгебраическое дополнение A{k = a;k det A, 29. Показать, что сумма квадратов всех миноров /г-го порядка, расположенных в k фиксированных строках ортогональной матрицы, равна 1; сумма произведений всех миноров k-то порядка в одной группе строк на соответствующие миноры k-vo порядка другой группы строк равна 0. 30. Некоторый линейный оператор Q сохраняет длину каждого вектора; показать, что он является изометрическим. 31. Оператор А, сохраняющий ортогональность любых двух векторов х, у (так что из (х, у) = 0 вытекает (Ах, At/) = 0), называется равноугольным оператором. Всякий изометрический оператор является равноугольным. Кроме того, равноугольными являются оператор подобия {кх — Хх для любого х) и произведение оператора подобия на изометрический оператор. Доказать, что всякий равноугольный оператор есть произведение оператора подобия и изометрического оператора. 32. Показать, что при п ^ 3 всякий линейный оператор Q, действующий в я-мерном пространстве R„ и не изменяющий площади любого параллелограмма, так что V[x,y]=V[Qx,Qy]9 есть изометрический оператор. 33. Показать, что при k < n всякий линейный оператор Q, действующий в я-мерном пространстве R„ и не изменяющий объема любого /г-мерного гиперпараллелепипеда, является изометрическим (М. А. Красносельский). Замечание. Для k = n утверждение задачи 33 уже не имеет места, так как в этом случае всякий оператор Q с detQ=± 1 будет удовлетворять условию задачи. 34. В евклидовом пространстве R„ заданы конечные множества F = {*!, х2, ...,xk) и (/ = {#!, у2, •••'*/&}• Для того чтобы существовал изометрический оператор Q, переводящий одновременно каждый вектор х,- в соответствующий вектор yl(i = \, 2, ..., k)t необходимой достаточно, чтобы имели место равенства (*/. */) = (уь У/) (*» i =l» 2 *)• 35. Углы между двумя подпространствами. В евклидовом пространстве R заданы два подпространства R' и R". Пусть нормированный вектор г' пробегает единичную сферу подпространства R', а нормированный вектор г" независимо от г пробегает единичную сферу подпространства R". Угол между г' и г" на некоторой паре е' = е', е" = е" достигает минимума, который мы обозначим
282 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА через q?x. Пусть, далее, е' меняется по своей единичной сфере, оставаясь ортогональным к e'v и е" меняется по своей единичной сфере, оставаясь ортогональным к е"у Угол между в' we" при этих условиях достигнет минимума ф2 :> фх на некоторой паре е' = е[л, е" — е"0. Пусть, далее, е' меняется по своей единичной сфере, оставаясь ортогональным к е\ и е',, и &" меняется по своей единичной сфере, оставаясь ортогональным к е" и е"2\ мы получим новый минимум утла Фз^ф-2 и новую пару р'3 и е". Продолжая этот процесс далее, мы получим некоторую совокупность углов фь ф2, ..., ф^, число которых равно наименьшей из размерностей подпространств R' и R". Углы фх, q2,... .... цк называются углами между подпространствами R' и R". Показать, что: а) углы фх, ср2, ..., ф^ определены однозначно и не зависят от выбора векторов e'v e"v е',, e"0, ..., если по построению эти векторы не определены однозначно; б) углы ц\, ф2, ..., цк определяют подпространства R' и R" с точностью до положения в пространстве; иными словами, если имеются две пары подпространств R', R" и S', S" и углы между подпространствами R' и R" такие же, как между подпространствами S' и S", то существует изометрический оператор, переводящий одновременно S' в R' и S" в R"; в) для любых наперед заданных углов 0^ ц^ ^ ф2 ^ ... ^ ф& ^ я/2 можно построить пару подпространств R' и R", углы между которыми совпадают соответственно с числами фь ф_>, ..., ф/г- 36. Пусть у1у у.у, ...,ут — ортогональные проекции соответственно векторов xlt х2, ..., хт на некоторое подпространство. Доказать, что объем параллелепипеда, построенного на векторах^, t/2, ..., у,ПУ не превосходит объема параллелепипеда, построенного на векторах •*1» Х2, •••» ^ т • 37. (Продолжение.) Предположим, что в задаче 36 как векторы хъ х2, ..., х„п так и векторы ух, t/2, ..., ут линейно независимы. Показать, что справедлива формула У\Уъ У-г, ••-, У,п\ = У[хъ хъ ••-, oleosa! cos ota ... cosaOT, где ax, a2, ..., am — углы между подпространствами L {*i, x2 xm\ = Ll и L {t/i, y2 ym} = U (задача 35). 38. Будем называть k-вектором совокупность k векторов евклидова пространства R. Два /г-вектора [хх, л-2, ..., xk) и [уъ у2, .. •, Ук\ называются равными, если: 1) объем V {хг, х2, ..., xk) равен объему У {у^ У?, • • •> Ук\> 2) линейная оболочка L (х1, х2> . . ., xk) совпадает с линейной оболочкой L {уъ у2, ..., у^)\ 3) системы хъ х2, ..., xk и У\, Уъ • • •» Ук имеют одинаковую ориентацию (т. е. оператор в пространстве L (а*!, х2, ...,Хь)у переводящий систему {хь х2, ..., xk} в систему {уъ //2, ..., ук) имеет положительный определитель). Показать, что /г-вектор {а^, х2у ..., xk) в я-мерном пространстве R„ определяется однозначно, если известны величины всех миио-
ЗАДАЧИ 283 ров &-го порядка матрицы \[%Ф || (/ = 1, 2, ..., п\ /=1, 2 /г), составленной из координат векторов х1, х.2, ...,хк в произвольном ортогональном и нормированном базисе е^ е2, ..., еп пространства R„. 39. Если /г-вектор |хь х2, ..., хк) равен /г-вектору {уъ у.,, ..., t/^} (см. задачу 38), то миноры &-го порядка матрицы из координат векторов А'ь х2, ..., дг/г равны соответствующим минорам матрицы из координат векторов уъ у.2, ..., t/^. 40. Назовем углами между двумя /г-векторами {хъ х2, ..., хк) и {Уъ У», - • ч Ук) набор углов между данными подпространствами Lx = = L {хь х2 хк) и L2 = L {t/b y.2 ук) (задача 35), выбираемых, однако, с тем дополнительным условием, чтобы векторы еъ е2, ..., ек, взятые в подпространстве Lx для построения этих углов, имели бы ту же ориентацию, что и векторы х1у х2, ..., хк (это условие играет роль лишь при построении последнего вектора ek)\ аналогично и в подпространстве L2. Показать, что углы рь р2, ..., $к между /г-векторами и углы ах, а2, ...,ак между соответствующими подпространствами связаны следующими соотношениями: а/ = Р/ (/<*)• ак = $к или аЛ = я — рЛ. 41. Назовем скалярным произведением двух /г-векторов Х = = {*i, л:2, ..., хк) и K~{t/i, #•_>, ..., #/J, заданных матрицами XwY из координат векторов *,-, у( в некотором ортогональном и нормированном базисе пространства R„, сумму всех произведений миноров /г-го порядка матрицы X на соответствующие миноры матрицы Y. Показать, что это скалярное произведение равно V[xlt х2у ..., xk]V[yx, у2 t/^1 cos Pi-cosPa ••• cos P&» где Pi, p2 P/j —углы между /г-векторами X и У. 42. "Показать, что скалярное произведение двух /г-векторов X = (xlt ..., хк) и V = ([/i {/&) может быть записано в форме (*i. У\) (хъ У*) • • • (*i. Ук) (*2. #l) (-^2. */*) • • • (*2. #/<) {*'У} = (**> У\) (**. у«) ••• (**. Ук) 43. Если многочлен [Р {t)]k является аннулирующим для симметричного оператора А, то многочлен Р (t) также является аннулирующим для этого оператора.
ГЛАВА 9 КОМПЛЕКСНЫЕ ПРОСТРАНСТВА СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ §9.1. Эрмитовы формы 9.11. Числовая функция А (х, у) от двух аргументов х, у в комплексном пространстве С называется эрмитово-билиней- ной, или, короче, эрмитовой формой, если она является линейной формой 1-го рода от х при каждом фиксированном значении у и линейной формой 2-го рода от у (4.14) при каждом фиксированном значении х. Иными словами, к(х,у) есть эрмитова форма от х и у, если для любых х, у, z из С и любых комплексных а удовлетворяются следующие условия: A(x + z, у) = А(х, y)+A{z,y), к (ах, у) = аА(х,у), А (х, у + z) = А (х, у) + А (х, z), А(х, ау) =а А (х, у). Из этого определения легко получается и общая формула (k m \ к m _ 2 «,*/. 2 P/J7 =22 «,-Р/ А (*,-, у,), (2) *=i j=l J i-\ j=\ где #х, ..., xk, yv ..., ^yw—векторы пространства С, a1? ..., ал, pi? ..., p^ — любые комплексные числа. 9.12. Примеры. а. Если Д (*) — линейная форма 1-го рода, а /2 (#)—• линейная форма 2-го рода (4.14), то А (л:,ву)=/1 (л:) /2 00—• эрмитова форма. 0)
9.14] §9.1. ЭРМИТОВЫ ФОРМЫ 285 б. В л-мерном пространстве Сп с базисом ег, ..., еп п п функция от векторов х = У^%кек и у = У^Цкек п А (*, у) = S я,уБ|Л/ (3) /, >= 1 является эрмитовой формой при любых комплексных В действительности выражение (3) д:ает общий вид эрмитовой формы в /z-мерном комплексном пространстве. Это доказывается так же, как в 7.13 доказывалось аналогичное предложение для билинейных форм в пространстве Кл. 9.13. Эрмитова форма А(х,у) называется симметричной эрмитовой формой, если для любых векторов х и у А(у,х) = А(х, у). (4) Если эрмитова форма А (д;, у) в комплексном пространстве Сп записана через координаты формулой (3) и симметрична, то aik = A (eh ек) = А {ек, е() = akh (5) т. е. матрица || aik || формы А в базисе ег, ...,еп после транспонирования и замены элементов на комплексно сопряженные переходит в себя. Обратно, если в некотором базисе ег, . . ., еп коэффициенты эрмитовой формы А (х,у) удовлетворяют условиям (5), то форма А (х, у) симметрична. В самом деле, п А [у, х) = 2 aikr\i lk = /, k=l п = 2 akilk4i= i, k- l п Z akilkv„-=A(x,y). i. k=l Матрицу Ця/fcH, для которой aik=aki (i,k=\, ..., л), будем называть в дальнейшем эрмитово-симметричной. 9.14а. Пусть эрмитова форма А (д;, у) в базисе еъ . . ., еп пространства Сп имеет матрицу Л{е) = || aik ||, а в базисе /i> •••»//! — матрицу Лф = ||^^|], причем векторы /у- и ej
286 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.15 связаны соотношениями /,-=2/>/"Ч- (i = \,..-,n). j=l Рассуждая так же, как в 7./5а, приходим к следующему результату: между матрицами А(р и А{е) имеет место соотношение Аф = Р*АмР, (6) где Р= ||р)[) || — матрица перехода от базиса ev . . ., еп к базису fv . . . ,/„, а Р*—матрица, получающаяся из матрицы Р транспонированием и переходом к комплексно сопряженным величинам. Обозначая Р* =^ \\p)h ||, имеем pf^W* ('.7=1. • ■•>")• б. Из равенства (6), как и в 7.23, вытекает, что ранг матрицы А{е) эрмитовой формы А (х, у) не зависит от выбора базиса {е\. Форма А (х, у) называется невырожденной, если ее ранг (т. е. ранг матрицы А{е) в любом базисе {е}) равен числу п—размерности пространства Сп. Если форма А (х,у) невырождена, то для любого х0 Ф- О найдется вектор у0 £ Cn такой, что А (х0, у0) =£0 (ср. 7.15в). 9.15а. Эр матово-квадратичной формой в комплексном пространстве С называется функция от одного аргумента х £ С, которая получается из эрмитово-билинейной формы А (х, у) заменой у на х. В л-мерном комплексном пространстве С„ с базисом ег, ...,еп эрмитово-квадратичная форма через координаты £i» •■■»£/* вектора лс, в силу 9.126, записывается в виде п А (х, х) = 2 <*iklilk (7) i, k=i с некоторыми комплексными коэффициентами aik. И обратно, функция А (х, х) вида (7) есть эрмитово-квадратичная форма, которая получается заменой у на х в эрмитово-билинейной форме п i, k = \
9.16] §9.1. эрмитовы формы 287 б. Если эрмитово-билинейная форма А (х, у) симметрична, так что aik = akh то соответствующая эрмитово-квадратнч- ная форма также называется симметричной. Симметричная эрмитово-квадратичная форма А (х, х) принимает лишь вещественные значения, поскольку из (4) следует, что А (х, х) = А (х, х). В отличие от случая 7.22, эрмитово-билинейная форма уже определяется однозначно по соответствующей ей эрми- тово-квадратичной форме. Действительно, мы имеем А (* +у, х+у) = А {х, х) + А (х, у) + А(х,у)-\- А (у, у), A(x-riy, х-\- iy) = А (х, х) — /А (х, у)— /А (х, у) -,- А (у, у). Из первого уравнения мы можем найти А (л;, у) -{- А (х,у) = = 2ReA(x,y) через значения квадратичных форм A (.v, л*), А (у, у) и A(xJry, x-\-y). Из второго уравнения аналогично можно найти —/А (х,у)-{- /А (х, у)~ 2 Im А (л*, у). Это доказывает наше утверждение. Если в некотором базисе elf ..., еп квадратичная форма А (л:, х) записана в виде п A (.v, х) = 2 <*лЛ/Ъ* то эрмитово-билинейная форма п очевидно, приводится к форме А (л:, х) при подстановке у — X. По доказанному, выписанная форма А (л:, у) является единственной эрмитово-билинейной симметричной формой, приводящей к данной форме А (л;, х) при подстановке^ — ** 9.16а. В n-мерном пространстве Сп существует базис, в котором эрмитово-квадратичная симметричная форма запи-
288 гл. 9. комплексные пространства 19-16 сывается в каноническом виде п п А (х, х) = 2 VM* = 2 Кh* I2 (8) /г=1 £=1 с вещественными коэффициентами Х1} ..., Хя. Доказательство проводится аналогично доказательству теоремы 7.31. Вместо равенства 7.31 (12) используется равенство {ЬттфО) /Л/Л ®тт где Ajfjc, я) — эрмитово-квадратичная симметричная форма от аргументов £1? ..., £л-1. Вместо преобразования 7.31 (14) используется преобразование ? —?' 4-?' Ъ1 — Ь1 ^Ъ2> Ъ2 ~ Ъ1 "Г 1ЬЪ> Ьз == ьз> Сумму tfi^ifs + a^i^^^0) оно приводит к виду («12 + «12) lill — 1 («12 — «12) ^12 + • • • t причем хотя бы один из двух коэффициентов я12 + «12 и 1 («12 — «12) заведомо отличен от 0. б. Теорема инерции 7.91 сохраняется (для эрмитово- квадратичных симметричных форм) и в комплексной области: число р положительных и число q отрицательных коэффициентов в наборе Xv . . ., Хп (8) не зависит от выбора канонического базиса формы к(х, х). Эти числа рад называются индексами инерции формы к(х, х); первый — положительным индексом инерции, второй — отрицательным. Доказательство полностью повторяет доказательство теоремы 7.91. Заметим, что для квадратичных (не эрмитово-квадра- тичных) форм в комплексном пространстве Сп закон инерции
9.17] §9.1. эрмитовы формы 289 не имеет места. Например, квадратичная форма А(*, х) = Ц + Ц преобразованием координат приводится к виду А (х, х) = х)1 — г)1. в. Для данной эрмитово-квадратичной симметричной формы А (х, х) в пространстве Сп можно всегда найти канонический базис так, что соответствующие канонические коэффициенты будут равны -\-\ или —1. Для этого, приведя форму А (л:, Л') к виду А(*. x) = X1hila+...+^|^l3-HiK + il2-... где Xl, . . ., Хр, (Д-!, . . ., \xq положительны, совершаем дальнейшее преобразование координат по формулам после чего форма А (х, х) принимает вид А(*. x) = |T1|^+... + |x/;P-|Vip-...-|T/)+i?p. 9.17а. Вектор хг называется сопряженным к вектору ух относительно эр мит о во-би линейной формы А (х, у), если A(*i> Уг) = °- Если векторы хъ ..., xk сопряжены с вектором д^, то также сопряжен с вектором^ любой вектор подпространства L (xv ..., xk) — линейной оболочки векторов хъ ..., xk. Вообще, если вектор у сопряжен с каждым вектором некоторого подпространства С'сС, мы будем называть этот вектор сопряженным к подпространству С. Совокупность С" всех векторов х £С, сопряженных к подпространству С, очевидно, и сама является подпространством в С; это подпространство С" мы будем называть сопряженным к С. Базис е1ч...,еп пространства Си называется каноническим базисом формы А (л:, у), если A (eh ej) = 0 при t=^=j. Всякая симметричная эрмитово-билинейная форма А (х, у) Ю г. Е. Шилов
290 гл. 9. комплексные пространства [9.18 имеет канонический базис: это базис, в котором соответствующая квадратичная форма А(х, х) записывается в каноническом виде (8). Действительно, по 9.156 в этом базисе п п форма А (дг, у) при х= V %^, у — V xkek принимает вид п __ так что А(^*у)=И'пр,,у=': ^ 0 при ]Ф I. б. Если угловые миноры 6ъ...,6п_1 матрицы \\ujk\\ эрмптово-квадратичной симметричной формы А (х, х) отличны от нуля, то канонический базис формы А (х, х) может быть построен по методу Якоби, как в 7.52. При этом сохраняются и формулы (24) для канонических коэффициентов формы А (х, х): 'kl = 6l, L д2 л _6, 6 ,..., л,,, ft в. Эрмитово-билинейная симметричная форма А (х, у) называется положительно определенной, если при любом х Ф 0 А (х, х) > 0. Так же как и в вещественном случае (7.94), эквивалентным условием является положительность всех канонических коэффициентов формы А (х, х), или, что то же, равенство р = п, где р — положительный индекс инерции формы А (х, х). Необходимым и достаточным условием положительной определенности формы А (х, у), как и в 7.96, является выполнение условий Сильвестра бх>о, а2>о, ..., б„>о. Доказательство, приведенное в 7.96, проходит в комплексном случае без изменений. 9.18а. Имея эрмитово-билинейную невырожденную симметричную форму (х, у), можно, аналогично тому как это было сделано в 7.61, ввести понятия сопряженных опера-
9-19] § 9.1. эрмитовы формы 291 торов (относительно формы (х, у)). Прежде всего, если А и В —линейные операторы в пространстве С„, то функции А (х, у) = (Ах, у), В (х, у) = (х, By) являются эрмитово- билинейными формами, матрицы которых связаны с матрицами операторов А и В (в любом каноническом базисе формы (х, у) с каноническими коэффициентами еу) формулами п . _ о п(!) А. _ с Ш) Обратно, по заданным эрмитово-билинейным формам А (л:, у) и В (л:, у), как в 7.62, можно указать, причем единственным образом, операторы А и В так, что А (х,у) = (Ал:, у), В (л:, у) = (х, By). б. Отсюда, как в 7.63, следует существование для любого оператора А такого оператора А*, что при любых х и у из Сп (Ах, у) = (х, А*у). Оператор А* определен единственным образом; в каноническом базисе формы (х, у) с каноническими коэффициентами еу матрицы \\alJSW и ||r/,(,{)>::j| операторов А и А* связаны соотношениями а*т = -Ш-^Ф'. Оператор А* называется эрмитово-сопряженным к оператору А относительно формы (х, у). в. Имеют место следующие формулы (ср. 7.64): а) (А*)*=А для любого оператора А; б) (А -|-В)* = А* + В* для любых А и В; в) (А,А)* —ХА* для любого оператора А и любого %£С; г) (АВ)* = В*А*. 9.19а. Назовем два комплексных пространства С и С" с выделенными в них эрмитово-билинейнымн симметричными формами А (х', у') и А (х", у") А-изоморфными, если пространства С и С" изоморфны как комплексные пространства (2.71) и если для соответствующих друг другу пар элементов х', у' из С и х", у" из С" справедливо равеист.во А(*', у') = А(х", у"). 10*
292 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.21 б. Теорема. Два конечномерных комплексных пространства С и С" с выделенными в них эрмитово-билинейными симметричными формами А (х', у') и А(х", у") являются А-изоморфными тогда и только тогда, когда размерности С и С" одинаковы и индексы инерции р' и q'формы к(х\ у') совпадают с индексами инерции р" и q" формы А (х", у"). Доказательство проводится точно так же, как доказательство аналогичного предложения для вещественных пространств (7.93). в. В частности, два пространства С^ и С"п одинаковой размерности п с выделенными в них положительно определенными формами А(х', у') и к(х",у") всегда А-изоморфны. § 9.2. Скалярное произведение в комплексном пространстве 9.21. В вещественном пространстве в качестве скалярного произведения двух векторов мы брали фиксированную симметричную положительно определенную билинейную форму. Соответствующая квадратичная форма положительна на каждом ненулевом векторе и позволяет тем самым определить его длину. В комплексном пространстве аналогичным свойством обладает положительно определенная эрмитово-били- нейная форма (9.17в). В связи с этим мы принимаем следующее определение: Комплексное линейное пространство С называется унитарным пространством, если в нем фиксирована некоторая положительно определенная эрмитово-билинейная форма, называемая (комплексным) скалярным произведением; иными словами, если каждой паре векторов л:, у из С поставлено в соответствие комплексное число (х, у), удовлетворяющее условиям: а) (У, х) = (х, у) для любых х, у из С; б) (х, y-\-z) = (x, у)-\-(х, z) для любых х, у, z из С; в) (Хх, у)^Х (х, у) для любых х, у из С и любого комплексного числа К; г) (х, х) > 0 для любого хфО; (0, 0) = 0. Из аксиом а) — в) следует общая формула (2 aJxp 2 Р*^ = 2 2аА <-w*) \/ = 1 *=1 / /=10=1
9-23) § 9.2. скалярное произведение 293 для любых xv .... хр, у^ • • •, уя "з С и любых комплексных av . . ., ар, р15 . . ., р^. 9.22. Пример ы. а. В л-мерном пространстве Сп (2.156) введем скалярное произведение векторов *=(si, . .-, £„)» J^Oli» •••, Ли) по формуле {*, y) = li4i+ ••• +1пЦп- Выполнение свойств а) — г) легко проверяется. б. В пространстве С (а, Ь) комплексных непрерывных функций на отрезке [а, Ь] (2.15г) скалярное произведение функций х = х (t) и y=y(t) введем по формуле ъ (x,y)=\x(t)JTJ)dt. а Выполнение аксиом а) — г) следует из основных свойств интеграла. 9.23. Основные метрические понятия В унитарном пространстве С можно ввести некоторые метрические понятия аналогично тому, как это делалось в вещественном евклидовом пространстве (§ 8.3). а. Длина вектора. Как и в вещественном случае, длиной (или нормой) вектора х называют величину 1*1= + V (*> *)• У всякого ненулевого вектора длина положительна, длина нулевого вектора равна 0. При любом комплексном а имеет место равенство ах = у (ах, ах) = у аа (х, х) = | а \у (х, х) = | а показывающее, что модуль числового множителя можно выносить за знак длины вектора. Вектор х длины 1 называется нормированным. Каждый вектор х можно нормировать — разделив его на его длину, получить вектор того же направления (т. е. лежащий в том же одномерном подпространстве)
294 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9-23 и единичной длины. Совокупность всех х £ С с | х j^ 1 называется единичным шаром пространства С. б. Неравенство Кошп — Буня к овского- Для любых двух векторов х, у из С имеет место неравенство К*, jO!<!*!>!• (9) Доказательство проводится по той же схеме, что и в вещественном случае (8.33), но с некоторой осторожностью обращения с комплексными числами. Если (х,у)=0, неравенство (9) очевидно. При (х, у) Ф 0 замечаем, что (Хх—у, Хх—у)^0 при любом комплексном X. Раскрывая скобки, находим \Х\>(х, х) — Х(х,у)—Ъ(х,у) + (у,у)^0. (10) Будем считать, что X изменяется по прямой у, симметричной относительно вещественной оси с прямой, определяемой комплексным числом (х,у), так что X = tz0, где t вещественно, a z0— единичный вектор, определяющий направление прямой у, ^о = \(Х\1)\' Тогда М*» .У) = * | (*» У) I есть вещественное число, так что X (х, у) — X (х, у). Неравенство (10) преобразуется к виду Р(х, х)- 2t \(х,у) \ + (у, у)^0. (11) Теперь та же аргументация, что и в 8.33, приводит нас к искомому неравенству (9). Если в неравенстве (9) стоит знак равенства, то трехчлен в левой части (11) имеет один вещественный корень t0. Заменяя fz0 на X, мы получаем, что трехчлен в левой части (10) имеет корень Х0 = t0z0, откуда (Х0х—у, Х0х—у) = 0 и у — Х^х, так что векторы х и у отличаются лишь (комплексным) множителем. в. Ортогональность. В унитарном пространстве не вводят понятия угла между векторами. Рассматривают лишь случай, когда векторы х и у ортогональны; под этим, как
9.24] § 9.2. скалярное произведение 295 и в вещественном случае, понимают выполнение равенства (*,.у) = 0. При этом, очевидно, и (у, х) = (х, у) = 0. Для ортогональных векторов, как легко проверить, остаются справедливыми аналоги лемм 8.36а — б и теорема Пифагора 8.37. Далее, справедлива теорема о разложении 8.51: для конечномерного подпространства С'сС и любого вектора / £ С существует (и единственно) разложение /=«Ч-А, где g(zC, h ортогонален к С. Совокупность всех векторов h, ортогональных к подпространству С, снова образует подпространство, которое называется ортогональным дополнением к подпространству С. Обозначая его через С", выводим, как в 8.51, существование разложения С — C'-j-C" в прямую сумму ортогональных слагаемых. г. Неравенства треугольника. Если х и у — два вектора в унитарном пространстве С, то по неравенству Коши — Буняковского (б) х+у\2= (х +у, х +у) = (*, х) + (х, у) -)- (х, у) + (у, у) \ < (*, *) + 2 | (*, у) | + (у, у)^(\х\ + \у |)2, \ >(х,х)-2\(х,у)\ + (у,у)^(\х\-\у\)\ откуда 1 'У]\ >\\х\-\у\\. 02) Неравенства (12), как и в вещественном случае, называются неравенствами треугольника. 9.24. Ортогональный базис в л-м е р н о м унитарном пространстве Сп. В /2-мерном пространстве (симметричная) эрмитово-билинейная форма (х,у) обладает каноническим базисом еъ . . ., еп (9.16а). Условие каноничности (eh еу) = 0 (/ Ф)) в данном случае есть условие ортогональности. Ортогональные базисные векторы е1, . . ., еп можно далее считать нормированными, так что
296 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.25 п п ki I = • • • = \е п\ = 1 • Если при этом * = 2] £***, .У = 2- Л*'* — 1 1 любые два вектора из Сп, мы получаем формулу для скалярного произведения \ 1 l/i 9.25а. В соответствии с 9.18а устанавливается взаимно однозначное соответствие между эрмитово-билинейными формами А(х,у) и линейными операторами А, действующими в пространстве С„, по формуле А(х,у) = (Ах,у). В любом ортонормированном базисе ег, ..., еп пространства Сп матрица || ajk || формы А (х, у) (aJk = А (е;., ek)) и матрица || а^к) || оператора A (Aek-=^iaifk)eJ) связаны соотно- j шениями alk-a} . б. В соответствии с 9.186 вводится понятие сопряженности операторов А и А* относительно скалярного произведения (х,у). Именно, для любого линейного оператора А, действующего в пространстве С„, существует и единствен эр матово-сопряженный оператор — оператор А*, удовлетворяющий уравнению (Ах,у) = (х, А*у) для любых х и у из С„. Поскольку ортогональный и нормированный базис есть канонический базис формы {х,у) с каноническими коэффициентами еу-=1, в любом ортогональном и нормированном базисе пространства С„ матрицы || а$ \\ и || а$* || операторов А и А* связаны соотношениями а*ию = 7ф и j um . в. Как и в 8.95а, ортогональное дополнение С" к подпространству С с: С, инвариантному относительно оператора А, инвариантно относительно сопряженного оператора А*.
9-26] § 9.2. скалярное произведение 297 9.26. Линейное преобразование в л-мерном комплексном пространстве, соответствующее переходу от одного орто- нормированного базиса к другому такому же, называется унитарным преобразованием. Унитарные преобразования аналогичны ортогональным преобразованиям вещественного пространства (8.93). Если еъ . . ., еп и /1? ..., /„ — орто- нормированные базисы и U— \\и(£}\\ есть матрица соответствующего унитарного преобразования, так что /г-= 2 44- то, очевидно, k-i Обратно, если числа u(kl) удовлетворяют соотношениям (14), то матрица \\и(^\\ есть матрица унитарного преобразования, или, короче, унитарная матрица. Линейный оператор U, соответствующий унитарной матрице, называется унитарным оператором. Так же как изометрический оператор в вещественном пространстве, унитарный оператор в комплексном пространстве не изменяет п п метрики: если х = V ^(е(, у= ^S TVe/» т0 i-l Э-1 (\Jx, Uy)= 2 InjV'i, Uf/) = = 2 linj{/i,/j)=^l^i = (x,y). i,j=l i-l Матрица V обратного перехода от базиса {/•} к базису \е{\ обратна матрице U и также унитарна; далее, если V=||z/j^||, мы имеем таким образом, матрица, обратная к унитарной, получается путем транспонирования и перехода к комплексно сопряженным элементам. Итак, для унитарного оператора U или при 1ф]л при i^j. (14)
298 гл. 9. комплексные пространства [9-31 § 9.3. Нормальные операторы 9.31. Определение. Оператор А, действующий в /2-мерном унитарном пространстве Сп, называется нормальным, если он коммутирует со своим сопряженным: А*А = АА*. (15) Примером служит оператор А, обладающий ортогональным базисом из собственных векторов е1, . .., еп1 так что kej^Xjej (у = 1, . . ., п). Действительно, матрица этого оператора А в базисе v к (16) Согласно 9.256 матрица оператора А* в том же базисе ev ..., еп имеет вид "к (17) отсюда очевидно, что операторы А и А* коммутируют. 9.32. Теорема. Каждый собственный вектор х0 нормального оператора А с собственным значением Х0 является собственным вектором оператора А* с собственным значением ^0. Доказательство. Пусть РсС„— подпространство, состоящее из всех собственных векторов оператора А с собственным значением К0. Покажем, что Р инвариантно относительно оператора А*. Для х £ Р мы имеем АА*д; = A*A* = А* (Кх) - ХА*х, откуда следует, что А*л;£Р, что и требовалось. Далее, для любых х и у из Р мы имеем (А**, у) - (*, Ау) = (х, Ху) = (Кх, у),
9.33] § 9.3. нормальные операторы 299 откуда для любого х £ Р А*х = Хх. Теорема доказана. 9.33а. Теорема. Для всякого нормального оператора А существует ортогональный и нормированный базис ег1 . . ., еп из собственных векторов оператора А. Доказательство. Нормальный оператор А, как и всякий линейный оператор в пространстве С„, имеет собственный вектор (4.956). Пусть е— собственный вектор оператора А с собственным значением X. Пусть РсС„— подпространство, состоящее из всех собственных векторов оператора А с этим собственным значением X. Если Р есть все пространство С„, то, произвольно дополняя в Сп вектор ех векторами е2, . . •, еп до ортогонального и нормированного базиса, получаем, что теорема доказана. Если Р^С„, то пусть Q — ортогональное дополнение подпространства Р в Си. Так как в силу 9.32 каждый вектор пространства Р оператором А* переводится снова в вектор пространства Р (даже в себя самого с коэффициентом X), то подпространство Р инвариантно относительно оператора А*. В силу равенства А**=А (9.18в)) и теоремы 9.25в, подпространство Q инвариантно относительно оператора А. Теперь воспользуемся принципом индукции, считая, что теорема справедлива для пространств меньшей размерности; тогда в подпространстве Q можно выбрать ортогональный базис, удовлетворяющий требуемому условию; присоединяя любой ортогональный базис подпространства Р, мы получим полный ортогональный базис в пространстве Си, удовлетворяющий условию теоремы. б. В силу а, всякий нормальный оператор А оказывается диагонализируемым (4.72е); в базисе из его собственных векторов, построенном в а, этот оператор имеет диагональную матрицу А =
300 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.34 На главной диагонали матрицы стоят собственные значения оператора А; каждое из них повторяется столько раз, какова размерность соответствующего собственного подпространства. Поэтому характеристический многочлен det ||А — КЕ\\ оператора А (который, как мы знаем, не зависит от выбора базиса) имеет вид т т det||A-XE|| = n (h~W>, 2*,= л, (18) 3=1 j=l где Х}, ..., Xm — различные собственные значения оператора A, a kv ..., km — размерности соответствующих собственных подпространств. в. С другой стороны, пусть известно, что у некоторого нормального оператора А характеристический многочлен имеет вид det||A-XE||=n^/~^Pl. (19) где |i1, ..., \xs — различные числа, рх, . .., ps — некоторые кратности. Тогда можно утверждать, что оператор А имеет ортонормальный базис из собственных векторов с собственными значениями jnх, ..., \\s, причем размерность собственного подпространства, отвечающего значению |i., равна числу р.. В самом деле, в силу единственности характеристического многочлена имеет место равенство многочленов (18) и (19), откуда, применяя теорему о единственности разложения многочлена на множители, получаем нужное. 9.34. Самосопряженные операторы. Если А* = А, то оператор А называется самосопряженным. Иными словами, оператор А самосопряжен, если соответствующая оператору А билинейная форма (л:, Ау) эрмитово-симме- трична: (Ах,у) = (х,Ау). (20) Оператор А, удовлетворяющий уравнению (20) для любых двух векторов х и у, называют поэтому также эрмитово- симметричным или эрмитовым оператором.
9-35) § 9.3. нормальные операторы 301 В силу теоремы 9.256 матрица самосопряженного оператора в любом ортогональном и нормированном базисе совпадает со своей эрмитово-траиспонированной матрицей, иными словами, есть эрмитово-симметричная матрица. И обратно, каждый оператор А, имеющий в некотором ортогональном и нормированном базисе эрмитово-симметричную матрицу, является самосопряженным оператором. Так как самосопряженный оператор, очевидно, нормален, то можно применить 9.32; мы получаем в данном случае, что ^0 — ^о' откуДа следует, что каждое собственное значение сопряженного оператора вещественно. Далее, применяя 9.33а, получаем следующую основную теорему: Теорема. Для всякого самосопряженного оператора А в унитарном пространстве Сп существует ортонормальный базис из собственных векторов оператора А с вещественными собственными значениями. Обратно, всякий линейный оператор А в пространстве Сп, обладающий указанным свойством, является самосопряженным: действительно, по 9.31 он нормален, и, сравнивая (16) с (17), в силу вещественности чисел Я- заключаем, что А*=А. 9.35. Ант и самосопряженные операторы. Если А*— — А, то оператор А называется антисамосопряженным. Матрица антисамосопряженного оператора в любом ортонормальном базисе ех, ..., еп обладает характеристическим признаком: ajk = (Aef, ek) = (*/, A*ek) = (ej, ~Aek) = — (A**, ej) = — a*,- (y, k= 1, . . ., n). Антисамосопряженный оператор А, очевидно, нормален. Применяя 9.32, мы получаем, что в данном случае ^0 = —Х0, откуда следует, что каждое собственное значение антисамосопряженного оператора чисто мнимо. Далее, применяя 9.33а, получаем следующую основную теорему: Теорема. Для всякого антисамосопряженного оператора А в унитарном пространстве С„ существует ортонормальный базис из собственных векторов оператора А с чисто мнимыми собственными значениями.
302 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.36 Обратно, всякий линейный оператор А в пространстве С„, обладающий указанным свойством, является антисамосопряженным. 9.36. Унитарные операторы. Оператор U, действующий в пространстве С„, называется унитарным, если U*U:==UU*==E (9.26). В частности, унитарный оператор нормален. Применяя 9.32, находим, что в данном случае А,0-^0=1, или, что то же, | \01 — 1; таким образом, каждое собственное значение унитарного оператора по модулю равно 1. Далее, применяя 9.33а, получаем следующую теорему: Теорема. Для всякого унитарного оператора U в пространстве Сп существует ортонормальный базис из собственных векторов оператора U с собственными значениями, по модулю равными 1. Обратно, всякий линейный оператор U в пространстве Сл, обладающий указанным свойством, унитарен. § 9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве 9.41. Включение вещественного евклидова пространства в унитарное пространство. Пусть R — вещественное евклидово пространство (8.21) со скалярным произведением (х,у). Рассмотрим комплексное пространство С, составленное из формальных сумм x-^iy, где х £ R, .y^R, с естественными операциями сложения и умножения на произвольные комплексные числа: (*i + fyi) + (*2 + (Уг) = (*i + *2) + * (У1 +У2)'> (а-;- ф) (х + iy) = (ах — $у) + / (ау + рлг). Легко проверить, что здесь выполняются все аксиомы линейного комплексного пространства. Векторы я'-р/О мы будем отождествлять с векторами х £ R и называть вещественными векторами пространства С. Векторы 0-г (у мы будем обозначать iy и называть чисто мнимыми векторами. Вектор х — iy будем записывать также в виде х-г iy и называть комплексно сопряженным к вектору х ~~iy.
9-42) § 9.4. операторы в евклидовом пространстве 303 Введем в пространство С скалярное произведение по формуле (x1 + iyv x2+iy2) = = [(*1, *2) + (У1> У2)] "Г 4(^1» Х2) — (*1> У*)]- Легко проверить, что это скалярное произведение удовлетворяет условиям 9.21а—г. В частности, (x + iy, x-]-iy) = (x, x) + (y,y). Пространство С содержит пространство R в качестве подмножества, допускающего операции сложения и умножения на вещественные числа и с тем же скалярным произведением. • Всякая ортогональная нормированная система е1у ..., еп в пространстве R будет ортогональной нормированной системой и в пространстве С. Если ех, ..., еп есть ортонор- мальный базис в пространстве R, то эти же векторы образуют и ортонормальный базис в пространстве С. 9.42. Всякий линейный оператор А, заданный в пространстве R продолжается на пространство С по формуле А (х + iy) = Ax -j- iky, (21) причем оператор А оказывается, очевидно, линейным оператором на пространстве С. Матрица оператора А в пространстве С в базисе *i» • ••» еп 6 R совпадает с матрицей оператора А в пространстве R в том же базисе, поскольку по (21) kej-^kej (/= 1, . . ., п). При продолжении сохраняются алгебраические соотношения между линейными операторами: если A-f В —S в пространстве R, то A-f-B--S в пространстве С; если AB = D в пространстве R, то AB=^D в пространстве С. Это следует, например, из сохранения матриц при продолжении.
304 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.43 9.43. Пусть А' — сопряженный оператор к оператору А в вещественном пространстве R {8.91). Покажем, что продолжением А' оператора А' на пространство С служит оператор А*, сопряженный к продолжению А оператора А. Действительно, для любых z = x-{-iy, w = u-r-iv£C мы имеем (A' (x + iy), u + iv) = = (к'х,и) + 1(к'ууи)-1(к'х, v) + {k'y, v) = = (*, ku)-\-i {у, ku) — i {x,kv)~{y, kv) = ^(x + iy, A(u+iv)), что и требуется. Б частности, продолжением симметричного оператора (А'= А) является самосопряженный оператор (А*—А), продолжением антисимметричного оператора (А'= —А) является антисамосопряженный оператор (А*=^—А) и продолжением изометрического оператора (U'= U"1) является унитарный оператор (U* = U_1). Наконец, продолжением нормального оператора (А'А — АА') является нормальный оператор (А*А — АА*). 9.44. Структура вещественного нормального оператора. Пусть о и т — вещественные числа. Легко проверяемое матричное равенство 1 а х\ i 1—т а i а-т| т а] = \а —т| К 4 1! а тЯ ! 1 ' — ||—т а\\ 1 показывает, что матрица I! о Tjj li—т а1 перестановочна со своей сопряженной. Более общим образом, перестановочна со своей сопряженной и квазидиагональиая
9-44] § 9.4. операторы в евклидовом пространстве 305 (вещественная) матрица II CTi Ti | * ^т + 1 I ' Mi порядка /z = 2/я -j- r — /и = /и 4- г. Теорема. Пусть А— нормальный оператор в вещественном евклидовом пространстве Rw. Тогда в этом пространстве существует ортогональный базис е1? ...,?,,, в котором матрица оператора А принимает вид (23). При этом числа \.=zOj-\-ixj(j=^\, . . ., m) и hm + 1, ..., Xr определяются однозначно оператором А. Именно, они являются комплексными (Х1У . . ., А,т) *г./ш вещественными (кт + 1у . . ., А,г) корнями характеристического уравнения det || А — А.ЕЦ = 0 и повторяются в матрице (23) столько раз, какова кратность соответствующего корня. Доказательство. Построим унитарное пространство Си со скалярным произведением, продолжающим скалярное произведение (х, у) на пространство R„. Продолжим операторы А и А' на пространство Сп по правилу 9.42; как мы видели в 9.43, они продолжаются до нормального оператора А и его сопряженного А*. Выберем в пространстве R„, пока произвольно, ортонор- мальный базис /х, ...,/„; мы видели, что векторы /ь ...,/„ образуют ортонормальный базис и в пространстве Сп. Матрицу оператора А в базисе /\, . . .,/„ обозначим ||ду7г||; числа a k вещественны. Эта же матрица представляет оператор А в базисе /\, ...,/„ во всем пространстве Сп.
306 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА I9-44 Так как характеристическое уравнение detj|A — А.ЕЦ — 0 имеет вещественные коэффициенты, то вместе с каждым невещественным корнем Ху. является корнем также сопряженная величина Х-. С учетом этого последовательность различных корней запишем в следующей форме: ^1» ^1» ^2' /и2> * * ' » 'V Р} V+1' * * ' ' V где корни Х1} ...Д невещественны, а корни X +1, ...Д^ вещестзенны. В силу 9.336, пространство С;/ распадается в ортогональную сумму подпространств Аъ Лх, . . . > Ару Ар; Ар + 1, . . ., Л^, где Ау состоит из собственных векторов оператора А с собственным значением Х-, а Л-—из собственных векторов оператора А с собственным значением Л •; А х = **-р + 1у • • • > ^^ ^ Чу Пусть z = х — /у £ Ау. Уравнение Az — kjZ в координатах (относительно исходного базиса /\, ...,/Л) записывается в форме где *=(£i, . . ., £„) -- (Ъ± -г иь» • • •, £и--'ПЛ Применяя операцию комплексного сопряжения и учитывая вещественность чисел a;k, получаем п Это означает, что вектор z -^ (£v ..., £;|) также является собственным вектором оператора А с собственным значением А. Отсюда следует, что операция комплексного сопряжения переводит подпространство Лу- в Лу. Пусть к1фк1, так что Х1_а1--/т1, Tj^O. Возьмем произвольно нормированный вектор ^1бА1 и найдем gx £ Ax. Положим, далее, *1 ^ 2" (^1 + ^ *2 = 27 (ft —^i), так что Si = ei-\-^2y gi = ei — *>4-
9.44] § 9.4. операторы в евклидовом пространстве 307 Векторы ех и е2, очевидно, вещественны. Так как векторы ft и ft ортогональны, то векторы ех и е2 имеют длину 1. При этом (ev е2) = 0; действительно, (*i, *2) = — 47^1 + ^' ft —£i) = — fi[(gi>gi) — (gi,gi)] = 0, поскольку (ft, ft) = 0, (ft, ft) = (ft, ft) =1. Далее, мы имеем Аех = ке1 = у (Aft + Aft) = ~ (Xlgl +ЪХ ft) = Ae2 = Ae2 = 2j (Aft — Aft) = ^ (Kxgx — ^ft) = axe2 + x1e1. Таким образом, оператор А преобразует плоскость векторов eL, e2 в себя с матрицей (в базисе еъ е2) (24) Если Лх имеет более одного измерения, возьмем вектор g2^Ax ортогонально к ft и сопряженный вектор g2£A1; последний уже автоматически будет ортогональным к ft. Повторим для ft и ft предыдущее построение; мы получим новую пару вещественных векторов е3, еь, линейно выражающихся через ft и ft и поэтому ортогональных к векторам ev e2 (которые линейно выражались через ft и ft); плоскость, определяемая парой е3, е4, преобразуется оператором А в себя с той же матрицей (24). Продолжая построение, мы построим взаимно ортогональные вещественные векторы *i, *2> •••><?2Я-1> е2Р'* каждую пару e2k„lf e2k оператор А преобразует в их плоскости с помощью матрицы, аналогичной (24). Пусть теперь X 1 = Хр + 1 вещественно. Операция перехода к сопряженным векторам переводит подпространство Ар + 1 в себя. Пусть g£Ap+1— любой вектор и g—ему сопряженный.
308 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.44 Возможно одно из двух: либо векторы g и g линейно независимы (в CJ, либо линейно зависимы. Если g и g линейно независимы, то и векторы *= 2-^+^' f=2[(?—g) линейно независимы. Векторы ей/ вещественны, и поскольку они лежат в Л +1 вместе с g и g, они являются собственными векторами оператора А с тем же собственным значением %p + v Если g и g линейно зависимы, то, так как они равны по норме, можно написать g=ewg, 0<ф<я, или el"'g=e-l""g--=el"'g, так что вектор el"^g уже вещественный. При этом, поскольку он лежит в Л +1 вместе с g, он является собственным для оператора А с тем же собственным значением А, +1. Таким образом, в подпространстве Ар + 1 можно указать базис из вещественных векторов. Применяя к ним процесс ортогонализации {8.61), мы получим в А х уже ортогональный и, далее, ортонормальный базис. Произведя аналогичную процедуру в Л^ + 2, . . ., Л^, завершаем доказательство теоремы. Представление нормального оператора в форме (23) дает возможность выяснить его геометрический смысл. Оператор с матрицей (24) в плоскости векторов б>1, е% можно истолковать как оператор поворота с растяжением. Действительно, мы имеем а т [| т а | 1/"оа + т2 ]/~o2-f t'II I cos a sin a]! I — sin a cos a I' где M ~ \ o2 ~r t2, cos a = r a ■ , sin a = . T . yV-r-x2 /о2 + та а т-| — x a = W + *2 = м
9.46) § 9.4. операторы в евклидовом пространстве 309 Матрица II cos a sin а II ||—sin a cos а || определяет в плоскости ev e2 поворот всех векторов на угол а, а коэффициент М есть коэффициент растяжения. В целом нормальный оператор, как видно из представления (23), в т взаимно ортогональных плоскостях осуществляет повороты с растяжениями и в г — т направлениях, ортогональных друг к другу и к указанным плоскостям, только растяжения (в Кт + 1у . . ., Хг раз)*). 9.45. Структура вещественного с и м м е т р и ч- ного оператора. Если оператор А в пространстве R„ симметричен, А' ~-= А, то продолжение А оператора А в пространство С;| есть самосопряженный оператор, А*=А. Все собственные значения Х1У . . ., Хп самосопряженного оператора вещественны (9.34), поэтому в представлении (23) клетки вида (24) отсутствуют и остаются лишь диагональные элементы. Мы получаем теорему: Теорема. Для всякого симметричного оператора А в пространстве RM существует ортонормальный базис из собственных векторов. Геометрически симметричный оператор осуществляет по каждому из п ортогональных направлений е1} • ••,£„ растяжение (соответственно в Х1У . . ., Хп раз). Так как числа Х1у. . . Ди суть корни уравнения det ||Л— ХЕ\\~0у то, в частности, для симметричной матрицы Л—||ау7г|| характеристическое уравнение det \\А — ХЕ\\=0 всегда имеет п вещественных корней (не обязательно различных) и вовсе не имеет невещественных корней. 9.46. Структура вещественного антисимметричного оператора. Если оператор А в пространстве R„ антисимметричен, А'= — А, то продолжение А оператора А в пространство С„ есть антисамосопряженный *) При 0 < Я/г < 1 растяжение в kk раз на самом деле есть сжатие. При Xk < 0 растяжение в Xk раз на самом деле есть растяжение, соединенное с отражением.
310 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.47 оператор, А* = — А. Все собственные значения Х1у . . ., Хп антисамосопряженного оператора чисто мнимы (9.35). Поэтому в представлении (23) клетки вида (24) имеют специальный вид 0 т|| —т о|г а числа Я/л + 1, . . ., Хг могут быть лишь равными 0. Мы получаем теорему. Теорема. Для всякого антисимметричного оператора А в пространстве Rn существует ортонормальный базис, в котором матрица оператора А записывается в виде 0 т1 т1 0 0 т, — т2 0 0 (25) Обратно, если матрица некоторого оператора А в пространстве Rn в некотором ортогональном базисе имеет вид (25), то оператор А антисимметричен (8.926). Геометрически антисимметричный оператор осуществляет в каждой из m взаимно ортогональных плоскостей поворот на 90° с последующим растяжением (соответственно в ть •••>т/я Раз)> а все векторы, ортогональные к указанным плоскостям, переводит в 0. 9.47. Структура вещественного изометрич- ного оператора. Если оператор А в пространстве R„ изометричен, А' — А"1, то продолжение А оператора А в пространство Сп есть унитарный оператор, А*= А"1. Все соб-
9-47] § 9.4. операторы в евклидовом пространстве 311 ственные значения Х1, . . ., кп унитарного оператора по модулю равны 1 (9.36). Можно написать ^• = cosa-— — / sin otj(j--= 1, . . ., т). Поэтому в представлении (23) клетки вида (24) имеют специальный вид cos a,- sin a.-\\ 1 J ii — sin «• cos ос-[| (26) a числа Xm + V . . . Дг могут быть равными лишь ±1. Мы получаем теорему: Теорема. Для всякого изометричного оператора А в пространстве Rw существует ортонормальный базис, в котором матрица оператора А записывается в виде cos аг sin аг — sin аг cos ax -hi (27) Геометрически изометричный оператор А в каждой из m взаимно ортогональных плоскостей осуществляет поворот на некоторый угол (без растяжений) и в г — m направлениях, ортогональных к этим плоскостям и друг к другу, действует как оператор Е или — Е. Впрочем, каждые два из таких направлений с одинаковыми коэффициентами растяжения (оба -(-1 или оба —1) можно объединить в плоскость, на которой оператор А также осуществляет поворот (на 0° или на 180°). Произведя все такие возможные объединения, мы получим, при п нечетном, последнее направление с коэффициентом -\-\ или —1; при п четном, возможно, два последних направления с коэффициентами -f 1 или —1. Наличие среди оставшихся коэффициентов —1 показывает, что к имеющимся поворотам присоединено отражение относительно некоторой координатной плоскости, например ортогональной к вектору еп. В этом случае мы имеем det А = —1; в случае, когда отражения нет, имеем det A — -\-\.
312 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА ЗАДАЧИ 1. Самосопряженный оператор, действующий в унитарном пространстве С„, называется неотрицательным (положительным), если все его собственные значения Х1У ...,Хп неотрицательны (положительны). Показать, что квадрат всякого самосопряженного оператора неотрицателен. 2. Показать, что для всякого самосопряженного неотрицательного (положительного) оператора А можно найти, причем единственным образом, такой неотрицательный (положительный) оператор В, что В2 —А («квадратный корень из оператора А»). 3. Извлечь квадратный корень из оператора А, заданного в ортогональном и нормированном базисе ех, е.>, е3 матрицей 13 14 4 И А = 14 24 18 4 18 29 !! 4. Если А — произвольный линейный оператор, действующий в унитарном пространстве Сп, А*—ему сопряженный, то А*А есть неотрицательный оператор. Если А невырожден, то А*А — положительный оператор. 5. Известно, что некоторый линейный оператор А есть произведение самосопряженного оператора S и унитарного Q: A = SQ. Показать, что S2 = AA*. 6. Показать, что всякий линейный оператор А с det А Ф О может быть представлен как произведение самосопряженного и унитарного операторов. 7. Доказать единственность представления оператора А в виде произведения SQ в условиях задачи 6. 8. Линейный оператор V, действующий в Сл, называется нерас- тягивающим, если | Vx | <: | х | для любого х. Показать, что любой линейный оператор А может быть представлен как произведение самосопряженного и нерастягивающего. 9. Показать, что самосопряженные операторы А и В перестановочны тогда и только тогда, когда они имеют общую систему из п взаимно ортогональных собственных векторов. 10. Для каждого линейного оператора А, странстве указать ортонормальныи оазис, оператора А имеет треугольный вид: действующего в про- в котором матрица а[1) А = а2 CD а(п1) aF 0 0 (П)
ГЛАВА 10 КВАДРАТИЧНЫЕ ФОРМЫ В ЕВКЛИДОВОМ И УНИТАРНОМ ПРОСТРАНСТВАХ § 10.1. Основная теорема о квадратичных формах в евклидовом пространстве 10.11. Начнем со следующего предложения, касающегося симметричной билинейной формы в евклидовом пространстве: Теорема. В п-мерном евклидовом пространстве всякая симметричная билинейная форма имеет канонический базис из взаимно ортогональных векторов. Доказательство. Рассмотрим линейный оператор А, отвечающий данной симметричной билинейной форме А{х,у) (8.91). Этот оператор также симметричен. Согласно теореме о симметричном операторе (9.45) в пространстве R имеется ортогональный и нормированный базис из собственных векторов оператора А. В этом базисе матрица оператора А диа- гональна. Поскольку эта же матрица является и матрицей билинейной формы А(х,у), построенный базис есть канонический базис формы А (л;, у), что и требовалось. 10.12. Этот результат мы применим теперь для изучения квадратичных форм. Пусть дана квадратичная форма п А (х, х) = ^ a^lj (аи=аЛ). (1) Будем считать числа |х, |2, ..., £и координатами вектора х в евклидовом пространстве Rn со скалярным произведением, определенным по формуле п (х, у) = 2 g,%, 1 = 1 где y~{r\j, T)2, . .., т)„). Базис *! = {!, 0,..., 0}, е2={0, 1,..., 0}, ...,«„={0,0, ...,1}
314 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.12 является ортогональным и нормированным базисом в Rw, причем п п Рассмотрим билинейную форму п i, /=1 соответствующую квадратичной форме (1). В силу теоремы J0.11 у этой формы существует ортогональный и нормированный канонический базис Д,/,, . . -,/„. Если относительно этого базиса векторы х и у имеют соответственно координаты Tjl, т2,. . ., т„ и 6Ь 02,. . ., 9М, то форма А (л;, у) будет иметь вид п А(*,.у) = 2^А> а квадратичная форма А(дг, д:) примет вид п A(*. *)-SV?- (2) Переход от базиса ех, е2, . . ., еп к базису /х, /2, ...,/„ осуществляется с помощью некоторой ортогональной матрицы (5.95) Q = ||^.')|| по формулам п /У=2Л (У =1, 2, .... л). Связь между координатами тх, т2, . . ., хп и |х, |2, . . ., \п может быть записана в силу формул (36) из 8.94 системой равенств &/=2^\ (/= 1, 2, ..., п) (3) с использованием транспонированной матрицы Q'. Мы получили тем самым следующую важную теорему: Теорема. (Теорема о квадратичной форме в евклидовом пространстве.) Всякая квадратичная форма (1) может быть приведена к каноническому виду (2) с помощью изометрического преобразования координат (3).
10.13] § ЮЛ. ОСНОВНАЯ ТЕОРЕМА О КВАДРАТИЧНЫХ ФОРМАХ 315 10.13. Последовательность действий, которые нужно произвести для построения формул перехода (3) и канонического вида (2) квадратичной формы (1), вытекает из результатов 4.94 и 9.45; мы приведем ее здесь в окончательном виде. а) По квадратичной форме (1) строим симметричную матрицу A = \\aiJ\\. б) Составляем характеристический многочлен Д (к) = = det (А — ХЕ) и находим его корни. В силу 9.45 этот многочлен имеет п вещественных корней (не обязательно различных). в) Зная корни многочлена А(Х), можно написать уже квадратичную форму в каноническом виде (2), в частности, можно сказать, каковы ее положительный и отрицательный индексы инерции. г) Корень Хг подставим в систему (23) из 4.94. Для данного корня Кг эта система имеет ровно столько линейно независимых решений, какова кратность корня Xv Найдем эти линейно независимые решения, пользуясь правилами решения однородных систем линейных уравнений. л) Если кратность корня Хг больше единицы, ортогона- лизируем полученные линейно независимые решения по методу 8.61. е) Проделав указанные операции с каждым корнем, мы получим систему из п взаимно ортогональных векторов. Пронормируем ее, разделив каждый вектор на его длину. Полученные векторы Л = К\ ?iu, •••> <}, /а=М2>. Ч?\ •••> Л /п = {яГ, яГ, .... чТ\ образуют уже ортогональную и нормированную систему. ж) Используя числа q{J\ можно написать формулы перехода (3). з) Если требуется дать выражения новых координат {%} через старые координаты {|}, то, поскольку матрица, обратная к ортогональной, получается транспонированием, мы
316 гл. 10. формы в евклидовом пространстве [10.14 можем написать искомые выражения в виде п *,-= 2 «7/% С'=1. 2, .... л). 10.14. Мы видели в 7.33а , что в аффинном пространстве ни канонический базис, ни канонический вид квадратичной формы не определены однозначно; вообще говоря, можно было включить в канонический базис формы любой наперед заданный вектор. В евклидовом пространстве и при условии, что рассматриваются только ортогональные и нормированные базисы, положение иное. Дело в том, что вместе с матрицей квадратичной формы, как мы видели, преобразуется и матрица соответствующего симметричного линейного оператора; если найден канонический базис квадратичной формы, то одновременно найден базис из собственных векторов симметричного оператора. При этом коэффициенты квадратичной формы в каноническом базисе (канонические коэффициенты.) совпадают с соответствующими собственными значениями оператора. Но собственные значения оператора А суть корни уравнения det (А — АЕ)-=0, которое не зависит от выбора базиса и инвариантно связано с оператором А. Следовательно, совокупность канонических коэффициентов формы (Ал;, л:) определена однозначно. Что же касается канонического базиса квадратичной формы (Ал:, л:), то он определен с той же степенью произвола, с какой определена полная ортогональная и нормированная система собственных векторов оператора А: не считая взаимных перестановок этих векторов, можно любой из них умножить на —1; более общим является любое изометрическое преобразование в собственном подпространстве, отвечающем фиксированному собственному значению А,. § 10.2. Экстремальные свойства квадратичной формы 10.21. Пусть в евклидовом пространстве Rn задана квадратичная форма А (л:, л:). Будем рассматривать ее значения на единичной сфере пространства R„, т. е. при (лг, л:) = 1, и поставим следующий вопрос: в каких точках единичной сферы значения формы стационарны? Напомним, что диффе-
10.21] § Ю.2. ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 317 ренцируемая числовая функция f(x), определенная для точек некоторой поверхности О, принимает по определению в точке А'0 £ U стационарное значение, если в точке х0 производная функции fix) но любому направлению на поверхности U равна нулю. В частности, функция /(х) стационарна в тех точках, где она достигает максимума или минимума. Задача об определении стационарных значений есть задача на условный экстремум; одним из методов ее решения является метод Лагранжа, который мы сейчас и используем*). Возьмем в пространстве R„ ортогональный и нормированный базис и обозначим через |t, |2, ...,£„ координаты вектора х в этом базисе. В этих координатах квадратичная форма п будет иметь вид А (л:, х) -— 2 aij%>&ji а УСЛ0Вие (х> х) — 1 п запишется равенством 2 |jf=l. Следуя методу Лагранжа, построим функцию п п l, .7 = 1 l - 1 и приравняем нулю ее первую частную производную по £,■(*'= 1, ^ ■-., п): п 2 2 «lV£y —2Xgf.==0 (/=1, 2, ..., /i). После сокращения на 2 мы получаем уже знакомую нам систему**) (23) из 4.94: («и — b)£i + «12S2 г • • • +а1Л5„ = 0, fl21^1 -;-(«22— ^) 52-Г • • • "Г ЯоДи == 0, которая служила для определения собственных векторов симметричного оператора, отвечающего квадратичной форме А (л;, х). Отсюда вытекает следующее предложение: *) См., например, В. И. Смирнов, Курс высшей математики, т. I, стр. 392, Гостехиздат, 1951. **) Напомним, что а^-^а.-,- (/, / = 1, 2, . ., п).
318 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.22 Квадратичная форма А (х, х) принимает стационарные значения на тех векторах единичной сферы, которые являются собственными векторами симметричного оператора А, соответствующего форме А (х, х). 10.22. Вычислим значения, которые принимает форма в стационарных точках. Для этого введем соответствующий симметричный оператор А и представим квадратичную форму в виде А (х, л;) = (Ал;, л;). Так как, по доказанному, форма А(х, х) принимает стационарное значение на собственном векторе е[ оператора А, то мы имеем Ае^—Х^^ отсюда А (<?,-, e{) = (Aeh ei)=Ki(eh «?,■) = *<,•• Итак, стационарное значение формы А (л:, л;) при х = е£ равно соответствующему собственному значению оператора А. Так как собственные значения оператора А совпадают с каноническими коэффициентами формы А (л:, л:), то мы можем, далее, заключить, что стационарные значения формы А (ху х) совпадают с ее каноническими коэффициентами. В частности, максимум формы А (х, х) на единичной сфере равен наибольшему из ее канонических коэффициентов, минимум — наименьшему. 10.23. Как билинейную, так и квадратичную форму А (л;, л;) можно рассматривать не во всем /z-мерном пространстве R„, а в некотором ^-мерном подпространстве R^cR,,, и разыскивать в этом подпространстве ортогональный н нормированный канонический базис. Пусть форма А (л;, х) во всем пространстве R„ имеет канонический вид А(*, х)^Ц1 + ^+...-|4Д (4) а в подпространстве R^ — канонический вид А (л;, х) = iixxl + \12т1 + . . . + №1 Выясним, как связаны коэффициенты |i1, |i2, ..., \ik с коэффициентами Aj, X2, ..., %п. Для удобства предположим, что нумерация канонических коэффициентов произведена в порядке их убывания, так что
10.24] § 10.2. экстремальный свойства квадратичной формы 319 Величина к1у как мы уже знаем, есть максимальное значение квадратичной формы А (х, х) на единичной сфере пространства R„; аналогично \х1 есть максимальное значение квадратичной формы А (х, х) на единичной сфере подпространства Rk, и потому [Хх^^х. Покажем, что \хл ^ hu_f7_1. Пусть <?х, р.2, . . ., еп —канонический базис формы А (х, х), в котором она записывается в виде (4). Рассмотрим (п — клг 1)-мерное подпространство R', порожденное векторами ех, е2, ..., en_kAl. Так как k -f- (п — &+1)>л, то иодпространстза R' и R/; в силу 2.47в имеют хотя бы один общий ненулевой вектор. Пусть это вектор Ar0 = {£i0), ... ..., 1п°-/г+ь 0> • ••* 0}'. предположим, что л*0 нормирован, т. е. что |л;0|=1. Для вектора х0 по формуле (4) имеем А / v v \ _ У t(0)2 j_ _j_) £(0)2 \ *-> 1 /t(0)2 i_ ! t(0)2 \ _. \ ^Л//-/г-М Vbi -г • • • "Г Ьп-k + l/ — An-k + V Отсюда вытекает, что [il как максимальное значение квадратичной формы А (л:, х) на единичной сфере подпространства Rfr не может быть меньше, чем Х„_fc.ьх, что и требуется. Таким образом, величина \хг заключена в следующих границах: K>Vi>hn-k + i- (5) 10.24. Для различных ^-мерных подпространств величина |i1 принимает, естественно, различные значения. Покажем, что существуют такие k-мерные подпространства, для которых \хг принимает крайние значения, указанные в неравенстве (5). Рассмотрим подпространство R', порожденное первыми k векторами ег, е2, ..., ek канонического базиса формы А (х, х). В подпространстве R' в базисе е1ц е2, ..., ek форма А (а:, х) имеет вид А (а:, х) = к1Ц + к2&+ . . . +КкЦ В частности, А(^, el) = Xl = maxA(x, х) (|*|=1, х £R').
320 ГЛ. 10. ФОРМЫ В КВКЛИДОВОМ ПРОСТРАНСТВЕ [10.25 Таким образом, на подпространстве R' величина |ах ---■-- max А (л:, л;) (|д;|^1, Jt6R') достигает наибольшего возможного значения лг Рассмотрим теперь подпространство R", порожденное последними к векторами en_k + 1, ?„_*4.2» •••» еп канонического базиса формы А (х, х). В подпространстве R" в базисе en_k + lJ . .., еп форма А(х, х) имеет вид А(х, х) = 'кп_к + 1Ъ2п-к+1+ . . . +KU- В частности, А(еп.к.1у еп_к_1) = кп_к + 1=--тахА(х, *) (|*| = 1, *6R"). Поскольку теперь \хг — max A („v, jc) (| jc / = 1, .v£R"), мы заключаем, так же как и выше, что М^ = Я„_л + 1. Следовательно, на подпространстве R" величина jij достигает своего наименьшего значения А,м_л + 1. Мы получаем, таким образом, новое определение коэффициента Я„_л + 1; коэффициент hn_k + 1 в канонической записи формы А (д*г д:) равен наименьшему значению максимума квадратичной формы А(х, х) на единичных сферах всех возможных k-мерных подпространств пространства Rn. 10.25. Используя этот результат, мы можем дать оценки для остальных канонических коэффициентов формы А (х, х) на подпространстве R^. Например, если фиксировано подпространство Rfe, то (i2 есть наименьший из максимумов квадратичной формы А (х, х) на единичных сферах (k—1)- мерных подпространств пространства R^. В то же время ^n-k + 2 есть наименьший из максимумов квадратичной формы А (л:, х) на единичных сферах всех (k—1)-мерных подпространств пространства R„; поэтому Щ^^м-л + 2- Аналогично Н-з^и-л+з* Ш>^-* + 4> ••■» РнЖ- С ДРУгой стороны, Я2 есть наименьший из максимумов квадратичной формы А (л:, л:) на единичных сферах (п—1)-мерных подпространств пространства Rn; но каждое (п — 1)-мерное подпространство пересекается с подпространством Rfe согласно нашей лемме по подпространству, имеющему не менее (п—1)+& — п — k—1 измерений; поэтому число Х2 не менее чем наименьший из максимумов формы A (х, x) на единичных сферах этих подпространств и, в частности, не менее чем число |i2 — наи-
10.26] § Ю.2. ЭКСТРРМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 321 меньший из максимумов формы А (х, х) на единичных сферах (к—1)-мерных подпространств пространства R^.. Следовательно, к2^\12. Аналогично А3 ^ \х31 ..., Xfe ^ \ik. Итак, канонические коэффициенты щ, \х2, ..., \ik удовлетворяют неравенствам ^i^Hi>^-* + i> К ^ До. ^Хи_^ + 2, % При & = /z—1 неравенства (6) приобретают следующий вид: Р2 3 ' (7) 10.26*. Если (п — 1)-мерное подпространство R„_x, на котором рассматривается квадратичная форма А (х, х), задано уравнением ai£1 + a2£2+---+a„6„ = 0 (<*? + a\+ . . . +а*п= 1), (8) то коэффициенты |lxx, |я2, •••, Мтг-i можно вычислить эффективно. В предположении, что все числа Xv X2, ..., Хп различны, приведем метод вычисления этих коэффициентов, предложенный М. Г. Крейном. Из коэффициентов ах, а2, . . ., ап по крайней мере один отличен от нуля. Пусть, например, апф0. Тогда из уравнения (8) мы получаем п-\ ;= I
322 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.26 мы получаем, что в подпространстве Rtl_1 в координатах Si» &2» •••> 1,-1 форма А{х, х) имеет вид /Л-1 \2 А (л;, ^ = ^ + ^+...+^.1^-1 + ^ 2 «Ду Канонические коэффициенты этой квадратичной формы определяются как ее стационарные значения на единичной сфере подпространства Rn_1 {JO.22); эта последняя в координатах Ei, Ёг> •••» L-i имеет уравнение В(х, ^-Sf + SI+.-.+SS-iH—fSayO = 1- Для определения стационарных значений действуем, как и ранее, по методу Лагранжа: составляем функцию л-1 л-1 А(х, х)-ХВ(х, *) = £ (Kj-^lj + ^L-hl £ аД. и приравниваем нулю ее частные производные по (*=1, 2, ..., л-1): (9) Искомые коэффициенты jix, (i2, ...,[x„_1 являются корнями того уравнения, которое получается, когда мы приравняем нулю определитель D (X) системы линейных уравнений (9). Матрица из коэффициентов этой системы есть, очевидно, сумма двух матриц, первая из которых диагональна, с числами Xk — X по диагонали (&=1, 2, ..., п—1), а вторая имеет вид !«!<*! a л-1а2 «!<*«-1 «2аИ В силу линейного свойства определителей (1.44) искомый определитель равен сумме определителя первой матрицы и всех определителей, полученных заменой некоторых столбцов определителя первой матрицы на соответствующие столбцы
10.26] § Ю.2. ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 323 второй матрицы с учетом множителя Поскольку всякие два столоца второй матрицы пропорциональны, достаточно рассматривать только те случаи, когда один из столбцов определителя первой матрицы заменен на соответствующий столбец второй матрицы. Если, в частности, &-й столбец первой матрицы заменен на &-й столбец второй матрицы, то соответствующий определитель имеет следующее выражение: \кг—Х 0 . . . 0 алах 0 ... 0 ~2 ап 0 Х.2—Х о aka2 о 'к-1 о -*«*«*■ akak + l ^k + 1 о K-i—h Ok i=l Oil П (K—v Ль — A Введем обозначения п— 1 ^(^)^П(^/г — ^) (определитель первой матрицы), G{X)=f[CKk-X) II (*, /г=1 Тогда искомый определитель D (X) примет вид D(X) а| (Ю) fc = Решая уравнение D(X) = 0, мы и найдем интересующие нас величины |ix, |i2, ..., \in_v Заметим, что они зависят не от самих чисел ау-, а от квадратов этих чисел; таким образом, если у одного или нескольких коэффициентов уравнения (8) изменить знак, то искомые канонические коэффициенты формы А (л:, х) на подпространстве R;/_x не изменяются. 11*
324 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.27 10.27*. Формула (10) интересна еще и тем, что она позволяет построить по данным числам ju1, |i.2, ..., un_i, удовлетворяющим неравенствам (8), подпространство R,;_b на котором форма А (а:, х) имеет канонические коэффициенты \ily |i2, . . ., lin_l (в предположении, что числа Xv л2, . . ., Хп различны). Покажем, как решается эта задача. Заметим, что формулу (10) мы можем записать в виде а" G (XT ~ n G (X) \& Xk-X -& Xk-X> ^{> таким образом, числа а\, aS, ..., а„ пропорциональны коэффи- циентам разложения рациональной функции -^j-г на про- стейшие дроби. Пусть заданы неравенствам числа \ily |i2, ..., \.in_v удовлетворяющие *1 > V>1 > ^2, ) К > ^2 > ^3» 1 (12) К-1>Рп-1>кг Положим Dx (к) = Ц (\xk — X) и разложим рациональную /2=1 функцию * . на простейшие дроби: Р\ (X) _ С\ . Со , I cn /io\ G(X) -'X1—X~t~X2—X~r"'~tXn — X' [l0) Покажем, что коэффициенты сх, с2, . . ., сп — одного знака. Известно, что эти коэффициенты вычисляются по формулам*) г Pi (h) =_£i(^ ck (Xk-Xj.. .(Xk-Xk-J (Xk-Xk + 1).. .(Xk-Xn) G'(Xk)' Числа Dx (Xx), D1(X2), ..., D1 (Xn) имеют попеременно противоположные знаки, поскольку корни многочлена Dx (к) по условию перемежаются с корнями многочлена G(X). Числа G' (Xx), G' (А,2), ..., G' (Хп) также имеют попеременно противоположные знаки, поскольку Къ Х2, ..., Кп — простые *) См., например, М. Гребенча, С. Новоселов, Курс математического анализа, стр. 405, Учпедгиз, 1951.
10.31] § 10.3. ЗАДАЧА О ПАРЕ КВАДРАТИЧНЫХ ФОРМ 325 корни многочлена G(k). Поэтому отношения ^МлД , а с ними и коэффициенты ск имеют одинаковые знаки. С точностью до множителя можно все коэффициенты ск считать положительными, а их сумму — равной единице, и тогда можно определить числа ах, а2, . . ., ап из условий at=cv а* = с2, ..., а*=с;1. (14) Числа ах, а2, ..., ап можно взять любого знака. Покажем, что подпространство R„_i, определяемое уравнением ^1?1-га2^2Г • • • + an£;i--=0, и будет искомым. Действительно, многочлен D(X), корни которого суть канонические коэффициенты формы А (х, х) на подпространстве Rn_x, по доказанному, выражается с помощью формулы (10) или эквивалентной ей (11). Сравнивая (11) и (12) и учитывая (14), мы получаем, что многочлен D (К) отличается только числовым множителем от построенного нами многочлена DX(A,). Но тогда корни многочлена D (к) совпадают с числами \iv |i2, ..., !!„_!, что и утверждалось. Заменами е. Можно показать, что полученные числа alt ..., ап зависят непрерывно от величин къ ..., Кп, ц,х, ..., цп-х. Используя этот факт, можно проверить, что задача имеет решение и для чисел jLii, ..., \in-i> удовлетворяющих неравенствам (7), а также и без предположения, что числа Хъ ..., Хп различны. § 10.3. Задача о паре квадратичных форм 10.31. В некоторых вопросах математики и физики существенную роль играет решение следующей задачи: для двух квадратичных форм А(х, х) и В(х, х), заданных в n-мерном аффинном пространстве Rn, указать базис, в котором обе эти формы записываются в каноническом виде (т. е. в виде суммы квадратов координат с некоторыми коэффициентами). Следующий пример на плоскости (п = 2) показывает, что эта задача не всегда допускает решение. Рассмотрим следующие две формы от двух переменных £lf l2» А(*. *) = 6?-ES,
326 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.32 Найтн общий канонический базис для этих форм означает найти общую пару взаимно сопряженных векторов для гипербол А (х, х)—1 и В (,v, х) = 1 (см. 7.44). Эти гиперболы равносторонние; из аналитической геометрии известно, что сопряженные направления таких гипербол симметричны относительно их асимптот. Поэтому полярные углы фх и q.2, отвечающие паре сопряженных направлений, для первой гиперболы связаны равенством ф1 + ф2 = я/2, а для второй гиперболы — равенством Ф1 + Т2 = 0 (оба равенства с точностью до слагаемого, кратного л). Так как эти равенства исключают одно другое, то в данном случае общих взаимно сопряженных направлений не существует. Оказывается, что задача имеет решение, если дополнительно допустить, что одна из этих форм, например В (л;, х), положительно определенная (т. е. В (х, х) >0 при хфО). Существование решения легко установить следующим путем. Пусть В(л*, у)— симметричная билинейная форма, соответствующая квадратичной форме В(х, х). Введем в аффинном пространстве Rn евклидову метрику, полагая (х, у) = В(х, у). Выполнение аксиом скалярного произведения обеспечивается симметричностью и положительной определенностью формы В (л:, л*). В силу 10.11 существует ортогональный и нормированный (относительно введенной нами метрики) базис ev . . ., еп, в котором форма А (х, х) принимает канонический вид А(лг, х)^К1ц\ + Х2г]1+ . . . -\-Кпц1 (15) (Л1> Л2> •••» Ли— координаты вектора х в построенном базисе). В этом же базисе вторая квадратичная форма В(х,х) в силу формулы 8.42 (17) имеет вид В(*, *) = (*, x) = t\l-\-x\l+ . . . +ц1 Итак, базис, в котором обе формы имеют канонический вид, существует. 10.32. Используем для вычисления координат векторов ег, ..., еп искомого базиса экстремальные свойства квадратичных форм. Как было показано в 10.21, векторы ev . . ., еп
10.32] § Ю.З. ЗАДАЧА О ПАРЕ КВАДРАТИЧНЫХ ФОРМ 327 суть те векторы, которые подчинены условию (л:, х) = В (л;, х) ■= 1 и для которых форма А(х, х) принимает стационарные значения. Предположим, что в исходном базисе формы А (д:, х) и В (х, х) имели следующие выражения: п п А(л-, *)= 2 aiklfck, В(х, д:)= 2 hiklilh- i, k=l i, k=- 1 Действуя по методу Лагранжа, мы должны составить функцию г (&1> £г> •••» ьп) — 2ii aik^ibk i, k-1 i, k= 1 и приравнять нулю ее частные производные по всем координатам: *=1 к=[ Полученная система однородных уравнений («и — ИМ 5i -г («12 —^i,) g2 + ... + (aln —\ibln) ln = 0, («21 — ^2l) Si + (°22 ~ИМ S2 + . . . + («2./ — Ц&2«) £л = 0- Ki — M^n)£i + Кг —Н-М 6а + •••+(««« — ^wi)5n--=0 допускает ненулевые решения тогда и только тогда ее определитель обращается в нуль: «11 — ^11 «12—И^12 •'• Й1«-^к а21 — \ib2l a22 — \ib22 ... a2n — \ib2n (16) (17) когда 'Hi l*Ail «М2— РЬп2 • • И*ии -0. 18) Решая уравнение (18), мы находим п возможных значений \i = \ik (&=1, 2, ..., /г); подставляя \лк в систему (17), мы сможем найти координаты $[к\ £[/>, ..., Vnk) соответствующего искомого базисного вектора. Теорема, доказанная в 10.31, обеспечивает существование вещественных корней определителя системы (17) и для каждого кратного корня наличие соответствующего числа линейно независимых решений этой системы.
328 гл. 10. формы в евклидовом пространстве [10.33 10.33. Переходим к вычислению канонических коэффициентов. Покажем, что коэффициенты Х1У Х2, . . ., Хп в канонической записи (15) формы А(х, л;) совпадают с соответствующими корнями [хх, (я2, ..., \хп определителя системы (17). Здесь можно было бы использовать рассуждение, аналогичное проведенному в 10.22; мы теперь предпочитаем провести непосредственное вычисление. Если для заданного корня \хт умножить i-e уравнение системы (16) на /-ю координату решения \\т) (/= 1, 2, . . ., п) и все эти уравнения сложить, то получим равенство = ft- . Ij^bikVrir = РяЩе„ ея) = |1Я, так как В(еа, ет)=\. С другой стороны, канонические координаты т]х, г]2, . . ., г\т для вектора ет имеют, очевидно, значения т],- = 0 при 1фт, п г\т=\, и форма А (л;, x)='^\'kir$ при х = ет становится равной кт. Отсюда \ьт = кт, что и утверждалось. Этот результат дает возможность написать форму А (лг, л;) в искомом каноническом виде, минуя вычисление канонического базиса. 10.34. Поставленная в 10.31 задача об одновременном приведении к каноническому виду двух квадратичных форм А (л;, х) и В (л:, х), из которых, например, В(х, x) положительно определена, решена нами в несколько усиленной форме; именно, форма В(х, х) приведена к виду суммы квадратов координат с коэффициентами, равными 1. Вообще говоря, это не требуется, и поэтому коэффициенты преобразованных форм заведомо не определяются однозначно. Мы покажем все же, что отношения соответствующих канонических коэффициентов не зависят от способа одновременного приведения форм А(х, х) и В(х, х) к каноническому виду. Пусть формы А (х, х) и В(х, х) двумя способами приведены к каноническому виду: в координатах £х, |2, ..., |„ А(*. *) = £Щ В(х, x) = i>#, i^l i = 1
10.41] § Ю.4. ПРИВЕДЕНИЕ УРАВНЕНИЯ К КАНОНИЧЕСКОМУ ВИДУ 329 а в координатах т^, г\2, . . ., г\п п п А(*, x) = y^ipir[l В(дг, л:)-2тЛ?- Так как форма В (л:, х) положительно определенная, числа V/ и г,- (/=1, 2, . .., п) все положительны. Рассмотрим новое преобразование координат Тогда формы А(дг, д;) и В (х, х) преобразуются к виду а) в координатах £•,■: а(лг, л:) = 2 т-1?. в(*> *) = 21?! б) в координатах г^-: 1 = 1 Ti £ = 1 Пусть elt e2, ..., е,;— базис, отвечающий координатам ^-, и /х, /2, ..., /и — базис, отвечающий координатам г],-. В метрике, определяемой формой В (я, х), оба эти базиса ортогональны и нормированы. Но тогда (10.14) совокупность канонических коэффициентов формы А (я, л;) определена однозначно; таким образом, последовательность чисел X X X — ,—,...., — должна совпадать с последовательностью vr v2 vn — , —, ..., — с точностью до порядка. Теорема доказана. § 10.4. Приведение общего уравнения поверхности 2-го порядка к каноническому виду 10.41. В этом и следующих пунктах мы будем называть элементы линейного пространства R„ не векторами, а точками (2.17), что будет более соответствовать геометрическому представлению. Поверхностью 2-го порядка в п-мерном пространстве мы будем называть геометрическое место точек
330 гл. 10. формы в евклидовом пространстве [10.42 х — (£i> £г> •••> £/*)> удовлетворяющих уравнению вида . gx «/*S.-g* + 2Д^ ft«6« + e = 0, (19) или А. (д:, jc) + 2iW-f c = 0, где А (я, я) = 2 а/*£Дл— квадратичная форма от радиуса- п вектора точки х, L(x) — 2 ^Д/ — линейная форма, с — по- стоянная *). Пространство Rw будем считать евклидовым и числа in ^2» •■•> iw — координатами вектора х в ортогональном и нормированном базисе. Задачей настоящего пункта является выбор в пространстве Rn нового ортогонального и нормированного базиса и нового начала координат так, чтобы наша поверхность 2-го порядка определялась некоторым специальным и особенно простым уравнением, которое называется каноническим. В дальнейшем по каноническому уравнению мы изучим свойства поверхности. 10.42. Совершим прежде всего в пространстве Rn ортогональное преобразование координат п 5/=.2 Я!/Ц/ (^=1» 2> •••> *)> (20) как указано в 10.12, с тем чтобы в новых переменных квадратичная форма А (х, х) приняла канонический вид п А(х, х)= 2 Vi*. Уравнение (19) будет после подстановки (20) иметь вид 2№ + 2%'М + с = 0, (21) *) В случае п — 2 геометрический образ, определяемый уравнением (19), называется кривой 2то порядка. Однако в дальнейшем мы всюду употребляем слово «поверхность», не оговаривая каждый раз, что при л = 2 его нужно заменить словом «кривая».
10.4 2] § 10.4. приведение уравнения к каноническому виду 331 где /,.(/=1,2, . . ., п) — новые коэффициенты линейной формы L(x). Если в полученном уравнении Х{Ф 0 для некоторого /, то переносом начала координат можно добиться исчезновения соответствующего члена первого измерения. Пусть, например, Х1 Ф 0; тогда, очевидно, Ml + 2/1ri1 = ^(ri1H-y2-^-. Положим г)', = г|х —{- Л ; это равносильно переносу начала координат в точку (—-~ , 0> 0» •••» 0 j. В результате подстановки группа членов \^с\\-\- 2/1rj1 заменится на X1r|i2 — — -г—; таким образом, член второго измерения останется с тем же самым коэффициентом Хъ член первого измерения /2 пропадает, свободный член получит добавок ~ . После всех таких преобразований уравнение поверхности примет вид hr\l + K4l+ • • • +М?-г-2/г + 1т|г + 1+ . . . +2/яЛв + с = 0. Здесь опущ»ены для простоты записи штрихи у координат, а сами координаты заново перенумерованы так, чтобы вначале шли координаты, участвующие в квадратичной форме, так что К1У Я2, . . ., Хг отличны от нуля, ^ — 0 при к > г. Если при этом г = п или же г < л, но числа /г+1, /г + 2'- • •» ^» оказались равными нулю, то мы получаем каноническое уравнение центральной поверхности MI + M!+---+Vl? + c = 0. (22) Если г —л, то эта поверхность при с =^= 0 называется истин- ной, а при с = 0 — конической. Допустим, что среди чисел /г + 1, . .., /„ имеется хотя бы одно отличное от нуля. Тогда мы совершим новое
332 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.42 ортогональное преобразование координат по формулам Т., гт= Т|а, • • • где Ж—положительный множитель, обеспечивающий ортогональность матрицы преобразования: так как у ортогональной матрицы сумма квадратов элементов каждой строки должна быть равна 1, то М* = /*+1+ &,+ ...+/*. Остальные строки (следующие за (г+1)-й) могут быть произвольными, лишь бы полученная матрица была ортогональной (8.95). В результате этого преобразования уравнение поверхности приобретает вид к1ч1+...+кгх*=2Мхг + 1-с. Если сфОу еще один перенос начала координат по формуле _ с позволяет освободиться от свободного члена; уравнение (опять с опущенным штрихом у последней координаты) получает вид X1xl+...+krx* = 2Mxr + 1; (23) это — каноническое уравнение нецентральной поверхности. Всякую поверхность 2-го порядка будем называть не- вырожденной, если в ее каноническом уравнении участвуют все п координат, и вырожденной, если в ее каноническом уравнении участвует менее чем п координат. Все введенные названия будут разъяснены в дальнейшем.
10.52) § Ю.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 333 § 10.5. Геометрические свойства поверхностей 2-го порядка 10.51. Центр поверхности. Центром поверхности называется точка л:0 = (ES, £°, •••>£«)> обладающая следующим свойством: если точка (Е? -+- Ei, ££ + £2» • • • Лп + 1п) лежит на поверхности, то симметричная с ней относительно х0 точка (Е? — Ei, ll —12> ---,1п — Ъп) также лежит на поверхности. У поверхности с каноническим уравнением (22) существуют центры; всякая точка, для которой г]1 = г]2 = ... = = г|г = 0, является, очевидно, центром. Этим объясняется название этого класса: центральные поверхности. Покажем (это будет использовано в дальнейшем), что никаких других центров у поверхности с уравнением (22) не существует. Действительно, пусть (££, ...,£„)—центр этой поверхности. Тогда из условия вытекает МЕ!-Е1)а+МЕ$-Ея)а+-..+М5!-Е,)2 + с = 0.- - Вычитая второе равенство из первого, мы получаем KIII1 + KUI2+ ■ ■ ■ +К1°Лг = о. Возьмем на поверхности точку, в которой £2 = |3— • • • = = |г = 0, ^^=0. (Очевидно, что уравнению (22) можно удовлетворить такими значениями.) Тогда мы получим откуда ii = 0. Аналогично показываем, что |§= . .. = £<! = 0, что нам и требуется. 10.52. Истинные центральные поверхности. Рассмотрим сначала истинную центральную поверхность, т. е. предположим, что г —пи сфО. Тогда уравнение (22) легко преобразовать к виду + Л? + Л1 + +.2^1
334 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.52 где числа ак определяются формулами a* = +l/|f| (*=1,2, ...,я); они называются полуосями поверхности. Перенумеруем координаты заново так, чтобы сначала шли слагаемые с положительными знаками: .Hi , Hi ] ■ 4k 4k+i __л1 — 1 n±\ a{ a* ak ak+\ an Случай k = 0 естественно исключить из рассмотрения, так как при k = 0 никакие вещественные значения %, т]2,... . . ., \\п не могут удовлетворить уравнению (24); в этом случае говорят иногда, что уравнение (24) определяет «мнимую» поверхность. Остаются п различных типов истинных центральных поверхностей, отвечающих значениям /5=1,2, . . ., п. а. В двумерном случае (п = 2) уравнение (24) определяет при k=\ и к = 2 две известные из аналитической геометрии кривые: 2 2 k=\: -~r — ^f=l (гипербола), al a2 2 2 fe = 2: ^\ + Ц=] (эллипс). а\ а* б. При /z^3 имеем fc=l, k = 2, k = 3 и соответственно три невырожденные центральные поверхности в трехмерном пространстве, определяемые следующими уравнениями: 2 2 2 k=\: -~- Ц- тг = 1 (двуполостный гиперболоид), а\ а2 а$ 2 2 2 k~2: -Дгт-~т—-т-=1 (однополостный гиперболоид), al а2 аз 2 о о k = 3: 3l + -Df + Jf =1 (эллипсоид). а1 а2 а3 Напомним читателю построение каждой из этих поверхностей. Рассмотрим сечения каждой из них горизонтальными плоскостями т]8 = ся3( — оо < с < оо). Эти сечения представляют собой соответственно: гиперболы с вещественной
10.52] § Ю.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 335 осью г\х: а\ а\ эллипсы, определенные для всех значений с: эллипсы, определенные только для |с|^1: k = 3: 4 + 4= 1-е2- ai a2 Чтобы определить положения вершин этих сечений, построим сечения поверхности координатными плоскостями r\t = 0, Рис. 2. Г)2 = 0. Для случая k—\ мы получаем при этом действительное сечение только координатной плоскостью г)2 — 0, которое будет представлять собой гиперболу: ill _-111 ==1 а\ al Вершины гипербол горизонтальных сечений будут располагаться на этой кривой; в результате построения получаем двуполостный гиперболоид (рис. 2).
ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.52 /^"~"7^—-1— 1 i "Y \о ^££2& Vjjf- \\ Рис. 4.
10.52] § 10.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 337 Для случая к = 2 сечения обеими координатными плоскостями т]х = 0, т]2 = 0 представляют собой гиперболы с мнимой осью т)3: 2 2 2 2 J]l_JQl=:1 J5l_i!L==1 2 2 » 2 2 й2 а3 ал а3 Совокупность эллипсов горизонтальных сечений с вершинами на этих гиперболах и составляет одиополостный гиперболоид (рис. 3). Наконец, в случае k=^3 сечения координатными плоскостями % = (), ^2 = 0 — эллипсы; проводя эллипсы горизонтальных сечений, получаем эллипсоид (рис. 4). в. Поверхности 2-го порядка в пространстве более чем трех измерении уже не поддаются наглядному геометрическому представлению. Тем не менее мы можем указать и в многомерном случае существенные различия между типами истинных поверхностей, отвечающих различным значениям /г=1, 2, ..., п. Будем исходить из геометрически очевидных различии в трехмерном пространстве. На двуполостном гиперболоиде (/г=1) существует пара точек, которые нельзя путем непрерывного передвижения по поверхности привести к совпадению: достаточно взять одну из точек пары на одной полости, а вторую точку — на другой полости, чтобы получить такую пару. На одно- полостном гиперболоиде (k = 2) уже всякие две точки можно привести к совпадению с помощью непрерывного передвижения по поверхности; но есть замкнутая линия (например, горловая линия гиперболоида), которую нельзя непрерывной деформацией свести в одну точку. На эллипсоиде (k = 2) уже всякая замкнутая линия может быть сведена в одну точку. Эти факты могут служить исходным пунктом при формулировке геометрических различий между центральными поверхностями в я-мерном пространстве. Введем следующие определения. Фигура А называется гомеоморф- ной фигуре £, если существует взаимно однозначное и взаимно непрерывное отображение множества точек фигуры А на множество точек фигуры В. Фигура Л, расположенная на поверхности S, называется гомотопной фигуре В, расположенной на этой же поверхности, если фигура А может быть переведена в фигуру В с помощью непрерывной деформации, з процессе которой фигура А остается все время на поверхности 5. Геометрические различия между центральными поверхностями с помощью этих определений формулируются следующим образом. Для /г=1 можно указать на поверхности пару точек, не гомотопных друг другу. Для k=-2 всякая точка на поворхности гомотопна всякой другой точке; но существует линия, гомеоморфная окружности, которая не гомотопна точке. Для k-^З всякая линия, гомеоморфная окружности, гомотопна точке; но существует не гомотопная точке часть поверхности, гомеоморфная сфере (точнее, двумерной сфере, т. е. сфере в трехмерном пространстве). Продолжая таким образом, мы сможем сформулировать для каждого к отличительное свойство соответствующей центральной поверхности: всякая ее часть, гомео-
338 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.53 морфная (k—1)-мерной сфере, гомотопна точке, но существует часть, гомеоморфная ^-мерной сфере, которая не гомотопна точке. Из этого результата, в частности, вытекает, что центральные поверхности в я-мерном пространстве, очевидно, гомеоморфные друг другу при равных значениях /г, не гомеоморфны друг другу при различных /г. На доказательствах этих интересных предложений мы останавливаться не можем *). 10.53. Конические поверхности. Рассмотрим теперь случай конической поверхности: в уравнении (22) с = 0. Уравнение (22) становится однородным: вместе сточкой (т]х, т]2, . . ., г)„) ему удовлетворяет и точка {t\]v /r)2,. . . . . ., tr\n) при любом t. Это означает, что поверхность образована из прямых линий, проходящих через начало координат**). Аналогично предыдущему каноническое уравнение конической поверхности мы сможем записать в виде «i ak ak+i an Оценим число различных типов конических поверхностей при заданном п. Если число т = п — к отрицательных коэффициентов в каноническом уравнении (22) больше /г/2, то, умножая уравнение на —1, мы получаем уравнение той же поверхности, но с числом отрицательных коэффициентов, уже меньшим /г/2. Следовательно, достаточно рассмотреть случаи, отвечающие значениям m^Ln/2. Если /г четное, то, исключая случай точки (k — О), получаем /г/2 различных типов конических поверхностей, отвечающих значениям т—1, 2, ...,/г/2; если /г нечетное, то различных типов оказывается (п—1)/2, именно, они отвечают значениям т=1,2, ...,(/г-1)/2. а. На плоскости (п -=2), кроме точки, имеется один такой тип (т—\) с каноническим уравнением л! л1. == о 2 2 ai а2 Соответствующий геометрический образ — пара пересекающихся прямых с уравнениями — — -ь — . *) См. Зейферт и Трелфал, Топология, ГОНТИ, 1938. **) За единственным исключением, когда все слагаемые в сумме (22) одного знака и уравнение определяет одну точку — начало координат.
10.53] § Ю.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 339 б. В трехмерном пространстве (п -=-- 3), кроме точки, имеется также только один тин конической поверхности (п—\ 3—1 ,\ ( 2 ~ ~~2~ ~ J с кано,,ическим уравнением 2 о о 2 "Т" 2 о - V* fl! a2 о.з Соответствующий геометрический образ — конус (рис. 5; в частном случае, при ах = а2, прямой круговой конус). Рис. 5. в. Чтобы представить себе форму конической поверхности в общем случае, рассмотрим ее сечение гиперплоскостью Чп са (-0О Л1 I , Чк y\l+i 2 ~Г * * • 1 2 2 С < оо) = г
340 гл. 10. формы в Евклидовом пространстве [10.54 Это уравнение соответствует центральной поверхности в (п—1)-мерном пространстве. Все эти поверхности (при различных значениях с) геометрически подобны друг другу, соответствующие размеры полуосей пропорциональны величине с. Таким образом, каждая коническая поверхность в /z-мер- ном пространстве может быть получена из некоторой центральной поверхности в (п—1)-мерном пространстве Яп_г при помощи перемещения этой центральной поверхности вдоль оси, перпендикулярной к R„_x, с одновременным пропорциональным растяжением во всех направлениях. Чтобы получить при этом все возможные типы конических поверхностей, достаточно использовать лишь те центральные поверхности в (п—1)-мерном пространстве, для которых число отрицательных слагаемых в каноническом уравнении не превосходит (п—1)/2. 10.54. Невырожденные нецентральные поверхности (параболоиды). Тем же путем, как и в 10.52, мы можем привести каноническое уравнение нецентральной невырожденной поверхности к виду — "Г • • • +—i" а • • • г - 2Г\п- (2Ь) Оценим число различных типов невырожденных нецентральных поверхностей. Если число отрицательных слагаемых в левой части уравнения (25) больше (п—1)/2, то, умножая уравнение (25) на —1, мы получаем уравнение той же поверхности, но с числом отрицательных слагаемых в левой части, меньшим (п —1)/2, и с измененным знаком правой части. После зеркального отражения v\'n= —цп знак у правой части восстанавливается. Таким образом, число различных типов невырожденных нецентральных поверхностей (если не причислять к различным типам поверхности, получающиеся друг из друга зеркальным отражением) определяется количеством целых чисел т, удовлетворяющих неравенству 0^т^(п—1)/2; это количество равно /г/2 при четном п и (/z-f-l)/2 при нечетном п. а. На плоскости (п = 2) существует единственная невырожденная нецентральная кривая (парабола) с каноническим
10.54] § 10.5. геометрические свойства поверхностей 341 уравнением T|I = 2aJr|a (л = 0). б. В трехмерном пространстве имеются две невырожденные нецентральные поверхности (л = 3; ^~ = 2 ] : 2 2 1) ~т+ 2 — 2г|3 (/я = 0) (эллиптический параболоид), 2) -у т = 2т]з (/и=1) (гиперболический параболоид). В первом случае сечение поверхности плоскостью г)3 = — С>0 представляет собой эллипс; чтобы определить положение вершин эллипса, построим сечения поверхности координатными плоскостями г\1 = 0 и г)2 = 0. В каждом из этих сечений мы получим параболу; следы этих парабол на плоскости Т)3 = С укажут положение вершин эллипса. Получающаяся поверхность (рис. 6) и есть эллиптический параболоид (в частном случае, при a1 = a2t круговой параболоид). Во втором случае сечение поверхности плоскостью г\3 = — С У-0 представляет собой гиперболу с вещественной осью г\1. Чтобы определить положение вершин, рассмотрим сечение поверхности координатной плоскостью г|2 = 0; в сечении получится парабола щ — 2alr\3, след которой на плоскости т]3 = С укажет положение вершин гиперболы. Сечение плоскостью т]3 = С<0 представляет собой гиперболу с вещественной осью г)2; вершины этой гиперболы лежат на параболе т]| =—2а1ц3 в плоскости ti1 = 0. В сечении т]3 = 0 получаем пару прямых, которые служат асимптотами для проекций на плоскость г)3 = 0 всех рассмотренных нами гипербол в горизонтальных сечениях поверхности. Сама поверхность и есть гиперболический параболоид (рис. 7). в. Чтобы представить себе форму поверхности (25) в общем случае, будем следить за изменением формы ее сечения гиперплоскостью г\п = С при изменении С от 0 до + оо. В каждом таком сечении получается центральная поверхность в (п — 1)-мерном пространстве. Все эти поверхности подобны друг другу; соответствующие размеры полуосей (в отличие от конической поверхности) изменяются по
342 гл. 10. формы в евклидовом пространстве [10.54 параболическому закону (пропорционально корню квадратному из С). При С=0 центральная поверхность становится конической. При С < О центральная поверхность переходит в сопряженную поверхность (т. е. коэффициенты канонического уравнения с отрицательными и положительными знаками меняются ролями). В частном случае, когда все коэффициенты уравнения (25) одного знака, — для определенности положительного, — поверхность существует только в полупространстве т]„^0. Рис. 6. Название класса рассматриваемых невырожденных поверхностей объясняется тем, что они действительно не обладают центром. При п = 3 это очевидно из рис. 6 и 7. В общем случае для доказательства допустим противное: пусть поверхность (25) имеет центр (т]5, т]2, ..., г|°). Так- как этот центр должен быть, в частности, центром симметрии сечения г]„ = г]°, представляющего собой невырожденную центральную поверхность в (п—1)-мерном пространстве, то необходимо т)!=Л2°=...=т|!1-1 = 0. Таким образом, центр должен находиться на оси цп. Перейдем из произвольной точки (%, г]2, ..., T|w-l, г|л + 6), ле-
10.55] § Ю.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 343 жащей на поверхности, в симметричную точку (— r\v ... •••» —Цп-ъ г\п — 6). При этом уравнение (25) не должно нарушиться. Но левая его часть остается неизменной при указанном переходе; следовательно, не меняется и правая часть, откуда вытекает, что 6 = 0. Мы получаем, что на Рис. 7. поверхности вовсе нет точек с х\пфу\\. Но, очевидно, уравнение (25) допускает решение (i^, Т|2, . . ., цп) с цпф\\%. Полученное противоречие показывает, что наша поверхность не может иметь центра. 10.55. Вырожденные поверхности. Вырожденными мы назвали те поверхности, в канонических уравнениях которых участвует меньше чем п координат. Пусть, например, в каноническом уравнении отсутствует координата Г),г Тогда все сечения поверхности (п—1)-мерными гиперплоскостями г\п ~ С (— оо < С < оо) представляют собой одну и ту же поверхность в (п—1)-мерном пространстве. Следовательно, всякая вырожденная поверхность образуется
344 гл. 10. формы в евклидовом пространстве [10.55 параллельным переносом некоторой поверхности 2-го порядка в {п — 1)-мерном пространстве Rn_1 вдоль перпендикуляра к этому (п—\)-мерному пространству. а. Найдем соответствующие линии на плоскости (я = 2); так как в каноническом уравнении в данном случае может Рис. 8. участвовать только одна координата, тс это уравнение имеет вид ТУ При С>0 мы получаем пару параллельных прямых, при С=0 — пару слившихся прямых, при С<0 — мнимую линию. б. Чтобы построить вырожденные поверхности в трехмерном пространстве (л = 3), нужно подвергнуть параллельному переносу вдоль оси г)3 все кривые 2-го порядка на плоскости (т)!, т]2). При этом эллипс, гипербола, парабола соответственно дают эллиптический, гиперболический, пара-
10.61] § Ю.б. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 345 болический цилиндры (рис. 8). Пара прямых, пересекающихся, параллельных или слившихся, приводит соответственно Рис. 9. к паре плоскостей — пересекающихся, параллельных или слившихся (рис. 9). § 10.6. Анализ поверхности по ее общему уравнению 10.61. Мы описали все возможные типы поверхностей 2-го порядка в л-мерном евклидовом пространстве. Тип поверхности определяется по ее каноническому уравнению. Но часто поверхность задается не каноническим, а общим уравнением (19) и бывает существенно определить тип поверхности, иными словами, построить ее каноническое уравнение, не производя всех преобразований, описанных в 10.42. Оказывается, чтобы написать каноническое уравнение поверхности, заданной уравнением (19), достаточно знать следующие величины: а. Корни многочлена /z-й степени 11 а21 ат X а12 .. а22 — К . ЯЛ2 • • • . . а аЪг | Чп пп—Ь \
346 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.61 б. Коэффициенты многочлена /z-й степени ап — а21 ««1 1>1 1 « 12 a.2i — а,л Ьг • X . . • а1п Ь1 I • Чп /?2 • аПп—Ь ьп • Ъп с \ Чтобы получить явные выражения для коэффициентов этого многочлена, используем линейное свойство определителя (1.44). Каждый столбец определителя Аг (X) (кроме последнего) можно представить в виде суммы двух столбцов, первый из которых состоит из числа аГ) (/=1,2, . . ., п; j фиксировано) и числа ft., а второй — из п нулей и числа —X. Соответственно определитель Ах(X) представляется в виде суммы некоторого числа определителей, каждый из которых получается заменой некоторых столбцов (кроме последнего) в матрице «11 «21 ««1 Ьг «12 • «22 • ««2 • ь2 . ■ «1„ • «2« • «,ш • ь„ М ы Ч с на столбцы, состоящие из п нулей и одного элемента —X, причем так, что число —X оказывается на главной диагонали матрицы. Каждый из этих определителей после разложения по тем столбцам, в которых стоят числа —X, приводится к виду где k — число столбцов, содержащих элементы —X, а Ми + 1_к — некоторый минор (п -\- 1—£)-го порядка матрицы Av Этот минор характерен тем, что в нем вместе с каждой строкой матрицы Ах используется столбец этой матрицы с таким же номером и заведомо используются последняя строка и последний столбец этой матрицы. Миноры, обладающие этим свойством, мы будем называть окаймляющими. Очевидно, что каждый окаймляющий минор матрицы Ах появится в разложении определителя AX(X). Отсюда мы не-
10.62] § Ю.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 347 посредственно получаем, что коэффициент при ( — X)k в разложении определителя А1{Х) по степеням —X равен сумме всех окаймляющих миноров порядка п -j- 1—k. Разложение определителя Ах(X) удобно записать в виде Ai (М = <*,, + ! — «,А + «„-ib2— • • • + ai ( — № при такой записи коэффициент ak будет равен сумме всех окаймляющих миноров матрицы А1у имеющих порядок k. 10.62. Корни характеристического многочлена А (X), как мы уже знаем, дают нам коэффициенты при квадратах переменных в каноническом уравнении. Чтобы найти оставшийся член (нулевой степени, если каноническое уравнение имеет вид (22), или первой степени, если оно имеет вид (23)), необходимо выяснить поведение коэффициентов многочлена Аг (X) при преобразованиях координат. Рассмотрим в (п -\- 1)-мерном евклидовом пространстве Rrt+1 квадратичную форму п п А^х, х)= 2 в/*Е,Е* + 2 2Шв + 1+сЕЛ+1. (27) где l±, I 2' £м» S/l + i —координаты вектора *€R,J + 1 в некотором ортогональном нормированном базисе ev e 1' *2) :n + V Этой квадратичной форме отвечает симметричный оператор Ах, имеющий в базисе {е\ матрицу (26); мы будем обозначать эту матрицу также через Л <«?>• Наряду с этим оператором рассмотрим оператор Ех, определяемый равенствами E1ek = ek при k^.n, Elen + 1 = 0. Ему 1) с2> отвечает . . .. е следующая « + i): 1 матрица (в том же базисе Ei = (28)
348 гл. 10. формы в евклидовом пространстве [10.62 Обозначим через R„ подпространство с базисом из векторов е1у е2, . .., еп] оператор Ег в этом подпространстве, очевидно, является тождественным оператором. Пусть дано некоторое изометрическое преобразование Q в пространстве R„; оно переводит ортогональный нормированный базис еъ е2, . . ., еп в некоторый базис /ь /2, ...,/„, также ортогональный и нормированный. Построим изометрическое преобразование Qx в пространстве R„+1, полагая Qi*i=/i» Qi^2=/2» •••> Qi*n=/„> Qi^+i = ^+i=/n+i- Если матрица оператора Q Яц ?12 Q = Я21 Ягг пространстве Rn имела вид Яш Ягп Яп\ Яп2 • • • Япп то в пространстве R„+1 матрица построенного оператора Qx будет иметь вид Яц Яи ••• Ящ 0 921 ?22 • • • Чы 0 Qi = 9nl 0/i2 0 0 о 0 1 Эта матрица отвечает следующим формулам преобразования координат (8.94): ll = ?ll4l + <721Л2 + • • • + ЯпхЧп* 1 £2 = ?12Л1 + ?22Л2 + • • • + ?„2Л„> £я =?!«% +?2пЛ2+ Ьл + 1 == •+?шЛ,> л„ + 1' (29) Оператор Ах в новом базисе fv /2, ..., /л+1 имеет матрицу ^(/) = Q~M(^)Q (5.51); оператор Ех — ту же матрицу (28), что и раньше. Согласно 5.52 справедливо равенство det (Лф — ХЕг) = det(Aie) — ХЕг). Допустим теперь, что в качестве преобразования Q было выбрано то самое, которое в 10.42 приводило квадратичную
10.62] § Ю.б. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 349 форму А(х, х) = 2 aik%fek K каноническому виду /, k=\ А(х, *) = 2 М?- Из формул (29) вытекает, что преобразование Q переводит квадратичную форму (27) от п-\- 1 переменного в форму 2 Vl?+ 2 2 Л-Л/Ля+i-h ст|»+1. Матрица оператора Alt которая, как мы знаем, преобразуется одинаково с матрицей квадратичной формы, приобретает после этого преобразования следующий вид: [Ф К х о Y + 1 'i h К /,+i о /й /„ с Многочлен Дх (Я) = det (A{/) — ХЕХ) будет равен определителю К1 — 1 0 ... 0 0 ... 0 /х 0 Х2 —Я 0 0 0 —X 'г 'г+1 о /, Коэффициенты этого многочлена можно вычислить с помощью окаймляющих миноров матрицы А{/) так же, как они
350 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.63 вычислялись раньше через окаймляющие миноры матрицы А(в) = Av Заметим, что при г < п все окаймляющие миноры матрицы Aif) выше (г + 2)-го порядка заведомо обращаются в нуль, так как содержат два пропорциональных столбца. Таким образом, при г < п коэффициенты осг+3, аг+4, . .. равны нулю. Кроме того, при г < п в окаймляющих минорах (rJ-2)-ro порядка, кроме заведомо равных нулю, необходимо используются первые г строк и г столбцов матрицы A(f). В окаймляющих минорах (г+1)-го порядка могут и не использоваться эти г строк и столбцов; отметим все же два случая, когда это использование заведомо имеет место: 1) г = п\ очевидно, что у матрицы Л(« имеется единственный минор (г+1)-го, т. е. (#+1)-го порядка, совпадающий с ее определителем; он содержит все строки и столбцы матрицы А{р. 2) г <п, /г+1 = /г+: 0; кроме заведомо равных нулю, имеется один окаймляющий минор (г+1)-го порядка; он лежит в строках и столбцах с номерами 1, 2, ... .... г. /i+l. 10.63. Посмотрим, далее, как отразится на матрице оператора Ах следующий этап преобразований уравнения (19) § 10.4, имеющий целью аннулирование величин 1Ъ /2, . . ., /г. После преобразования Л1 + -^Л|»+1. П/^Л* (£ = 2> 3> 1) матрица А(р переходит в матрицу >4Ф = Кг 0 . 0 Х8 . 0 0 . 0 0 . 0 0 . 0 /х . .. 0 .. 0 .. кг .. 0 .. 0 • • к 0 0 . 0 0 0 1г+1 .. 0 .. 0 .. 0 .. 0 ... о ... /„ 0 h к 1г+1 In 1 с-1
10.63) § Ю.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 351 Операция, произведенная с матрицей Лф, может быть описана еще так: из последнего столбца вычтен первый столбец, умноженный на -^ , а затем из последней строки вычтена первая строка, также умноженная на ~ . Аналогично можно описать дальнейшие преобразования, имеющие целью аннулировать величины /2, /3, ..., 1Г\ в результате всех этих преобразований матрица Aif) переходит в матрицу Лф — i*i 0 • 0 к, . 0 0 . 0 0 . i0 0 . 0 0 . . . 0 .. 0 .. 0 .. 0 .. 0 0 . 0 . 0 . 0 . 0 . 'г + 1 • ..0 0 ..0 0 ..0 0 .. 0 /„ .. 0 /„ .. /„ с' При этих преобразованиях заведомо не изменяют свою величину те окаймляющие миноры матрицы A{f), в которых участвуют первые г строк и г столбцов этой матрицы. Рассмотрим многочлен Ь[»(к) = = а К- 0 0 0 0 0 л+г~ к 0 А о — X 0 0 0 0 -а'пХ+ . . . . ф ф .. • + 0 0 К- 0 0 0 а[(- 0 .. 0 .. к 0 .. —к .. 0 .. 'г+г ■■ -к)п. . 0 . 0 . 0 . 0 . — к ■ In 0 0 0 'r + l In с Коэффициенты этого многочлена вычисляются через окаймляющие миноры матрицы A{rf) по тем же правилам, что и коэффициенты многочлена &1(к) через окаймляющие миноры матрицы A(f). В силу доказанного выше свойства неизменности миноров (r-f2)-ro порядка (при г < п) мы получаем,
352 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.64 что сх.'г+п = аг+2; так же в двух указанных особых случаях мы будем иметь ос'г+1 = аг+1. 10.64. Рассмотрим сначала особый случай г = п. Тогда коэффициент а„+1 многочлена А[п (X) равен, очевидно, произведению Хг%2 • • • Хп с> тем самым величина с в каноническом уравнении (22) оказывается равной AjAo • • • htl Aj^At • • • Кп 10.65. Пусть теперь г < п. Определим нужный для дальнейшего коэффициент аг + 1 у многочлена А[п (X) *). Окаймляющие миноры матрицы порядка г + 2, за исключением заведомо равных нулю, имеют вид Ях 0 о я2 0 0 0 0 | 0 0 . . 0 .. 0 .. к .. 0 .. 0 0 0 0 0 L 0 0 0 1т с (/77 = ^-1-1, ...,#), и их сумма, равная коэффициенту а'г+,, — аг+2} выражается в виде — Я^ . . . Кг (/|+1 + . . . + 1\). Вспомним, что условием приводимости уравнения (19) к канонической форме (23) было наличие среди коэффициентов lk + ъ '-">1п хотя бы одного отличного от нуля. Теперь мы можем эквивалентное условие сформулировать в виде неравенства аг + 2ф0 и одновременно указать формулу для вычисления коэффициента М канонической формы (23) /1|_Л2 • • • ^Т *) Нетрудно проверить, что и у многочлена А(]/р) (X) все коэффициенты ат при т >/■ + 2 в этом случае заведомо обращаются в нуль. — Aj/u 5i /2 Агст
10.66] § 10.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕМ УРАВНЕНИЮ 353 Если же аг + 2 = 0, то 1г + 1 = 1г + 2= •••= 1п — 0 и уравнение приводится к канонической форме (22). Мы приходим здесь ко второму особому случаю. Коэффициент аг+1 = аг+1 в этом случае равен, очевидно, произведению ^2 . . . ХГС, откуда коэффициент с канонической формы (22) получается равным /\.\К-2 . . . Кг А^Ао . . . А/- 10.66. Приведем сводку полученных результатов. При этом корни ах, Я2, . . •, Хп характеристического многочлена Д (X) условимся, как и ранее, выписывать в таком порядке, чтобы сначала шли корни, отличные от нуля. Произведение XL ... Хг обозначим через Аг. Дпппьк Каноническое уравнение К г- о А„ -1 = 0 \ ап Ф 0 А„_о ^ 0 J а„-0 >.Л11 + М°1+ ■ ■ ■ +^„-1Лп-1 + Г Лп-1 1 2 , л 2 , , л 2 , ^п г\ 4-2 У -i ^-,=0 а„_ Mi + Л2т|5 + • • • + А„ _„т|«-* + т^- 1V л _ о «:« MJ+2 У -^ A,ilI+^=0 12 г. Е. Шилов
354 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.71 § 10.7. Эрмитово-квадратичные формы 10.71. Многие из теорем предыдущих параграфов переносятся на квадратичные формы в комплексном пространстве. Начнем со следующей основной теоремы: Теорема. В n-мерном унитарном пространстве Сп всякая эрмитобо-билинейная симметричная форма имеет канонический базис из п взаимно ортогональных векторов. Доказательство. Линейный оператор А, отвечающий данной эрмитово-билинейной симметричной форме А (х, у) (9.18 а) по формуле А(*,.У) = (А*, у), имеет в любом ортонормированном базисе пространства Сп ту же матрицу, что и форма А(х,у), и, следовательно, эрмитово-симметричен (a^k) = ajj\ у, k= 1, . .., п). В силу теоремы 9.34 в пространстве Сп имеется ортонормированный базис ev ...,en из собственных векторов оператора А. В этом базисе матрица оператора А диагональна; следовательно, в этом базисе диагональна и матрица формы А(х,у)\ таким образом, базис ех, ...,еп есть канонический базис формы А (х, у). Теорема доказана. 10.72. Из теоремы 10.71. следует, что всякая симметричная эрмитово-квадратичная форма А(х, х) может быть приведена к каноническому виду A(*,*)=SWI* / = 1 унитарным преобразованием. Последовательность действий, которые приводят к определению координат векторов искомого канонического базиса и чисел Ху., такова же, что в вещественном случае (10.13). 10.73. Найдем стационарные значения на единичной сфере п 2j | |у |2= 1 эрмитово-квадратичной симметричной формы /=i А (л:, х). Как мы помним из 9,156, форма А (л;, х) принимает лишь вещественные значения. Пусть е1, ...,еп — ортонор- мальный канонический базис формы А (л:, х). В этом базисе
10.74) § Ю.7. эрмитово-квлдрлтичные формы 355 мы имеем А (х, х) = 2 kj | \j I2 = 2 *у (а/ + -cj); £,. = <ту + ix/, i=i /=i Действуя по методу Лагранжа, приравниваем нулю частные производные функции А(х,х)— Х(х,х) по каждой из 2/г вещественных координат ау- и т- (у'=1, • .., п). При этом получаются уравнения 2Х;О,— 2Хо,= 0, ) 11 J \ j=\ .. п 2А,/су—2^=0, \ Эти уравнения удовлетворяются на векторе х с |л*|-=1, лишь если К совпадает с одним из значений Kv . .., Хп. Пусть К — Kk\ тогда решением служит вектор х с координатами £у. = Оу+ ix j— 0 при )фк и |£л|=1. Следовательно, как и в вещественном случае (10.21), эрмитово-квадратичная форма А (х, х) принимает стационарные значения на векторах ее ортонормального канонического базиса е;-, иными словами, на собственных векторах соответствующего эрмитово-сим- метричного оператора А. Сами значения формы в этих точках совпадают с соответствующими каноническими коэффициентами; в частности, максимум формы А (х, л;) есть наибольший из коэффициентов X., а минимум — наименьший из этих коэффициентов. 10.74. К теореме 10.72 сводится и проблема об одновременном приведении к каноническому виду двух симметричных эрмитово-квадратичных форм А(х,х) и В (л:, л:), из которых одна, например В (л;, л:), положительно определена. Именно, мы можем принять за скалярное произведение эрмитово-билинейную форму В(х,у). По теореме 10.72 существует ортонормированный (в смысле введенного ска- лирного произведения) канонический базис формы А (х, х). В этом базисе мы имеем А(*,*)=23*у|5у1а, В(*,*)=£|&у|я, что и требуется. 12*
356 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ Вычисление координат векторов искомого базиса (относительно произвольного исходного базиса) и коэффициентов Xlt ..., кп производится по тем же правилам, что и в вещественном случае (10.32). Для обоснования их следует, введя выражения |у. = ау-+ /т-, записать формы А(х,х) и В (л:, л:) в виде вещественных функций от вещественных переменных ау- и т-(у = 1, ...,#). Мы можем предоставить читателю детали этого вывода. ЗАДАЧИ 1. Привести ортогональным преобразованием к каноническому виду следующие квадратичные формы: а) 2|?+|?—Ц^-^з! б) 211 + 5|| + 5Й + 41Л*-41А*-ЧЛ»; в) 2g{ + 215 + 21^-41,1, + 21^4 + 2121з-41з14; г) 2S1S2 + 2i1e, — 2|,£4 - 21,13 + 2121., + 2|&. 2. Где располагаются при | х | = 1 стационарные значения квадратичной формы 1 2 А (х, *) = *i+y + y (* = (*i. х2, А-3)) и каковы они (минимум, максимум)? 3. Показать, что каждая из величин Uj, u2, ..., ц^ может достигать крайних границ, указанных в неравенствах 10.25 (6). 4. Квадратичные формы А (а, х) и В (х, а) называются сравнимыми, если для любого x£R выполняется неравенство А (я, я) ^ В (х, л-). Пусть Я,! ^ Я2^ ... ^ А.,,— канонические коэффициенты формы А (х, х), [.ц ^ ц2 ^нг ... ^ 1Ц — канонические коэффициенты формы В (х, х). Показать, что для любого /г (1 ^k^n) имеет место неравенство 5. Найти общую пару сопряженных направлений у кривых г2 и- 'тн-у = 1; 2x^ = 1. 6. Построить линейное преобразование, переводящее две квадратичные формы А (а:, *) = £? r-2cl52 + 2^~2?1J3-b3g5, В (х, ^) = e? + 2gife + 3g2?3-2?1H3 + 6y к каноническому виду; указать канонический вид. *) Очевидное в случае, когда формы А (х, х) и В (х, х) имеют общий канонический базис,
ЗАДАЧИ 357 7. Показать, что базис, в котором формы А (х, х) и В (х, х) записываются в каноническом виде с каноническими коэффициентами соответственно Яг, ..., Хп и vL, ..., v;/, определен однозначно с точностью до числовых коэффициентов, если все отношения Vi ' V2 ' V„ попарно различны. 8. Доказать, что середины хорд поверхности 2-го порядка, параллельных вектору y={li, Н2, ..., £„), расположены па (п—1)-мернон гиперплоскости (диаметральной гиперплоскости, сопряженной с вектором у). 9. Какие поверхности 2-го порядка в трехмерном пространстве (а*, у, г) задаются уравнениями V'2 U2 7'1 X2 U2 22 в) х = у* + г*\ г) у = х* + г*+\\ Д) У-^хг? 10. Упростить уравнения поверхностей 2-го порядка в трехмерном пространстве (х, у, z) и указать соответствующие формулы преобразования координат: а) 5.v2 + 6*/2-f7z2 — Axy + Ayz— 10* + 8y+14z — 6-0; б) х2-\-2у2 — г2+\2ху—4xz — 8yZ+\4x+\Gy— 12г — 3 = 0; в) 4x2 + y2 + 4z2 — 4xy + 8xz — 4yz — \2x — 12y-f-6z = 0. 11. Показать, что в пересечении эллипсоида с полуосями ах >s ^ я2 $> ... ^ я/г и /г-мерной гиперплоскости, проходяще»! через центр этого эллипсоида, получается эллипсоид с полуосями bl^ Ь2^ ... ^ 6Л, где
ГЛАВА И КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ § 11.1. Еще об алгебрах 11.11. Мы ввели понятие алгебры в 6.21; такое название было присвоено линейному пространству над некоторым полем К с введенной в нем операцией умножения элементов (подчиненной аксиомам 6.21, 1)—3)), коммутативной или некоммутативной. Алгебры, которые мы рассматривали в гл. 6, были в основном коммутативными. Важный пример конечномерной некоммутативной алгебры — алгебры В(К„) всех линейных операторов в пространстве Кп — мы там оставили в стороне. В этой главе мы ставим своей целью изучение алгебры В(К„) и ее подалгебр. Но будет удобнее рассмотреть вначале абстрактные конечномерные алгебры. 11.12. Не всякая алгебра обладает единицей (примером чему служит любая тривиальная алгебра, т. е. алгебра с нулевым умножением, 6.22 а). Тем не менее каждую алгебру можно дополнить до алгебры с единицей следующим стандартным образом. Пусть А — произвольная алгебра. Рассмотрим множество А+, состоящее из формальных сумм вида а-\-Х, где а£А, а X — число из поля К. Очевидно, А+ является линейным пространством с операциями (a + X)+(b+ii) = (a + b) + (X+ii) и [i (a + ^) = \xa-\-Xii, и, более того, алгеброй относительно умножения {а + X) (Ь + \х) = (ab + Xb + \ia) + X\i
11.21] § 11.2. ПРЕДСТАВЛЕНИЯ АБСТРАКТНЫХ АЛГЕБР 359 (a, b £ А; X, (.1 £ AT). Алгебра А+ заведомо обладает единицей: ею является формальная сумма нулевого элемента в А и числа 1. При этом исходную алгебру А можно рассматривать как лежащую в А + , если каждый элемент а £ А отождествить с формальной суммой а-\-0£А + . § 11.2. Представления абстрактных алгебр 11.21. Пусть А — абстрактная алгебра над полем /Си В (К) — алгебра всех линейных операторов, действуюидих в линейном пространстве К над тем же полем /<\ Будем рассматривать морфизмы алгебры А в алгебру В (К), которые в дальнейшем будем обозначать символом вида Т: А —>- В (К). а. Определение. Морфизм Т:А—^В(К) называется представлением алгебры А в пространстве К. Представление называется тривиальным, если Та = О для каждого а £ А, и тонным, если морфизм Т есть мономорфизм, т. е. для различных элементов а и b алгебры А соответствующие операторы Та и Ть различны в алгебре В (К). Совокупность всех элементов а £ А, которые представлением Т переводятся в нулевой оператор, называется ядром представления Т. Ядро тривиального представления совпадает со всей алгеброй А, ядро точного представления состоит из одного нулевого элемента алгебры. В общем случае ядро любого представления есть двусторонний идеал алгебры А (6.25 г). б. Определение. Два представления Т': А —> В (К') и Т": А —-* В (К") алгебры А называются эквивалентными, если между линейными пространствами К' и К" можно установить изоморфизм U: К' —> К" такой, что для любого а£А ига=гаи. Очевидно, в случае конечномерных пространств К' и К" эквивалентность представлений Т' и Т" означает, что в некоторых базисах пространств К' и К" операторы Т^ и Тд (а £ А) записываются одинаковыми матрицами. в. Пусть Т: А —■> В (К) — представление алгебры А. Подпространство К' в К мы будем называть инвариантным подпространством представления Т, если оно инвариантно относительно всех операторов Та, а£А. Рассматривая операторы Та лишь на К\ мы, очевидно, получим некоторое
360 ГЛ. 11. КОПКЧНОМКРНЫК АЛГКЬРЫ И АЛГЕБРЫ МАТРИЦ [П.22 новое представление Тк': А —> В (К'), которое будем называть сужением представления Т па К'. г. Пусть Т: А—^В(К) — представление алгебры А такое, что К разлагается в прямую сумму подпространств Kfe(l^&^fl), инвариантных относительно представления Т. Обозначим через Т^ сужение представления Т на Kk(\^k^n). В такой ситуации мы будем говорить, что представление Т разлагается в прямую сумму представлений Tk(\^Zk^n). 11.22. С каждой алгеброй А естественным образом связано ее некоторое представление Т: А—> В (А) в самом линейном пространстве А, которое ставит в соответствие каждому элементу а£А оператор левого умножения на я, т. е. оператор ffl, определенный равенством fab = ab для любого Ь£А. Такое представление называется левым регулярным представлением алгебры А. Очевидно, инвариантные подпространства левого регулярного представления являются левыми идеалами в А (6.23 а). С помощью этого понятия установим следующий важный результат: Теорема. Любая алгебра изоморфна некоторой подалгебре алгебры В (К) (при надлежащем выборе К). Доказательство. Как легко видеть, утверждение теоремы равносильно следующему: каждая алгебра обладает точным представлением. Пусть А — заданная алгебра. Как показано в 11.12, существует алгебра А + , обладающая единицей е и содержащая А в качестве подалгебры. Рассмотрим ее левое регулярное представление f : А+ —-* В (А + ). Поскольку для любого а £ А4', а ф 0, Тае — ае ■— а Ф 0, это представление является точным. Следовательно, сужение морфизма Т на подалгебру А в А + является точным представлением алгебры А в пространстве К —А + . Тем самым теорема доказана. § 11.3. Неприводимые представления и лемма Шура 11.31. Среди всех представлений заданной алгебры можно выделить некоторые, устроенные в определенном смысле наиболее просто. Каждое представление Т: А —-> В (К) некоторой алгебры А обладает по крайней мере двумя инвариантными подпрост-
11.33) § 11.3. НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ И ЛЕММА ШУРА 361 ранствами: самим К и его нулевым подпространством. Остальные инвариантные подпространства мы будем называть собственными. Тс из них, которые не содержат ни одного другого подпространства того же вида, будем называть минимальными инвариантными подпространствами представления Т. Определение. Нетривиальное представление Т: А —* —► В (К) называется неприводимым, если у него отсутствуют собственные инвариантные подпространства. 11.32. Пусть ;?£К — некоторый вектор; тогда, как легко видеть, множество К2~ \Taz £К'. я£А} является инвариантным подпространством представления Т. Будем называть вектор z £ К циклическим (относительно представления Т), если KZ^K. Из этого определения и определения неприводимости немедленно вытекает следующая теорема: Т е о р е м а. Представление, действующее в пространстве К, неприводимо тогда и только тогда, когда каждый отличный от нуля вектор пространства К является циклическим. Несмотря на свою простоту, этот результат окажется весьма полезным в дальнейшем. 11.33. Неприводимые представления алгебр над полем С комплексных чисел обладают следующим важным свойстзом: Теорема (л е м м а Ш ура). Пусть Т: А —> В (С) — неприводимое представление алгебры А над полем С. Тогда любой оператор в пространстве С, перестановочный со всеми операторами Та, а £ А, кратен тождественному оператору Е. Доказательство. Пусть S — оператор, перестановочный со всеми Та, а£А, и х — его собственный вектор (4.956). Тогда Sx^Xx для некоторого комплексного X и, следовательно, STax = TaSx ~ХТах для любого а£А. Но представление Т неприводимо, а значит, по теореме J J .32, любой вектор у £ С представим в виде у = Тах, а£А. Отсюда Sy — Ху для любого у £ С, что и требовалось доказать. Заметим, что при доказательстве существенно использован тот факт, что каждый линейный оператор в комплексном линейном пространстве обладает собственным вектором. В силу решающей роли леммы Шура, в дальнейшем мы ограничиваемся рассмотрением линейных пространств и алгебр только над полем комплексных чисел.
362 ГЛ. П. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.41 § 11.4. Основные типы конечномерных алгебр Начиная с этого параграфа, если специально не оговорено обратное, будут рассматриваться исключительно конечномерные алгебры (т. е. алгебры, имеющие как линейные пространства конечную размерность) над поле\у С комплексных чисел. Как устроены конечномерные алгебры и их представления? Основная часть настоящей главы будет посвящена результатам именно в этом направлении. В частности, будут выделены некоторые классы алгебр, строение которых удается изучить полностью, т. е. удается описать все такие алгебры с точностью до изоморфизма, а все их представления —с точностью до эквивалентности; именно, речь будет идти о классах простых и полупростых алгебр. Различные классы алгебр возникают при рассмотрении специфических свойств их идеалов и представлений. 11.41. Определение. Нетривиальная алгебра (6.22а) называется простой, если она не содержит собственных двусторонних идеалов. Примером простой алгебры является алгебра В(Сп) всех линейных операторов в конечномерном пространстве. Действительно, пусть J — двусторонний идеал в алгебре В (KJ и пусть Л0= \\(ijk\\ £ J — ненулевая матрица, так что, например, as ФО. Тогда, как было показано в 4.44в, операциями умножения матрицы А справа и слева на некоторые матрицы, т. е. операциями, не выводящими за пределы идеала J, можно получить матрицу Ert с единственным ненулевым элементом 1 в пересечении г-й строки и ^-го столбца при любых г и t от 1 до /г. Линейные комбинации матриц Еп дают любую матрицу Л£В(К„), откуда и следует, что J = B(KJ. Как мы увидим далее, этот пример в классе всех конечномерных алгебр над полем комплексных чисел — единственный (11.64). Теорема. Простая алгебра обладает точным неприводимым представлением. Доказательство. Пусть А — простая алгебра. Рассмотрим ее левое регулярное представление Т: А —► В (А). Из конечномерности А немедленно вытекает, что среди инвариантных подпространств представления Т имеется минимальное подпространство А'. Сужение Т представления Т на А'
11.42) § 11.4. ОСНОВНЫЕ ТИПЫ КОНЕЧНОМЕРНЫХ АЛГЕБР 363 не является тривиальным представлением; покажем это. Дл<т этого достаточно показать, что для любого Ь £ А' множество Ab={ab: а£А}ф{0}*). Пусть, напротив, АЬ = Ь. Тогда, как легко видеть, множество ЬА = {Ьа: а£ А}—двусторонний идеал в А и ввиду простоты А либо ЬА = А, либо ЬА -= {0}. Но в случае ЬА = А из АЬ = 0 вытекает, что любое произведение в А равно нулю. В случае же ЬА = {0\ множество {XbiX^C} является ввиду АЬ={0} двусторонним идеалом в А и вследствие простоты А должно совпадать со всей алгеброй. Таким образом, в обоих случаях алгебра А оказывается тривиальной, а значит, не может быть простой. Итак, представление Т: А—^В(А') не является тривиальным. Но тогда, во-первых, оно ввиду минимальности непрп- водимо, а во-вторых, его ядро, будучи отличным от всей простой алгебры ее двусторонним идеалом, состоит из одного нуля. Поэтому всякое неприводимое представление является одновременно и точным, что и доказывает теорему. На самом деле имеет место и обратная теорема, т. е. конечномерная алгебра, имеющая точное неприводимое представление, проста. Это будет показано в конце 11.64. 11.42. Произвольная алгебра может и не иметь точных неприводимых представлений. Однако естественно выделить те алгебры, свойства которых могут быть описаны в терминах их неприводимых представлений. Мы приходим к следующему классу алгебр, более широкому чем класс простых алгебр: Определение. Алгебра называется полупростой, если для каждого ее элемента, отличного от нуля, существует неприводимое представление, отображающее этот элемент в отличный от нуля оператор. Иными словами, в полупростой алгебре пересечение всех ядер ее неприводимых представлений состоит из одного нуля. В силу теоремы 11.41 всякая простая алгебра является и полупростой. С другой стороны, рассмотрим коммута- *) Следующее ниже простое доказательство этого факта предложено А. С. Немировским.
364 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (П.43 тивную л-мерную (л > 1) алгебру Сп из элементов а~(а1у ... , ап), где ау£С, с покоординатным умножением. Эта алгебра коммутативна; множество тех a=(ai} ... , aj, для которых, например, а^О, представляет ее (двусторонний) идеал, так что алгебра Сп не простая. Приводя в соответствие элементу а — (а1, . .., (хп)п комплексное число afi(\^.k^.n) (или, что то же, оператор умножения на число ak в одномерном пространстве С\), мы получаем неприводимое представление алгебры Сп, которое переводит не в нуль любой элемент алгебры Сп с <хкфО. Так как у любого элемента алгебры Сп имеется хотя бы одна ненулевая координата, то для любого элемента алгебры Сп имеется и неприводимое представление, переводящее этот элемент в ненулевой оператор. Таким образом, алгебра Сп полупростая. В этом примере алгебра Сп есть прямая сумма простых (одномерных) коммутативных алгебр. Легко можно его обобщить, рассмотрев прямую сумму простых некоммутативных алгебр; и тогда, как мы покажем ниже (77.77), мы получим общий вид полупростой конечномерной алгебры над полем комплексных чисел. 11.43. Алгебры, в определенном смысле противоположные по своим свойствам полупростым алгебрам, выделяются следующим образом. Определение. Алгебра называется радикальной, если каждое ее нетривиальное представление обладает собственным инвариантным подпространством. Иными словами, у радикальных алгебр вообще отсутствуют неприводимые представления. В качестве примера рассмотрим алгебру А из многочленов р (z) — dxz -\- ... -\-dnztl с обычными операциями, но с условием zn+1 — 0. Тогда и каждый элемент алгебры А, возведенный в (/z -}- 1 )-ую степень, равен 0, так что все ее элементы необратимы. Алгебра А не имеет нетривиального одномерного представления, поскольку всякий ненулевой линейный оператор в одномерном пространстве обратим. Пусть Т — нетривиальное (следовательно, неодномерное) представление алгебры А и Z — оператор, соответствующий элементу z. Так как Z (вместе с z) необратим, то имеется вектор е, для которого Ze = 0. Но тогда и p(Z)e — 0 при
11-51 § 11.5. ЛЕВОЕ РЕГУЛЯРНОЙ ПРЕДСТаВЛЕНИЕ 365 любом p(z)£A. Таким образом, у представления Т нашлось нетривиальное инвариантное подпространство (прямая, определяемая вектором в). Мы видим, что алгебра А радикальная. 11.44. Определение. Пусть А — произвольная алгебра. Тогда радикалом алгебры А называется пересечение всех ядер неприводимых представлений алгебры А, если последние имеются, пли вся алгебра А, если они отсутствуют. Так как ядро каждого представления есть двусторонний идеал алгебры А (11.21а), то и радикал, как пересечение некоторых двусторонних идеалов, также, очевидно, является двусторонним идеалом алгебры А. Изучение алгебр с нетривиальным радикалом (в частности, радикальных) вызывает существенные трудности, и результаты, как правило, не носят окончательного характера; некоторые из них мы приведем в конце главы. Напротив, полупростые алгебры и их представления удается исследовать полностью; их изучение, как мы увидим в дальнейшем, сводится к изучению простых алгебр. К подробному рассмотрению простых алгебр, а также их представлений мы сейчас и переходим. § 11.5. Строение левого регулярного представления простой алгебры 11.51. Итак, пусть А — простая алгебра. Зафиксируем ее некоторое точное неприводимое представление Т: А -> В(Х) (оно существует согласно теореме 11.41). В дальнейшем это представление мы будем называть стандартным. Теорема. Пусть Т: А •-+ В (А) — левое регулярное представление простой алгебры А, I — минимальное инвариантное подпространство представления Т. Тогда а) сужение Т1 представления Т на I эквивалентно Т, б) подпространство I, рассматриваемое как подалгебра в А, обладает правой единицей. Зафиксируем некоторый элемент а £ I, афО. Поскольку представление Т точно, Тах Ф О для некоторого х £ X. Рассмотрим линейный оператор U:I-*X, определенный равенством 11Ь~Тьх для любого Ь£\.
366 ГЛ. 1 1. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.52 Ядро оператора U является, как легко видеть, левым идеалом в А или, что то же самое, инвариантным подпространством представления Т, содержащимся в I и не совпадающим с ним. Следовательно, ядро U состоит лишь из нулевого элемента. С другой стороны, образ U является, очевидно, отличным от нуля инвариантным подпространством неприводимого представления Т и поэтому совпадает со всем X. Итак, U — изоморфизм I на X. Кроме того, для любых b£\ ис£А m\b = U (cb) = ТсЬх = Тс (Тьх) = Тги,; следовательно, UTC — Tt.U. Тем самым доказано, что представления Т и Т эквивалентны. Далее, поскольку U отображает I на все X, существует е £1 такой, что Ue = Тех — х. Отсюда для любого Ь £ I U (be) =Tbex = Tb(Tex)Tbx = Ub. Но U — взаимно однозначное отображение; следовательно, be = b. Таким образом, е — правая единица в алгебре I, что и завершает доказательство теоремы. Заметим, что в качестве стандартного представления мы могли бы взять любое неприводимое представление простой алгебры. Поэтому автоматическим следствием доказанной теоремы является тот факт, что все неприводимые представления простой алгебры эквивалентны. 11.52. Лемма. Пусть А — произвольная алгебра, 1х и 12 — ее левые идеалы, обладающие правыми единицами соответственно ех и е'2, причем ае1=0 для любого а £ 12. Тогда в 12 существует правая единица е2 такая, что Ье2 = 0 для любого b £ \v Положим е2=е2— ехе\. Тогда для любого а £ 12 мы будем иметь ае2 — ае2 — аехе\— а ввиду соотношений ае'2 = а и ае1 — 0. Далее, для любого b £ Ix имеют место равенства be2 = be'2— be1e'2 = be2 — be2—0, что и доказывает лемму. 11.53. Теорема. Левое регулярное представление простой алгебры разлагается в прямую сумму ее неприводимых представлений.
11.54] § 11.5. ЛЕВОЕ РЕГУЛЯРНОЕ ПРЕДСТАВЛЕНИЕ 367 Искомый набор минимальных инвариантных подпространств представления Т: А—^В(А) будем строить индуктивно, доказывая на каждом шаге, что прямая сумма уже найденных подпространств обладает, как алгебра, правой единицей. В качестве первого подпространства зафиксируем любое минимальное инвариантное подпространство 1х представления Т. Согласно теореме 11.52 1х обладает правой единицей е1. Пусть теперь найдены минимальные инвариантные подпространства 1х, ..., 1^ такие, что левый идеал Ук = Ix -f- + •••+!* обладает правой единицей ek. В случае J'k= A искомые инвариантные подпространства уже построены. В противном случае положим S'k— [a£A: aek = 0}. Как легко видеть, Ук— инвариантное подпространство представления Т, имеющее нулевое пересечение с Ук. Более того, поскольку любой элемент а£А представим в виде а = aek -\-(a — aek), где аек^Ук и (a — aek)£J"k, алгебра А разлагается в прямую сумму Ук и Ук. Конечномерное инвариантное подпространство Ук содержит некоторое минимальное инвариантное подпространство; обозначим его Ife + 1. Идеал \k + 1 обладает согласно теореме 11.52 правой единицей e'k+l; при этом, поскольку \k + 1^S'k, aek = 0 для любого a£\k + 1. Следовательно, по лемме 11.52 в \k + 1 существует такая правая единица e"k, что be"k — 0 для любого а £ Ук. Положим ek + 1 = ek-\-e"k; тогда, как легко видеть, ek + 1— правая единица в идеале J^+1 — 13 + . . . + \k-\- Ift + 1. Тем самым доказана законность индуктивного перехода от k к k+\. Алгебра А конечномерна, поэтому на некотором шаге мы получим набор минимальных инвариантных подпространств 1Х, ..., \т представления Т, дающих в прямой сумме всю алгебру А. Следовательно, левое регулярное представление алгебры А разлагается в прямую сумму ее неприводимых представлений, что и требовалось доказать. 11.54. Заметим, что попутно нами установлено наличие в простой алгебре правой единицы. В действительности имеет место более сильная теорема: Теорема. Простая алгебра обладает единицей.
368 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.61 Пусть А —простая алгебра и е — ее правая единица. Рассмотрим оператор Т^, в стандартном представлении Т: А—*В(Х). Для любых х £ X и а £ А Та (Твх - х) = Таех — Тах = 0. Следовательно, поскольку Т неприводимо и каждый ненулевой вектор обязан быть циклическим, мы получаем, что Тех — х — 0 для любого х £ X; иначе говоря, Т^ —тождественный оператор в пространстве X. Но тогда ТДТ^ — ТеТа = —- Та для любого а£А, а значит, ввиду точности представления Т и ае^ еа = а. Отсюда е — единица в А, и теорема доказана. § 11.6. Структура простых алгебр В этом параграфе до конца будет решен вопрос о строении простых алгебр. Для этого окажется весьма полезным следующее понятие. 11.61. Пусть X — линейное пространство, А0 — некоторая подалгебра в В(Х). Подмножество в В(Х), состоящее из операторов, перестановочных со всеми операторами из А0, мы будем называть коммутатором алгебры А0 и обозначать через А0. Как легко видеть, множество А0 само образует подалгебру в В(Х). Коммутатор этой новой подалгебры мы будем обозначать через А0 и называть вторым коммутатором алгебры А0. Очевидно, А0 с=: А0. 11.62. В произвольной алгебре А каждый элемент а£А определяет два оператора из В(А): оператор левого умножения Та, действующий по формуле Tub — ab, и оператор правого умножения Ra, задаваемый равенством Rab — ba. Операторы левого умножения, равно как и операторы правого умножения, образуют, как легко видеть, две подалгебры в В (А); обозначим их соответственно через А10 и AJ. Лемма. Пусть алгебра А обладает единицей. Тогда
II-63] § 11.6. СТРУКТУРА ПРОСТЫХ АЛГЕБР 369 Возьмем S£A(,, тогда для любых а, Ь£А имеет место равенство S (ab) = STab = TaSb --= a (Sb). Положив b — e, где е — единица в А, получим Sa~aS(e). Следовательно, оператор S является оператором умножения справа на элемент SegA, т. с. SgAJ,. Таким образом, А10 с: AJ и, поскольку обратное включение очевидно, А{, —AJ. Равенство Ar0 — Aj доказывается совершенно аналогично. 11.63. Теорема. Пусть А — простая алгебра, А0 — алгебра операторов ее стандартного представления Т: А—*В(Х). Тогда А0 = А0. Определенную выше алгебру AJ можно, очевидно, рассматривать как алгебру операторов левого регулярного представления Т: А—*В(А) алгебры А. Согласно теореме 11.53 это представление разлагается в прямую сумму некоторых неприводимых представлений Т1»: А —+ В(\{) (1 ^ / ^ т), причем, по теореме 11.51, каждое из этих представлений эквивалентно стандартному. Сказанное означает следующее: можно найти такой базис хъ ..., хп в пространстве X и такой базис f{j\ ..., flp в каждом из пространств 1-(1^Сг^/я), что для любого а£А матрица оператора Та в базисе flf\ f(2l\ ..., /Цп) всего пространства А имеет вид т" I ' tJ где в блоках по диагонали стоит матрица оператора Та в базисе хъ ..., xtn а в остальных местах — нули. Из правила перемножения матриц вытекает, что матрицы, Перестановочные со всеми матрицами вида (1), суть матрицы Т =
370 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.64 вида 5 = 11 '1/л $т1 (2) где в блоках (размера пхп) расположены матрицы, перестановочные со всеми матрицами Та, а£А. Рассмотрим теперь оператор Р £ А0 и его матрицу Р в базисе хг, ..., хп. Тогда, очевидно, матрица Р Р Р = перестановочна со всеми матрицами вида (2) и, следовательно, задает в базисе f(^\ f£\ ..., /^m) пространства А оператор, принадлежащий второму коммутатору алгебры А^. Простая алгебра по теореме 11.54 обладает единицей. Следовательно, согласно лемме 11.62 A*0 = AJ = Ao, а значит, матрица Р задает в базисе /[г\ /£\ . .., /^от) оператор Р, равный fb для некоторого Ь£А. Но тогда для того же Ь Р = Т, поэтому Р принадлежит алгебре А0. Поскольку Р — произвольный элемент из А0, теорема доказана. 11.64. Теперь мы в состоянии получить основную теорему о простых алгебрах. Теорема. (Первая структурная теорема.) Всякая простая алгебра изоморфна алгебре всех линейных операторов, действующих в некотором конечномерном пространстве. Пусть А — простая алгебра, Т: А—^В(Х) — ее стандартное представление. Достаточно показать, что алгебра А0 операторов представления Т совпадает с В(Х). Поскольку представление Т неприводимо, из леммы Шура немедленно следует, что коммутатор А0 алгебры А0 состоит из операторов, кратных тождественному. Но тогда второй коммутатор А0 совпадает со всей алгеброй В(Х). В то же
11.71) § 11.7. СТРУКТУРА ПОЛУПРОСТЫХ АЛГЕБР 371 время по теореме //.63 А0 — А0. Следовательно, А0=В(Х), что и требовалось доказать. Обратим внимание на следующее обстоятельство: в основе всех рассуждений, которые привели к первой структурной теореме, лежит лишь тот факт, что всякая простая алгебра обладает точным неприводимым представлением. Следовательно, мы одновременно доказали и то, что любая алгебра, обладающая точным неприводимым представлением, изоморфна алгебре В(Х). Отсюда уже немедленно вытекает, что имеет место теорема, обратная к теореме 11.41: всякая алгебра, обладающая точным представлением, является простой. § 11.7. Структура полупростых алгебр 11.71. В этом параграфе будет показано, что вопрос о строении полупростых алгебр полностью сводится к уже изученному вопросу о строении простых алгебр. Для этого окажется полезным ввести несколько новых понятий. Определение. Нормальным рядом алгебры А называется цепочка алгебр А = 10 э ^ 2 . . . Э 1п Э In + i= (0), в которой каждая из алгебр является двусторонним идеалом предыдущей. Композиционным рядом алгебры называется такой ее нормальный ряд, в котором каждый из этих идеалов является максимальным (т. е. не содержащимся ни в каком более широком двустороннем идеале), а алгебра \п не содержит собственных двусторонних идеалов. Легко показать, что каждая конечномерная алгебра обладает композиционным рядом. Действительно, среди двусторонних идеалов конечномерной алгебры А существует максимальный; обозначим его \х. По тем же причинам алгебра 1Х содержит максимальный двусторонний идеал 12, 12 — идеал 13 с теми же свойствами и т. д. Поскольку исходная алгебра А конечномерна, через конечное число шагов мы придем к некоторой алгебре 1п, уже не имеющей собственных идеалов. Таким образом, полученная цепочка А = 10з11з ... з1йз1и + 1 = (0) является, очевидно, композиционным рядом алгебры А.
372 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ II АЛГЕБРЫ МАТРИЦ [П.72 11.72. Прежде чем перейти к специальным свойствам нормальных и композиционных рядов полупростых алгебр, докажем вспомогательное утверждение. Лемма. Для любого элемента а полупростой алгебры А существует элемент Ь £ А такой, что любая степень элемента Ьа отлична от нуля. Доказательство. Согласно определению полупростой алгебры существует неприводимое представление Т: А—*В(Х) такое, что ТафО. Тогда для некоторого х £ X, хфО, вектор у — Тах отличен от нуля и, следовательно, является циклическим вектором неприводимого представления Т (11.32). Поэтому найдется элемент Ь£А такой, что ТьУ~х1 а значит, ТЬах — Ть (Тах) — Тьу -~х. Это означает, что никакая степень оператора Т6д, а следовательно, и элемента Ьа£А не может равняться нулю, что и доказывает лемму. 11.73. Теорема. Нормальный ряд полупростой алгебры не содержит отличных от нуля тривиальных алгебр. Доказательство. Пусть А — полупростая алгебра; А = 10з112 ... 3ln2lH + 1 = (0) — ее нормальный ряд. Не теряя общности, можно предположить, что алгебра \п содержит элемент а, отличный от нуля. Для доказательства теоремы, очевидно, достаточно найти с £ \п такой, что сафО. По лемме 11.72 существует Ь£А такой, что любая степень элемента Ьа отлична от нуля. Положим clt = (ba)2'"~1b (k = О, 1, . . ., п— 1). Индукцией по k доказать, что ck £ \k_v Действительно, для k — О c0^=bab £ Ix ввиду того, что «£lx, а возможность индуктивного перехода немедленно вытекает из очевидного соотношения ck + l = ckack и того факта, что Таким образом, доказано, что элемент с = сп_1 принадлежит алгебре 1„. Но са = (ba)2n~l~l ba= фа)2'1'1 ф 0. Тем самым теорема доказана. 11.74. Докажем еще несколько простых утверждений. Л е м м а. Пусть А ^ 1х =2 12 =>0—нормальны ряд алгебры А, причем алгебра 12 проста. Тогда 12 является двусторонним идеалом в А. Доказательство. По теореме 11.54. алгебра 12 обладает единицей е. Поскольку е £ 1Ь для любого а£А
11-77) § 11.7. структура полупростых алгебр 373 элементы ае и еа принадлежат 11. Но тогда для любого ft£I2 ab = a (eb) = (ае) ft £ I2 и ba — (be) a = b (еа) £ I2, что и доказывает лемму. 11.75. Лемма. Пусть А — произвольная алгебра, I — ее двусторонний идеал, обладающий единицей. Тогда в А есть двусторонний идеал J такой, что А разлагается в прямую сумму I и J. Положим J^{a£A: ае = 0}, где 6? — единица алгебры I. Очевидно, J — левый идеал в А, причем, поскольку b ----= be -L + (ft— be) и ft — /?e? £ J для любого b £ А, имеет место разложение A = I -j-J. Осталось доказать, что J — правый идеал в А. Для любых а £ J и ft £ A aft = aft? -f a (ft — fte). Поскольку /)pgl, be. — ebe, а значит, поскольку #е — О, a/?? — (ае) be = 0. Таким образом, ab—a(b — fte), а следовательно, ab является произведением двух элементов из J. Тем самым aftgJ, и лемма доказана. 11.76. Лемма. Пусть алгебра А разлагается в прямую сумму своих двусторонних идеалов 1 и J, причем I — максимальный двусторонний идеал в А. Тогда алгебра J не содержит собственных двусторонних идеалов. Пусть J' — двусторонний идеал в J, не совпадающий с J. Тогда алгебра J"- 1 — J' является двусторонним идеалом в А. Но I максимален; следовательно, J" = I. Отсюда J' = (0), и лемма доказана. 11.77. Сформулируем, наконец, основную теорему о строении полупростых алгебр. Теорема. (Вторая структурная теорема.) Всякая полупростая алгебра разлагается в прямую сумму своих двусторонних идеалов, каждый из которых является простой алгеброй.
374 ГЛ. 1 1. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.77 Доказательство. Пусть А — полупростая алгебра. Как показано в 11.71, для нее можно построить композиционный ряд A=I0Dl1D...DlwDl„ + 1 = (0). Наша теорема, очевидно, содержится как частный случай в следующем утверждении: (*) Для любого k, O^k^n, алгебра \n_k разлагается в прямую сумму своих двусторонних идеалов, являющихся простыми алгебрами, и, кроме того, обладает единицей. Утверждение (#) мы будем доказывать индукцией по k. Алгебра \п не содержит собственных двусторонних идеалов и, согласно теореме 11.73, отлична от тривиальной. Следовательно, алгебра \п проста и, в частности, обладает единицей. Это доказывает утверждение (*) для k = 0. Пусть теперь наше утверждение справедливо для некоторого k, O^k^n—1. Это означает, в частности, что алгебра \n_k содержит единицу, а следовательно, по лемме 11.75, \n_k_1=z \n_k-\- J для некоторого двустороннего идеала J B K-k-i- Поскольку \п_к — максимальный двусторонний идеал в Ьг-л-i алгебра J согласно лемме 11.76 не содержит собственных двусторонних идеалов. В то же время, применив теорему 11.73 к нормальному ряду А=10з 1хз ... dIm.mdJd(0), мы получим, что эта алгебра не является тривиальной. Следовательно, она проста. По индуктивному предположению, алгебра \tl_k разлагается в прямую сумму своих простых подалгебр, являющихся в ней двусторонними идеалами. Обладая единицей, эти же подалгебры согласно лемме 11.74 являются двусторонними идеалами также и в \n_k_v Из этого факта и равенства 1„_л_1 = I„_^ + J немедленно следует, что требуемое разложение в прямую сумму простых подалгебр имеет место и для алгебры \n_k_1. Осталось доказать существование единицы у алгебры 1„_/г-1- Пусть ех — единица алгебры \п_к (она существует согласно индуктивному предположению), а е2 — единица простой алгебры J. Поскольку ab= ba = 0 для любых а£\п_к,
П.78] § 11.7. структура полупростых алгкбр 375 b = J, элемент е — е1-\- е2 является, как легко видеть, единицей во всей алгебре \n_k_l. Таким образом, доказана законность индуктивного перехода, а с ней и все утверждение (*). Как уже отмечалось, наша теорема является частным случаем этого утверждения, именно, при к —п. Тем самым она доказана. Заметим, что мы одновременно установили тот факт, что всякая полупростая алгебра обладает единицей. Найденные в теореме двусторонние идеалы, дающие в прямой сумме заданную полупростую алгебру А, мы будем в дальнейшем называть простыми составляющими алгебры А. 11.78. В 11.64 было выяснено, что всякая простая алгебра изоморфна алгебре В(Х) для некоторого конечномерного пространства X, или, что то же самое, алгебре всех квадратных матриц некоторого размера. Пусть теперь Х1? ..,, Хп— некоторый набор конечномерных пространств. Обозначим через В(ХХ, ..., Х;|) множество всех строк вида а = (а1у . . . , ап), где ak — оператор из алгебры B(Xk) (или, если угодно, матрица соответствующего размера). Очевидно, B(Xt, . . ., Хп) является алгеброй относительно (покоординатных» операций, определяемых равенствами fl-г ft = («! + *!, . . ., an + bn)t Xa^(Xaly . . ., Кап), ab^{axbx, . . ., anbn)y где a, b £ В (Х1? . . ., Х„), а - (аъ . . ., ап), b = (bi} . . ., bn)y X—комплексное число. С учетом сказанного теорема 11.77 допускает следующую эквивалентную формулировку: Всякая полупростая алгебра изоморфна алгебре В (Xv . . ., Хп) для некоторого набора пространств Xv . . ., Х„. Заметим еще, что простые составляющие алгебры В (Хь . . ., Хп) состоят, очевидно, из строк вида (0, ..., О, ak, 0, ..., 0), где /г-я координата пробегает всю алгебру В (Хд,), а на остальных местах — нули; мы будем каждую такую составляющую отождествлять с соответствующей алгеброй В(ХЛ).
376 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.79 11.79. В заключение этого параграфа мы найдем все двусторонние идеалы полупростой алгебры. Т с о р е м а. Всякий двусторонний идеал полу простой алгебры представляет собой прямую сумму некоторого числа ее простых составляющих. Пусть А — полупростая алгебра; тогда согласно 11.78 она изоморфна некоторой алгебре вида В(ХХ, . . ., Хп) с простыми составляющими B(Xfe), 1^С&^я. Пусть теперь I — двусторонний идеал в В(Х1ч . ..,Х;|). Обозначим через \k пересечение I с B(Xk). Поскольку вместе с каждым элементом а = (аЛ, ...,ак_ъ ак, ak + v ...,#„), я £ I, идеал I содержит и строку аек = (О, . . ., 0, ak% О,. . ., 0), где ek — единица вВ(Х^), имеет место разложение в прямую сумму: I =\х -|- . . . 4- \п. Но для любого k, l^&^/z, \k как легко видеть, есть двусторонний идеал в простой алгебре B(Xfe); следовательно, либо \k = (0), либо \k совпадает со всей B(Xk). Отсюда непосредственно вытекает наше утверждение. § 11.8. Строение представлений простых и полупростых алгебр Знание структуры изученных типов алгебр позволяет без особого труда найти все их представления с точностью до эквивалентности. 11.81. Пусть А — полупростая алгебра; ввиду доказанного в предыдущем параграфе ее можно отождествить с алгеброй В(ХХ, ..., Х;|) для некоторого набора пространств Хк, 1^ ^/г^С/z. Поэтому вместе с заданной алгеброй А естественным образом возникают п ее представлений Tk\ A—+B(Xk), l^&^/z, действующих но формуле T*=afe£B(Xfe) для любого а £ A, a~(aly ...,ak, ...,atl). Поскольку образом представления Tk является вен алгебра В(Х^), все эти представления неприводимы. Теорема. Всякое неприводимое представление полу простой алгебры А эквивалентно одному из представлений Tk (1<Л</|). Доказательство. Пусть А =^ В (Хг, ..., XJ-—полупростая алгебра; Т: А-^В(Х) — ее неприводимое представление. Рассмотрим ядро Z (Т) представлении Т. Будучи дву-
11.82) § 11.8. простык и полупростык алгкбры 377 сторонним идеалом в А, это ядро по теореме 11.79 является прямой суммой нескольких простых составляющих алгебры А. Обозначим через А, прямую сумму остальных, не вошедших в Z (Т) простых составляющих алгебры А, через Т(1): А1 —-> В(Х) — сужение на А1 исходного представления Т. Новое представление Т(1) уже является точным и, поскольку образы представлений Т(1) и Т, очевидно, совпадают, является неприводимым. Алгебра А1, имея представление такого вида, должна быть простой (11.64). Следовательно, она сводится к одному лишь прямому слагаемому, т. е. совпадает с В (Xk) для некоторого k, l^fr^/z. Отсюда, как легко видеть, для любого а £ А, а ----- (av . . ., ak, . . ., а/;), Тв-Т<о акеВ(Хк). Согласно теореме 11.51 все неприводимые представления простой алгебры эквивалентны; в частности, эквивалентны Т(1): B(Xfe)—^В(Х) и тождественное представление Т(2): В(ХД>)—>B(Xk). Это означает существование изоморфизма U: X —-*■ X. такого, что UT(l>--T<2)U для любого ak£B(Xk). Но по доказанному Та^Т^[) для любого а £ А; с другой стороны, из определения представления Тк следует, что Т£ ™ГП2). Отсюда UTa---T*U для любого а £ А, что и доказывает эквивалентность представлений Т и Т*. 11.82. Перейдем к произвольным представлениям простых и полупростых алгебр. Окажется полезным следующее утверждение общего характера. Л е м м а. Пусть А — произвольная алгебра, Т: А —* В (X) — ее представление, Xfe, 1^&^я, — минимальные инвариантные подпространства представления Т такие, что их линейная оболочка совпадает с X. Тогда X является прямой суммой нескольких подпространств из этого набора. Пересечение инвариантных подпространств представления само является инвариантным подпространством. Поэтому из минимальности заданных подпространств следует, что для любого k пересечение подпространства Хл.н1 с линейной оболочкой предшествующих подпространств Хг, Х^ есть либо само Xfe + ], либо нуль. Таким образом, последовательно выбирая из подпространств Х^ те, которые не содержатся в линейной оболочке предыдущих, мы получим подпространства,
378 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.83 дающие в прямой сумме всю линейную оболочку подпространств Хл, 1 ^/е^я, т. е. все X. Тем самым лемма доказана. 11.83. Согласно второй структурной теореме всякая полупростая алгебра А изоморфна некоторой алгебре вида В (Хь . ..,ХИ). В дальнейшем нам будет удобно рассматривать реализацию алгебры В (Хь . . ., Хп) в виде алгебры строк из п матриц соответствующей размерности. Для элемента я £ А число, стоящее на <■:/, у-м» месте в Л-й матрице соответствующей строки, мы будем обозначать через Xffl (a). Через e^f будем обозначать тот элемент алгебры А, для которого Щ)(е$))=\, а все остальные места в матрицах соответствующей строки заполнены нулями. Заметим, что 2^-/} = ^, где е — единица алгебры А. /, k Лемма. Пусть Т: А—► В (X) — представление полупростой алгебры А. Пусть, далее, для некоторого х £ X и некоторых индексов i и k вектор у = ТефХ отличен от нуля. Тогда у принадлежит некоторому минимальному инвариантному подпространству представления Т. Доказательство. Положим Y={Tay: a£A}. Поскольку y — Te(k) х, из правила перемножения матриц следует, что любой элемент zx£Y имеет вид z1 = Tbx, где Ъ — некоторая линейная комбинация элементов е(ц (i и k фиксированы). Достаточно показать, что в случае гфО вектор zL—циклический вектор в сужении представления Т на Y. Пусть z2£Y: z2 = Tcx, где с—другая линейная комбинация тех же элементов. Используя реализацию алгебры А в виде алгебры строк матриц, найдем элемент а£А такой, что c = ab. Но тогда z2 = Тсх = Та (Tbx) = Tazv Таким образом, вектор zx циклический, и лемма доказана. 11.84. Теорема. Всякое представление полу простой алгебры разлагается в прямую сумму неприводимых представлений и тривиального представления. Пусть А — полупростая алгебра, Т°: А—^В(Х0) —ее представление. Рассмотрим оператор Т°е, где е — единица в А. Для любого х £ Х° равенство X — 1 qX -у- \Х — 1 еХ)
11.85] § 11.8. ПРОСТЫЕ И ПОЛУПРОСТЫЕ АЛГЕБРЫ 379 определяет, очевидно, разложение Х° в прямую сумму подпространств X и Х0, инвариантных относительно Т°, причем сужение представления Т° на Х0 является тривиальным представлением. Нам осталось доказать, что представление Т: А—► В (X) — сужение представления Т° на X — разлагается в прямую сумму неприводимых. Выберем в X базис х1у ...,хт. Оператор Те — тождественный оператор в X, поэтому ввиду равенства е = '£\е$) линейная оболочка векторов вида Т </&> х,- (по всем возмож- и J ным индексам /, у, k) совпадает со всем X. По лемме 11.83 каждый отличный от нуля вектор такого вида лежит в некотором минимальном инвариантном подпространстве представления Т. Итак, мы находимся в условиях леммы 11.82. Но тогда пространство X разлагается в прямую сумму минимальных инвариантных подпространств представления Т, и, следовательно, само Т разлагается в прямую сумму неприводимых представлений. Тем самым доказательство теоремы закончено. 11.85. Теоремы 11.81 и 11.84 вместе описывают с точностью до эквивалентности все представления полупростых (в том числе и простых) алгебр. Полученный результат показывает, в частности, что операторы заданного представления простой алгебры (этот случай мы выделяем для большей наглядности), записываются в некотором базисе матрицами вида М 0 • 1 о м 0 0 0 где М пробегает всю совокупность матриц соответствующего размера. В более общем случае полупростой алгебры
380 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (П.86 соответствующие матрицы суть матрицы вида 0 м, м> ль (4) о где стоящие в блоках матрицы Mv ...,Mk, ... пробегают независимо друг от друга всю совокупность матриц соответствующего размера (вообще говоря, разного для разных матриц). 11.86. Попутно нами получено описание всех простых и полупростых матричных алгебр, т. е. алгебр, которые сами состоят из матриц. Действительно, поставив в соответствие каждой матрице из такой алгебры задаваемый ею оператор (в любом базисе), мы получим тем самым точное представление этой алгебры. Отсюда с учетом предыдущих рассуждений немедленно вытекает следующее утверждение: Всякая простая (соответственно полупростая) матричная алгебра состоит из матриц вида Р'1 LP, где Р—некоторая фиксированная невырожденная матрица, a L пробегает совокупность матриц вида (3) (соответственно вида (4)). Для алгебр с единицей результат получается еще более точным: Всякая простая матричная алгебра с единицей состоит из матриц вида P~1LP, где Р—фиксированная невырожденная
11-91! § 11.9. НЕКОТОРЫЕ ДАЛЬНЕЙШИЕ РЕЗУЛЬТАТЫ 381 матрица, a L — пробегает совокупность всех матриц вида МО ... О О М ... О О О М где М пробегает всю совокупность матриц соответствующего размера. Всякая полупростия матричная алгебра с единицей состоит из матриц вида P~1LP. где Р —фиксированная невырожденная матрица, a L пробегает совокупность всех матриц вида A1L О ... О О О МЛ Mk О О О ... Мг где матрицы Л1г, Мк пробегают независимо друг от друга всю совокупность матриц соответствующих размеров. § 11.9. Некоторые дальнейшие результаты Итак, мы закончили описание простых и полупростых конечномерных алгебр, а также их представлений. Дальнейшее исследование конечномерных алгебр уже выходит за рамки настоящей главы. Тем не менее полезно для перспективы привести некоторые известные факты в этом направлении. 11.91. Теорема В с д д с р б е р н а. Всякая конечномерная алгебра разлагается, как линейное пространство, в прямую сумму своего радикала и некоторой полупростой подалгебры (см., например, Н. Джекоб сон, Теория колец, ИЛ, 1947, стр. 220).
382 ГЛ. П. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [П.92 11.92. Радикал конечномерной алгебры состоит только из нильпотентных элементов. Более того, для каждой такой алгебры существует натуральное п такое, что произведение любых п элементов ее радикала равно нулю (см., например, Н. Г. Чеботарев, Введение в теорию алгебр, Гостех- издат, 1949, § 8). 11.93. Всякое представление радикальной алгебры записывается в некотором базисе матрицами с нулями на главной диагонали и ниже ее. (При этом, конечно, не утверждается, что матрицы операторов представления пробегают всю совокупность матриц такого вида; см., например, А. Я. Xе- лем с к и й, Об алгебрах нильпотентных операторов и связанных с ними категориях, Вестник МГУ, 1963, № 4, стр. 49—55.) ЗАДАЧИ 1. Доказать, что всякий левый идеал алгебры В (К„) есть совокупность всех операторов, нуль-многообразие которых содержит некоторое подпространство К' CZ К„. 2. Доказать, что всякий правый идеал I алгебры В (К„) есть совокупность всех операторов, область значений которых лежит в некотором подпространстве К' а К„. 3. Указать все максимальные и минимальные левые и правые идеалы алгебры В (Кл). 4. Для всякой полупростой алгебры В линейных операторов над пространством С„ ввести в Сп скалярное произведение так, чтобы из А£В следовало А*£В. 5. (Обращение задачи 4.) Если для некоторой алгебры В линейных операторов над пространством С,, существует такое скалярное произведение (х, у) в С„, что из А£В следует А*£В, то алгебра В полупростая. 6. Если, при выполнении условий задачи 5, коммутатор В (11.61) пересекается с самой алгеброй В лишь по операторам, кратным единичному, то В — простая алгебра. 7. Доказать, что коммутатор простой алгебры В, состоящей из матриц, вида 11.85, распадающихся на т2 блоков || А 0 ... О || О А ... О ( 0 0 ... А ]
ЗАДАЧИ 383 представляется (в том же базисе) всеми матрицами вида X2lE kl2E ... Х2тЕ "•miE Лт2Е... ьттЕ где \jk (/, k=\, ..., т) — произвольные комплексные числа. В частности, пересечение В с В состоит лишь из матриц, кратных единичной. 8. У какой полу простой матричной алгебры В ее коммутатор В совпадает с самой В? 9. Описать все коммутативные полупростые алгебры (В а В). 10. Описать все полупростые матричные алгебры В, для которых В с В. П. Доказать, что для полупростой алгебры всегда В = В. 12. Алгебра В состоит из всех многочленов от одного оператора А (и, следовательно, коммутативна, так что В Z) В). Дать критерий равенства В = В. 13. Если алгебра В ф 0 состоит из нильпотентных элементов (т. е. для каждого А£В имеем A^ = 0 при некотором k = k(A)), то равенство сВ = В невозможно ни при каком eg В. 14. Алгебра В называется нильпотентнон, если существует число р такое, что произведение любых р ее элементов равно 0. Показать, что алгебра В, являющаяся суммой своих правых идеалов Bi-f---.+ В,Л, нильпотептна, если нильпотентен каждый идеал Ву-(/ = 1, ..., т). 15. Если конечномерная алгебра В состоит из нильпотентных элементов, то она сама нильпотентна. 16. Пусть В — нильпотентная алгебра операторов в пространстве К„. Пусть Mi cz Kn есть пересечение всех нуль-многообразий всех операторов А£В, далее, М., с К„ — пересечение всех подпространств, которые операторами А£В переводятся в Мь М« а Кп — пересечение всех подпространств, которые операторами А£В переводятся в М2, и т. д. Показать, что имеют место строгие включения 0 с Mi с М2 с ... СМ^К^, где р — индекс нильпотентности алгебры В, т. е. наименьшее число р такое, что произведение любых р операторов из В равно 0. 17. Для всякой нильпотентной алгебры В операторов в пространстве Кп существует базис, в котором все операторы А£В записываются матрицами вида А = 0 А12 Л13 . 0 0 А23 . 0 0 0. 0 0 0.. • Ai, p-i • ^2, р-1 • Аз,p-i 0 где р—индекс нильпотентности алгебры В (А. Я. Хелемский).
ГЛАВА 12 КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ § 12.1. Введение 12.11. В последнее время в различных областях математики стали играть болышую роль понятие категории и связанные с ним понятия*). Некоторая совокупность множеств с их отображениями друг в друга, некоторая совокупность линейных пространств \\:т алгебр с их морфизмами — все это примеры категорий. Точное определение категории следующее. Пусть имеется некоторое множество % индексов а. Пусть, далее, имеется некоторая совокупность At элементов Ха, называемых объектами категории А?, и дитя каждой пары объектов Ху Хгх указано множество 23, а других элементов Afta, называемых отображениями объекта >£а в объект X . Предполагается, что при любых а, Р, у определено произведение имеющихся отображений А и Аух, котор-ое является отображением Ха в Хт; при этом требуется, чтобы умножение отображений было ассоциативным, т. е. для любых а, Р, у, б А,7 (Ат Дя) - (Аг.Д,,) А?а. В частности, определено и множество 23ао[ отображений объекта Ха в себя самого. IB этом множестве, следовательно, определено (ассоциативно^) умножение отображений. Кроме того, требуется, чтобы множество 23аа содержало единичный элемент 1а, который обладает тем свойством, что *) См., например, А. К а рта и и С. Эйленберг. Гомологическая алгебра, ИЛ, М., I960; А. Г роте иди к. О некоторых вопросах гомологической алге'бры, ИЛ, М., 1961; А. Г. Курош и др. Основы теории категорий,, УМН, К° 6, 3—52, 1960.
12.12] § 12.1. ВВЕДЕНИЕ 385 при любых а, Р и у. Будем далее вместо 23аа писать короче ЭЗа. Совокупность объектов Ха и отображений А.а, обладающих перечисленными свойствами, и образует, но определению, категорию. Категория $ называется линейной, если в совокупности 23 отображений А (с любыми фиксированными а и Р) определены операции сложения отображений и умножения их на числа (из поля К), превращающие совокупность 23 в линейное пространство над полем К. В линейной категории совокупность 23а представляет собой алгебру с единицей (над нолем К). 12.12. Мы рассмотрим в этой главе линейные категории, элементами которых являются линейные конечномерные пространства над полем С комплексных чисел, а отображениями— линейные отображения (морфизмы) одного такого пространства в другое. Итак, мы исходим из следующего определения. Имеется некоторое множество линейных конечномерных комплексных пространств Ха(а£§(). При каждом а в пространстве Ха задана алгебра 23а линейных операторов, переводящих Ха в себя. Для каждой пары индексов Р, а задано семейство 23;а линейных операторов А переводящих Ха в X , содержащее вместе с каждыми двумя операторами А и Вга их сумму A -f В и вместе со всяким оператором А его произведение ЛА0в на любое комплексное число Я; такое семейство линейных операторов будем в дальнейшем называть линейным семейством. В частности, линейное семейство 23аа совпадает с алгеброй 23а. Предполагается, что для любых а, Р, у выполнено условие ЗЗгДасЗЗта> (1) т. е. любое произведение А А^а(А £23YV Ar^ g $5 ) лежит в 23та. Совокупность пространств Ха с алгебрами 23а и семействами 23га будем называть категорией конечномерных пространств, или просто категорией, и обозначать через Я. Если в каждом пространстве Ха выбран как-нибудь базис, то алгебры 23а и линейные семейства i\a можно отождествить соответственно с алгебрами и линейными семействами 13 г. Е. Шилов
386 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.13 соответствующих матриц, что мы в дальнейшем будем систематически использовать. В этой главе мы выясняем, какими могут быть категории линейных пространств при заданных алгебрах 2.\. Мы ограничиваемся полупростыми алгебрами 23а. В силу 11.86 для полупростой алгебры пространство Ха может быть разбито в прямую сумму подпространств Хву-, инвариантных относительно всех операторов Ага, причем в каждом подпространстве Хау- алгебра 3$а есть простая алгебра с единицей, т. е. в некотором базисе она записывается матрицами вида II С II с где С пробегает всю совокупность матриц соответствующего размера. Мы начинаем с разбора нескольких частных случаев, которые позволят затем сформулировать и общие результаты. В § 12.2 рассматривается случай, когда каждая алгебра 33а есть полная алгебра, т. е. алгебра всех линейных операторов, действующих в Ха. Противоположный случай, когда каждая из этих алгебр есть алгебра операторов {ЯХ}, кратных единичному, разобран в § 12.3. Результаты § 12.4 относятся к случаю простых алгебр sl\, который является естественным обобщением случая алгебр {^Х}. В § 12.5 речь идет о случае, когда каждая алгебра 3?а есть алгебра всех диагональных матриц. В § 12.6 общая категория приводится к разобранным в предыдущих параграфах. 12.13. Напомним обозначения и правила действий с матрицами линейных операторов, отображающих линейное пространство X в линейное пространство Y (4.41—4.43). Пусть имеется л-мерное пространство X с базисом el1 ...,en и /и-мерное пространство Y с базисом Д, . ..,/да. Линейному оператору А, действующему из X в Y, мы ставим в соответствие тХя-матрицу (т. е. матрицу из т строки
12.14] § 12.1. ВВЕДЕНИЕ 387 п столбцов) Л = In а21 а 22 где в ft-м столбце стоят числа alkl a2kl . . ., amk, представляющие собой коэффициенты разложения вектора АеЛ£У по базису fv . . .,/m. Пусть, далее, имеется ft-мерное пространство Z с базисом gv . ..,£"Л. Оператору В, действующему из пространства Y в пространство Z, ставится в соответствие ftx/w-мат- рица Ьп Ь12 . Ь21 #22 * В \т '2т bkl Ьк2 Оператор С = ВА действует из Лхя-матрица С km In Z. Ему отвечает С21 Слс 22 Ckl Ск2 кп Эта матрица получается из матриц В и А с помощью операции "умножения: т РЯ S bpfli(n p=l, . .., ft; ?=1 / = i п. 12.14. Напомним следующий факт, который будет часто полезным (4.44). Лемма. Пусть дана прямоугольная пхш-матрица (п строк, m столбцов; р=\, . . ., п; q = 1, . . ., тп). pq Если умножить матрицу А справа на прямоугольную mXk-матрицу B — \\brs\\, где все элементы brs, кроме broSo1 равны О, a br0s0=l, то получится прямоугольная пхк-мат* рица F, в которой все столбцы, кроме £0-го, будут равны 13*
388 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.15 нулю, а в s0-m будут стоять элементы г0-го столбца матрицы А. Если матрицу А умножить слева на прямоугольную lXn-матрицу C=\\crs\\, где все элементы crsi кроме criSl, равны нулю, a criSl = 1, то получится прямоугольная lxm-матрица, все строки которой, кроме г-й, будут равны О, тогда как в гх-й строке будут стоять элементы sx-u строки матрицы А. 12.15. Как следствие получаем: если прямоугольную лХ/я-матрицу А умножить справа на mxfc-матрицу В, а слева на /X/z-матрицу С с указанными свойствами, то в полученной /х£-м.атрице D будет отличен от нуля (возможно) только один элемент, именно, стоящий на скрещении /уй строки и 50-го столбца, а этим элементом будет элемент aSir исходной матрицы А (т. е. находившийся в ней на скрещении 5х-й строки и /уго столбца). § 12.2. Случай, когда все данные алгебры §Ва — полные 12.21. Пусть категория $ состоит из конечномерных линейных пространств Ха, причем алгебра 33а операторов, действующих в Ха, при любом а есть полная алгебра, т. е. алгебра всех линейных операторов в Ха. Фиксируя произвольно базис еъ . . ., еп в пространстве Хх и /х, . . ., /п в пространстве Х2, мы можем отождествить операторы из совокупностей 5811, £3|а,. 3521, Э32г-£ соответствующими им матрицами. Пусть размерность пространства Хх равна m и размерность пространства Х2 равна п. Предположим, что в совокупности 2321 имеется ненулевой оператор А и ему соответствует прямоугольная /zX/я-матрица А~\\а ||, в которой по крайней мере один элемент, например аРо<7о, отличен от нуля. В этом случае можно считать аРоЯо= 1. По условию (1) и нашему предположению (33х и 232 суть полные алгебры матриц), произведение матрицы А справа на любую квадратную mX/я-матрицу и слева на любую квадратную #х#-ма- трицу снова принадлежит семейству 3321. Однако в силу леммы 12.14 в результате такой операции мы всегда можем получить яХ/я-матриЦу с единственным отличным от нуля элементом -1 в любом наперед заданном месте. Так как линей-;
12.22] § 12.2. ВСЕ ДАННЫЕ АЛГЕБРЫ ПОЛНЫЕ 389 ная комбинация таких матриц дает любую #Х/#-матрицу, то 2321 содержит все эти матрицы, т. е. представляет собой полную совокупность операторов, действующих из Хх в Х2. 12.22. Мы свяжем сейчас рассматриваемую категорию с некоторым частично упорядоченным множеством. Введем соответствующее определение: множество S называется частично упорядоченным, если для некоторых пар Л, В его элементов установлено соотношение, обозначаемое знаком ^ (меньше или равно), причем выполнены следующие аксиомы: а) Если Л<£ и £<Л, то Л = В. б) Если Л<£, £<С, то Л<С. в) Всякое Л^Л. Несколько более обшим понятием является понятие пред- частично упорядоченного множества. Мы будем так называть множество с отношением ^, удовлетворяющим лишь аксиомам б) и в). Если при этом А^В и В^А, то А и В называются эквивалентными, что обозначается знаком А~ В. Проверим, что из А~В и В~С следует А~С. Действительно, из А^В, В^С следует, по б), также Л^С и из С^.В, В ^ Л следует С^.А, так что Л ~ С. Поэтому отношение ~ позволяет разбить все множество S на классы 81, 58, ... ; каждый класс содержит вместе с элементом А все ему эквивалентные, и элементы Л, £, принадлежащие к разным классам, не эквивалентны. Теперь введем отношение ^ уже для классов 21, 23. Именно, будем считать, что 31^23, если существуют Л g 3(, В g 23 такие, что А^В. Это определение не зависит от выбора элементов Л £ 2( и 5 £ 23; действительно, пусть, кроме того, Л^З!, 5^23, так что A~AV В ~ Bv Тогда мы имеем A1i^A^.B^iB1, откуда Л1<!£1, что и требуется.. Выполнение свойств б) и в) частично упорядоченного множества для классов 31, 23, ... теперь следует из выполнения этих свойств для элементов Л, В, . . . Покажем, что для классов 31, 23, ... выполнено и свойство а). Пусть 21^23 и 23^31; выберем произвольно Л g 31 и ££23. Мы имеем А^В и B^iA, так что А и В эквивалентны. Но тогда классы 31 и 23 совпадают, 31 = 23, что и требовалось. Итак, введя в пред-частично упорядоченное множество S, как указано, отношение эквивалентности, мы приходим к
390 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.23 частично упорядоченному множеству классов эквивалентных элементов. 12.23. Возвращаемся к рассмотрению нашей категории. Из 12.21 следует, что для пары пространств Х1 и Х2 мы имеем четыре возможности: а) 2312 и 2321— обе суть полные совокупности операторов; б) 33'12 есть полная совокупность, 232! состоит только из нуля; в) 2321 есть полная совокупность, 2312 состоит только из нуля; г) 2312 и ч1>21 состоят только из нуля. Если Й312 есть полная совокупность, а относительно 2321 не делается никаких предположений, будем писать XX^ZX2. Аналогичный смысл имеет запись Х2^.Х1. Покажем, что введенное таким образом отношение ^ превращает категорию Si в пред-частично упорядоченное множество. Действительно, для данного Х1 мы имеем но условию, что 33п — полная совокупность операторов, поэтому Х^Х^ Далее, если А\<*2 и Х2 < Х3, то 2312 и 3323 являются полными совокупностями линейных операторов, действующих из Хх в Х2 и соответственно из Х2 в Х3. Так как все наши пространства имеют размерность ^ 1, то в совокупности 2313 имеется оператор, отличный от нулевого. Такой оператор можно получить, фиксируя ненулевые векторы ех £ Х1? е2 £ Х2, е3 £ Х3, как произведение операторов АВ, где А £ 2312 переводит е2 в еъ а В £ 2323 переводит е3 в е2. По /:?.?/ совокупность 2313 есть полная совокупность операторов, переводящих Х3 в Хх, так что ХХ^Х3. Итак, аксиомы б) и в) выполнены, категория Si превращена в пред-частично упорядоченное множество. 12.24. В соответствии с 12.22 введем отношение эквивалентности, считая, что ХХ~Х2, если Х2^ХХ, Хх ^ Х2, т. е. если обе совокупности 2312 и 2321 — полные совокупности соответствующих линейных операторов. Тогда совокупность пространств Ха разбивается на классы взаимно эквивалентных пространств, и совокупность этих классов, с указанным в 12.22 отношением ^, становится частично упорядоченным множеством. Обратно, любое частично упорядоченное множество Ха классов конечномерных пространств определяет категорию рассматриваемого типа. Именно, для пространств Хх и Х2,
12.32) § 12.3. ВСК ДАННЫЕ АЛГЕБРЫ ОДНОМЕРНЫЕ 391 входящих в один и тот же класс, мы задаем совокупности 3512 и 2521, как" полные совокупности операторов; для пространств Хх и Х3, входящих в классы А\ и Х3, связанные отношением Хг < Х3 (т. е. А*х^Л*з, но Х1^=Х3), мы задаем 3313, как полную совокупность, и £>31, как состоящую только из нуля. Если же Хг и Х4 входят в несравнимые классы Хг и А*4, то мы задаем 3314 и 2341, как состоящие только из нуля. Этим описание категорий рассматриваемого типа закончено. § 12.3. Все данные алгебры $8а—одномерные 12.31. Рассмотрим вначале два простых примера. а. Категория S\\ состоит из двух пространств Хх и Х2 одинаковой размерности. Система £321 представляет собой один оператор А, отображающий взаимно однозначно Хг на Х2, со всеми его кратными К А, Х£С. Система Й312 представляет собой один оператор В, обратный к А, со всеми его кратными \iB, \i £ С. Очевидно, что i^21 = (XX), 2321^12-(ХХ). б. Категория S\2 состоит из двух произвольных пространств Хх и Х2, в которых фиксированы подпространства Х( cz Хх и Хо cz Х2. Система 9321 состоит из всех операторов, переводящих Хх в Х'2 и при этом Х[ в (0). Система 3312 состоит из всех операторов, переводящих Х2 в Х[ и одновременно Хо в (0). Очевидно, что 3312232i = 0, 3321ь1>12 = 0. Мы покажем, что категориями ${\ и Si2 в основном исчерпываются все категории из двух пространств с 23у. = (АЕ) (/= 1, 2), а именно, для любой категории Я' имеет место альтернатива: или 3?i23?2i = 0 — в этом случае и 23219312 = = 0, и категория SX содержится в некоторой категории типа Я'2, или размерности пространств Хх и Х2 равны и категория Я есть категория типа Ях. 12.32. Пусть дана некоторая категория Я из двух пространств Хх и Х2 с условиями ^^(ХХ), 332 = (ХХ). Обозначим через N2 cz Xx пересечение нуль-многообразий {4.62) всех операторов А12 £ s3312 и через N2 cz X2 пересечение нуль-многообразий всех операторов А21~£3321. Если
392 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.32 3321ХХ cz N2 и 9512Х2 с Nx, то мы имеем дело с подкатегорией категории типа Я"2, в которой Xi = Nx, X2 = N2. Поэтому предположим, что, например, 232i^i не содержится в N2 и, следовательно, есть вектор х1£Х1 и оператор А21 £ ©21, для которого А21х = х2 не принадлежит N2. Покажем, что все операторы В21 £ Э321 переводят вектор хх в вектор, коллинеарный д;2, и все операторы С12 £ 3512 переводят х2 в вектор, коллинеарный хх. Действительно, пусть А21х1 = х21 &21х1=уг. Рассмотрим оператор С52£2312,для которого CJ2a:2^:0. Тогда в силу основного условия C0l2x2 = Cl2A21x1 = Kxv причем ХфО. Заменяя С°12 его кратным, можем считать, что к=\. Далее, В21С?2д:2 = В21д:1=<у2, и в то же время B2lCl2x2 = \ix2; таким образом, y2 = \ix2. Так как> обратно, х1=--С12х2 и, по определению вектора х1у он не содержится в Nx, мы имеем аналогично С12лг2 = f-iATx при любом С12£3312. Покажем, что в данном случае Nx и N2 сводятся к нуль- вектору. Пусть 2'1gN1; тогда А21 {x1-\-z1) = А21х1 = х2, т. е. вектор хх в предыдущем построении может быть заменен на x1 + z1. В таком случае С?2д:2 есть кратное и х1 и х1 + г1, так что х1 и z1 коллинеарны. Так как л:^^, to z1 = Q. Итак, N1 = (0). Аналогично, начиная с х2, получаем, что и Na = (0). Теперь мы видим, что в качестве хх можно было взять любой ненулевой вектор пространства Хх, поскольку всегда имеется оператор А21£$321, переводящий хх не в нуль. Следовательно, операторы семейства 3521 устанавливают взаимно однозначное соответствие между всеми прямыми пространства Хх и некоторой совокупностью прямых пространства Х2; более того, даже с совокупностью всех прямых пространства Х2 в силу симметрии нашего построения. Теперь покажем, что вся совокупность 3321 сводится к семейству кратных одного оператора. Пусть хх Ф О есть произвольный вектор в пространстве Хх и х2 — ненулевой вектор, определяющий соответствующую хх прямую в пространстве Х2. Мы знаем, что имеется оператор А21, переводящий хх точно в х2. Всякий другой оператор А21 £ £}21 переводит хх в Кх2. Пусть сначала А21х1='кх2 и А, Ф 0. Тогда оператор В21 = у А21 переводит хх точно в х2. Покажем, что В21 совпадает с А°21 всюду. Пусть А\1у1=у2, В^х^ ^2фу2\ это возможно или
12.33] § 12.3. ВСЕ ДАННЫЕ АЛГЕБРЫ ОДНОМЕРНЫЕ 393 приз;2^0, z2 = |iy2, \ьф\, или при ^2 = 0, г2ф0. Рассмотрим ненулевой вектор z1 = ахх + $yv афО, $ф0. Векторы Al1z1 и B21zv по доказанному, коллинеарны; но в данном случае это не может иметь места, поскольку при А°21 (ах± + $уг) = ах2 + fry2, В21 (ах± + $уг) = ах2 + РкУг» а при ^2 = 0 AJi (ахг + Р^ух) = ах21 В21 (а*! + $уг) - ад:2 + р*2. Таким образом, если А21х1 = Хх2, кфО, то A21 = XAJ1# Пусть теперь А21д:1 = 0; тогда, по доказанному, А^ + А21 = = AoiH, следовательно, А21 = 0. Итак, семейство 3321 сводится к семейству кратных оператора А^. Аналогично и семейство Й3]2 сводится к семейству кратных фиксированного оператора В12. Произведения А^ BJ2 и В°12 А°21 отличны от нуля и, по основному предположению, дают операторы, кратные Е. Поэтому А°21 и В°12 можно считать взаимно обратными операторами; но это возможно, лишь если пространства Хх и Х2 имеют одинаковую размерность. Мы пришли к выводу: всякая категория, не являющаяся подкатегорией категории типа iT2, есть категория типа йх. 12.33. Категориями типа $х и ^2 не исчерпываются возможные категории с двумя пространствами и 331 = (ХЕ), 332 = (ХЕ). Действительно, если из совокупности 3321 категории Я1 типа Я:2 мы выберем линейную подсовокупность, не увеличивая Nx и не уменьшая N2 (например, наложив на элементы матриц операторов А21 подходящее дополнительное линейное однородное условие), то получим категорию Й', удовлетворяющую поставленным условиям, но не совпадающую с $. В частично упорядоченном по включению множестве всех категорий с ЗЗу-=(ХЕ) (/=1,2) категории типа $2 характеризуются тем, что они максимальны; иными словами, каждая категория типа й2, за исключением вырожденных случаев, когда Х'2 = (0) или Х^ = (0), не может быть расширена с сохранением свойств категории и условий ЗЗу=(ХЕ). Действительно, допустим, что категорию $ типа Я*2 можно расширить добавлением оператора А^, принимающего на некотором х1£Х1— Х^ значение у2^^2- Допустим, что Х[ф0. Возьмем оператор BJ2 £ i)12, переводящий у2 в
394 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.34 ненулевой вектор х[ £ Х^. Тогда B?2A5i хг = х'1у что противоречит условию. Далее, пусть к категории &\ добавлен оператор А21, переводящий вектор хх £ Х( не в нуль, а, например, в вектор у'2 £Хо. Ясно, что Х'.2фХ2, иначе было бы XJ = §812 X2 = = ^12 Х2 —(0) и Указанного вектора xv переводящегося не в нуль, не могло бы существовать. Поэтому в 2?12 имеется оператор В12, переводящий вектор .у2 € Х2— Х'2 в xv Тогда ^21^12^2 = У'п что противоречит условию. Аналогично, предполагая Х'2 = 0, получаем, что нельзя добавить ни одного оператора к совокупности 2312. Итак, рассматриваемая категория S\ типа $\2 максимальна в предположении, что Х[фО и Х2^0. 12.34. Случаи вырождения нужно рассмотреть отдельно. Пусть, например, XJ —О, так что 2312 состоит только из нулевого оператора. Если теперь Х.,=7^Х2, то категория не максимальна и в совокупность 232i можно добавить без нарушения условий 23у-=(ХЕ) все операторы, действующие из XL в Х2. Таким образом, получается ('тривиальная > максимальная категория, где 2312 = (0), a 2321— полная система операторов, действующих из 23х в 232. Аналогичная максимальная категория получается с 2321 = (0) и 2312— полной системой. В результате мы получаем, что общая категория типа Я2 максимальна при условиях: 1) Х[фО, Х^фО, 2) х; = о, х; = х2; з) х; = хь х; = о. 12.35. Мы переходим теперь к общему случаю категории из любого числа N^C оо пространств {Ха}, а£2(. Здесь имеет место утверждение, аналогичное доказанной нами альтернативе (12.32). Альтернатива. Если 23-, = . . . = 25Л == (^Е), то или произведение 23и23Л>Л_1 ... 23322321 = 0, или пространства Хх, . . ., Хк имеют одинаковую размерность и 33/у = {ХА - }, где А,-. — фиксированный обратимый оператор, причем ^lk^k, k-l- ' -^32^21 — Е. Доказательство. Допустим, что произведение 23lft 33^, /г-1 • • -2321 содержит ненулевой оператор, равный, следовательно, ХЕ с Л ФО. Пусть размерность пространства X. есть Г;\ тогда матрицы А1/г£231/г, ..., А21 £ 2321, дающие
12.36) § 12.3. ВСЕ ДАННЫЕ АЛГЕБРЫ ОДНОМЕРНЫЕ 395 в произведении ХЕ, имеют размеры Рассмотрим произведение матриц AlfeA^ k_x. . . А32. Эта матрица, имеющая размеры г1Хг2, действующая, следовательно, из Х2 в Xv Рассмотрим категорию Sf0 из двух пространств Хь Х2, где совокупности операторов 23^ и ЙЗ^ следующие: (£>1в2 — линейная оболочка соответствующих произведений). Так как, по условию, AifcAfc,fc-i- • -А21 = аЕ, то, по доказанному, Хх и Х2 имеют одинаковую размерность r1 = r2, 23o°i = 33oi = (^Ао0!), гдеА^— обратимая матрица ЗЗ^ — =^а^>: Далее, мы имеем А0-1 А А А — >Р а рассуждая, как и раньше, получаем, что г2 = г3, 2332 = ЯА§2, где А°2— обратимая матрица. После к шагов приходим к требуемому утверждению. 12.36. В дальнейшем, рассматривая категорию из N пространств, мы можем предполагать, что все циклические произведения 23агД\г,,^&» Равны нулю; в противном случае мы просто отождествили бы соответствующие пространства одинаковой размерности. Рассмотрим вначале следующую конкретную категорию, которую будем обозначать S\%. Выберем в Хх произвольно N— 1 подпространств, которые обозначим Х12, . . . , X1N. При попарно различных у, k, /, ... положим Хук — Ху Г) Xu, Xykl = Х1у. П Xlk Г) Хп и т. д., образуя последовательно пересечения пространств Ху по два, по три и т. д. Если N конечно, последним пересечением будет Х12 Дг—пересечение всех N—1 выделенных подпространств, если N бесконечно, последнего пересечения не будет. Такое же построение проведем во всех остальных пространствах Х2, ... , причем индекс всего пространства будет первым индексом в обозначении всех его подпространств.
396 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.37 Каждой системе попарно различных индексов у, . . . , k теперь отвечает однозначно некоторое из выделенных подпространств. Построим совокупность 5821. По определению она состоит из всех операторов, переводящих Хх в Х2 так, что каждое из подпространств Ху k переходит в Х21, .Л, если в последовательности у, ... , k нет индекса 2, или в (0), если в ней индекс 2 имеется. Аналогично построим все совокупности $8 . Докажем, что мы получили категорию. Пусть имеются некоторые операторы А21 £ 3521 и В32 £ 3332. Рассмотрим оператор В32А21. Он переводит пространство Хх в Х3. Подпространство Xly. k оператор А21 переводит в ^21у.../г> а полученное подпространство оператор В32 переводит в Х321;. ..fcCXgxy..^. Таким образом, оператор В32А21 входит в 3331, что и требуется. Если имеется цепь операторов А1у-...А^, переводящая пространство Х1 в себя, то результирующий оператор переводит Хх в Хх- fel= 0, что и согласуется с требованием аз1 = (ЯЕ). 12.37. Покажем теперь, что любая категория из N^. oo пространств Х1? с S3y. = (?iE) содержится в некоторой категории типа S^2 • Обозначим через Х-Л полный образ пространства Xk в пространстве Ху под воздействием всех операторов ЗЗу-Л и далее через XjklmmtSm полный образ в пространстве Х- пространства XOT под воздействием всех операторов вида AjkAkL Asm (порядок индексов существен!). Покажем, что X-kl sm содержится в пересечении ХуЛ, Xj4, . .. ...,Xym. Действительно, если z£Xjkl^sm, то г "VАа \сс Аа Аа^а а где Zm^X^, или z = 2L^ik • • -кряУя) а где j>" = 2 • • • А?яг" 6 X,, а так как А%... Ар„ € »Л, то а z£Xjq, что и требуется. Заметим, далее, что А/у. переводит Xjm в Х^_т. Теперь ясно, что наша категория содержится в категории типа
12.41] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 397 $2 с определяющими подпространствами Х-л; в частности, все максимальные категории должны иметь тип Я 2 ' Неясно, однако, при каких условиях на подпространства Xjk категория типа Я"2 является максимальной. (Напомним, что в случае двух пространств Хх и Х2 необходимые и достаточные условия максимальности категории Я2 состояли в том, что пространства Х12 и Х21 либо оба отличны от нуля, либо одно есть нуль, а другое — все пространство.) § 12.4. Все данные алгебры 33 а— простые В этом случае каждая алгебра 33а в некотором базисе записывается матрицами вида С С (2) где С—одна и та же матрица фиксированного размера га, причем во всем 35а она пробегает всю совокупность квадратных матриц с га строками и столбцами (П.86). 12.41. Рассмотрим вначале категорию Я* из двух пространств Хх и Х2 размерностей п1 и п2 с размерами квадратов т1 и т2 и числом их k1 и к2 (так что пх — kxmx, п2 — k2m2). Матрица Л21 категории St может быть разбита на блоки следующим образом: Ln 12 Lu, Л 21 L12 U А кЛ L*A
398 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.41 Аналогично можно представить матрицу ^12: *л?12 — fill ^12 • • • ВЩ 1 V [-.. Мы утверждаем: ала произведение Д2133Х2 = 0 (яра любых ^2i € ЗЗ21 w ^126^12)» млм k\ — k2 и все матрицы A-k являются кратными одной (произвольной) фиксированной матрицы А, равно как и все матрицы B.-k являются кратными одной (произвольной) фиксированной матрицы В; при этом коэффициенты кратностей образуют взаимно обратные матрицы порядка kx^k2. Категорию второго типа будем обозначать в дальнейшем через Я3. Для доказательства заметим, что в категорию Я1 вместе с матрицами Л2\ и 5дп входят их произведения (с соответствующей стороны) на матрицы С1 и С2 вида (2), поэтому наряду с равенством ^21*^12 == ^2 имеет место и равенство «/X2i^i«л/12 7== ^2 с произвольной матрицей С1 вида (2). Вспоминая правило умножения блочных матриц (4.51), мы можем написать уравнения (в блоках): = Л21С/э12 -г- Л22С/>г ■■■+А1кСВкЛ ^Ъкр^кЛ АкЛСВ} ™k 2^£>ои + . . /l11Co12 -j- /112Сх522 ^м/^*Л' Л*св,2 = о (3) Возьмем в качестве матрицы С матрицу, имеющую единственный ненулевой элемент 1 на скрещении г-й строки и 5-го столбца (r^mly s ^ тх). Вообще, если А — любая /я2Х/^-матрица, а В — любая /Я1Х/я2-матрица, то произведение АСВ есть /и2х/я2-матрица первого ранга, у которой
12.41] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 399 на скрещении p-Pi строки и q-ro столбца стоит элемент Q>prbSq. Поэтому равенства (3) можно переписать в форме 11,11 , „12,21 aprt>SQ ~Г Gpr О sq — n2lh12 — UprDsq sq 22,22 alklhkl1 = upr I'sq — dpr Osq + . . . + apr Psq akp\xb\kq* + akpfb^ + . . . + a%H%k\ 12,22 111li | IJLiS ' 1 ~lKlU aprO$q ~F aprVsq T • • • ~T apr О sq (4) где индексы наверху означают номера соответствующих матриц. Уравнения (4) можно трактовать как матричное равенство Apfisq — а11 а12 ирг ирг '21 2 2 арг арг l*t ! 'рг \ 2*, рг k2kx рг /11 ь12 Usq "sq A21 A22 sq hq '&7 , k,k2 Osq *, Аналогично имеет место и равенство '*' IK1 21 &SqApr l! 1 «Л 2 0s« ft></ ...ft s<7 12 &pr ®pr A2i A22 bsq t?sq .. ft 2*, sq ,kx\ ,kx2 "sq "sq V >4 * *ll *t 2 -pr И- *l Upr Мы видим, что матрицы Л^г и Bsq (р, г, 5, #— параметры этих матриц) образуют категорию, связывающую
400 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.42 пространство Ех размерности kx с пространством Е2 размерности k2 при условиях Ri= (А,У), /?2= (|аУ). Мы можем теперь применить альтернативу, установленную в 12.32. Именно, если к1Фк2, то на самом деле всегда Х = 0, ^ = 0; если же мы допускаем, что хотя бы при одной системе индексов /?, q, г, 5 получается X Ф 0 (или \хф0)у то k1 = k2 и все матрицы Л^ представляют собой кратные одной обратимой матрицы, а все матрицы Bsq — кратные обратной матрицы: Кг = V^' Bsq = \xsgB. Матрица Арг состоит из элементов матриц Л/у., находящихся на скрещении /)-й строки и г-го столбца. Мы видим, что выполняется условие где aij — элементы матрицы А. Поэтому мы приходим к выводу, что все матрицы А(. являются кратными фиксированной матрицы А = )\'Крг\\ с коэффициентами аи. Аналогичный вид имеют матрицы B(j-, чем и завершается доказательство нашего утверждения. 12.42. Итак, если <Л12*В21фО, то kx = k2 и категория $ имеет вид д»Л|д12Л| . а21Л/ ... . . . | л1Л»л[ д*,1Л| • • • • • |fl*i*iA| Г1гм\ь12м\ . ь21м \ ... . ьк*ш\ ••• • .. \ь^м\ .. |£м,м Матрицы Л =11^ || и М прямоугольные: 1^'Р^/и2» l^^^tf^. Среди матриц Л, участвующих в данной категории, имеется ненулевая Л0 (поскольку S92i^i2 ^ С))? и поэтому среди них должна быть и любая m2 x /^-матрица, поскольку из ненулевой матрицы умножением справа на С2 и слева на Сх можно получить любую такую матрицу. Итак, Л 21 Ж 12
12.43] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 401 если £32i^i2 ^ 0> семейство R21 состоит из матриц вида 11 а11 А | . . . | <2lfe'A [ I ak^A\ \ak^A\ где Л =|| а'71| — фиксированная обратимая матрица, а А пробегает всю совокупность ш2Хт1-матриц. Аналогичная картина будет иметь место, если 33122321=^0. Теперь ясно, что неравенства 25123321=т^О и 23213312=т^О имеют место или не имеют места одновременно. 12.43. Полученный результат может быть сформулирован в терминах тензорных произведений. Эта точка зрения позволяет, кроме того, выяснить и некоторые дополнительные обстоятельства. Приведем необходимые нам определения. Пусть даны ^-мерное пространство X с базисом еъ . . ., ek и /я-мерное пространство Y с базисом /х, . . ., fm. Тензорным произведением XxY = Z пространств X и Y называется совокупность всех конечных формальных сумм вида V=l где #V6X, >>V6Y. При этом предполагается, что [*i Ху] + [*2 ХУ] = [(*i + *2) ХУЬ [х хуг] + [х Ху2] = [хх (у± + у2)]. р р р S^v^vX^v=S^vX^Viyv=2 M^vX^v]. v=1 v=1 v=l Отсюда следует, что XxY — линейное пространство, оно имеет размерность km, и его базисом могут служить векторы вида e{Xfj (/= 1, • • ., k\ j— 1, . . ., m). Таким образом, векторы пространства Z имеют вид k m Мы.можем преобразовать эту запись, выполнив суммирова- m k и: кие по индексу /; получим g= 2 [ ^ с,//Х/у] = У х- хЛ, 3=1 1=1 3=1 (5)
402 гл. 12. категории конечномерных пространств [12.44 k где Xj = ^lcijei— произвольные (уже не обязательно базис- i- I ные) векторы пространства X. 12.44. Пусть даны оператор А, действующий из пространства Хх в пространство Х2, и оператор В, действующий из пространства Ух в пространство У2. Определим тензорное произведение С —Ах В как оператор, действующий из пространства Ъх = Хх х Ух в пространство Z2 = Х2 х У2 по формуле (дополнительный индекс — номер пространства) C[e}xf}] = AefxBf}. (6) Если Ае} = ^аГке1 и Bff = ^bjyf^ то формула (6) преобразуется к виду сих//]=|1!«-л-,и.хЛ]- Выясним структуру матрицы оператора С относительно базисов e}xfl и е|х//2, упорядоченных в XjXYj но правилу *\Xfi\ ^Х//, ..., e\xxft\ e{xf}> e\xfi, . .., elkixfl, . .. и аналогично в пространстве Х2хУ2. Матрица С согласно определениям 12.13 имеет вид апЬп аиЬп ...а1к2Ьп ... апЬХт7 апЬ1гПз '-.cilkpimj «21^11 «22^11 ••• U2*Al ---a*\bim* a2p\m7 • • • a2k7blm2 fl*,i&n а\\ътл aksP\\ • аиЬтЛ • •• fl*,*Al • • • Qlk-РтЛ • • • QkiPlm-x • • а\Ртхтъ 4$\m% • а\Фт^т-х • • • aklkplmi • • ak-xkpm,m-x akabrnil aki2bmil ••• akxkPmxl ••• akxP"m^m-x акхФтхт7 ••• akikpmxtn2 или (используем блок-запись) ^ii ••• Ablm% c = АЬт л ... Abm т 12.45. Применяя 12.44 и 12.41, мы видим: операторы алгебры 25х, рассмотренной выше, суть операторы в тензорном произведении /^-мерного пространства Хг и /г^-мер-
12.47] § 12.4. все данные алгебры простые 403 ного пространства Уь которые являются тензорными про- изведениями любого оператора С £ SJ3 (Хх) на единичный оператор Eg 25^). Операторы системы Э321, рассмотренной выше, являются тензорными произведениями любых операторов А21 £ 33 (Х2, Хх) на фиксированный обратимый оператор А21 £ 23 (Y2, Yx) и аналогично операторы системы 3312 являются тензорными произведениями любых операторов М12£$8 (Хъ Х2) на А"1. 12.46. Для произведения тензорных произведений операторов справедлива очевидная формула (AxB)(CxD) = (AC)x(BD). Поэтому, перемножая операторы категории А21 и £12, мы находим, в частности, (Л X А) (М х А"1) = (AM) X (АА"1) = (ЛЛГ) X Е g »lf откуда следует выполнение свойства категории. 12.47. Найдем инвариантные пространства алгебры операторов 23 — {С X Е}, действующих в пространстве Z = X х Y. Таким инвариантным подпространством является тензорное произведение XxY0, где Y0 £ Y есть любое подпространство, поскольку (Сх Е) (X х Y0) =СХ X EY0 (X X Y0). Покажем, что никаких иных инвариантных подпространств в пространстве Z нет. Действительно, пусть z — jJ-K/Xj^-— любой вектор пространства Z. Можно считать, что Xj линейно независимы. Рассмотрим оператор С, переводящий векторы Xj в заданные векторы Xj £ X. Тогда (CxE)2^XeV/ = 2^/XeV/. Таким образом, во всякое подпространство, инвариантное относительно всех операторов СхЕ, вместе с каждым вектором 2-*7x.V/ попаДает любой вектор ^ХуХуу, откуда и вытекает требуемое. Если мы применим к инвариантному подпространству XiXY10 B 21 = X1xY1 оператор категории ЛхА, то в силу произвольности матрицы Л получим в пространстве
404 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.48 Z2 = X2x Y2 в качестве образа подпространство ЛХ1хЛУ10= = X2xY20. Таким образом, операторы категории устанавливают взаимно однозначное соответствие между инвариантными подпространствами в пространствах Zx и Z2 и одновременно между обычными подпространствами пространств Yx и Y2. 12.48. Все изложенное справедливо при условии 2321^12^0 (или, что то же самое, при 23122521=^=0). Если 35i2^2i — ^21^12 — 0> т0 изложенная схема уже не работает и матрица категории вообще не состоит из блоков, кратных фиксированной матрице Л. Мы находимся в условиях 12.32 и можем применить соответствующий результат: категория есть часть некоторой категории типа К2\ какая именно, уточним дальше. 12.49. Переходим к случаю категории из любого числа пространств Ха с алгебрами 23а рассматриваемого типа. Назовем пространства Zx и Z2 родственными, если ^812^821 =^= 0 и, следовательно, матрицы 5В12 имеют вид (5). Ясно, что соотношение родства транзитивно: если Zx родственно с Z2, a Z2 родственно с Z3, то Ъх родственно с Z3, так как в силу произвольности матриц Л в произведении 3332^2i имеются ненулевые матрицы. Поэтому всю совокупность пространств Ха можно разбить на непересекающиеся классы взаимно родственных пространств. Если Хх и Х2 входят в разные классы, то ад21==ад12==о. Теперь мы можем с некоторыми изменениями повторить схему 12.36. Допустим, что наши пространства разбиты на некоторое число классов G1, . . ., Gn ... взаимно родственных пространств. Пространства, входящие в класс Ог, имеют вид Xry.xYr, где Yr означает фактически одно пространство, в котором действуют обратимые операторы. Рассмотрим лишь пространства Yr и построим из них категорию й2 , как было указано в 12.36, с тем, чтобы выполнялось условие £5.5955/— 0 (произвольно выбираем подпространства Y^ и строим пересечения Yrvp., Yrvixx, . . .). Эта категория состоит из операторов Ais, отображающих Y5 в Y,- и при этом переводящих подпространства Y5V , . . . czYs в подпространства
12.51) § 12.5. ПОЛНЫЕ АЛГЕБРЫ ДИАГОНАЛЬНЫХ МАТРИЦ 405 Y/<5V[A, . . . czY,-. Категория, которую мы обозначим через Я*4, для пространства Zy строится так: если Zy и Zk родственны, то операторы kjk £ 25у7г описаны выше; если же Z = XyXYy- и Zk = XkxYk принадлежат к разным классам, то операторы Kjk — любые операторы, переводящие Zk в Zj и при этом переводящие инвариантное подпространство X^XY #_ в инвариантное подпространство XyxY/ftv[A Проверим, что любая категория $ с простыми кольцами 23у содержится в категории типа Я1^. Пусть Zk — Xkx4k и Zy. — Xy.xYy принадлежат к различным классам родственных пространств. Пусть Zy7j — полный образ пространства Zk в пространстве Zy под воздействием всех операторов семейства 53у7г Очевидно, что Zy7j есть инвариантное подпространство в Zy. и, следовательно, имеет вид XyXYy7?, где Yy£ — некоторое подпространство в Y-. Обозначим через Z/ki...sm полныи образ в Zy пространства Zm под воздействием всех операторов вида Kjkkkl. . .Asm. Это — также инвариантное подпространство, и легко установить, действуя, как и в J2.36, что оно содержится в пересечении Zjk, . . . ..., Zjm. Отсюда видно, что наша категория является частью категории вида Я*4, что мы и утверждали. § 12.5. Все данные алгебры !©а — полные алгебры диагональных матриц В этом случае в каждом из рассматриваемых пространств Ха выделяется фиксированный базис, относительно которого все матрицы операторов Аа g 35a диагональны. С помощью таких базисов операторы А ^35 также записываются определенными матрицами (прямоугольными), так что наша задача может быть поставлена как задача из теории матриц. 12.51. Рассмотрим вначале категорию $ из двух пространств Хх и Х2. Пусть А12££В12 — любой оператор; согласно определению категории произведение Bi^A^B, (7) также принадлежит 3312, если Ах и В2 суть соответствующие диагональные матрицы. Возьмем в качестве Ах матрицу с единственным ненулевым элементом 1 на скрещении у-й строки и у'-го столбца,
406 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.52 а в качестве В2 матрицу с единственным ненулевым элементом 1 на скрещении k-Pi строки и &-го столбца. Тогда согласно 12.14 в матрице В12 будет (возможно) отличен от нуля только один элемент, стоящий на скрещении у-й строки и &-го столбца, и этим элементом будет элемент a-k матрицы А12. Таким образом, операция (7) заменяет в матрице А12 все элементы нулями, кроме элемента a-k, который она оставляет неизменным. Отсюда можно сделать вывод о структуре системы 5512: система Ъ12 представляет собой совокупность всех матриц, элементы которых на фиксированном множестве мест произвольны, в то время как остальные равны нулю. 12.52. Будем обозначать в матрицах системы 2312 фиксированное множество мест, на котором разрешаются любые элементы, через S12. Мы должны выяснить теперь, как связаны множества S12 и S21. Возьмем матрицу А12£)В12 с единственным отличным от нуля элементом, равным 1, на скрещении j\-h строки и &гго столбца, (y'j, kx) £ S12, и любую матрицу В21£%$21 со всеми возможными отличными от нуля элементами на местах S2l. Произведения С1 = А12В21 и D2 = В21А12 согласно условию представляют собой диагональные матрицы. С другой стороны, согласно 12.13 мы имеем: в С1 все строки равны 0, кроме у 2 - и, а в угй строке стоят элементы ^-й строки матрицы В21. Так как должна получиться диагональная матрица, то мы делаем вывод, что в &гй строке матрицы В21 все элементы, кроме стоящего в y'j-м столбце, равны нулю. В D2 все столбцы равны нулю, кроме &гго, а в £х-м столбце стоят элементы jx-ro столбца матрицы А12; опять-таки, поскольку должна получиться диагональная матрица, то в y'j-м столбце матрицы А12 все элементы равны 0, кроме стоящего в k-v\ строке. Итак, если (j\, kv) £ S12, то в матрицах класса 2312 все элементы j^-го столбца и kx-u строки, кроме их пересечения, равны 0. Этого достаточно, чтобы мы, зная множество S12, могли сделать вывод о строении множества S21. Переставляя строки и столбцы матриц 2^12 (что равносильно перестановке элементов в базисах пространств Хх и Х2), мы можем добиться, чтобы вначале шли строки и столбцы, в которых нет представителей множества S12; далее — строки и столбцы, в которых только
I2.52J § 12.5. ПОЛНЫЕ АЛГЕБРЫ ДИАГОНАЛЬНЫХ МАТРИЦ 407 по одному представителю этого множества, и, наконец,— строки и столбцы, в которых не менее чем по два его представителя: I Y б п 42 0 . . . ■ о ... 0 . . . 0 .. . 0 .. . 0 ... 0 . . . 1 ... ... 1 0 . . . 0 . . . 1 0 ... II 0 . . . 11... 1 1 1 (8) На этой схеме места, занятые множеством Sl2, отмечены единицами, остальные — нулями. Построим теперь матрицу В21£)д21] в ней п строк и т столбцов: 1а 3 т ^21 0 . . . 0 . . . | 0 . .. 0 . . . 0 . . . 1 ... ... 1 0 . .. 0 . . . | 0 . . . | 0 .. . 0 . . . 1 0 . . . (9) Поскольку в матрице А12 на скрещении строки с номером ос-J- 1 и столбца с номером у^-\ стоит 1, в матрице В21 на скрещении столбца с номером a-f 1 и строки с номером Y+ 1 может стоять 1, и во всяком случае остальные элементы этой строки и этого столбца равны 0. То же относится ко всем
408 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.52 строкам с номерами от у-{-1 до б и столбцам с номерами от а+ 1 до (J. Если в столбце матрицы Л12 с номером 6+ 1 имеются две единицы, все элементы соответствующей строки матрицы В21 равны 0. То же относится ко всем тем столбцам, идущим за 6-м, в которых имеется по две единицы. Если же в столбце матрицы А12 оказывается только одна единица, то имеются две единицы в соответствующей строке с номером >(J, что приводит к равенству нулю столбца матрицы В21 с тем же номером. В результате весь правый нижний угол матрицы В21 заполняется нулями. Действительно, если взять место (у, к) в этом углу и рассмотреть соответствующее место (k, у) в матрице Л12, то k-я строка или у-й столбец имеет в матрице Л12 по крайней мере две единицы (иначе мы поместили бы эти строку и столбец раньше). Значит, k-й столбец или у-я строка в В21 состоит сплошь из нулей; следовательно, на месте (у, к) должен быть нуль. Левый нижний и правый верхний углы в матрице В21 также сплошь состоят из нулей; действительно, если бы в матрице В21 оказалась 1 где-нибудь в левом нижнем углу, например на месте (у, &), то, по симметрии построения, в матрице Л12 все элементы у-го столбца, кроме того, который стоит в k-и строке (т. е. в правом верхнем углу матрицы А12\), должны были бы быть равными нулю. В этом столбце обязательно есть единицы в правом нижнем углу. Что же касается элементов левого верхнего угла матрицы В21, то они могут быть произвольными. Ясно, что нашу категорию можно расширить, присоединив к множеству S12 все элементы нижнего правого угла матрицы (8) (если S12 еще содержит не все эти элементы) и к множеству S21 все элементы левого верхнего угла матрицы (9). После этого категория К станет максимальной, так как уже нельзя будет расширить S12 без уменьшения S2V На языке геометрии, максимальная категория из двух пространств устроена так: пространство Х1 разбито в прямую сумму трех подпространств, положим X?, Х|, X*, и пространство Х2 разбито в прямую сумму трех подпространств Х°2, Х{, Х|, причем dim X} = dim Х£; действие оператора А12 состоит в том, что XJ переходит в 0, X} отображается диагональной матрицей в Х\, Х\ любым образом отображается в Х|, а действие оператора В21 состоит в том, что Х\ любым образом отображается в Х\у Х\ — диагональной матрицей в Х\ и Х\ — в нуль. Произвольная (не максимальная) кате-
12.53) § 12.5. полные алгебры диагональных матриц 409 гория отличается от максимальной тем, что операторы, переводящие Х\ в Х\, не произвольны, а соответствуют матрицам с некоторыми закрепленными местами для нулей. То же можно сказать об операторах, переводящих Х° в X?; при этом между местами этих нулей может не быть уже никакой связи. 12.53. Теперь займемся описанием категории $ с любым числом пространств Ха. Прежде всего ясно, что каждая подкатегория категории $, образованная парой пространств Ха, X и соответствующими системами $8 и 93аз, устроена так, как было описано выше: в матрицах этих систем выделены множества S и S^, и 33™ состоит из всех матриц, у которых на множестве S„a стоят любые числа, а вне этого множества — нули, и аналогично устроена система $8 . Мы будем обозначать через 5 любое подмножество мест в совокупности матриц фиксированного размера тхп. Множество элементов главной диагонали квадратных матриц будем обозначать D. Совокупность всех /#хл-матриц, имеющих на местах 5 произвольные элементы, а вне S — нули, обозначим через ?8тп (S). Пусть имеется множество Sly определенное на /яхл-матрицах, и множество S2l определенное на /zxp-матрицах. Определим на т Х/?-матрицах множество 5 (будем называть его произведением S^^, которое состоит из всех тех мест в /яхр-матрицах, на которых могут получаться, ненулевые элементы в произведении $Втп (St) %5np{S2). Иначе говоря, место (у, k) принадлежит совокупности SXS2 тогда и только тогда, когда существует номер у такой, то (/, у) принадлежит Sly а (у, k) принадлежит S2. Пусть Slly ..., Slr — совокупность множеств на /#ХЛ-матрицах и S2l, •••» $2q— совокупность множеств на /zxp-матрицах. Из определения произведения легко вытекает общая формула U Sy U S2i = U U SyS2i. (10) С помощью операции произведения S-множеств условия категории этого параграфа можно записать так:
410 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.54 12.54. Теперь мы построим семейство некоторых конкретных категорий. Задать категорию Я'— значит задать все семейства /?,г или, что в данном случае то же, задать все множества S . Выберем произвольно S21 и затем подберем такое Sl2, чтобы выполнялись условия S21S12cD, S12S21aD; как это сделать, описано выше. Допустим, что уже построены S.-k для всех j и k, меньших /z, с выполнением свойств категории (11). Покажем, как построить Sjn и Snj при у < п. Выберем Sul произвольно, a Sln с выполнением условия ад;1сО, SnlSlnc:D. Пусть уже выбраны S/n и Sn/ для всех j < k с выполнением условий (11) и нам остается выбрать Snk и 5^. Для искомых множеств 5иЛ и SfcM должны быть выполнены условия, вытекающие из (11): а) Srik^kn^D, SknSrlkczD; б) SjkSkn^Sjrn ^kriSri/^Skf) SiriSnk^Sifr, SnkSkic:Sni; Условия а), б) ограничивают множества Snk и Skn сверху, условия в) — снизу. Покажем, что все эти условия совместны. Положим, например, /2-1 П-\ $кп= U SkiSini $пк— U SnjSjk. /=1 /=1 Тогда, по предположению индукции и в силу формулы (10), п-\ п-\ п-1п-1 ^пк^кп— U SnjSjk U SkiSin= U U Sn-S-kSkiSinc: /= i /=i /= i /=i с "и" "и' W^cV ЗД„еД /= 1 /= 1 /=1 л- 1 п-1 л- 1 SjkSkn — Sjk U ^ki^in= U SjkSkiSinc: (J SjtSinc:Sjn. i=\ i=1 /= 1 Мы проверили первое из соотношений а) и первое из соотношений б). Ясно, что остальные справедливы по тем же соображениям. Итак, индукция оправдана и наше построение корректно. Можно, разумеется, строить категорию с помощью любых Skn и Snk, удовлетворяющих условиям а) — в), а не только того специального вида, который мы использовали при доказательстве совместности этих условий. Таким образом, мы получаем широкое семейство конкретных категорий,
12.61] § 12.6. категории и прямые суммы 411 в каждой из которых полностью произвольными являются лишь множества Snl, все же остальные множества S^ подчинены дополнительным условиям а) — в). 12.55. Покажем, что любая категория $ с условиями 23^33,3с23 (D) принадлежит к этому семейству. Действительно, в категории определены множества Snl и Sln для всех п\ все остальные множества Snk и Skn должны удовлетворять условиям а) — в), а это и значит, что категория принадлежит к числу описанных. Было бы интересно выяснить, какой вид имеют максимальные категории описанного семейства. § 12.6. Категории и прямые суммы 12.61. Пусть имеется категория S{ с основными пространствами Ху, алгебрами 23у- и системами 23у7г Мы укажем, как построить категорию, в которой основными пространствами являются прямые суммы пространств Х- (в произвольных комбинациях) и основными алгебрами — соответствующие прямые суммы алгебр 23у. Пусть Ху—прямая сумма пространств X}, ..., X/, 23- — прямая сумма соответствующих алгебр 23/, ..., 23/; (т. е. оператор Al£ 25у- в пространстве X* действует, как любой из операторов алгебры 23/). Нужно определить оператор Лу7с23у7. Мы задаем Лу7 с помощью блок-матрицы Ал = Ш А1Л А1'1 А--1 W Ajf A2-k: Akix AW • • • Лп (12) где блок APjiq отвечает произвольному оператору категории, который действует из пространства Xq£ в X?, /?=1, . . ., &у-; q=^\, . . ., kt. Покажем, что при этом получается категория. Действительно, если Bfi Bfi Ви = Bh* tip ПЦ DU . . . t!U
412 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.62 то АнВи = \klDki\ А?м+А)т\+.--+А)?ва и все получающиеся суммы произведений принадлежат снова к соответствующим системам согласно определению категории Я*. Итак, наше правило приводит к новой категории W, которую будем называть расширением категории й. 12.62. Оказывается, что верно и обратное: если основные пространства Ху-, фигурирующие в некоторой категории, суть прямые суммы некоторых пространств X'-, /= 1, . . ., kj> и соответствующие алгебры 5В- — прямые суммы алгебр 33J-, /=1, • • •, к;, операторов, действующих в Ху, то вся категория Я' есть расширение Я* в указанном смысле некоторой категории Я, построенной по пространству Ху и алгебрам 35/. Действительно, пусть имеется категория й указанного вида. В базисе, выбранном в подпространствах Ху, матрица Aj алгебры 33у. имеет квазидиагональный вид А) А]' причем квадратная матрица А) имеет Гу строк и столбцов. Матрицу А-( категории Ш можно представить в форме блок-матрицы АМ = AW AW И?1 И?? A2-ki AkJl Ak.fl A-l kjki
12.63) § 12.6. КАТЕГОРИИ И ПРЯМЫЕ СУММЫ 413 при этом блок АЧ? имеет гр. строк и г? столбцов. С блоком Арц естественно можно связать оператор, переводящий пространство X? в пространство Ху. Используя все такие операторы, мы построим новую категорию Alf/7, для которой основными пространствами будут пространства X/, основными алгебрами — алгебры 23/ и основными системами — системы S3 у/7 операторов, определенных матрицами А™. Докажем, что указанный набор объектов определяет категорию. Пусть имеются оператор А™, действующий из X/ в Ху, и оператор А^-, действующий из Х^- в Х£; покажем, что их произведение Arkp}- принадлежит классу 23j#. Действительно, в категории 31 имеется матрица, в которой все блоки, кроме (р, <7)-го, равны нулю, а блок с индексами (р, д) занимает матрица А*}?, и есть другая матрица с единственным отличным от нуля блоком Arkpj. Произведение этих матриц принадлежит категории Я1, и в нем имеется единственный ненулевой блок ArkPAPi, что и требуется. Итак, все условия категории выполнены; правда, не определены еще операторы, действующие из пространства Х'у- в Ху с тем же нижним индексом. Однако можно положить все такие операторы равными нулю, что не нарушит требований категории. 12.63. Так как каждая полупростая алгебра операторов, действующих в пространстве Ху, позволяет разбить пространство Ху. в прямую сумму пространств Х^-, в которых действует уже простая алгебра, мы видим, что структура общей категории с полупростыми алгебрами приводится к структуре категории с простыми алгебрами. (Этот вопрос мы рассмотрели в § 12.4.) В соответствующем базисе матрица каждого оператора £1у7 категории Я1 имеет вид (11), причем каждый из блоков АР[ есть оператор семейства 23у/ некоторой категории Яу7 с основными пространствами Ху и X? и простыми алгебрами 23*} и 23/. Некоторые блоки матрицы 91у/€ 23у7 могут быть тождественно (для всех 9{у7) равными нулю. Если обозначить их множество через Sjh то возникает вопрос, как связаны между собой эти множества при разных
414 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.63 индексах j и /. Подобный вопрос для случая одномерных блоков мы рассматривали в § 12.5. Метод, использованный там, применим и в данном случае и приводит к следующему результату. Если категория, определяемая скрещением j-ft блок-строки и i-го блок-столбца матрицы %21 £ 3321 типа Я^ (12.31) или \{3 (12.41), т. е. связана с обратимыми матрицами, то в /-и блок-строке и в j-м блок-столбце матрицы 2(12 все блоки, кроме находящегося в их скрещении, определяют нулевые категории. Если указанная категория типа Й\2 (12.31), то в указанных блоках находятся матрицы категории типа Я2, дающие в произведении с данной нуль. Это позволяет судить и об устройстве общей категории, как в § 12.5. Замечание. А. Я. Хелемский (Вестник МГУ, серия Математика и механика, 1963, № 4, стр. 49—55) нашел категории, соответствующие ннльпотентным алгебрам 25.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ К главе 1 1. Ответ, а) +» б) + . 2. Ответ. аиа^ао^а4А, Д-цЯ^яЧЛ^ az\aA*a^aAi- 3. Ответ. (_Г)«(м-1)/г. ' 4. Указание. Рассмотреть определитель, все элементы которого равны единице. 5. Ответ. A = (mq— пр) (ad — be). 6. Указание. Умножить первый столбец на 104, второй — на 103, третий — на 102, четвертый — на 101 и прибавить к последнему столбцу; использовать, далее, следствие 1.45. 7. Ответ. Д1== — 29 400 000, Д., = 394. 8. Указание. Очевидно, Р (х) есть многочлен 4-й степени. Можно подсчитать его старший коэффициент, а затем определить его корни из условия совпадения строк определителя. 'Ответ. Р (*) = — 3 (х* — 1) (**— 4). 9. Указание. Прибавить все столбцы к первому. Ответ. А = [* + (/! — 1) а] (х — а)"~ К 10. Указание. Заменив хп на л- и использовав идею решения задачи 8, получить соотношение А(Хг, А'о, . . . *„_!, А') = Д (X, . . . , Xfl_!)-(X — ^) . . . (* — *„-!). Ответ. A (xlf х2, ..., *м) = (*2— *i) (*з— *i)(*3— х2)...Х У{хп xu-i) ... (хп xn-i)t 11. Ответ. Сх = 0, С2 = 2, С3= — 2, С4 = 0, С3 = 3. 12. Ответ. У\М'?' {■• -• ft-Я''1, '"Г ""' '* = 0, ^ у»' /2' ••• ' !k /,, /г. •••• У/с где /i < /г < • • • < ife и ii < /о < ... < ik фиксированы, причем хотя бы одно из /а не совпадает с соответствующим ia. 13. Указание. Достаточно, чтобы соответствующий определитель 4-го порядка был отличен от нуля. 14. Указание. Использовать результаты 1.96—1.97. К главе 2 1. Ответ. Нет, ибо в пределах этой совокупности нельзя умножить на — 1. 2. Ответ. Нет, ибо в пределах этой совокупности нельзя сложить два вектора, симметричных относительно заданной прямой.
416 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 3. Ответ. Да. В частности, «нулем» пространства Р служит число 1 £Р. 4. Указание. Использовать 1.96. 5. Указание. Предполагая наличие зависимости разделить на № и продифференцировать, далее использовать индукцию по k. 6. Указание. Показать, что нуль-вектор также допускает единственное разложение по системе ev е2, ... , еп. Отсюда вывести линейную независимость векторов этой системы. 7. Ответ. Да, из одного вектора — любого элемента х£Р, отличного от 1. 8. Ответ. 1. 9. Ответ. Пересечение — прямая пересечения двух плоскостей в обычном смысле. Сумма — все пространство. 10. Использовать 2.34. 11. Ответ. Нет. Его можно заменить на любой другой вектор этой гиперплоскости. 12. Ответ. В «точечной» интерпретации: каждая гиперплоскость вместе с любыми двумя своими точками содержит проходящую через них прямую. 13. Ответ. В общем случае p-\-q+\y если это число не превосходит размерности всего пространства. 14. Ответ, р-\-q-\-r-\-2, если это число не превосходит размерности всего пространства. 15. Ответ. Поставить в соответствие каждому положительному числу его логарифм. К главе 3 1. Указание. В матрице ранга 1 столбцы пропорциональны. 2. Указание. Нужно так написать условия принадлежности вектора у подпространству L, чтобы в них участвовали только миноры &-го порядка матрицы А. Но y£L тогда и только тогда, когда матрица В, полученная присоединением к матрице А столбца из координат векторам/, имеет ранг /г, или, что то же самое, каждый ее минор (k\- l)-ro порядка равен нулю. Разлагая каждый минор (k + 1)-го порядка матрицы В по последнему столбцу, можно получить некоторую систему уравнений относительно координат вектора у с коэффициентами — минорами /г-го порядка матрицы А. 3. Указание. Использовать 1.51—1.52. 4. Ответ, х = (съ с2, с3, с4, с5), где сх= — 16 + с3 + с4 + 5с5, с2 = 23 — 2с3 — 2с4 — 6с5. 5. Ответ. Если (X—1) (Л, -+- 2) ^0, то Х+1 _ _J (^ + 1)2 Х~ Х + 2 ' У~ Х + 2 ' Z~ Л + 2 ' Если Х=\, система имеет решения, зависящие от двух параметров. Если Х=—2, система несовместна.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 417 6. Ответ. Если матрицы ранг. 7. Ответ. Матрицы Ifl! Ьх\ #2 ^2 кз b3\ И Ifl! Ьх CJ \а2 b2 с2\ \аз h сз[ \ai \а2 \<*п h ь2 Ьп 1 и а2 b2 ап bn имеют одинаковый имеют одинаковый ранг. 8. Ответ. **> = (1,-2, 1, 0, 0), х<2> = (1,-2, 0, 1, 0), х<з> = (5,_6, 0, 0, 1). 9. Ответ. Например, 1—161 23 0 0 1 о \ + сЛ 1 1 1—2 1 0 о| г°2\ 1 1 —2 0 1 о + С8 1 51 —6 1 о 0 1| х = Здесь в первом столбце выписаны координаты вектора х0 — частного решения неоднородной системы; в остальных столбцах — координаты векторов у{1\ у{2), у(3), образующих нормальную фундаментальную систему решений соответствующей однородной системы. 10. Ответ. Ранг AY равен 3; базисный минор, например, в левом верхнем углу. Ранг А2 равен пяти, базисный минор совпадает с определителем матрицы. 11. Указание. Перевести минор М в левый верхний угол и затем, применив процедуру 3.62, показать, что столбцы матрицы Л, начиная с (r-f-l)-ro, можно сделать нулевыми. 12. Указание. Если Р Ф 0, искать матрицу А в виде Р 0 х\\ 0 1 у\\' 13. Указание. Или ранг матрицы \\ ajk \\ равен п, или он меньше п. 14. Указание. Использовать теорему Кронекера — Капелли. 15. Указание. Использовать результат задачи 14. 16. Указанае. См. 6.63 (18). главе 4 1. Ответ. Также п. 2. Ответ, в) и ж). 3. Ответ. Да. 4. Ответ. а) А{е)=. 1—1 1 1—1 — 1 21 -3 3 —5 5 ; б) а{х)= J2 1 2 0 — 1 1 —2 1 0 14 Г. Е. Шилов
418 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ б. Ответ. АВ АВ ф А2В2. 6. Ответ. АВ — ВА = Е. 7. Ответ. (А + В)2 = А2 + АВ + ВА+В2, (А + В)з = А3 + А2В + ABA + АВ2 + В А2 + В АВ + В2А + В8. 8. Указание. Применить метод индукции. 9. Ответ. Размерность пространства равна тп. В качестве базисных операторов можно взять такие, которым соответствуют матрицы Ajj с единственным ненулевым элементом на пересечении t-й строки и /-го столбца. 10. Ответ. АВ = 11. Ответ. Ап = 12. 13. Ответ. А Ответ. 0 0 0 0 0 0 0 0 0 1 п 0 1 Ь — а Вп = COS Яф sin лф sin гсер cos жр где be = — а2 а) 9 6 7 — 2 14 5 — 10 8 —5 . б) 10 0 011 0 0 0 |0 0 0 15. Указание. Найти след обеих частей равенства. 16. Указание. Три уравнения для неизвестных элементов матриц А и В приводятся к уравнениям для трех миноров неизвестной матрицы с двумя строками и тремя столбцами. Использовать задачу 12 к гл. 3. 17. Указание. Использовать 4.54. 18. Указание. Записать элементы минора М через элементы, находящиеся в первых г строках, и применить теорему 4.54. 19. Указание. Использовать решение задачи 18. 20. Указание. См. 4.54. 21. Ответ. 5 —2 ■2 1 В~1 = 1 —2 0 1 0 0 С. Х = 23. Ответ. Если А — нулевая матрица, то X — любая. Если det Л Ф 0, то X — нулевая матрица. Если det/4 = 0, но А — ненулевая матрица, то ее строки пропорциональны; пусть а:^ есть отношение соответствующих элементов первой и второй строк матрицы А\ тогда РР ар II Р<7 °W II при любых р и q. 24. Указание. Использовать 1.51 —1.52. 25. Ответ. Нет. 26. Указание. Например, Ах [а0 + ах t -\ ]= А [а0 + а\ tJ 14- 27. Указание. Оператор А переводит линейно независимые векю- ры снова в линейно независимые.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 419 28. Указание. Применить равенство АВ = ВА к собственному вектору оператора В. 31. Указание. Использовать результат задачи 30. 32. Указание. Подбирая должным образом оператор В и используя задачу 28, свести решение к задаче 31. 34. Указание. Использовать разложение оператора А2 — |Л2Е на множители. 35. Ответ, а) ^ = 2, /1 = (1, 0, 0); Х2 = \, /2 = (1, 0, 1); Ь3 = -1, /з = (0, 1, -1); б) ^ = -1; /х = (1, 0, 0); Х2 = Х3=\, /2 = (1, 0, 1); /з=(0, 1, 1); в) Х1 = 2, /1 = (1, 0, 0); г)^=1, /1 = (1, 0, 0,-1); ^2 = (0, 1, 0, 0). 36. Указание. Включение Т (А*) а N (Ат) необходимо и достаточно для равенства А*+От = 0 37. Указание. Пусть /ь ... , fr—базис области значений оператора А, так что для любого х£Кп имеем г Ах = ^aj{x)fj. / = i Положить AjX = aj(x) fj (/ = 1, ... , п). К главе 5 1. Указание. Первый вектор нового базиса есть х. 2. Указание. Выбрать новый базис flt /2, ..., fn так, чтобы первые k векторов составляли базис подпространства К'. Записать условие х£К' системой координатных уравнений в новом базисе. Используя формулы перехода, построить соответствующую систему координатных уравнений в исходном базисе. 3. Указание. Использовать определение гиперплоскости и задачу 2. 4. Ответ. Матрица искомого преобразования С = ВА~1. 5. Указание. Пусть еъ ..., еп — произвольный базис в Кп и п /(*)= 2 С*&Ь' где ^' "•, £»~координаты вектора х. Формулы преобразования координат начать с уравнения п 6. Указание. Использовать 4.83 и инвариантность характеристического многочлена (5.53). 7. Указание. Выбрать базис так, чтобы первые т его векторов лежали в подпространстве R(V. Показать, что для этого базиса многочлен det ]| Аф—ХЕ || имеет множителем (X—Х0)т. Использовать инвариантность характеристического многочлена (5.53). К главе 6 1. Ответ. В базисе хп, xn_ly ...txv 2. Указание. См. 6.44. 14*
420 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 3. Ответ: —1 0 0 0 0 10 0 0 -10 0 0 0 2 10 0 0 2 0 0 0 0 2 4. Ответ. Нет: Е2 (А) = (Х—2) (к— I)2, Е2 (В) = (А,— 1) (№—5Х—2). 5. Ответ. Еп_1(А1) = En-1(A2) = (l-X)«, En_2(A1) = En-2(A2)=U En-i(A3) = (n-X)», £„-2(Л3)=1; 6. Указание. Еп„1(А) = (а—Х)п, Еп_2(А)=\. 7. Ответ. Диагональная матрица, на диагонали которой стоят некоторые из корней многочлена Р(Х). 8. Ответ. На диагонали жордановых клеток стоят некоторые из корней многочлена Р (X), и размеры клеток не больше кратности соответствующего корня. 9. Указание. Векторы х, Ах, А2х линейно зависимы. 10. Ответ. Многочлены от Ат (а). 11. Ответ. Матрицы вида Ьх Ь2 Ь3 ...Ьп 0 Ьх Ь% ...&„_! Втп = 0 0 0 ... V-A-m+l (п^т) или Втп = 12. Ответ. Матрицы вида Ьх Ь2 ... Ьп 0 Ьх ... Ъп_ъ 0 0 . 0 0 . 0 0 . .. ьг .. 0 .. 0 (п ^ т). R R R umtmt 0тхтг • • • Dmlmii R R | miitTii ntftmi . В т^тк где блоки Bmmi указаны в задачах 10 и 11 IjtTlj 13. Ответ. Матрицы вида Втт. 0 тггпг о в, о о в о о
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 421 14. Ответ. Для каждой группы жордановых блоков с одним и тем же характеристическим корнем—блок, указанный в задаче 12. Остальные элементы — нули. 15. Ответ. Если кратность каждого характеристического корня равна размеру соответствующей жордановой клетки (или: характеристический многочлен совпадает с минимальным; или: все элементарные делители, кроме самого старшего, равны 1). 16. Указание. Использовать 6.63(18). К главе 7 1. Ответ. Тензор второго ранга, два раза ковариантный. 2. Ответ. Например, 2 2 2 где ~2 €1 + ~9"Ь2+ьз» ^2 — ""И" Si—о Л! = "о" ?1 + "гГ^2+^3» ^2 = -^" £l FT&2» Лз = 5з- 3. Указание. Использовать 7.93. 4. Указание. Использовать 4.54. и 7.15. 5. Ответ. Например, А (х, у) = о1х1 + а2т2-Ь оуг3, где а,- и т/ (i=l, 2, 3) — новые координаты векторов х и у. При этом формулы перехода к новому базису следующие: 04 = Si-r-S2> о~2 = £2 + 2£з> о3 = 13. 6. Указание. Сначала изменить нумерацию координат таким образом, чтобы матрица билинейной формы А (х, у) преобразовалась к виду, допускающему применение метода Якоби. 7. Указание. ||—а,Л II есть матрица положительно определенной формы. Ответ. о„ < 0, | ^ £| | > 0 (-1)" det || aik || > 0. 8. Указание. Использовать замечание к 7.96. 9. Указание. Рассмотреть эту форму на базисных векторах. 10. Указание. Последняя строка определителя состоит из элементов a<n) = (_i)*-iA(eb uuu9 ek_lt ek + lt ..., еп)у k=lt ..., п. 11. Указание. Первую пару базисных векторов еъ е2 найти из уравнения А (еъ е2)=\\ построить подпространство L, определяемое уравнениями А(еъ х) = 0, А (е2, х) = 0, и, если форма А (х, у) в нем не равна тождественно нулю, определить векторы е3, eA£L так, чтобы А (е3, еА)=\\ и т. д. п 12. Указание. Рассмотреть форму А(х, х)-\-е^ х) (е > 0) /=1 и применить критерий 7.96.
422 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 13. Указание. Пусть хф = {$\ ..., &} (/=1, ..., г)—базис подпространства К'. Тогда К" состоит из векторов у = {г\х, ..., г\.^у удовлетворяющих системе Матрица коэффициентов системы есть произведение невырожденной матрицы ||a,-fc|| формы А (х, у) и матрицы ||£j;)|] ранга г. Использовать 4.67. 14. Ответ. А' = А. 15. Указание. Если j/^rh, ..., г]„} есть решение системы (44), то (6, г/) = (А*, у) = (х, А'у) = 0. Обратно: система (44) есть условие сопряженности вектора у и векторов af=\aJ1} ..., ajn)\ если (fr, г/) = 0 для всех таких у, то л: лежит в линейной оболочке векторов ах, ..., ап. 16. Указание. См. задачу 37 к гл. 4. 17. Указание. См. задачу 1 к гл. 3. 18. Указание. Сначала рассмотреть случай неотрицательных форм ранга 1, использовать задачу 17. Затем применить задачу 16. К главе 8 1. Ответ. Нет, ибо не выполняется аксиома 8.21 б) и аксиома 8.21 а) для К = — 1. 2. Ответ. Нет, ибо не выполняется аксиома 8.21 б). 3. Ответ. Можно. Это равносильно изменению масштаба на осях. 4. Указание. Обозначить через ех, е2, еъ векторы, идущие из фиксированной вершины тетраэдра по трем его ребрам, и найти векторные выражения для остальных его ребер. Оглвет. 90°. 5. Ответ. 90°, 60°, 30°. 6. Ответ. I <]/ \x*(t)dt+y \y4t)dt , \ а а У 5<*(0 + И0)'Л | | ,-ь л— ]/ J *■ (о л - ]/ J у» (о dt а а 1 7. Ответ. cosw = —f= - У п 8. Ответ, a) g = (3, 1, —1, —2), Л = (2, 1, —1, 4), б) £ = (1, 7, 3, 3), Л = ( —4, -2, 6, 0). 9. Указание. Использовать определение угла 8.33 и ортогональность Еектора h ко всем векторам подпространства R'.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 423 10. Указание. Умножить скалярно равенство 8.51 (18) на век- 11. Указание. Использовать 8.54 и 8.52. 12. Ответ. ух = 1, */2 = #з = °> 04 = —2/ 05 = 0» */з = 5&. 13. Ответ. (1, 2, 1, 3); (10, —1, 1, —3); (19, —87, —61, 71). 14. Указание. Предполагая, что размерность R" больше, чем размерность R', рассмотреть вектор e"£R", ортогональный к проекции подпространства R' на R"; использовать задачу 10. 15. Ответ. Ап= ^])% . 16. Ответ. Рп (—1) = ( — \)п. 17. Указание. Записать искомые коэффициенты через скалярные произведения. 18. Указание. Использовать решения задач 15 и 16. 19. Указание. Разложить Q (t) по многочленам Лежандра. Ответ. Q(t) = — Pn(t). An 20. Ответ. \\Pn{t)f~~~. 21. Ответ. fc(/4)Hdet Л \. 22. Указание. Использовать 4.75. 23. Указание. Речь идет о том, чтобы сравнить высоты двух гиперпараллелепипедов. 24. Указание. Неравенства У[хъ х2, ..., хт] У[хъ ..., xk\ V [х1у ..., *a-i» Xk+it •••> хт] Vlxi> •••> xk-ii (k = \, 2, ..., m) получаются из неравенства задачи 23. Перемножить их для всех &=1, 2, ..., т, произвести сокращения и извлечь корень (т—1)-й степени. Геометрический смысл: объем m-мерного гиперпараллелепипеда не превосходит произведения корней (т—1)-й степени из объемов его (т—1)-мерных граней. 25. Указание. Написать неравенство задачи 24. для xs , xs ... ... , xsr и перемножить такие неравенства для всех допустимых значений slts2, .. • , sr. 26. Указание. Требуется построить в 2от-мерном пространстве гиперпараллелепипед, у которого проекции ребер на каждую ось не превосходят по абсолютной величине числа М и объем которого в точности равен Мп пп/2. Для М = 1 матрица Ат координат искомых векторов в 2от-мер- ном пространстве может быть задана рекуррентной формулой А-т — /i т — 1 rim — 1 1 1 —1 Пр име ча ни е. Для п Ф 2т оценка Мп пп/2 может быть улучшена.
424 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 27. Указание. Пусть G1 означает ортогональное дополнение подпространства G в R. Для каждого *gN(A) и для каждого z£R (А'г, *) = (z, А*) = 0, откуда A'zgN-^AJ.T.e. T (А') с N-^A), TJ-(A/) Z) N (А). Для каждого *£Т±(Д) и для каждого */£R (А'х, */) = (*, Ау) = 0, откуда А'х = 0, т. е. xgN(A'); таким образом, Т1 (А) с N (А'), T1(A,)cN(A). Отсюда N (A) = T1(A,)J N1 (А) = Т (А'). Аналогично доказывается второе утверждение. 28. Указание. Сравнить 8.93 с 1.51—1.52. 29. Указание. Использовать 4.54. 30. Указание. Углы треугольника однозначно определяются по его сторонам. Другой метод: симметричная билинейная форма (Q*, Qy) однозначно восстанавливается по квадратичной (Qx, Qx). 31. Указание. Данный равноугольный оператор С преобразует ортогональный и нормированный базис eL, е2, ... , еп в ортогональный базис f[=a1f1, /г = а2/2, ... , /л = ая/я, где /lf f2, ... , /„ нормированы. Пусть Q—изометрический оператор, переводящий векторы /1» /2» • • • у fn в еъ е2> •••> еп* тогда матрица равноугольного оператора QC диагональна. Показать, что условие <х/ = ау позволяет построить пару ортогональных векторов, которые переходят в неортогональные в результате применения оператора QC. 32. Указание. Достаточно показать, что Q — равноугольный оператор (задача 31). В предположении, что имеется прямой угол, который переходит не в прямой, построить параллелограмм, площадь которого в результате применения оператора Q изменится. 33. Указание. Обобщить конструкцию задачи 32. 34. Указание. Применив к данным системам процесс ортогонали- зации, получить ортогональные и нормированные системы ех, е2, ... и /lt /2» • • • Используя 8.53, показать, что векторы хх, х2, ... выражаются через ех, е2, ... по таким же формулам, по каким векторы ух, у2, ... выражаются через fx, f2, ... Оператор Q задать путем отображения системы ех, е2, ... на систему flt f2, 35. Указание. Рассмотреть конечные системы e'v e'x', е'г, е'2\ ... ... , e'k, е'ъ и /;, /;',/;, /2\ ...,/;, f'k\ полученные при определении углов между подпространствами R' и R" и подпространствами S' и S". Согласно построению («J. e'/) = (f'r /;/) = со5Ф/,(/=1, 2 k), (е-, «}) = (/;, /;) = 0, (е'/, е'.') = (Г/, /;')«0 (iV/); далее показать, что (e'r e'.') = (f'., f',') = 0 (используя задачу 9). Затем применить результат задачи 34. 36. Указание. Использовать задачу 11. 37. Указание. Выбрать в подпространствах Lx и L2 базисы glf ..., ет и ifi» /2. •••»//я» полученные при построении углов alf ...,am.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 425 В пространстве R построить базис е1у е2, ... , ет, ет + 1, ... , еп> первые векторы которого получены путем ортогонализации векторов *i, еъ ... , ет, /lt /2, .... f.m- Разложить векторы xv х2, ... , хт, уъ #2» • • • » Ут по построенному базису. Показать, что матрицы этих разложений имеют только по одному минору m-го порядка, если не считать миноров, заведомо равных нулю. Использовать, далее, выражение объема параллелепипеда через миноры соответствующей матрицы. 38. Указание. Использовать задачу 2 к гл. 3 и задачу 17 к гл. 4. 39. Указание. Проверить утверждение задачи в специальном ба- висе, первые k векторов которого принадлежат к подпространству L {xv х2, ... , xk}. Для перехода к общему случаю использовать задачу 17 к гл. 4, причем показать, что det || aSp || =1. 40. Указание. Сначала рассмотреть случай k = 2. 41. Указание. Выбрать в пространстве R базис, как указано в задаче 37, и проверить утверждение задачи в этом базисе. Для перехода к общему случаю действовать так же, как в задаче 39. 42. Указание. Использовать 4.54. 43. Указание. Рассмотреть ортогональное дополнение Z к инвариантному (относительно А) подпространству Н всех векторов л*, для которых Р(А)л: = 0. Подпространство Z также инвариантно относительно оператора А, следовательно, и относительно [Р (А)]*"1. Но если zgZ, то [Р (А)]!'е-1г £ Н, откуд.а[Р (A)[k~1z = 0. Отсюда получить, что [Р (t)]k-x есть аннулирующий многочлен оператора А. К главе 9 1. Указание. Использовать 9.34. 2. Указание. Оператор В имеет базис из собственных векторов «1» • • • » еп с положительными собственными значениями \ilt ... , цп. Отсюда B2e( = \ifei, и если мы желаем удовлетворить равенству В2 = А, необходимо, чтобы e-L были собственными векторами оператора А, а числа \ij совпадали с А,. Но этого и достаточно для В2 = А. 3. Указание. Предварительно преобразовать базис так, чтобы матрица данного оператора приняла диагональный вид. Ответ. У А = 3 2 0 2 4 2 0 2 5 4. Указание. Оператор А'А самосопряжен, и выражение (А'Ах, *)=* в= (Ах, Ал*) неотрицательно при любом x£Rn. Если А невырожден, то это выражение положительно при любом x£Rn. 5. Указание. Использовать равенство (АВ)*=В*А*. 6. Указание. Оператор АА* самосопряжен и положителен (задача 4), поэтому можно найти самосопряженный и положительный оператор S так, чтобы иметь Sa = AA*\ Далее построить оператор Q по формуле Q = S_1A и показать, что Q — унитарный оператор. 7. Указание. Использовать задачи 5 и 2. 8. Указание. Пусть R' с R« — подпространство, порожденное собственными векторами оператора А'А с ненулевыми собственными значениями, и R"—ортогональное дополнение к R\ На R' положить V
426 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ равным унитарной составляющей А (так что V^A'A Vx = Ах), на R" положить Ул: = 0. 9. Указание. Использовать задачи 28 и 29 к гл. 4. 10. Указание. Применить к векторам жорданова базиса оператора А (6.37) процесс ортогонализации. К главе 10 1. Ответ. а) 4г]12 + т122-2Лз2; 4i= | Si —1~§2 + ~ 6з» _ 2 1 2 . Лг — "S~Ъ1 i "о" Ь2 о" ьз» Лз = "о" li + "о" Sa + -Q- 5з» б) 1СН||Ч-Л| + Л1; Л1=~|1 + у?2—|^ _ 2 1 t n - 2 S д. 4 Е + ^3 8 В) Л2-^ + ЗТ)32 + 5^; Л1—g-6l+y6l + yE8 + y64. __ 1 с . 1 t 1 у 1 t Лг — -g" Si + -у *2 — "9"^з 2^Ь4> Лз3-^^— "2"?2 + -2"^з—2 !U» 1 а 1 О 1 О . 1 р Л4 — yfel о- Ь2 2" ЬзН--^" Ь4» г) Л2 + Л2 + Л32-Зл2: 4i = *J-8i + ^Ei. „ _*% , ^2 , Лг — ~2— Ь2 и—о~ Ь4» Лз — ~2 51—о" Ь2 + "9" 5з—о" *4' Л4 = ~2 »1 о" 52 2 ЪЗ + "о" Ы- 2. Ответ. Максимум при х = (±\, 0, 0), где А (х, х) = 1. Минимум при х = (0, 0, ±1), где А (х, х) = -^-. При х = (0, ±1, 0), где А(х, *)=*—,—мин имакс
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 427 (т. е. при движении по единичной сфере в одну сторону от точки х функция А (х, х) возрастает, а в другую — убывает). 3. Указание. А именно, на подпространствах, натянутых на соответствующие канонические базисные векторы. 4. Указание. Коэффициент Xk равен наименьшему из максимумов формы А (л:, х) на некоторой системе подпространств, а коэффициент jLife равен наименьшему из максимумов формы В (л:, х) на той же системе подпространств. 5. Ответ. — = ± — . х 2 6. Ответ. А (х, х^г^ + ЛН^з' В (*• *) = *)? +2^ + 3^, £i = *h— т)2 + 2гь ?2 = Л2—Лз, 53 = ^3- 7. Указание. Вопрос сводится к единственности канонического базиса у симметричного оператора с попарно различными собственными значениями. 8. Указание. Обобщить 7.44. 9. Ответ, а) Однополостный гиперболоид с осевой линией вдоль оси у\ б) однополостный гиперболоид с осевой линией вдоль оси х\ в) круговой параболоид с осевой линией вдоль оси х\ г) круговой параболоид с осевой линией вдоль оси у, сдвинутый на 1 вдоль этой оси; д) гиперболический параболоид. 10. Ответ. а)х2_|_2^ + 3г2 = 6; 3(х-1)= -Xl + 2yi+2zlt 3y = 2x,-y1 + 2zl, 3(z+\) = 2x1 + 2yl-zl; 6)х1 + 2у1-Щ = е>- 3(х + \) = -х1 + 2у1 + 2г1, 3(y+\) = 2x1-y1 + 2z1, 3z = 2x1 + 2y1 — z1; в) у\ = 2хх\ Ъ(х-т) = 2х1 + 2у1-\-г1% 3(y + 2m) = 2xl-y1-2z1, 3(z + 2m)= — x1 + 2y1 — 2zx (т произвольно). 11. Указание. Полуоси эллипсоида определяются по каноническим коэффициентам соответствующей квадратичной формы. Использовать результаты 10.25. К главе 11 1. Указание. Пусть К' — пересечение нуль-многообразий всех операторов, входящих в левый идеал J с L (Кл), и пусть г—размерность К'. Выберем базис в К„ так, чтобы первые г базисных векторов лежали в К'. Матрицы всех операторов A£J имеют г первых столбцов из одних нулей. Пусть размерность J есть т и Аь • • •, Ат — линейно независимые операторы в J. Рассмотрим матрицу из п—г столбцов и тп строк, полученную при записывании всех матриц
428 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ А1 Ат одна над другой и отбрасывании г первых (нулевых) столбцов. Ее ранг равен п — г, следовательно, имеются п — г базисных строк. Их линейные комбинации дают всевозможные строки из п — г элементов. Использовать 4.44. 2. Указание. Введя невырожденную билинейную форму (х, */), рассмотреть совокупность J* всех операторов А*, сопряженных к операторам A£J. Эта совокупность есть левый идеал. Использовать задачу 1. 3. Ответ. Максимальный левый идеал алгебры В (К„) — совокупность всех операторов, переводящих в нуль некоторый фиксированный вектор пространства Кп. Минимальный левый идеал—совокупность всех операторов, переводящих в 0 некоторое фиксированное (п—1)-мерное подпространство пространства К„. Максимальный правый идеал — совокупность всех операторов, переводящих все пространство Кп в фиксированное (п—1)-мерное подпространство. Минимальный правый идеал — совокупность всех операторов, переводящих все пространство Кп в фиксированную прямую. 4. Указание. В базисе еъ еПУ в котором матрицы операторов А£В записываются в форме 11.85, положить (*. </)=2 £;Л/ (*= 2 б/*/. y=2v/)- б. Указание. Вместе со всяким инвариантным (относительно алгебры В) подпространством С'£С„ является инвариантным и его ортогональное дополнение. Разложить Сп в ортогональную прямую сумму неприводимых инвариантных подпространств. Каждый оператор А Ф 0 (из алгебры В) хотя бы в одном из них действует как ненулевой оператор. 6. Указание. Получить из представления 11.85, что коммутатор полупростой, но не простой матричной алгебры В пересекается с самой В не только по матрицам, кратным единичной. 7. Указание. Записать искомую матрицу в виде блочной матрицы из т2 блоков, выписать условие коммутируемости и использовать лемму Шура. 8. Ответ. У алгебры В всех диагональных матриц (klt ... , Хп — произвольные комплексные числа). Всякая матричная алгебра В = В приводится к этому виду в некотором базисе. 9. Ответ. Алгебра В всех операторов, оставляющих собственными данную систему подпространств, дающих в прямой сумме все С„, удовлетворяет условию В с В. Всякая алгебра В с В с Б приводится к этому виду. 10. Ответ. Пространство Сп разложено в прямую сумму подпространств С(1), ... , С(к), и алгебра В состоит из всех операторов,
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 429 инвариантных в каждом ОЛ / = 1, ... , /г. Коммутатор В состоит из операторов, кратных единичному в каждом С(^ (/=1, ... , /г). _ П. Указание^ Если В есть прямая сумма B(1)-f • • • + В^\ то В = БЧ1)+... + В<*). 12. Ответ. Кратность каждого характеристического корня оператора А равна размеру соответствующей жордановой клетки (см. задачу 15 к гл. 6). 13. Указание. Если СВ = В, то для некоторого А £ В имеем СА=С. Отсюда С = СА = С(СА) = С2А = С3А=... 15. Указание. Пусть Аь ..., Ат— базис алгебры В. Тогда, если алгебра В не нильпотентна, один из правых идеалов АХВ, ..., А^В, например АХВ, не нильпотентен (задача 14). При этом АХВ ф В (задача 13) и проблема сведена к аналогичной для алгебры меньшей размерности. 16. Указание. Если М,= М/ + 1, то для любого вектора x(fM/ найдется оператор АХ£В такой, что Ахл:^М/ = М/ + 1; далее, найдется А2£Втакой, что А2А1х^М1- и т. д. Если М^ Ф К„, то для х£Мр+1—Мр найдется оператор А^^В такой, что Арх£Мр—№p_lt затем A^.xgB такой, что Ар-Х Арх£Мр_1 — М^.2, и т. д.,так что AiA2 ... Арх Ф 0. 17. Указание. Использовать подпространства М1э ... , М^, задачи 16.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А-изоморфизм 231, 240, 243, 291 — пространства 232 Алгебра 161, 187 — аналитических функций 203 — коммутативная 161 —, коммутатор 368 — корпусов 187 — многочленов 188 — операторов 196 — полная 388 — полупростая 363, 373, 380 — простая 362, 370, 380 — радикальная 364 — рациональных функций 202 ~ тривиальная 162, 358 Альтернатива Фредгольма 89 Аннулирующий многочлен оператора 168 Ассоциативность 9, 161 Аффинное пространство 42 Базис Жордана 172 — нормированный 256 — ортогональный 256, 294 — ортонормированный 256 Базисные столбцы матрицы 35 Вектор 4 3 — вещественный 302 —, высота 158 —, длина 249, 293 — комплексно сопряженный 303 — нормированный 250, 293 —, ортогональный к подпространству 254 — собственный 129 —, сопряженный к подпространству 220 —, — с данным 220, 289 — циклический 361 — чисто мнимый 303 Вложение 70, 1 64 Гиперболоид двуполостный 334 — однополостный 334 Гиперпараллелепипед 268, 270 Гиперплоскость 66, 68 Гомеоморфизм фигур 337 Гомотопность фигур 337 Дистрибутивность 161 Дополнение алгебраическое минора32 элемента определителя 21 —, ортогональное к подпространству 254, 295 Евклидово-иэоморфные пространства 255 Единица алгебры левая, правая 161 Зависимость линейная 37 векторов 4 8 над подпространством 58 Идеал алгебры 163, 166 Изоморфизм алгебр 164 — линейных пространств 69 — полей 10 Индекс инерции квадратичной формы 239 ft-вектор 282 Каноническое отображение 70, 164 Категория 384 — конечномерных пространств 385 — линейная 385 — максимальная 393, 408 —, расширение 4 12 Коллинеарность 251, 252 Комбинация линейная векторов 48 столбцов определителя 19, 34 Коммутативность 9 Композиционный ряд алгебры 371 Координаты вектора относительно базиса 51, 140 Корпус 187 — обратный 194 —симметричный 195 Коэффициенты Фурье 256 Крамера правило 29 Крейна метод 321 Лемма Шура 361 Матрица 13, 84 — билинейной формы 209, 2 10 — вырожденная 125 — диагональная 12 1 —единичная 98, 119 — жорданова 172, 178 — квадратичной формы 214 —квазидиагональная 107, 160, 186 — невырожденная 125, 14 1 — нильпотентного оператора 160 —обратная 109, 118, 126, 144 — оператора 96 — ортогональная 276 — перехода к новому базису 141 —, преобразование 147 — присоединенная 138 —, ранг 35 — симметричная 209 — системы 26, 78 — тождественная 98 — унитарная 297 — эрмитово-симметричная 285 Минор 30, 35, 74 — базисный 35, 85 — диагональный 243
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 431 Минор, дополнительный к данному 30 — окаймляющий 346 — произведения матриц 112 — угловой 242 Многочлен характеристический матрицы 132 оператора 149 Многочлены Лежандра 266 Множество ограниченное 250 — пред-частичн* упорядоченное 389 — частично упорядоченное 389 Мономорфизм 69, 164 Морфизм 69 — алгебр 163 Наименьших квадратов метод 27 1 Неравенство Адамара 270, 280 — Бесселя 259 — Коши — Буняковского 251, 294 — треугольника 255, 295 Нормальный ряд алгебры 37 1 Нуль 9 Нуль-вектор 43 Нуль-многообразие морфизма 72 — оператора 1 13 Область значений морфизма 72 Оболочка линейная векторов 64—66, 75 Оператор 69, 94, 96 — антйсамосопряженный 301 — антисимметричный 275, 310 —, действующий в пространстве 118 —диагональный 12 1 — единичный 95 — изометрический 276, 310 —, инвариантный относительноформы 232 —, каноническая форма 172 — нильпотентный 157 —, нормальная форма Жордана 1 72 — нормальный 275, 298, 304 — нулевой 94, 1 19 — обратный 117, 119, 125, 126 — поворота 120 — подобия 120 — проектирования 120 — самосопряженный 300 положительный 312 — симметричный 275, 309 —, собственное подпространство 131 — сопряженный 230, 275 —, степень 122 — тождественный 95 — унитарный 297, 302 —, элементарный делитель 176 — эрмитово-сопряженный 291, 296 Определитель Грама 266 — квазитреугольный 33 — матрицы 15, 25 , линейное свойство 19 , разложение по элементам столбца 22 , свойство антисимметрии 18 треугольный 24 — произведения матриц 124 Ортогональность 252, 294 Параболоид гиперболический 34 1 — круговой 341 «— эллиптический 34 1 Перпендикуляр, опущенный на подпространство 257 Плоскость 69 Поверхность второго порядка 329 , анализ по ее уравнению 345 вырожденная 332, 343 истинная 331 центральная 333 , каноническое уравнение 330 — коническая 331, 338 невырожденная 332 нецентральная 340 сопряженная 342 , центр 333 центральная 331 Подалгебра 162 Подпространство 55 — инвариантное 127, 359 — нетривиальное 56 —, пересечение подпространств 56 —, раствор подпространств 278 — тривиальное 56 Поле вещественных чисел (R) 10, 45 — комплексных чисела (С) 10, 4 5 — произвольное (К) 9 — рациональных чисел 10 Порядок матрицы 13 Представление 123, 359 — левое регулярное 360, 366 — неприводимое 361 — стандартное 365 — точное 359, 362 — тривиальное 359 Проекция вектора на подпространство 257 Произведение 9 — вектора на число 43 — корпуса на число 187 — корпусов 187 — матриц 103 — матрицы на число 102 — оператора на число 99 — операторов 1 00 — скалярное 248, 292 — тензоров 154 Пространство линейное (К) 42 , базис 51 бесконечномерное 53 вещественное (R) 45 евклидово 248 комплексное (С) 45 конкретное 45, 46 — решений системы уравнений 57 унитарное 292 Прямая линия 69 Равенство операторов 98 Радикал алгебры 365 Радиус-вектор точки 4 7 Размерность алгебры 162 — гиперплоскости 68 — линейного пространства 53 — линейной оболочки векторов 66, 75 — над подпространством 59
432 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Размерность нуль-многообразия оператора 113 — области значений оператора 1 13 — суммы пространств 61, 62 Разность векторов 45 Ранг матрицы 3.5, 75, 76, 85 — оператора 1 13 — произведения матриц 115 — тензора 152 — формы билинейной 210 квадратичной 214 Раствор подпространств 278 Родственные пространства 404 Система линейных уравнений 11 неопределенная 13 несовместная 12, 271 — нетривиально совместная 77 , общее решение 79 определенная 13 , решения 12 совместная 12, 78 , фундаментальная система решений 82 , нормальная 82 След матрицы 136 Собственное значение оператора 130 Спектр 186 —, кратность 186 — симметричный-— 195 Сравнимость элементов 62 Стационарное значение формы 318 функции 31 7 Сумма векторов 4 3 — корпусов 187 — матриц 101 — операторов 99 — подпространств 56 прямая 59 ортогональная 258 — прямая представлений 360 — тензоров 154 — чисел 9 Тензор 149 —, инварианты 155 — ковариантный 153 — контравариантный 153 —, ранг 152 —, свертывание 154 —, смешанный 153 Тензорное произведение операторов 402 пространств 401 Теорема Веддерберна 381 — инерции квадратичных форм 237 — Кронекер1—Капелли 78 — Лапласа 32 — о базисном миноре 35 — о квадратичной форме в евклидовом пространстве 314 — об определителе Грама 267 — об ортогонализации 262 — Пифагора 254 Транспонирование матрицы 109 — определителя 16 Углы между ^-векторами 282 подпространствами 281 Угол между векторами 250 Унитарное преобразование 297 Фактор-алгебра 163, 193 Фактор-пространство 63 Форма антисимметричная 235 — билинейная 207 , канонические коэффициенты 222, 233 , канонический базис 220, 233 , — вид 221 невырожденная 210, 24 1 положительно определенная 24 1 симметричная 209, 221, 313 — квадратичня 212 , задача о паре квадратичных форм 325 — —, канонические коэффициенты 215, 219, 316 , канонический базис 215 , — вид 215 невырожденная 214 положительно определенная 239 — линейная 91,93 , коэффициенты 146 — полилинейная 235 симметрнчния 285 — эрмитова 284 квадратичная 286. невырожденная 286 симметричная 285 — эрмитово-билинейная 284 симметричная 287 , индекс инерции 288 , канонический базис 289 , — вид 288 положительно определенная 290 Формула Тейлора для многочленов 189, 198 Функционал билинейный 208 — линейный 92 Характеристический многочлен матрицы 132 оператора 149 Частное 10, 162 Числа натуральные 10 — рациональные 10 — целые 9 Числовое поле 9 Эквивалентность операторов 157 — представлений 359 — элементов 389 Элемент линейного пространства 43 — матрицы 13 — обратимый 161, 194 — обратный 9, 161 — определителя 15 — противоположный 9, 43 Элементарные операции (над матрицей) 84 Эллипсоид 334 Эпиморфизм 69, 164, 192 Ядро морфизма 72 Якоби метод 223