Author: Шилов Г.Е.  

Tags: математика  

Year: 1969

Text
                    МАТЕМАТИЧЕСКИЙ АНАЛИЗ (КОНЕЧНОМЕРНЫЕ ЛИНЕЙНЫЕ НРОСТРАНСТВА).
Г. Е. Шилов.
Книга представляет собой существенно переработанный вариант книги того же автора «Введение в
теорию линейных пространств» (Гостехиздат, 1952 и 1956). Издание соответствует в основном
программе университетского курса линейной алгебры и рассчитано в первую очередь на студентов
математических, физических и других естественнонаучных специальностей. Для ее чтения необходимо,
как правило, владение лишь элементарной математикой; в отдельных случаях используются сведения из
математического анализа с соответствующими отсылками. В главе 1 излагается теория определителей.
В главах 2—7 рассматривается аффинная теория линейных пространств (над произвольным числовым
полем), в главах 8—10—теория евклидовых и унитарных пространств. В главе 11 описываются алгебры
линейных операторов в конечномерных пространствах и в главе 12—соответствующие категории.
ОГЛАВЛЕНИЕ		операторами	
Г л а в а 1. Определители	9	§ 4.4. Соответствующие действия над	101
§ . 1. Числовые поля	9	матрицами	
§ .2. Основные задачи теории систем	11	§ 4.5. Дальнейшие свойства умножения	106
линейных уравнений		матриц	
§ .3. Определитель n-го порядка	13	§ 4.6. Область значений и нуль-	112
§ .4. Свойства определителей	17	многообразие линейного оператора.	
§ .5. Алгебраические дополнения и	21	§ 4.7. Линейные операторы, переводящие	118
миноры		пространство Кп в себя	
§ .6. Практическое вычисление	25	§ 4.8. Инвариантные подпространства	127
определителей		§ 4.9. Собственные векторы и собственные	129
§ .7. Правило Крамера	26	значения	
§ .8. Миноры произвольного порядка.	30	Задачи	135
Теорема Лапласа		Глава 5. Преобразования координат	140
§ 1.9. 0 линейной зависимости между	33	§5.1. Формулы перехода к новому базису	140
столбцами		§ 5.2. Последовательные преобразования	142
Задачи	39	§ 5.3. Преобразование координат вектора	143
Глава 2. Линейные пространства	42	при изменении базиса	
§2.1. Определение	42	§ 5.4. Преобразование коэффициентов	146
§ 2.2. Линейная зависимость	47	линейной формы	
§2.3. Базис, координаты, размерность	51	§ 5.5. Преобразование матрицы линейного	147
§ 2.4. Подпространства	55	оператора	
§2.5. Линейные оболочки	64	§ 5.6. Тензоры	149
§ 2.6. Гиперплоскости	66	Задачи	155
§ 2.7. Морфизмы линейных пространств	69	Глава 6. Каноническая форма матрицы	157
Задачи	73	линейного оператора	
Глава 3. Системы линейных уравнений	74	§6.1. Каноническая форма матрицы	157
§3.1. Еще о ранге матрицы	74	нпльпотентного оператора	
§3.2. Нетривиальная совместность	76	§ 6.2, Алгебры; алгебра многочленов от	161
однородной линейной системы		одного переменного	
§3.3. Условие совместности общей	78	§ 6.3. Каноническая форма матрицы	167
линейной системы		произвольного оператора	
§ 3.4. Общее решение линейной системы	79	§ 6.4. Элементарные делители	172
§3.5. Геометрические свойства	81	§ 6.5. Некоторые следствия	179
совокупности решений линейной системы		§ 6.6. Вещественная жорданова форма	181
§3.6. Методы вычисления ранга матрицы	83	§ 6.7. Спектры, корпусы и многочлены	186
Задачи	88	§ 6.8. Функции от оператора и их	196
Глава 4. Линейные функции векторного	91	матричная запись	
аргумента		Задачи	204
§4.1. Линейные формы	91	Глава 7. Билинейные и квадратные формы	207
§ 4.2. Линейные операторы и их матричная	94	§ 7.1. Билинейные формы	207
запись		§ 7.2. Квадратичные формы	211
§4.3. Действия над линейными	98	§ 7.3. Приведение квадратичной формы к	214

каноническому виду § 10.3. Задача о паре квадратичных форм 325 § 7.4. Канонический базис билинейной 220 § 10.4. Приведение общего уравнения 329 формы §7.5. Построение канонического базиса по методу Якоби § 7.6. Сопряженные линейные операторы § 7.7. Изоморфизм пространств с 223 227 231 поверхности 2-го порядка к каноническому виду § 10.5. Геометрические свойства поверхностей 2-го порядка § 10.6. Анализ поверхности по ее общему 333 345 выделенной билинейной формой §7.8. Полилинейные формы 235 уравнению § 10.7. Эрмитово-квадратичные формы 354 §7.9. Квадратичные и билинейные формы 237 Задачи 356 в вещественном пространстве Задачи Глава 8. Евклидовы пространства 244 246 Глава 11. Конечномерные алгебры и алгебры матриц § 11.1. Еще об алгебрах 358 358 §8.1. Введение 246 § 11.2. Представления абстрактных алгебр 359 §8.2. Определение евклидова 248 § 11.3. Неприводимые представления и 360 пространства §8.3. Основные метрические понятия 249 лемма Шура § 11.4. Основные типы конечномерных 362 § 8.4. Ортогональный базис §8.5. Задача о перпендикуляре 256 257 алгебр § 11.5. Строение левого регулярного 365 § 8.6. Общая теорема об ортогонализации §8.7. Определитель Грама 261 266 представления простой алгебры § 11.6. Структура простых алгебр 368 §8.8. Песовместные системы линейных 271 § 11.7. Структура полупростых алгебр 371 уравнений и метод наименьших квадратов §8.9. Сопряженные операторы и изометрия Задачи 274 278 § 11.8. Строение представлений простых и полупростых алгебр § 11.9. Некоторые дальнейшие результаты Задачи 376 381 382 Глава 9. Комплексные пространства со 284 Глава 12. Категории конечномерных 384 скалярным произведением §9.1. Эрмитовы формы 284 пространств § 12.1. Введение 384 §9.2. Скалярное произведение в 292 § 12.2. Случай, когда все данные алгебры 388 комплексном пространстве §9.3. Пормальные операторы 298 Ра § 12.3. Все данные алгебры 391 §9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве Задачи 302 312 одномерные § 12.4. Все данные алгебры — простые § 12.5. Все данные алгебры — полные 397 405 Глава 10. Квадратичные формы в евклидовом и унитарном пространствах § 10.1. Основная теорема о квадратичных 313 313 алгебры диагональных матриц § 12.6. Категории и прямые суммы Ответы и указания к задачам 411 415 формах в евклидовом пространстве. § 10.2. Экстремальные свойства квадратичной формы 316 Предметный указатель 430 ПРЕДИСЛОВИЕ Эта книга предназначена в качестве учебного пособия для студентов младших курсов математических и физических специальностей. В ней излагается материал, обычно входящий в курс линейной алгебры и в дальнейшем обслуживающий различные разделы математического анализа. Следует заметить, впрочем, что название «линейная алгебра» давно уже не соответствует реальному содержанию курса, который представляет собой синтез идей алгебры, геометрии и анализа. И хотя анализ в точном смысле слова (т. е. отдел математики, связанный с пределами, дифференцированием, интегрированием) присутствует в книге явно лишь на втором плане, на самом деле он-то и является настоящим организатором курса, поскольку проблемы «линейной алгебры» можно считать «конечномерными проекциями» основных проблем анализа и в то же время «опорой» для них. Книга написана на основе нашей старой книги «Введение в теорию линейных пространств» (Гостехиздат, 1952 и 1956; далее ее именуем ВЛП). Различие между ВЛП и новой книгой, в кратких
словах, следующее. В ВЛП речь шла исключительно о вещественных пространствах; в новой книге рассматриваются пространства над произвольным числовым полем, вещественный и комплексный случаи излагаются как специфические случаи общей теории, находящиеся в тесной связи друг с другом. Введена глава о жордановой форме матрицы линейного оператора в комплексном и вещественном пространстве. Для комплексного пространства со скалярным произведением рассмотрены канонические формы матриц нормальных операторов, из которых, как частные случаи, получаются канонические формы матриц эрмитовых, антиэрмитовых и унитарных операторов и их вещественных аналогов Книга ВЛП заканчивалась большой главой о геометрии бесконечно-мерного гильбертова пространства; здесь такой главы нет (В ряде других книг можно найти более систематическое изложение этого материала, относящегося скорее уже к функциональному анализу). Зато добавлены две новые главы, непосредственно примыкающие к основному содержанию курса: глава о структуре матричных алгебр (написанная по просьбе автора А. Я. Хелемским) и глава о строении матричных категорий (содержание которой взято из статьи И. М. Гельфанда и автора, Вестник МГУ, Математика и механика, 1963, № 4). Эти две главы, хотя и вполне элементарны по методам, все же несколько выше по уровню, чем остальные; они представляют линейную алгебру в ее развитии и могут быть использованы в факультативных занятиях. Каждая глава книги заканчивается рядом задач. В некоторой, но весьма небольшой мере они помогают выработке необходимых технических навыков (для этой цели лучше использовать ряд распространенных задачников с богатым выбором упражнений). В основном имеющиеся в книге задачи предназначены для иллюстрации и некоторого развития основного текста; циклы из некоторых задач могут служить темами для докладов на семинарах. Для этой же цели предназначены отдельные необязательные параграфы основного текста, выделенные звездочкой. Автор считает своим приятным долгом отметить тщательную работу М. С. Аграновича и принести ему благодарность за ряд весьма ценных замечаний. Автор благодарит также И. Я. Дорфман за проверку всех задач. ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А-изоморфизм 231, 240, 243, 291 — пространства 232 Алгебра 161, 187 — аналитических функций 203 — коммутативная 161 — , коммутатор 368 — корпусов 187 — многочленов 188 — операторов 196 — полная 388 — полупростая 363, 373, 380 — простая 362, 370, 380 — радикальная 364 — рациональных функций 202 — тривиальная 162, 358 Альтернатива Фредгольма 89 Аннулпрующий многочлен оператора 168 Ассоциативность 9, 161 Аффинное пространство 42 Ьазис Жордана 172 — нормированный 256 — ортогональный 256, 294 — ортонормированный 256 Базисные столбцы матрицы 35 Вектор 43 — вещественный 302 — , высота 158 — , длина 249, 293 — комплексно сопряженный 303 — нормированный 250, 293 — , ортогональный к подпространству 254 — собственный 129 — , сопряженный к подпространству 220 — , — с данным 220, 289 — циклический 361 — чисто мнимый 303 Вложение 70, 164 Гиперболоид двунолостный 334 — однополостный 334 Гиперпараллелепипед 268, 270 Гиперплоскость 66, 68 Гомеоморфизм фигур 337 Гомотопность фигур 337 Дистрибутивность 161 Дополнение алгебраическое минора 32 -----элемента определителя 21 —, ортогональное к подпространству 254, 295 Евклидово-изоморфные пространства 255 Единица алгебры левая, правая 161 Зависимость линейная 37 -----векторов 48 -------над подпространством 58 Идеал алгебры 163, 166 Изоморфизм алгебр 164 — линейных пространств 69 — полей 10 Индекс инерции квадратичной формы 239 к-вектор 282 Каноническое отображение 70, 164
Категория 384 — конечномерных пространств 385 — линейная 385 — максимальная 393, 408 —, расширение 412 Коллинеарность 251, 252 Комбинация линейная векторов 48 ----столбцов определителя 19, 34 Коммутативность 9 Композиционный ряд алгебры 371 Координаты вектора относительно базиса 51, 140 Корпус 187 ---обратный 1 94 —симметричный 195 Коэффициенты Фурье 256 Крамера правило 29 Крейна метод 321 Лемма Шура 361 Матрица 13, 84 — билинейной формы 209, 210 — вырожденная 125 —диагональная 121 —единичная 98, 119 — жорданова 172, 178 — квадратичной формы 214 — квазидиагональная 107, 160, 186 —невырожденная 125, 141 — нильпотентного оператора 160 —обратная 109, 118, 126, 144 — оператора 96 — ортогональная 276 — перехода к новому базису 141 — , преобразование 147 — присоединенная 138 — , ранг 35 — симметричная 209 — системы 26, 78 — тождественная 98 — унитарная 297 — эрмитово-симметричная 285 Минор 30, 35, 74 — базисный 35, 85 — диагональный 243 Минор, дополнительный к данному 30 — окаймляющий 346 — Произведения матриц 112 — угловой 242 Многочлен характеристический матрицы 132 ----оператора 149 Многочлены Ле.жандра 266 Множество ограниченное 250 — пред-частично упорядоченное 389 — частично упорядоченное 389 Мономорфизм 69, 164 Морфизм 69 — алгебр 163 Наименьших квадратов метод 271 Неравенство Адамара 270, 280 — Бесселя 259 — Коши—Буняковского 251, 294 — треугольника 256, 295 Нормальный ряд алгебры 371 Нуль 9 Нуль-вектор 43 Нуль-многообразие морфизма 72 — оператора 113 Область значений морфизма 72 Оболочка линейная векторов 64—66, 75 Оператор 69, 94, 96 — антисамосопряженный 301 — антисимметричный 275, 310 — , действующий в пространстве 118 — диагональный 121 — единичный 95 — изометрический 276, 310 — , инвариантный относительно формы 232 — , каноническая форма 172 — нильпотентный 157 —, нормальная форма Жордана 1 72 — нормальный 275, 298, 304 — нулевой 94, 119 —обратный 117, 119, 125, 126 — поворота 120 — подобия 120 — проектирования 120 — самосопряженный 300 -----положительный 312 — симметричный 275, 309 —, собственное подпространство 131 — сопряженный 230, 275 — , степень 122 — тождественный 95 — унитарный 297, 302 — , элементарный делитель 176 — эрмитово-сопряженный 291, 296 Определитель Грама 266 — квазитреугольный 33 — матрицы 15, 25 -----, линейное свойство 19 , разложение по элементам столбца 22 , свойство антисимметрии 18 треугольный 24 — произведения матриц 124 Ортогональность 252, 294 Параболоид гиперболический 341 — круговой 341 — эллиптический 341 Перпендикуляр, опущенный на подпространство 257
Плоскость 69 Поверхность второго порядка 329 -------, анализ по ее уравнению 348 -------вырожденная 332, 343 -------истинная 331 ----------центральная 333 -------, каноническое уравнение 330 -------коническая 331, 338 -------невырожденная 332 ----------нецентральная 340 -------сопряженная 342 -------, центр 333 -------центральная 331 Подалгебра 162 Подпространство 55 — инвариантное 127, 359 — нетривиальное 56 — , пересечение подпространств 56 — , раствор подпространств 278 — тривиальное 56 Поле вещественных чисел (R) 10, 45 — комплексных чисел (С) 10, 45 — произвольное (К) 9 — рациональных чисел 10 Порядок матрицы 13 Представление 123, 359 — левое регулярное 360, 366 — неприводимое 361 — стандартное 365 — точное 359, 362 — тривиальное 359 Проекция вектора на подпространство 257 Произведение 9 — вектора на число 43 — корпуса на число 187 — корпусов 187 — матриц 103 — матрицы на число 102 — оператора на число 99 — операторов 100 — скалярное 248, 292 — тензоров 154 Пространство линейное (К) 42 -----, базис 51 -----бесконечномерное 53 -----вещественное (R) 45 -----евклидово 248 -----комплексное (С) 45 -----конкретное 45, 46 — решений системы уравнений 57 -----унитарное 292 Прямая линия 69 Равенство операторов 98 Радикал алгебры 365 Радиус-вектор точки 47 Размерность алгебры 162 — гиперплоскости 68 — линейного пространства 53 — линейной оболочки векторов 66, 75 — над подпространством 59 Размерность нуль-многообразия оператора 113 — области значений оператора 113 — суммы пространств 61, 62 Разность векторов 45 Ранг матрицы 35, 75, 76, 85 — оператора 113 — произведения матриц 115 — тензора 152 — формы билинейной 210 -----квадратичной 214 Раствор подпространств 278 Родственные пространства 404 Система линейных уравнений 11 -------неопределенная 13 -------несовместная 12, 271 -------нетривиально совместная 77 -------, общее решение 79 -------определенная 13 -------, решения 12 -------совместная 12, 78 -------, фундаментальная система решений 82 -------,-------нормальная 82 След матрицы 136 Собственное значение оператора 130 Спектр 186 — , кратность 186 — симметричный—195 Сравнимость элементов 62 Стационарное значение формы 318 -----функции 317 Сумма векторов 43 — корпусов 187 — матриц 101 — операторов 99 — подпространств 56 -----прямая 59 -------ортогональная 258 — прямая представлений 360 — тензоров 154 — чисел 9 Тензор 149 — , инварианты 155 — ковариантный 153 — контравариантный 153 — , ранг 152 — , свертывание 154 — , смешанный 153 Тензорное произведение операторов 402 -----пространств 401 Теорема Веддерберна 381
— инерции квадратичных форм 237 — Кронекера—Капелли 78 — Лапласа 32 — о базисном миноре 35 — о квадратичной форме в евклидовом пространстве 314 — об определителе Грама 267 — об ортогонализации 262 — Пифагора 254 Транспонирование матрицы 109 — определителя 16 Углы между к-векторами 282 -----подпространствами 281 Угол между векторами 250 Унитарное преобразование 297 Фактор-алгебра 163, 193 Фактор-пространство 63 Форма антисимметричная 235 — билинейная 207 -----, канонические коэффициенты 222, 233 -----, канонический базис 220, 233 -----, — вид 221 -----невырожденная 210, 241 -----положительно определенная 241 -----симметричная 209, 221, 313 — квадратичная 212 -----, задача о паре квадратичных форм 325 -----, канонические коэффициенты 215, 219, 316 -----, канонический базис 215 -----, — вид 215 -----невырожденная 214 -----положительно определенная 239 — линейная 91,93 -----, коэффициенты 146 — полилинейная 235 -----симметричная 285 — эрмитова 284 -----квадратичная 286. -----невырожденная 286 -----симметричная 285 — эрмитово-билинейная 284 -----симметричная 287 -------, индекс инерции 288 -------, канонический базис 289 -------, — вид 288 -------положительно определенная 290 Формула Тейлора для многочленов 189, 198 Функционал билинейный 208 — линейный 92 Характеристический многочлен матрицы 132 -----оператора 149 Частное 10, 162 Числа натуральные 10 — рациональные 10 — целые 9 Числовое поле 9 Эквивалентность операторов 157 — представлений 359 — элементов 389 Элемент линейного пространства 43 — матрицы 13 — обратимый 161, 194 — обратный 9, 161 — определителя 15 — противоположный 9, 43 Элементарные операции (над матрицей) 84 Эллипсоид 334 Эпиморфизм 69. 164, 192 Ядро морфизма 72 Якоби метод 223
ГЛАВА 1 ОПРЕДЕЛИТЕЛИ § 1.1. Числовые поля 1.11. Как и ббльшая часть математики, линейная алгебра использует числовые системы (числовые поля). Числовым полем называют всякую совокупность К объектов, называ- емых числами, в которой можно производить с этими объектами четыре арифметических действия. Перечислим необходимые сведения об этих действиях (аксиомы поля). а. Каждрй паре чисел а и 0 отвечает число а-)-0, на- зываемое суммой чисел а и 0, причем 1) а + 0 = 0 + а для любых а и 0 из К (перемести- тельность, или к о м му т а т и в н о с т ь сложения); 2) (а+0) + у = а+(0 + у) для любых а, 0, у из К (сочетательность, или ассоциативность сло- жения); 3) существует число 0 (нуль) такое, что 0-)-а = а для любого а из К', 4) для любого а из К существует число 0 из К такое, что а+0 = 0 (противоположный элемент). Разрешимость уравнения а+0 = О при любом а позво- ляет ввести операцию вычитания: разность а — 0 по опре- делению есть сумма числа а и решения у уравнения 0 + у = 0. б. Каждой паре чисел а и 0 отвечает число а-0 (или а0), называемое произведением чисел а и 0, причем 5) а0 = 0а для любых а и 0 из К (коммутатив- ность умножения); 6) (а0)у = а(0у) для любых а, 0, у из К (ассоциа- тивность умножения); 7) существует число 1 (#=0) такое, что 1-а = а для лю- бого числа а из К; 8) для любого а+=0 существует число у из К такое, что ау=1 (обратный элемент),
10 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.12 Разрешимость уравнения ау=1 при любом а =£0 позво- ляет ввести операцию деления на число а =4=0: частное |$/а есть произведение числа р и решения у уравнения ау=1. Числа 14-1=2, 2-}-1=3 и т. д. называются нату- ральными-, предполагается, что ни одно из них не равно 0*). Натуральные числа, им противоположные и 0 образуют, по определению, совокупность целых чисел поля К. Част- ные pfq, где р и q—целые и <?=Д0, образуют совокупность рациональных чисел поля Д'. Два поля К и К' называются изоморфными, если между ними можно так установить взаимно однозначное соответ- ствие, что сумма и произведение чисел поля К соответствуют сумме и произведению соответствующих чисел поля К'- (В этом случае результаты остальных операций — разности и частного — также будут соответствовать друг другу.) 1.12. Наиболее часто встречаются следующие примеры конкретных числовых полей. а. Поле рациональных чисел, т. е. отношений p/q, где р и q =/= 0 — обычные целые числа с обычными арифметическими правилами действий. (Заметим, что одни только целые числа не образуют числового поля, так как в этом случае не вы- полнена аксиома 8).) Из сказанного выше следует, что в каждом поле А'имеется часть (подполе), изоморфная полю рациональных чисел. б. Поле вещественных чисел, имеющее геометрическим Образом совокупность всех точек прямой. Аксиоматика поля вещественных чисел получается, добавлением к аксиомам 1)-—8) аксиом порядка и аксиомы о точной верхней грани **). в. Поле комплексных чисел a-}-lb, где а и b вещест- венны (символ i не есть вещественное число), с правилами *) Из двух элементов, положим М и Е, можно устроить поле по правилам N + N = N, N-j-E = E, E + E = N, N-N = N, N-E = N, E-E = E. В соответствии с нашими обозначениями мы должны положить М =0, £=1, и тогда 2=14-1=0. Для исключения таких числовых систем мы и требуем, чтобы все натуральные элементы поля были бы отличными от 0. **) Теория вещественных чисел подробно излагается в нашей книге «Математический анализ (Функции одного переменного)», «Наука», 1969, гл. 1. В дальнейшем обозначаем эту книгу через ФОП,
1.21 J § 1.2. ЗАДАЧИ ТЕОРИИ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ 11 действий (ФОП, 2.7Гу. (ах 4- ibj) 4~ (а2 + г'^г) = (Й1 + аг) +г' (^i+ ^г)> (<zi 4- ibj (а2 4- ib2) = (ага2 — bJJ 4- 4~ аа&1)• Для чисел вида а 4- «0 эти действия приводятся к одноимен- ным действиям над вещественными числами а; мы пишем коротко a-\-i0 = a и называем эти комплексные числа ве- щественными. Можно сказать, что поле комплексных чисел содержит часть (подполе), изоморфную полю вещественных чисел. Комплексные числа вида O4~i6 называются (чисто) мнимыми и короче обозначаются ib. Из правила умножения следует, что /2=;Z-.f = (O4-/l)(O4-zl)= —1. 1.13. Поле вещественных чисел в дальнейшем обозна- чается через /?. Поле комплексных чисел обозначается че- рез С. Согласно так называемой основной теореме алгебры (ФОП, 4.86), в поле С не только выполнимы четыре ариф- метические операции, но и разрешимо любое алгебраическое уравнение г" + а1^-1+ ...4-а„ = 0. Поле R вещественных чисел не обладает этим свойством: например, уравнение х24~ 1 =0 не имеет решений в поле /?. Многие из дальнейших построений справедливы для любого числового поля. Любое числовое поле мы будем обозначать в дальнейшем буквой К. Если некоторое пред- ложение верно для поля К, оно автоматически верно для поля R и поля С, которые являются частными случаями поля К. § 1.2. Основные задачи теории систем линейных уравнений 1.21. В этой и двух следующих главах мы будем зани- маться изучением систем линейных уравнений. В самом общем случае такая система имеет следую- щий вид: Д1Л + “12-г2 + • • - + а1пхп = br, 1 а11Х1~Ь а22Х2 ~t~ а2пХп ~ I Q) aklXl + ак2Х2 + • • + акпхп ~^к- I
12 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.21 Здесь через хх, х2, • • • , хп обозначены неизвестные (элементы поля К), подлежащие определению (заметим, что число неизвестных не предполагается обязательно равным числу уравнений). Числа ахх, аХ2, . . . , akn, взятые из поля К, называются коэффициентами системы. Первый индекс коэф- фициента указывает номер уравнения, в котором фигури- рует данный коэффициент, а второй индекс — номер неизвест- ного, при котором этот коэффициент поставлен*). Чис- ла frx, b2, .. . , bk, стоящие в правых частях равенства (1), ввятые из того же поля К, называются свободными членами системы; как и коэффициенты, они предполагаются известными. Решением системы называется всякая совокупность чисел сх, с2, . . . , сп из того же поля К, которая, будучи под- ставлена в систему (1) на место неизвестных хх, х2, ... , хп, обращает все уравнения системы в тождества **). Не всякая система линейных уравнений вида (1) имеет решение. Например, система 2хх -4- Зх«== 5, 1 ? (2) 2хх4-Зх3 = 6 f k ’ заведомо не может иметь ни одного решения. Действительно, какие бы числа сх, с2 мы ни подставили на место неизвест- 'ных хх, х2, левые части уравнений системы (2) окажутся совпадающими, в то время как правые части раз- личны. Поэтому оба уравнения системы (2) такой подста- новкой не могут быть одновременно обращены в тождества. Систему уравнений вида (1), имеющую (хотя бы одно) решение, мы будем называть совместной; систему, не имеющую решений, будем называть несовместной. Совместная система может иметь одно решение или более чем одно; в последнем случае для различения решений мы будем указывать их номера индексами наверху в скобках; например, первое решение с{п, с^, ... , с^, второе реше- ние с(х2>, с<2>, . .. , с(пг> и т. д. Решение с*/’, с(2и, .. . , с),1’ и с(х2), с<2), ... , с<2) считаются различными, если хотя бы одно из чисел с)1’ не совпадает с соответствующим числом *) Поэтому, например, запись а34 должна читаться так: «а—три — четыре» (а не «а—тридцать четыре»), **) Подчеркнем, что совокупность чисел сх, с2, ... , сп составляет одно решение системы (а не п решений).
1.31] § 1.3. ОПРЕДЕЛИТЕЛЬ П-ГО ПОРЯДКА 13 с<2) (Z=l, 2, .... л). Например, система 2х1 + Зх2 = 0, 1 з 4х1 + 6х2 = 0 ] ' имеет различные решения с'/’ = с(21)=0, с^2’ = 3, с^2> = —2 (а также бесконечное множество других решений). Если сов- местная система имеет единственное решение, она называется определенной; если совместная система имеет по крайней мере два различных решения, она называется неопределенной. 1.22. Мы можем сформулировать теперь те основные задачи, которые возникают при изучении системы (1): I. Выяснить, является система (1) совместной или несов- местной. II. Если система (1) совместна, то выяснить, является ли она определенной. III. Если система (1) совместна и определенна, то найти ее единственное решение. IV. Если система' (1) совместна и неопределенна, то описать совокупность всех ее решений. Основным математическим инструментом для изучения линейных систем является теория определителей; мы пере- ходим теперь к ее изложению. § 1.3. Определитель л-го порядка 1.31. Пусть дана квадратная матрица, т. е. таблица из л2 чисел (элементов поля К) a^li, J—\, 2, ..., л): аи а1г • • • а1п а21 а22 • • • а2п ап1 ап2 • ‘ апп (4) Число л, указывающее количество строк и столбцов матрицы (4), называется ее порядком. Числа а^ называются элемен- тами матрицы А; первый и второй индексы у элемента указывают соответственно номер строки и столбца, в кото- рых расположен этот элемент. Элементы аи, а22, ... , апп образуют главную диагональ матрицы А. Рассмотрим любое произведение л элементов, расположен- ных в различных строках и различных столбцах матрицы (4),
14 ГЛ. 1. ОПРЕДЕЛИТЕЛИ (1.31 т. е. по одному в каждой строке и в каждом столбце. Такое произведение можно записать в виде ^«,1 ^«22 • • • &апп’ (^) Действительно, в качестве первого сомножителя мы всегда можем взять элемент, стоящий в первбм столбце Матрицы (4); если обозначить через ах номер строки, в ко- торой находится этот элемент, то индексы этого элемента будут otj и 1. Аналогично в качестве второго сомножителя можно взять элемент, стоящий во втором столбце; его ин- дексы будут а2 и 2, где а2—номер той строки, в которой расположен этот второй элемент; и т. д. Таким образом, индексы ах, а2, . . . , а„ являются номерами строк, в кото- рых расположены сомножители произведения (5), в соот- ветствии с принятым порядком их записи по возрастанию индексов столбцов. Так как по условию элементы аяХ, aai2, .. ., аЯл„ распо- ложены в различных строках матрицы (4), по одному в каждой строке, то числа ах, а2, ... , а„ все различны и представляют собой некоторую перестановку чисел 1,2, .. . , п. Назовем «беспорядком» в этой последовательности ах, а2, ... , а„ такое расположение индексов, когда стар- ший индекс стоит раньше младшего. Число всех «беспоряд- ков» обозначим через AZ(ах, а2, ... , а„). Например, в перестановке четырех цифр 2, 1, 4,3 — два «беспо- рядка» (2 впереди 1, 4 впереди 3); таким образом, N (2, 1, 4, 3) = 2. В перестановке 4, 3, 1, 2— пять «беспорядков» (4 впереди 3, 4 впереди 1, 4 впереди 2, 3 впереди 1, 3 впереди 2); поэтому А (4, 3, 1, 2) = 5. Если число беспорядков в последовательности ах, ... , а„ четно, поставим перед произведением (5) знак-}-; если это число нечетно, поставим перед этим произведением знак —. Иными словами, условимся перед каждым произведением вида (5) писать знак, определяемый выражением (_ 1)# («1. аг, , а„)
1.31] § 1.3. ОПРЕДЕЛИТЕЛЬ П-ГО ПОРЯДКА 15 Число всех произведений вида (5), которые можно со- ставить из элементов данной матрицы л-го порядка, равно числу всех возможных перестановок чисел 1, 2, ... , п, которое, как известно, равно л!. Теперь введем следующее определение: Определителем матрицы (4) называется алгебраическая сумма, состоящая из л! всевозможных произведений вида (5), перед каждым из которых поставлен знак, определенный по указанному выше правилу: D = 2 (— 1 У1 (“2....“п) аа, 1 аЛг2 аапп- (6) В дальнейшем произведения вида (5) мы будем называть членами определителя. Элементы aZ/. матрицы (4) будем называть элементами определителя. Определитель матрицы (4) обозначается одним из следую- щих символов: D = ац а12- • • а1п а21 а22- • • а2и = det||flj7|| = det[[az7||z>/. 1, 2, п* (7) «„1 ®«2 • ’ • ^пп Например, для определителей 2-го и 3-го порядка мы получаем следующие выражения: — а11а22 а21а12« аи ап а13 в21 а22 fl23 ®31 й32 а33 — Оц®22®33 “Ь ®21®32®13 “Ь ^31^12^23 ®31®22®13“ а21а12а33 а11а32а23‘ Роль определителей при решении систем линейных уравнений мы покажем на примере системы из двух уравнений с двумя неиз- вестными. Если дана система а11х14“ Й12Х2 — ^1> ^21^1 Н- ^22^2 — ^2, то, исключая обычным образом одно из неизвестных, можно легко получить формулы „ Ь1а22 &2а12 ®ll^2---а21^1 , л 2 — “ , ^11^22 — #21^12 #11^22 — ^21^12 в предположении, что знаменатели этих отношений отличны от нуля. Числители и знаменатели получающихся дробей представляют собой
16 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.32 определители 2-го порядка: ацОгг—= Мм —М12 = | М«~ а21^ = | в“&*| • Оказывается, что аналогичные формулы имеют место и для решения систем с любым числом неизвестных (см. § 1.7). 1.32. Правило для определения знака данного члена определителя можно сформулировать несколько иначе, в гео- метрических терминах. В матрице (4) в соответствии с нумерацией элементов естественно выделяются положительные направления: слева направо — вдоль строк, сверху вниз — вдоль столбцов. Вместе с этим и косые отрезки, соединяющие два каких-либо эле- мента матрицы, можно снабдить указанием направления: будем говорить, что отрезок, соединяющий элемент а,у с элементом акт, имеет положительный наклон, если его пра- вый конец расположен ниже левого, и отрицательный наклон, если его правый конец лежит выше, чем левый. Теперь проведем мысленно в матрице (4) все отрезки, соединяющие попарно элементы аа,\, аа,2, ... , а^п произведения (5) и при этом имеющие отрицательный наклон. Будем ставить перед произведением (5) знак +, если число всех таких отрезков четно, и знак—, если их число нечетно. Например, в случае матрицы 4-го порядка перед произведением 021^12^3^34 должен быть поставлен знак +, так как в матрице имеется два отрезка отрицательного наклона, соединяющих элементы данного произведения: Oil 01з Оц Wsi) O22 O23 Ял O3I O32 Ода (йм О41 O42 (“4з) 0« а перед произведением а^а32а13а^ должен быть поставлен знак —, так как в матрице имеется пять отрезков с отрицательным
1.41] § 1.4. СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 17 наклоном, соединяющих его элементы: Он ®12а14 ®2t Яи/flsajflaa) Яз)/ (UazTfljj Й34 M4tpe« а« Й44 В этих примерах количество отрезков отрицательного наклона, соединяющих элементы данного члена, равно числу «беспорядков» в расположении первых индексов элементов, составляющих в произве- нии данный член: в первом примере последовательность первых индексов 2, 1,4, 3 имеет два «беспорядка», во втором примере по- следовательность первых индексов 4, 8^ 1, 2 имеет пять «беспорядков». Покажем, что второе определение знака члена определи- теля равносильно первому. Для этого достаточно показать, чтр число «беспорядков» в последовательности первых ин- дексов элементов данного члена (при натуральном порядке вторых индексов) всегда равно числу отрезков отрицатель- ного наклона, соединяющих элементы данного члена в мат- рице. Но это почти очевидно: наличие отрезка отрицатель- ного наклона, соединяющего элементы aaii и яау, означает при i < /, что а,- > ау-, т. е. наличие «беспорядка» в распо- ложении первых индексов. См. задачи 1—3 (в конце этой главы). § 1.4. Свойства определителей 1.41. Операция транспонирования. Определи- тель а11 а21 • • ап1 а12 а22 • • ап2 (8) а1п а2п полученный из определителя (7) заменой строк на столбцы с теми же номерами, называется транспонированным по отношению к определителю (7). Покажем, что величина транспонированного определителя совпадает с величиной исход- ного определителя. Действительно, определители (7) и (8) состоят, очевидно, из одних и тех же членов; поэтому нам
18 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.42 достаточно показать, что одинаковые члены обладают в опре- делителях (7) и(8)и одинаковыми знаками. Транспонирование матрицы определителя, очевидно, есть результат ее поворо- та (в пространстве) на 180 ° вокруг диагонали ап, а22, . . ., апп. При этом повороте каждый отрезок с отрицательным на- клоном (например, образующий угол а < 90° со строками матрицы) переходит снова в отрезок с отрицательным наклоном (именно, образующий со строками матрицы угол 90° — а). Поэтому число отрезков с отрицательным наклоном, соеди- няющих элементы данного члена, после транспонирования не изменится; следовательно, не изменится и знак этого чле- на. Таким образом, знаки всех членов сохранятся; тем самым величина определителя остается неизменной. Доказанное сейчас свойство определителя устанавливает равноправие его строк и столбцов. Поэтому дальнейшие свойства определителей мы будем формулировать и дока- зывать только для столбцов. 1.42. Свойство антисимметрии. Под антисим- метрией относительно столбцов понимают свойство определи- теля менять знак при перестановке двух столбцов. Рас- смотрим сначала случай, когда переставляются два соседних столбца определителя, например у-й и (уЦ-1)-й. Опреде- литель, полученный после перестановки столбцов, будет состоять, очевидно, из тех же самых членов, что и исход- ный определитель. Рассмотрим какой-нибудь из членов ис- ходного определителя. Этот член в своем составе имеет элемент из у-го столбца и элемент из (у+1)-го столбца. Если отрезок, соединяющий эти два элемента, имел отрицательный наклон, то после перестановки столб- цов его наклон станет положительным, и наоборот. Что же касается остальных отрезков, соединяющих попарно эле- менты выделенного члена, то после перестановки столбцов характер наклона каждого из них останется неизменным. Следовательно, количество отрезков с отрицательным на- клоном, соединяющих элементы данного члена, при переста- новке столбцов заведомо изменяется на единицу; поэтому каждый член определителя, а следовательно, и сам опре- делитель, при перестановке столбцов меняет знак. Пусть теперь переставляются не соседние столбцы, а, например, у'-й столбец с k-м столбцом, причем между
1.44] § 1.4. СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 19 ними находится т других столбцов и j< k. Эту переста- новку можно осуществить последовательными перестановками соседних столбцов в следующем порядке: сначала /-й стол- бец переставляется с (/4-1)-м, далее с (/4-2)-м, (/4~3)-м,... ...,&-м, затем получившийся (k—1)-й столбец (ранее быв- ший А-м) переставляется с (k — 2)-м, (k — 3)-м, ..., /-м. Всего понадобится m-j-1-j-т = 2m-f-1 перестановок сосед- них столбцов; после каждой из них, по доказанному, опре- делитель изменяет знак и, следовательно, после конца процесса -будет иметь знак, противоположный начальному (поскольку 2/в+ 1 при любом целом т есть нечетное число). 1.43. Следствие. Определитель, имеющий два одина- ковых столбца, равен нулю. В самом деле, переставляя эти столбцы, мы не изменим определителя; с другой стороны, по доказанному, он должен изменить свой знак. Таким образом, D= —D, откуда сле- дует, что D — 0. См. задачу 4. 1.44. Линейное свойство определителя. Это свойство формулируется следующим образом: а. Если все элементы j-го столбца определителя D пред- ставлены в виде «линейной комбинации» двух слагаемых aij—'kbi-\-ykci (/=1, 2, ...,л) (Л и ц — фиксированные числа), то определитель D равен такой же линейной комбинации двух определителей: D = + р.^2> (9) причем у каждого из этих двух определителей все столбцы, кроме j-го, такие же, как у определителя D, а j-й столбец состоит у определителя Dr из чисел bit у оп- ределителя D2—из чисел С[. Действительно, всякий член определителя D можно представить в виде йа,1аа22 • • • Gaji • • • аапп — <^а11^аг2 • • • (^aj 4“ • • • аапп = = ^аа,1аа22 • • ‘daj- аапп Р’аа11ааг2 • -caj- • -аапП‘ Собирая вместе первые слагаемые (с теми знаками, которые
20 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.45 имели соответствующие члены первого определителя) и вы- нося за скобки число %, получим в скобках, очевидно, определитель Dx; аналогично, собирая вторые слагаемые и вынося за скобки число р., получим определитель D2. Та- ким образом, формула (9) установлена. Эту формулу удобнее записать в несколько ином виде. Пусть D — произвольный фиксированный определитель. Обо- значим через Dj(Pi) определитель, который получается при замене элементов /-го столбца определителя D на числа р; (L— 1, 2, ..., л). Исходный определитель можно записать в форме D Тогда доказанное нами равенство (9) прини- мает вид DJ{kbi + \i,ci) = KDj(bi) + \kDj(ci). б. Линейное свойство определителя без труда распрост- раняется на тот случай, когда каждый элемент /-го столбца есть линейная комбинация любого фиксированного числа слагаемых: + ... + тД; в этом случае (а<у)= D/ (^< + Рс< + • • + т/;) — = (bi) + И Dj (Ci) + ... + rDj (fi). (10) 1.45. Следствие. Общий множитель всех элементов некоторого столбца определителя можно вынести за знак определителя. В самом деле, если то по формуле (10) Dj(aiJ}=Djabi) = ’kDj(bi), что и утверждается. 1.46. Следствие. Если некоторый столбец определи- теля состоит целиком из нулей, то определитель равен нулю. В самом деле, 0 есть общий множитель элементов дан- ного столбца; вынося его за знак определителя, получим D/(0) = Dy(0.1) = 0.D/(l) = 0. См. задачу 5. 1.47. Прибавление к одному столбцу дру- гого столбца с произвольным множителем. а. Определитель не изменится, если к элементам одного из его столбцов прибавить соответствующие элементы любого другого столбца, умноженные на фиксированное число.
1-5*1 § 1.5. АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ И МИНОРЫ 21 Пусть к /-му столбцу прибавляется А-й (А#=/), умножен- ный на число X. В полученном определителе /-й столбец будет состоять из элементов вида а^-\- kaik (i = 1,2, ..., п). В силу формулы (9) Dj (ац + Xalft) = (а,7) + X D,. (ailt). Во втором определителе /-й столбец состоит из элементов aik, т. е. совпадает с А-м столбцом. По следствию 1.43 о/(ац,) = 0, откуда DJ(aiJ+kaik) = DJ(aiJ), что и требуется. б. Разумеется, свойство а можно сформулировать в более общей форме: определитель D не изменится, если к элемен- там его j-го столбца прибавить соответствующие элементы k-го столбца, умноженные на число X, затем элементы 1-го столбца, умноженные на число р., . . ., элементы р-го столбца, умноженные на число т J, I =£=j, ..., р=/= /). См. задачу 6. 1.48. Все свойства, доказанные нами в этом параграфе для столбцов определителя, в силу неизменности определи- теля при транспонировании (1.41) остаются справедливыми и для его строк. § 1.5. Алгебраические дополнения и миноры 1.51. Рассмотрим произвольный, например /-Й, столбец определителя D. Пусть а^—некоторый элемент этого столбца. В правой части равенства (6) D~^j{ 1)^ ....а^аа11аа2г • • • а<Хпл> задающего определитель D, соберем все члены, содержащие элемент а,у, заключим их в скобки и вынесем за эти скобки элемент а,у. Величина, оставшаяся в скобках, обозначается через Д,7; она называется алгебраическим дополнением эле- мента a,j в определителе D. Так как в каждый член определителя D входит элемент из /-го столбца, то равенству (6) можно придать теперь вид D= ауА1} + а^А^-\- ... + anJAn/. (11)
22 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.52 Формула (И) называется формулой разложения опреде- лителя D по элементам j-го столбца. Разумеется, аналогичную формулу можно написать и для любой строки определителя D; например, для /-й строки мы получим такое равенство: £> = л(1Л(14- ai2A,-2 + ... + ainAln. (12) Мы получили теорему. Теорема. Сумма всех произведений элементов какого- нибудь столбца {или строки) определителя D на соответст- вующие алгебраические дополнения равна самому определи- телю D. Формулы (11) и (12) можно использовать для вычисления определителя. Но при этом необходимо уметь вычислять алгебраические дополнения; правила для их вычисления мы приведем в 1.54. 1.52. Отметим одно следствие формул (11) и (12), которое будет в дальнейшем использовано. Равенство (И) выполняется тождественно относительно величин йц, a2J, . . ., апу-; поэтому оно останется справед- ливым, если заменить в нем а(.у.(/=1, 2, ..., л) на любые другие величины. При такой замене величины Д1у-, Д2у-, . . ., Anj остаются неизменными, поскольку они не зависят от элемен- тов а,у. Заменим в правой и левой частях равенства (11) элементы а1у-, a2j, ..., anj на соответствующие элементы какого-нибудь другого, например й-го, столбца. Тогда опре- делитель слева в (И) будет иметь два одинаковых столбца и по 1.43 будет равен нулю. Мы получаем равенство (при k =£ j) alkAlj + a2kA2; + • • • + ankAnJ = °- П 3) Аналогично из формулы (12) при получаем алЛ1 + а 12^12 + • • • + alnAin — °- (14) Итак, мы доказали теорему: Теорема. Сумма всех произведений элементов какого- нибудь столбца {или какой-нибудь строки) определителя D на алгебраические дополнения соответствующих элементов дру- гого столбца (строки) равна нулю. 1.53. Если зачеркнуть в матрице л-го порядка некоторую строку и некоторый столбец, то оставшиеся элементы, ес-
1.53] § 1.5. АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ И МИНОРЫ 23 тественно, образуют некоторую матрицу (л—1)-го порядка. Определитель этой матрицы называется минором данной матрицы л-го порядка (а также минором ее определителя D). Если были зачеркнуты z-я строка и /-й столбец, то получен- ный минор обозначается через УИ,- - или /И,у (О). Мы докажем, что имеет место равенство Л,.у=(-1)-+>/И17, (15) с помощью которого вычисление алгебраических дополнений сводится к вычислению соответствующих миноров. Доказательство равенства (15) проведем сначала для случая i= 1, /=1. Соберем в правой части равенства (6) все члены, содержащие элемент ап. Рассмотрим один из таких членов. Очевидно, что произведение всех его элементов, за исключением ап, дает некоторый член с минора 7ИП. Так как в матрице определителя D нет отрезков с отрицательным наклоном, соединяющих элемент аи с остальными элементами выделенного члена, то знак, который приписывается члену аг1с определителя D, совпадает со знаком, который приписывается члену с в миноре /Ип. Выбирая должным образом член определителя D, содержащий элемент а11, и зачеркивая аи, можно получить любой член минора Ми. Поэтому рассмат- риваемая алгебраическая сумма всех членов определителя D, содержащих аи, равна произведению Но согласно 1.51 эта сумма равна произведению Следовательно, Аи = A41V что и требуется. Теперь мы докажем формулу (15) при любых I и /. То обстоятельство, что при z' = /=l эта формула справед- лива, будет нами существенно использовано. Рассмотрим элемент а,у=а, расположенный на пересечении z'-й строки и /-го столбца определителя D. Переставляя последовательно соседние строки и столбцы, мы можем перевести элемент а в левый верхний угол матрицы; для этого понадобится z — 1 + /—1 =/-(-/—2 перестановок. В результате мы по- лучим определитель Dx с теми же членами, какие будет иметь исходный определитель D, если его умножить на (—1),+-,-2 = (—1)'+Л Минор /И11 определителя Z^, оче- видно, совпадает с минором 2Игу(£>) определителя D. По до- казанному, в определителе Dr члены, содержащие элемент а, составляют в сумме величину аМп (£>1). Поэтому в составе исходного определителя D члены, содержащие элемент а^ = а,
24 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.54 образуют в сумме величину (-1 )/+/ажп (Ох) = а,7 (-1)'+ЛИ/7 (D). Но согласно 1.51 эта же сумма равна произведению а^А^. Следовательно, Д7=(—1)'+?уИ;7; тем самым фор- мула (15) доказана полностью. 1.54. Формулы (11) и (12) можно теперь записать соот- ветственно в форме о=(-1)1+ЧА+(-1)2+ЧА+ ... +(-1)’+ЧА/- D = (_ + (- 1)/+ЧА+ • • • +(-1)/+л«,Л,л> в которой они обычно и употребляются. 1.55. Примеры. а. Определитель третьего порядка допускает шесть различных разложений (три по строкам и три по столбцам). Например, разло- жение по первой строке имеет вид а11 а12 а13 а21 °22 а23 а31 а32 а33 = ап а22 агз а32 а33 — ^12 °21 fl23 а31 а33 + а13 a2i <*22 а31 а32 б. Определитель л-го порядка ап 0 0 ... О ^21 @22 б ... О а31 а32 а33 • • б аП1 @п2 апЗ • • • апп называется треугольным. Разлагая его по первой строке, получим, что определитель Dn равен произведению элемента аи на треугольный определитель (п—1)-го порядка а22 О ... б Dп-1= °32 б ал2 апЗ • • • апп Определитель Оп-1 снова разложим по первой строке; получим £)„_1 = а22£)„_2, где £)и_2— треугольный определитель (п—2)-го по- рядка. Продолжая таким образом далее, в конце концов получим Dn — au а22 ••• апп> т. е. треугольный определитель равен произведению элементов, стоя- щих на его главной диагонали.
1.62] § 1.6. ПРАКТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ 25 § 1.6. Практическое вычисление определителей 1.61. Формула (12) приобретает особенно простой вид, когда все элементы z'-й строки, кроме одного, например а!к, равны нулю. В этом случае Z) а.(кА[к, (16) и вычисление определителя D л-го порядка непосредственно приводится к вычислению определителя (л—1)-го порядка. Но если при aik=/=G в z-й строке есть элемент а^, также не равный нулю, то мы можем вычесть из /-го столбца опре- делителя D k-R столбец, умноженный в резуль- тате мы получим определитель, равный исходному (1.47), у которого /-Й элемент z'-й строки уже равен нулю. Повто- ряя аналогичные операции, мы можем от любого определи- теля с фиксированным элементом а[к 0 перейти к опреде- лителю, у которого все элементы z'-й строки, кроме а1к, равны нулю, и вычислить его по формуле (16). Разумеется, аналогичные преобразования можно производить и со столб- цами определителя. 1.62. Пример. Вычислим определитель 5-го порядка Г> = —2 5 0 —1 3 1 0 3 7 —2 3—1 0 5—5 26—412 0—3—1 2 3 В третьем столбце этого определителя уже имеется два нуля. Чтобы получить в этом столбце еще два нуля, нужно ко второй строке при- бавить утроенную пятую, а из четвертой строки вычесть учетверенную пятую. После этой операции и разложения определителя по третьему столбцу мы получаем 5 0 —1 3 —9 0 13 7 — 1 0 5 —5 18 0 —7 —10 -3 —1 2 3 = (_1)3+5.(_1) —2 5—1 3 1 —9 13 7 3—1 5—5 2 18 —7 —10 —2 5—1 3 1 —9 13 7 3—1 5—5 2 18 —7 —10
26 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.71 Теперь проще всего получить три нуля в первом столбце: для этого мы прибавим к первой строке удвоенную вторую, а из третьей и чет- вертой строк вычтем вторую, соответственно утроенную и удвоенную: —2 5 —1 3 0 —13 25 17 г-» 1 —9 13 7 1 —9 13 7 и =— 3 —1 5 —5 0 26 —34 —26 2 18 —7 —10 0 36 —33 —24 —13 25 17 _l)i + a 26 —34 —26 36 —33 —24 Чтобы легче было вычислить полученный определитель 3-го порядка, постараемся уменьшить абсолютные величины его элементов. Для этого после вынесения из второй строки общего множителя 2 приба- вим вторую строку к первой и из третьей строки вычтем удвоенную вторую: D = 2 — 13 25 17 13 —17 —13 36 —33 —24 0 8 4 13 —17 —13 10 1 2 = 2-4 О 2 1 13 —17 —13 10 1 2 = 2 В первой строке имеется уже один нуль. Чтобы получить еще один нуль, вычтем из второго столбца удвоенный третий; после этого опре- делитель легко вычисляется до конца: 0 = 8 О 2 1 13 —17 —13 10 1 2 О 0 1 13 9 —13 10 —3 2 -=8(-1)1 + з|ю -з| = = 8 = 8-3| 10 _i | = 8-3(—13— 30) = — 8-3-43 =—1032. См. задачи 7—10. § 1.7. Правило Крамера 1.71. Мы можем перейти теперь к решению систем ли- нейных уравнений. Рассмотрим сначала систему специального вида а11Х1 + а12Х2 + • • • + а1„х„ — ^1> а21Х1 + а22Х2 + • • • + а2вХи = ^2> ап1Х1 + ав2Х2 + • • + аввХв = &П (17) с числом неизвестных, равным числу уравнений. Коэффици- енты ai;-{i, j=\, 2, л) образуют основную матрицу системы, относительно которой мы предположим, что ее определитель D отличен от нуля. Мы покажем, что такая
1.71J § 1.7. правило Крамера 27 система всегда совместна и определенна, и получим формулу для вычисления ее единственного решения. Допустим сначала, что система (17) имеет некоторое решение с2, ..., сл; справедлива, следовательно, система равенств а11с1 + a12f2 + • • • + а1пСп — Ьц а21С1 4" а22С2 + • • • 4’ а2пСп ~ ^21 > 08) ап1С1 ~Г ап2С2 4“ • • • 4“ ЙЛПСЛ = Ьп. 1 Умножим первое из равенств (18) на алгебраическое до- полнение к элементу ап в матрице системы, далее ум- ножим второе равенство на А21, третье — на Д31 и т. д., пока не дойдем до последнего равенства; затем все получен- ные равенства сложим. В результате мы получим следующее соотношение: (ai Ии4--a2i^2i 4- • • • + a„iA,i) ci 4- 4“ (а12-^11 4“ а22^21 4' • • • 4“ a,i2All) С2 4- 4- (а1,Л1 4- а2п^21 4- • • • 4- a„„Ail) сл = = ^Ии 4- ^2^214- • • • 4- Ь„Аа1. (19) В силу теоремы 1.51 коэффициент при ct в соотношении (19) равен самому определителю D; в силу теоремы 1.52 коэф- фициенты при всех остальных су- (/=/= 1) обращаются в нуль. Выражение в правой части есть разложение определителя *1 °12 • i>2 а22 • • ^2« ^«2 * ' &пп по первому его столбцу; поэтому равенство (19) можно теперь записать в виде D-c^— Dv откуда 4 Совершенно аналогично можно получить выражение D, Cj = -£ (/=1, 2, .... л), (20)
28 ГЛ. 1, ОПРЕДЕЛИТЕЛИ [1.72 где D/== а11 а12 . Ьг а1,/+1 • • а1п а21 о22 .. • a2,j-l ^2 а2,/+1 ' °2п ап2 • • Ьп ап,/+1 апп есть определитель, полученный из определителя D заменой его у-го столбца на столбец из чисел Ьг, Ь2, ..., Ь„. Мы получили следующий результат: Если решение системы (17) существует, то оно выражается через коэффициенты системы и правые части по формулам (20). В частности, мы получаем, что решение системы (17), если оно существует, единственно. 1.72. Теперь остается показать, что решение системы (17) всегда существует. Подставим величины <7 = ^ (/=h2.........п) в систему (17) на место неизвестных xlt х2, хп. Пока- жем, что все уравнения системы (17) при этом обращаются в тождества. Действительно, для i-го уравнения мы получаем I I 1^1 I Л9 | । W1 + ai2c2 + .. . + aincn = ап + ai2-£ + . + ain-g = — [a/i (^Ai + ^21 + • • + + + ап Pi^i2 + b2A22 -|- .. . -|- bnAn2} -f- + ain (^lAn + ^2^2n + + bnA„„)] — — Pi (aii Ai + в/гАг + • • • + ainAm) + + bt (allA11 -f- ai2Ai2 + ... + Я/Им) + + bn (aaAel ai2An2 -J- ... + а,-„Д„„)]. Из всех скобок, служащих коэффициентами при величи- нах Ьг, Ь2, ..., Ьп, отлична от нуля в силу теорем 1.51 и 1.52 только одна, именно та, которая стоит при величине bf,
1.74J § 1.7. ПРАВИЛО КРАМЕРА 29 она равна самому определителю D. Следовательно, получен* ное выражение приводится к виду т. е. совпадает с правой частью /-го уравнения системы. 1.73. Итак, величины Су действительно образуют реше- ние системы (17). Тем самым мы установили следующее правило для получения решения системы (J7) (правило Крамера): Если определитель системы (17) отличен от нуля, то она имеет одно и только одно решение: значение неизвестного Xj равно дроби, знаменателем которой является определитель системы (17), а числителем—определитель, получающийся за- меной j-го столбца в определителе системы (17) на столбец из правых частей системы (J=\, п). Отыскание решения системы (17), таким образом, сво- дится к вычислению определителей. См. задачу 11. Способы решения более общих систем (с определителем, равным нулю, или с числом уравнений, не равным числу неизвестных) будут даны в двух следующих главах. 1.74. Замечание. Иногда встречаются системы ли- нейных уравнений, свободные члены которых являются -не числами, а векторами (в аналитической геометрии, в меха- нике). Теорема Крамера и ее вывод остаются справедливыми и для этого случая; следует иметь только в виду, что и значения неизвестных хх, х2, . . ., хп также будут не числами, а векторами. Например, система *1 + *2 = /—3/, хх—хг = / + 5/ имеет решение (единственное) G = /4Z с2 = —4/.
30 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.81 § 1.8. Миноры произвольного порядка. Теорема Лапласа 1.81. Теорема 1.51 о разложении определителя по строке или столбцу является частным случаем более общей теоремы о разложении определителя по целой совокупности строк или столбцов. Прежде чем сформулировать эту общую теорему (теорему Лапласа), введем некоторые новые определения. Пусть в квадратной матрице л-го порядка указаны про- извольно k^n различных строк и столько же различных столбцов. Элементы, стоящие на пересечениях этих строк и столбцов, образуют квадратную матрицу порядка k; ее определитель называется минором k-го порядка данной мат- рицы л-го порядка (а также минором k-vo порядка опреде- лителя D) и обозначается через АЛ — АЛ1.” Ь' 1г...........1кУ где ilf i2, ..., ik—номера выделенных строк, a Jly j2, ..., jk — номера выделенных столбцов. Если зачеркнуть в исходной матрице строки и столбцы, в которых лежит минор М, то оставшиеся элементы снова образуют квадратную матрицу порядка л—k\ ее определи- тель называется минором, дополнительным к минору М, и обозначается символом где индексы указывают номера вычеркнутых строк и столбцов. В частности, если исходный минор имеет порядок 1, т. е. совпадает с некоторым элементом а;-у- определителя D, то дополнительный минор совпадает с минором М^, о кото- ром шла речь в 1.53. Рассмотрим минор лежащий в первых k строках и первых k столбцах опреде- лителя D; минор, дополнительный к нему, есть минор Выделим в правой части формулы (6) все те члены опре- делителя, в которых первые k элементов принадлежат ми-
1.81) § 1.8. МИНОРЫ ПРОИЗВОЛЬНОГО ПОРЯДКА 31 нору Мр а следовательно, остальные л — ft элементов — ми- нору Фиксируем сначала один из таких членов с тем, чтобы определить знак, который должен быть ему приписан; обозначим этот член через с. Первые k элементов этого члена определяют некоторый член с± минора обозначим через число соответствующих отрезков отрицательного наклона; тогда знак, который должен быть поставлен перед членом с± в миноре Мг, определяется выражением ( —l)v*. Остальные л—k элементов члена с определяют некоторый член с2 минора /И2; знак, который должен быть поставлен перед этим членом в миноре Ж2, определяется выражением (—1)ЛГг, где N2 — число соответствующих отрезков отрица- тельного наклона в миноре Af2. Поскольку в матрице опреде- лителя D нет ни одного отрезка с отрицательным наклоном, который соединял бы элемент минора с элементом минора Af2, общее число отрезков отрицательного наклона, соединяю- щих элементы члена с, равно сумме A^-j-A^. Поэтому знак, который следует поставить перед членом с в определителе D, определяется выражением (— 1 )Лг»4-аг, и следовательно, равен произведению знаков членов ct и с2 в минорах и М2. За- метим, далее, что произведение любого члена минора Л11 на любой член минора Л42 дает нам один из выделенных членов определителя D. Отсюда вытекает, что сумма всех выделен- ных членов в выражении определителя D по фррмуле (6) равна произведению миноров А4Х и М2. Теперь мы получим похожий результат для произвольного минора М — м‘-'' ‘‘ ‘-к — /И/1. h.....1к с дополнительным минором Ж2. Переставляя последовательно соседние строки и столбцы, мы можем минор перевести в левый верхний угол определителя D; для этого понадобит- ся всего (h—1) + (/2 — 2)+ ... +(ik — + 1) + •+(/2— 2)-j-.-- + (A — k) перестановок. В результате, мы получим определитель с теми же членами, какие будет иметь исходный определитель D, если его умножить на (— 1 )'+', где i = ix + /2 + . .. + ik, / = /х + /2 + • • • + jk. По доказанному, в определителе Dr сумма всех тех членов, первые k элементов которых входят в минор равна произведению AJXA12. Отсюда следует, что сумма соответ-
32 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.81 ствующих членов определителя D равна произведению где величина А2=(— 1)'+/ЛТ2 называется алгебраическим дополнением минора Л1г в определителе D. Иногда употреб- ляют обозначение А — д'*- ‘....'* !г...1k ' Фиксируем теперь в определителе D строки с номерами ilt i2, . . ., ik. В каждый член определителя D входят неко- торые элементы из этих строк. Если собрать вместе все та- кие члены, у которых элементы выделенных строк принадле- жат к фиксированным столбцам с номерами Jly j2, .. ., jk, то, по доказанному, сумма всех этих членов будет равна произ- ведению минора i2 • • • • > А........Jk на соответствующее алгебраическое дополнение. Все члены определителя, таким образом, можно разбить на группы, каж- дая из которых определяется заданием k столбцов. Сумма членов в каждой группе равна произведению соответствую- щего минора и его алгебраического дополнения. Поэтому весь определитель представляется в виде суммы z>=2 (-к::::: Ь Ж к::::: к. (21) причем суммирование производится при фиксированных индек- сах z\, z2, . .. , ik (индексы выбранных строк) по всем воз- можным значениям индексов столбцов /х, /2...........jk U • • • < Свойство определителя D, выражающееся равенством (21), и называется теоремой Лап- ласа. Очевидно, формула (21) действительно является обоб- щением формулы разложения определителя по одной строке, полученной в 1.54. Аналогичная формула справедлива для разложения опре- делителя D по фиксированной системе столбцов.
1-81] § 1.9. О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 33 1.82. Пример. Определитель вида fln • • • alk ai, k+i • • aln a2i . . . a2k й-2, k+i • • • a2n akl акк ак, ft+1 • • • akn о 0 aA + l, k + 1 ak + l,n 0 ... 0 ... a все элементы которого, находящиеся в первых k столбцах и последних п — k строках, равны нулю, называется квази- треуголъным.. Для его вычисления разложим определитель по первым k строкам с помощью теоремы Лапласа. В сумме (21) останется только одно слагаемое, и мы получим аи aki ak + l, к + 1 ••• &к + 1, п @кк &п, к + 1 • • • &пп См. задачу 12. § 1.9. О линейной зависимости между столбцами 1.91. Пусть нам дано несколько, например т, числовых Умножим каждый элемент первого столбца на некоторое число Ах, каждый элемент второго столбца — на число А2, ... . .. , каждый элемент последнего, от-го, столбца на число Х,я и сложим соответствующие элементы полученных столбцов. В результате получится некоторый новый числовой столбец, элементы которого мы обозначим буквами сх, с2, ... , сп. Все эти действия можно наглядно представить с помощью
34 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.92 следующей схемы: или, короче, М14-Мг + 4-AmXm = C, где через С обозначен получившийся столбец. Этот стол- бец С называется линейной комбинацией взятых столбцов АЛ, А2, . . . , Ат; числа Х2, . . . , \т называются коэф- фициентами этой линейной комбинации. Частными случаями линейной комбинации являются сумма столбцов (когда коэффициенты А1; . . . , Ага равны 1) и про- изведение столбца на число (когда т=\). Теперь представим себе, что наши столбцы взяты не сами по себе, а входят в состав некоторого определителя D л-го порядка. Докажем следующую теорему. Теорема. Если один из столбцов определителя D явля- ется линейной комбинацией других столбцов, то D=0. Доказательство. Пусть, например, q-й столбец опре- делителя D является линейной комбинацией у'-го, fe-ro, . .. . . . , р-го столбцов этого определителя с коэффициентами, соответственно, Aft, .. . , Тогда, вычитая из q-ro столбца у-й столбец, умноженный на Лу-, затем fe-й столбец, умножен- ный на ХА, . . . , наконец, р-й столбец, умноженный на мы согласно 1.476 не изменим величины определителя D; но в результате <?-й столбец будет состоять из одних нулей, откуда вытекает, что D = 0. Замечательно, что справедлива и обратная теорема: если заданный определитель D равен нулю, то один (по меньшей мере) из его столбцов является линейной комбинацией других столбцов. Доказательство этой теоремы требует некоторых предварительных построений, к которым мы и переходим. 1.92. Пусть опять имеется m числовых столбцов по п элементов в каждом. Мы можем записать их в виде матрицы
1.93] § 1.9. О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 35 с п строками и т столбцами: а11 а12 • • • а\т Л__ а21 Я22 • • • а2т ап1 ап2 ' • • апт Если фиксировать некоторое число k столбцов этой матрицы и такое же число k ее строк, то элементы, стоя- щие на пересечениях указанных столбцов и строк, образуют квадратную матрицу k-ro порядка. Ее определитель назы- вается минором k-го порядка матрицы А; он может быть равен нулю или отличен от нуля. Если среди чисел есть отличные от нуля (что мы всегда будем предполагать), то всегда можно указать натуральное число г, обладающее такими свойствами: а) у матрицы А имеется минор г-го порядка, отличный от нуля; б) всякий минор матрицы А, имеющий порядок г+1 или выше (если вообще таковые существуют), равен нулю. Число г, обладающее указанными свойствами, называется рангом матрицы А. Если все aik равны нулю, то ранг мат- рицы считается равным нулю (г = 0). В дальнейшем мы пред- полагаем, что г > 0. Тот минор г-го порядка, который от- личен от нуля, называется базисным минором матрицы А. (Разумеется, у матрицы А может быть и несколько базис- ных миноров; но все они имеют один и тот же порядок г.) Столбцы, на которых построен базисный минор, называются базисными столбцами. 1.93. Имеет место следующая важная теорема: Теорема (о базисном миноре). Любой столбец матрицы А является линейной комбинацией ее базисных столбцов. Доказательство. Предположим для определенности, что базисный минор матрицы А расположен в первых г стро- ках и первых г столбцах матрицы А. Пусть s—любое целое число от 1 до m, a k— любое целое число от 1 до л.
36 ГЛ. 1. ОПРЕДЕЛИТЕЛИ [1.93 Рассмотрим определитель (r-f-l)-ro порядка а11 в12 (Zn । CL 22 a\r als a2r a2s аП аг2 akl ак2 arr ars akr aks Если определитель D, очевидно, равен нулю, так как в нем имеются две одинаковые строки. Аналогично D = Q при s^r. Если &>г и s > г, то определитель D также равен нулю как минор (г+1)-го порядка матрицы ранга г. Следовательно, D — 0 при любых значениях k и s. Разложим определитель D по последней строке; мы полу- чим равенство akl^kl + ak2^k2 + • • • + акг^кг + aks^ks = (22) где числа Akl, Ak2, ..., Akr, Ahs означают соответственно алгебраические дополнения элементов akl, ak2, ..., акг, aks, находящихся в нижней строке определителя D. Эти алгеб- раические дополнения не зависят от числа k, так как обра- зуются с помощью элементов с i^r; поэтому мы можем ввести обозначения ^к! — с1< ^к2 ~ с2, • • • > -^кг — cr’ ^ks ~ CS- Подставляя в равенство (22) последовательно значения & = 1, 2, ..., л, получим систему равенств cian + c2ai2 4~ • • • 4* crair "4 csais ~ С1а21 + С2а22 + • • • + Сга2Г + Csa2s — ^i«„i + с2а„2 + . .. + cranr + csans = 0. (23) Число cs = Aks отлично от нуля, так как Ahs есть базис- ный минор матрицы А. Разделив каждое из равенств (23) на cs, перенеся все слагаемые, кроме последнего, в правую Су часть и обозначив —— через Лу (/=1,2, ..., г), мы получим alS — ^1а11 + ^2а12 + • • • + ^Га1г> ®2S ~ ^'1а21 4~ ^2®22 4* • • • + ^r^2r> (24) ans — ^lanl "4 ^2ап2 + • • • ~V^ranr-
1.95] § 1.9. О ЛИНЕЙНОЙ ЗАВИСИМОСТИ МЕЖДУ СТОЛБЦАМИ 37 Эти равенства показывают, что s-й столбец матрицы А явля- ется линейной комбинацией первых г столбцов этой матрицы (с коэффициентами Ах, Л2, . . Хг). Поскольку у может быть любым числом от 1 до т, наша теорема полностью дока- зана. 1.94. Мы можем теперь доказать сформулированное в конце 1.91 обращение теоремы 1.91. Теорема. Если некоторый определитель D порядка п равен нулю, то у него имеется столбец, который является линейной комбинацией других столбцов. Доказательство. Рассмотрим матрицу определителя D. Поскольку D = 0, базисный минор этой матрицы имеет порядок г < п. Поэтому после выделения г базисных столб- цов мы сможем найти еще по меньшей мере один столбец, не попавший в число базисных. В силу теоремы о базисном миноре он представляет собой некоторую линейную комби- нацию базисных столбцов. Итак, мы нашли в определителе D столбец, который является линейной комбинацией других столбцов, что и утверждалось. Заметим, что в состав этой линейной комбинации можно включить и все оставшиеся столбцы определителя D, поста- вив перед ними, например, нулевые коэффициенты. 1.95. Полученные результаты можно сформулировать в несколько более симметричном виде. Если коэффициенты Х2, ..., Ет линейной комбина- ции т числовых столбцов Av А2, ..., Ат (1.91) взять равными нулю, то очевидно,’ что в результате получится нулевой столбец, т. е. столбец, состоящий из одних нулей-. Но возможно, что нулевой столбец получается из заданных столбцов не только таким способом, а и с помощью коэф- фициентов Х2, ..., из которых не все равны нулю. В этом случае взятые столбцы Дх, Аг, ..., Ат называются линейно зависимыми. Например, столбцы Аг= 1 2 3 4 2 4 6 8 1 ^3 = ] I —
38 ГЛ. I. ОПРЕДЕЛИТЕЛИ [1.9Г линейно зависимы, так как нулевой столбец равен линейной комби- нации 2* Ai— I • Л 2 + 0- Л3. Определение линейной зависимости можно сформулиро- вать более подробно так: столбцы А = ап Й21 , а2 = • • & й to н* СО to , . . . г m to м Э 3 • s' ап2 называются линейно зависимыми, если существуют вели- чины Xj, Х2, •••> не все равные нулю, такие, что удов- летворяется система уравнений ^1а11 + ^2а12 + • • • + ^та1я1 = 0, j ^1а21+^2а2г+ • ' • + Ana2m = 0, 1 Sanl + ^2an2 + • • • + ^тапт — 0, J рли, что то же самое, М1 + М2+---+ЧА» = о*). Если один из столбцов Лх, Л2, . . ., Ат, например послед ний, является линейной комбинацией остальных, Ап = + • • • (25) то столбцы Xj, Л2, ..., Ат линейно зависимы. Действи- тельно, соотношение (25) равносильно соотношению Х1Д1 + Х2'42+ • • + Ч»-1Ап-1 + ( U ^т~^’ следовательно, существует линейная комбинация столбцов Alt А2, . . ., Ат, коэффициенты которой не все равны нулю (в частности, последний коэффициент равен —1) и которая дает в результате нулевой столбец; это и означает линей- ную зависимость столбцов Alt Л2, ..., Ат. Обратно, если между столбцами At, А2, Ат имеется линейная зависимость, то (по меньшей мере) один из этих *) Здесь в правой части символ 0 означает нулевой столбец.
ЗАДАЧИ 39 столбцов является линейной комбинацией остальных. В самом деле, пусть в равенстве + ^2^2 + • • • + = О, ДО) выражающем линейную зависимость столбцов Hj, А2, ,.Ат, отличен от нуля, например, коэффициент Тогда соот- ношение (26) равносильно соотношению которое показывает, что столбец Ат является линейной комбинацией столбцов Л1; А2, ..., Ат_1. Итак, столбцы Аг, Л2, . . ., Ат линейно зависимы тогда и только тогда, когда один из этих столбцов является линей- ной комбинацией остальных столбцов. 1.96. Теоремы 1.91 и 1.94 показывают, что определи- тель D равен нулю тогда и только тогда, когда один из его столбцов является линейной комбинацией остальных столбцов. Используя полученный в 1.95 результат, мы можем сфор- мулировать следующую теорему: Теорема. Определитель D равен нулю тогда и только тогда, когда между его столбцами существует линейная зави- симость. 1.97. Так как при транспонировании определителя его величина не меняется {1.41}, а столбцы заменяются строками, то во всех формулировках настоящего параграфа столбцы можно заменить на строки. В частности, имеет место сле- дующий результат: Определитель D равен нулю тогда и только тогда, когда между его строками существует линейная зависимость. См. задачи 13—14. ЗАДАЧИ 1. С каким знаком в определитель 6-го порядка входят члены: а) Й23а31а42а5ба14°в5> б) Яз2а43°:4а51авв°25? 2. Выписать все члены, входящие в состав определителя 4-го порядка со знаком — и содержащие множителем а2з-
40 ГЛ. 1. ОПРЕДЕЛИТЕЛИ 3. С каким знаком входит в определитель n-го порядка член м-1 ani- 4. Показать, что из п! членов определителя ровно половина получает по определению § 1.3 знак + , а вторая половина — знак —. 5. Вычислить определитель ат -}Ьр an-}- bq cm }-dp сп -}- dq разложив его на слагаемые. 6. Числа 20 604, 53 227, 25 755, 20 927 Доказать, что определитель 2 0 6 0 4; 5 3 2 2 7 2 5 7 5 5 2 0 9 2 7 7 8 4 2 1 также делится на 17. 7. Вычислить определители 78 421 делятся на 17. 246 427 327 1014 543 443 —342 721 621 8. Вычислить определитель 2 1 1 1 1 1111 3 111 14 11 115 1 1116 112 3 1 2—х2 2 РЮ~ 2 3 1 3 5 2 3 1 9—х2 9. Вычислить определитель n-го порядка х а а ... а а х а ... а а ах ... а а а а ... х 10. Вычислить определитель Вандермонда 1 1 1 «1 ... хп A (Xi, х2........х„) = ,п-1 ^.п^-1 Xl %2 п-1
ЗАДАЧИ 41 11. Решить систему уравнений х4 2х3 -j- Зх3 -j- 4x4 -j- 5x3 = 13, 2x4 -j- x2 -j- 2Xg -j- 3x4 -j- 4xg = 10, 2x4 + 2x2 + x3 + 2x4 + 3x6 = 11, 2xt -j- 2x2 -|- 2x3 -j- x4 2x6 =— 6, 2xx + 2x2 + 2x3 + 2x4 + x3 = 3. 12. Сформулировать и доказать теорему, находящуюся в таком же логическом отношении к теореме Лапласа, в каком теорема 1.52 находится к теореме 1.51. 13. Построить четыре столбца из четырех чисел в каждом, кото- рые не были бы линейно зависимыми. 14. Показать, что если строки некоторого определителя п-го порядка линейно зависимы, то линейно зависимы и его столбцы.
ГЛАВА 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА §2.1. Определение 2.11. В аналитической геометрии и в механике исполь- зуются направленные отрезки — векторы. Для векторов уста- новлены по определенным правилам действия: известно, что означает сумма двух векторов и что означает произведение вектора на вещественное число*). При этом выполняются обычные законы арифметики. Определение линейного пространства обобщает опреде- ление совокупности всех векторов. Обобщение производится, во-первых, путем отвлечения от конкретной природы объ- ектов (направленных отрезков) с сохранением свойств дейст- вий над ними, во-вторых, путем отвлечения от конкретной природы допустимых множителей (вещественных чисел). Таким образом, получается следующее определение: Множество К называется линейным (аффинным) простран- ством над полем К, если а) имеется правило (правило сложения), которое позволяет для каждых двух элемен- тов х и у из К построить третий элемент z g К**), называе- мый суммой элементов х и у и обозначаемый х-\-у, б) име- *) Мы не касаемся пока других векторных операций — скаляр- ного и векторного произведений. Во всяком случае оба эти произве- дения не могут играть той роли, которую играет обычное произведе- ние в поле вещественных чисел; скалярное произведение векторов уже не есть вектор; векторное произведение векторов хоть и есть вектор, но эта операция, в отличие от умножения вещественных чисел, неком- мутативна. **) Мы используем здесь и в дальнейшем некоторые обозначения теории множеств. Запись а£А означает, что элемент а входит в мно- жество А; запись BczA означает, что множество В является частью множества А (причем В может и совпадать с А). Два соотношения ВсЛ, ЛаВ равносильны утверждению, что множества А и В сов- падают. Знаки £, с называются знаками включения.
2.14] § 2.1. ОПРЕДЕЛЕНИЕ 43 ется правило (правило умножения на число), кото- рое позволяет построить для каждого элемента х $ К и любого числа X £ К элемент и £ К, называемый произведением, элемента х на число X и обозначаемый Хх; в) правила а) и б) удовлетворяют аксиомам, перечисленным в 2.12 — 2.13. Элементы линейного пространства мы будем называть векторами, невзирая на то, что по своей конкретной при- роде они могут быть вовсе и не похожи на привычные нам направленные отрезки. Геометрические представления, свя- занные с названием «векторы», помогут нам уяснить и часто предвидеть нужные результаты, а также находить прямой геометрический смысл в различных фактах из алгебры и анализа, который без того не был бы очевидным. В частно- сти, в следующей главе мы получим простую геометричес- кую характеристику всех решений однородной или неоднород- ной системы линейных уравнений. 2.12. Предполагается, что правило сложения обладает следующими свойствами: 1) х-)-у=у-)-х для любых х и у из К; 2) (х+у)4-д = х + (у<^-г) для любых х, у, z из К; 3) существует элемент 0 (нуль-вектор) такой, что х 4~ 0 = х для любого х^К; 4) для каждого х£К существует элемент у £ К такой, что х-]-у = 0 (противоположный элемент). 2.13. Предполагается, что правило умножения на число обладает следующими свойствами: 5) 1-х —х для любого х g К; 6) а(0х)=-(оф)х для любого х£Ки любых а и f из X; 7) (а-j-Р) х = ах + 0х для любого х£К и любых а и Р из К\ 8) а (х -j- у) ~ ах + ау для любых х и у из К и любого а£К. 2.14. Из аксиом 1) — 8) можно получить в первую оче- редь следующие теоремы: а. Теорема. В любом линейном пространстве сущест- вует единственный нуль. Доказательство. Существование хотя бы одного ну- ля утверждается в аксиоме 3). Допустим, что в пространстве К
44 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА- [2.14 имеются два нуля: 0х и 02. Полагая в аксиоме 3) х = 01( О = 02, мы получаем 0i4-02 = 0r Полагая в той же аксиоме х = 02, 0 = 01( мы получаем Оа + 0х = 02. Сравнивая первое из полученных равенств со вторым и поль- зуясь аксиомой 1), находим 0х = 02, что и требовалось. б. Теорема. В любом линейном пространстве для каж- дого элемента существует единственный противоположный элемент. Доказательство. Существование хотя бы одного противоположного элемента утверждается в аксиоме 4). Допустим, что для некоторого элемента х имеется два про- тивоположных элемента и _у2. Прибавим к обеим частям равенства х4-_ух = 0 элемент у2; используя аксиомы 2) и 3), мы получаем У 2 + (•* + У1) = (Ь + х) = 0 + Ji = Ji, Л + (х +J1) =Л + ° =Л. откуда j1=j’2, что и требовалось. в. Теорема. Для всякого элемента х в любом линей- ном пространстве имеет место равенство 0-х = О (в правой части равенства 0 означает нуль-вектор, в левой — число 0). Доказательство. Рассмотрим элемент O-x-f-1-x; используя аксиомы 7) и 5), мы получаем O-x-j-l-x = (O-f-l)x — 1 - х = х, 0-x-f-l-x = 0-x-f-x, откуда х = 0-х-)-х; прибавляя к обеим частям равенства противоположный к х элемент у, находим 0 = х + j = (0 • х + х) = 0 • х + (х -f-j) = 0- x-f-0 = 0-x,
2.15] § 2.1. ОПРЕДЕЛЕНИЕ 45 откуда 0 = 0-х, что и требуется. г. Теорема. Для всякого элемента х в любом линей- ном пространстве противоположным элементом служит у = ( — 1)-х. Доказательство. Составим сумму х-\-у, используя аксиомы и теорему в, находим x-J-y = 1 -х + (—1) -х = (1 — 1) - х = 0-х — 0, что и требуется. д. Мы будем обозначать теперь элемент, противополож- ный к данному элементу х, через —х; доказанная теорема г делает естественным это обозначение. Наличие противоположного элемента позволяет ввести операцию вычитания. Именно, разность х—у определяется как сумма х и —у. Это определение согласуется с опреде- лением вычитания в арифметике. 2.15. Линейное пространство над полем R вещественных чисел мы будем называть вещественным и обозначать че- рез R. Линейное пространство над полем С комплексных чисел мы будем называть комплексным и обозначать через С. Если указаны 'природа элементов х, у, z, ... и правила действий над ними [причем должны быть выполнены аксиомы 1) — 8)], мы будем называть линейное пространство конкретным и использовать для него, как правило, индиви- дуальное обозначение. В дальнейшем для нас будут особенно важны следую- щие три типа конкретных пространств: а. Пространство V3. Элементы этого простран- ства— свободные векторы в пространстве, рассматриваемые в аналитической геометрии. Каждый вектор характеризуется длиной и направлением*). Сложение векторов определено обычным образом по правилу параллелограмма. Умножение вектора на вещественное число X определено также обыч- ным образом (именно, длина вектора умножается на | % |, *) За исключением нуль-вектора, длина которого равна нулю! а направление произвольно.
46 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.16 направление при X > О остается неизменным, при X < О заменяется на противоположное). Легко проверить, что все аксиомы 1)—8) здесь выполнены. Аналогичные совокупности векторов на плоскости и на прямой, также представляющие со- бой линейные пространства, обозначим соответственно через У2 и Vlt V2, V3 — линейные пространства над полем R. б. Пространство Кп. Элемент этого пространства — любая совокупность х=(^1, g2, . . ., £„) п чисел из поля К. Эти числа £2, ..., будем называть координатами элемента х. Действия сложения и умножения на число Х£/С производятся по следующим правилам: (11> 12, • • •, U+ 011. • • •. *!«) = = (gi + ni, ?2 + Лг. •••> L + Л»). 0) MI1.U и = (2) Легко проверить, что аксиомы 1) — 8) удовлетворены. В частности, элемент 0 есть совокупность п нулей: О = (0,0, ...,0). Фактически мы имели дело с элементами этого пространства в § 1.9; только мы записывали тогда их не в форме числовой строки, а в форме столбца. Если К есть поле R вещественных чисел, обозначение Кп заме- няется на 7?„. Если К есть поле С комплексных чисел, обозначение Кп заменяется на Сп. в. Пространство R(a,b). Элемент этого простран- ства— любая вещественная непрерывная функция x = x(Z), определенная на отрезке Действия сложения функций и умножения их на вещественные числа опреде- ляются по правилам анализа; выполнение аксиом 1)—8) очевидно. При этом элемент 0 есть функция, тождественно равная нулю. Пространство R (а, Ь) есть линейное простран- ство над полем R вещественных чисел. г. Пространство С(а, Ь) соответственно есть простран- ство всех комплекснозначных непрерывных функций на от- резке Это пространство есть линейное простран- ство над полем комплексных чисел. 2.16. Заметим, что все свойства элементов конкретных пространств (например, векторов пространства V3), основан- ные только на аксиомах 1) — 8), справедливы и для элемен- тов любых линейных пространств. Например, анализируя
2.21] § 2.2. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 47 доказательство теоремы Крамера о решении системы линей- ных уравнений аих1 + й12х2 + . . . + ainxn — fl21Xl + a22X2 + • • • + a2llXn ~ Ь2, I anlXl+an2X2 + • ' • аПпХп = Ьп, J мы можем заметить, что в той части, которая касалась величин bi, b2, ..., Ьп, оно основывалось только на том факте, что эти величины можно было складывать и умно- жать на числа из К, причем использовались правила 1)—8). Это позволило обобщить теорему Крамера на системы, в которых величины Ьг, Ь2, . .., Ьп суть векторы (элементы пространства V3), как мы уже указывали в 1.74. Это позво- ляет, далее, утверждать, что теорема Крамера справедлива и для систем, в которых величины Ьг, Ь2, ...,Ьп являются элементами произвольного линейного пространства К. Отметим только, что значения неизвестных хг, х2, ..., хп будут тогда также элементами этого пространства К, линейно вы- ражающимися через величины bit b2, ..., Ьп. См. задачи 1—3. 2.17. 3 амечание. В аналитической геометрии иногда бывает удобно рассматривать векторы не свободные, а за- крепленные своим началом в начале координат. Такое рас- смотрение удобно тем, что при этом каждый вектор ассо- циируется с некоторой точкой пространства — своим концом и каждая точка пространства может быть определена соот- ветствующим вектором — так называемым радиусом-вектором этой точки. Имея в виду эту картину, мы будем иногда называть элементы линейного пространства не векторами, а точками. Разумеется, такая перемена названия не сопро- вождается никакими изменениями в определениях и апелли- рует лишь к нашим геометрическим представлениям. § 2.2. Линейная зависимость 2.21. Пусть xlt х2, •••, xk — векторы линейного про- странства К над полем К и av а2, ..., ak — числа из поля К. Вектор <y = a1x1 + a2x2+ . . .
48 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.22 называется линейной комбинацией векторов хх, х2, .. ., xk; числа ссх, а2, ..., ak—коэффициенты этой линейной комби- нации. Если ^ = «2= . . . =aft=0, то в силу теоремы 2.14в мы получаем, что у = 0. Но может быть и так, что суще- ствует линейная комбинация векторов хг, х2, ..., хк, в ко- торой не все коэффициенты равны нулю и которая, тем не менее, дает в результате нуль-вектор; в этом случае век- торы хг, х2, .. ., xk называются линейно зависимыми. Иными словами, векторы хх, х2, . . ., xk называются линейно зависимыми, если существуют числа ax, а2, . . ak, не все равные нулю и такие, что а1Л'1 Ч'а2Л-2 4“ • • • 4_ akxk ~ О’ (3) Если же равенство (3) возможно в единственном случае, когда ссх = а2= .. . = aft = 0, векторы хх, х2, хк назы- ваются линейно независимыми. 2.22. Примеры. а. В линейном пространстве У3 линейная зависимость двух векторов означает, что они параллельны одной и той же прямой; линейная зависимость трех векторов — что они параллельны одной и той же плоскости. Всякие четыре вектора линейно зависимы. б. Выясним, что означает линейная зависимость векто- ров хх, х2, ..., xk линейного пространства /<„. Пусть век- тор х{ имеет координаты Qp, ..., gjf’ (Z= 1, 2, ..., k); тогда линейная зависимость a1x1 + a2x2+ • • • + акхк — 0 означает, что выполняется п равенств a1gi1) + ^?)+. •+«^’ = 0, a1^1) + a2^>+- ..+а^<*’ = 0, (4) а1^1, + аг^г,+ • ..+a^> = 0, причем среди постоянных 0^, а2, . . ., ak имеются отличные от нуля; это — то самое определение линейной зависимости, которое мы дали в 1.95 для числовых столбцов.
2.22] § 2.2. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 49 Таким образом, вопрос о линейной зависимости векторов д-р х2, . . ., xk в общем случае сводится к вопросу о су- ществовании ненулевого решения у однородной системы урав- нений с коэффициентами, равными соответствующим коорди- натам данных векторов. В следующей главе этот вопрос будет полностью решен (3.21)t и тем самым будет получено правило, позволяющее судить о линейной зависимости или независимости данных векторов пространства Кп по их коор- динатам. в. Но в некоторых случаях мы можем и теперь уже делать выводы о линейной зависимости или независимости данной системы векторов. Пусть, например, в простран- стве Кп взяты п векторов q = (l, 0, 0, .. ., 0), е2=(0, 1, 0, . . ., 0), ... . . ., еп = (0, 0, 0, ..0, 1). Система (4) для этих векторов принимает вид • 1 + а2 • 0 4- «з • 0 + • • • ~г • 0 = 0, 4 aj-O-j-as-1 -г-а3-0-г . .. -J-an-O = O, I а^О^си-О-гОз-О-г ...+<х,,-1 =0 J и, очевидно, допускает единственное решение а1 = а2=... ...=ал = 0. Таким образом, векторы ех, е2, ..., еп в про- странстве Кп линейно независимы. См. задачу 4. г. Линейная зависимость векторов хх — хг (/), х2 = = х2(П, xk = xk(f) пространства /?(а, Ь) (или С (а, Ь)) означает, что между функциями x1(t), x2{t), ..., xk (t) имеется соотношение »i*i (t) 4- a2x2 (<)+...-(- akxk (t) == 0, причем вещественные (комплексные) постоянные an a2, ... ..., ak не все равны нулю. Например, функции xr (t) = cos2f, х2 (0 = sin21, х3 (/) = 1 линейно зависимы, так как имеет место соотношение (0 + х2(/)-Х3 (0^0.
50 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.23 Проверим, что функции 1, /, t2, tk линейно неза- висимы. Допустим, что существует соотношение а0-1 . . . — akik = 0. (5) Тогда, последовательно дифференцируя k раз равен- ство (5), мы получим систему k--\ уравнений относительно величин а0, а1; . . ., с определителем, заведомо отличным от нуля (1.556); решая систему по правилу Крамера (1.73), мы получаем, что «о = ai — • • = = 0. Следовательно, функции 1, /, t2, tk линейно незави- симы в пространстве R(a,b), что мы и утверждали. См. задачу 5. 2.23. Отметим два простых свойства систем векторов, связанных с линейной зависимостью. а. Лемма. Если некоторые из векторов хх, х2, ..., хк линейно зависимы, то и вся система xlt х2, . . ., хк линейно зависима. Доказательство. Без ограничения общности можно принять, что линейно зависимы векторы xlt х2, ..., Xj (j < А); таким образом, имеет место соотношение а1х1+а2х2 + . . . +а/х~0, где среди постоянных а,, а2, . . ., ау- имеются отличные от нуля. В силу теоремы 2.14в и аксиомы 2.12 3) справедливо равенство + rj-2x2 + ... + ауХу-1- 0 • Xj-+1 + . .. 4~ 0 • хк — 0; оно показывает, что векторы хг, х2, . . ., хк также линейно зависимы, так как среди постоянных av а2, . .., а , 0, . . ., 0 имеются отличные от нуля. б. Лемма. Векторы хг, х2, ..., хк линейно зависимы тогда и только тогда, когда можно представить один из этих векторов в виде линейной комбинации других. Предложение, аналогичное сформулированному, уже встре- чалось нам прежде: мы доказывали его в 1.95 для число- вых столбцов. Если мы просмотрим еще раз это доказа- тельство, то увидим, что оно основано только на возможности производить со столбцами операции сложения и умножения
2.32] § 2.3. БАЗИС, КООРДИНАТЫ, РАЗМЕРНОСТЬ 51 на число. Следовательно, это доказательство можно про- вести для элементов любого линейного пространства. Вместе с этим и наша лемма оказывается справедливой для любого линейного пространства, что нам и требуется. § 2.3. Базис, координаты, размерность 2.31. Система линейно независимых векторов е1, es, .е„ некоторого линейного пространства К образует, по опре- делению, базис пространства К, если для всякого вектора х£К существует разложение Х = ?1е1+В2е2+ • • • +1пе„ J=\, .п). (6) Легко видеть, что при указанных условиях коэффи- циенты разложения (6) определяются единственным, образом. Действительно, если бы для некоторого вектора х можно было написать два разложения х = 4“ ^2е2 4" • • 4" х = 41*14-112^2 4- • • • +г]„е„, то, вычитая почленно, мы получили бы равенство О = (В1—Т)1) «14- (В2—п2) «2 4- • • • 4- —nJ еп, из которого в силу предположенной линейной независимости векторов ev е2, . .., еп мы получили бы, что ?1 = П1, ?2 = П2, •••> В„ = Пп- Эти единственным образом определяемые числа g2, ..., называются координатами вектора х относительно базиса еЪ е2) • • •, еп- 2.32. Примеры. а. В пространстве П3 хорошо известный базис образует тройка единичных взаимно ортогональных векторов i, j, k. Координаты g1; |2, вектора х относительно этого базиса суть проекции вектора х на координатные оси. б. В пространстве К„ примером базиса служит система векторов е1=(1, 0, ..., 0), е2=(0, 1, ..., 0), ... .. ., еп = (0, 0, . . ., 1), рассмотренная уже нами в 2.22в. Дей- ствительно, для любого вектора х = (Вг, £2,
52 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА (2.33 очевидно, имеет место равенство * = £1(1,0, ...,0)^(0,1, ...,0) + ...+L (0,0, 1), которое и доказывает в соединении с уже известной линей- ной независимостью векторов ev е2, ..., еп, что эти век- торы образуют базис в пространстве Кп. В частности, оказывается, что числа ?2, £» являются как раз координатами вектора х относительно базиса elt е2, ..., еп. в. В пространстве R(a,b) базиса—в том смысле, как он нами здесь определен,— не существует; доказатель- ство этого утверждения будет дано в 2.36в. 2.33. Основное значение базиса линейного пространства состоит в том, что линейные операции в пространстве, вначале заданные абстрактно, при задании базиса становятся обычными линейными операциями с числами — координатами взятых векторов относительно этого базиса. Именно, имеет место следующая теорема: Теорема. При сложении двух векторов пространства К их координаты (относительно любого базиса) складываются. При умножении вектора на число все его координаты умно- жаются на это число. Действительно, пусть Х = £1*1 + £2*2 + • • • + £„*„, у = П1*1 + Л2*2 + • • • + П«*«- Тогда в силу аксиом 2.12—2.13 *+j* = (£i + Л1) *1 +(£2 + 112) *2+ • • + (£re + i]n) *»> Кх = + Xg2e2 + ... + Х?иел, что и требуется. См. задачи 6—7. 2.34. Если в линейном пространстве К можно найти п линейно независимых векторов, а всякие л 4-1 векторов этого пространства линейно зависимы, то число п называют
2.35] § 2.3. БАЗИС, КООРДИНАТЫ, РАЗМЕРНОСТЬ 53 размерностью пространства К; само же пространство К на- зывают п-мерным. Мы будем в дальнейшем для «-мерного пространства над полем К. использовать обозначение К„ (над полем R — соответственно R„, над полем С—соответ- ственно С„). Линейное пространство, в котором можно указать сколь угодно большое число линейно независимых векторов, называется бесконечномерным. Теорема. В пространстве К размерности п существует базис из п векторов; более того, любая совокупность из п линейно независимых векторов пространства К является ба- зисом этого пространства. Доказательство. Пусть ег, е2, ..., еп — система из п линейно независимых векторов заданного «-мерного пространства К. Если х— некоторый вектор пространства К, то совокупность из п -ф1 векторов х, ег, е2, ..., еп линей- но зависима; существует соотношение вида “ox + aiei+ • •+апеп = °> (7) причем среди коэффициентов а0, аг, ..., а„ имеются от- личные от нуля. Можно утверждать, что коэффициент а0 заведомо отличен от нуля: действительно, в противном слу- чае мы получили бы линейную зависимость между векто- рами е1, е2, .. ., еп, которая, по предположению, не имеет места. Но в таком случае обычным путем, т. е. разделив уравнение на а0 и перенеся все остальные члены вправо, мы получим, что х линейно выражается через векторы ег, е2, ..., еп. Поскольку х—любой вектор пространства К, мы доказали, что векторы elt е2, ..., еп образуют базис в этом пространстве, что и требовалось. 2.35. Следующая теорема является обратной по отно- шению к теореме 2.34. Теорема. Если в пространстве К имеется базис, то размерность этого пространства равна числу базисных век- торов. Доказательство. Пусть векторы ег, е2, ..., еп образуют базис пространства К- По самому определению базиса векторы е1, е2, ..., еп линейно независимы; следо- вательно, у нас уже имеется п линейно независимых векто- ров. Покажем, что всякие «4*1 векторов пространства К линейно зависимы.
54 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.36 Пусть в пространстве К заданы п 4-1 векторов = ^44- ^44-... 4-^„, х2 = |(12,^4-^2+...+^гЧ, х„+1 = + &л+1’*г + • • + &Л+1Ч. Выписывая в отдельный столбец координаты каждого из этих векторов, составим матрицу с п строками ил-|-1 столбцами А = |Н> g<2) _ |i’+1) Е<1) е<2) Е(П+1) ^2 о 2 ••• и, 2 t(l> t<2) t(n+l) fen fen • • • fen Базисный минор (/.92) матрицы А имеет порядок г^л. Если г = 0, то линейная зависимость очевидна. Пусть г > 0. После указания г базисных столбцов мы сможем найти еще по меньшей мере один столбец, не попавший в число базис- ных. Но тогда согласно теореме о базисном миноре этот столбец является линейной комбинацией базисных столбцов. Соответствующий вектор пространства К является линей- ной комбинацией других векторов (из числа заданных хг, х2, • ••, хп+1)- Но в таком случае векторы хг, х2, ... ..., хп+1, согласно 2.236, линейно зависимы, что и требо- валось. 2.36. Примеры. а. Пространство V3 трехмерно, поскольку оно обла- дает базисом из трех векторов /, j, k (2.32а); соответ- ственно У2 двумерно, VT одномерно. б. Пространство Кп л-мерно, поскольку оно обладает базисом из л векторов ег, е2, ..., еп (2.326). в. В пространствах R(a,b) и С (а, Ь) имеется сколь угодно большое число линейно независимых векторов (2.22г), и, следовательно, эти пространства бесконечномерны. Поэтому они не имеют базиса: наличие базиса привело бы к противоречию с теоремой 2.35. г. Всякое комплексное линейное пространство С является, очевидно, и вещественным, поскольку область комплексных
2.42] § 2.4. подпространства 55 чисел включает в себя область вещественных чисел. Однако размерность пространства С как комплексного пространства не совпадает с размерностью того же С как вещественного пространства: если векторы е1, ..., еп линейно независимы в С как в комплексном пространстве, то в С как вещест- венном пространстве будут линейно независимы векторы ev iel, ..., е„, ien, так что размерность С как веществен- ного пространства (если она конечна), вдвое больше, чем размерность С как комплексного пространства. См. задачу 8. § 2.4. Подпространства 2.41. Допустим, что некоторая совокупность L элемен- тов линейного пространства К обладает следующими свой- ствами: а) если x£L, y£L, то x-j-ygL; б) если x£L, X — элемент поля К, то Хх £L. Таким образом, нам задана совокупность элементов, и в ней определены линейные операции. Покажем, что мы по- лучаем здесь также линейное пространство. Для этого нужно проверить для совокупности L с операциями а) — б) выполнение аксиом 2.12—2.13. Аксиомы 1), 2), 5)—8) удовлетворяются, поскольку они удовлетворяются вообще для всех элементов пространства К. Остается проверить аксиомы 3) и 4). Пусть х—любой элемент из L; тогда по условию 1.x при любом вещественном X. Возьмем X = 0; тогда, поскольку по теореме 2.14в 0-х = 0, нуль-вектор принадлежит совокупности L. Тем самым вы- полнена аксиома 3). Возьмем теперь Х =—1; поскольку по теореме 2.14г (—1)х есть элемент, противоположный эле- менту х, совокупность L вместе с каждым элементом х содержит и противоположный элемент. Таким образом, вы- полнена и аксиома 4), и наше утверждение полностью доказано. Поэтому всякая совокупность LcK, удовлетворяющая условиям а) и б), называется линейным подпространством (или просто подпространством) пространства К- 2.42. Пример ы. а. Нуль-вектор пространства К образует, очевидно, наименьшее возможное подпространство пространства К.
56 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2Л2 б. Все пространство К — наибольшее возможное подпро- странство пространства К. Эти два подпространства—нуль-вектор и все простран- ство— называют иногда тривиальными подпространствами; и- тогда все остальные подпространства называют нетривиаль- ными. в. Пусть Ц и Ь2—два подпространства одного и того же линейного пространства К. Совокупность всех векторов х£К, принадлежащих одновременно к Ц и Ц, образует подпространство, называемое пересечением подпространств Lj и Ь2. Совокупность всех векторов вида уЦ-д, гдеу^Ц, z g L2, образует подпространство, называемое суммой под- пространств Lx и Ь2. г. В пространстве V3 все векторы, параллельные какой- либо плоскости (или какой-либо прямой), образуют подпро- странство. Если говорить не о векторах, а о точках (2.17), то подпространствами пространства V3 являются совокуп- ности точек, расположенных на плоскости (или прямой), проходящей через начало координат. д. В пространстве Кп рассмотрим совокупность L тех векторов |2, ... , £„), координаты которых удов- летворяют системе линейных уравнений 4" • • • 4* ^\пХп ~ с21-^1 4" аггХ‘1 4" • • • 4* аЪпХп ~ , ^8) aklXl + ak2XS 4" • • • + aknXn = О с коэффициентами из поля К и со свободными членами, равными 0. Такая система называется однородной линейной системой. Однородная линейная система всегда совместна, так как имеет очевидное «нулевое» решение xt — x2 = ... — = хи = 0. Пусть с*/’, с»’, ... , c't1* и е^2>, с(22), ... , с(п3) — два реше- ния такой системы; образуем числа ---- z>(l) [ р -- /’(D | z>(2) л - л(1) | л(2) С1 — С1 П С1 > L2 — с2 С2 , • • • > Сп — Сп I СП • Утверждается, что сх, с2, . . . , сп снова образуют решение системы (8). Действительно, подставляя эти числа в г-е
2.43] §2.4. ПОДПРОСТРАНСТВА 57 уравнение этой системы, мы получаем аНС1 + а12с2 + • • • + aiuCn ~ - (с?’ + ^2)) + «Z2 (41’ + С<2)) + . . . + ain {с™ + О = = («/icin + ai2c™ + • • + + 4- (a,.lC<” + аас^ + ... +ainc™) =0, что и требовалось. Это решение мы будем называть суммой решений с!1’, с<21>> • • , сп} и с12>< с22\ • • • > сл’- Аналогично, если с1, с2, .. . , си — произвольное решение системы (8), то числа Хсх, Хс2, ... , %сп при фиксированном % £ К образуют также решение системы (8); это решение мы будем называть про- изведением. решения clt с2, ... , сп на число X. Таким образом, решения однородной системы с коэффици- ентами из поля К можно складывать друг с другом, и умно- жать на числа из того же поля К. Тем самым совокупность L есть подпространство про- странства Кп и, следовательно, является линейным простран- ством. Мы будем называть его пространством решений системы (8). В 3.41 мы вычислим размерность этого про- странства и построим его базис. См. задачу 9. 2.43. Отметим некоторые свойства подпространств, свя- занные с определениями §§ 2.2—2.3. Прежде всего, всякое линейное соотношение, связываю- щее векторы х, у, ..., z в подпространстве L, справедливо и во всем пространстве К, и обратно; в частности, факт линейной зависимости векторов х, у, ... , z £ L выполняется одновременно в подпространстве L и в пространстве К. Если, например, в пространстве К всякие я-ф1 векторов линейно зависимы, то это утверждение и подавно будет выполнено в подпространстве L. Отсюда вытекает, что раз- мерность любого подпространства L в п-мерном пространстве К. не превосходит числа п. В этом случае согласно теореме 2.34 в каждом подпространстве Lc'K можно построить базис из такого числа векторов, какова размерность подпростран-, ства L.
58 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.44 Если в пространстве К выбран базис ех, е2, . .. , е„, то в общем случае, разумеется, нельзя выбрать базисные векто- ры подпространства L прямо из числа векторов ev е2, . . . , еп хотя бы потому, что в подпространство L может не входить ни один из них. Но можно утверждать, что если выбран базис Д, f2, . . . , Д в подпространстве L (имеющем для определенности размерность I < п), то всегда можно дополнительно выбрать векторы fl + l, ... , fn во всем про- странстве К так, что система flt f2, .. . , ft, . . . , fn будет базисом во всем К- Для доказательства будем рассуждать так. В простран- стве К существуют векторы, которые линейно не выражаются через Д, Д, . . . , Д; действительно, если бы таких векторов не было, то векторы Д, Д, ... , ft— по условию линейно независимые — составляли бы базис пространства К и по теореме 2.35 размерность К была бы равна /, а не п. Обо- значим через fl + 1 любой из векторов, не выражающихся линейно через Д, Д, . . . , Д. Система Д, Д, . . . , Д, Д+1 линейно независима; в самом деле, если бы существовало соотношение вида «1/1 + а24 + • • • + а,Д + аг+1Д+1 = О, то при az + 1y=0 мы получили бы, что вектор Д+1 можно линейно выразить через Д, Д, ... , Д, а при az + 1 = 0 по- лучили бы, что векторы Д, Д, . . . , Д линейно зависимы; оба эти вывода противоречат построению. Если теперь всякий век- тор пространства К линейно выражается через Д, Д, . .. , Д, fi+v то система Д, Д, .. . , Д, Д + 1 образует базис в К (и /Д1=л), и наше построение закончено. Если IД 1 < п, то имеется вектор + не выражающийся линейно через Д, Д, • • • , Д, fi+i- Таким образом можно продолжить построение; в конечном счете (через п — I шагов) мы полу- чим базис пространства К- См. задачу 10. 2.44. Будем говорить, что векторы gx, . .. , gk линейно независимы над подпространством LcK, если из соотношения ai£i + • • • од . .. , ak£K, следует аг = ... = = 0. Если L — нулевое подпространство, то линейная независимость над L означает обычную линей-
2.45] § 2.4. подпространства 59 ную независимость. Линейная зависимость векторов^, . . . , gk над подпространством L означает, что существует линейная комбинация aig1^ . . . + akgk, лежащая в L, причем среди коэффициентов ах, . . . , ak имеются отличные От 0. Наибольшее возможное число векторов пространства К, Линейно независимых над подпространством LcK, называется размерностью К над L. Если векторы gt, . . . , gk линейно независимы над про- странством LcK, а /х, . . . , /г— векторы, линейно независи- мые в подпространстве L, то векторы gr, .. . , gk, j\, . . . , ft линейно независимы в пространстве К- Действительно, если бы имело место равенство “1/1 + • • • + “//г + ₽i£i + • • • + $k£k ~ то, написанное в форме ₽i£i + • • • + — — (“1/1 + • • • + “/Л) 6 L, оно привело бы к заключению, что Рх = . . . = = 0 в силу предположенной линейной независимости векторов g1; ... , gk над L; отсюда ах=...=а( = 0 в силу линейной независи- мости векторов /х, . . . , /г. Векторы fl+1, ,/„, построенные в 2.43, линейно независимы над подпространством L: действительно, если бы имело место равенство “1+1Л+1 + • • + “z/n = “i/i + • • • + “///» причем среди чисел а/+х, . . . , ап были бы отличные от О, то векторы /х, . . . , fn оказались бы линейно зависимыми в противоречии с построением. Размерность пространства К над L, следовательно, не меньше, чем п — I. С другой сто- роны, она не может быть и больше, чем п—I, так как если бы нашлось п — /4-1 векторов, например, Лх, ..., hn_l+1, линейно независимых над L, то в пространстве К были бы линейно независимы векторы Лх, . . . , hn_l + 1, /х, .. . , /г, число которых больше, чем п. Таким образом, размерность К над L в данном случае равна п — I. 2.45. Прямая сумма. Говорят, что пространство L является прямой суммой своих подпространств Ц, ... , Lm, если:
60 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.46 а. Для всякого х g L существует разложение х — xL 4- • • • + хт, xt £ Ц, .. . , хт € Lm. б. Это разложение единственно: если Х = Хх4- . . . +xm=y1+ • • • ~Ьут, где ху€ yj£L}, /= 1, .. . , т, то хг=у1У ... , хт=ут. Впрочем, справедливость последнего условия следует из более простого требования: б'. Если имеется разложение 0 = ^4- .. . +zm, где ... , zm£Lm, то z1 = ...=zm = 0. Действительно, пусть выполнено условие б' и дано раз- ложение б. Вычитая, находим 0 = (*1—Л) + • • • 4- (хт— ут); применяя б', получаем х1—у1, ..., хт—ут. Обратно, б' следует из б, если положить х = 0, хг = . . . = хт = 0. Из б следует, что всякие два из подпространств LT, ... , Lm имеют общим один лишь элемент 0. Действительно, если бы мы имели z£Lk и z£Ly, то из сравнения двух разложений z — г 4-0, z£L,-, OgLA, z = 0 4- z, 0 g Ly, z La, и условия б вытекало бы, что z = 0. Так, л-мерное пространство К„ есть прямая сумма п одномерных подпространств, определенных любыми п линейно независимыми векторами. Кроме того, пространство К„ можно представить разными способами в форме прямой суммы и неодномерных подпространств. 2.46. Пусть в л-мерном пространстве Кп фиксировано под- пространство L. Покажем, что всегда существует подпро- странство МсК„, которое в прямой сумме с L дает все К„. Для доказательства используем векторы fi+x, , fn, построенные в 2.43, линейно независимые над подпростран- ством L. Пусть М — подпространство, составленное из всех
2-47] § 2.4. подпространства 61 линейных комбинаций векторов Д+1, .. . , Д; покажем, что оно удовлетворяет нашему требованию. Действительно, поскольку векторы Д, .. . , fn образуют базис в К„ (2.43), каждый вектор х £L допускает разложение x==a1/i+ .. . +az/i + az+1/’z+1+ . . . + а,/'„ = у + z, где у = а1Д + .. . +аДеЬ, z =al+1fl+1 Д . . . £М. При этом из х = 0 следует ау = 0 (/'=1, . .. , л) в силу линейной независимости векторов Д, ... , Д. Следовательно, условия 2.45а,б' выполнены, и Кп есть прямая сумма L и М. 2.47. а. Если размерность пространства Lk равна гк (k=\, ... , т) и в каждом пространстве Lfe выделены гк линейно независимых векторов Дх, ... Дг , то каждый век- тор х суммы L = Lx + ... Д Lft можно линейно выразить через все эти векторы. Следовательно, размерность суммы пространств LT, ... , Д не больше суммы их размерностей. Если сумма Ц Д ... Д Lft прямая, то все векторы Д1( ... , (Л=1, ... , т) линейно независимы, так что в этом случае размерность суммы равна сумме размерностей. б. В общем случае размерность суммы определяется через размерности слагаемых более сложным образом; мы рассмотрим только вопрос о размерности суммы двух конеч- номерных подпространств Р и Q пространства К. Пусть р и q обозначают размерности этих подпространств. Обозначим через L пересечение подпространств Р и Q и через I его размерность. Выберем в L базис ег, е2, .. . , et и, используя соображения 2.43, дополним его векторами Д+1, , fP до полного базиса подпространства Р и векторами gi+1, gi+%, • • • , gq до полного базиса подпро- странства Q. Каждый вектор суммы РДО по самому опре- делению есть сумма вектора из Р и вектора из Q и поэтому может быть линейно выражен через векторы е1; е2> • • • , ег> fi+i, • • • , fP, gi+n • • , gq- Покажем, что эти векторы образуют базис подпространства Р-j- Q. Для этого нам оста- ется проверить их линейную независимость. Допустим, что существует линейное соотношение вида °Д1 + • • • + + Рг+1/z+i + • • • +₽^4’ + + Yz+1^+1+ • • • +4qgq = 0, (9)
62 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.48 причем среди коэффициентов ах, .. . , имеются отличные от нуля. Мы можем тогда утверждать, что имеются отлич- ные от нуля числа в совокупности у( + х, • • , так как в противном случае векторы ег, е2, . . . , et, + , fp оказались бы линейно зависимыми, что невозможно ввиду того, что они образуют базис подпространства Р. Следова- тельно, вектор •V = Yi+i^+i+ • +7^=/= 0, (10) иначе векторы gl+1, , gq оказались бы линейно зависи- мыми. Но из (9) вытекает, что —х = а1е1+ • • 4-Р^ёР, в то время как (10) показывает, что xgQ. Таким образом, х принадлежит и Р и Q и, следовательно, входит в под- пространство L. Но тогда х ~ 4i+i£t+i + • • +Y9g,9 = 4ei + ^2e2+ • • • Поскольку векторы ev е2, . . . , et, gl + 1, .. . , gq линейно независимы, yz+1 = . . . = у(/ = 0. Полученное противоречие показывает, что векторы ех, е2, . . . , et, fl + 1, .. . , fp, gi+1, • • > Sq действительно линейно независимы. Согласно теореме 2.35 размерность подпространства Рф-Q равна числу базисных векторов ег, . . . , eh ft + l, . . . , fp, gM, • • • , gq', но это число равно pq— l. Итак, размер- ность суммы двух подпространств равна сумме их размерно- стей за вычетом размерности пересечения. в. Следствие. Если в п-мерном пространстве R„ выделены два подпространства и R?, размерности кото- рых р и q в сумме превышают число п, то пересечение R^ и R? имеет размерность не меньшую, чем p-[-q—п. 2.48. Фактор-пространства. а. Пусть в линейном пространстве К выделено подпро- странство L. Назовем элемент х С К сравнимым с элементом у С К (точнее, сравнимым относительно L), если х—у £ L. Очевидно, в этом случае иу сравним с х, так что отношение сравнения симметрично. Всякий х£К сравним сам с собою. Далее, если х сравним с у, а у сравним с г, то и х срав- ним с z, так как X—Z = (х— у) + (у—z) € L.
2.49] § 2.4. ПОДПРОСТРАНСТВА 63 б. Совокупность всех элементов _у С К, сравнимых с дан- ным элементом x£K, называется классом и обозначается через X. В силу сказанного класс X содержит сам элемент х, и всякие два элемента у£Х, z£X сравнимы друг с другом. Наконец, если и^Х, то и не сравним ни с одним элементом из класса X. Поэтому два класса X и Y или не имеют общих элементов, или полностью совпадают. Одним из классов является все подпространство L; поскольку оно содержит нулевой элемент пространства К, этот класс обозначается через 0. в. Все пространство К разбивается в совокупность не- пересекающихся классов X, Y, ... Эту совокупность клас- сов мы обозначим через К/L. Введем в множестве К/L ли- нейные операции следующим образом. Пусть X и Y — классы, а и Р — элементы поля К', мы желаем определить класс аХ pY. Для этого выберем произвольно элементы х £ X и у g Y и найдем класс Z, который содержит элемент z--ax;f}y; этот класс и обозначим ocX-pY. Проверим, что он определен однозначно. Если в классе X мы возьмем элемент х*, а в классе Y — элемент yt, то (ах1 + Ру Д — (ах + Ру) = а (х1 — х) Р (ух —у) лежит в подпространстве L вместе с х1— х и yt—у; это означает, что ахг рух лежит в том же классе, что и ах + Ру. В частности, мы определили сложение классов X, Y и умножение их на числа а^К. Покажем, что эти операции удовлетворяют аксиомам линейного пространства 2.12—2.13. Действительно, из справедливости 2.12 1)—2) и 2.13 5)—8) для элементов пространства К следует сразу выполнение этих же свойств для классов. Нулем пространства K/L является класс 0 (состоящий из всех элементов простран- ства L). Противоположным к классу X является класс, состоя- щий из элементов, противоположных к элементам класса X. Таким образом, для совокупности классов выполнены и аксиомы 2.12 3)—4). Построенное здесь линейное пространство К/L называется фактор-пространством пространства К по подпространству L. 2.49. Теорема. Пусть К = К„ есть п-мерное линейное пространство над полем К, L = LzcK есть l-мерное подпро-
64 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.51 странство в К. Тогда фактор-пространство К/L имеет раз- мерность п — I. Доказательство. Выберем произвольно базис (\, . . . , ft в подпространстве L и дополним его, как в 2.43, векторами /z + 1, . . . , fn до базиса всего К- Рассмотрим классы Хг + 1Э/; + 1, ••• , Х„Э/„ и покажем, что они обра- зуют базис в пространстве К/L. Для любого л'£ К сущест- вует представление п х = 2 аАЛ, k= 1 поэтому для класса X Э х существует представление х= 2 «Л. k=i+1 Покажем, что классы Xz + 1, ... , Х„ линейно независимы. Если бы мы имели при некоторых а1 + 1, . . . , из К. аг+Л+1- • • .+авХл = 0£К/Е, то, в частности, выполнялось бы соотношение “z+i/z + i4- • • • -г ajn € L; но так как /z + 1, ..., fn линейно независимы над L (2.44), то az+1—. .. =а„ = 0, что и требовалось. Таким образом, Х/+1, ..., Хп образуют базис в К/L; но тогда их число л — I есть размерность пространства K/L (2.35). Теорема доказана. § 2.5. Линейные оболочки 2.51. Важным способом построения подпространств яв- ляется образование линейной оболочки заданной системы векторов. Пусть х, у, z, ...—некоторая система векторов линей- ного пространства К; линейной оболочкой системы х, у, z, ... называется совокупность всех (конечных) линейных комбинаций ax + Pj + yz+... (И) с коэффициентами а, |3, у, ... из ноля К. Легко проверить, что для этой совокупности выполнены условия 2.41 а, б; поэтому линейная оболочка системы х, у, z, ... есть под
2.53] § 2.5. ЛИНЕЙНЫЕ ОБОЛОЧКИ 65 пространство пространства К- Это подпространство, оче- видно, содержит векторы х, у, z, ... С другой стороны, всякое подпространство, содержащее векторы х, у, z, ..., содержит и все их линейные комбинации (И); следовательно, линейная оболочка векторов х, у, Z, ... есть наименьшее подпространство, содержащее эти векторы. Линейная оболоч- ка векторов х, у, z, ... обозначается через L (х, у, z, ...). 2.52. Примеры. а. Линейная оболочка векторов е1; е2, ..., еп, образую- щих базис некоторого пространства К, очевидно, совпадает со всем пространством К. б. Линейная оболочка пары (неколлинеарных) векторов пространства V3 состоит из всех векторов, параллельных плоскости этих векторов. в. Линейная оболочка системы функций 1, t, i2, . . ., tk пространства К (а, Ь) (К есть R или С) совпадает с сово- купностью всех многочленов от t не выше й-й степени. Ли- нейная оболочка бесконечной системы функций 1, f, t2, . . . состоит из всех многочленов (любой степени) от перемен- ного t с коэффициентами из поля К. 2.53. Отметим два простых свойства линейных оболочек. а. Лемма. Если векторы х', у', ... принадлежат к ли- нейной оболочке векторов х, у, . .., то вся линейная обо- лочка L (х', у', ...) содержится в линейной оболочке L(.r, у, ...). Действительно, поскольку векторы х’, у', .. . принад- лежат к подпространству L(x, у, ...), все их линейные комбинации, совокупность которых и составляет линейную оболочку L (х', у', ...), также принадлежат к подпростран- ству L (х, у, .. .). б. Лемма. Всякий вектор системы х, у, ..., линейно зависящий от остальных векторов этой системы, можно и:- нее исключить без изменения линейной оболочки. Действительно, если, например, вектор х линейно зависит от векторов у, z, .. . , то это означает, что х g L (_у, z,. ..). Отсюда и из леммы а вытекает, что L (х, у, z, ...)с с L(y, z, .. .). С другой стороны, очевидно, L (_у, z, ...) с cL(x, у, z, ...). Оба включения вместе показывают, что L(_y, z, . ..) = L(x, у, z, ...), что и требуется.
66 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.54 2.54. Поставим вопрос о построении базиса линейной оболочки и определении ее размерности. При решении этого вопроса мы будем предполагать, что число векторов х, у, . .., порождающих линейную оболочку L(x, у, ...), конечно (хотя некоторые из заключений и не будут существенно требовать такого предположения). Допустим, что среди векторов х, у, .. ., порождающих линейную оболочку L (х, у, ...), мы смогли найти г линейно независимых векторов,— обозначим их через хг, х2, ... , хг,— через которые может быть линейно выражен любой вектор из системы х, у, . .. В этом случае мы можем утверждать, что векторы хг, х2, ..., хг образуют базис пространства L (х, у, ...). Действительно, всякий вектор z <z L (х, у, .. ) по самому определению линейной оболочки линейно выра- жается через конечное число векторов из системы х, у, . ..; но каждый из векторов этой системы по условию линейно выражается через хг, х2, . . ., хг; поэтому в конечном счете и вектор z может быть линейно выражен непосредственно через векторы х1г х2, ..., хг. В соединении с предполо- женной линейной независимостью векторов х1; х2, .. ., хг мы получаем выполнение для них обоих условий, содержа- щихся в определении базиса (2.31), что и требовалось. Согласно теореме 2.35 размерность пространства L(x,_y, ...) равна числу г. Поскольку в r-мерном простран- стве не может существовать более чем г линейно независимых векторов, мы можем сделать относительно размерности г пространства L(x, у, ...) следующие выводы: а. Если число порождающих векторов х, у, ... больше числа г, то векторы х, у, ... линейно зависимы; если их число равно числу г, то они линейно независимы. б. Всякие г -|- 1 векторов из системы х, у, ... линейно зависимы. в. Размерность пространства L (х, у, . . .) можно опре- делить как максимальное число линейно независимых век- торов в системе х, у, ... § 2.6. Гиперплоскости 2.61. Как мы уже видели в 2.42г, геометрический образ, соответствующий понятию подпространства, для простран- ства П3 в «точечной» (а не «векторной») интерпретации есть
2.62] § 2.6. ГИПЕРПЛОСКОСТИ 67 плоскость (или прямая), проходящая через начало координат. Но плоскости и прямые, не проходящие через начало коор- динат, желательно было бы также включить в круг наших рассмотрений. Замечая, что такие плоскости и прямые полу- чаются из плоскостей и прямых, проходящих через начало координат, параллельным перемещением в пространстве, т. е. сдвигом, мы естественно приходим к следующему общему построению. Пусть L—некоторое подпространство линейного простран- ства К и л'п — фиксированный вектор, вообще говоря, не при- надлежащий L. Рассмотрим совокупность Н всех векторов х, которые получаются по формуле х = х0+У> когда вектор у пробегает все подпространство L. Совокуп- ность Н называется результатом сдвига подпространства L вдоль вектора х0 или гиперплоскостью. Заметим, что гиперплоскость сама, вообще говоря, не образует подпространства. 2.62. Примеры. а. В пространстве V3 совокупность всех векторов, выхо- дящих из начала координат и кончающихся на некоторой плоскости у, образует гиперплоскость. Легко проверить, что эта гиперплоскость является подпространством в том и только в том случае, когда плоскость у проходит через начало ко- ординат. б. В пространстве Кп рассмотрим совокупность Н тех векторов х = (^1, |2, ..., ]•„), координаты которых удовлет- воряют совместной системе линейных уравнений <Wi + а12х2 + . . . + а1пхп = Ьг, а21Х1 + а-МХ2 + • • • + а2пХп = ^2> \ (12) aklXl “Г ak2X2 Т • • • 4~ aknXn = и совокупность L тех векторов у = (т^, г]2, ..., т]„), коор- динаты которых удовлетворяют однородной системе линейных
68 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.63 уравнений с теми же коэффициентами: ацУ1 + а12У2^- • • • +ai„J„ = 0, 'I а21У1 + а22у2-г • + а2„у„ = 0, I (13) ак1У1~^ akiV2 + • • • + акпУп — О- J Как мы уже знаем, совокупность L есть подпространство пространства Кп. Пусть х0 = (^0), g!/”, ..., ^0>)—некоторое решение системы (12). Покажем, что совокупность Н совпа- дает с совокупностью всех сумм х0^у, где у пробегает все подпространство L. Действительно, если у = (т^, т]2, ... , т]„) есть некоторое решение системы (13), то вектор х = х0 +у = (£)0) + 1)1, ^2О> + Л2, £п’+ *]«), очевидно, является решением системы (12), т. е. входит в совокупность И. Обратно, если х — любой вектор совокуп- ности Н, то разность у = х — х0 удовлетворяет уже системе (13), т. е. вектор у входит в подпространство L. В силу данного нами выше определения совокупность И есть гипер- плоскость, именно, результат сдвига подпространства L на вектор х0. 2.63. Каждой гиперплоскости, хотя она и не представ- ляет собой подпространства, можно приписать некоторую размерность. Именно, размерность гиперплоскости Н будем считать равной размерности того подпространства L, сдвигом которого была получена эта гиперплоскость. Чтобы это определение было корректным, нужно показать, что данная гиперплоскость Н может быть получена сдвигом только одного подпространства. Для доказательства этого утверждения допустим, что гиперплоскость Н есть результат сдвига подпространства L на вектор хп и в то же время результат сдвига подпространства L' на вектор х'о. Тогда для любого z С И имеем z = хд где у £ L, ив то же время z — x’g-\-y', гдеу'^Ь'. Отсюда следует, что L' есть совокупность векторов, определяемых формулой у' = (х0 — Xo)+j, где у—-произвольный вектор из L, т. е. что подпространство L' есть результат сдвига подпростран- ства L на вектор л:1 = х0— х'д. Покажем, что вектор xt входит в подпространство L. Нуль-вектор, как и всякий
2.72] § 2.7. морфизмы линейных пространств 69 элемент подпространства L', можно представить в виде Xj+ji, где^ёЬ (поскольку L' есть сдвиг подпростран- ства L на вектор Х-J; отсюда следует, что хг = —у{ и поэтому х± входит в L, что мы и утверждали. Но в таком случае и всякий вектор у' g L' входит в подпространство L, так как представляется суммой вектора хгg L и некоторого вектора у £ L. Следовательно, имеет место включение L'crL. В силу полной симметрии условия аналогично можно дока- зать, что LcL', откуда вытекает, что L^L', что и утверж- далось. В дальнейшем гиперплоскости размерности 1 будем назы- вать прямыми линиями, гиперплоскости размерности 2 — плоскостями. См. задачи 11—14. § 2.7. Морфизмы линейных пространств 2.71. Пусть каждому вектору х' линейного простран- ства К' по некоторому правилу со поставлен в соответствие вектор х" линейного пространства К". Правило со называется морфизмом (или линейным оператором), если выполняются следующие соотношения: а) со (х' +У) = ® ) + ° {у') Для любых х', у' из К'; б) со (ax') = а со (х') для любых х'£К' и любого а£К. Если морфизм со отображает пространство К' на все прост- ранство К", он называется эпиморфизмом. Если морфизм со отображает пространство К' хотя бы и не на все К", но взаимно однозначно (так что из х’ =£у’ следует со (х') =у= =т^со(у')), он называется мономорфизмом. Если морфизм со отображает пространство К' взаимно однозначно на все про- странство К", т. е. является одновременно моно- и эпимор- физмом, он называется изоморфизмом, а сами пространства К' и К" называются изоморфными (точнее, К-изоморфными). Общепринятое обозначение морфизма: со: К'->К". 2.72. Примеры. а. Пусть L есть подпространство пространства К. Ото- бражение со, которое каждому вектору х g L ставит в соот- ветствие этот же вектор х в пространстве К, есть морфизм
70 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА [2.73 L в К, и именно мономорфизм (причем, если L=^K, не эпи- морфизм). Этот морфизм со называется вложением L в К. б. Пусть L есть подпространство пространства К и K/L — фактор-пространство пространства К по подпростран- ству L (2.48). Отображение <о, которое каждому вектору х £ К ставит в соответствие класс XczK/L, содержащий элемент х, есть морфизм К в К/L, и именно эпиморфизм (причем, если Ly=0, не мономорфизм). Этот морфизм ю на- зывается каноническим отображением К на K/L. 2.73. а. Пусть пространство К' л-мерно и обладает базисом е), . . ., е'п. В пространстве К" выберем произвольно векторы г'), ..., е"п. Поставим в соответствие любому век- тору х' вектор п ш(х,) = х’ = 2^4 k=l с теми же коэффициентами |fc(fe=l, ..., л). Покажем, что отображение w(x') = x" есть морфизм про- странства К' в пространство К". Пусть в пространстве К' выбраны два вектора x' = ^ke'k и тогда по 2.33 а X' +у' = 2(^ + nft) ek- /с = 1 Согласно определению отображения со А=1 k = l Далее, со (х' +У) = 2(^ + 1)*) ^=2^е*+2т1л==®(д:')+® (у">' k=i k~i £=i
2.74| § 2.7, морфизмы линейных пространств 71 так что условие 2.71а) выполнено. Аналогично при любом а € А' W (ax') = о) lkek ) = “> 2 ) = \ k=l J \k=\ J п п = 2 a^ke"k = « 2 ^ke’k = а <о (*'), А=1 Л=1 так что выполнено и условие 2.716). Следовательно, со (х') = х" есть морфизм К' в К", что и утверждалось. б. Выясним, при каком условии морфизм со, описанный в а, является эпиморфизмом. Очевидно, необходимым и доста- точным условием для этого является возможность представ- п ления в форме любого вектора х” С К”, иными сло- fe = i вами, тот факт, что К” совпадает с линейной оболочкой векторов. е’(, ..., е"п. в. Выясним, при каком условии морфизм со, описанный в а, является мономорфизмом. Для этого необходимо и до- статочно, чтобы векторы 2^Л’ 2т1ь£А’ различающиеся хотя бы по одной паре координат (т. е. такие, что Е.ь^’П/г хотя бы при одном значении k), были бы различными векто- рами пространства К". Но это равносильно линейной неза- висимости векторов е’(, ..., е"п, следовательно, морфизм со тогда и только тогда является мономорфизмом, когда век- торы е(, .. ., е "п линейно независимы. г. Как следствие получаем: морфизм со, описанный в а, является изоморфизмом тогда и только тогда, когда векторы е"г, ..., е"п линейно независимы и их линейная оболочка совпадает со всем пространством К". Иначе говоря, морфизм со является изоморфизмом тогда и только тогда, когда век- торы е'(, . . ., е'п образуют базис пространства К". 2.74. Теорема. Любые два п-мерных пространства К' и К" (над одним и тем же полем К) К-изоморфны. Доказательство. Пусть е{, ..., е'п — базис в про- странстве К' и е'(, . .., е"п—базис в пространстве К". С по- мощью этих систем векторов построим морфизм со, как ука- зано в 2.73а. В силу 2.73г он является изоморфизмом, что и требуется.
72 ГЛ. 2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА (2.75 2.75. Следствие. Всякое л-мерное линейное простран- ство над полем К /С-изоморфно пространству Кп (2.156). В частности, всякое л-мерное комплексное пространство С-изоморфно пространству С„; всякое л-мерное вещественное пространство /?-изоморфно пространству Rn. 2.76. Дальнейшие свойства моно- и эпимор- физмов. а. Пусть имеется морфизм со: К'—*К". Рассмотрим сово- купность всех векторов со(х')ёК", когда х' пробегает все К'- Эта совокупность есть, очевидно, подпространство L"c:K". Оно называется областью значений морфизма со. Ясно, что отображение со пространства К' в L" является эпиморфизмом. Если морфизм со: К'—*-К" был мономорфиз- мом, то морфизм со: К'—*-L" есть изоморфизм. б. Пусть имеется морфизм со: К'—’•К". Рассмотрим сово- купность L' всех векторов х'£К', для которых со(х') = 0. Совокупность L' есть, очевидно, подпространство в прост- ранстве К'; оно называется ядром., или нуль-м.ногообразием, морфизма со. Построим фактор-пространство К'/L' (2.48). Все элементы х', лежащие в одном и том же классе X' gK'/L' переводятся морфизмом со в один и тот же элемент пространства К"; действительно, для двух таких элементов х' и у' мы имеем х'—y'=z'£L', откуда со (х') — со (у') = со (z') = 0, со(х') = .-= со (у'). Поставим в соответствие каждому классу X' £К'/Ь' элемент х" = со (х') ё К", где х' g X'—любой элемент; мы только что видели, что х" определен при этом однозначно. Положим x" = Q(X'). Отображение й, как легко видеть, есть морфизм пространства К'/Ъ' в К"; он является моно- морфизмом, так как из X'=?^Y', х'^Х', у' £Y' следует й (X')— Й (Y') = со (х') — со (у') = со (х'—у') =/= 0. Таким образом, любой морфизм со: К'—’•К" порождает моно- морфизм й: K7L'—*К". Если морфизм со был эпиморфизмом, то, очевидно, и мономорфизм Й является эпиморфизмом, так что эпиморфизм со: К'—*К" порождает изоморфизм Й: K'/L'-*K". Мы продолжим изучение морфизмов в гл. 4.
ЗАДАЧИ 73 ЗАДАЧИ 1. Образует ли совокупность векторов на плоскости, начала кото- рых находятся в начале координат, а концы — в пределах первой четверти, линейное пространство (с обычными операциями)? 2. Образует ли линейное пространство совокупность всех векторов на плоскости с исключением векторов, параллельных некоторой заданной прямой? 3. Рассмотрим совокупность Р одних положительных ве- щественных чисел. Введем операции по следующим правилам: под «сложением» двух чисел будем понимать их (обычное) умножение, а под произведением элемента г £ Р на вещественное число Л, будем понимать (обычное) возведение числа г в степень Л. Является ли Р с указанными операциями линейным пространством? 4. Показать, что в случае п заданных векторов в пространстве К„ критерием линейной независимости их служит неравенство нулю определителя, составленного из координат этих векторов. 5. Показать, что в пространстве R (а, Ь), где 0 < а < fe, функции Z®i, /*«, ..., f*k линейно независимы, если ах, а2, ..., ак—различ- ные вещественные числа. 6. Относительно системы векторов е1г е2, •••> £п линейного про- странства К известно следующее: а) Каждый вектор х £ К допускает разложение х = SA + + • • • б) Для некоторого фиксированного вектора х0 £ К это разложе- ние единственно. Доказать, что система elt ..., еп образует базис пространства К. 7. Существует ли базис у пространства Р (задача 3)? 8. Какова размерность пространства Р (задача 3)? 9. В пространстве У3 взяты два различных двумерных подпро- странства Li и L2 (две различные плоскости, проходящие через начало координат). Что собой представляют их пересечение и сумма? 10. Доказать теорему: если размерность подпространства L с: К совпадает с размерностью пространства К, то L = K. 11. Определен ли однозначно самой гиперплоскостью вектор сдвига х0, фигурирующий в ее построении? 12. Показать, что всякая гиперплоскость Н с К обладает сле- дующим свойством: если х £ Н, у £ Н, то ах -ф (1—а) у £ Н при любом вещественном а. Обратно, если некоторое подмножество Н cz К обладает сформулированным свойством, то Н есть гипер- плоскость. Какая геометрическая характеристика гиперплоскости содержится в этом свойстве? 13. Гиперплоскости Hi и Н2 имеют размерности соответственно р и q. Какой (наименьшей) размерности нужно взять гиперплоскость Н3, чтобы она, будучи должным образом расположена в пространстве, содержала в себе и Д и Н2? 14. Аналогичная задача для трех гиперплоскостей Нх, Н2, Н3 с размерностями р, q и г. 15. Согласно теореме 2.74 одномерные пространства /?А и Р (задача 3) изоморфны. Как можно осуществить этот изоморфизм?
ГЛАВА 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ §3.1. Еще о ранге матрицы 3.11. Мы уже несколько раз встречались с матрицами в нашем изложении. В этом параграфе мы остановимся более детально на тех свойствах матрицы, которые связаны с по- нятием ранга (1.92). Это позволит нам дать общее реше- ние задачи о системах линейных уравнений, сформулирован- ной в § 1.2. Напомним основные определения из § 1.9. Пусть дана матрица с п строками и k столбцами, за- полненными числами <z,y (I— индекс строки, j — индекс столбца, /=1, 2, ... , п, j=\, 2, . . . , k) из поля К: аи ап • aik yj _ Й21 а22 • • • a2k Ц) ап1 ап2 • ank Если в этой матрице выбрать произвольным образом т строк и т столбцов, то элементы, стоящие на пересечениях этих строк и столбцов, образуют квадратную матрицу по- рядка т. Определитель этой матрицы называется минором т-го порядка матрицы А. Натуральное число г называется рангом матрицы А, если у нее имеется минор порядка г, отличный от нуля, а все имеющиеся миноры порядка г+1 и выше равны нулю. Если матрица А имеет ранг г > 0, то всякий ее минор r-го порядка, отличный от нуля, называется ба- зисным минором. Столбцы и строки матрицы, на пересече- ниях которых находятся элементы базисного минора, назы- ваются базисными столбцами и строками. Наши дальнейшие рассмотрения будут основаны на возможности придать любому столбцу из п чисел геомет-
3.12] § 3.1. ЕЩЕ О РАНГЕ МАТРИЦЫ 75 рический смысл вектора в л-мерном пространстве Кп (2.156). Сама матрица А в этой геометрической трактовке отвечает определенной совокупности k векторов пространства Кп; обозначим через Xj вектор, соответствующий /-му столбцу матрицы А (/=1, 2, ...,&). Любое линейное соотношение между столбцами матрицы мы можем истолковать как такое же линейное соотношение между соответствующими векто- рами (2.226). Образуем в пространстве К„ линейную оболочку векто- ров xlt ха, . .. , хк (2.51). Покажем, что векторы, отвеча- ющие базисным столбцам матрицы А,—пусть для опреде- ленности первые г ее столбцов являются базисными — образуют базис этой линейной оболочки. Для этого достаточно пока- зать, во-первых, что векторы х1, х2, . . . , хг линейно не- зависимы и, во-вторых, что через них может быть линейно выражен любой из оставшихся векторов хг+1, .. . , хк (2.54). Проверим сначала первое из этих, утверждений. Линейная зависимость векторов х1, х2, ... хг была бы равносильна линейной зависимости г первых столбцов матрицы А. Но тогда в силу теоремы 1.96 любой определитель r-го порядка, по- строенный на этих столбцах и каких-нибудь г строках мат- рицы А, был бы равен нулю. В частности, был бы равен нулю базисный минор матрицы А, что противоречит его опре- делению. Таким образом, первое утверждение доказано. Второе утверждение мы фактически доказали в 1.93; сформулирован- ное там для столбцов матрицы А, оно составило содержание «теоремы о базисном миноре». Тем самым мы полностью до- казали, что векторы х1г х2, .. ., хг образуют базис пространст- ва L (xv х2, .. . , хк). В силу теоремы' 2.35 размерность этого пространства равна числу г, т. е. равна рангу мат- рицы А. Мы получили следующий важный результат: Теорема. Размерность линейной оболочки векторов, опре- деленных столбцами матрицы А, равна рангу этой матрицы. Векторы, отвечающие базисным столбцам матрицы А, обра- зуют базис линейной оболочки. 3.12. Дальнейшие предложения представляют собой оче- видные следствия из 2.54а — в. а. Теорема. Если ранг матрицы А меньше, чем число ее столбцов (г < k), то столбцы матрицы А линейно зависимы.
76 Гл. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 13.13 Если ранг матрицы А равен числу столбцов (r = k), то столбцы матрицы А линейно независимы. б. Т е о р е м а. Всякие г + 1 столбцов матрицы А ранга г линейно зависимы. в. Теорема. Ранг любой матрицы равен максимальному числу ее линейно независимых столбцов. Это последнее предложение имеет большое принципиальное значение, так как оно содержит в себе новое определение ранга матрицы. 3.13. Если транспонировать матрицу А, т. е. перейти от матрицы А к матрице А', строки которой являются столб- цами матрицы А, то ранг транспонированной матрицы А' будет, очевидно, таким же, каков был ранг матрицы А. Но согласно теореме 3.12в ранг матрицы А равен максимальному количеству ее линейно независимых столбцов, или, что то же самое, строк матрицы А'. Мы приходим к несколько неожиданному заключению: Теорема. Максимальное количество линейно независимых строк любой матрицы совпадает с максимальным количеством ее линейно независимых столбцов. Заметим, что эта теорема нетривиальна; любое прямое ее доказательство потребовало бы цепи рассуждений, эквива- лентной доказательству теорем 1.93 и 3.11. 3.14. Отметим еще следующий результат, который выте- кает из теоремы 3.11 и леммы 2.536: Теорема. Если один из столбцов матрицы А является ли- нейной комбинацией других ее столбцов, то его можно вы- черкнуть из этой матрицы, не меняя ее ранга. См. задачи 1—2. § 3.2. Нетривиальная совместность однородной линейной системы 3.21. Пусть дана однородная линейная система «11*1 + «12*2 + • • • + «1Л = °, | «21*1 + «22*2 + • • • а2пХп = 0> I (2) «/е1*1 + «£2*2 + • • • + аknXи = °- J
3.22] § 3.2. НЕТРИВИАЛЬНАЯ СОВМЕСТНОСТЬ 77 Как мы уже знаем, эта система всегда совместна, так как обладает нулевым решением хх = х, = . . . = хп = 0. Основ- ная задача, с которой приходится встречаться при изучении однородных линейных систем, следующая: при каких условиях однородная система «нетривиально совместна», т. е. имеет, кроме нулевого, еще другие решения? Результаты § 3.1 позволяют сразу решить эту задачу. Действительно, суще- ствование ненулевого решения системы (2), как мы виде- ли в 2.226, равносильно линейной зависимости столбцов матрицы аи а12 • • • ain д __ а21 а22 • • а2п akl ak2 • • аЬп а по теореме 3.12а эта линейная зависимость имеет место тогда и только тогда, когда ранг матрицы А меньше числа столбцов. Итак, мы получаем следующую теорему: Теорема. Если ранг матрицы А равен числу п, система (2) не имеет ненулевых решений; если же ранг матрицы А мень- ше п, ненулевые решения системы (2) заведомо существуют; в этом и только в этом случае наша система нетривиально совместна. 3.22. В частности, если число уравнений в системе (2) меньше числа неизвестных (k < п), то ранг матрицы А заве- домо меньше п и ненулевые решения всегда существуют. Если k~n, то решение вопроса о существовании ненулевых решений зависит от величины detA: если йе1Д^Д0, нену- левых решений нет (г = л), если detX = 0, ненулевые реше- ния есть (г < л). При k > п нужно рассмотреть все возмож- ные определители л-го порядка, которые получаются при выборе л произвольных строк матрицы А; если все эти опреде- лители равны нулю, то г < л и имеются ненулевые решения; если же среди этих определителей есть хотя бы один отличный от нуля, то г = п и имеется только нулевое решение. См. задачу 3.
78 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ £3.31 § 3.3. Условие совместности общей линейной системы 3.31. Пусть дана общая линейная система уравнений Я1Л ^12^2 Н- • • • &1пХп й21"''1 "Ь ^22^2 4~ • • < а2пХп ~ ^2> ак1х1 ак2Х2 "Г • • • ~Ь акпхп = ^к- (3) С этой системой мы сопоставим две матрицы; матрицу А = й11 rtl2 • ’ • а1и Й21 ^22 • ’ ’ Л2п ак1 ак2 • • ’ а'лп называемую основной матрицей системы (3), и матрицу аи а12 • • ain 11 а21 rt22 • • а2и ^2 ак1 ак2 йкп Ьк называемую расширенной матрицей системы (3). Важная тео- рема о совместности системы (3) гласит: Теорема (Крбнекер и К а п ё л л и). Система (3) сов- местна тогда и только тогда, когда ранг расширенной мат- рицы этой системы равен рангу основной матрицы. Доказательство. Допустим сначала, что система (3) совместна; если ct, с2, ..., сп — некоторое ее решение, то имеют место равенства а11С1 а12С2 + • • • + а1пСп = ^1, ^21^1 "Ь ^22С2 ~Г • • Ч~ ^2п^п ~ ^2> ЙЛ1С1 + ак,с2 + • • + akncn = bk. Но эти равенства означают, что последний столбец матри- цы Аг есть линейная комбинация остальных столбцов этой матрицы (с коэффициентами с-ц с2, . . ., сп). В силу теоремы 3.14 последний столбец матрицы Аг можно вычеркнуть без изменения ее ранга. Но при вычеркивании последнего столбца
3.41] § 3.4. ОБЩЕЕ РЕШЕНИЕ ЛИНЕЙНОЙ СИСТЕМЫ 79 матрица AL переходит как раз в матрицу А. Следовательно, если система (3) совместна, матрицы А и Аг имеют одинако- вый ранг. Допустим теперь, что матрицы А и Аг имеют одинаковый ранг, и покажем, что система (3) совместна. Пусть г — ранг матрицы А (следовательно, и матрицы Д1). Рассмотрим г ба- зисных столбцов матрицы А; они будут базисными столбцами и матрицы Av По теореме 1.93 последний столбец матри- цы Аг есть линейная комбинация базисных столбцов, а сле- довательно, и линейная комбинация всех столбцов матрицы А. Если мы коэффициенты этой последней линейной комбинации обозначим через сг, с2, ..., сп, то получим, что выполня- ются равенства а11С1+ а12С2~Г • • • + а1нСп = | а21с1+а22с2 + . . . +a2ncn = b2, I afelCl+ ak2C2~\~ • • • aknCn = bk- j Таким образом, система (4) удовлетворяется значениями Х1 = с1> Х2 — С2> • • • , Хп = Сп и, следовательно, совместна. Теорема доказана. § 3.4. Общее решение линейной системы 3.41. Теорема Кронекера — Капелли, устанавливая общее условие совместности линейной системы, не дает способа получения решений этой системы. В этом параграфе мы вы- ведем формулу, заключающую в себе общее решение ли- нейной системы. Общим решением системы (3) называется совокупность выражений вида •*7=/} («и, «к, • • • , akn, blt .... Ьк, qlt , qs) (/=1, .. . , л), где в правых частях стоят функции, зависящие от коэффициен- тов a-i] системы (3), ее свободных членов Ь}- и неопределенных параметров qlt . . . , qs, такие, что при произвольно фиксиро- ванных значениях параметров q}- (из поля /<) получающиеся величины Xj = Cj (j = 1, ... , л) образуют решение системы (3),
80 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.41 причем любое решение системы (3) получается этим путем при некотором выборе значений параметров qlt ..., qs из К. В 2.626 мы видели, что совокупность всех сумм вида л;,--//, где х0— какое-либо частное решение этой системы, а у пробе- гает совокупность всех решений соответствующей однородной системы, есть совокупность всех решений системы (3). Теперь этот факт можно выразить следующим образом: общее ре- шение неоднородной системы (3) есть сумма какого-либо частно- го решения этой же системы и общего решения соответству- ющей однородной системы. Пусть дана совместная линейная система (3) с основной матрицей A = ||аг--|| ранга г. Можно предположить, что базис- ный минор М матрицы А расположен в ее левом верхнем углу; если бы это было не так, мы смогли бы достичь желаемого расположения некоторой перестановкой строк и столбцов матрицы А, что равносильно некоторой перестановке уравне- ний и неизвестных в системе (3). Рассмотрим первые г урав- нений системы (3), причем перепишем их следующим образом: а11х1 _Ра12-*'2_Р • • • А'а1ГХГ = ^1-Cl, r + lXr + l- • • ' а1пХП’ O21*14"a22x2 4“ • • • -\~а2ГхГ — ^2 a2,r + lXr~il а2пХп< , (5) arlxl 4“ агЧх2 + • • JTarrxr = 6r — ar, r + lxr + l— • • —arnxn- J Придадим неизвестным хг+1, . .. , хп совершенно произвольные значения сг+х, . . . , сп. Тогда система (5) превращается в сис- тему г уравнений для г неизвестных хх, х2, . . . , хг с опре- делителем Л1, отличным от нуля (базисным минором матри- цы Л). Эту систему можно разрешить по правилу Крамера 1.73; существуют, следовательно, числа сх, с2, . . . , сл, которые при подстановке их в систему (5) на место неизвестных хх, х2, . . . , хп обращают все уравнения этой системы в тож- дества. Покажем, что эти значения сх, са, . . . , сп удовлетво- ряют и всем прочим уравнениям системы (3). Первые г строк расширенной матрицы Лх системы (3) являются базисными строками этой матрицы, так как ранг расширенной матрицы в силу условия совместности равен г и в первых г строках матрицы Лх содержится отличный от нуля минор М. В силу теоремы 1.93 (в применении к строкам) каждая из последующих строк матрицы Лх есть линейная комбинация ее первых г строк. Для системы (3) это означает, что каждое уравнение системы (3), начиная с (г~р 1)-го, есть
3.51] § 3.5. СВОЙСТВА СОВОКУПНОСТИ РЕШЕНИЙ 81 линейная комбинация первых г уравнений этой системы. Сл'е- довательно, если первые г уравнений системы (3) удовлетво- ряются значениями х1 = с1, . . . , хп~сп, то все остальные ее уравнения также удовлетворяются этими значениями. 3.42. Чтобы записать построенное решение системы (3) в виде некоторой формулы, обозначим через /Иу(а,-) опре- делитель, получающийся из базисного минора М-= det||a;y-|| (/, /=1, 2, .. . , г) заменой его у-го столбца на столбец из величина^ а2, . . . , а,-, . .., аг. Тогда, записывая решение системы (5) с помощью формул Крамера, мы получим XJ = 7Г MJ (bi ~ ai,r + lcr + l~~ — ainCn) = = -JT № — Cr + lMj <ai,r+l)— — CnMj («<„)] (6) (/= 1, , r), Xj= CjU = r+ 1, . . . , n). Эти формулы выражают значения неизвестных Xj—Cj (/=1, 2, . . . , г) через коэффициенты системы, свободные члены и произвольные величины (параметры) сг+1, сг+2, . . . , сп. Покажем, что в формулах (6) содержится любое решение системы (3). Действительно, пусть с$, с“, . . . , с"+1, . . . , с°п— произвольное решение системы (3). Очевидно, оно является также решением системы (5). Но по правилу Крамера из системы (5) величины с?, с", . . . , с“ определяются через ве- личины с’+1, . . . , с“ однозначно и именно по формулам (6). Таким образом, при сг + 1=с“+1, •••, сп = с°п формулы (6) дают нам как раз взятое решение с?, с“, . . . , с’, что и тре- бовалось. Таким образом, формулы (6) дают общее ре- шение системы (3). См. задачи 4—7. § 3.5. Геометрические свойства совокупности решений линейной системы 3.51. Рассмотрим сначала случай однородной линейной системы (2); мы уже знаем, что совокупность всех решений такой системы образует линейное пространство (2.42д). Обозначая это пространство через L, вычислим его размер- ность и построим его базис.
82 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.52 Формулы (6) в данном случае приобретают вид — NlCj= cr+1Mj(aitr+1) -j- . .. 4- caMj (ain) (/=1,2, ...,r), (7) так как (b;) — Mj (0) = 0. Каждому решению (Cj, c2, . . . , cr, cr + 1, . . . , c„) системы (2) поставим в соответствие вектор (сг+1, . . . , с„) простран- ства Кп_г. Так как числа сг+1, . . . , сп могут быть взяты произвольно и однозначно определяют решение системы (2), то соответствие между пространством решений системы (2) и пространством Кп_г получается взаимно однозначным. Поскольку при этом соответствии, как легко проверить, со- храняются линейные операции, это соответствие является изоморфным. Итак, пространство L решений однородной сис- темы линейных уравнений с п неизвестными и с рангом г мат- рицы коэффициентов изоморфно пространству Кп_г. В част- ности, размерность пространства L равна числу п—г. 3.52. Любая система из п— г линейно независимых решений однородной линейной системы уравнений, являющаяся вслед- ствие теоремы 2.34 базисом в пространстве всех решений, называется фундаментальной системой решений. Для построе- ния фундаментальной системы решений мы можем воспользо- ваться любым базисом пространства Кп_т‘, в силу изоморфиз- ма соответствующие решения системы (2) будут образовывать базис и в пространстве всех решений этой системы. Простейший базис пространства Кп_г образуется векто- рами (1,0, ..., 0), е2 = (0, 1, ..., 0), ..., еп_г = — (0,0,..., 1) (2.326). Чтобы получить решение системы (2), соответствующее, например, вектору elt нужно в форму- лах (7)подставить cr+1= 1, сг+2= . . . = сп = 0 и определить соответствующие значения ci = СР’ (i = 1, 2, . . . , п). Аналогично строится решение, соответствующее любому дру- гому вектору еу- (У==2, . . . , п — г). Построенная так совокупность решений системы (2) на- зывается нормальной фундаментальной системой решений. Если обозначить эти решения через х(1), х(2), ..., то по определению базиса для любого решения х мы будем
3.61] § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 83 иметь равенство х == аре'1*а2х(2) + . .. -\-ап_гх{п~гУ. (8) Поскольку в формуле (8) заключено любое решение систе- мы (2), эта формула дает общее решение системы (2). См. задачу 8. 3.53. Переходим теперь к рассмотрению неоднородной системы (3) в общем случае. Как было показано в 2.626, геометрический образ И, отвечающий совокупности всех ре- шений неоднородной системы, есть гиперплоскость в п-мерном пространстве Кп, полученная сдвигом подпространства L решений соответствующейоднородной системы (по доказанно- му изоморфного пространству R„_r) на некоторый вектор х0, яв- ляющийся произвольным частным решением неоднородной си- стемы. Из этого мы выводим прежде всего, что размерность ги- перплоскости Н совпадает с размерностью подпространства L. Далее, если г—ранг основной матрицы системы (3), то любой вектору подпространства L можно представить в виде суммы У = «1У11 + а2У2) + • • + ап_г у{п~г\ где j(1>, у2), .. . , у{п~гУ— базисные векторы подпространст- ва L (фундаментальная система решений). Следовательно, любой вектор х гиперплоскости Н можно представить в ви- де суммы х = хо +У = хо + + «гУ2’ + • • • + ап-гУ”~г)- Этот результат на языке решений систем (3) и (2) согла- суется с принципом, установленным в 3.41: Общее решение неоднородной системы (3) равно сумме любого частного ре- шения этой системы и общего решения соответствующей одно- родной системы (2). См. задачу 9. § 3.6. Методы вычисления ранга матрицы 3.61. Для практического использования развитых в пре- дыдущих параграфах методов решения систем линейных урав- нений необходимо уметь вычислять ранг матрицы и находить ее базисный минор. Очевидно, что определение ранга матрицы,
84 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ (3.61 данное в 1.92, само по себе не может служить разумным способом практического вычисления ранга; например, в квад- ратной матрице 5-го порядка можно выделить один минор 5-го порядка, 25 миноров 4-го порядка, 100 миноров 3-го порядка и 100 миноров 2-го порядка; понятно, что если бы мы пожелали найти ранг этой матрицы с помощью прямого вычисления величины всех ее миноров, это была бы весьма трудоемкая задача. В этом пункте будут даны простые спо- собы подсчета ранга матрицы и определения ее базисного минора. Эти способы основаны на изучении некоторых опе- раций со столбцами и строками матрицы, которые не изме- няют ее ранга; мы будем называть эти операции элементар- ными операциями. Поскольку ранг матрицы, как мы уже указывали, не меняется при транспонировании, мы будем определять эти операции только для столбцов матрицы. В связи с этим при доказательствах мы будем использовать геометрическую интерпретацию матрицы с п строками и k столбцами как матрицы из координат некоторой системы k векторов х1, х2, .. . , хк л-мерного пространства R„ и тео- рему 3.11, согласно которой ранг этой матрицы равен раз- мерности линейной оболочки векторов х1; х2, • • • , хк. а. Перестановка столбцов. Пусть в матрице А произвольно переставлены ее столбцы; покажем, что эта операция не изменяет ее ранга. Действительно, размерность линейной оболочки векторов хг, х2, .. . , хк не зависит от того, в каком порядке они записаны; следовательно, и ранг матрицы не зависит от порядка ее столбцов. б. Отбрасывание ненулевого общего мно- жителя элементов данного столбца. Допустим, что речь идет об отбрасывании общего множителя X О у элементов первого столбца матрицы А. Эта операция равно- сильна замене системы векторов Кхг, х2, ... , хк на систему хг, х2, ..., хк; но очевидно, что размерности линейных оболочек этих систем одинаковы (так как сами линейные оболочки совпадают). Поэтому ранг матрицы А не меняется в результате этой элементарной операции. в. Прибавление к одному столбцу другого столбца с произвольным множителем. Пусть к у-му столбцу матрицы А прибавлен m-Й. столбец этой же матрицы, умноженный на число X. Это означает, что система векторов xlt . . . , Xj, . .. , хт, ... , хк заменена на систе-
3.62] § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 85 му хх, ... , х--|-Лхт, . . . , хт, .. . , xk. Покажем, что линейные оболочки Zx и L2 обеих этих систем совпадают. Действительно, все векторы второй системы входят в линей- ную оболочку векторов первой системы; поэтому в силу леммы 2.53а Л2сА1. С другой стороны, равенство Xj = (xJ-+Xxm) — Kxm показывает, что вектор Xj входит в линейную оболочку век- торов второй системы; так как все остальные векторы первой системы, очевидно, также входят в эту линейную оболочку, то АхсА2- Отсюда вытекает, что L1~L2. Поэтому ранг матрицы А не меняется в результате рассматриваемой эле- ментарной операции. г. Зачеркивание столбца, состоящего из од- них нулей. Столбец из одних нулей отвечает нулевому вектору пространства Rn. Очевидно, что от зачеркивания нулевого вектора в системе хх, х2, . . . , хк линейная обо- лочка L (хх, х2, .. . , xft) не может измениться; вместе с нею не может измениться и ранг матрицы А. д. Зачеркивание столбца, являющегося ли- нейной комбинацией других столбцов. Закон- ность этой элементарной операции была доказана в 3.14. Подчеркнем еще раз, что все предложения, доказанные в а — д для столбцов матрицы А, справедливы также и для ее строк. 3.62. Подсчет ранга матрицы и отыскание ба- зисного минора. Покажем, как можно подсчитать ранг заданной матрицы А и найти ее базисный минор, используя операции, перечисленные в а — д. Если матрица А состоит из одних нулей, то ее ранг, очевидно, равен нулю. Допустим, что в матрице А имеется элемент, отличный от нуля; тогда, переставляя строки и столбцы, можно перевести этот элемент в левый верхний угол матрицы. Затем, вычитая из каждого столбца первый столбец с некоторым коэффициентом, можно обратить в нуль все остальные элементы первой строки. Больше мы не будем менять элементы первой строки и пер- вого столбца *). Если среди остальных элементов (т. е. не принадлежащих к первой строке или к первому столбцу) нет *) Но, может быть, будем переставлять их.
86 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3.62 элементов, отличных от нуля, то ранг матрицы А, очевидно, равен 1. Если среди них имеется элемент, отличный от нуля, то, переставляя строки и столбцы, можно перевести его на пересечение второй строки и второго столбца и, так же как и раньше, обратить в нуль все следующие за ним элементы второй строки; отметим, что указанные операции не затраги- вают первой строки и первого столбца. После этого вторую строку и второй столбец мы оставляем в покое. Продолжая таким образом далее, мы приведем матрицу А к одному из следующих двух видов (считая, что количество столбцов матрицы А не больше количества ее строк, чего всегда можно добиться транспонированием): ч 0 0 . 0 0 . . 0 21 «2 0 . 0 0 . . . 0 31 С32 а3 . 0 0 . . 0 А1 Ck'2 Ck3 • v-k 0 . . 0 k +1 1 СА+1 2 Ck + 1, 3 ' ck + l, k 0 .. 0 П1 Сп2 СпЗ • ^nk 0 . . 0 или А = “1 0 0 . . 0 C21 «2 0 . . 0 C31 C32 «3 • . 0 Cml Cm2 ?тЗ •• % Cnl C«2 Cn3 • • Cnm причем числа ах, а2, ... отличны от нуля. В первом случае ранг матрицы Аг равен k и базисный минор (в преобразован- ной матрице) стоит в левом верхнем углу; во втором случае ранг матрицы Л2 равен т (числу столбцов) и базисный минор (в преобразованной матрице) стоит в первых т строках. Ранг матрицы А, таким образом, определен; положение базисного минора можно восстановить, если проследить в обратном по- рядке за всеми операциями, которые производились с мат- рицей А.
3.62] § 3.6. МЕТОДЫ ВЫЧИСЛЕНИЯ РАНГА МАТРИЦЫ 87 Для примера рассмотрим следующую матрицу с пятью столбцами и шестью строками: 1 2 6—2 —1 —2 —1 0 —5 —1 3 1—18 1 А= — 1 0 2 —4 —1 ' _1 —2—7 3 2 —2 —2 —5 —1 1 Во второй строке матрицы А имеется один нуль; используя общий метод, мы можем получить в ней еще три нуля. Для удобства вначале переставим вторую строку с первой, а затем первый столбец со вторым (чтобы в левом верхнем углу оказался наименьший по абсолютной величине элемент—1). Мы получаем*): А —2 —1 0 —5 —1 1 2 6—2—1 3 1—18 1 —1 0 2—4 —1 —1 —2—7 3 2 —2 —2 —5 —1 1 —1 —2 0 —5 —1 2 1 6—2—1 13—181 0—1 2—4 —1 —2 —1—7 3 2 —2 —2 —5 —1 1 Теперь для получения трех новых нулей в первой строке вычтем из второго, четвертого и пятого столбцов первый столбец с множи- телями 2, 5 и 1: —1 0 0 0 0 2 —3 6 — 12 —3 1 1 — 1 3 0 А ~ 0 —1 2 —4 — 1 -2 3 —7 13 4 -2 2 —5 9 3 Далее проще всего добиваться новых нулей в третьей строке; мы вначале переставим ее со второй строкой, затем прибавим к треть- ему и четвертому столбцам второй со множителями 1 и —3: А ~ 1—1 0 0 0 0 11—1 3 0 | 2 —3 6 —12 —3 j 0 —1 2—4—1 —2 3—7 13 4 —2 2 —5 9 3 —1 0 0 0 0 110 0 0 2—3 3—3 —3 0—1 1—1 —1 —2 3 —4 4 4 —2 2 —3 3 3 = Л *) Знак ~ между двумя матрицами означает в данном случае ра- венство их рангов.
88 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Четвертый и пятый столбцы полученной матрицы At пропорцио- нальны третьему, и их можно зачеркнуть. Оставшаяся матрица имеет, очевидно, ранг 3; вместе с ней имеет ранг 3 и исходная матрица А. Базисный минор матрицы At расположен в ее первых трех строках и первых трех столбцах. Возвращаясь по цепочке преобразованных матриц к исходной матрице, мы легко можем проверить, что все произведенные преобразования не влияют на абсолютную величину этого минора. Следовательно, и в исходной матрице минор, стоящий в первых трех строках и первых трех столбцах, является базисным. См. задачу 10 *). ЗАДАЧИ 1. Доказать теорему: для того чтобы матрица m-го порядка || а,у | f имела ранг г < 1, необходимо и достаточно, чтобы существовали числа Oj, ...,ат и fej, Ь2, ..., Ьт такие, что atj=aibj (i, j = l, 2, ..., т). 2. В n-мерном пространстве К„ взяты k линейно независимых векторов х1( х2, ...,Xk. Показать, что линейная оболочка L = = L (xlt х2, ..., хк) определена однозначно, если известны значения всех миноров fe-ro порядка матрицы Л = ||ар>|| из координат век- торов xv х2, ..., хк в некотором базисе е4, е2, •••> еп- 3. Показать, что система (2) при k = n имеет решение С1=Ац, с2= А,-2, ... , cn~ Ain где А^—алгебраическое дополнение элемента а1А (Z фиксировано), если ранг матрицы А меньше п. Примечание. Это обстоятельство позволяет легко строить ненулевые решения системы (2) в случае, когда ранг матрицы системы равен п—1. 4. Решить систему уравнений Х1 + х2 + х3 + + х5 — 7, 3xi + 2x2+ х3+ х4— Зх5 = — 2, х2 + 2х3 + 2х4 -j-6x5 = 23, 5хх + 4х2 + Зх3Зх4— х3 = 12. 5. Исследовать решения системы Zx+ уА- г=1, х —|— Ку —1~ г = Л, х+ у-\-Кг = К2 в зависимости от значения К. 6. При каком условии три прямые +С[ = 0, а2х~-&,у4- +с2 = 0, а3х-~Ь3у-гся==0 проходят через одну точку? 7. При каком условии п прямых а1х + Ь1г/+с1 = 0, а.2х-\-Ь2у-[- + с2 = 0....апхА-Ьпу-\~сп = 0 проходят через одну точку? *) Далее в книге указания на относящиеся непосредственно К тексту задачи уже не делаются.
ЗАДАЧИ 89 8. Написать нормальную фундаментальную систему решений для системы уравнений Xi + хг + х3 + х4 + х5 = О, Злу Ад + — Зх3 = О, х2 + 2х3 2х4 + 6x5=- О, 5х4 + 4х2 Зх3 -ф- Злу — %5 = О. 9. Написать общее решение системы задачи 4, используя нор- мальную фундаментальную систему решений соответствующей одно- родной системы, найденную в задаче 8. 10. Определить ранг и базисный минор следующих матриц: 1—2 3—1 —1 —2 2—1 1 0—2—2 —2 —5 8 —4 3 —1 6 0—1 2—7—5 —1—1 1—1 2 1 Л2 — 10 10 0 110 0 0 0 110 0 0 0 110 0 10 11 11. Пусть в матрице Л имеется минор М r-го порядка, отличный от нуля, а всякий минор (г + 1)-го порядка, включающий все элементы минора М, равен нулю. Доказать, что тогда ранг матрицы Л равен числу г. 12. Построить матрицу д___|1 а11 а12 а13 || II ^21 а22 а23 И с заданными значениями миноров ан а12 Й21 ^22 а11 °13 а21 а23 °12 й13 #22 ^23 =я. 13. Для квадратной системы уравнений п ^ajkxk = bJ k=l (9) доказать «альтернативу Фредгольма»: или система (9) имеет решение, притом единственное, для любых .........Ьп, или однородная система 2 «/Л = ° (/ = 1, ••>«) А=1 имеет ненулевое решение. 14. Доказать, что система уравнений «цХ1 + • • + Oinx„ = 6г, ^7ilXl“h • • ~\~^ППХП a»+i, ЛЯ- ... -ф-ая+1г пхп =Ьп+1
90 ГЛ. 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ при условии а11 • • • а1п апХ ••• апп #0 разрешима тогда и только тогда, когда аи • • «1п bv .................... ' =0. ап1 ' • • ®пп "и ап + 1, 1 • • ап + 1, п Ьп + 1 15. (Задача об исключении неизвестных.) Доказать, что содержа- щая параметры ylt ..., уk система °iixi+-'-+ ainxn~ Ьц У1+--- + Ь1к Ук+си t>ni Pi + • • + b!lk у,. 4-с, a„i *i ^пп^п — ап + 1, 1 АТ + • • • + +1, п хп — ^п + 1, 1 Ух + • • • -г^л+1, k Ук^гсп + 1 при условии «И «1л /о I #//1 • • • апп разрешима тогда и только тогда, когда параметры . летворяют уравнению Ук Удов- 011 • а1п ^11 «11 а1п &lk У1 ап1 anti ^nl + • • +Ук ап1 ^пп ^nk + ап + 1, 1 • • ап + 1, п ^л + 1,1 о« + 1.1 • ап + 1, п 4-1, k °11 • -• а1ч С1 ап1 • • • &пи сч ап + 1, 1 • • • ап + 1, п сп+1
ГЛАВА 4 ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА В общем курсе математического анализа изучаются функ- ции одного или нескольких вещественных переменных. В слу- чае функции, например, трех вещественных переменных можно говорить о функции, аргументом которой является вектор пространства Vs. Мы будем здесь изучать функции, аргу- ментом которых будет вектор произвольного линейного пространства. При этом мы ограничимся пока простейшими типами таких функций, а именно, линейными функциями. Мы будем рассматривать линейные числовые функции векторного аргумента, т. е. функции, значения которых суть числа, и линейные векторные функции векторного аргумента, значения которых суть векторы. Векторные линейные функции, называемые иначе линей- ными операторами, имеют важное значение в линейной ал- гебре и ее приложениях. §4.1. Линейные формы 4.11. Числовая функция L (х) векторного аргумента х, определенная на линейном пространстве К над числовым полем К, называется линейной формой, если она удовлетво- ряет следующим условиям: a) L (х 4-у) = L (х) -|- Г (у) для любых х, б) L(ax) = aL(x) для любого х£К и любого а£К. Иначе говоря, линейная форма L (х) есть морфизм ли- нейного пространства К в одномерное пространство Кг= К. (2.71). Из условий а) — б) по индукции легко получить формулу L (а1х14- а2х2 4 ... 4- <*Л) = = ai£(x1)+a2L(x2)4-... 4-aftL(xft), (1)
92 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.12 справедливую для любых хх, хг, . ..,xft£K и любых чисел а1( а2, ..., ак из К. 4.12. Примеры. а. Пусть в «-мерном пространстве К выбран базис, так что каждый вектор х £ К может быть задан своими коорди- натами Bj, Вг, Тогда L (х) = (первая координата) есть, очевидно, линейная форма от х. б. Более общей линейной формой в том же пространстве является выражение п L (х) - 2 1£к k=\ с произвольно фиксированными коэффициентами /2, . . ., 1п. в. В пространстве К (а, Ь) (где К есть R или С) при- мером линейной формы является выражение Z. (х) = х (/ц), где t0—фиксированная точка отрезка г. В том же пространстве можно рассматривать линейную форму вида ь L ( х '} -= \ I (/) х (/) dt, а где I (/) — фиксированная непрерывная функция. д. В пространстве V3 скалярное произведение (х, х0) вектора х с фиксированным вектором х0 g ]73 есть линейная форма от х. Линейные формы, заданные в бесконечномерных прост- ранствах, обычно называют линейными функционалами. 4.13. Найдем общий вид линейной формы L (х) в «-мер- ном линейном пространстве К,;. Пусть ег, е2, ...,еп — про- извольный базис пространства К„. Обозначим число L (ек) п через lk (k = 1, 2, ..., п). Тогда для любого х = 2 ^кек в силу k— 1 формулы (1) /(*)=/( 2 = 2 1к f (^) = 2 hik, \k=\ / k=\ k~\
4-15] § 4.1. линейные формы 93 т. е. значения линейной формы fix) линейно выражаются через координаты вектора х с фиксированными коэффициен- тами 1г, 12, . . ., 1п. Таким образом, в примере 4.126 мы имели самый общий вид линейной формы в л-мерном пространстве. 4.14. В комплексном линейном пространстве С рассмат- ривают еще один вид линейной формы, называемый линейной формой 2-го рода. Линейная форма, определенная в 4.11, называется в этом случае формой 1-го рода. Числовая функ- ция L (х) аргумента х, определенного на комплексном линей- ном пространстве С, называется линейной формой 2-го рода, если она удовлетворяет следующим условиям: a) L (х -j-j) = L (х) + L (у) для любых х, у С С; б) L(ax) = aL(x) для любого х£С и любого комплекс- ного числа а = а1-|-/а2; число сё-а1— ia2 есть здесь ком- плексно сопряженное к числу а. Формула, аналогичная (1), в случае формы 2-го рода имеет вид L(a1x1+ . .. = ... + akL{xk) (2) для любых хх, . . ., хк из С и любых комплексных ах,..., ак. 4.15. Примером линейной формы 2-го рода в /г-мерном комплексном пространстве Ся с базисом ех, ...,еп служит функция £(*)= к=1 где /х, .. ., /и—произвольно фиксированные комплексные чи- сла, а £х, . . ., — координаты вектора х в базисе ех, . . ., еп. Покажем, что эта формула дает общий вид линейной формы 2-го рода на пространстве С„. Пусть L (х)— произвольная линейная форма 2-го рода; положим /х = L (ех), ...,/„ = £ (еп). Тогда для любого х g С„ по формуле (2) Z. (х) = L ^2 = S Sa (сА) = 2 ^а Sa> что и требуется.
94 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.21 § 4.2. Линейные операторы и их матричная запись 4.21. Линейная форма L (х), определенная в линейном пространстве К, как мы указывали, является морфизмом пространства К в одномерное пространство Кг. Рассмотрим теперь морфизм А = А(х) линейного прост- ранства X в любое линейное пространство Y над тем же са- мым полем К. Будем писать иногда короче: Ах вместо А (х). Согласно определению, функция А (х) удовлетворяет условиям: а) А (х 4~_у) = Ах + А_у для любых х и у из X; б) А (ах) = аАх для любого х £ X и любого числа а. Как и для линейных форм, из условий а), б) следует более общая формула в) А(а1х1 + • • • +ал) = «1Ах1-{- . . . 4~aftAxft для лю- бых Xj, .. ., хк из X и любых ах, . . ., ак из К. Морфизм А называют также, как отмечено в 2.71, ли- нейным оператором, действующим из X в Y. 4.22. Примеры. а. Оператор, который каждому вектору х пространства X ставит в соответствие нуль-вектор пространства Y, яв- ляется, очевидно, линейным оператором. Он называется ну- левым оператором. б. Пусть имеется некоторый линейный оператор А, дей- ствующий из пространства X в пространство Y. Положим по определению Вх = —Ах. Полученный оператор В, как легко видеть, также является линейным оператором, пере- водящим X в Y; он называется оператором, противоположным оператору А. в. Пусть векторам базиса е1г ,еп пространства X произвольно поставлены в соответствие векторы /х, пространства Y. Тогда существует и единствен линейный оператор А, переводящий X в Y и при этом каждый вектор ek переводящий в соответствующий вектор fk(k=\, Действительно, если искомый оператор А существует, то п для любого вектора х= "ikek € X выполняется равенство k— 1 (п \ п п 2 %>kek) — 2 2 k-i j k=i k=i
4.23] § 4.2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ И ИХ МАТРИЧНАЯ ЗАПИСЬ 95 чем доказана единственность оператора А. С другой сто- п роны, для любого х = X мы можем положить по fe= 1 определению п Ах = 2 SftA- k= 1 Получающийся при этом оператор А, как легко прове- рить, является линейным оператором, переводящим X в Y и при этом переводящим каждый вектор ek в соответствующий вектор Д(А=1, . ..,«), что нам и требуется. г. Поставим в соответствие каждому вектору х прост- ранства X этот же вектор х. Мы получим линейный опера- тор Е, действующий из X в X. Этот оператор называется тождественным, или единичным, оператором. . 4.23. Матричная запись линейных операто- ров. Пусть А есть линейный оператор, действующий из пространства X размерности п в пространство Y размерно- сти т. Фиксируем в пространстве X базис ех, ..., еп и в пространстве Y базис Д, Вектор ех переводится оператором А в некоторый век- тор Аех пространства Y, который, как всякий вектор этого пространства, мы можем разложить по базисным векторам: Аа1 = а<1’/1 + ^172+---+</„.• Аналогично оператор А действует на остальные базисные векторы: Аа^^’Д + й^+.-.+^Х. Ае„ = ^ «!/%+... + a^fm. Эти формулы можно записать короче: т (/=1,2, ...,/г). (3) /= 1 Коэффициенты {i = 1, ..., т, j=l, . .., п) определяют
96 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.23 матрицу из т строк и п столбцов или, короче, тX«-матрицу а']1’ а^2) . . . а*"’ а<1> аД . . . а'”' (1^ ит “т • • • ит которая называется матрицей оператора А в базисах {е} = = {ех, и {/} = {Д, . . - Столбцами этой матрицы служат координаты векторов Аег, Ае2, . . Аеп относительно базиса Д, . . ., /т. п Пусть теперь х *= —произвольный вектор и у — 1 tn — Ах — 2 ^ift’ выясним, как выражаются координаты т]; i — 1 вектора у через координаты £, вектора х. Мы имеем m / п \ п У = 2 Л/Л = Ах = А 2 fyj = 2 Ij^ej = i=i v=i / ;=i n m tn / п \ = 2 Л 2 77-= 2 2 77/ д. 7=1 i=l z=l V=1 / Сравнивая коэффициенты при векторе Д, находим л,-=2 77/ (z = 1,2, ..., т). (4) ;=i В раскрытом виде Щ = а^а^г+..^аПп, 'I Л2 = «271 + «22)ё2+• • •I ? (5) ^=« + 772+ • • • +C’U J Следовательно, зная матрицу оператора А в базисе е1; е2, . . ., еп, можно определить результат применения опера- п тора к любому вектору х= V ^>kek пространства X: коор~ *=1 динаты вектора у = Ах линейно выражаются через коорди- наты вектора х по формулам (5). Заметим, что матрица коэффициентов в формулах (5) совпадает с матрицей А^у,.
4.24] § 4.2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ и их матричная ЗАПИСЬ 97 Пусть теперь || а'р || *) — произвольная т X «-матрица. Если л т х= 2 £/е/> мы можем построить вектор _у = 2 V» по фор- 7=1 «'=1 мулам (5). Легко проверить, что оператор А, задающий этот пере- ход от вектора х к вектору у, является линейным оператором. Построим матрицу оператора А в базисе е1; е2, ..., еп. Ёектор ег имеет координаты 1, £2== .. . = е„ = 0; в силу формул (5) координатами вектора /1 = Ае1 будут числа ai\ а2П> • ап\ так чт0 /i = Aei = a<11)e1 + a'1,e2+ ... + а(»еп. Аналогично /у = keJ-=a{iye1 + a(jye2+ . . . + а#е„ (/=1,2, Следовательно, матрица оператора А совпадает с исход- ной матрицей ]| а'/' ||. Итак, каждая тхп-матрица является матрицей некото- рого линейного оператора А, действующего из п-мерного пространства X в m-мерное пространство Y, с фиксирован- ными базисами elt еП в пространстве X и fm в пространстве Y. Тем самым между линейными операторами, действующими из пространства X (с фиксированным базисом в пространство Y (с фиксированным базисом Д, . . ., fm), и тх«-матрицами, заполненными числами из поля К, устанав- ливается взаимно однозначное соответствие, осуществляемое с помощью формул (3) или, что то же, (4). Заметим, что оператор А можно было бы восстановить по матрице Л=||ар || (и притом однозначно), исходя непо- средственно из формул (5). В этих формулах /-й столбец матрицы А представляет собой набор координат вектора fj = kei- 4.24. Примеры. а. Матрица нулевого оператора (4.22-а) в любом базисе пространства X и любом базисе пространства Y, очевидно, состоит из одних нулей. ') Верхний индекс—номер столбца, нижний—номер строки.
98 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.31 б. Если ]| а(/’ || есть матрица оператора А, то матрицей противоположного оператора (4.226) является, очевидно, матрица ||—ар ||. в. Пусть т п и оператор А переводит векторы базиса е1У . .., е„ пространства X в линейно независимые векторы Д, пространства Y. Дополним векторы Д, ...,/„ до полного базиса пространства Y векторами /п+1, . . ., Д,. Тогда матрица оператора А в базисах , . .., еп и Д, ..., fm примет, очевидно, следующий вид: г. В частности, матрица тождественного оператора (4.22г) в базисе е1У ... ,еп пространства X, как области определе- ния, и в том же базисе е1У . . . , еп пространства X, как области значений, имеет вид 10 ... 0 01 ... 0 (5') 00 ... 1 Матрица Е вида (5') называется тождественной или еди- ничной пх «-матрицей. § 4.3. Действия над линейными операторами Мы рассмотрим здесь действия сложения операторов, умножения оператора на число и умножения операторов друг на друга. Два оператора А и В, действующих из прост- ранства X в пространство Y, будем считать равными (и пи- сать А = В), если Ах = Вх для каждого х£Х. 4.31. Сложение операторов. Пусть даны два линейных оператора А и В, отображающих пространство X
4.32] § 4.3. ДЕЙСТВИЯ НАД ЛИНЕЙНЫМИ ОПЕРАТОРАМИ 99 в пространство Y. Оператор С = А -|- В определяется по формуле Сх = (А + В)х = Ax-j-Bx. (6) Очевидно, что С также отображает пространство X в про- странство Y. Покажем что С — снова линейный оператор. Пусть х = а1х1а2х2; тогда . С (аххх -J- а2х2) = A (аххх + а2х2) + В (а^ + «2*2) = — ах Ахх + а2Ах2 + ахВхх + а2Вх3 = = ах (Ахх + Вхх) + а2 (Ах2 + Вх2) = o^Cxj + а2Сх2. Таким образом, оба условия 4.21а)—б) выполнены. Линейный оператор С, определенный равенством (6), на- зывается суммой операторов А и В. Легко проверить следующие равенства: А + В = В + А, \ (А4-В) +С = А +(В4-С), А4-0 = А, [ А + (— А) = 0. J Здесь А, В, С—произвольные линейные операторы, 0—ну- левой оператор (4.22 а),— А—оператор, противоположный к оператору А, т. е. переводящий каждый вектор х£Х в вектор—Ах (4.22 6). 4.32. Умножениеоператора на число. Если А — линейный оператор, действующий из пространства X в про- странство Y, и %—число из поля К, то оператор В = ХА, называемый произведением оператора А на число X, опре- деляется формулой Вх = (ХА) х = X (Ах). Легко проверить, так же как в 4.31, что построенный опе- ратор является линейным. При этом имеют место соотношения Хх (ХаА) = (ХхХ2) А, \ 1-А —А, I (Хх-{-Х2) А = ХхА —Х2А, । X (А В) — ХА ХВ. J
100 ГЛ. 4, ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.33 Соотношения (7) — (7') показывают, что совокупность всех линейных операторов, действующих из линейного пространства X в линейное пространство Y, образует новое линейное про- странство. 4.33. Умножение операторов. Если А—линей’ ный оператор, действующий из пространства X в простран- ство У, а В —линейный оператор, действующий из прост- ранства У в пространство Z (все пространства над одним ц тем- же числовым полем К), то мы определяем оператор Р = ВА, называемый произведением оператора В на оператор А, как оператор, действующий из пространства X в про- странство Z по формуле Рх а (ВА) х = В (Ах) (т. е. сначала на вектор х действует оператор А, а затем на результат, лежащий в пространстве У, действует опера- тор В). Построенный оператор Р является снова линейным, так как Р («!*! + а2х2) = В [А («!*! 4-а2х2)] = В (a^Xj + а2Ах2) = = ахВ Ахх + а2ВАх2 = а1Рх1 + а2Рх2. 4.34. Легко проверяются следующие соотношения: а) Х (ВА) = (ХВ) А для любых операторов А и В с указан- ными свойствами и любого А С К’, б) (А 4* В) С = АС 4* ВС для любых операторов А и В, действующих из пространства У в пространство Z, и Любого С, действующего из X в У; в) А (В 4-С) = АВ 4-АС для любых операторов В и С, действующих из X в У, и любого А, действующего из У в Z; . г) (АВ) С = А (ВС) для любых операторов:. С—-из про- странства X в пространство У, В—из пространства У в про- странство" Z, А—из пространства Z в пространство W. Проверим, например, равенство г). В соответствии с при- нятым нами определением равенства операторов мы должны для любого вектора х б X доказать равенство [А (ВС)] х = [(АВ) С] х.
4.42] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ 101 Но по самому определению произведения операторов [А (ВС)] х = А [(ВС) х] = А [В (Сх)], [(АВ)С]х = (АВ) (Сх), откуда и вытекает требуемое равенство. Справедливость всех остальных равенств проверяется аналогично. § 4.4. Соответствующие действия вад матрицами Выясним, как отражаются действия над операторами, описанные в § 4.3, на матрицах этих операторов. 4.41. Сложение операторов. Пусть даны два линейных оператора А и В, отображающих пространство X с базисом elt ... , еп в пространство Y с базисом ft, ... ,fm. Пусть, далее, оператору А в этих базисах соответствует матрица А==||ар||, а оператору В—матрица В = ||£р||; следовательно, т т (/=1, 2, ... ,п). J г=1 J i=l В таком случае т (А + В) е, = Ав • + Be • = 2 (<$> + b^) fb i= 1 откуда следует, что оператору А+В соответствует матрица ||ар + ^Pll- Такая матрица называется суммой матриц ||ар]| и |рр||. Таким образом, сумма A-J-B определена для всяких двух матриц А и В с одинаковым числом строк и с одина- ковым числом столбцов. 4.42. Умножение оператора на число. При тех же условиях т (ХА)е/=Х(Ае/) = 2 Хар/., z= 1 Следовательно, оператору ХА соответствует матрица ||Хар||, получающаяся умножением всех элементов матрицы ||ар||
102 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО аргумента Н-43 на число А. Такая матрица называется произведением матрицы ||ар|| на число X. Поскольку /лхл-матрицы и линейные операторы, дейст- вующие из л-мерного пространства в /я-мерное, соответст- вуют друг другу взаимно однозначно (4.23), действия с опе- раторами соответствуют одноименным действиям с матрицами и действия с операторами подчиняются правилам (6) — (7), мы можем сделать вывод, что действия с матрицами также подчиняются правилам (6) — (7), что, впрочем, легко было бы проверить и непосредственно. Тем самым мы получаем, что совокупность всех mxn-матриц образует линейное простран- ство. По самому построению оно изоморфно линейному про- странству всех линейных операторов, действующих из л-мер- ного пространства X в /я-мерное пространство Y. 4.43. Умножение операторов. Выберем в про- странствах X, Y, Z базисы: в пространстве X—базис е1( .. ., е,., в пространстве Y—базис Д, . . . ,fm, в пространстве Z—базис glt ... , gq. Пусть оператор В, действующий из X в Y, имеет /»ХЛ-матрицу ||&р||, так что tn Bej = ^b^fi (/=1,..., л), а оператор А, действующий из Y в Z, имеет q X «-матрицу ||а*’II, так что A/,- = 2 apgk (1=1, ..., m). А=1 Для произведения Р = АВ мы получаем m (АВ)е/=А(Ве/) = А b^fi = m m q q / m \ = 2^’A/( = 2 bp s apgk= 2 ( 2 apbp]gk. i=l i=l k=l k=l \i=l / Следовательно, элементы pp матрицы P оператора P = AB имеют вид tn Pp=%apbp (J=l, 2, ... , л; k=l,...,q). (8) i = l
4.44] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ над матрицами 103 Это и есть интересующий нас результат. Его можно выра- зить так: элемент матрицы Р, стоящий на пересечении ее k-й строки и j-го столбца, равен сумме произведений всех элементов k-й строки матрицы А на соответствующие эле- менты j-го столбца матрицы В. Матрица UpV’II, которая получается из матриц || а#’II и ||£//>|| по формуле (8), называется произведением первой из этих матриц на вторую. Заметим, что число столбцов первой матрицы должно быть равно числу строк второй матрицы, иначе произведение матриц не будет иметь смысла. При выполнении этого усло- вия матрица-произведение имеет столько строк, сколько их имеется у первой матрицы, и столько столбцов, сколько их имеется у второй матрицы. Более выразительна отхл-запись: произведение qx/-мат- рицы А на m X л-матрицу В определено, если 1—тп, и в этом случае произведение АВ есть qx«-матрица. Оба произведе- ния АВ и ВА определены, если l~m, q= л; в этом случае АВ есть квадратная л X «-матрица, а ВА есть также квад- ратная лгахлх-матрица. Если, наконец, « = m = p = q, т. е. обе матрицы А и В суть квадратные л х «-матрицы, то АВ и ВА — также квадратные «хл-матрицы. Однако они не обя- заны быть равными. Например, Таким образом, умножение квадратных матриц, вообще говоря, некоммутативно. Что касается сочетательного и распредели- тельного законов, то здесь положение более благополучное: умножение операторов, как мы видели в 4.34, подчиняется сочетательному и распределительным законам; поскольку матрицы и операторы находятся во взаимно однозначном соответствии и умножение матриц соответствует умножению операторов, мы можем сделать вывод, что сочетательный и распределительные законы удовлетворяются также и для умножения матриц. 4.44. Примеры. В следующих примерах индексы элементов матриц пи- шутся внизу, так что элемент aJk матрицы А= ||ay-s|| стоит на пересечении ее /-й строки и k-ro столбца. Формула
104 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4-44 умножения Р=АВ [см. 4.43 (8)] в этих обозначениях прини- мает вид (/=1, ••• > п, А = 1, ... ,д). а. Умножим дахл-матрицу А = Ца/6Ц слева на дахда-мат- рицу Brs = ||fyft||, в которой все элементы bjk равны 0, кроме одного элемента brs, равного 1. По общему правилу (8) мы получим дахл-матрицу Bzs4 = (0 & а а s • • • • £ • • £ & • • - • й • • й В . . , . й Зй ' ’ в ' •3 Со а .... а .. 3 = (О 0 0 ... 0 asl as2 • • asn 0 0 ... 0 так что в г-й строке матрицы BrsA стоят элементы $-й строки матрицы А, а остальные элементы матрицы BrsA равны 0. б. Умножим да X «-матрицу А = ||a-ft|| справа на лХл-мат- рицу С t в которой все элементы равны 0, кроме одного элемента cqt, равного 1. По общему правилу (8) мы получим дахл-матрицу (О (О ACqt = а11 л21 . . О гЧ cq в <3 ° S ft to H* • 3 3 W . . .1 . . . — 0 . 0 . о о l-l fl • . 0 . 0 aml • • &mq • • amn 0 . • amq . 0 так что в Z-м столбце матрицы ACqt стоят элементы q-ro столбца матрицы А, а остальные элементы матрицы ACqt равны 0.
4.44] § 4.4. СООТВЕТСТВУЮЩИЕ ДЕЙСТВИЯ над МАТРИЦАМИ 10b в. При тех же Brs, A, Cqt получаем так что операция BrsACqt приводит к отХл-матрице, в ко- торой все элементы равны нулю, кроме стоящего на пере- сечении r-й строки и Лго столбца, который равен asq. г. На какую т X /«-матрицу D нужно умножить слева от X//-матрицу А, чтобы матрица JDA совпала с матрицей А, в которой переставлены местами r-я и 5-я строки? Пример а показывает, как получить матрицу, в которой г-я строка есть 5-я строка матрицы А, — умножением слева на от Хот-матрицу Brs. Но остальные строки в результате равны 0. Теперь ясно: чтобы получить требуемую матрицу, нужно матрицу А умножить слева на от Хот-матрицу (г) (S) 1 1 ... о 1 1 (S) 1 о 1 ... 1 1
106 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4-51 д. На какую п X «-матрицу G нужно умножить справа ту «-матрицу А, чтобы матрица AG совпала с матрицей А, в которой переставлены местами <?-й и t-й столбцы? Аналогично г мы получаем G=cgt + ctq+ 2 ckk. k=£q e. На какую m X «г-матрицу F нужно умножить слева «IX«-матрицу А, чтобы получившаяся матрица совпала с мат- рицей А, в которой к r-й строке прибавлена s-я строка с коэффициентом X? После сказанного в а ответ очевиден: F=E-\-'kBrs. ж. На какую л X «-матрицу Н нужно умножить справа «г X «-матрицу А, чтобы получившаяся матрица совпала с матрицей А, у которой к /-му столбцу прибавлен q-й стол- бец с коэффициентом р? Ответ очевиден: // = £-|-pC9t. § 4.5. Дальнейшие свойства умножения матриц 4.51. Умножение матриц, разбитых на блоки. В некоторых случаях бывает удобно разбивать перемножае- мые матрицы на блоки и действовать далее с блоками. Предположим, что нам дана /иX«-матрица А и «хр-мат- рица В, которые разбиты на блоки: Предположим, что в каждой блок-строке матрицы А столько же блоков, сколько в блок-столбцах матрицы В, и при этом
4.521 § 4.5. дальнейшие свойства Умножения матриц 107 ширина любого блока А]к матрицы А совпадает с высотой любого блока Bks матрицы В. Тогда все произведения AjkBks имеют смысл; это—прямоугольные матрицы, размеры которых зависят от индексов j и s, но не зависят от индекса k. Интересующее нас правило умножения матриц состоит в следующем: матрицу АВ можно составить из блоков, по- строенных из блоков матриц А и В так же, как элементы матрицы АВ составляются из элементов матриц А и В: ^11 + ^12 ^21 + • • • Ai ^12 + •••]••• АВ = А1 #11 + • • • Действительно, пусть i—номер блок-строки матрицы А, содержащей k-io строку самой матрицы А, и J—номер блок-столбца матрицы В, содержащего q-fi столбец матри- цы В. По общему правилу 4.43 элементы матрицы Р — АВ имеют вид Pkq — 4“ • • • 4" ^krfinq — (aki biq + • • • + акр bpq) + ... + (акг brq+ ... + акп bnq), где скобки расставлены в соответствии с шириной блоков матрицы А (и высотой блоков матрицы В). Будем нумеровать строки и столбцы блоков теми же номерами, что и в самой матрице А. В первой скобке стоит элемент, стоящий на пере- сечении А-й строки и q-ro столбца блока АцВу, во второй скобке — элемент, стоящий на пересечении Л-й строки и q-ro столбца блока Л,-2В2у, и т. д.; в результате получается элемент, стоящий на пересечении Л-й строки и q-ro столбца блока Л(1Вгу-|- ... -\-AirBrj, что и утверждалось. 4.52. Умножение квазидиагональных мат- риц. Матрица называется квазидиагональной, если она
108 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА (4.52 имеет вид причем необозначенные блоки состоят из нулей. Предполо- жим, что блок Акк представляет собой тк хлА-матрицу (fe = l, .... s). Рассмотрим квазидиагональную матрицу у которой блок Вкк представляет собой пк хрА-матРицУ (k = 1, ... , s). Матрицы А и В можно перемножить по правилу 4.51, которое в данном случае немедленно приводит к результату ^22^22 (9)
4.54] § 4.5. ДАЛЬНЕЙШИЕ СВОЙСТВА УМНОЖЕНИЯ МАТРИЦ 109 Таким образом, в данном случае матрица АВ снова есть ква- зидиагональная матрица, причем блок АккВкк имеет тк строк и рк столбцов. 4.53. Произведение транспонированных мат- риц. Пусть дана да х «-матрица А .= || ajk ||. Транспонирован- ной по отношению к А называется п X да-матрица А' —1| a'pq |[, для которой а'рч = адр (р=1, ...,л; q=\, ... , да). Пусть А есть да х «-матрица и В есть п хр-матрица, так что произведение Р = АВ определено и является дахр-мат- рицей. Определено и произведение транспонированных мат- риц В'А', которое представляет собой рхда-матрицу. По- кажем, что справедлива формула В'А' = (АВ)’. (10) Для доказательства обозначим элементы матриц А, В, Р = ~ АВ, А', В', Р' соответственно через а„у, b^, ptj, а’ц = — ajh t^i = Ьд, р'а=рр- Равенство (8), определяющее элементы pik, мы можем переписать в виде Pik^ Pki~ S ajfikj= i=l i=i /=1 Суммирование проводится по индексу j при фиксированных индексах I и к. Фиксированные индексы указывают, что Для образования элемента р'м в матрице В' используется k-я строка, а в матрице А' — i-ft стойбец. В результате образования суммы произведений соответствующих элемен- тов получается элемент p'ki, лежащий на пересечении k-й строки и z-ro столбца матрицы Р'. Но по определению произведения матриц это и означает, что матрица Р' есть произведение матрицы В' на матрицу А'. Тем самым ра- венство (10) доказано. 4.54. Миноры произведения двух матриц. Пусть даны да х «-матрица А = || а]к || и «хр-матрица В = || bjk |]; построим дахр-матрицу Р = АВ — || pyft ||. Фикси- руем в матрице Р строки с номерами ах ак и столбцы с номерами k^p) и поставим себе
НО ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА (4.54 целью вычислить минор Af = AfpJ‘;(АВ), построенный на фиксированных строках и столбцах: л«₽::::::Й(лв) = + • • • +аа1п^лр1 • • • aa,i^ifik + • • • аа,пЬпЦ1: а«>Ар1 + • • • • аоц1^1₽л + • • + аа,пЬп^ aa*jA₽i + • • • + аакПЬп$, + • • + aaknt>n$k Для вычисления используем линейное свойство опреде- лителя (1.44). Столбец минора Af с номером v является суммой k «элементарных» столбцов с элементами вида ва/£/₽ (где индексы столбца I и v фиксированы, индекс строки j изменяется от 1 до k). Поэтому весь минор Af равен сумме kk «элементарных» определителей, составлен- ных только из «элементарных» столбцов. В каждом из элементарных столбцов множитель вдоль столбца не V меняется и его можно вывести за знак «элементарного» определителя. После этого каждый из «элементарных» определителей принимает следующий вид: ^ati, ^a,ia • • • ^aaik aaai, aa2l, • • aa2ik (12) aaki, aakl, aakik где i\, ... , ik — некоторые числа от 1 до п. Если среди этих чисел есть одинаковые, то соответствующий элемен- тарный определитель равен 0. Между прочим, так всегда будет, если п < k. Поэтому если в матрице АВ есть вообще миноры порядка k> п, то все они равны 0. Возвращаясь к случаю ktg^n, мы видим, что следует рассматривать лишь такие элементарные определители, для которых все индексы 1г, . .. , ik различны. В этом случае определитель aa2i, aaaia aatik aa,ik aalti1 вак1, • • •
4.54] § 4.5. ДАЛЬНЕЙШИЕ СВОЙСТВА умножения матриц 111 с точностью до знака совпадает с минором zW“t*; , где суть индексы zx, . . .,ik, переставлен- ные в порядке возрастания. Выясним, какой именно знак нужно поставить перед минором ТИ?,*,’ .чтобы по- лучить в точности минор ЛТ/,1.’;. Для этого будем по- следовательно переставлять в миноре УИ“‘,сосед- ние столбцы с тем, чтобы в результате получить их нор- мальное расположение (т. е. совпадающее с расположением столбцов в самой матрице А). При каждой перестановке двух соседних столбцов минор М7*,’ ;изменит знак; с другой стороны, при этом число «беспорядков» в пере- становке индексов ilt i2, . . . , in изменится на единицу. Так как в окончательном расположении столбцов нижние индексы идут в натуральном порядке, без «беспорядков», то число последовательных перемен знака равно числу «.беспорядков» в перестановке индексов zx, z2, ..., z'n*). Обозначим это число через /V(z). Тогда выражение (12) приобретает следующий вид: (—1И“и). (1з> Чтобы получить величину М, мы должны сложить все вы- ражения вида (13). Будем сначала складывать выражения с одним и тем же набором z'x < . . . < z\, так что числа z'x, .. . , ik представ- ляют некоторую перестановку в этом наборе. При этом общий множитель ЛТ“‘,’ \ (Л) можно вынести за скобки. В скобках остается величина которая, очевидно, есть минор ЛГр1,’, pfck(В). Окончательно мы получаем формулу : ₽£ (лв)= •_ •_ ; % (Л)м^,_• _•;; & (В). (14) Суммирование производится здесь по всем наборам номеров zx < z2 < ... < ik, причем сами эти числа могут изменяться *) Предполагается, что при каждой перестановке индексов мень- ший индекс становится впереди большего и тем самым число беспо- рядков уменьшается ровно на единицу.
112 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4,61 от 1 до П- Общее число слагаемых в этой сумме равно рь______п । л“й!(п — k)\ ’ Сформулируем результат в виде теоремы. Теорема. Каждый минор k-го порядка матрицы АВ может быть выражен через миноры того же порядка мат- риц А и В по формуле (14). § 4.6. Область значений и нуль-многообразие линейного оператора 4.61. Пусть дан линейный оператор А, действующий из линейного пространства X в линейное пространство ¥. Мы используем здесь обозначение 2.71 А: X—► ¥. Пусть п — размерность пространства X, a m—размер- ность пространства Y. Выберем произвольно базис , еп в пространстве X и базис Д, . . . , fm в про- странстве Y. Тогда оператору А можно поставить в соот- ветствие по правилу 4.23 л» X л-матрицу А = / = = 1, .. . , m, j— 1, . . . , п. Обозначим через Т (А) область значений оператора А, т. е. совокупность всех векторов у = Ах, х£Х. Поставим задачу: вычислить по матрице А размерность подпространства Т (А). Полагая п * = 2 ^kek’ k=l мы получаем п J = Ax= 2 k=i следовательно, область значений оператора А совпадает с линейной оболочкой векторов Ае1; Ае2, ... , Ае„. Раз- мерность линейной оболочки L {Аег, Ае2, .. . , Аеп) согласно 2.54в равна максимальному количеству линейно независимых векторов в системе Аег, Ае2, ... , Аеп. Мы знаем, что в столбцах матрицы оператора А выписаны координаты векторов Ае,- относительно базиса {/}; таким образом, вопрос о максимальном количестве линейно независимых векторов в системе Ае}- (у= 1, 2, ... , п) немедленно сво- дится к вопросу о максимальном количестве линейно неза- висимых столбцов у матрицы оператора А, Но это послед-
4.63] § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 113 нее в силу 3.12в равно рангу матрицы оператора А. Итак, размерность области значений линейного оператора А, действующего из п-мерного пространства X в m-мерное про- странство Y, равна рангу матрицы оператора А в любом базисе {е} пространства X и любом базисе {/} прост ран? ства Y. Заметим, что выбор базисов в данном случае безраз- личен: следовательно, ранг матрицы оператора А не зави- сит от выбора базисов, т. е. зависит только от самого оператора А. В дальнейшем мы будем ранг матрицы опе- ратора А (в любых базисах) называть просто рангом опе- ратора А и обозначать через г&. 4.62. Теперь обозначим через N (А) нуль-многообразие оператора А, т. е. совокупность всех тех векторов х£Х, для которых Ах = 0. Поставим задачу: по матрице А = ||аР |j оператора А вычислить размерность подпространства N (А). п Пусть х= S ^iei (А). Тогда система (5) прини- 1=1 мает вид 41,В1+^Ч2+...+а<1п,£в = 0, ' 41)£1+а^2+...+^л = 0, .... Очевидно, что и обратно, всякий вектор х£Х, координаты которого удовлетворяют системе (15), входит в нуль-мно- гообразие оператора А. Таким образом, вопрос о размер- ности нуль-многообразия оператора А равнозначен вопросу о размерности подпространства решений системы (15). В силу 3.51 размерность лА этого подпространства равна числу п — г, где г — ранг матрицы из коэффициентов системы, или, что то же самое, ранг оператора А; таким образом, Ла = п — гк. Итак, размерность нуль-многообразия оператора А равна дополнению ранга оператора А до размерности простран- ства X, из которого действует оператор А. 4.63. В частности, если морфизм А: X—>-Y есть эпи- морфизм, то T(A) = Y и, следовательно, r^ = m. Если
114 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.64 морфизм А: X—> Y есть мономорфизм, то N(A) = 0 и, следо- вательно, Гд=л. Верны и обратные утверждения. Именно, если ранг матрицы А равен числу т ее строк, то размер- ность Т (А) совпадает с размерностью всего Y, откуда следует, что Т (А) = Y. Поэтому морфизм А есть эпиморфизм тогда и только тогда, когда r^—m. Если ранг матрицы А равен числу п ее столбцов, то векторы Д — Аех, . . . ..., fn = ken являются линейно независимыми и, следова- тельно, оператор А является мономорфизмом (2.73в). По- этому морфизм А есть мономорфизм тогда и только тогда, когда — п. 4.64. Следующее предложение есть обращение резуль- татов 4.61—4.62: Теорема. Пусть X есть п-мерное пространство, Y — произвольное пространство. Каковы бы ни были подпро- странства Nc.X и Т с Y, сумма размерностей которых равна п, существует линейный оператор А: X—>Y, для которого N (А) = N, Т(А) = Т. Доказательство. Обозначим размерности подпро- странств N и Т соответственно через k и т = п—k. В под- пространстве Т выберем т линейно независимых векторов /1, /2> • • • > fm- Выберем, далее, произвольный базис е1т е2, . .. , еп в пространстве X так, чтобы первые k векто- ров базиса лежали в подпространстве N (2.43). Определим оператор А условиями Ас,- =0 (4 = 1, 2, .. . , k), 1 AeJ+A=/z (/=1, 2, ... , т). J (16) Покажем, что оператор А удовлетворяет поставленным требованиям. Прежде всего, очевидно, что Т (А) есть ли- нейная оболочка векторов /;(г=1, 2, ..., т) и, следо- вательно, совпадает с подпространством Т. Затем всякий вектор подпространства N по условию принадлежит к N (А); нам остается показать, что любой вектор пространства N (А) входит в N. Допустим, что для некоторого п х = 2 »=i
4.66J § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 115 будет Ах = 0. Используя условия (16), мы получаем О = Ах = А + ... + М„) = ^+i/i + • • • + lnfm. Поскольку Д, Д, .. . , fm линейно независимы, мы имеем Б*+1= • • • = L = °- Но Tor«a * = ^1 + ---+5*e*€N, что и утверждалось. 4.65. Следующая теорема о ранге произведения двух матриц вытекает из свойств только что введенных геометри- ческих характеристик. Теорема. Ранг произведения АВ матриц А и В не превосходит ранга каждого из сомножителей. Доказательство. Естественно, мы предполагаем, что число столбцов матрицы А совпадает с числом строк матрицы В, иначе их нельзя было бы перемножить. Пусть А есть /яхл-матрица, а В есть лхр-матрица. Введем в рассмотрение линейные пространства X, Y, Z с размерно- стями, соответственно, л, m и р. В пространстве X выберем базис ег, ..., еп, в пространстве Y—базис Д, ... , fm, в пространстве Z—базис gv ... , gp. Используя их, можно матрице А поставить в соответствие линейный оператор А: X—>-Y, а матрице В—линейный оператор В: Z—>Х. Произведению АВ матриц А и В отвечает линейный оператор АВ: Z—>Y. Область значений оператора АВ в силу самого его определения содержится в области значений оператора А. Поскольку согласно 4.61 размерность области значений любого оператора равна рангу соответствующей матрицы, мы получаем, что ранг произведения двух матриц не пре- восходит ранга первого множителя. Чтобы доказать, что он не превосходит также и ранга второго множителя, перейдем к транспонированным матрицам; используя 4.53, мы получим ранг АВ = рангу (АВ)' — рангу В’А' Яранга В'= рангу В, что и требуется. 4.66. Ранг произведения меньше, чем ранг каждого матрицы двух матриц может быть и из сомножителей. Например, 1 О О О В = О 1 О О
116 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.67 обе имеют ранг, равный единице, а их произведение имеет нулевой ранг. Поэтому представляет интерес следую- щая теорема, дающая оценку ранга произведения двух мат- риц не сверху, а снизу. Теорема. Пусть А есть mxn-матрица ранга гА и В есть пхр-матрица ранга гв. Тогда ранг mxp-матрицы АВ не меньше Га-\-гв—п. Доказательство. Покажем сначала, что любой опе- ратор А: X—>Y ранга г переводит всякое A-мерное подпро- странство Х'сХ в подпространство Y'aY, размерность которого не ниже г — (л—А). Выберем базис ех, ег, ...,еп в пространстве X так, чтобы первые А векторов базиса ле- жали в подпространстве X' (2.45). Координаты векторов Ае1; Ае2, ..., Aek, порождающих подпространство Y', в мат- рице оператора А занимают А первых столбцов. По условию в матрице оператора А имеется г линейно независимых столбцов. Эти столбцы разобьем на две группы: в первую группу отнесем те, которые имеют номера от 1 до А, а во вторую группу—те, которые имеют номера от А + 1 до л. Числен- ность второй группы не больше л—А; следовательно, чис- ленность первой группы не меньшег — (л—А). Таким образом, подпространство Y" имеет не менее г — (л—А) линейно не- зависимых векторов, что и утверждалось. Пусть теперь А: X —> Y и В: Z —► X—линейные операто- ры, соответствующие перемножаемым матрицам. Оценка ран- га матрицы оператора АВ согласно 4.61 есть оценка раз- мерности области значений этого оператора. Оператор В переводит все пространство Z в подпространство Т(В)сХ размерности гв. По доказанному оператор А переводит под- пространство Т (В) в подпространство, размерность которого не ниже гА— (п—rB) = гА4-гв—л. Таким образом, область значений оператора АВ, а с ней и ранг матрицы АВ, име- ют величину не ниже гА-}-гв—п, что и требовалось. 4.67. Следствие. Если одна из перемножаемых матриц, т. е. mxn-матрица А или п X р-матрица В, имеет ранг, равный п, то ранг произведения равен рангу второй матрицы.
4.68} § 4.6. ОБЛАСТЬ ЗНАЧЕНИЙ И НУЛЬ-МНОГООБРАЗИЕ 117 Действительно, в этом случае оценки ранга произведе- ния сверху и снизу, полученные в теоремах 4.64 и 4.65, дают одинаковый результат, равный рангу второй матрицы. 4.68. Пусть дан линейный оператор А, переводящий линейное пространство X в линейное пространство Y. Ли- нейный оператор В, переводящий линейное пространство Y в линейное пространство X, называется левым обратным к оператору А, если ВА^Е есть единичный оператор в пространстве X. Оператор А в этом случае называется правым обратным к оператору В. В каком случае оператор А(В) имеет левый (правый) об- ратный? На этот вопрос отвечает теорема: Теорема. Оператор А: X—>Y имеет левый обратный тогда и только тогда, когда А есть мономорфизм. Оператор В: Y—► X имеет правый обратный тогда и только тогда, когда В есть эпиморфизм. Доказательство. Пусть А есть мономорфизм и T(A)cY— его область значений. Каждому у £ Т (А) отвечает х € X, для которого Ах = у, причем х определяется одно- значно по у в силу предположенной мономорфности А. Пусть QcY есть подпространство, дающее в прямой сумме с Т (А) все пространство Y (2.46). Определим оператор В: Y—>-Х по следующему правилу. Для у £ Т (А) положим By равным тому (единственному) х, для которого Ах—у; для у £ Q положим Ву = О; для у =уг -}-_у2, где _У1£Т(А), j2gQ, по- ложим By = Byj. Оператор В, как легко видеть, линейный, и для каждого х £ X мы имеем ВАх = х, так что В есть левый обратный для А. Если А не есть мономорфизм, то существует вектор х £ X, отличный от 0 и такой, что Ах = 0. Тогда для любого В: Y —>Х мы имеем (ВА)х = В(Ах) = В(0) = 0, так что левого обратного для оператора А заведомо не су- ществует. Пусть В: Y—>Х есть эпиморфизм и пусть N (В) с Уесть нуль-многообразие оператора В, a QcY в прямой сумме с N(B) дает все пространство Y. Так как X=B(Y) = B(N(B)4~Q) = = B(Q), то отображение В: Q—»Х есть также эпиморфизм и, более того, изоморфизм, так как никакой элемент у £ Q, отличный от 0, не переходит при воздействии оператора В
118 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.вд в нуль. Определим оператор А: X —► Y по следующему правилу: для любого х £ X вектор Ах есть тот (единствен- ный) вектор y£Q, для которого tiy = x. Оператор А, оче- видно, линеен, и для каждого х £ X мы имеем ВАх = х, так что А есть правый обратный для В. Если В: Y —► X не есть- эпиморфизм, то для вектора х£Х, не входящего в Т (В), и любого оператора А: X —> Y мы имеем ВАх#=х, так что В не имеет правого обратного. Теорема доказана. 4.69а . Мы знаем (4.43), что результатом умножения лх>я-матрицы Р на /яхл-матрицу А является квадратная л хл-матрица S — PA. Если S — единичная лхл-матрица (4.24г), то матрица Р называется левой обратной для матрицы А. Аналогично ре- зультатом умножения техл-матрицы А на лх/я-матрицу Q является квадратная m х /я-матрица 7'=AQ, и если Т—единичная /ях/я-матрица, то Q называется пра- вой обратной для матрицы А. б. Используя результаты 4.63, можно сформулировать теорему 4.68 в терминах ранга матрицы. Теорема. Тогда и только тогда некоторая тхп-матри- ца А имеет левую обратную, когда ее ранг равен числу п; тогда и только тогда она имеет правую обратную, когда ее ранг равен числу т. § 4.7. Линейные операторы, переводящие пространство Кп в себя 4.71. Рассмотрим линейный оператор А, переводящий пространство X в себя (так что в 4.21 следует положить Y = X). Будем называть такой оператор А действующим в пространстве X. Пусть оператор А действует в л-мерном пространстве Х = КП. Выберем в пространстве X базис elt ..., еп н этот же базис в X используем для построения матрицы операто-
4.72] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 119 ра А.. В соответствии с 4.22, матрица А оператора А стро- ится по формулам АеА=г?1а^е<‘’ (17) так что коэффициенты образуют на этот раз квадрат- ную п X л-матрицу; она называется матрицей оператора А в базисе (е) = {ex, ..., еп). Мы будем ее иногда обозначать через А(е). Соответствующая формула для координат век- п п тора у = Ах,у — имеет ВИД (4.23): п (18) При фиксированном базисе (е1; ..., еп)—{е} получается взаимно однозначное соответствие между всеми линейными операторами, действующими в пространстве Кп, и всеми квадратными п X л-матрицами, заполненными элементами из поля К. 4.72. Примеры. а. Оператор, который каждому вектору пространства X ставит в соответствие нуль-вектор, очевидно, является ли- нейным. Он называется нулевым оператором (ср. 4.22а). Матрица нулевого оператора в любом базисе, очевидно, состоит из одних нулей. б. Единичный или тождественный оператор Е, ставящий в соответствие каждому вектору х £ X сам вектор х, мы рассмотрели в 4.22г. Матрица единичного оператора имеет вид (4.24г) Е = 1 О О О 1 О О 0 1 ООО О О О 1 Такая матрица называется единичной.
120 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.72 в. Оператор А, который переводит каждый вектор х в Хх, где X—фиксированное число из поля К, очевидно, ли- неен; он называется оператором подобия (с коэффициентом подобия X). Аналогично предыдущему матрица оператора подобия в любом базисе имеет вид X 0 ... 0 ОХ ... 0 0 0 . . X г. На евклидовой плоскости У2 векторы можно опреде- лять полярными координатами: х = {ф, р}. Оператор А, пе- реводящий вектор х = {ф, р} в Ах = {ф-|-ф0, р} (ф0— фик- сированный угол), является, как легко проверить с помощью чертежа, линейным. Этот оператор называется оператором поворота на угол ф0. Для построения матрицы оператора поворота выберем в плоскости У2 базис из двух единичных взаимно ортогональ- ных векторов elt е2. Построив чертеж, легко проверим, что вектор ех после поворота на угол ф0 перейдет в вектор cos ф0 sin ф0 е2, а вектор е2—в вектор — з1пф0е1-|-со5ф0 е2. Следовательно, матрица оператора поворота в любом из указанных базисов имеет вид Icos ф0 —sin ф0 sin фо cos фо д. Пусть ег, е2, ..., еп — некоторый базис в л-мерном п пространстве К„. Поставим в соответствие вектору х = k=i m вектор Рх =']>'.1i,kek, где m<~n. Оператор Р—линейный k=i оператор; он называется оператором проектирования на под- пространство Ки, порожденное векторами ег, е2, . .., ет. Для построения матрицы оператора проектирования за- метим, что под его воздействием векторы ех, е2, . . ., ет переходят в себя, а векторы ега+х, ..., еп — в нуль. Поэто- му матрица оператора проектирования в базисе ех, е2, ..., еп
4-73] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 121 имеет вид m-я строка 1 0 . . . 0 0 . . 0 0 1 .. . 0 0 . . 0 0 0 .. . 1 0 . . 0 0 0 .. 0 0 . . 0 0 0 .. . 0 0 . . 0 е. Пусть elt е2, •••, еп—базис в л-мерном пространстве К„ и даны п фиксированных чисел Х2, .. ., Опреде- лим оператор А для векторов базиса условиями Ае1 = %1е1, Ае2=Х2е2, Аел = Хлел и для любого другого вектора п п х = естественно, по линейности условием Ах = fe=1 k=i Полученный оператор называется диагональным относитель- но базиса е1г .. ., еп или диагонализируемым оператором. Матрица диагонального относительно базиса elt . . ., еп оператора в этом же самом базисе ег, е2, ..., еп имеет вид 0 ... О О Х2 ... О о v .‘.л; Элементы, отличные от нуля, могут находиться в этой матрице только на главной диагонали. Такая матрица назы- вается диагональной-, отсюда и название оператора. Заме- тим, что в другом базисе /х, .. ., fn матрица оператора, диагонального относительно базиса ег, .. ., еп, уже не бу- дет, вообще говоря, диагональной. 4.73а. Линейные операторы, действующие в простран- стве X, можно по общим правилам 4.31 — 4.32 складывать друг с другом и умножать на числа, причем снова получа- ются линейные операторы, действующие в X. Равенства (7) и (7') показывают, что при введенных там операциях сложения и умножения на числа совокупность всех линейных операторов, действующих в пространстве X, сама становится линейным пространством над тем же полем К. Кроме того, для операторов, действующих в простран-
122 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.73 стве X, всегда определена и операция умножения 4.33, в результате которой также получается оператор, действую- щий в пространстве X. В частности, если В — любой опе- ратор, то (BE) х = В (Ex) = Вх = Е (Вх), так что ВЕ=ЕВ = В. Определим степени данного оператора А по правилам А1 = А, А2 = АА, А3 = А2А = (АА) А = А (АА) = АА2, Ап = АЙ-1А = ААЛ-1. При этом имеет место формула А'”+” = А'ЯА” (да, л =1,2, ...), (19) которую легко доказать по индукции. Еще положим по определению А°=Е (тождественный оператор). Очевидно формула (19) остается справедливой и в том слу- чае, когда один из показателей обращается в нуль. б. Пусть пространство X конечномерно, Х = К„. Фикси- руем в пространстве X произвольно базис е1, . . ., еп. Тогда каждому линейному оператору А, действующему в простран- стве X, можно поставить в соответствие матрицу оператора А в этом базисе. В соответствии с правилами 4.41—4.43 вместе с операторами складываются, умножаются и возво- дятся в степени и соответствующие им матрицы. В этом случае легко можно найти размерность линейного простран- ства всех матриц л-го порядка. Именно, матрицы Ejk, имею- щие один-единственный элемент, отличный от нуля, для определенности 1, на пересечении j-й строки и k-ro столб- ца, очевидно, линейно независимы; с другой стороны, каждая матрица л-го порядка есть линейная комбинация указанных матриц Е}-к. Таким образом, матрицы Е}к образуют базис в пространстве всех матриц л-го порядка. Поскольку число
4.74] § 4.7. операторы, переводящие пространство в себя 123 матриц Ejk равно л2, это число л2 и есть размерность про- странства всех матриц л-го порядка (2.35). Ту же размерность л2 имеет, очевидно, и пространство всех линейных операторов, действующих в пространстве К„. 4.74. Примеры. а. Умножение на комплексное число co = a + i0 есть ли- нейное преобразование на плоскости z = х 4- 1у, которое можно записать с помощью вещественной матрицы 2-го порядка. Из формулы умножения («4-/0) (x-}-iy)=(ax—0y)-H (0х-]-ау) следует, что в базисе 1, i соответствующая матрица имеет вид a 0 со = -0 a Таким образом, комплексным числам ® = a-]-t0 взаимно од- нозначно ставятся в соответствие вещественные матрицы со 2-го порядка; нетрудно видеть, что при этом сумме и про- изведению чисел отвечают сумма и произведение соответст- вующих матриц. Говорят, что вещественные матрицы ® об- разуют точное представление поля комплексных чисел. б. Обозначим через Bft (k 0) оператор «сдвига на k шагов по индексу»; по определению, он переводит каждый базисный вектор ет в базисный вектор em_k, если т—k > О, и в 0, если т — Очевидно, В0 = Е, Bk-Br—Bk+r; в частности, Bj=BA. Матрица оператора Вх имеет вид О 1 0 ... О 001 ... О О 0 0"... 1 ООО ... о Матрица оператора ВА имеет вид (k < л) О ... 1 о ... о О ... О 1 ... о *+1 О ... 00 ... 1 О ... 00 ... о
124 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА (4.75 4.7S. Определитель произведения двух мат. риц. Пусть А = || а/к ||, В —||/>yft||—две произвольные пхп- матрицы, С = АВ—их произведение. В силу теоремы 4.54, примененной к минору J4J ••••" (АВ), т. е. к самому опреде- лителю матрицы АВ, мы получим det АВ = det А • det В. Таким образом, справедлива теорема: Теорема. Определитель произведения двух пуп-матриц равен произведению определителей этих матриц. Существуют и прямые (т. е. не опирающиеся на предложения типа 4.54) доказательства этой теоремы. Вот одно из них. Рассмотрим определитель порядка 2п Ьи ... Ь1п — 1 0 ... О В21 .. * Ь2п 0 —1 ... О Ьщ ... ьпп 6 О ... —1 О ... О ац а12 ... а1п О ... О о21 а22 ... а2п О ... О а,Л ап2 ... апп В силу 1.82 определитель D матриц ап ... а1п равен произведению определителей ••• Ь1п и агЛ • • • апп Ьщ ьпп Но можно и другим путем получить величину определителя D. Используя числа —1, стоящие в первых п строках и в последних п столбцах определителя D, можно обратить в нуль все элементы, ле- жащие в последних п строках и в последних п столбцах определителя £>. Для этого нужно к (п-|-1)-й строке определителя D прибавить первую, умноженную на аи; затем вторую, умноженную на а12; ... ...; n-ю, умноженную на ain, далее к (п4-2)-й строке прибавить пер- вую, умноженную на а21, вторую, умноженную на а22; ...; 2п-ю, умноженную на а2п и т. д., пока не дойдем до последней, 2п-й, строки. В результате мы получим Ьц &21 ••• Ь1п • •• ь2п —1 о ... о 0—1 ... о bni * • * 5пп 5ца11+Ь21а12+ ... +bnialn ... Ь1па±1+ ^11а21+^21а22 + • • • +Ьп1а2п ... &1пО21 + О 0 ...—1 +Ьппа1п 0 0 ... О , +Ьппа2п 0 0 ... О 5цап1+'^г1апг+ • • + Ьц1апп ... binan^+ ., ,+Ьппапп 0 0 ... О
4.76] § 4.7. ОПЕРАТОРЫ, ПЕРЕВОДЯЩИЕ ПРОСТРАНСТВО В СЕБЯ 125 откуда по теореме Лапласа 1.81, разлагая определитель D по пос- ледним п строкам, мы будем иметь ©=(-1)* + ... + Л -1 0... О 0 -1 ... о ‘d o.'..’-i ^llall+- • + ^п1а1п ••• ^1пе>11 + --'+^ппа1п ^11а21+" • •+^Л1а2Л ••• ^1Па21+••+^ПП^2П &цаП1+ • • •+^тапп binanl+... + Ьппапп] ацЬц + • • • + а1п&л1 • • • аП^1п + • • • + а1л^лл а216ц + ••• + а2П^П1 ••• а21^1л4" • • • ~Ьа2П^ПП ап1&11 + • • • +Олл^п1 ••• а щЬщ + ••• + Одл^лл = det(H, В). Сравнивая этот результат с полученным выше значением опре* делителя D, убеждаемся в справедливости теоремы. В частности, отметим, что если обе перемножаемые мат- рицы А и В невырождены (т. е. det А 0, det В 0), то и матрица АВ невырождена; если хотя бы одна из матриц, например А, вырождена, det4 = 0, то и det АВ = 0. Впро- чем, это утверждение можно вывести и из 4.67. 4.76. Обратный оператор. В соответствии с опре- делением 4.68 оператор В, действующий в пространстве X, называется левым обратным к оператору А, действующему в том.же пространстве X, если ВА = Е. Оператор А в этом случае называется правым обратным к В. а. Возможно, что оператор А имеет много левых обрат- ных и ни одного правого, или наоборот, много правых об- ратных и ни одного левого (см. задачу 25). Допустим, что оператор А обладает левым обратным Р и правым обратным Q; тогда справедливо равенство Р —РЕ = Р (AQ) = (PA)Q = EQ = Q. (20) Фиксируем Q; мы видим, что любой левый обратный оператор Р совпадает с Q и тем самым определен единствен- ным образом. Точно так же в рассматриваемом случае пра- вый обратный Q также определен единственным образом. Этот оператор P = Q, определенный единственным образом и одновременно и правый, и левый обратный к оператору А, называется обратным оператором к оператору А и обозна-
126 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.77 чается через А-1. Сам оператор А, обладающий обратным, называется обратимым оператором. б. Рассмотрим случай оператора А в л-мерном прост- ранстве Х = К„. Пусть А—матрица оператора А в некото- ром фиксированном базисе еп. Возможно одно из двух: или det А 5^=0, или detA = O. В первом случае ранг матрицы А равен л и по 4.696 матрица А обладает и левой обратной матрицей, и правой обратной матрицей. Соответ- ственно и оператор А обладает и левым обратным, и правым обратным. По а оператор А является обратимым оператором. Если же det А = 0, то по тому же 4.696 матрица А не имеет ни левой, ни правой обратной; так же и соответст- вующий оператор А, действующий в пространстве К„, не имеет ни левого, ни правого обратного. 4.77. Матрица обратного оператора. Пусть А — обратимый оператор в л-мерном пространстве X и В = А-1 — его обратный оператор. Выберем базис elt . . ., еп и обозначим через и матрицы операторов А и В в этом базисе. Найдем явное выражение элементов b^i через элементы а1^. Фиксируя номер строки /, последовательно выписываем выражения элементов i-й строки матрицы Е — АВ по фор- мулам (8); b^a^ + b^a(l'>+ ... +М7’а^ = 0, + b<fa^ + ’. ’ + ЬЧ'аУ = h b^a^ + b<?a™ + Ь1?а™ = 0*. Неизвестные 6(1’, ... , b™ определяются из этой системы уравнений по правилу Крамера 1.73, так как по условию det А=}^0. Разлагая определитель в числителе по у-му столбцу, получаем где А(р — алгебраическое дополнение элемента а(р в мат- рице А. Итак, элемент Ь(Р обратной матрицы равен отно- шению алгебраического дополнения элемента а'р исходной матрицы к ее определителю.
4.82] § 4.8. ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 127 Мы получаем теорему: Теорема. Для всякой невырожденной матрицы А == существует и единственна обратная матрица В= ||М{’||, для которой АВ = ВА = Е. Элементы матрицы В вычисляются по формулам (21). 4.78. Оператор, обратный к оператору А, мы обозначили через А-1. Далее, (А-1)* обозначается через А-*. Легко доказать по индукции, что формула (19) распространяется также и на все отрицательные показатели. Аналогичные обозначения применяются для степеней об- ратной матрицы. Распространение формулы (19) на отрицатель- ные показатели для матриц вытекает непосредственно из справедливости этого распространения для операторов. § 4.8. Инвариантные подпространства 4.81. Пусть в линейном пространстве К задан линейный оператор А. Введем следующее определение. Подпрост- ранство К' пространства К называется инвариантным отно- сительно оператора А, если из х£К' следует Ах£К'. В частности, тривиальные подпространства — нулевое и все пространство — являются инвариантными для всякого ли- нейного оператора; нас будут интересовать, естественно, нетривиальные инвариантные подпространства. 4.82. Рассмотрим с этой точки зрения примеры линей- ных операторов, указанные в 4.72. а — в. Для операторов в примерах 4.72а—в (нулевой оператор, тождественный оператор и оператор подобия) каж- дое подпространство является инвариантным. г. Оператор поворота (4.72г) на угол <рп^=/пл, m це- лое — не имеет нетривиальных инвариантных подпространств. д. Оператор проектирования (4.72д) имеет, например, следующие инвариантные подпространства: подпространство m К' из векторов х— 2 которые не изменяются, и *=i
128 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.83 п подпространство К" из векторов у = 2 которые k=m+ 1 переходят в нуль. е. Каждое подпространство, порожденное некоторыми из базисных векторов elt е2, ... , еп, является инвариантным для диагонального оператора (4.72е). 4.83. Пусть оператор А имеет в л-мерном пространстве Кп инвариантное m-мернре подпространство Кт. Выберем ба- зис е1, ... , еп пространства Кп так, чтобы его первые т векторов elt ... , ет лежали в подпространстве Кт. Тогда мы будем иметь Аех =а(}’е14- ... = ai^e1 ++ а^ет, и, следовательно, матрица оператора А в указанном базисе будет иметь вид да> д<1> п (» д<1> и 1 • • • ит ит+1 • • • и п а<7> О п(т) п(т> и т ит+1 л д(т+1) и а т+1 „<т) U п п(т+1) ип О ... О ... а<"> В первых т столбцах матрицы все элементы (лг-}-1)-й и следующих строк равны 0. Обратно, если матрица оператора А имеет такой вид, то подпространство, определяемое век- торами ег, ... , ет, является инвариантным для оператора А. 4.84. Предположим, что пространство Кп можно пред- ставить в виде прямой суммы инвариантных подпространств Е, F, ... , Н (2.45). Выберем базис пространства К„ так, чтобы векторы ех, . .. , ег лежали в Е, А, • • • , fs » » F, Лх, . . . , » » Н.
4-91] § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 129 Тогда матрица оператора А примет квазидиагональный вид Диагональные квадраты матрицы А заполняются элементами • • • , С<Г в соответствии с формулами Ае -= 2 а^ек, к=л *=1 ай7.= 2 *=1 вне диагональных квадратов в матрице А всюду стоят нули. Обратно, если матрица оператора А в некотором базисе имеет квазидиагональную структуру, то пространство К„ разлагается в прямую сумму подпространств, порожденных соответствующими группами базисных элементов. § 4.9. Собственные векторы и собственные значения 4.91. Особую роль играют одномерные инвариантные под- пространства оператора А; они называются иначе инвариант- ными, или собственными, направлениями. Всякий (ненулевой) вектор, принадлежащий к одномерному инвариантному на- правлению оператора А, называется собственным вектором оператора А; иначе говоря, вектор х=/=0 называется собствен- ным вектором оператора А, если оператор А переводит век- тор х в коллинеарный ему вектор: Ах = Ах. (22)
130 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.92 Число X, фигурирующее в этом равенстве, называется собст- венным значением (собственным числом) оператора А, соот- ветствующим собственному вектору х. 4.92. Обратимся опять к примерам 4.72. а — в. В примерах 4.72а — в каждый ненулевой вектор пространства есть собственный вектор соответствующего оператора с собственными значениями соответственно 0, 1, X. г. Оператор поворота (4.72г) на угол, не равный дал с целым да, не имеет собственных векторов. д. Оператор проектирования (4.72д) имеет собственные m п векторы вида х— 2 %kek и У= S с собственными k=1 k = m +1 значениями соответственно 1 и 0. Можно проверить, что иных собственных векторов у оператора проектирования нет. е. Диагональный оператор (4.72е) по самому определению имеет собственные векторы ег, е2, . . . , еп с собственными значениями соответственно Хр Х2, . . . , Х„. 4.93. Укажем два простых свойства собственных век- торов. а. Лемма. Собственные векторы х±, х2, ... , х,п опе- ратора А с попарно различными собственными значениями Хр Х2, . . . , Х,л линейно независимы. Это утверждение мы докажем индукцией по числу да. Очевидно, что для да=1 лемма верна. Допустим, что лем- ма верна для всяких да—1 собственных векторов оператора А; покажем, что она продолжает оставаться верной и для всяких да собственных векторов оператора А. Предполагая противное, допустим, что между да собственными векторами оператора А имеется линейная зависимость aiXj + а2х2 + . .. + a.mxm = 0, где, например, сс1^О. Применяя к этому равенству опера- тор А, получаем а1Х1х1 + а2Х2х2 + . .. + с<иХихм = 0. Умножим первое равенство на Хт и вычтем из второго; мы получим а1 (^-1 Х1 а2 (^2 ^/я) Х2 Т • • • • + am-l (^m-1 л'га-1 = ®>
4.94] § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 131 откуда по индуктивному предположению все коэффициенты должны быть равны нулю. В частности, ах (Хх— Хи) = 0, что противоречит условиям 04=^0, Хх =£кт. Следовательно, наше предположение неверно и векторы xlt х2, ... , хт линейно независимы. В частности, в п-мерном пространстве линейный опе- ратор А не может иметь более п собственных векторов с различными собственными значениями. б. Лемма. Все собственные векторы линейного операто- ра А, отвечающие данному собственному значению X, образу- ют подпространство К<х,с:К. В самом деле, если Ах1 = Хх1 и Ах2 = Хх2, то А (ахх + Р%2) = аАхх + р Ах2 = аХх1 + pXjc2 = X (ахх + Рх2), чем утверждение леммы доказано. Подпространство К(Х) называется собственным подпрост- ранством оператора А, отвечающим собственному значению X. 4.94. Мы укажем здесь, как можно вычислить координаты собственных векторов оператора А, заданного своей матрицей в некотором базисе е1г ..., еп пространства К„. Допустим, п что вектор х = 2 ^kek есть собственный вектор оператора А, л=1 так что Ах = Хх с некоторым X. Используя формулы 4.23 (5), мы можем это равенство переписать в координатной форме: Х^-а'^ + Л+.-.+Л, Kl^a^ + a^+...+а^, Х^ = <£1 + ^2>52 + • .-+Л, («<1>-X)g1+ а^2 ++ =0,4 +(<42,-ХН2+---+ 4Х =0, I (23) a^U + а™Ц 4-...+(4'”-X)g„ = 0. J Эта однородная система уравнений относительно величин |х, £2, ...,£„ допускает ненулевое решение в том и только
132 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4.95 в том случае, когда ее определитель равен нулю (3.21): Д(*) = а'1’ —X а'2) ... а™ а'1’ й‘2> — X ... а<п> ' ‘ ' а™ а™'-Л (24) Многочлен л-й степени относительно X, стоящий в левой части этого уравнения, называется характеристическим мно- гочленом матрицы А. Всякому его корню Хо С К отвечает собственный вектор, который определяется после подста- новки в (23) вместо X величины Хо путем решения получив- шейся совместной системы относительно величин |1; |2, . . ., Полученный результат показывает, между прочим, что хотя матрица оператора А зависит от выбора базиса е1, . . ., еп, но корни характеристического многочлена этой матрицы уже не зависят от выбора базиса. Мы еще вернемся к этому вопросу в 5.53. 4.95. Разберем некоторые возможности, которые могут представиться при решении характеристического уравне- ния (24). а. Случай отсутствия корней в поле К. Если уравнение A(X) в поле К вовсе не имеет корней, то линей- ный оператор А не имеет в пространстве К„ собственных векторов. Например, оператор поворота на угол <р0 тл (т = 0, + 1, ±2, ...) на плоскости V2, как мы уже отметили, не имеет собственных векторов. Этот факт, геометрически очевидный, легко устанавливается алгебраически. В самом деле, уравнение (24) для оператора поворота имеет вид cos ф0 — X —sin ф0 I q sin фо cos фо — X | — или после раскрытия определителя 1 — 2Х cos фо + X2 = О, и если фо =/= пт (т — 0, ±1, ±2, ...), то это уравнение не имеет вещественных корней. б. Если К=С есть поле комплексных чисел, то в силу основной теоремы алгебры уравнение (24) всегда имеет корень
4.95] § 4.9. СОБСТВЕННЫЕ ВЕКТОРЫ и собственные значения 133 Д € К. Таким образом, в пространстве Сп всякий линейный оператор имеет (хотя бы один) собственный вектор. в. Случай наличия п различных корней. Если все п корней Д, Д, ...,%„ уравнения Д(Д = 0 лежат в поле К и различны, то мы сможем в пространстве К„ найти п различных собственных векторов оператора А, решая систему (23) последовательно при Х = Д, Д, . . ., Д. В силу леммы 4.93а собственные векторы Д, Д, ..., fn будут линейно независимы. Примем их за новый базис и построим матрицу оператора А в этом новом базисе. Поскольку АД = ДД, АД= матрица А(^ имеет вид 0 ... О о о ... д Используя определение диагонализируемого оператора (4.72е), мы можем сформулировать полученный результат следующим образом: в пространстве К„ всякий линейный оператор, характеристический многочлен матрицы которого (в каком-либо базисе) имеет п различных корней в поле К, является диагонализируемым-, матрица этого оператора, по- строенная в базисе из его собственных векторов, диагональна, и ее диагональные элементы суть собственные значения опе- ратора. г. С другой стороны, если оператор А в некотором ба- зисе Д, . .., fn пространства К„ имеет диагональную мат- рицу (25) с произвольными, необязательно различными числами Д, . .., Д на диагонали, то векторы Д, ...,fn—собствен- ные, а числа Д, ..., Д— соответствующие собственные значения. Покажем, что у оператора А в этом случае нет иных собственных значений (отличных от чисел Д, . . ., Х„). Дей- ствительно, если 2.— собственное значение, отвечающее
134 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА [4-95 п собственному вектору /= 2 Р///> т0, выделяя в равенстве /=1 А/= А (2 = 2 ш = 2 Р/М/ = = V=x2P///=2W/ слагаемое по вектору /•, мы получаем ?Ф/=М/ (/=1, л). (26) Среди чисел Рх, |3П есть хотя бы одно отличное от нуля; пусть, например, ^=/=0. Тогда равенство (26) при /= 1 дает Х = ХЪ что и требуется. д. Случай кратного корня. Пусть Х = Х0 — неко- торый корень уравнения (24) кратности г^1. Возникает следующий вопрос: какова размерность соответствующего собственного подпространства К(Х°’, или, иными словами, сколько линейно независимых решений допускает система (23) при 2. =--2.0? Зная ранг матрицы системы, мы бы могли точно ответить на этот вопрос (3.51). Но мы желаем свя- зать этот ответ только с кратностью г корня Хо. В примерах 4.72а—в и е, как легко убедиться, размер- ность каждого собственного подпространства К(Х°’ совпадает с кратностью соответствующего собственного значения Хо как корня характеристического многочлена оператора А. Однако в общем случае это не так. Рассмотрим оператор А в Р2, заданный матрицей А = К 0 || И A-oll с произвольным |Д=/=0. Характеристический многочлен имеет вид (Ао— Z)2; он имеет двойной корень % — К0. Система (23) в данном случае принимает вид 0-^ + 0.|2 = 0, н- ^+0.^=0 и имеет единственное (с точностью до числового множителя) решение 11 = 0, £3=1.
ЗАДАЧИ 135 Таким образом, собственное подпространство оператора А, соответствующее собственному значению Х = Х0, имеет раз- мерность 1, меньшую, чем кратность корня Хо. Можно доказать, что в общем случае размерность собственного подпространства К(Х<)) не превышает кратности корня Хо (см. задачу 11 к гл. 5). Полный ответ на вопрос о размер- ности пространства КХ для случая К=С мы дадим в гл. 6 в результате определения канонической формы матрицы оператора А. ЗАДАЧИ 1. Определив естественным образом сложение линейных форм и умножение линейной формы на вещественное число, построить из линейных форм, определенных на линейном пространстве К, новое линейное пространство К*. Какова размерность пространства К*, если размерность пространства К равна п? 2. Выяснить, какие из следующих векторных функций в про- странстве У3 являются линейными операторами: а) А.х = х-\-а (а—-фиксированный ненулевой вектор); б) Ах = а; в) Ах = (а, х) а *); г) Ах = (а, х)х*); д) Ах = (^, g2 + U gf), где х = &, Ъ, g8); е) Ax = (sing!, cos g2- 0); ж) Ax = (2gj—£2, + £1)- 3. Будут ли линейными операторами в пространстве всех много- членов от t а) умножение на t, б) умножение на /2, в) дифференцирование? 4. Составить матрицу оператора А в К3, переводящего векторы х1 = (0, 0, 1) в ^ = (2, 3, 5), х2 = (0, 1, 1) в г/2 = (1, °- °)- х3 = (1, 1, 1) в </3 = (0, 1, —1) в базисе а) е1=(1, 0, 0), е2 = (0, 1, 0), е3 = (0, 0, 1); б) хх, х2, х3. 5. В трехмерном пространстве обозначим через А оператор пово- рота на 90° вокруг оси ОХ (от ОУ к OZ), через В—оператор пово- рота на 90° вокруг оси ОУ (от OZ к ОХ), через С—на 90° вокруг *) Здесь (а, х) означает обычные скалярные произведения векто- ров а и х, т. е. число, равное произведению их длин и косинуса угла между ними.
136 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА оси 0Z (от ОХ к 0Y). Показать, что А4 = В4=С4 = Е, АВ 7= ВА, А2В2 = В2А2. Имеет ли место равенство АВАВ = А2В2? 6. В пространстве всех многочленов от t обозначим через А оператор дифференцирования, а через В—оператор умножения на независимое переменное: АР (/) = ?'(/), BP(f) = <P(0- Имеет ли место равенство АВ = ВА? Найти оператор АВ—ВА. 7. В предположении, что АВ = ВА, доказать формулы (Аф-В)2 = А2 + 2АВ + В2, (А + В)3 = А3 + ЗА2В + ЗАВ2 + В3. Как следует изменить эти формулы, когда АВ ВА? 8. В предположении, что АВ—ВА = Е, доказать формулу AmB — BAm = rnAm-1 (m=l, 2, ...). 9. Найти размерность линейного пространства L(K„, К,я) всех линейных операторов, действующих из n-мерного пространства Кп в m-мерное пространство Кот, и построить базис пространства L(Kn, Km). 10. Найти произведение матрицы А на матрицу В: 2 3 4 6 6 9 А = —2 —4 —2 —4 2 4 11. Выполнить действие возведения в n-ю степень матриц 1 1. 0 1 COS ф —sin ф sin ф COS ф и В = 12. Найти все матрицы А 2-го порядка, удовлетворяющие условию 13. Вычислить АВ—В А, где а) б) 4 1 1 —4 2 0, 1 2 1 3 1 2 3—2 4 -3 5 -1 14. Сумма диагональных элементов аи А~ А~ впп матрицы A = ||ayft|| называется следом матрицы А и обозначается sp А. Прове- рить формулы sp (A-|~B) = sp А-ф sp В, sp (AB) = sp (ВА). 15. Используя задачу 14, доказать, что для операторов А и В, действующих в пространстве Кн, равенство АВ—ВА = Е невозможно.
ЗАДАЧИ 137 Примечание. Результат задачи 6 показывает, что в рассмат- риваемом случае предположение о конечномерности пространства Кп существенно. 16. Для данной квадратной матрицы С 2-го порядка с spC = O (см. задачу 14) найти представление в форме С = Дб — ВА, где А и В — (неизвестные) матрицы 2-го порядка. 17. Пусть в n-мерном пространстве даны т линейно независимых векторов п х/= 2 &1>е‘ ^=1,2> •••’ 1=1 и оператор А действует в линейной оболочке L (xlt ..., хт) по фор* мулам У; = Axj = J] а^хк (/=1,2, ..., и). fe=l Показать, что каждый минор m-го порядка в матрице из координат векторов у}- (относительно базиса е1( е2, .еп) равен произведению соответствующего минора в матрице из координат векторов х< на dethV’ll- 18. Доказать, что если в матрице А ранга г базисный минор расположен в левом верхнем углу, то отношение любого минора М r-го порядка к минору, находящемуся в тех же столбцах, что и ми- нор М, но в первых г строках, зависит только от номеров столбцов минора М. 19. Доказать, что если А—матрица ранга г, то любой определи- тель 2-го порядка, составленный из миноров r-го порядка матрицы А( вида ... kT Mkt, .......kr *1’ 12 > • • » ► 1 ’ *** 2» • • • 9 равен нулю. 20. Доказать, что каждый минор Л-го порядка матрицы АВС равен сумме произведений некоторых миноров fe-ro порядка матриц А, В и С. 21. Для матриц А = С = < 2 5 V2 V2 v2 V2 ta" ta" ta" to1 1 1 1 2 —3 0 1 2 0 0 1 v2 v2 -’/2 -v2 v2 -v2 -1/? найти обратные матрицы,
138 ГЛ. 4. ЛИНЕЙНЫЕ ФУНКЦИИ ВЕКТОРНОГО АРГУМЕНТА 22. Для любой невырожденнной матрицы А доказать равенство 23. Найти все решения уравнения ХА = 0, где А — данная ма- трица 2-го порядка, X — искомая матрица 2-го порядка, 0 — нулевая матрица (матрица, все элементы которой равны нулю). 24. Пусть А = ||.а//)||—любая квадратная матрица n-го поряд- ка и Ар — алгебраическое дополнение элемента аР в определителе матрицы А. Матрица А = ||А/г) || называется присоединенной для мат- рицы А. Показать, что АА = AA = (det А)-Е. 25. Пусть Р — линейное пространство всех многочленов от аргу- мента t. Рассмотрим операторы А и В, определенные условиями A [a04-aj/4- ... + antn} = aj + a.,t -f-... В [a0 + art + ... + aHtn] = + аД2 antn + 4 Показать, что А и В — линейные операторы и что АВ = Е, ВА # Е. Обладает ли оператор А обратным? 26. Показать, что оператор В в задаче 25 имеет бесконечное число левых обратных. 27. Если А—невырожденный линейный оператор в гг-мерном линейном пространстве, то всякое подпространство, инвариантное от- носительно А, будет инвариантным и относительно А-1. 28. Если линейные операторы А и В перестановочны (т. е. АВ = В А), то всякое собственное подпространство оператора В является инвариантным подпространством для оператора А. 29. Если прямая сумма (2.45) собственных подпространств опера- тора А совпадает со всем пространством К и каждое собственное подпространство оператора А является инвариантным для оператора В, то А и В перестановочны. 30. Если х и у—собственные векторы оператора Ас различ- ными собственными значениями, то ax + p«/(a # О, Р # 0) заведомо не является собственным вектором оператора А. 31. Если каждый вектор пространства К является собственным вектором для оператора А, то А = ХЕ (Х^К). 32. Если линейный оператор А перестановочен со всеми линей- ными операторами, Действующими в данном пространстве, то А = ХЕ. 33. Если линейный оператор А имеет собственный вектор е0 с собственным значением Хс, то для оператора А2 вектор е0 также является собственным с собственным значением, равным Хо. 34. Если линейный оператор А не имеет собственных векторов, то оператор А2 может их иметь (пример: оператор поворота на 90° в плоскости). Показать, что если оператор А2 в пространстве R„ имеет собственный вектор с неотрицательным собственным зна- чением Х = р2, то оператор А также имеет собственный вектор.
ЗАДАЧИ 139 35. Найти собственные значения и собственные векторы операто- ров, заданных следующими матрицами: 2 —1 — 1 —1 —2 2 а) 0 —1 0 ; б) 0 1 0 > 0 2 1 0 0 1 0 0 1 - -1 2 —1 0 1 Л 1 1 в) 0 1 —1 ; г) — 1 0 V 1 — 0 0 — 1 0 0 1 3 0 0 0 1 36. Проверить выполнение следующих фактов: а) соотношение N (A) Z) Т (А) необходимо и достаточно для того,, чтобы имело место равенство А2 = 0; б) для любого оператора А имеем N (А) с N (А2) с N (А3) с ...; в) для любого оператора А имеем Т (А) О Т (A2) Z5 Т (A3) ZJ...; г) если Т (Aft) с N (Ат), то T(A)cN (Аи+-1), Т (А'в+Л-т) с N (А). 37. Показать, что каждый линейный оператор А ранга г может быть представлен в виде суммы г линейных операторов ранга 1. 38. Найти все инвариантные подпространства диагонального оператора с различными диагональными элементами и доказать, что их число равно 2П.
ГЛАВА 5 ПРЕОБРАЗОВАНИЯ КООРДИНАТ Известно, какую большую роль при решении геометрических за- дач средствами аналитической геометрии играет правильный выбор системы координат. В значительно более обширном круге вопросов, которые открываются в связи с геометрией /г-мерного линейного пространства, роль правильного выбора системы координат будет также весьма велика. Эта глава посвящена правилам, по которым совершается преобразование координат в /i-мерном линейном прост- ранстве. Результаты, полученные здесь, послужат, в частности, осно- вой для классификации квадратичных форм, которая будет проведена в седьмой главе. §5.1. Формулы перехода к новому базису 5.11. Пусть { е } = { elt е2, еп} — некоторый базис в л-мерном пространстве К„ и {/} = {Д, /2, — неко- торый другой базис в том же пространстве. Векторы системы {/} однозначно определяются своими разложениями по век- торам исходного базиса: Л = />1% + Р^е2 + ... + р^еп, + • • +р1?е„, /п=Р(1)е1 + р^е.г+ ••• +№„ или, короче, п (/=!> 2. •••> «)• (2) i = 1 В формулах (1) или (2) коэффициенты />Ф (Л J— Ъ 2> • • •> п) определяют матрицу рТ РТ • • • Р(пгу rt' № • • рТ Р'п Р'п • . Р'п
5.13] § 5.1. ФОРМУЛЫ ПЕРЕХОДА К НОВОМУ БАЗИСУ 141 которая называется матрицей перехода от базиса {е} к базису {/}. Как и ранее в аналогичных случаях (§ 4.2 и далее), мы выписываем координаты векторов Д (относительно базиса { е}) в столбцах матрицы Р. Определитель D матрицы Р отличен от нуля; дей- ствительно, в противном случае ее столбцы, а с ними и векторы Д, Д, • • •, fn были бы линейно зависимыми (3.12а). Матрицу с определителем, отличным от нуля, мы уже на- звали ранее невырожденной. Таким образом, переход от од- ного базиса п-мерного пространства К„ к другому базису всегда осуществляется с помощью некоторой невырожденной матрицы. Формулы (1) вместе с матрицей Р задают и соответст- вующий линейный оператор Р, определяемый из соотноше- ний Д = Ре((г=1, 2, ..., л). Он также называется опера- тором перехода от базиса {е} к базису {/}. 5.12. Обратно, пусть (е} = {е1, е2, ..., еп} — заданный базис л-мерного пространства К„ и = — невырожден- ная матрица порядка л. Построим по формулам (1) систему векторов Д, Д, ..., Д. Очевидно, что эти векторы линейно независимы, поскольку столбцы всякой невырожденной мат- рицы линейно независимы (3.12а). Следовательно, векторы Д, Д, ...,fn образуют новый базис пространства К„. Итак, всякая невырожденная матрица = определяет по фор- мулам (1) переход от одного базиса п-мерного пространства К„ к другому базису. 5.13. Отметим один частный случай перехода к новому базису: именно, тот, когда каждый из векторов Д совпа- дает с соответствующим вектором ek, умноженным на неко- торое число (А=1, 2, ..., л). Формулы (1) прини- мают вид А = Mi, Д = fn = Mn,
142 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.21 и матрица Р имеет диагональную форму В частности, при = Х2 — ... = = 1 получаем матрицу тождественного преобразования — единичную матрицу 1 1 Е = (3) 1 при тождественном преобразовании исходный базис не изме- няется. § 5.2. Последовательные преобразования 5.21. Пусть /3 = ||р</’|| — матрица перехода от базиса {р} = {е1, е2, е„} к базису = /2, и Q = — матрица перехода от базиса {/} к базису {g-} = = g2, ... , gn\. Определим матрицу перехода от базиса {е} непосредственно к базису {£•}. Формула перехода от базиса {е} к базису {/} имеет вид (2) Л=2//Ч (/=1. 2, /2) (4) и от базиса {/} к базису {^} соответственно ^=2)^/7/ (*=1, 2, ...,«). (5) Подставляя (4) в (5), получаем gk = 2 2 p^ei = 2 ( S рУ i = 1 1=1 i = 1 \/ = 1 / (A=l, 2, ..., n).
5.31] § 5.3. ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 143 С другой стороны, если 7’ = ||^/)|| означает искомую матрицу перехода от базиса {е} к базису {g], то мы можем написать п ^=2^4- (*=1.2.....л). (7) Z = 1 Сравнивая (6) и (7), мы получаем (Z, k=\, 2, ..., л). (8) /=1 Полученная формула (8) только обозначениями индексов (но не их ролью) отличается от формулы 4.43 (8). Следо- вательно, искомая матрица Т есть произведение матрицы Р на матрицу Q. 5.22. Рассмотрим следующий частный случай последо- вательных преобразований. Систему уравнений (1), поскольку матрица Р не вырождена, можно разрешить относительно векторов е1г ..., еп; получающаяся при этом система равенств вида е2 = ^2А + ?<22,А+---+СЛ, I е„=?ГЛ+9ГА+...+^п,Л ) определяет, очевидно, переход от базиса {/} к базису {е}. Последовательный переход от базиса {е} к базису {/} с по- мощью матрицы Р и затем от базиса {/} к базису {е} с помо- щью матрицы Q= ||^7)|1 есть переход от базиса {е} к нему же самому, т. е. в конечном счете тождественное преобра- зование с единичной матрицей; поэтому здесь PQ — E. § 5.3. Преобразование координат вектора при изменении базиса 5.31. Пусть {е} = {е1, е2, еп} и {/} = {Л> /г. • • •./„}— два базиса в л-мерном линейном пространстве К„. Для лю- бого вектора х £ К„ имеют место разложения Х = + ^2е2 + • • + ^пеп = Л1А + Л2/2 + • +Л«/л, (Ю)
144 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.31 где Jj2, —координаты вектора х относительно базиса {е} и т|г, т|2, т]л—его координаты относительно базиса {/}. Поставим задачу вычислить координаты век- тора х относительно базиса {/} по известным его коорди- натам относительно базиса {е}. Пусть нам дана матрица Р = [J перехода от базиса {е} к базису {/}. Тогда век- торы {е} выражаются через векторы {/} по формулам (9) или, короче, <7=2^4 (7=1, 2, ..., Л), (11) k=l где Q=||?V>|I — матрица, обратная к матрице Р. Подстав- ляя ф°РмУлы (11) в разложение (10), мы получаем п п Х= 2 = 2 ^4 = 7=1 fe=l п f п \ п / п \ = 2 2 МЛ Ь= 2 ( 2 Л, /=1 \а=1 j *=i \/=i j j откуда в силу единственности разложения вектора х по базису {/} п ^ = 2^'4/ (Л = 1, 2, ..., п). (12) В раскрытом виде получается система равенств 41 = ^1+^%+ • • +Л, пг=^1+Л+---+Л, Пп = 9л1)?1-Нп,£2+ • • Таким образом, координаты вектора х относительно ба- зиса {/} линейно выражаются через координаты вектора х относительно базиса {е}; коэффициенты этих линейных выра- жений образуют матрицу, транспонированную по отношению к матрице перехода от базиса {/} к базису {е} (т. е. транс- понированную по отношению к матрице, обратной к мат- рице Р). Используя обозначение обратной матрицы Р-1 и транс- понированной Р', можно записать матрицу 5, определяемую соотношениями (12), формулой S=(P~1}'.
5.33] § 5.3. ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА 145 5.32. Имеет место и обратная теорема: Пусть £г, •••, — координаты произвольного век- тора х относительно базиса {е} = {е^ с2, . . ., еп} п-мерного пространства К„ и величины, т]г, т]2, . . ., т]п определены посредством, равенств "’ll = sn£i + + • • • Th = S21^1 + S22^2 + • • • + S2n%n’ Лп ~ + ^n2?2 + • • • + Sn&n, где det || Sjk || 0. Тогда в пространстве K„ можно найти новый базис {/} = {Д, /2, . . ., /„} таким образом, чтобы числа Т]1, т]2, .. ., т]„ стали координатами вектора х. отно- сительно базиса {/}. Доказательство. Введем матрицу 5 = || Sjk || и мат- рицу P—(S')~1, элементы которой обозначим через рр. С помощью матрицы Р построим новый базис по форму- лам (1). Утверждается, что этот базис и есть искомый. Действительно, составим формулы перехода (12) к коор- динатам вектора х относительно нового базиса. Как мы видели, эти формулы записываются с помощью матрицы (Р-1)'. В данном случае эта матрица совпадает с матрицей 5, так как (Р-V = ([(S')-1]~1)' = (S')' = S. Следовательно, величины т]1, т]2, .. ., т)„ и координаты век- тора х относительно базиса {/} — одни и те же для любого вектора х, что и требовалось. 5.33. Аналогично 5.21 можно построить матрицу после- довательного преобразования координат. Пусть £2, •••,£„ — координаты вектора х относительно базиса {е} и вели- чины т]х, т]3, ..., Т1п и тъ т2, . .., хп определены посредством равенств п ’l/=2/’A U= 1> 2, . . ., п), tk= Sад- 2’ • ••> /=|
146 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.33 соответственно с невырожденными матрицами Р=||ру.-|| и Q = |f^y||. Тогда можно выразить величины {т} непосредст- венно через величины {£} по формулам 4 = S S 4kjPjili= S thili (k=l, 2, . . ., n), где величины A = l, 2, . . ., л) образуют матрицу Ts равную произведению матрицы Q на матрицу Р. § 5.4. Преобразование коэффициентов линейной формы Пусть в пространстве К„ задана линейная форма L (х). Как мы видели в 4.13, когда в пространстве К„ выбран базис = е2, еп], значения формы L (х) можно вычислять по формуле L (х) = S k=\ где £й(&=1, 2, ..., п)— координаты вектора х относи- тельно базиса {е}, a Zft = Л (eft) (л=1, 2, ..., л). Коэффи- циенты lk, очевидно, зависят от выбора базиса {е}. Мы выведем здесь правило, по которому совершается преобра- зование коэффициентов линейной формы при переходе к но- вому базису. Допустим, что формулы //=2^4 (У=1, 2, ..., л) (13) определяют переход от базиса {е} к новому базису {/}. Найдем коэффициенты линейной формы L (х) в базисе {/}. Эти коэффициенты суть числа Z, = L(/y); вычисляя эти числа с помощью формулы (13), находим п п Таким образом, коэффициенты линейной формы преобра- зуются так же, как преобразуются базисные векторы.
5.51] § 5.5. ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА 147 § 5.5. Преобразование матрицы линейного оператора 5.51. Пусть дан линейный оператор А в «-мерном про- странстве К„. Обозначим через А(е} = || af,'> || матрицу опера- тора А относительно базиса {е} = {е1, е2, ..., и через = || а^р> || его матрицу относительно базиса {/} = = {/i, /2, •••> fn}- Предположим, далее, что формулы перехода от базиса {е} к базису {/} имеют вид Л=2р^/ (*=1, 2, ..., л). (14) /=1 Матрицу перехода ||р/А>[| обозначим через Р. Установим связь между матрицами А{е}, А{^ и Р. Матрица А(е} = || af || определяется из системы равенств п Ae^^a^ei (/=1, 2, .. ., л), (15) а матрица Аф — || с^"1’ || — из системы равенств п А/т=Ъ<*П (лг=1, 2, ..., л). й= 1 Заменим в последней формуле через векторы е}- по формулам рования j на г: векторы fk их выражениями (14), изменив индекс сумми- Теперь применим оператор А к обеим частям формулы (14) и используем выражение векторов Аау- из (15): Afm=а 2 р}т)д = 2 аГАй/= 2 рТ 2 «У'Ч-= /=1 /=1 /=1 i=i
148 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.52 Сравнивая коэффициенты при е,- в двух последних разложе- ниях, находим 2 /><*><” = 2 k=1 j=i или в матричной форме РАф = АмР. (16) Это и есть искомая связь между матрицами Ам, Л(/) и Р. Умножая обе части слева на матрицу Р~\ получаем выра- жение матрицы Alf): А(/} = Р^АМР. 5.52. Используя теорему о произведении определителей (4.75), получаем из (16) следующее соотношение: det Р det A(f} = det Л(е) det Р или, так как detP^O, det Л((?) = det Л(/). Итак, определитель матрицы оператора не зависит от выбора базиса в пространстве. Поэтому мы можем говорить об определителе оператора, подразумевая под ним определитель матрицы этого оператора в произвольном базисе. 5.53. Кроме определителя, существуют и другие функ- ции от элементов матрицы оператора, остающиеся неизмен- ными при переходе к новому базису. Чтобы построить та- кие функции, рассмотрим оператор А — ХЕ, где X — пара- метр, взятый из поля К. Матрицей этого оператора в базисе (е) является, очевидно, матрица А(е) — ХЕ, а в базисе {/}—• матрица Л^ — ХЕ. По доказанному, при любом X det (Л(й) — ХЕ) = det (Л(р—ХЕ). Справа и слева стоят многочлены л-й степени от X. Так как эти многочлены совпадают тождественно, то у них коэффициенты при любой степени X должны быть одинако- выми. Эти коэффициенты суть некоторые функции от эле- ментов матрицы оператора, которые, следовательно, оста- ются неизменными при изменении базиса. Выясним вид этих
Б.61) § 5.6. ТЕНЗОРЫ 149 функций. Определитель матрицы Ам — ХЕ имеет вид а^ — Х а™ ... а™ а^—Х ... а™ а™ ... а(пт—Х = (—1)” V + Д^"-1 + ... + Д„_А 4-д„. Коэффициент Д1 при л"-1, как легко вывести из опре- деления определителя, равен (со знаком (—I)"-1) сумме диагональных элементов а)1'1 + а(.р + • • + это число называется следом, оператора А. Коэффициент Д2 при Хп~г есть сумма всех диагональных миноров 2-го порядка*), взятая со знаком (—I)"-2; аналогично коэффициент ДЛ при Хп~к есть СуММа Всех диагональных миноров А-го порядка, взятая со знаком (—1)" —*. Наконец, коэффициент Д„ при Х°—свободный член — равен, очевидно, самому определителю оператора. Многочлен det (А(е)—ХЕ), который, как мы дока- зали, не зависит от выбора базиса в пространстве, назы- вается характеристическим, многочленом, оператора А. § 5.6* . Тензоры 5.61. Координаты вектора, коэффициенты линейной формы, элементы матрицы линейного оператора являются примерами геометрических величин, называемых тензорами. Прежде чем перейти к соответствующему определению, несколько рационализируем нашу систему обозначений. Векторы базиса л-мерного пространства К„ будем обо- значать, как и раньше, символами ех, е2, . . .^ еп (с индек- сами внизу). Координаты векторов х,у, ... будем обозначать соответ- ственно символами I1, £2, ..., т)1, т]2, ..., т]", ... (с индексами вверху). Коэффициенты линейной формы L (х) обозначим /1; /2, .. .,1п (с индексами внизу). Элементы матрицы линейного оператора обозначим через а'-; при этом верхний индекс обозначает номер строки, *) Минор ••• (Л называется диагональным, если = •••> «* = /*.
150 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ (5.61 нижний — номер столбца (в отличие от обозначений, принятых в 4.23). Целесообразность такого расположения индексов опреде- ляется следующим соглашением о суммировании: если имеется сумма п одночленных выражений, причем индекс суммирова- ния i встречается в общем члене суммы два раза — один раз наверху, другой раз внизу,— знак суммы мы будем опускать. Например, разложение вектора х по базису {ех, е2, . . ., после нашего соглашения приобретает вид х = (знак суммирования по i опущен, но подразумевается). Вы- ражение линейной формы f\x) через координаты вектора и коэффициенты формы принимает такой вид: f(x) = l$. Результат применения оператора А к базисному вектору ег- принимает следующий вид: Ае(- = a'^j (подразумевается суммирование по индексу /). Координаты т/ вектора Ах выражаются через координаты вектора х следующим образом: т/ = (подразумевается суммирование по индексу I). Величины, относящиеся к новой системе координат, мы будем обозначать теми же символами, но со штрихами при индексах. Так, новые базисные векторы мы будем обо- значать через «j-, е2’, , еп>, новые координаты вектора х — через I1', £2', .. и т. д. Элементы матрицы перехода от базиса е(- к базису обозначим через pi,, так что ^'=ЛЧ (И) (суммирование по индексу г). Коэффициенты матрицы обратного перехода обозначим через q‘-: (18)
5.62] § 5.6. ТЕНЗОРЫ 151 (суммирование по z"). что можно записать в Матрица eft обратна к матрице р1е виде равенства , Р\'Я11 ( 0 при i j, '=< . . . (19) ( 1 при 1 — J или равенства р\'Ял = { 0 при z" 1 при z" = у". (20) Для сокращения записи величину, зависящую от индексов I и j так, что она равна нулю при различных значениях ин- дексов и единице при совпадающих значениях индексов, обозначают б); таким образом, равенство (19) можно запи- сать в виде = (21) а равенство (20) — в виде = (22) 5.62. Чтобы показать преимущества пользования новыми обозначениями, выведем заново формулы преобразования координат вектора, коэффициентов линейной формы и эле- ментов матрицы оператора при переходе к новому базису. Пусть х = = Q'e^. Подставляя вместо величин ei равные им величины q^'e^ (18), получаем х = Wiei' = Ver. Поскольку е(-—базис, = (23) Это и есть формула преобразования координат вектора. Пусть дана линейная форма Ь(х). Числа Ц, определя- ются, как обычно, равенствами le = L (ег). Подставляя вместо ег выражение pii,ei (17), получаем It' = L =Pli'L (ez) =Р\'11- Итак, (24) это и есть интересующая нас формула.
152 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.63 Наконец, пусть дан оператор А. Элементы его матрицы в новом базисе определяются из равенств Подставив сюда вместо ег (е^) равные им величины Р1'е1(Р!Ге/) (17)> получим а>.,р’ге}: Но Ае{ = а{е^, так что в результате pii.ailej=ai-pij,ej. Поскольку Cj—базисные векторы, Чтобы получить отсюда а£, умножим обе части равен- ства на q*' и по индексу / произведем суммирование. В силу формулы (22) мы получим Ри^' = a'-p'rq^ = affi. Согласно определению величины 6^ при суммировании по /' нужно учесть только одно слагаемое, отвечающее значению f = k'. При этом 6^=1 и, следовательно, (25) Это и есть искомая формула. Нетрудно проверить, что все три полученные нами те- перь формулы преобразования совпадают с формулами, полученными нами ранее обычным путем (§§ 5.3, 5.4, 5.5). Формулы (23,) (24) и (25) имеют много общего. Прежде всего, эти формулы линейны относительно преобразуемых величин. Далее, коэффициентами этих формул служат или элементы матрицы перехода от старого базиса к новому, или элементы матрицы обратного перехода, или, наконец, и те и другие. 5.63. Теперь можно перейти к определению тензора. Тензоры разделяются на ковариантные, контравариантные и смешанные. Кроме того, каждый тензор имеет определен- ный ранг. Начнем с определения ковариантного тензора, для опре- деленности, третьего ранга.
5.63] § 5.6. тензоры 153 Пусть имеется правило, позволяющее в каждой системе координат л-мерного пространства К„ построить л3 чисел Тijk (составляющих), каждое из которых определяется при придании индексам /, j, k определенных значений от 1 до п. Эти числа T;j-k образуют по определению ковари- антный тензор третьего ранга, если преобразование величин Tijk при переходе к новому базису производится по формуле Ti'i'k' =Pl’P'i'Pk'Tijk- Аналогично определяется ковариантный тензор любого другого ранга: тензор да-го ранга имеет не л3, а пт состав- ляющих, и в формуле преобразования стоит не три множи- теля вида р11>, а т таких множителей. Коэффициенты линейной формы, которые преобразуются, как мы видели, по формуле (24), дают пример ковариант- ного тензора первого ранга. Определим теперь контравариантный тензор третьего ранга. Пусть имеется правило, позволяющее в каждой системе координат построить л3 чисел Т^'к, каждое из которых определяется при придании индексам i, J, k числовых зна- чений от 1 до л. Эти числа TIJk образуют по определению контравариантный тензор третьего ранга, если преобразова- ние величин T‘Jk при переходе к новому базису произво- дится по формуле Аналогично определяется контравариантный тензор лю- бого другого ранга. В частности, координаты вектора х образуют контравариантный тензор первого ранга. Введенные нами термины «ковариантный» и «контрава- риантный» объясняются очень простым образом. «Ковариант- ный» означает «изменяющийся так же», как изменяются базисные векторы, т. е. с использованием коэффициентов pt,. «Контравариантный» означает «изменяющийся в обрат- ном направлении», т. е. с использованием коэффициентов Существуют еще и смешанные тензоры. Например, л3 чисел Tkj, заданные в каждой системе координат, образуют смешанный тензор третьего ранга, два раза ковариантный и один раз контравариантный, если преобразование этих величин при переходе к новому базису производится по
154 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ [5.64 формуле Аналогично определяется смешанный тензор, I раз кова- риантный и т раз контравариантный. Например, элементы матрицы линейного оператора обра- зуют смешанный тензор второго ранга, один раз ковариант- ный и один раз контравариантный. Отметим, что целесооб- разная расстановка индексов предназначена прямо указывать характер того или иного тензора. 5.64. Действия с тензорами. Можно определить операцию сложения двух тензоров одинакового строения, например двух тензоров Tfa и S£! (два раза ковариантных и один раз контравариантных). Это будет тензор Q*,- того же строения; в каждой системе координат при фиксирован- ных /, j, k его составляющая по определению равна сумме соответствующих составляющих слагаемых. То, что величи- ны Q£j действительно образуют тензор, притом того же строе- ния, что и у слагаемых, вытекает из следующих равенств; Qh = т^' + = = Pfafak, (Ti] + ^j)= Операция умножения применима к тензорам любого строения. Например, умножим тензор Тц на тензор Slk. Это будет тензор четвертого ранга в каждой системе коор- динат при фиксированных /, у, k, I его составляющая по определению равна произведению соответствующих состав- ляющих множителей. Тензорный характер Ql£!k проверяется следующим образом: Qi'i’k’ = = P/’P'i-T'iyPk'^i'^k = = Pt-'P'i’Pk'?!' Tusk=p^p'j’Pk'gi'Q^-k- Рассмотрим еще операцию свертывания. Она применяется к тензорам, у которых имеется по меньшей мере один ковариантный и один контравариантный индекс. Пусть, например, дан тензор Тц. Свернуть его по первому ниж- нему и верхнему индексам означает в каждой системе коор- динат составить величины Т‘. 1 ч-
ЗАДАЧИ 155 Здесь по индексу I подразумевается суммирование; в итоге величины Т~Т1ц зависят только от индекса у. В резуль- тате свертывания снова получается тензор, ранг которого на две единицы меньше исходного. Проверим это на рассмот- ренном примере. Мы имеем 7}, = = (^4')4П/= Здесь при суммировании по индексу k достаточно ограни- читься только значением k — P, поскольку 6<=1, мы по- лучаем ^=4^=47), что и требовалось. Что получится, если свернуть смешанный тензор второго ранга по его двум индексам? Величина Т = 7"/ уже не имеет ни одного индекса, т. е. в каждой системе координат она образует только одно число. Это число — одно и то же в любой системе координат; действительно, Г = 7’<:=^'77 = 6}7’/=Т<=7\ Такая числовая величина, не зависящая от системы коор- динат, называется инвариантом. Следовательно, операция свертывания дает возможность получать инварианты тензоров. Например,, если тензор а'г, соответствующий линейному оператору А, свернуть по его индексам, то полученный инва- риант a‘t- будет следом — суммой диагональных элементов матрицы оператора А. Инвариантность этой величины была уже доказана нами другим способом (5.53). Еще пример: матрица с( произведения двух операторов с матрицами соот- ветственно а* и есть смешанный тензор второго ранга, который получается при свертывании тензора четвертого ранга а*Ь{ по индексам k и I. ЗАДАЧИ 1. Вектор х £ К„ имеет относительно базиса et, е2, ..., еп коор- динаты g2, • • • > Как построить базис в Ки, чтобы координаты вектора х относительно этого нового базиса стали равными 1,0,0, ... ..., 0? 2. В «-мерном пространстве К,2 выбран базис еъ е2, ., еп. До- казать, что каждое подпространство К' С К,г может быть задано как совокупность всех векторов х £ К„, координаты которых (относи-
156 ГЛ. 5. ПРЕОБРАЗОВАНИЯ КООРДИНАТ тельно базиса ег, е2, ..., еп) удовлетворяют системе уравнений вида 2 а,у^ = 0 (i=l, 2, k). 3. (Продолжение.) Доказать, что каждая гиперплоскость НсКв может быть задана как совокупность всех векторов х £ К„, коорди- наты которых (относительно базиса ег, е2, ..., еп) удовлетворяют системе уравнений вида п (i=l, 2, .... fe). >=1 4. На плоскости выбрано три базиса; координаты вектора X отно- сительно каждого из них равны соответственно £2; r|i> т1, За- дано 111 = а1151Ч_1г12?2; ti==6ii^i + 612E2; г]2 = <?2iSi + a22S‘/, т2 = 621с, b.22^2; А = || ау ||, В = 11 6,71|- Выразить координаты тх, т2 через координаты i]1( т|». 5. Для данной линейной формы f (х) 0 в пространстве К„ выбрать базис glt g2, .gn так, чтобы для всякого вектора п х = 2 Т|АЙ* имело место равенство *=1 f W=ni- 6. Пусть оператор А, действующий в n-мерном пространстве R, имеет й-мерное инвариантное подпространство R'. Тогда, считая вре- менно, что оператор А определен только в подпространстве R', мы можем построить для него характеристический многочлен й-й степени. Показать, что этот многочлен является делителем характеристического многочлена оператора А, действующего во всем пространстве R. 7. Пусть Х = Х.О есть r-кратный корень уравнения det||А(е)—%Е|| = 0. Показать, что размерность. т собственного подпространства опе- ратора А, отвечающего корню Хо, не превышает г. 8. Показать, что величины образуют тензор второго ранга, один раз ковариантный и один раз контравариантный. 9. Система величин S,y определяется в каждой системе координат путем решения системы уравнений T';’S,7 = S^, где Т‘к— ковариантный тензор второго ранга, причем det || Tik || 0. Показать, что S/,- — ковариантный тензор второго ранга. 10. Если /, и 1} имеют тот же смысл, что и в тексте, какой геометрический смысл имеет свертка тензора по обоим его индексам?
ГЛАВА б КАНОНИЧЕСКАЯ ФОРМА МАТРИЦЫ ЛИНЕЙНОГО ОПЕРАТОРА Два оператора А и В, действующие в л-мерном простран- стве К„, называются эквивалентными, если существуют та- кие два базиса в К„, что матрица оператора А в первом базисе совпадает с матрицей оператора В во втором базисе. Очевидно, что эквивалентные операторы определяют в про- странстве К„ одинаковые по своим свойствам линейные преобразования. Но как узнать по матрицам операторов А и В в одном и том же базисе, являются ли они эквива- лентными? В этой главе для данного линейного оператора А в л-мер- ном пространстве (комплексном или вещественном) мы укажем базис, в котором матрица А оператора А примет «канони- ческий» вид — в некотором смысле наиболее простой из всех возможных. При этом канонический вид может быть получен непо- средственно по элементам матрицы оператора А в произ- вольном базисе. И оказывается, что если операторы А и В эквивалентны, то канонический вид их матриц совпадает. Таким образом, необходимым и достаточным условием экви- валентности операторов является совпадение их канонических- матриц. Мы начинаем построение с одного частного класса опе- раторов (§ 6.1); общий случай будет рассмотрен в § 6.3. §6.1 . Каноническая форма матрицы нильпотентного оператора 6.11. Линейный оператор В, действующий в л-мерном пространстве К„, называется нильпотентным, если при неко- тором натуральном г выполняется равенство Вг = 0, иначе говоря, если Вгх = 0 при любом Предположим, что В—нильпотентный оператор и Вг = 0; будем считать при
158 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.11 этом, что Вг-1^=0, т. е. имеются векторы х£К„, для ко- торых Вг-1х=^=0. Назовем высотой вектора х 6 К,, наимень- шее из чисел т, при которых Втх = 0. Все векторы х € Кп, по нашему предположению, имеют высоту ^г, причем имеются векторы с высотой, равной г. Для любого обозначим через Hfc совокупность всех векторов высоты k. Очевидно, Hfe есть подпространство в К„-' если x£Hk и у С Hft, то Вкх — 0, Вку = 0, откуда при любых a £ К и [3 £ К также Bfe (ах Ц-|3у) = 0, так что высота вектора ах 4 |3у не превосходит k и ах + Р_у£Нл. Очевидно, далее, что Нг = Кга и 0 = Но S Нх s . . . с Нг_т с Нг - К„. Размерности этих пространств обозначим соответственно через ото = О^ тх $4. . . тг = п. Будем строить базис в пространстве К„ следующим образом. Как мы видели, Нг-1 не совпадает со всемК„ = Нг. По- этому можно найти векторы Д, ..., /Р1, лежащие в Нг и линейно независимые над. Нг_2 (2.44) (р1 —тг— тг_1). Векторы B/j, ..., В/Р1 лежат в Нг-1 и линейно независимы над Нг_2: действительно, если бы мы имели ciB/i + • • • + cpiP/pi = S € Нг_2, то, применяя Вг~2, мы получили бы, что С1В'-1Л+... +сР1В'-уР1 = о, или, что то же, С1А+ • • • + cPifpi € Нг \ что по построению не имеет места. Отсюда видно, что раз- мерность тг_1 — тг_2 пространства Hr-1 над Нг_2 равна или больше размерности тг— тг_1 пространства Нг над И,.!. Дополним векторы В/1; ...,В/Р1 векторами fPl+i, в Нг-1 до максимальной системы, линейно независимой над Hr_2 (р2 = mr-i—тг-2>- Применяя ко всем этим векторам оператор В, получаем векторы в Нг_2 в2Л, вуР1, В/Р1+1, ..., В/Рг, линейно независимые над Нг_3, что доказывается аналогично предыдущему. Отсюда тг_2—тг_3^ тг_1—tnr_2, и можно построить в пространстве Нг_2 векторы /р2+1, • образующие вместе с предыдущими полную систему, линейно независимую над Нг_3.
6.13] § 6.1. ФОРМА НИЛЬПОТЕНТНОГО ОПЕРАТОРА 159 Переходя таким же образом в подпространства Нг_3, . .. . Н0 = (0), мы и получаем, в конце концов, полную систему п линейно независимых векторов. 6.12. Полученную систему векторов можно записать в таблицу Л, •••>4., Ц/li • • •, в fPi, /pj + i, • • • > /р,» В'-Уь ..., В^-уР1, В'-%1+1, ..., В-УР2, ... ' ’ ’ ’ fpr~l+ 1 ’ ' ' ’ ?г' Векторы, стоящие в первой строке таблицы, имеют высоту г, векторы следующей строки — высоту г—1 и т. д.; векторы последней строки имеют высоту 1, т. е. оператором В перево- дятся в 0. Каждый столбец таблицы определяет инвариантное подпространство оператора В; первые рг инвариантных под- пространств имеют размерность г (каждое), следующие /?2—рг подпространств — размерность г—1 (каждое) и т. д. Последние (одноэлементные) столбцы определяют одномерные инвариантные подпространства. Все пространство К„ есть прямая сумма рг указанных подпространств. 6.13. Напишем матрицу оператора В в подпространстве, определяемом векторами первого столбца. В качестве базиса возьмем векторы В''~1/], В7--2/!, ..., ВД, Д; в таком по- рядке они располагаются по возрастанию высоты. В этой записи первый вектор базиса оператором В переводится в 0, второй — в первый, ..., r-й переводится в (г—1)-й: поэтому матрица оператора В согласно 4.23 содержит по г строк, и столбцов и имеет вид 0 1 0 ... 0 0 001 ... 00 (1) 0 0 0 ... 0 1 000 ... 00
160 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.14 с отличными от нуля элементами, именно, равными 1, над главной диагональю. Аналогичный вид имеет матрица оператора В в осталь- ных инвариантных подпространствах, соответствующих остальным столбцам таблицы; отличие от матрицы (1) может состоять лишь в числе строк и столбцов. 6.14. Матрица оператора В во всем пространстве Кп будет квазидиагональной (4.52) с указанными блоками на диагонали: 0 Число блоков размера г равно pt, число блоков размера г—1 равно р2—ръ ..., число блоков размера 2 равно рг_у—Рг-2’ число блоков размера 1 равно рг—рг^. Разу- меется, если для некоторого j мы имеем =рг_у-, то в матрице (2) блоков размера j не будет вовсе.
6.21] § 6.2. алгебры; алгебра многочленов 161 § 6.2. Алгебры; алгебра многочленов от одного переменного 6.21. Приведем некоторые определения из теории алгебр. Линейное пространство К над числовым полем К называется алгеброй (точнее, алгеброй над К), если в К установлена операция умножения, приводящая в соответствие каждой паре элементов х, у из К элемент z СК (обозначаемый х-у или ху) и удовлетворяющая следующим условиям: 1) а (ху) = (ах) у = х (ау) для любых х и у из К и а С К', 2) (ху) z — x (yz) для любых х, у, z из К (а с с о- циативный закон); 3) (х-\-у) z = xz-[-yz для любых х, у, z из К (дистрибутивный закон). Вообще говоря, умножение может не быть коммутатив- ным, так что xy=j=yx. Если умножение коммутативно, т. е. выполнено условие 4) ху=ух для любых х и у из К, то алгебра К называется коммутативной. Пусть 0 есть нуль-вектор пространства К. Тогда для любого х С К 0-х = (0~|-0)х = 0- х-|-0-х, откуда следует, что 0-х = 0. Элемент е£К называется левой единицей, если ех — х для любого х С К; правой единицей, если хе = х для любого х С К; двусторонней единицей, или просто единицей в К, если ех = хе = х для любого х С К. Элемент х С К называется левым обратным к элементу у С К, если ху есть единица алгебры К; в этом случае у называется правым обратным к х. Если элемент z обладает и левым и правым обратными, то они могут быть лишь единственными и совпадают друг с другом (ср. 4.76а). Эле- мент z называется в этом случае обратимым, ему обратный обозначается через z-1. Произведение zu обратимого элемента z и обратимого элемента и есть обратимый элемент с обратным a-1z-1. Если элемент и обратим, то уравнение их — тз имеет реше- ние x = u~xv, поскольку оно получается из самого уравнения
162 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.22 умножением на и-1, оно единственно. В коммутативном случае употребляют запись х~— или х — v:u; этот эле- мент называют частным элементов v и и. Для частных спра- ведливы обычные арифметические правила действий: — Н—- — --—~ (если и и2 обратимы); Uj tl2 ^1^2 t»! V2 VyVo . л . — • ~ (если Uy и п2 обратимы); Uy U2 UyUn Vy V2 Vyllo . , . — — — —— (если Uy, u2, v2 обратимы), lly U2 UyVv доказательства которых мы предоставляем читателю. Алгебра К по определению имеет размерность п, если эту размерность п имеет соответствующее линейное про- странство К. 6.22 . Примеры. а. В любом линейном пространстве К положим x-v = 0 для любых х К, _у€К. Мы получим алгебру. Такая алгебра называется тривиальной. б. Примером нетривиальной коммутативной алгебры над полем К является совокупность П всех многочленов р Р с коэффициентами из К, с обычными операциями сложения и умножения. В этой алгебре есть единица, именно, много- член е (X), у которого а0 = 1, а остальные коэффициенты равны 0. в. Линейное пространство L (К„) из всех матриц л-го порядка с элементами из К с обычным матричным умноже- нием дает пример конечномерной некоммутативной алгебры размерности п~ (4.736). Эта алгебра обладает единицей, кото- рой является единичная матрица Е. г. Более общим примером некоммутативной алгебры с единицей является линейное пространство В (К) всех линей- ных операторов, действующих в линейном пространстве К, с обычным для операторов действием умножения (4.33). 6.23 а. Пространство L с К называется подалгеброй алгебры К, если из х С L, у £ L следует xy£L. Подпро-
6.24] § 6.2. алгебры; алгебра многочленов 163 странство L cz К называется правым идеалом в К, если из xfzL, у б К следует xy£L, и левым идеалом в К, если из xgL, у К следует ух £L. Идеал, одновременно левый и правый, называется двусторонним идеалом. В коммутативной алгебре нет различия между левыми, правыми и двусторон- ними идеалами. Во всякой алгебре К имеются два очевидных двусторонних идеала: один, обозначаемый (0),— состоящий из единственного элемента 0, второй.— состоящий из всех элементов х б К. Все остальные идеалы, односторонние и двусторонние, называются собственными идеалами. Всякий идеал есть подалгебра; обратное, вообще говоря, неспра- ведливо. Так, совокупность всех многочленов Р(к), удовле- творяющих условию Р (0) = Р (1), есть подалгебра алгебры П, не являющаяся идеалом. Совокупность всех многочленов удовлетворяющих условию P(0) = 0, есть собствен- ный идеал в алгебре П. б. Пусть L с К есть подпространство в алгебре К. Рассмотрим фактор-пространство K/L (2.48), т. е. линейное пространство из классов X элементов х£К, взаимно срав- нимых относительно подпространства L. Если L —двусто- ронний идеал в К, то для классов X б К/L, кроме линейных операций, можно ввести операцию умножения. Именно, имея классы X и Y, выберем произвольно элементы х £ X, у£Ч и под произведением Х-Y будем понимать класс, содержа- щий произведение ху. Проверим однозначность этого опре- деления. Если в классе X мы возьмем элемент х', а в классе Y элемент у', то мы будем иметь х'у' — ху = х' (у — у)-\-(х'~ х)у; этот элемент лежит в идеале L вместе с у'—у и х’—х. Из условий 6.21, 1) — 3), выполненных в алгебре К, немед- ленно следует выполнение аналогичных условий для классов х б K/L; поэтому фактор-пространство К/L с введенным в нем умножением является также алгеброй. Алгебра K/L называется фактор-алгеброй алгебры К по двустороннему идеалу L. Очевидно, она коммутативна, если коммутативна алгебра К- 6.24. Пусть имеются две алгебры К' и К" над полем К. Морфизм и линейного пространства К' в пространство К" (2.71) называется морфизмом алгебры К" в алгебру К*, если
164 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.25 наряду с условиями морфизма пространств (2.71) а) св (х' +у') = (о (х') 4- со (у’) для любых х', у' £ К', б) со (ax') = асо (х') для любого х'СК' и любого а£К выполняется также условие в) со (х’ -у') — со (х')-со (у') Для любых х', у' СК'. Если морфизм со есть эпиморфизм или мономорфизм, или изоморфизм пространства К' в пространство К" (2.71), то при выполнении условия в) он соответственно называется эпиморфизмом., мономорфизмом, изоморфизмом алгебры К' в алгебру К". 6.25. Примеры. а. Пусть L—подалгебра алгебры К- Отображение со, которое каждому вектору х С L ставит в соответствие этот же вектор х в алгебре К, есть морфизм алгебры L в ал- гебру К, и именно мономорфизм. Как и в аналогичном слу- чае в 2.72, этот мономорфизм называется вложением L в К. б. Пусть L—двусторонний идеал алгебры К и K/L — соответствующая фактор-алгебра (6.236). Отображение со, которое каждому вектору х С К ставит в соответствие класс XCK/L, содержащий элемент х, есть морфизм алгебры К в алгебру К/L, и именно эпиморфизм. Как и в аналогичном случае в 2.726, этот эпиморфизм называется каноническим отображением К на K/L. в. Пусть имеется мономорфизм со алгебры К' в алгебру К”. Совокупность всех векторов со(х') С К" есть подалгебра L"czK", и мономорфизм со есть изоморфизм алгебры К' в алгебру L". г. Пусть имеется морфизм со алгебры К' в алгебру К". Покажем, что совокупность L' всех векторов х' СК', для которых со(х') = О, есть двусторонний идеал алгебры К'. Действительно, L' есть подпространство в К' (2.766); далее, если x'CL', у'СК', то со (х' -у') = со (х')-со (у') = 0, так что x'-y'CL' и аналогично y'-x'^L', что и требовалось. Далее, мономорфизм Q пространства K'/L' в пространство К", ставящий в соответствие каждому классу X' С K'/L' элемент со (х'), х'СХ' (2.766), в данном случае есть мономорфизм алгебры K'/L' в алгебру К". Действительно, выбирая х' £Х', y'CY', мы имеем x'y'CX'Y' и й (X'Y') = со (х'у') = со (х') X
6.25] § 6.2. алгебры; алгебра многочленов 165 X со (у') = £2 (X') Q (Y'). В частности, если морфизм со есть эпиморфизм алгебры К' в алгебру К", то морфизм Q есть изоморфизм алгебры К'/L' с алгеброй К". д. Пусть А—линейный оператор, действующий в про- странстве К. Так как для линейных операторов в прост- ранстве К определены операции сложения и умножения, то т каждому многочлену Р (X) = 2 € П мы можем поставить 6 = 0 в соответствие оператор т Р(А)= 2 k = 0 действующий в том же пространстве К. При этом соответ- ствии сложению и умножению многочленов отвечает сложение и умножение соответствующих операторов в смысле § 4.3. В самом деле, пусть т т т р (X)=л (X)+р2 (М = s a^k + 2 ь^к = 2 кк> k=C й=0 *=0 тогда т т т Р(А) = 2 (лА+^)А*= 2 м*+ £ ^а^=р1(А)+р2(А). k=0 fc=0 k=0 Аналогично пусть т т т т Q(X) = (X) Р2(X) = 2 а^к 2 2 2 a^k+J-, k = Q j—0 k=G тогда по распределительному закону для операторов (4.33) mm mm Q(A)= 2 2 *ЛА*+/= 2 ^A- 2 ь^р^РгМ- k = 0 /=0 k — Q j = Q В частности, операторы P(A) и Q(A) всегда коммутативны, каковы бы ни были многочлены Р(Х) и Q(X). Мы получили морфизм алгебры многочленов П (6.226) в алгебру линейных операторов В (К) (6.22г). Вообще говоря, этот морфизм не есть эпиморфизм (хотя бы потому, что опе- раторы вида Р(А) коммутируют друг с другом, а вся алгебра В (К), за исключением тривиального случая К=КХ, неком- мутативна).
166 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.26 е. Существует изоморфизм между алгеброй В (Кп) всех линейных операторов, действующих в пространстве Кп, и алгеброй L (Кп) всех матриц л-го порядка с элементами из поля К', мы осуществляем его, фиксируя в пространстве Кп базис ег, . . ., еп и ставя в соответствие каждому оператору А С В (Кп) его матрицу в этом базисе. Обе эти алгебры имеют одинаковую размерность л2. 6.26. В коммутативной алгебре П всех многочленов Р(Х) с коэффициентами из поля А' (6.226) совокупность всех мно- гочленов вида P(X)Q0(X), где Q0(X)—фиксированный многочлен, а Р(Х)— любой многочлен, очевидно, является идеалом. Мы покажем, что каждый идеал 1=^=0 алгебры П имеет такую структуру, т. е. получается из некоторого многочлена Qo (К) умножением на любой многочлен Р(Х). Для доказа- тельства найдем в идеале / отличный от 0 многочлен наи- меньшей возможной степени, например q, и обозначим его через Q0(X). Мы утверждаем теперь, что любой много- член Q(X)£/имеет вид Р (X) Qo (К), где Р(Х)€П. Действи- тельно, по правилу действий с многочленами*) можно написать Q(k)^P(K)Q0(k)+R(k), (3) где Р(Х)— частное от деления Q(X) на Q0(X), a R (К) — остаток, имеющий степень, меньшую степени делителя, т. е. меньшую, чем число q. Многочлены Q (X) и Qo (X) при- надлежат идеалу /. Но тогда, как видно из равенства (3), и многочлен R (X) принадлежит идеалу /. Так как степень Р(Х) меньше q, а многочлен Qo (X) в идеале имеет наимень- шую возможную степень q среди многочленов, отличных от 0, то R (X) = 0, что и утверждалось. Многочлен Qo (X) называется порождающим идеал /. 6.27. Многочлен Qo (X) определяется идеалом I единст- венным образом с точностью до числового множителя. Дейст- вительно, если бы наряду с Qo (X) тем же свойством *) См., например, А. Г. Ку рош, Курс высшей алгебры, «Наука», 1965, гл. 5.
F.31] § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 167 обладал многочлен Qj (X), то, по доказанному, мы имели бы Qi (X) = ^(X)Q0(X), Qfl(X) = P0(X) Q, (X). Из этих равенств вытекает, что степени многочленов (X) и Qo (X) одинаковы и что Рг (X) и Ро (X) не содержат X, т. е. являются числами; это и утверждалось. 6.28. Пусть имеются многочлены QT (X), . . ., (X), не все равные 0 и не имеющие общего делителя степени 1. Покажем, что существуют такие многочлены Р° (X), ... . . ., Р® (X), что Р? (X)Qj (X) + . . . +7* (X)Q„ (X) = 1. (4) Действительно, пусть /—совокупность всех многочленов вида P1(X)Q1(X)+ ...+РИ(Х)(?Я(Х) при любых Рг (X), . . ., Рт (X) из П. Очевидно, совокупность / есть идеал в П. По 6.26 идеал / порожден одним много- членом т Q0W = 2 Pl^Qk^)- (5) *=i При этом, в частности, Qi (X) = (X) Qo (X), . . ., Qm (X) = Sm (X) Qo (X), где Sj (X), . . ., Sm (X) — некоторые многочлены. Эти равенства показывают, что Qo (X) есть общий делитель многочленов С\(Х), ..., (X). Но тогда из предположения следует, что степень многочлена Qo (X) равна 0, т. е. что Qo (X) есть постоянная а0. При этом ао=рО, так как иначе I--0. Умно- жая (5) на 1/а0, получаем (4), что и требуется. § 6.3. Каноническая форма матрицы произвольного оператора 6.31. Рассмотрим линейный оператор А в /z-мерном про- странстве К„. Указанное в 6.25д отображение cd (Р (X)) = Р (А) есть эпи- морфизм (6.23) алгебры П всех многочленов с коэффициен- тами из поля К в алгебру Пд линейных операторов вида
168 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА J6.32 Р(А) в пространстве Кп. В силу 6.25 г алгебра Пд изоморфна фактор-алгебре П//, где /—идеал, состоящий из всех мно- гочленов Р (X), для которых со (Р (X)) = Р (А) = 0. Мы выясним сейчас структуру этого идеала. 6.32. В 6.22 мы видели, что совокупность всех линейных операторов, действующих в пространстве Кп, представляет собой снова алгебру над тем же полем К, размерности п2. Фиксируя оператор А, рассмотрим последовательность опе- раторов А° = Е, А, А2, ..., А'л, ... В этой последовательности первые п2+1 членов линейно зависимы. Пусть, например, 2 cftAft = 0 (т^п2). й=0 Это означает, что в установленном выше соответствии (6.31) т многочлену Q (X) = С*Х* соответствует нулевой оператор. fe = 0 Всякий многочлен Q(X), для которого оператор Q(A) есть нулевой оператор, будем называть аннулирующим мно- гочленом оператора А. Мы доказали, что у всякого опера- тора А есть аннулирующий многочлен степени ^л2. 6.33. Совокупность всех аннулирующих многочленов опе- ратора А есть идеал в алгебре П. В силу 6.26 имеется многочлен Q0(X), определенный с точностью до множителя, такой, что все аннулирующие многочлены имеют вид /3(X)Q0(X), где Р(Х)—любой многочлен из П. В частности, Qo (к) сам является аннулирующим многочленом. Среди всех аннулирующих многочленов он имеет наименьшую степень и поэтому называется минимальным аннулирующим много- членом для оператора А. 6.34. Т еорема. Пусть аннулирующий многочлен Q(X) оператора А разложен в произведение двух взаимно простых множителей: Q(X)==Qx(X)Q2(X).
6.34J § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 169 Тогда пространство К„ можно разложить в прямую сумму двух подпространств, инвариантных относительно оператора А {так что ATjCTj, АТ2сТ2), причем для любых х2£Т2 Qi (А) х2 = О, Qa (A) = О, так что Qj (X) [Q2 (%)] есть аннулирующий многочлен для оператора А, действующего в подпространстве Т1[Т2]. Доказательство. В силу 6.28 существуют такие многочлены Рг (X) и Р2 (X), что P1(X)Q1(X)+P2(X)Q2(X) = 1. Используя морфизм 6.25д, находим P1(A)Q1 (A) + P2(A)Q2(A)^E. Обозначим через Tft(A=l,2) область значений оператора Qk (А), т. е. совокупность векторов вида Qk (А) х, х С К„ {4.61). Очевидно, из y = Qft(A)x£Tft следует Ay =-Qk (А) Ах £ Тй, так что подпространство инвариантно относительно опе- ратора А. Мы имеем для любого хг € Т1 и некоторого у € К„ Q2 (А) хх = Q2 (A) Qi (А)у = Q (А)у = О, и аналогично для любого х2 С Т2 и некоторого z £ Kn Qi (A) x2 = Q1(A)Q2(A)2=Q(A)z = 0. Далее, для любого x g K„ имеет место равенство x == Qj (A) Pr (A) x + Q2 {A) P2 {A) x = xx + x2, где xft = Qk (A) Pk (A) x £ Tft {k — 1, 2), оно показывает, что подпространства Tj и Т2 в сумме дают все К„. Пусть x0€T1f]T2. Тогда Qx (А) х0 = Q2 (А) х0 = 0 и, следовательно, хо = pi (А) (A) + Р9 (A) Q2 (А) х9 = О,
170 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-35 Таким образом, Т5 f] Т2 —0 и сумма КП = Т1 + Т2 — прямая. Разумеется, не исключена возможность, что одно из подпро- странств Т3, Т2 состоит только из одного нулевого вектора. 6.35. Замечание. По построению оператор (А) ан- нулирует подпространство Т2, а оператор Q2 (А) аннулирует подпространство Tv Покажем, что всякий вектор х, аннули- руемый оператором Q, (А), лежит в Т2 и всякий вектор х, аннулируемый оператором Q2(A), лежит sT,.Пусть Q1(A)x = 0. Мы имеем х — х, 4- х2, где xt С Т1? х2 € Т2. Так как Q1(A)x2 = 0, то и (A) х} = Qj (А) х — Q1(A)x2 = 0. Но и Q2(A)Xj = 0, поскольку х1^Т1. Следовательно, хх —Рх (A) Qt (А) х, + P<z (A) Q, (A) Xj — 0, х = х2 £ Т2. Аналогично из (?2 (А) х = 0 следует х£Т15 что и утверждалось. 6.36. Разлагая многочлены Qj (k) и Q2 (Z.) далее на взаимно простые множители, получаем возможность разбивать про- странство К„ на более мелкие инвариантные относительно оператора А подпространства, аннулируемые соответствую- щими множителями многочленов Qj (%) и Q2 (%). Пусть многочлен Р(к) допускает в поле разложение вида tn = П (6) /=1 где Kj—все (различные) корни многочлена, a —их крат- ности. Такое разложение всегда возможно, в частности, в поле С комплексных чисел. Разложение (6) есть разложение на m попарно взаимно простых множителей (X — Х,-)'л При- меняя результат 6.34, получаем следующее утверждение: Теорема. Если аннулирующий многочлен оператора А имеет вид (6), то пространство К„ разлагается в прямую сумму m подпространств Ть ..., Тот, инвариантных отно- сительно оператора А, причем подпространство Tft аннули- руется оператором В*'1, где В* = А-^Е. 6.37. В каждом ненулевом пространстве Tft, согласно 6.14, можно выбрать базис, в котором матрица оператора Bfe (по построению нильпотентного в пространстве ТА) примет канонический вид (2). В этом же базисе матрица оператора
6.37J § 6.3. ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА 171 A = Bft4-XftE примет вид (7) Матрица оператора А во всем пространстве К„ = Тг + • + Тт в базисе, который получается объединением всех канони- ческих базисов, построенных в пространствах Тх, .... Тт, приобретает окончательную форму 1 ... О ОХ.!... О О 0 ... 1 0 0... X.! Xi 1 ... 0 0 Xi ... 0 0 0 ... 1 00... Xj J(A) = • (8) XM 1 ... о о \т ...о 0 0 1' о о ...хм
172 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.41 Формулируем окончательный результат: Теорема. Для любого оператора А в п-мерном про- странстве К„, имеющего аннулирующий многочлен вида (6) (в частности, для любого оператора А в п-мерном комплек- сном пространстве Сп), существует базис, в котором матрица оператора А записывается в форме (8). Матрица (8) назы- вается нормальной формой Жордана оператора А, а соответ- ствующий базис — базисом Жордана. В случае К„ = СП комплексные числа Л,17 можно упорядочить по какому-либо правилу: например, в порядке воз- растания модулей, а при равных модулях — в порядке возрас- тания аргумента 0, меняющегося в промежутке 0^0 < 2л. Для оператора А, действующего в пространстве К„=И=С„, представление (8) возможно не всегда. Мы рассмотрим в § 6.6 каноническую форму матрицы оператора А, дейст- вующего в пространстве K„-=R„- § 6.4. Элементарные делители 6.41. Матрицу (8) можно задать таблицей л(1>, ..., л*1’ ') х 1 ^11 Х_; л^), ..., л<т> I 1 ‘Г m J в которой для каждого диагонального числа указаны размеры л<*>, ..., л<*> соответствующих «элементарных жордановых клеток» вида \ 1 0 ... 0 0^1 ... 0 ч. строк, (10) 0 0 0 ... 1 0 0 0 . . Л* встречающихся в матрице (8). Мы хотим выяснить, как построить таблицу (9) и тем самым восстановить вид мат- рицы J (А) оператора А по известной его матрице Д в каком-либо базисе пространства Кл.
6.43] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 173 6.42. Как мы знаем (5.53), характеристический многочлен оператора А не зависит от выбора базиса. Составим его для жорданова базиса; так как под главной диагональю стоят нули, мы получаем det (A— X£') = det|| J (А) — ХД|| = Ш „(£). _!.„(*) 1 ГА- un 6=1 Мы видим, что числа ‘kk суть корни характеристического многочлена, а суммы гк = + ... + —их кратности. Таким образом, вычисляя характеристический многочлен (что можно сделать по матрице А) и находя его корни, мы по- лучаем величины и rk = 4* .. . + nf^ таблицы (9). 6.43. Далее (здесь и в 6.44) мы укажем, как по матрице А оператора А в исходном базисе вычислить сами числа n)k). Поскольку J (А) и А—матрицы одного и того же опера- тора А, взятого в разных базисах, согласно 5.51 справедливо равенство J (А) = Т~гАТ, где Т—невырожденная матрица. Поэтому и J (А) — KE = Т~1 (А—Х£) Т. Миноры фиксированного, например р-го, порядка матрицы А—%Е представляют собой некоторые многочлены от X сте- пени Обозначим через 1р (А) идеал в алгебре П, по- рожденный всеми этими минорами. Аналогичный смысл имеет идеал Ip(J (А)). Покажем, что эти идеалы совпадают. Дей- ствительно, каждый минор р-го порядка матрицы J (А)— 7.Е согласно 4.54 является суммой произведений миноров р-го порядка матриц А—КЕ, Т~г и Т. Но элементы матриц Т и Т-1 суть числа; таким образом, всякий минор р-го порядка матрицы J (А) — КЕ есть просто линейная комбинация мино- ров р-го порядка матрицы А—%Е и тем самым входит в идеал 1р(А)- По симметрии каждый минор р-го порядка матрицы А — %Е входит в идеал Ip (J (А)). Тем самым 1р(А) = = Ip(J (А)), что и утверждалось. Пусть Dp (X)— порождающий многочлен этого идеала; он может быть определен как общий наибольший делитель
174 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.43 многочленов, порождающих идеал I (А) {6.26}. Таким обра- зом, наибольший общий делитель миноров р-ro порядка у матрицы J (А) — ХЕ тот же, что и у миноров р-го порядка матрицы А-—ХЕ, и поэтому может считаться известным. Вычислим непосредственно наибольший общий делитель ми- норов р-го порядка матрицы J {А} — ХЕ. Опять-таки вместо матрицы J (А) — ХЕ при этом можно рассматривать матрицу вида P{J{A)— XE}Q, где Р и Q — обратимые числовые матрицы (не содержащие X). Операции перестановок строк, столбцов, прибавления к одному столбцу другого с произ- вольным множителем в матрице J (А) — ХЕ приводят как раз к такого рода матрицам {4.44}. Мы утверждаем, что эле- ментарную клетку Хк — X 1 о ... о О Хк — Х 1 ... о О 00... 1 О О О .. . Хк — X указанными операциями можно преобразовать к виду 1 1 (Хк-Х}п^ А именно, для получения требуемого результата следует вначале из второй строки вычесть первую, умноженную на Хк — X, из третьей — вторую, умноженную на Хк — X, и т. д.; мы получим матрицу (р = nf1} Хк — Х 1 о ... о -{Хк-Х}* 0 1 ... о (’— l)f-2(Xfc — Х)*7"1 0 0 . . .’ 1 (-I)/7-1 {Хк-Х}Р 0 0... о Если теперь из первого столбца вычесть второй, умноженный на Хк — X, затем третий, умноженный на — {Хк — X}2, . . . ..., {р— 1 )-й, умноженный на (— 1)^-2 {Хк — X)*7-1, мы получим
6.43] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 175 матрицу О 1 О ... О О О 1 ... О О ' ' ' О О ... 1 (— — Х)Р 0 0 ... о (13) из которой матрица (12) получается перестановкой столбцов. Теперь подсчитаем общий наибольший делитель миноров р-го порядка у матрицы J (X) с клетками вида (12) на глав- ной диагонали. Так как у этой матрицы вне главной диаго- нали стоят нули, то отличными от нуля могут быть лишь миноры с одинаковым набором номеров строк и столбцов; такой минор равен произведению своих диагональных эле- ментов. В матрице J (X) среди элементов на главной диагонали имеется некоторое число, положим N. биномов вида (Xft— X) ! , а остальные л — N элементов главной диагонали равны 1. Число N есть полное число жордановых клеток в матрице J (А), т. е. + ... +rm. С другой стороны, среди миноров до порядка п — N заведомо имеются равные 1, откуда следует, что Dp (X) = 1 при — N. Можно заме- нить матрицу J (X) более простой диагональной матрицей .(D (^-Х)^ „(а) (Х2-А) "1 тогда многочлен ZXf(X), сосчитанный для матрицы J(X), бу- дет совпадать с многочленом Do _ („_jv)(X), сосчитанным для матрицы /(X). Очевидно, наибольший общий делитель
176 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.44 миноров р-го порядка матрицы /(X) имеет вид т D/,(X) = IJ(Xy-X)^W /=1 (14) где лгу^0. Спрашивается, каково значение, например, пока- зателя лгх(р). Эта величина есть наименьший показатель, с которым Хх—X входит во все миноры р-го порядка. Если + ••• + л*т), т0 имеется минор р-го порядка, не содержащий вообще Хх— X, так что при этих р мы имеем т1(р) = 0. Для/> = л<12>+ ... +«<'"> +1, учитывая, что по- казатели л*1»,..., лг(1) идут в убывающем порядке, мы имеем mi (Р) = п(г')- В дальнейшем на каждую единицу увеличения р пока- затель будет увеличиваться соответственно на л<*> «<*>_, ... , наконец, при р — п мы получим f L~ 1 ’ Г1 —X /»1(Р) = «(11)+ ••• +лп’- Аналогично, /»/ (р) = + • • • + nrj (1^7<w)> D p+ i (X) 6.44. Отношение Ев (X) = ... называется элементар- У Up (A) ным делителем оператора А; вместе с многочленами Dp (X) элементарные делители не зависят от выбора базиса, и их можно вычислять по матрице оператора А в любом базисе. Из сказанного в 6.43 видно, что элементарные делители имеют вид 0) ^-?(Х) = П(Х7—Х)% , <7=1,2, ... , л-1, 7=1 с корнями, кратности которых равны размерам (последова- тельных) жордановых клеток. Таким образом, вычислив эле-
6.45] § 6.4. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 177 ментарные делители, мы получаем числа nW и тем самым ре- шаем задачу, поставленную в 6.43. 6.45. Примеры. а. У жордановой матрицы 10-го порядка 1 1 О О 1 1 О 0 1 1 1 О 1 1 2 1 О 2 2 1 О 2 имеются три клетки, отвечающие корню Хх=1, размеров 3, 2 и 1, и две клетки, отвечающие корню Х2 = 2, раз- меров 2 и 2; поэтому элементарные делители имеют значения Е9 (X) = (1 -X)3 (2-Х)2, Е8 (Х) = (1-Х)2(2-Х)2, Е7 (Х) = 1—X, £в(Х)=...=£х(Х) = 1. б. У некоторой матрицы A = ||ayftl| 10-го порядка элемен- тарные делители (вычисленные, как указано в 6.43 и 6.44, по минорам матрицы А—Х£) оказались равными 2:9 (X) = (3 —X)2 (4 —X)3, Ев (X) = (3—X)2 (4—X), £7(Х) = 4 —X, Еъ (Х) = 4—X, Е. (X) = ... =£х(X) == 1,
178 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.46 Напишем выражение матрицы J (А). В соответствии с резуль- татом 6.44 матрица J (А) имеет две клетки, отвечающие корню Х1 = 3, размеров 2 и 2, и четыре клетки, отвечаю- щие корню Z2 — 4, размеров 3, 1, 1, 1. Таким образом, мы имеем 3 1 О 3 3 1 О 3 2(А) = 4 1 4 1 4 6.46. Итак, зная элементарные делители оператора А, мы можем определить все величины л}*’, а вместе с ними— структуру жордановой матрицы оператора А. В частности, мы видим, что жорданова матрица оператора А определя- ется однозначно самим оператором А. С другой стороны, поскольку элементарные делители оператора А определяются через миноры матрицы А — \Е в любом базисе, два эквивалентных оператора А и В, т. е. имеющих в двух (разных) базисах одну и ту же матрицу, имеют одну и ту же каноническую жорданову форму. Очевидно и обратное: если два оператора имеют одну и ту же каноническую форму, то они эквивалентны. Тем самым проблема эквивалентности линейных операторов (в комплек- сном пространстве), поставленная в начале этой главы, полностью решена.
6.52] § 6.5. НЕКОТОРЫЕ СЛЕДСТВИЯ 179 § 6.5. Некоторые следствия 6.51. Если известно, что оператор А приводится к ди- агональному виду, т. е. его матрица в некотором базисе имеет вид Xj т то матрица А и есть жорданова матрица оператора А (все жордановы клетки имеют размер 1). В частности, все эле- ментарные делители имеют простые корни. Обратно, если все элементарные делители некоторого оператора А имеют только простые корни, жорданова матрица J (А) имеет клетки только размера 1 и, следовательно, диагональна. 6.52. Имея жорданову форму оператора А, можно напи- сать его минимальный аннулирующий многочлен. Пусть опе- ратор В в некотором базисе ек, . . . , ер имеет матрицу О 1 0 ... О О 001 ... 00 0 0 0 ... 0 1 0 0 0 ... 0 0 Это означает, что 8^ = 0, Ве2 = ек, ..., Вер = ер_и откуда следует, что ВЛх = 0 при любом х = \скек. Таким
180 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.52 образом, аннулирующий многочлен оператора В имеет вид V. Минимальный аннулирующий многочлен, как делитель V, дол- жен иметь вид X®, т^.р; но поскольку ВР~1ер = е1=^0, мы видим, что V и есть минимальный аннулирующий многочлен. Пусть оператор А в том же базисе е1г ... , ер имеет матрицу Хо 1 0 ... 0 0 0 Хо 1 ... 0 0 0 0 0 Хо 1 О О О ... О Ао так что А = В4~Х0Е. По доказанному (А — Х.оЕ)р = В^ = 0, так что для оператора А аннулирующим многочленом явля- ется (Хо—Х)Р; он является и минимальным в силу той же аргументации. Пусть оператор А имеет матрицу Хо 1 о ... о О ?.о 1 ... о о о х0 ... о 6 o' о’ ... Хо 1 ... о о х0 ... о о о х0 причем числа Pi^Pt^ • • • ~^РТ СУТЬ размеры ее диагональ ных клеток. Многочлен Q(X), аннулирующий оператор А, должен по отдельности аннулировать каждую его клетку (ср. 4.52). Этим свойством обладает многочлен (Хо — Х)р*. По указанным выше причинам он является и минимальным аннулирующим многочленом. Наконец, в общем случае, когда оператор А обладает жордановой матрицей с таблицей X’, 1 **> п(т) п{т) «2 прт >
6.61] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 181 аннулирующим многочленом является многочлен т /Ь\ С(М-П(Ч-МЛ1 • к-1 (15) Он является и минимальным аннулирующим многочленом опе- ратора А, так как ни один из показателей не может быть здесь понижен по указанным выше соображениям. Итак, минимальный аннулирующий многочлен матрицы А есть многочлен (15). Его степень равна л*/’ + ... + — сумме размеров максимальных жордановых клеток, отвечаю- щих каждому корню характеристического многочлена. Заме- тим, что это число не превосходит размера всей.матрицы А (т. е. числа п—размерности пространства, в котором дей- ствует оператор). Характеристический многочлен det (А—Х£) оператора А (6.42) содержит многочлен Q(k) в качестве делителя и поэтому также является аннулирующим (это ут- верждение называется теоремойГ амильто на — К э л и). Вообще говоря, характеристический многочлен det (А-—КЕ) не является минимальным аннулирующим многочленом опера- тора А. Если оказывается, что минимальный многочлен сов- падает с характеристическим, то это означает, что каждый характеристический корень используется только в одной жордановой клетке, размера, равного кратности корня. § 6.6. Вещественная жорданова форма 6.61. Рассмотрим оператор А в вещественном л-мерном пространстве R„. Канонический базис, в котором матрица оператора А записывалась бы в жордановой форме (8), вообще говоря, не существует, хотя бы потому, что харак- теристический многочлен оператора А может иметь невещест- венные корни. Тем не менее в вещественном пространстве можно найти некоторую замену жордановой матрице (8). Пусть А = 110^’11 есть матрица оператора А в некотором базисе е1( ... ,еп пространства Rn. Рассмотрим комплексное л-мерное пространство Сп) состоящее из векторов х = а1в1+ ...+апеп, где а1( ..., ал—произвольные комплексные числа. Матрица А
182 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.62 задает в пространстве С„ линейный оператор А по формулам п п / п \ Ах = У aCjAej = У ссу-1 У а$ек I; /=1 /=i \*=i J для векторов х с вещественными составляющими ау- эти формулы определяют сам оператор А. 6.62. Начнем с оператора А, у которого аннулирующий многочлен имеет специальный вид где т — положительное число. Для оператора А определены операторные полиномы Q(A) с комплексными коэффициентами. В частности, имеют смысл многочлены (A-^ixE)^ и (А — гтЕ)Л Полином Р(Х) = — (А2 + т2)р остается аннулирующим и для оператора А. Раз- ложению (X2 1 т2)р = (X — г'тИ' (X 4- ix)p, согласно 6.34, отве- чает разложение пространства С„ в прямую сумму инвариант- ных относительно оператора А подпространств С„ и С„, в которых он имеет аннулирующие многочлены соответст- венно (X — ix)P и (Х-|-/т)Л Более того, если подпростран- ство Q состоит из векторов X==aJel+ • • • +anen с некоторыми alt ..., a„, то подпространство состоит из векторов х = а1е1+ . . . +апеп, где числа ау- комплексно сопряжены к числам ау-. Действи- тельно, если (А — /тЕ)^х = 0, то, переходя к комплексно сопряженным числам во всех членах левой части, получаем, что (А Д-гх Е^х = О, и обратно; последним равенством, по 6.35, однозначно определяется подпространство С„. Отсюда следует, между прочим, что п четно, п = 2т, где т — раз- мерность каждого из подпространств С„ и С2. Пусть — жорданов базис оператора А в простран- стве (Д (6.37). Поскольку в этом базисе матрица опера-
6.62] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 183 тора А имеет вид [6.37 (7)] гт 1 1х ix оператор А действует на базисные векторы по формулам A/} = ixf[, ..., Aff = ixfl, A/i =Л + ixf\, . . ., АД = fl + ixfl, Для совокупности сопряженных векторов ff £ С„ спра- ведливы сопряженные формулы А/} = -ixf[,_ ^Л=~irfl,_ А/?=Л-/тД, &fnt= jtil - 1 — Z T fni I I &fnq — fnq_ 1 — ixfnq. Мы видим, что векторы образуют жорданов базис для оператора А в пространстве С„. Таким образом, векторы /у и образуют жорданов базис для оператора А во всем пространстве С„. Мы построим теперь базис в веществен- ном пространстве R„, заменяя каждую пару комплексных векторов и на пару вещественных векторов gj — = у(//+/Л и = Из формул ixfl (Л=Л = 0), fff=t fl^-ixff
184 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.62 получаем а{4(//*+//*) = (^ = й* = 0), A j {ft-ft) } = Айу* = й)_, + т^. Поэтому для векторов gf, й* получаются формулы A^i = — хй?, Ай? = xg$, Agi — gi—г hi, Ah% = й? +r^t, (16) A^fc = Ай^ = тйЙ, Йлк-1 , При этом, обратно, ft = gt + iht ’ ft = Si ~ih^ Таким образом, линейная (комплексная) оболочка всех век- торов gt и ht та же, что и линейная оболочка всех век- торов ft и ft- А так как число тех и других одинаково, то векторы gt и й? линейно независимы над полем С вместе с векторами ft и ft. Тем более векторы gt и hff линейно независимы над полем R, т. е. в вещественном линейном пространстве R„. Из формул (16) следует, что матрица оператора А в базисе gt, й^ состоит из диагональных клеток вида 0x10 — х 0 0 1 0x10 — х 0 0 1 О х — х О (17) 0x10 — х 0 0 1 О х —х О размеров соответственно 2лу,
6.63] § 6.6. ВЕЩЕСТВЕННАЯ ЖОРДАНОВА ФОРМА 185 6.63. Переходим к рассмотрению общего случая. Пусть А — линейный оператор в вещественном л-мерном простран- стве R„ и Р(Х)— его аннулирующий многочлен. В вещест- венной области многочлен Р(Х) допускает разложение вида т s Р(Ь) = П - № П [(Ь-<92+тЖ k=i j=i где Xft (k = 1, . .., т)— различные вещественные корни много- члена Р(к), а оу-iXj = Ху-; оу-——различные невеще- ственные корни; все числа Ту положительны. В соответствии с общей теорией (6.36) пространство Rra допускает разложе- ние в прямую сумму инвариантных относительно А подпро- странств т $ R= S Е*+ 2Fy, k=i i=i причем аннулирующим многочленом для оператора А в под- пространстве Еа служит многочлен (X — а в подпро- странстве Fy—многочлен [(X—Оу)2tJ]p>. В подпростран- стве Ей оператор А приводится к жордановой форме вида (7). В подпространстве Fy обозначим By—-А — оуЕ; тогда для опе- ратора By в подпространстве Fy многочлен (Х2 + т|)Р; будет аннулирующим и по предыдущему можно будет построить базис, в котором матрица оператора By будет состоять из клеток вида (17) (с заменой т на Ту). В этом же базисе матрица оператора А = Ву4-ОуЕ будет состоять из клеток Оу Ту 1 О — г- <Ту 0 1 Оу Ту 1 О ~~xi 0 1 . (18) Оу Ту -Ту Оу Итак, в пространстве Rn можно выбрать базис, в кото- ром матрица оператора А состоит из диагональных клеток вида (10) и (18). Обозначим эту матрицу через JR (А) (ве- щественная жорданова матрица).
186 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6-64 6.64. Структуру матрицы JR (А) можно восстановить по элементарным делителям оператора А, вычисленным по мино- рам матрицы А — ХЕ в исходном базисе (§ 6.4). Поскольку многочлены Dp (X) и Ер (X) получаются из миноров матрицы А—ХЕ рациональными операциями, многочлены Ер (X) имеют вещественные коэффициенты и, следовательно, имеют вид m . s En-q (X) = П (X-**) ’ П [(X -ст,.)2 + Tj] Р<> k=i /=1 (</= 1, 2, . . ., л —1). Каждому показателю nqk> отвечает жорданова клетка ви- да (10) размера л^’. Каждому показателю отвечает клетка вида (18) размера 2ру\ 6.65. Формулируем окончательный результат в виде сле- дующей теоремы: Теорема. Для любого оператора А в вещественном п-мерном пространстве R„ существует базис, в котором мат- рица JR (А) оператора А квазидиагональна и состоит из диагональных клеток вида (10) и (18). Здесь Xk — веществен- ные характеристические корни оператора A, Оу-рТТ,- и Oj-iXj- комплексные его корни. Размеры клеток однозначно определяются по элементарным делителям оператора, как указано в 6.64. § 6.7. Спектры, корпусы и многочлены В различных вопросах анализа и алгебры встречается необходимость вычисления различных функций, в частности, многочленов, от заданных линейных операторов в конечно- мерном пространстве. Функции от операторов обладают рядом специфических свойств. В ближайших двух параграфах строится исчисление таких функций. Естественной арифме- тической моделью для функций от одного оператора является алгебра корпусов, с которой мы и начинаем теорию. 6.71. Будем называть спектром и обозначать символом £ конечную совокупность точек Х1Т ...,Хт. При этом будем считать, что каждой точке Xk приписано под названием «кратности>? некоторое натуральное число rk (Zs=l,
6.71] § 6.7. СПЕКТРЫ, КОРПУСЫ И МНОГОЧЛЕНЫ 187 Все это будем записывать так: 5 = . . .ДМ. ’ 1 ’ ’ tn I Предположим, что каждой точке "Kk поставлен в соответствие набор из rk чисел из К, которые мы обозначим f (Хл), . . ., D (Xft). Такой набор чисел мы будем называть корпусом, f, заданным на S*). Пусть Q (S)—совокупность всех корпусов на множестве 5. Введем в Q(S) следующие операции: а. Сложение. Суммой двух корпусов f— {/</) и g= {^(/) будем называть корпус f + g, определенный набором чисел (/+^)(/) (Ч)=/(/) (Ч)+^(/) (М, k = 1, .. ., т, /= 1, . . ., rk — 1. б. Умножение на число. Пусть а £ К', произведе- нием af корпуса /= {/</> (2.J} на число а будем называть корпус, определяемый набором чисел (а/)(/) (Ч) = «/(/) (ХА). Очевидно, операции ап б превращают совокупность Q(S) в линейное пространство. Нулем этого пространства являются корпус 0 со всеми нулевыми составляющими. в. Введем теперь операцию умножения. Произведе- нием /§• корпусов /={/(/> и g — {gdl называется корпус, определяемый формулами (/£)' (Ч) =Ж) (^) +Г (Ч)= 2сд</)(Ха)^-/)(Ха), / = 0 k = 1, ..., т, р = о,1, ... , rk —1, с/=______£j____ р ГЛр-ГП' Легко проверить, что операция умножения коммутативна и удовлетворяет условиям 6.21 1) —3). Таким образом, Q(S) — коммутативная алгебра над полем К. В этой алгебре есть единица, корпус е, который обладает свойством ef=f для *) Принят также термин джет (англ, jet означает «струя»).
188 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.72 любого f^Q(S). Именно, можно положить 1 при /=0, k = 1, ..т, О при 0 < гк, k=*\, ..т. Для случая, когда точки Xj, .. ., Xm принадлежат полю К, мы свяжем в этом параграфе алгебру Q (S) с алгеброй всех р многочленов Р (к) = 2 ak^k с коэффициентами из поля К. А=о 6.72. Будем предполагать, что поле К содержит беско- нечное множество различных элементов. При этом условии установим вначале некоторые теоремы о восстановлении коэффициентов многочлена по его значениям. р а. Пусть Р(Х) = 2 ак^к—многочлен с коэффициен- k= о тами из поля К, аргумент которого X также может прини- мать значения в поле К. Покажем, что значения Р(к) поз- воляют однозначно восстановить его коэффициенты <z0,.. ., ар. Пусть Хо, Х1; ..., кр—различные элементы поля К; рассмот- рим равенства «о + <2дХ0 арк% = Р (Хо), <го + аЛ1+ • • • + а0 + + • • • + аркР = Р (кр). Эти равенства можно рассматривать как уравнения относи- тельно величин <z0, ах, ..., ар с определителем, отличным от 0; по теореме 1.73 она обладает единственным решением, что и требуется. б. Отсюда следует, что если два многочлена Р(Х) = р р — S ак^к и Q (X) = 2 Ьккк совпадают при каждом значе- fe=o k=a нии к£К, то ак = Ьк (& = 0, 1, .. .,р). 6.73. Далее нам понадобится понятие производной от многочлена Р(к), понятие высших производных и формула Тейлора. В анализе эти понятия вводятся для случая много- члена Р (к) от вещественного (или комплексного) аргумента.
6.73] § 6.7. СПЕКТРЫ, КОРПУСЫ И МНОГОЧЛЕНЫ 189 Здесь мы рассматриваем многочлены с аргументом 1, меняю- щимся в произвольном поле К; поэтому мы должны ввести соответствующие определения независимо (причем не опи- раясь на понятие предела, которого в поле К может и не быть). а. Фиксируем точку и напишем равенство р р р = + Н)]*= — Н)\ (19) 6=0 k=0 k=0 где (fe = 0, 1, . ..,p)— многочлены от ц, которые полу- чаются после развертывания [р + (Х— p)]ft по степеням ри (X — р) и приведения подобных членов. Многочлены Ьк(ц) получают следующие наименования: р £0(р) = 2 == (Iх) —сам многочлен Р(р); k=0 р (р) = 2 kak]ik~1 = P' (р) —первая производная *=| многочлена Р(р), р 62(р) = 2 & (&—1) = Р" (Р-) — вторая производная k=2 многочлена Р(р), Ьр(ц)=р(р — 1) ... 1-ар = Р'Р’(р)—p-я производная мно- гочлена Р(р). Для многочлена степени р положим РЮ (р) == 0 при /? > р. Равенство (19) в приведенных обозначениях принимает форму р = (20) k~ о и называется формулой Тейлора для многочленов Р(Х). б. В частности, для многочлена Р(Х) = (Х—а)? мы имеем Р(а) = Р' (а)= ... =Р(^-1) (а) = 0, (%) ==/Я, Р<?>(Х)=0 при <? > р.
190 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.74 в. Более общим образом, если Р(Х) = (Х— мы имеем также Q (X) = 2 bk (X - а)к, Р (X) = 2 bk (X - а)к+Р, k=0 /г = 0 так что Р(а) = Р'(а)= . . . =Р{р-^ (а)~0. (21) г. Обратно, если известно, что выполнены условия (21), то это означает, что S 4г(«)(ь-«)*= k = 0 s = (X- а}Р £ 4- p(ft) - a)k~P = (X - d}P Q (X), k= p где Q(X)— некоторый новый многочлен. 6.74. Заметим, что представление многочлена Л’(Х) в форме р р 2 aAXfts=P(X)= 2 Ми) (Ь — н)*> /г = 0 k=0 где Ьк (р)— некоторые многочлены от р, может быть лишь единственным. Действительно, зафиксируем р = р0 и прида- дим величине X последовательно различные значения Хо, ... , 7р. Тогда т = Х — р примет последовательно раз- личные значения Хо — р(„ Xj— р0, ... , Х^— р0, и при этих значениях т оказываются известными значениями многочлена р 2 bk (р0) Tfe (которые равны /Э(ХО), ... , Р(Х )); в силу k=o 6.72а величины Ьк (р0) определены однозначно. Так как это верно при любом р = р0€К, то однозначно определены и сами многочлены Ьк (р.) (fe = 0, 1, ... , р). 6.75а. Пусть даны два многочлена Р(X) и Q(X). Прове- рим справедливость формул (P+Q)‘« (р) = Р™ (р) -I- (р), (22) k (PQYk} (р) = 2 (р) (р), (23) /=о (‘-°.
6-75] § 6.7. СПЕКТРЫ, КОРПУСЫ И МНОГОЧЛЕНЫ 191 Действительно, мы имеем по определению р (Р+Q) (X) = £ 4 (Р+Q){k} (и) (* - н)\ й=0 ' р р<*) = £ (Ь-н)*» k~0 р <?(*) = £ 4-Q(*’(h) (*-н)\ k= о р Р (X) + Q (X) = £ ± [Р<*> (ц) + (И)] (X - И)*. k— о В силу теоремы единственности 6.74 получаем форму- лы (22). Далее, аналогично р (PQ) (X) = £ 4г(PQ){k} (и) k= о с другой стороны, р р Р (М = £ 4 рф (И) - Н)Л Q (М - £ 4г Q(” (и) (* - Н)\ /=0 h s = 0 ' Р Р ₽(Х)(?(Х) = £ £ ~р^ (И)<2«> (И)(Х-ИГ' = /=о k-0 'h 2р . k =Е {<н) Q**-7’ (н)} (Х-н)‘; в силу теоремы единственности 6.74 имеем k -L {Р€}уъ (и) = £ ]Ц±_. (и)> откуда и вытекает (23). б. В частности, из формулы (23) вытекает следующее важное предложение: Если /><А)(р.) = 0 при k = 0, 1, . .. , т, то для любого многочлена Q(X) также (PQ)M (|д) = 0 при Л = 0, 1, ... , т.
192 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА (6.78 6.76. Пусть теперь заданы некоторый спектр S = ... , Xyg/C, и алгебра соответствующих корпусов Q(5) (6.71). Каждому многочлену Р(к) отвечает следующий корпус Р из Q(S): точке ставятся в соответствие числа P(Xft), Р' (Xft), ... , Р<гь~Р (X*), где Р{Р (X) — производные от многочлена Л’(Х), определенные в 6.73а. Формулы (22) и (23) показывают, что обычным действиям сложения и ум- ножения многочленов отвечают определенные в 6.71 действия над корпусами. Таким образом, отображение Р(Х)—>Р есть морфизм (6.24) алгебры многочленов П в алгебру корпу- сов Q(S). Покажем, что этот морфизм является эпиморфиз- мом.- иначе говоря, для любого корпуса f можно найти такой многочлен P(X), что f(Kk) = P(Xk),f'(‘kk)=P'(Kk), ... , (X*) = *>(Х*) (k— 1, ... , т). Достаточно рассмотреть случай, когда числа /<у) (Xft) отличны от нуля только для какого-нибудь одного значения k = klt а для остальных значений равны 0; если мы решим постав- ленную задачу для такого случая, т. е. для каждого k— 1, . .. , т построим многочлен Рк(к), удовлетворяющий условиям Рк (М =/(М. • • • . pkk~1} (М =/(г/‘-1) (ХА), (24) /Г(М = 0, s=£=k, j=\, ... , rs—\, (25) то искомое решение можно будет получить по формуле Р(Х)=^(Х)+...+Рт(Х). Итак, нам требуется найти многочлен Рк(У), удовлетво- ряющий условиям (24)—(25). Будем искать его в форме Pk(K)=Qk(k)Rk(K), (26) где Qk (X)— новый искомый многочлен, а = П (27) В силу 6.726 и 6.756 мы имеем ^(Ч)=0 (s^A, 7=0, 1, ... , rs—1);
6.77] § 6.7. спектры, корпусы и многочлены 193 отсюда, каков бы ни был многочлен Qk(k), мы получаем, снова применяя 6.756, что PV’(4) = 0 (s^ k, j=G, 1, ... , rs-l), так что условие (25) заведомо выполнено. Мы должны подчинить многочлен Рк(Ь) условиям (24). Заметим, что я*(Ч) = п (Ч-Ч)^о. S =# k Поэтому из условия /(Ч) = ^(Ч) = «?НЧ)^ (Ч) величина Qk (Aft) однозначно определяется. Далее из условия f (Xft)=РИЧ) = Q'k (Ч) Ъ (Ч) + Qk (Ч) Rk (Ч) при известном уже Qk (Aft) однозначно определяется Qk(А*); продолжая таким образом дальше, мы получаем возможность однозначно определить все числа Qk (Aft),Q*(Aft), • •, Q*/‘-1)(4)- А имея их, мы можем определить и искомый многочлен Qk (А) по формуле Тейлора Qk Qkiy (Ч) (*-Ч)Ч (28) Возвращаясь по цепочке наших рассуждений, мы видим, что многочлен Рк (А), определенный формулами (26) — (28), удо- влетворяет требуемым условиям (24)—(25). 6.77. Применяя 6.25г, получаем, что алгебра Q(S) всех корпусов на данном спектре изоморфна фактор-алгебре П//, где I—идеал в П, образованный теми многочленами, для которых Р(Р(Ч) = 0, k = \, . . . , т, j=1, .. . , гк. Из 6.73г следует, что каждый многочлен Р(А)£/ делится на многочлен т т(Х) = ц (Х-Ч)а; (29) из 6.73в следует, что каждый многочлен Р(А), делящийся на Т(А), входит в I. Идеал I, как и всякий идеал в алгеб» ре П, порождается входящим в него многочленом наименьшей
194 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА |6-78 степени (6.26). Таким многочленом является сам многочлен Т’(Х). Следовательно, алгебра Q(S) изоморфна фактор-ал- гебре П/I, где /—идеал, порожденный многочленом Т’(Х). 6.78. Применим результат 6.77 к решению следующей задачи: описать все обратимые (6.21) элементы алгебры Q(S). Очевидно, корпус /, для которого хотя бы при одном значении j имеет место равенство /(Xft) = 0, не может быть обратимым, поскольку в этом случае для любого корпуса g мы имеем №) (Ч) =/(W(4) = о #= 1 = е (lft). Рассмотрим корпус /, для которого /(Xt)=^0 (k= 1, ... , m). Пусть Р (К) — многочлен, для которого (6.76) f(h) = P(h), ••• = (Ч) (А=1, Этот многочлен, таким образом, не имеет общих множителей с многочленом Т(Х) (29): поэтому, согласно 6.28, сущест- вуют такие многочлены Q(X) и S(X), что P(X)Q(%)+T(X)S(X)sl. (30) Пусть q— корпус, отвечающий многочлену Q(%). При- меняя к равенству (30) эпиморфизм П—>Q(S), построенный в 6.76, и используя тот факт, что при этом эпиморфизме многочлен Т (X) переходит в 0, мы получаем /•?=!, т. е. корпус / обратим в алгебре Q(S). Итак, корпус f£Q(S) обратим. Как мы знаем из 6.21, для обратимого корпуса и раз- решимо, притом единственным образом, любое уравнение вида ux = v, где v — известный корпус, а х — неизвестный корпус. Для и „ частного х = — можно найти явное выражение, последова-
6.79[ § 6.7. СПЕКТРЫ, КОРПУСЫ И МНОГОЧЛЕНЫ 195 тельно решая уравнения “ (Ч) х' (Ч) + «' (Ч) х (Ч) = v' (М, 2 (Xft)x('-'>(Xft) = ^> (ХА),. /=о А=1, . . . , да, r = 0, 1, ..., rk. 6.79а . Спектр 5 = {Хр, . . . , XJ”1} с комплексными Х15 . .. , Хот называется симметричным, если для любого невещественного Hk = (ykiTk в 5 содержится и комплексно сопряженное число ХА = ол — iTk с той же кратностью rk. Корпус f = {У’7’(Xft)} на симметричном спектре S называется симметричным, если числа /(7> (Xfe) комплексно сопряжены числам /(/) (Xfc) (/= О, 1, ... , rft). Если Р (X) — многочлен с вещественными коэффициентами, то на симметричном спек- тре 5 корпус, образованный числами P*7) (Xft) (k= 1, ... , да, 7=1, ... , гк), симметричен, поскольку производные /э<у)(Х) также имеют вещественные коэффициенты и поэтому р(/’(Ч)=’^7ЧЧ)- (31) Обратно, для симметричного корпуса f= (Xft)} на симметричном спектре S = {Х^1, ... , Х£?} всегда можно найти многочлен Ро (X) с вещественными коэффициентами, для которого Ptf> (Xft) = f{P (ХА) (k = 1, . . . , да, j = 1, . . ., гк). Действительно, по 6.76 можно построить многочлен Р(Х) с комплексными коэффициентами, удовлетворяющий требуемым условиям. Обозначим через Р(Х) многочлен с комплексно сопряженными коэффициентами. Тогда 1 [Р‘/> (Xft) +7*Р (X*)] = 1 [Р<7> (XJ+f*P (Xft)] = (Ч)+7ЖП=f{J} (М, т. е. многочлен Ро (X) = у [Р (X) -f-P (X)], имеющий вещест- венные коэффициенты, удовлетворяет требуемому условию. б. Симметричные корпусы f на симметричном спектре 5, очевидно, образуют алгебру над полем вещественных чисел.
196 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.81 В силу 6.25г эта алгебра изоморфна фактор-алгебре U/I, где П — алгебра всех многочленов с вещественными коэффи- циентами, а /сП — идеал, образованный теми многочленами для которых = k=1, ., m, /=1, . .. , rk, т. е. идеал, порожденный (вещественным) многочленом пг 7’(Х) = П (Х-ЛА)Ч k=l § 6.8. Функции от оператора и их матричная запись В этом параграфе строится исчисление функций от опе- раторов: для каждого линейного оператора А, действующего в л-мерном пространстве С„ (или R„), указываются матрицы любого многочлена Р (А) или рациональной функции Р(А) Q(A) и правила действий над ними. В последнем пункте дается расширение операторного исчисления на аналитические функции. 6.81. Пусть дан оператор А в пространстве К„. Алгебра Пд всех операторов Р(А), где Р(Х) есть некоторый мно- гочлен, как мы знаем из 6.31— 6.33, изоморфна фактор- алгебре П//д, где П — алгебра всех многочленов, а /д— идеал, порожденный минимальным аннулирующим многочленом Т (К) оператора А. Пусть известно, что многочлен Т (X) допускает в поле К разложение на множители tn Т(Х) = Ц (Л-^)Ч (32) k=i В силу 6.77 фактор-алгебра П//д изоморфна алгебре Q (S) всех корпусов, определенных на спектре 5 = 2>д = — (Xi1, • • • , Кп} (спектре оператора А). Следовательно, и алгебра Пд изоморфна алгебре Q(Sa). Явный вид этого изоморфизма можно получить следующим образом: каждому корпусу /CQ(^a) отвечает класс много-
6-821 § 6.8. функции от оператора 197 членов Р (X) £ П таких, что ^7)(Ч)=/(/’(Ч) (33) (k= 1, ... , т, j=0, 1, . . . , г^_1), и каждому из этих многочленов отвечает один и тот же вполне определенный оператор Р (А) £ Пд, который мы будем обозначать /(А). Далее мы укажем явный вид матрицы оператора Р(А) при заданных значениях (33), если матрица А дана в жор- дановой форме. 6.82. Пусть известно, что в некотором базисе простран- ства К„ оператор А записывается матрицей тг-го порядка специального вида Хо 1 ... 0 0 Хо ... 0 0 0 ... 1 0 0 .. . Хо (34) г. е. имеет вид Х0Е-(-В, где В имеет матрицу 0 1 . .. 0 0 0 . .. 0 В = 0 0 . .. 1 • 0 0 . .. 0 Из 4.746 мы знаем, что матрица Вк имеет вид 0 . - k+1 0 10.. . 0 0 0 0 1 .. . 0 вк= 0 0 0 0 .. . 1 £+1 0 0 0 0 . . . 0 (диагональ из единиц удалена от главной диагонали на k шагов).
198 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.83 Пусть Р(Х)— произвольный многочлен степени р; при- меняя формулу Тейлора (20), мы можем написать р р(Х)= й = 0 Заменяя X на символ оператора А, получаем равенство р р р (А) = Е i Р(к> w (А - W = £ и Р<к> <Хо) в*- fe = 0 k=0 Учитывая выражения матриц Вк, находим матрицу Р (Хо) Р' (Хо) 1Р" (Хо) ... Р^ (Хо) 0 Р(Х0) Р' (Хо) ... —1—(Хо) Р(А)= (n-2>' ° . (35) 0 0 О ... Р(Х0) Заметим, что для построения матрицы Р (А) от многочлена Р (X) нам понадобились только значения Р(Х0), Р' (Хо), ... ..., Р'"-1’(Хо), где п — порядок матрицы А. 6.83. Пусть теперь А записывается квазидиагональной матрицей А n-го порядка, состоящей из т диагональных кле- ток вида (34), где Хо пробегает значения Хр ..., Хга, с размерами соответственно л1; ..., пт. В силу правил действий с квазидиагональными матрицами (4.52) вычисле- ние Р(А) можно вести независимо для каждой диагональной клетки. Применяя 6.82, получаем: матрица Р(А) получается путем замены каждой диагональной клетки (34) матрицы А на клетку (35). Таким образом, для построения матрицы /’(А) нам требуются в данном случае значения P{J} (ХА), А=1, ..., m, j=l, ..., пт. 6.84. Пусть К=С есть поле комплексных чисел. Тогда для любого оператора А, действующего в пространстве К„ = С„, минимальный аннулирующий полином имеет разло- жение (32), и существует базис, в котором матрица опе- ратора А записывается квазидиагональной матрицей
6.85] § 6.8. ФУНКЦИИ ОТ ОПЕРАТОРА 199 с клетками вида 1 0 . О Ч 1 • о о ООО. ООО. (36) размера (6.37). Таким образом, оператор А определяет спектр SA = {4‘, •••, Чг}. Если f—любой корпус на спектре 5 а, /={/(/,(Ч). k=\, ...,т, /=1, ..., rk}, то соответствующий оператор /(А) в силу рассуждений 6.81 — 6.83 имеет вид квазидиагональной матрицы, в которой каждая клетка вида (36) заменена на клетку 7(4) /'(Ч) ^Г(Ч) О /(Ч) /'(Ч) (Ч) 1 04-2)! • (37) о о о ... /(Ч) Этим задача изоморфизма алгебры Пд с алгеброй Q(<Sa) решена в явном виде. 6.85а. Остановимся еще на функциях от оператора, матрица которого в некотором базисе имеет вид (6.62) ах 10 —т а 0 1 а х —х а (38) где а и х—элементы из поля К. 1 Ч (4Z)-i)! о х —т а /(п'*-2) (Ч)
200 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА {6.85 Положим г о О 1 А = £ = О Т|| —т ст|| Матрицу А можно записать в форме блок-матрицы с дву- строчными квадратными блоками: А = Л Е 0 ... О О О Л Е . . . О О ООО . . . Л Е ООО ... О Л Л 0 . . 0 0 ОДО. 0 Л . . 0 0 + 0 0 Е . 0 0 . . Л 0 ООО. 0 0 . . 0 Л ООО. О О О О ОД О О Поэтому, так же как и выше, и на основании правила ум- ножения блок-матриц (4.51) матрицу Р(А) можно записать в форме блок-матрицы с блоками того же размера Р(А) = Р(А) Р' (Л) ~Р" (А) ... О Р (Л) Р' (Л) (т—1)! ' ' (Л) (т— 2)! ' ' • (39) ООО Р(А) б. Если матрица А квазидиагональна и состоит из диа- гональных клеток вида (34) и (38), то, так же как в 6.83, выводим, что матрица Р(А) получается заменой каждой диагональной клетки матрицы А на соответствующую клетку вида (35) или (39). в. Отметим случай, когда в a K=R и числа опт вещественны. В этом случае для вещественного многочлена Р(Х) можно явно указать вид матриц Pfk> (Л), фигурирующих в формуле (39). Действительно, если ввести матрицу то, как легко проверить, мы имеем Р = —Е, так что ал- гебра вещественных матриц Л = оЕ + т/ = Re Л ImX — Im X ReX X = а 4- zt, о т — т а
6.87] § 6.8. ФУНКЦИИ ОТ ОПЕРАТОРА 201 изоморфна обычной алгебре комплексных чисел X (ср. 4.74а). Поэтому для любого многочлена Л’(Х) с вещественными коэффициентами Р(Л) = Р(о£ + т/) = ReP(X) ImP(X) —ImP(X) ReP(X) X = о + гт, и соответственно Р1*’ (Л) = Р<*> (оЕ + х!) = RePlft>(X) ImP<ft>(X) — ImP<*>(X) ReP(fc)(X) 6.86. Пусть K=R', тогда для любого оператора А, действующего в пространстве K„ = R„, минимальный анну- лирующий многочлен Т (X) имеет вещественные коэффици- енты и, следовательно, определяет симметричный спектр Sa. Алгебра операторов Р (А) изоморфна фактор-алгебре П//г, где П — алгебра многочленов с вещественными коэффици- ентами, а 1Т — идеал, порожденный многочленом /"(Х). Эта фактор-алгебра изоморфна алгебре симметричных корпусов на спектре ST (6.79). С другой стороны, для оператора А существует базис, в котором матрица А оператора А ква- зидиагональна с диагональными клетками вида (34) или (38). Если теперь /—любой симметричный корпус на спектре то соответствующая ему матрица / (А), в соответствии со сказанным выше, получается заменой каждой клетки (34) на (37) и каждой клетки (38) размера, положим, 2m, на блок- матрицу /(А) /'(А) ... ^-^/^(Л) ° ••• (^2)! , 0 О ... /(Л) где двустрочные квадратные блоки /(fc) (Л) имеют вид (Л) = Re/<*> (X) Im /<*> (X) II —Im/‘*>(X) Re/(*>(X)|' 6.87. Пусть A—линейный оператор в пространстве С„; какие операторы Р (А) (где Р (X) многочлен) обратимы?
202 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА [6.88 Из выражения матрицы оператора Р (А) в жордановой базисе оператора А (36) видно, что т k detP(A) = IIlPO"*, 2 пк = п. k—1 П= 1 Поэтому оператор Р (А) обратим в алгебре В (Сп) всех линейных операторов, действующих в пространстве С„, тогда и только тогда, когда Р(Aft)0, А=1, . .., т. По- кажем, что при выполнении этого условия обратный оператор [Р(А)]-1 имеется уже в алгебре Па- Действительно, в данном случае корпус р, отвечающий многочлену Р (X) в алгебре корпусов Q(Sa), т. е. составленный из чисел Р‘/>(ЛА) (А=1, ..., т; J — 0, ..., обратим в алгебре Q(Sa) (6.78); а так как алгебра Q(Sa) изоморфна алгебре Па (6.81), то оператор Р (А) обратим в алгебре Пд. По тем же соображениям изоморфизма между алгебрами Q(Sa) и Пд в этом случае для любого многочлена Q(K) разрешимо в алгебре Пд уравнение P(A)-z(A)= (?(А) с неизвестным многочленом г(Х). В соответствии с резуль- татами 6.78 и 6.84 матрица искомого оператора z (А) в жор- дановом базисе оператора А получается заменой каждой клетки (36) на клетку вида Р(ЛА) \Р(А,)Л=хк 0 0 1 fQWV 2 \P(Z)A=X* • • • fg wy \P (Z)/z.=xk сад рад (40) 6.88. Полученный результат можно истолковать еще и следующим образом. Пусть 5 = { X?, . . ., Хг”} — некоторый спектр в комплексной плоскости. Обозначим через Т (S) совокупность всех комплексных рациональных функций /(*) _g(X) Р(Х) , где Q(X) и Р (X)—многочлены, причем много-
6.89] § 6.8. ФУНКЦИЙ ОТ ОПЕРАТОРА 203 член Р (к) не имеет корней в точках множества S. В со- вокупности T(S) введем по обычным правилам операции сложения, умножения на комплексные числа и умножения функций друг на друга, после чего совокупность T(S) становится алгеброй над полем С. Далее заметим, что каждая функция f(k)£T(S) обладает производными /' (X), /"(X), ... в обычном смысле анализа. Если поставить в соответствие каждой функции /(Х)£ T(S) корпус /={Л’(ХЛ), *=1, /= О, 1, ..., rk-1}, где /(7)(Х) означает обычную производную от функции /(X), то это соответствие будет морфизмом алгебры T(S) рацио- нальных функций в алгебру Q (S) корпусов на спектре S, и именно эпиморфизмом, поскольку корпусы, отвечающие даже только многочленам Q(X), заполняют всю алгебру Q(S) (6.76). Пусть теперь спектр S = Sa есть спектр некоторого оператора А, действующего в пространстве С„. Тогда алгеб- ра Па операторов Р (А) изоморфна алгебре корпусов Q(Sa), и мы можем имеющийся эпиморфизм T(Sa)—>-Q(Sa) про- должить до эпиморфизма Т(3д)—!-Пд- Иными слова- ми, мы можем поставить в соответствие каждой рацио- нальной функции f(k)£T(S) линейный оператор /(А)£Пд так, что соответствие /(X)—>-/(А) будет снова эпиморфиз- мом. Матрица оператора /(А) строится по приведенному выше правилу (40). 6.89*. Вместо алгебры рациональных функций мы можем рассмотреть алгебру аналитических функций. Именно, пусть W(S) — совокупность функций /(X), аналитических в точках Хх, . . ., Хот (т. е. аналитических каждая в некоторой окрест- ности указанных точек). Совокупность W(S) с обычными операциями сложения и умножения есть снова алгебра над полем С (содержащая алгебру T(S)). У аналитических функ- ций также имеются производные любого порядка (в обычном смысле анализа); пользуясь ими, мы можем распространить эпиморфизм T(S&)—* Пд, построенный в 6.88, до эпимор- физма W (S а) —> Пд. Существенно, что в сферу действия этого эпиморфизма втягиваются теперь многие трансцендентные функции, встречающиеся в анализе, например, etk, sin соХ, coscoX и др. Если обозначить через /(А) оператор, отвечаю- щий функции f(k)£W {Sa.), то матрица его в жордановом
204 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА базисе оператора А вычисляется по тому же правилу (37). Отметим, например, формулу вытекающую непосредственно из тождества и из того факта, что отображение W(S&) —> Пд является эпиморфизмом. Результаты 6.87— 6.89, относящиеся к линейным опе- раторам в комплексном пространстве, можно перенести на линейные операторы в вещественном пространстве, используя вещественную жорданову форму и метод 6.85 — 6.86. В таком переносе уже не требуется использование никаких новых идей и мы можем предоставить его читателю. ЗАДАЧИ 1. Матрица оператора А в некотором базисе ...,еп имеет вид X 1 X 1 X X 1 X В каком базисе она будет иметь нормальную жорданову форму? 2. Доказать, что матрица А и матрица А' (полученная транспо- нированием матрицы А) всегда эквивалентны. 3. Найти жорданову форму матрицы —2 —1—1 3 2 —4 1—1 3 2 1 1 0—3—2 —4 —2—1 5 1 1 1 1—30 4. Эквивалентны ли операторы, заданные матрицами 1 1 0 0 1 0 0 0 2 А = 4 1 —1 —6—1 2 ? 2 1 1
ЗАДАЧИ 205 5. Найти элементарные делители матриц n-го порядка 1 1 ... 1 123... п 0 1 2 ... п — 1 О 0 1 ... О 00 ... 1 О 0 0 ... 1 п п— 1 п—2 . . 1 111. .. 1 0 п п— 1 . . 2 0 2 2. .. 2 Л3 — 0 0 п . 3 , Л4 — 0 0 3. .. 3 0 0 0 . . п ООО. .. п 6. Показать, что все матрицы а а12 О1з • • • ain О а а23 ... агп 0 0 а ... азп 00 0 ... а с любыми элементами а12, а13, ... эквивалентны, если элементы а12, о2з> •••> an-i, п отличны от нуля. 7. Найти жорданову форму матрицы А, удовлетворяющей урав- нению Р(Л) = О, где многочлен Р (X) не имеет кратных корней. 8. Найти жорданову форму матрицы А, удовлетворяющей урав- нению Р(Л) = 0, где Р (а)—произвольный многочлен. 9. Если аннулирующий многочлен оператора А есть многочлен 2-й степени, то любой вектор х пространства R лежит в инвариант- ной (относительно А) плоскости или прямой. 10. Найти все матрицы, коммутирующие с матрицей а 1 0 ... 0 0 О а 1 ... О О (а) — О 0 0 ... а 1 ООО ... О а т строк. 11. Найти все mxn-матрицы В, удовлетворяющие условию ВАп(а)=Ат(а)В. 12. Найти все матрицы, коммутирующие с квазидиагональными матрицами вида Лт1(а) 0 ... О О АтДа) ... О О 0 ... Атк(а)
206 ГЛ. 6. КАНОНИЧЕСКАЯ ФОРМА ЛИНЕЙНОГО ОПЕРАТОРА 13. Найти все матрицы, коммутирующие с квазидиагональными матрицами вида лт1(й1) о ... о О Лта(а2) ... о О 0 ... Атк(ак) где все числа alt а2, ..., ак различны. 14. Найти все матрицы, коммутирующие с общей жордановой матрицей (8). 15. При каком условии всякая матрица, коммутирующая с неко- торой матрицей А, есть многочлен от А? 16. Показать, что в вещественном пространстве Rn размерности л^2 каждый линейный оператор имеет инвариантную плоскость.
ГЛАВА 7 БИЛИНЕЙНЫЕ Й КВАДРАТИЧНЫЕ ФОРМЫ В этой главе мы будем изучать числовые линейные функции двух векторных аргументов. В отличие от случая линейных числовых функций одного аргумента теория линейных числовых функций двух аргументов—билинейных форм — имеет богатое геометрическое содер- жание. Положив в выражении билинейной формы второй аргумент равным первому, мы получаем новый важный класс функций одного переменного, уже нелинейных—квадратичных форм. В §§ 7.1—7.8 рассмотрения ведутся в линейном пространстве К над произвольным числовым полем К, в § 7.9—в вещественном ли- нейном пространстве. §7.1. Билинейные формы 7.11. Числовая функция А (х, у) от двух векторных ар- гументов х, у в линейном пространстве К называется били- нейной функцией или билинейной формой, если она является линейной функцией от х при каждом фиксированном значе- нии у и линейной функцией от у при каждом фиксированном значении х. Иными словами, А (х, у) есть билинейная форма от х и у, если для любых х, у и z из К и любого а £ К удовлетво- ряются равенства A(x4-z, у) = А(х, у) 4- A (z, у), \ А (ах, у) = аА(х, у), I А (х, y + z) = А (х, j)4- А (х, z), | W А (х, ау) — аА (х, у). I Первые два из этих равенств означают линейность функ- ции А (х, у) по первому аргументу, последние два — линей- ность по второму аргументу.
208 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (7.12 Из определения билинейной формы, используя равенства (1), легко получим общую формулу / k т \ k т А ( 2 «/*/> 2 = 2 2 yj), (2) \ i = 1 3 = 1 / i = 1 3 = 1 в которой хх, хг, xk, _у1, ..., ут— произвольные век- торы пространства К, а <х1, а2, ak, Рх, Р2, Рт — любые числа из К. Билинейные формы, заданные в бесконечномерных про- странствах, называют обычно билинейными функционалами. 7.12. Примеры. а. Если Ьг{х) и Z.2 (х)— линейные формы, то А (х, _у) = = £х (x)-L2 (у) является, очевидно, билинейной формой от X и у. б. В л-мерном линейном пространстве с фиксированным базисом е2, ..., еп примером билинейной формы явля- ется функция п п А (х, у) = 2 2 /=1k=\ п п где х= 2 У = 2 ЛА— произвольные /=1 k=i aik(i, k=\, 2, ..., л)— фиксированные числа. векторы и 7.13. Общий вид билинейной формы в л-мер- ном линейном пространстве. Пусть в л-мерном линейном пространстве Кп задана билинейная форма А (х, у). Выберем в К„ произвольный базис е2, . . ., еп. Положим А(е;, ek) = aik(i, Zs — 1, 2, ..., л). Тогда для любых п п 1 = 1 /г=1 согласно формуле (2) ( п п \ А (х, у) = А (^2 *2 ^]kekj = п п п п = 22 А (е<> ел) = 2 2 aik^]k-, 1= 1 k= I i= 1 k= 1 (3)
7.14] § 7.1. БИЛИНЕЙНЫЕ ФОРМЫ 209 Таким образом, в примере б мы имели самый общий вид билинейной функции в л-мерном линейном пространстве. Коэффициенты aik образуют квадратную матрицу. А — А(е> — а11 а12 • • ат а21 а22 • • а2п = 11 ^ll- ап1 ап2 ' • • апп которую мы будем называть матрицей билинейной формы А (х, у) в базисе {е} == {cx, е2, ..., еп]. 7.14. Симметричные билинейные формы; Би- линейная форма наз&вается симметричной, если для любых векторов х и у А (х, у) = А (у, х). Если билинейная форма А (х, у) в л-мерном пространстве К„ симметрична, то = А (<?,•, ек) = А(ек, е{) = ак{-, следовательно, матрица А(е) симметричной билинейной формы в любом базисе ех, е2, . . . , еп пространства К„ совпадает с транспонированной матрицей А'(е). Легко проверить, что верно и обратное: если в некотором базисе {е} = = {ev е2, ... , еп} A'w~A(e}, то форма А (х, у) симмет- рична; в самом деле, в этом случае А (У, х)= 2 а1кт]£к = i, fc=l = 2 = 2 0^zT]* = A(x, у), i, k=l k, » = 1 что и утверждалось. В частности, мы получаем: если матрица билинейной формы А(х, у), вычисленная в некотором базисе, совпадает с транспонированной матрицей, то в любом другом базисе пространства Кп матрица этой фор.мы также совпадает с транспонированной. Матрицу, совпадающую с транспонированной матрицей, мы будем называть в дальнейшем симметричной.
210 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.15 7.15. Преобразование матрицы билинейной формы при переходе к новому базису. а. При переходе к новому базису матрица билинейной формы, разумеется, изменяется; найдем закон ее изменения. Пусть А(е} = || а.][ || — матрица билинейной формы А (х, у) в базисе { е } = { е1, е2, ..., еп } и A(/) = |pZft||— матрица той же формы в базисе {f} — {/х, /2, ..., fn\ (i, j, k, l—\, 2, ..., л), и пусть формулы перехода от одного базиса к другому имеют вид (/=1, 2, ..., л) /=1 с матрицей перехода Р = || ||. В таком случае bik = А fk) = А ( 2 р^, 2 р^еЛ = \/=i J i=i J = 2 PTP^klej, et) = 2 p}bP\k>ajf i. i=i j, 1=1 Полученную формулу мы запишем в виде п п Ь^^Ъ^РГ^РГ, (4) i=i1=1 где рР’=р)х> — элемент матрицы Р', транспонированной по отношению к матрице Р. Формула (4) отвечает следующему соотношению между матрицами (4.43)-. Аф = Р'АмР. (5) б. Так как матрицы Р и Р' невырождены, то в силу 4.67 ранг матрицы А(^) равен рангу матрицы А(е); следова- тельно, ранг матрицы билинейной формы не зависит от выбора базиса. Поэтому имеет смысл понятие ранга билинейной формы, определяемого как ранг матрицы этой формы в любом базисе пространства К„- Если форма А (х, у) имеет ранг л, равный размерности пространства К„, она называется невырожденной формой. в. Пусть А (х, у) — невырожденная форма; покажем, что для каждого вектора х0 =/= 0 существует вектор _у0 £ К„, для которого А (х0, у0) =/= 0. Допустим противное, т. е. что
7.15] § 7.2. КВАДРАТИЧНЫЕ ФОРМЫ 211 А (х0, _у) = 0 при каждом _у£Кп. Построим базис elt ... , еп в пространстве К„ так, что ег = х0. Тогда в матрице формы А (х, у) в этом базисе мы будем иметь при любом т = 1, ... , п = A (*i, em) = A(x0, ет) = О, так что вся первая строка матрицы состоит из нулей. Но тогда ранг этой матрицы < п, что противоречит предполо- жению о невырожденности формы. Это доказывает утверждение. г. Заметим, что форма А (х, у), невырожденная во всем пространстве К, может быть вырожденной на подпростран- стве К'сК. Так, в пространстве R2, где x = ]£i, £а), У = (П1> Пг), Ф0Рма А(х, у) = ^111 — ^2 невырождена; однако на подпространстве R'2 с R2, где £j = £a (и т]1 = т]2), она тождественно равна 0. д. Для определителей наших матриц в силу теоремы об определителе произведения матриц (4.75) получается соотношение det А(/) = det А{е} (det С)2. (6) § 7.2. Квадратичные формы В аналитической геометрии на плоскости одна из основных задач состоит в приведении общего уравнения кривой 2-го порядка к кано- ническому виду путем перехода к некоторой новой системе координат. Уравнение центральной кривой 2-го порядка с центром в начале координат х = 0, у = 0, как известно, имеет вид AxiA‘2Bxy + Cyi = D. (7) Преобразование координат производится по формулам х = аих'+а12/, у = а21х' + а22у', где ац, а12, а21, а22—некоторые числа (обычно синусы и косинусы угла поворота осей). В результате уравнение (7) приобретает более простой вид: А'х'гА-В'у'г = D. Аналогичная задача может быть поставлена в пространстве любого числа измерений. Теория квадратичных форм, излагаемая далее, основной своей целью имеет решение этой задачи и задач, связан- ных с нею.
212 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.21 7.21. Введем следующее определение. Квадратичной формой в линейном пространстве К назы- вается функция А (х, х) от одного векторного аргумента х£К, которая получается из произвольной билинейной формы А (х, у) заменой у на х. В л-мерном линейном пространстве К„ с фиксированным базисом {е } = { ev е2, ...,еп} каждая квадратичная форма в силу формулы (2) имеет вид А (х, х) = 5 2 (8) 1=1А=1 где |2, .. . , — координаты вектора х относительно базиса {в}. И наоборот, если задана функция А (х, х) от вектора х, определяемая в базисе {е} формулой (8), то эта функция представляет собой квадратичную форму от вектора х. Действительно, мы можем ввести билинейную форму п п в (м) = 2 2 i=lк=1 где т]1, т]2, ... , т]„—координаты вектора у относительно базиса {е}; тогда очевидно, что квадратичная форма В (х, х) совпадает с функцией А (х, х). 7.22. Заметим, что в двойной сумме (8) можно совер- шить приведение некоторых подобных членов: при i^k мы имеем 4“ (aik 4~ ^ik^i^k> где &ik ~ ^ik 4” aki’ Для i = k полагаем ьп = ан- В результате двойную сумму можно записать с меньшим числом слагаемых: п А (X, х) = 2 2 biklfek- k= 1 i < k
7.22] § 7.2. КВАДРАТИЧНЫЕ ФОРМЫ 213 Отсюда следует, что две различные билинейные формы А (X, у) = 2 И С(х, у)= 2 I, й=1 I, к=1 можно иногда после замены у на х привести к одной и той же квадратичной форме; для этого нужно только, чтобы имело место равенство aik + aki = cik cki для любых i и k. Таким образом, вообще говоря, нельзя однозначно вос- становить по квадратичной форме породившую ее билиней- ную форму. В одном случае исходная билинейная форма восстанавливается однозначно: именно, если известно, что она была симметричной. В самом деле, если aik = aki, то из уравнения aik -|- aki — bik (при i =£ k) коэффициенты aik одно- значно определяются: и при i=k а вместе со всеми а1к однозначно определяется и вся били- нейная форма. Это утверждение можно доказать и не при- бегая к базису и координатам; в самом деле, по определению билинейной формы А(х+у, х+у) = А(х, х) + А(х, у) + А(у, х)+А{у, у) и при условии симметрии А(х, у)=у[А(х, у) + А(у, х)] = =у[А(х+у, x-j-y) — А(х, х)—А(у, у)]; таким образом, значение билинейной формы А (х, у) для любой пары векторов х, у однозначно определяется по зна- чениям квадратичной формы на векторах х, у и х+у. С другой стороны, чтобы получить из билинейных форм все возможные квадратичные формы, достаточно иметь одни лишь симметричные билинейные формы. В самом деле, если А (х, у)—произвольная билинейная форма, то Ах (х, у) = у [А (х, у) + А (у, х)]
214 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.23 есть симметричная билинейная форма, и А1(х, х) = у[А(х, х)-|-А(х, х)] = А(х, х), т. е. квадратичные формы Аг (х, х) и А (х, х) совпадают. 7.23. В силу всех этих соображений при использовании билинейных форм для изучения свойств квадратичных форм достаточно ограничиться рассмотрением одних только сим- метричных билинейных форм и соответственно симметричных матриц || , ajk = akj. Симметричная матрица А = || || симметричной билиней- ной формы А (х, у), отвечающей квадратичной форме А (х, х), называется матрицей формы А (х, х). При изменении базиса матрица А квадратичной формы А (х, х), совпадающая с матрицей соответствующей сим- метричной билинейной формы А (х, у), меняется так же, как и эта последняя: = Р А^Р, где Р—матрица перехода от базиса {в} к базису {/}. В частности, ранг матрицы квадратичной формы не зависит от выбора базиса. Поэтому можно говорить о ранге квадра- тичной формы А (х, х), подразумевая под ним ранг матрицы этой формы в любом базисе пространства Кл- Квадратич- ная форма ранга п, равного размерности пространства, называется невырожденной. § 7.3. Приведение квадратичной формы к каноническому виду 7.31. Пусть дана произвольная квадратичная форма А (х, х) в л-мерном линейном пространстве К„- Покажем, что в пространстве Кл существует базис {/} = {Д, Д, ••• , Д}> п в котором для каждого вектора х — У fk значение квад- k=i ратичной формы А (х, х) вычисляется по формуле А (х, х) = Дт]? +Х2т]*+. . +V]», (Ю) где Х2, ... , — некоторые фиксированные числа.
7.31] § 7.3. ПРИВЕДЕНИЕ ФОРМЫ К КАНОНИЧЕСКОМУ ВИДУ 215 Всякий базис, обладающий этим свойством, будем назы- вать каноническим базисом формы А (х, х), а выраже- ние (10) — каноническим видом формы А (х, х); в частности, числа %х, Х2, .. . , будем называть каноническими коэф- фициентами формы А (х, х). Пусть {ех, е2, ..., еп} — произвольный базис про- п странства К„; если х = 2 бЛ, то, как мы Уже знаем, k=i форма А (х, х) имеет следующий вид: п А(х, х)= s 2 гш*. (И) k= 1 Согласно 5.32 наше утверждение будет доказано, если мы сможем написать формулы Л1 =Рц£1+/’1г£г+ • • +Р1пВпЛ Ла =PaiBi +Рм £ 2 + • • • +Р2«Вп> I (11') Угг Р,г111 4”Рп2&2 4" • • • 4"Рпп&п J с невырожденной матрицей P=||p(fc|| и такие, что, выражая координаты {£} в формуле (11) через величины {г]}, мы преобразуем формулу (И) к виду (10). Будем вести доказательство индукцией по числу коор- динат, фактически входящих в формулу (И) (т. е. с отлич- ными от нуля коэффициентами). Предположим, что каждая форма, содержащая m—1 координат (например, £х, |2> • • • , может быть при- ведена к каноническому виду (10), с п = т—1 преобразова- нием (И')> также с п = т — 1. Если в формулу (И) фак- тически входит лишь одна координата, например £х, т. е. формула (И) имеет вид А(х, x) = Z>xx£?, то это предположение, очевидно, выполняется (можно взять /?1Х5^0 произвольно). Пусть теперь имеется форма (11) .фактически содержащая т координат £х, £2, . . . , Допустим вначале, что среди чисел &хх, 632, ... , Ьтт имеется число, отличное от нуля; предположим для определенности, что Ьтт =£ 0. Выделим в форме (11) группу членов, содержащих координату ^т;
216 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.31 эта группа имеет вид ~Ь ^2m^2^m ~Ь • • • “Ь^/я-1, т ^т — Ч~ ^тп^т = = bmm ...+^»^_1 + ^у+ \^итт ^итт ^итт / Ч-А^х, х) (12) где через (х, х) обозначена квадратичная форма, зави- сящая только от величин £г, £2, . .. , £от_г. Рассмотрим следующее преобразование координат: Ti = — ?2> ^-1 6»г-1> т — ^1т ? I ^2т ? I I ^т-1. т е де <)к Ы ‘ 9h I • • • 1 о/, Ь/я-1 “ ?т' ^итт Аитт ^итт Матрица этого преобразования невырождена (ее определи- тель равен 1). В новых координатах форма А (х, х) оче- видно, принимает вид А(х, х) = В(х, х) + Ьттх*т, где квадратичная форма В (х, х) зависит только от величин т1; т2, ... , В силу предположения индукции суще- ствует новое преобразование ’ll =/’11'Г1+/’12Тг+ • • • 4"Л, га-1Т/я-1, > Т]2 =/’21Т1+А2Т2+ • • • +Рг, т-1Хт-1> I г1т-1 —Рт-1, Л + Рт-1, 2Т2 Ч~ • • • Ч~Рт-1, т-зУт-! с невырожденной матрицей Р=||рг-7.||, которое приводит форму В(х, х) к каноническому виду В (х, х) = + Ml + • • • + Ья-1Пт-1- Если мы добавим к равенствам (13) еще одно равенство Лиг — то получим невырожденное преобразование координат та, ... , хт в координаты т]х, т]2, ..., т]т, после которого
7.31] § 7.3. ПРИВЕДЕНИЕ ФОРМЫ К КАНОНИЧЕСКОМУ ВИДУ 217 форма А (х, х) примет канонический вид А(х, х) = В(х, х) + Ьттх^ = = М1 + ^2П!+-- - +^Пт- Прямой переход от координат {|} к координатам { г]} в силу 5.33 осуществляется с помощью матрицы, равной произве- дению матрицы перехода от координат { т} к координатам {г]} на матрицу перехода от координат {£} к координатам {т}. Так как обе эти тут- матрицы невырождены, то и тут- матрица-произведение тоже невырождена. Нам остается рассмотреть случай, когда в форме А (х, х) с т координатами |2, ... , все числа ди, а22, .. . , атт равны нулю. Рассмотрим один из членов с отличным от нуля коэффициентом например, пусть а12 ={= 0. Произведем следующее преобразование коор- динат (для удобства рассуждения выпишем переход от новых координат к старым): ? <14> Определитель матрицы преобразования (14) равен —2, и, таким образом, это преобразование снова невырожденное. Член преобразуется следующим образом: схгВх^2 = ахгВ1 ахаВг > поэтому в преобразованной форме появятся сразу два квад- рата координат с ненулевыми коэффициентами (очевидно, что сократиться с остающимися членами эти квадраты не смогут, ибо все остающиеся члены содержат координату U с г >2). Таким образом, в координатах Ц к форме (11) уже можно применить наш индуктивный метод. Итак, форма (11), с любым числом т^.п фактически входя- щих в нее координат приводится к виду (10) преобразо- ванием (ЛГ), где п заменено на т. Дописывая при необходи- мости равенства Лт+х= £л>+1> мы можем до- полнить систему (11') до требуемой системы из п уравне- ний с невырожденной матрицей Р= || ptj. || , i,j= 1, . ..,л, чем доказательство и завершается.
218 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.32 Идея нашего доказательства — последовательное выде- ление полных квадратов—может быть применена и для фактического приведения данной квадратичной формы к ка- ноническому виду. В § 7.5 будет описан другой метод, по- зволяющий непосредственно получить векторы искомого канонического базиса и канонический вид формы. 7.32. Пример. Приведем к каноническому виду форму А(х, = + 5Й-4^3-12^з+4&|-4^4-8^-Й. Дополняем группу членов, содержащую £1( до полного квадрата и полагаем "П1 = 5i Н- %— Тогда форма преобразуется к виду А(х, х)=т]?-4^-4^4-8Ы4-Ь2. Далее дополняем группу членов, содержащую £а, до полного квадрата и полагаем T12 = 2g2+g4, после чего мы будем иметь А(х, х)=т]?—112—^з^- Квадраты координат и £4 отсутствуют. Поэтому мы полагаем ^3 = 113—т. ^ = 1'1з + 'П4. так что ^4 = т|1—г)2. Таким образом, форма А (х, х) приведена к каноническому виду А(х, х) = т]1—Пз—8т]з + 8т]4 преобразованием t1i = 5i + 352 — 2|3, т)2 = 2|г + 54, 1 t , 1 „ 1 F , 1 , 43 — Tj-бз + 'тг Ь4> ’ll — —rySa + 'g+i» которое, как видно из построения, невырождено. 7.33а . Ни канонический базис, ни канонический вид квадратичной формы не определены однозначно. Например, любая перестановка векторов канонического базиса приводит вновь к каноническому базису. В § 7.5, между прочим, будет показано, что для данной квадратичной формы можно по- строить канонический базис, взяв первый вектор этого базиса
7.33] § 7.3. ПРИВЕДЕНИЕ ФОРМЫ К КАНОНИЧЕСКОМУ ВИДУ 219 в пространстве произвольно (за некоторыми редкими исклю- чениями). Далее, если форма А (х, х) записана в канониче- ском виде А (х, х) = XjT]? + Х2т)| 4- ... 4- (Ли 112> • • • > Лп—координаты вектора х), то преобразование координат П1 = «Л, Ла = а2т2» ПВ = «Л„ (аь аа, .. . ,а„—фиксированные числа, все отличные от нуля, 14, та, . ..,т„— новые координаты) приводит форму А (х, х) к новому виду, также каноническому, но с другими коэф- фициентами: А (х, х) = (А^оф т? 4- (k2a?) *1 + • • • + (^пап) т£. Поэтому встает вопрос об описании всех канонических видов, к которым можно привести данную квадратичную форму. Этот вопрос будет уточнен, если мы сузим определение кано- нического вида (например, как это будет сделано в веще- ственном пространстве, 7.93) или сузим класс допустимых преобразований координат (например, как это будет сделано в евклидовом пространстве (10.12)). б. Заметим, что в приведенном примере число коэффи- циентов, отличных от 0, осталось неизменным. Вообще, число ненулевых канонических коэффициентов, очевидно, есть ранг матрицы квадратичной формы в соот- ветствующем каноническом базисе. Поскольку ранг матрицы квадратичной формы не зависит от выбора базиса (7.23), число ненулевых канонических коэффициентов квадратичной формы не зависит от выбора канонического базиса. Это число, очевидно, совпадает с рангом квадратичной формы (7.23). Зная матрицу формы А (х, х) в каком-либо базисе {е}, мы можем предсказать число ее ненулевых канонических коэф- фициентов— это число есть ранг формы А (х, х), который можно вычислить как ранг матрицы формы А (х, х) в базисе (е). В частности, у невырожденной формы (7.23) в любом каноническом базисе все ее канонические коэффициенты отличны от 0.
220 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [741 § 7.4. Канонический базис билинейной формы 7.41а . Вектор хг называется сопряженным с вектором _ух относительно билинейной формы А(х,_у), если А(х11<у1) = 0. б. Пусть —матрица формы А (х, у) в каком-либо базисе ...,еп. Если = У1= Ут0 условие сопряженности векторов хг и у± записывается в виде А(х1,^1)= 2 ajk^k = ^- j, k= i в. Если векторы хх, х2, ... , xk сопряжены с вектором. уи то также сопряжен с вектором. уг любой вектор подпро- странства L (хх, х2, . .., xk)—линейной оболочки векторов х1( х2, ...,х*. Действительно, в силу свойств билинейной формы А (ахХ1 + а2х2 + ••• 4“aAx*>Ji) = = ах А (хг, ух) + а2А (х2, ух) + • • + А (хк, уг) = 0. Если вектор уг сопряжен с каждым вектором некоторого под- пространства К' с К, мы будем называть этот вектор сопря- женным к подпространству К'. г. Совокупность К" всех векторов yr £ К, сопряженных к подпространству К/, очевидно, является, подпространством пространства К. Это подпространство К" мы будем называть сопряженным к К*. 7.42. Базис elt е2, ...,еп пространства К называется каноническим базисом для билинейной формы А(х,у), если базисные векторы взаимно сопряжены: A (ez, ek) = 0 при i -=у= k. Пример. В пространстве Vs в качестве билинейной формы А (х, у) рассмотрим скалярное произведение векторов х и у. Сопря- женность векторов относительно этой билинейной формы равнозначна, очевидно, их ортогональности. Каноническим базисом в этом случае служит любой ортогональный базис пространства Е3. 7.43. Матрица билинейной формы в каноническом базисе имеет диагональный вид, так как aik = А (е;-, ек) = 0 при i^=k. Диагональная матрица совпадает со своей транспони- рованной, поэтому билинейная форма, обладающая канони-
7.44] § 7.4. КАНОНИЧЕСКИЙ БАЗИС билинейной формы 221 ческим базисом, должна быть симметричной*). Покажем, что каждая симметричная билинейная форма А(х,_у) обладает каноническим базисом. Рассмотрим квадратичную форму А (х, х), соответствую- щую данной билинейной форме А(х,у). Мы знаем, что в пространстве К существует базис ег, е2, •, еП1 относи- тельно которого квадратичная форма А (х, х) записывается в каноническом виде п А (х, х) = 2 ХД?. /= 1 Соответствующая симметричная билинейная форма А (х,.у) согласно формуле (9) имеет канонический вид п А (х, .у) = 2 М(г]<- (15) /=1 ^где ее матрица, следовательно, диагональ- \ '=1 / ная. Но это и означает, что базис elt е2, ., еп является каноническим для формы А (х, у). 7.44. В аналитической геометрии доказывается, что гео- метрическое место середин хорд кривой 2-го порядка, парал- лельных заданному вектору, есть прямая линия. Приведем доказательство этой теоремы. На плоскости xlt х2 уравнение кривой 2-го порядка имеет вид filial + 2а12х1х2 + а22х\ + Ьххх + Ь2х2 + с = О, или А (х, х) + L (х) + с = О, где А (х, х) — auXi + 2а12ххх2 + а22х% есть квадратичная, а L (х) = ЬгХу + Ь2х2 —линейная форм.а от вектора х = (хг, х2). *) Вспомним, что симметричность или несимметричность билиней- ной формы — факт, не зависящий от выбора базиса (7.14).
222 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.45 Пусть вектор х определяет середину хорды, параллель- ной фиксированному вектору е. Это означает, что для не- которого t=/=Q удовлетворяются равенства А (х + /е, х + te) + L (х + te) + с = 0, 1 А (х — te, х — /e)-j-L(x— /е)-|-с = 0. J Пусть А(х,у)— симметричная билинейная форма, отве- чающая квадратичной форме А (х, х); тогда равенства (16) можно записать так: А (х, х) + 2Z А (х, е) -j- /2А (е,е) + L (х) +tL (е) + с = О, А (х, х) — 2t А (х, е) + г<2А (е,е) +L (х) — t L (е) с = 0. Вычитая второе из первого и сокращая на 21, находим 2А(х, e)+L(e) = 0. (17) Полученное уравнение линейно относительно х и, сле- довательно, определяет прямую в плоскости хх, х2, что и до- казывает теорему. Если х' — другая точка этой же прямой, так что 2А(х', e)+L(e) = 0, (18) то, вычитая (17) из (18), мы получаем А (х — х', е) = 0, т. е. вектор е и вектор х — х', определяющий направление полученной прямой, сопряжены друг другу в смысле 7.41 относительно билинейной формы А(х,у). 7.45. Пусть elt . .., ек— канонический базис формы А (х,у) в ^-мерном подпространстве К'сК. Пусть е1, . . . , ел — соот- ветствующие канонические коэффициенты. Выразим числа А (х, е7) через координаты вектора х^К'. Мы имеем / k \ (^» £у) = ( .2 j = * = 2 Sy А (еу> ₽,•) = В,- A (ez, ej = i=i так что числа А (х, е() однозначно определяются координа-
7.52] § 7.5. ПОСТРОЕНИЕ БАЗИСА ПО МЕТОДУ ЯКОБИ 223 тами вектора х. Если форма А(х,у) невырождена в под- пространстве К', то числа е,- отличны от нуля; в этом случае справедливо и обратное — значения формы А (х, е() одно- значно определяют координаты вектора х. § 7.5. Построение канонического базиса по методу Якоби 7.51. Построение канонического базиса, приведенное в 7.31, имеет тот недостаток, что оно не дает возможности непосредственно, по элементам матрицы А(/) симметричной би- линейной формы А (х,у) в заданном базисе (/} = указать коэффициенты 1,- и координаты векторов канони- ческого базиса. Метод Якоби, излагаемый далее, позволяет находить эти коэффициенты и координаты векторов искомого канонического базиса. Но при этом на матрицу А(/) мы на- ложим следующее дополнительное условие: угловые миноры матрицы Д(/) до (л — 1)-го порядка включительно 6Х — <zu, 62 — ап а12 Й21 °22 а11 а12 • • • а1, п-1 а21 а22 • • • а2, п-1 ал-1,1 ап-1,2 ••• ап-1,п-1 все должны быть отличными от нуля. 7.52. Векторы et, е2, .. ., еп мы построим по формулам е2= “V’/i+A, ^ = al2,/i + a<2)/2+/3) ^+i = a,?/i + a<2ft’/2 + a>,A+ ••• +<4*’Л+Л+1, \ = аГ’Л +аГ1,7а+аГ1',Л+ • • +аГ11’/„-1+Л, , (19) где коэффициенты a-k> (z = 1, 2, . .., k; £—1,2.п— 1) еще должны быть определены.
224 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.52 Заметим прежде всего, что переход от векторов Д,Д, ...,Д к векторам elt е2, ...,ек совершается при Помощи матрицы 10 0 ... 0 0 al1’ 1 0 ... О О а^-1) а(/~1> а^-1> . . . а^.-/’ 1 с определителем, равным единице; поэтому для k — 1,2, .. ., п векторы Д, Д, ..., Д могут быть линейно выражены через ех, е2, • • • > ekt и> следовательно, линейная оболочка L(Д, Д, . ..,Д] совпадает с линейной оболочкой L [ех, е2..eft]. Коэффициенты а)*’ (/= 1, 2, ...,&) мы подчиним условию, чтобы вектор ек+1 был сопряжен с подпространством L (ех, е2, . . . , ек). Для этого необходимо и доста- точно, чтобы выполнялись равенства А(^+1,Д) = 0, А(ей+х,Д) = 0, ..., А(да+х,Д) = 0. (20) Действительно, из условий (20) вытекает, что вектор ек+1 сопряжен с линейной оболочкой векторов Д, Д, . . . , Д, которая по доказанному совпадает с линейной оболочкой векторов ех, е2, ..., ек. Обратно, если вектор ек+1 сопряжен с подпространством L[ех, е2, . . ., ек], то он сопряжен с каж- дым вектором этого подпространства и, в частности, с век- торами Д, Д, ...,fk, поэтому выполняются равенства (20). Подставляя в формулы (20) выражение ек+1 (19) и поль- зуясь определением билинейной формы, получаем систему уравнений относительно величин a)ft’(i = 1,2, . . k): А (еА+х, Д) = ар А (Д, Д) + ар А (Д, Д) + . . . +<А(Д,Д) + А(Д+х,Д) = 0, А {ек+1> f2) = ар А (Д, Д) + ар А (Д, Д) + ... ...+а^’А(Д,Д) + А(Д+Х1Д) = 0, (21) А (д+1, Д) = ар А (Д, Д) + ар А (Д, Д) + . .. •••+^’А(Д,Д) + А(Д+Х1Д) = 0. Эта неоднородная система уравнений с коэффициентами А (Д Д) = ciij (/,/=1,2, ... , k) имеет по условию отличный
7.53] § 7.5. ПОСТРОЕНИЕ БАЗИСА ПО МЕТОДУ ЯКОБИ 225 от нуля определитель и поэтому однозначно разрешима; следовательно, можно определить величины a)fe) и тем самым построить искомый вектор ek+1. Для определения всех коэффициентов a)ft) и всех векто- ров ek нужно при каждом k разрешить соответствующую систему (21), следовательно, всего разрешить п — 1 систем линейных уравнений. 7.53. Обозначим координаты вектора х в построенном ба- зисе ех, е2, . . ,,е„ через Вх, |2, . . ., и координаты векто- ра у в этом базисе соответственно через т]2, ... , т]„. Билинейная форма А (х, у) в этом базисе принимает вид п А(х,у) = 2М,1Ъ-. (22) /=1 Чтобы вычислить коэффициенты Ху, будем рассуж- дать следующим образом. Рассмотрим нашу билинейную фор- му А(х,у) только в подпространстве Lm = L(^1, е2, . . ., ет), где m^Zn. Форма А(х,у) в базисе Д,/2, .. . ,подпро- странства Lm имеет, очевидно, матрицу а11 а12 • • а1т а21 а22 • • • а2т апЛ ат2 • • • атт а в базисе ех, е2, . . ., ет — матрицу Х2 Матрица перехода от базиса Д,/2, • • • > Z» к базису е2, . . ., отвечающая формулам перехода (19), имеет, как мы видели, определитель, равный 1. В силу формулы
226 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.54 7.15 (6) мы должны иметь det «и «12 а21 а22 а1т а2т = det Х2 ат1 ат2 или, используя обозначения угловых миноров 7.51, ~ ^>1^2 • 1, 2, .. ., п). (23) Из формулы (23) непосредственно вытекает, что %1 = 61 = «11, Х2 = ^, Х3 = ^,...ДП = -А-. (24) Формулы (24) позволяют найти коэффициенты билинейной формы в каноническом базисе, не вычисляя самого базиса. 7.54. Обратим внимание на k-ю формулу в системе (19); запишем ее в форме А+1 = ——a^’A + ^+i = ^ + ^+i. В этой формуле вектор gk лежит в подпространстве L (/i, . . ., Д), a ek+1 сопряжен к этому подпространству. Коэффициенты ..., сД4) определяются, причем един- ственным образом, из системы (21), при условии, что det ||А (/,-,/у)|| =7^ 0 (г, j = 1, . . ., k), или, что то же, при условии, что форма А (х,у) на подпространстве L(/j, . . . ,Д) невырождена. Так как вектор fk+1 был в этом построении произвольным, то, обозначая f=fk+n S~ ^l==ek+i> L (/i, • ••,/*) = К'czK, мы приходим к следующей теореме: Теорема. Пусть вектор f не принадлежит к подпро- странству К'сК, на котором форма А(х,у) невырождена. Тогда существует (и единственно) разложение f=g+h, (25) где g€K', а 1г сопряжен с пространством К'. 7.55. Обозначим через К" подпространство, сопряженное к подпространству К' относительно формы А (х, у). Наличие разложения (25) вместе с его единственностью по- казывает, что все пространство К есть прямая сумма подпро-
7.61] § 7.6. СОПРЯЖЕННЫЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 227 странств К' и К" (2.45). Итак, имея подпространство К'сК, на котором (заданная во всем пространстве К) форма А (х, у) невырождена, можно осуществить прямое разложение К = К' + К", где подпространство К" сопряжено с К' относительно формы А(х,у). § 7.6. Сопряженные линейные операторы 7.61. Фиксируем в пространстве К„ билинейную невырож- денную симметричную форму, которую будем обозначать в этом параграфе через (х,у). Пусть А и В — линейные операторы, действующие в пространстве К„. Образуем функ- ции А (х, у) и В (х, у) от двух векторов х, у по формуле А (х, у) = (Ах, у), В (х, _у) = (х, В_у). Проверим, что полученные функции А(х,у) и В(х,_у)—би- линейные формы. Действительно, на основании определений линейного оператора (4.21) и билинейной формы (7.11) имеют место равенства А (хх + х2, у) = (А (хг + х2), у) = (Ахх + Ах2,_у) = = (Ахр у) + ( Ах2, у) = А (х1; j) + А (х2, у), А (ах, у) = (А (ах), у) — (а А (х), у) = а (Ах, у) = а А (х, у), которые показывают, что А (х, у) линейна по первому аргу- менту. Линейность А(х, у) по второму аргументу следует из того, что (х,у) линейна по у. Таким образом, А(х,у) — билинейная форма. Аналогично и В(х,_у)— билинейная форма. Пусть elt . . ., еп — канонический базис для формы (х,у)-. («/, ек) = 0 при /=# k, (ет, ет) = гт^К,гт^ 0. Сравним в этом базисе матрицу оператора А и формы А (х,у). Матрица оператора А определяется из формул Ае-= 2 ек, fe=i (здесь верхний индекс указывает номер строки, нижний — номер столбца). Матрица ||ауЛ|| формы А (х, у) (первый ин- декс— номер строки, второй — номер столбца) определяется
228 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.62 из формул ajm = А (*/. = (А «/> ет) = ( 2j 4'’ ет = а£(ет,ет) = ета£. (26) Следовательно, т-й столбец матрицы ||а7-га|| получается умно- жением от-го столбца матрицы \\а£|| при каждом т= 1, . . ., п на канонический коэффициент ът формы (х,у). Для матрицы H&V’il оператора В (в том же базисе elt ..., е„) и матрицы формы В(х,.у) аналогично получаем = ет) = (ер Вет) = е,, 2 = (27) 1 / т. е. /-я строка матрицы || bjm || получается умножением у'-го столбца матрицы оператора В при каждом /== 1, . .. , п на соответствующий канонический коэффициент е;. 7.62. Пусть, обратно, в пространстве К„ заданы били- нейные формы А (х, у) и В(х, у); мы утверждаем, что существуют линейные операторы А и В такие, что А (х, у) = (Ах, у), В(х, у) = (х, By), причем они определены единственным образом. Для доказательства зададим операторы А и В в каком- либо базисе е1( . . . , еп матрицами соответственно из чисел аГ==±А(еу, ея), ^’ = 1в(ау, ет). ст ] По этим операторам построим формы Ax(x, _у) = (Ах, .у) и В1(х, у) = (х, By). По доказанному, в базисе е1; . . . , еп матрица формы Ах(х, у) совпадает с матрицей формы А (х, у), а матрица формы Вг(х, .у) совпадает с матрицей формы В(х, .у). Но тогда дл? любых х и у из К„ (Ах, у) = Ах (х, у) = А (х, у), (х, В.у) = Bi (х, у) = В(х, у), так что операторы А и В удовлетворяют требуемым усло- виям. Для доказательства единственности нам достаточно
7.63] § 7.6. СОПРЯЖЕННЫЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ 229 проверить, что если некоторый оператор А удовлетворяет условию (Ах, у) = 0 (при любых х, у из К„), (28) то Ах = 0 (29) при каждом xgK„, т. е. А — нулевой оператор. Пусть для некоторого х0 С К„ мы имеем Ах0 =/= 0. Тогда, поскольку форма (х, у) невырождена, в силу 7.15в суще- ствует вектор у0£К„ такой, что (Ах0, у0) 0; это проти- воречит (28), откуда и следует требуемая единственность. 7.63. Теперь мы установим следующую важную теорему. Теорема. Если в пространстве К„ выделена невырож- денная билинейная симметричная форма (х, у), то для каждого линейного оператора А существует и единствен линейный оператор А', удовлетворяющий уравнению (Ах, у) — (х, А у) при любых х и у из К„. Матрица оператора А' в любом каноническом базисе формы (х, у) получается из матрицы оператора А транспонированием, умножением m-й строки на ет и делением j-го столбца на ej (j, m=l, . . . , п). Доказательство. По заданному оператору А по- строим форму А (х, у) — (Ах, у) и затем определим оператор А' из уравнения (Ах, у) = А (х, у) = (х, А у). Существование и единственность оператора А' следуютиз 7.62. Матрица || а$ || оператора А, матрица || ajm || формы А (х,у) и матрица Ц а}<т) || оператора А' связаны в любом канони- ческом базисе формы (х, у) формулами (26)—(27) так что (30) и теорема полностью доказана.
230 гл. 7• билинейные и квадратичные формы [7.64 Оператор А' называется сопряженным к оператору А относительно формы (х, у). 7.64. Операция перехода к сопряженному оператору А—» А' обладает следующими свойствами: а) (А')' = А для любого оператора А; б) (А + В)' = А' + В' для любых А и В; в) (ХА)' = ХА' для любого оператора А и любого г) (АВ)' = В'А' для любых А и В. Равенство а) вытекает из определения (А')': (х, (А')'у) = (А'х, у) = (х, Ау) и единственности оператора, определяемого билинейной фор- мой (7.62). Аналогично получаются и остальные утвержде- ния; так, б) вытекает из соотношений (х, (А + В)'у) = ((А + В) х, у) = (Ах, у) + (Вх, у) = = (х, А'у) + (х, В'у) = (х, (А' + В')у); в) вытекает из соотношений (х, (ХА)'у) = (ХАх, у) = X (Ах, у) = Х(х, А'у) = (х, ХА'у), и, наконец, г) — из соотношений (х, (АВ)'у) = (АВх, у) — (Вх, Ау) —(х, В'А'у). 7.65. Отметим еще одну связь между операторами А и А'. Пусть подпространство К'сК„ инвариантно относительно оператора А; это означает (4.81), что каждый вектор х £ К' переводится оператором А снова в вектор из того же под- пространства К'. Пусть К" — подпространство, сопряженное к К' (7.41г). Покажем, что оператор А' инвариантен отно- сительно подпространства К". Пусть у £ К", так что (у, х) = О для любого х£К'. Мы имеем (А'у, х) = (у, Ах) = 0, так как Ах вместе с х лежит в К'; но это означает, что век- тор А'у сопряжен всем векторам х^К' и входит тем самым в К", что и требуется.
7.72J § 7.7. ИЗОМОРФИЗМ ПРОСТРАНСТВ 231 § 7.7. Изоморфизм пространств с выделенной билинейной формой 7.71. Определение. Два линейных пространства К' и К" над одним и тем же числовым полем К с выделенными в них билинейными симметричными формами А(х', .у') и А (х", у") называются А-изоморфными, если они изоморфны как линейные пространства над полем К (2.71),— т. е. существует взаимно однозначное отображение (морфизм) (»х' = х", сохраняющее линейные операции,—и, кроме того, для соответствующих друг другу пар элементов сох' = х", а>у'—у" значения форм А(х', у') и А (х", у") совпадают: A (cox', <оу') = А(х', .у'). 7.72. Имеет место следующая теорема: Теорема. Для того чтобы конечномерные линейные пространства К' и К", снабженные формами А (х', у') и А (г", у"), были А-изоморфны, необходимо и достаточно, чтобы К' и К" были равной размерности п и чтобы в К/ и К" существовали канонические базисы форм А (х', у') и А (х", у”) с одинаковым набором канонических коэффици- ентов gj, . . . , е„. Доказательство. Предположим, что пространства К' и К", снабженные формами А(х', у') и А (х", у"), явля- ются А-изоморфными. Тогда они изоморфны как линейные пространства и, следовательно, имеют равную размерность (2.71). Возьмем произвольный канонический базис е1, ..., еп формы А(х', у’) в пространстве К'. Мы имеем ( 0 А (4 = | g_ при I Ф j, при i — j. Пусть e"lt ..., е”п—векторы в К", отвечающие векторам e'lt . .., е’п пространства К' в силу имеющегося А-изомор- физма. По условию А (4 e”j) — при i j, при i = j. Мы видим, что у формы А (х", у") имеется канонический базис в пространстве К" с тем же набором канонических
232 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.73 коэффициентов elf . . . , е„, что и у формы А (х', у'). Та- ким образом, необходимость условия теоремы установлена. Для доказательства достаточности рассмотрим канониче- ские базисы е[, ., е'п (в К') и ej, . . ., е"п (в К") с одинаковым набором канонических коэффициентов, так что А (су, су) А (су, су) — О при 8(* При i = j. Положим ДЛЯ любого х' =2 ^;ек' х" = co(x') = 2V^K" с теми же координатами 5/. Такое соответствие определит изоморфизм пространств К' и К" (2.74). Мы имеем, далее, при у’ = 2%^, У" = ® (/) = ^ke"k А(х', x") = 2e»Vlfe = аСу', У')> так что изоморфизм со является и А-изоморфизмом. Теорема доказана. 7.73. Пусть имеется л-мерное пространство К„ с фикси- рованной невырожденной билинейной формой А (х, у). Рас- смотрим А-изоморфизм пространства К„, т. е. линейное обратимое отображение у —> Qx, не изменяющее форму А(х, у): A (Qx, Qy) = A(x, у). (31) Будем далее форму А (х, у) короче обозначать через (х, у). Обозначая через Q' оператор, сопряженный к оператору Q относительно формы (х, у) (7.63), имеем (Qx, Qy) = (QzQx, у). (32) Так как оператор Q' невырожден вместе с оператором Q, из (32) следует Q'Q = E, (33) т. е. Q' является обратным оператором для оператора Q. Обратно, из (33) следует (32) и далее (31), так что равенство (33) полностью определяет класс операторов, не изменяющих форму (х, у). Эти операторы будем называть инвариантными относительно формы (х, у).
7-76] § 7.7. изоморфизм пространств 233 7.74. Вместе с оператором Q обратный оператор Q-1 = Q' также является инвариантным, так как для любых х и у (Q'x, Q» — (QQ'x, у) = (х, у). Произведение двух инвариантных операторов Q и Т также является инвариантным оператором, так как для любых х и у (QTx, QTjz) = (Tx, Ту) = (х, у). 7.75. Применяя инвариантный оператор Q к векторам е1г . . еп канонического базиса формы (х, у) с коэффи- циентами ех, . , е„, мы получаем векторы /1 = Qe1, ...,/„ = Qp„. (34) При этом ( е,- при k = j, приА=А. Таким образом, /х, . . ., fn есть также канонический базис формы (х, у) с теми же каноническими коэффициентами ei, е„. Обратно, если /х, ...,/„ есть канонический базис формы (х, у) с теми же каноническими коэффициентами 8Х, ..., е„, что и в базисе elt ..., еп, то оператор Q, определенный по формулам (34), является инвариантным. Действительно, мы имеем ( 8,- при k — j, ^) = {0\ри^7- Мы видим, что равенство (31) справедливо для любой пары базисных векторов. Отсюда, по линейности, оно справедливо для любой пары векторов х, у из Кп, что и требуется. Итак, инвариантный оператор Q характеризуется тем, что всякий канонический базис пространства К„ (относительно формы (х, у)) он переводит снова в канонический базис с теми же самыми каноническими коэффициентами. 7.76. Найдем условия, определяющие матрицу любого инвариантного оператора в каноническом базисе формы (х, у). Пусть ех, ..., еп — такой базис и 8Х, ..., 8„ — соответ- ствующие канонические коэффициенты. Пусть, далее,
234 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.76 Q = Ill’ll—матрица оператора Q в этом базисе. Матрица сопряженного оператора имеет вид (7.63) Q=II<7z II, 4t =^чТ- Равенство (33) теперь можно записать в координатной форме Д, </> •А е,- 1’1 при j=k, Иначе говоря, П 1 Ь v-, , . . — при /=я, 8у (35) j=i ‘ [0 при /=#А. Равенство (35) эквивалентно (33) и поэтому также может служить определением инвариантного оператора Q. Итак, матрица инвариантного оператора в любом кано- ническом базисе формы (х, у) (инвариантная матрица) ха- рактеризуется тем, что сумма квадратов элементов ее /-го столбца с коэффициентами е^1, •••, е^1 равна числу еу*1 (/=1, ..., п), а сумма произведений соответствующих элементов двух различных столбцов с коэффициентами Ej, . . ., е„ равна 0. Так как из (33) следует также QQ' = Е, то имеют место и равенства m tn k=i k-i или m ( при 7у=/я (35) Мы получаем вторую характеристику инвариантной матри- цы: сумма квадратов элементов ее /-й строки с коэффици- ентами Ej, . . . , е„ равна числу еу., сумма произведений соответствующих элементов двух различных строк также С коэффициентами elt . .. , е„ равна 0,
7.82] § 7.8. полилинейные формы 235 § 7.8* . Полилинейные формы 7.81. По аналогии с билинейными формами можно рас- сматривать линейные функции от большего числа векторов (трех, четырех и более). Все они называются полилинейны- ми формами. Определение. Функция A (хп . . xk) от k векторных аргументов хх, . .. , хк, меняющихся в линейном простран- стве К, называется полилинейной (точнее, k-линейной] формой, если она линейна по любому аргументу Ху(_/'=1, ...,£) при фиксированных значениях остальных аргументов хь ... . . . , Ху.!, Xy+V .. . , хк. Полилинейная форма А(хх, х2, ..., хк) называется симметричной, если она не изменяется при перемене места- ми любых двух своих аргументов, и антисимметричной, если при перемене местами двух своих аргументов она изменяет знак. Примером полилинейной антисимметричной формы от трех векторов х, у, z (трилинейной формы) в пространстве V3 является смешанное произведение этих векторов. Примером полилинейной антисимметричной формы от п векторов в пространстве Кп Х1 — {«11, «12, •• > «1п|, ^2 “{«21, «22, , «2п}> *п={«п1, «п2, • • , апп} является определитель «11 «12 а1п ап1 ап2 • апп Несколько более общим примером является произведение определителя (36) на фиксированное число а £ К- 7.82. Покажем, что всякая полилинейная антисимметрич- ная форма А (хх, х2, . . . , х„) от п векторов ху, х2, ... . . . , хп в п-ме'рном линейном пространстве К„ с фиксирован- ным базисом ех, ег, . . . , еп равна определителю (36) с не- которым постоянным множителем а £ К,-
236 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.82 Обозначим через а величину А(ех, е2, , еп). Тогда легко подсчитать величину А (е^, eit, .. . , е,л), где ilt i2, .. . ... , in — любые целые числа от 1 до п. Если среди этих чисел имеются два равных, то величина A(eZi, е^, . . . , ein) равна нулю, ибо при перестановке соответствующих аргументов она не изменяется, в то время как по свой- ству антисимметрии она должна изменить знак. Если все числа г2, . . . , in различны, то, произведя столько пере- становок соседних аргументов, сколько беспорядков в после- довательности индексов i\, i2, ..., i„*),— обозначим это число через N,— можно добиться нормального расположения аргументов; отсюда А (е •, е •, ... , е- ) — (—1 )Na. Пусть теперь xi=^%aiiei (* = 1, 2, ... , л) Z=i есть произвольная система п векторов пространства Кп. Составим полилинейную форму A (хх, х2У ... , х„): А(хх, х2У ... , хп) = / п п п \ = А 2 2 а^еь’ • • • ’ 2 “«<•/'» = М1 = 1 4 = 1 *П=1 / п = 2 = «1. <2.'П=1 = а 2 (—••• anin. 4» •••» in— 1 Так как в каждом слагаемом получившейся суммы AZ озна- чает число беспорядков в расположении вторых индексов элементов при нормальном порядке первых индексов, то каж- дое слагаемое есть один из членов определителя (36) с по- ложенным этому члену знаком. Сумма всех этих членов равна поэтому самому определителю (36). Таким образом, наше утверждение доказано. *) Ср. доказательство теоремы 4.54.
7.91] § 7.9. ФОРМЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 237 В частности, мы показали, что смешанное произведение трех векторов х, у, z пространства V3 в любом базисе за- писывается как определитель 3-го порядка из координат этих векторов с коэффициентом, равным смешанному про- изведению базисных векторов. § 7.9. Квадратичные и билинейные формы в вещественном пространстве 7.91. У вещественных чисел определены знаки (Дили—), поэтому для билинейных и квадратичных форм в веществен- ном пространстве теория может быть продвинута несколько далее, чем в пространстве над произвольным полем К. Согласно общей теореме 7.31 квадратичная форма А (х,х) в некотором базисе приводится к каноническому виду А (х, х) = М?+ • • • + Ш Среди чисел Д, . . . , А.„ имеется столько отличных от нуля, каков ранг формы А (х, х) (7.33 б). Они положительны или отрицательны. Оказывается, что число положительных и число отрицательных канонических коэффициентов также не изменяются при изменении канонического базиса. Теорема. (Теорема инерции квадратичных форм.) Число положительных и число отрицательных коэф- фициентов в каноническом виде квадратичной формы А(х, х) являются инвариантами формы (т. е. не зависят от выбора канонического базиса). Доказательство. Пусть задана квадратичная форма А (х, х). В некотором базисе {е} = {ех, е2, ..., еп} она имеет вид п А (х, х) = 2 I, k=i где |2, ..., Д—координаты вектора х относительно базиса {е}. Допустим, что она обладает двумя канонически- ми базисами {/} = {Д, Д, . .. , Д} и {g} = {gl, gi, .... gj. Обозначим через т^, т]2, ... , г]я координаты вектора х в базисе {/} и через т1; т2, . . . , т„—в базисе {g}. Соот- ветствующие формулы преобразования координат пусть
238 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.91 будут следующими: Л1 — ^1151 + ^12^2+ • • +^1п5л! т1=с1151 +с12?2 + • • • +с1п5п> Т]2 = ^21ё1 + ^22^2 + ••• +^2л5;г: Т2 = с2151 + с22?2 + • + с2гЛп > .(37) Пл ~ ^«151 + + • • • + ^пл5л’ ~ СЛ151 + ^п2^>'2 + • • • + Слл5л- > В базисе {/} форма А (х, х) имеет вид А(х, x) = «iT]i+•••+аА'Пл—aA+iT[ft+i—адат1т, (38) а в базисе {§•} соответственно А (х, х) = - М + М + • + - ₽;,+1т*+1 - ... - pgT*. (39) Числа Op а2, . . . , ат, pv Р2, . . . , Р? предполагаются положительными. Мы покажем, что k=p, m~q. При- равнивая правые части равенств (38) и (39) и перенося отрицательные члены в противоположные части равенства, мы получаем ain? + <Vll+ • • • +а*П* + ₽г+1^+1+ • • +М? = = «Л+1П1+1 + • • + + 01*1 + • • • + Ррт®. (40) Допустим, что k < р. Рассмотрим тогда векторы х, удов- летворяющие условиям: Л1=о, п2 = о, ..., п* = 0, ) т>+1 = 0, ... , т9 = 0, т?+1 = 0, ... , т„ = 0. j Этих условий, очевидно, меньше чем п, так как k <Zp. Подставляя выражения i)1; • • • , Л*, тр+и • • • , *п через координаты {£} по формулам (37), мы получаем однородную систему линейных уравнений относительно координат (|); число уравнений меньше числа неизвестных, и, следователь- но, эта однородная система допускает ненулевое решение х = g2, .. . , £„}• Но, с другой стороны, всякий вектор х, удовлетворяющий условиям (41), в силу равенства (40) удов- летворяет и условиям тх = т2 = . .. = = 0. Вектор, для которого тх — т2 = ... = хр = тг+1 = . .. = т„ = 0, необходимо есть нуль-вектор, и для него все координаты {£} также должны быть равны нулю. Полученное противо-
7.92] § 7.9. ФОРМЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 239 речие показывает, что предположение k < р не может осу- ществиться. В силу полной симметрии чисел k и р в рассматривае- мой задаче также не может осуществиться и предположение р < k. Отсюда А — р. Далее, если рассмотреть условия тх = 0, т2 = 0, .. . , 1^ = 0, Па+1 = 0> • • .,T]m = 0, r)m+i = 0, . ..,пл = 0, тем же приемом можно опровергнуть предположение т < q и по симметрии q < т. Таким образом, окончательно полу- чаем, что k=p, m = q, что и требовалось. 7.92. Полное число членов, входящих в канонический вид квадратичной формы А (х, х), т. е. ее ранг (7.336), называется также ее индексом инерции; число положитель- ных членов называется положительным индексом инерции, число отрицательных членов — отрицательным индексом инер- ции. Если при этом положительный индекс инерции равен размерности пространства, форма называется положительно определенной; иными словами, квадратичная форма положи- тельно определенная, если все п ее канонических коэффи- циентов положительны. Тем самым положительно определен- ная форма в каждой точке пространства, кроме начала ко- ординат, принимает положительное значение. И обратно, если некоторая квадратичная форма в л-мерном пространстве при- нимает всюду, кроме начала координат, положительные зна- чения, то ее ранг равен л и положительный индекс инерции также равен л, т. е. форма положительно определенная. Действительно, для формы ранга, меньшего л, или имею- щей меньшее, чем л, число положительных канонических коэффициентов, легко указать точки в пространстве, отлич- ные от начала координат, где эта форма принимает отри- цательное значение или нулевое. Например, форма ранга 2 в трехмерном пространстве А(х, = + принимает нулевое значение на любом векторе с коорди- натами ^ = 0, =/=(), £3 = 0. Форма ранга 3 в трехмерном пространстве А(х, х) = ^-У + В32 принимает на тех же векторах отрицательные значения.
240 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [7.93 7.93. Теорема инерции, доказанная нами для квадратич- ных форм, непосредственно переносится и на симметричные билинейные формы: именно, число положительных и отрица- тельных коэффициентов канонического виса (22) билинейной формы А (х, у) не зависит от выбора канонического базиса. Поэтому для симметричной билинейной формы имеют смысл понятия положительного и отрицательного индексов инер- ции. Значения положительного и отрицательного индексов инерции билинейной формы А (х, _у) и, следовательно, квад- ратичной формы А(х, х) могут быть определены по знакам угловых миноров матрицы формы в каком-либо базисе (если только эти миноры отличны от нуля) по формулам (24). Заметим, что в вещественном пространстве Rn всегда можно для данной квадратичной формы А (х, х) найти ка- нонический базис такой, что все канонические коэффи- циенты будут числами +1 или •—1- Для этого, приведя форму А (х, х) к виду А (х, х) = Х1т?+ ... 4-X.ytp — — HiTp+i— • • — гДе • • • > Hi, Р, положи- тельны, мы совершим еще одно преобразование координат 5! = /^,...,^ = /^, _ ^/> + 1 + . ., ^>p + q = VP’q'tp+g* После этого преобразования форма принимает вид А(х, Отсюда легко следует, что числа р и q в вещественном пространстве — единственные инварианты квадратичной фор- мы А (х, х) и соответствующей билинейной формы А(х,_у): Теорема. Два пространства R' и R" с выделенными в них симметричными билинейными формами А (х', у') и А (х", у") являются А-изоморфными тогда и только тогда, когда пространства R' и R" имеют одинаковую размерность, а индексы инерции р', q’ формы А (х', у') совпадают соот- ветственно с индексами инерции р", q" формы А (х", у"). Доказательство непосредственно следует из при- веденных выше соображений и теоремы 7.72. 7.94. Следующие определения соответствуют определе- ниям, приведенным в 7.92 для квадратичных форм.
7-95] § 7.9. формы в вещественном пространстве 241 Билинейная форма А(х, j) называется невырожденной, если ее ранг равен числу измерений пространства, иными словами, если в канонической записи формы А (х, у) А (х, у) = + •. • + ХД„т]« все коэффициенты %2, ..., отличны от нуля. Если все эти коэффициенты, кроме того, положительны, форма к(х,у) называется положительно определенной. Положительно определенная билинейная форма А (х, у) характеризуется тем, что соответствующая квадратичная форма А (х, х), согласно 7.92, принимает при каждом х =/= О положитель- ное значение. По самому определению положительно определенная форма в пространстве Rn невырождена. Но так как в силу свойства А (х, х) > 0 она остается положительно определенной и на любом подпространстве R'cR„, то в отличие от общей билинейной формы (7.15г) положительно определенная форма остается невырожденной на любом подпространстве R'cR„. Если Л> ..., fk—любые k линейно независимых векторов, определитель D = А (Л- А) ••• А (Л, А) A (fk, Л) • • • A (fk, fk) заведомо отличен от нуля. Ниже мы увидим, что число D всегда положительно. 7.95. Одним из важных примеров симметричной положительно определенной билинейной формы в пространстве Va является скаляр- ное произведение векторов хну. Действительно, из определения скалярного произведения непосредственно вытекают соотношения (х, у)~(у, х), (х, х) = | х |2 > 0 при х 0; первое из них показывает, что билинейная форма (х, у) симметрична; второе—что соответствующая квадратичная форма принимает при каждом х 0 положительное значение и, следовательно, билинейная форма (х, у) положительно определена. В дальнейшем симметричные положительно определенные билиней- ные формы будут играть исключительную роль: именно, используя такие формы, мы в общем линейном пространстве получим возмож- ность ввести понятия длин векторов и углов между векторами (гл. 8).
242 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (7.96 7.96. Возникает вопрос, как по матрице билинейной сим- метричной формы А (х, у) судить о том, является ли она положительно определенной. Ответ на этот вопрос дается следующей теоремой. Теорема. Для того чтобы симметричная матрица А — || aik || определяла положительно определенную билиней- ную форму А (х, у), необходимо и достаточно, чтобы все угловые миноры матрицы ||aift|| cii> аи аи ®22 а11 а12 а1з а21 а22 а23 аз1 а32 азз ..., det||art|| были положительными. Доказательство. Если все угловые миноры матрицы А положительны, то в силу формул (24) будут положительны и все канонические коэффициенты пк формы А (х, у) в не- котором каноническом базисе; таким образом, форма А (х, у) положительно определена. Пусть, обратно, форма А (х, у) положительно определена; покажем, что тогда угловые миноры матрицы || aik || положи- тельны. Действительно, угловой минор ап а12 • • а1т М = а21 а22 • • а2т aml ат2 • • ^тт определяет матрицу || aik || (г, k— 1, 2, ..., m) формы А (х, у) на подпространстве Lm, порожденном первыми m ба- зисными векторами. Так как на подпространстве Lm форма А (х, у) положительно определена (А (х, х) > 0 при х =£ 0), то в подпространстве Lm существует канонический базис, в котором форма А (х, у) записывается в каноническом виде с положительными каноническими коэффициентами. В част- ности, и определитель формы А (х, у) в этом базисе, равный произведению канонических коэффициентов, также положи- телен. Учитывая связь определителей матрицы билинейной формы в разных базисах (7.15 (6)), мы видим, что опре- делитель формы А (х, у) в исходном базисе подпространства
7-98J § 7.9. формы в вещественном пространстве 243 Lm тоже положителен. Но определитель формы А (х, у) в исходном базисе подпространства Lm есть как раз ми- нор М. Следовательно, 2И>0, и теорема полностью до- казана. Замечание. Вместо углового минора во второй части доказательства можно было взять любой диагональный ми- нор (5.53) без существенного изменения рассуждений. Таким образом, у матрицы положительно определенной формы любой диагональный минор положителен. 7.97. Для положительно определенной формы А (х, у) всегда существует канонический базис ег, . . ., еп, в котором все канонические коэффициенты равны 1 (7.93). Поэтому два п-мерных вещественных пространства R.'n и R„ с выделен- ными в них положительно определенными формами А (х', у') и А (х", у") в силу теоремы 7.72 всегда А-изоморфны. 7.98. В приложениях линейной алгебры к анализу (именно, в тео- рии условных экстремумов) часто требуется решить следующую зада- чу: зная матрицу <4= || || билинейной симметричной формы А (х, у), узнать, будет ли эта форма положительно определенной на под- пространстве, заданном системой k независимых линейных уравнений п 2 М/ = ° О‘ = 1.2......k,k<ri). /=1 Оказывается, что необходимым и достаточным условием для этого является положительность угловых миноров матрицы Д = (-1)* 0 0 . • о ьг1 ь1г . Ь1п 0 0 . . 0 • • bin 0 0 . • 0 5Л1 Ьк2 . Ькп Ьп t>21 • • Ьк1 я12 • а1п Ь12 &22 • • Ьк2 а21 а22 • • а2п Ьщ i>2n • • ^kn anl ап2 • • апп порядка 2Л-)-1, 2£-|-2, ..., /г-)-п*). *) См. заметку Р. Я. Шостака в журнале «Успехи математиче- ских наук», 1954, т. 9, вып. 2 (60), стр. 199—206.
244 ГЛ. 7. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ ЗАДАЧИ 1. Образуют ли элементы матрицы билинейной формы тензор (5.61), и если да, то какого типа? 2. Преобразовать квадратичную форму 11?2 4” к каноническому виду. 3. Пусть р—положительный индекс инерции квадратичной формы А(х, х) (заданной в пространстве R„) и q—ее отрицательный индекс инерции. Пусть заданы р положительных чисел Х2...........1.р и q отрицательных чисел |хг, ц2, ..., Показать, что существует базис, в котором форма А (х, х) принимает вид А (х, х) = XxTj + Л2т| + ... + Хрх2 + Н1т|+1 + • • • + 4. Показать, что у квадратичной формы ранга г всегда имеется по крайней мере один диагональный минор ранга г, отличный от нуля. 5. Преобразовать билинейную форму А (х, у) = 5jT)i + 51*12 + ёз'Л 1 + 2=2^2 + 252*1з + 2§3г|2 55зт1з к каноническому виду. 6. Применить метод Якоби для преобразования билинейной формы А (х, у) = 5i"*li—ВгЯг—+ бх^з + bAli + 252"*1з 4~ 25з'*1г + ^зЛз 4" к каноническому виду. 7. Сформулировать условия, при которых симметричная матрица || aik || определяет отрицательно определенную билинейную форму. 8. Дана симметричная матрица А = || ||, обладающая свойствами Оц > о, all а12 °21 °22 > о.......det || aik || > 0. Доказать, что апп > 0. 9. Доказать теорему: полилинейная антисимметричная форма от и-J-l векторов в n-мерном пространстве Кп тождественно равна нулю. 10. Доказать теорему: полилинейная антисимметричная форма A (Xi, ..., x„_i) от п. — 1 векторов в n-мерном пространстве записы- вается в любом базисе как определитель, первые п—1 строк которого заполнены координатами векторов-аргументов, а последняя, n-я, строка заполнена п фиксированными числами. 11. Доказать, что всякая антисимметричная билинейная форма А (х, у) 0 может быть всегда приведена к «каноническому виду» А (х, y) = OiX2 — 02^14-0371 — О4Т3+ . . . 4-°2/j-172S 4-02fe72fc-i. 12. Доказать теорему: вещественная квадратичная форма А (х, х)= = Уз QrirXfXi, неотрицательна при всех x£Rn тогда и только тогда, когда все диагональные миноры матрицы A = ||ayft|| неотрицательны.
ЗАДАЧИ 245 Примечание. Для матрицы |q __________®| угловые миноры и 62 равны 0, а соответствующая форма не является неотрицательной. Таким образом, условия 0, 62^0 недостаточны для неотрица- тельности формы. 13. Пусть в пространстве К„ задана невырожденная билинейная симметричная форма А (х, у). Пусть К'сК — подпространство раз- мерности г. Доказать, что сопряженное подпространство К"сК имеет размерность п—г. 14. В пространстве R2 задана симметричная билинейная форма (х, = — g2r)2. Найти оператор, сопряженный (относительно этой формы) к оператору поворота с матрицей л —II cos а sin а || || —sin а cos а ||' 15. Пусть в пространстве Кп выделена невырожденная форма (х, у). Для квадратной системы линейных уравнений п (/=1......п) (43) fe=i доказать «теорему Фредгольма»: система (43) имеет решение для тех и только для тех векторов £’ = {&!, которые сопряжены ко всем решениям однородной системы 2 = (44) *=1 где || a'jk ||—матрица, сопряженная с || || относительно формы (х, у). Отсюда вывести, что число независимых линейных условий на вектор Ь, необходимое и достаточное для разрешимости системы (43), равно размерности пространства решений однородной системы = 0 (/ = 1.....л). (45) ft= 1 Примечание. Для общей системы п ^ajk^bj (j = l,...,m) (46) 1 две указанные характеристики уже не совпадают: их разность, назы- ваемая индексом системы (46), равна т—п. 16. Показать, что всякая неотрицательная билинейная форма ран- га г в пространстве Rn может быть представлена как сумма г неот- рицательных билинейных форм ранга 1. 17. Показать, что всякая билинейная форма ранга 1 в простран- стве Кп имеет вид А (х, y) = f (x) g(i/), где f (х) и g(x)—линейные формы. 18. Если А(х, у) = 2а/^/’1/г и. В (х, у) = 2bjkZjAk—неотрица- тельные билинейные формы в пространстве R„, то форма С (х, у)= = 2 ajkbfk^j'c\k также неотрицательна.
ГЛАВА 8 ЕВКЛИДОВЫ ПРОСТРАНСТВА §8.1. Введение Большое многообразие фактов, которыми богата геомет- рия, в значительной мере объясняется возможностью различ- ных измерений — в основном возможностью измерения длин отрезков и углов между прямыми. В общем линейном прост- ранстве мы еще не имеем способа производить такие изме- рения; и это, разумеется, суживает область нашего иссле- дования. Желая наиболее естественным образом распространить на общие линейные пространства методы, связанные с воз- можностью измерений, мы обратимся к определению скаляр- ного произведения двух векторов, принятому в аналитичес- кой геометрии (и пригодному, конечно, только для обычных векторов—элементов пространства Vs). Это определение гласит: скалярное произведение двух векторов есть произ- ведение длин этих векторов и косинуса угла между ними. Следовательно, это определение уже основано на возмож- ности измерения длин векторов и угла между ними. Но, с другой стороны, зная скалярное произведение любой пары векторов, мы можем восстановить длины их и угол между ними; действительно, квадрат длины вектора равен скалярному произведению этого вектора с самим собой, а косинус угла между двумя векторами—отношению их скалярного произведения к произведению их длин. Следова- тельно, в понятии скалярного произведения потенциально заключены и возможность измерения длин, и возможность измерения углов, а вместе с ними и вся область геометрии, связанная с измерениями («метрическая геометрия»). В общем линейном пространстве нам легче будет сна- чала ввести понятие скалярного произведения двух векторов и затем из имеющегося уже понятия скалярного произведе-
§ 8.1. ВВЕДЕНИЕ 247 ния получить определения длины вектора и угла между векторами. Посмотрим, какие свойства обычного скалярного произ- ведения можно использовать для построения аналогичной величины в общем линейном пространстве. Вначале ограни- чимся случаем вещественных пространств. В 7.95 мы уже видели, что в пространстве V3(2./5 а) скалярное произведение (х, у) есть билинейная форма от векторов х и у, симметричная и положительно определенная. Формы с такими свойствами, вообще говоря, имеются и в общем вещественном линейном пространстве. Рассмотрим в вещественном линейном пространстве произвольную фикси- рованную билинейную форму А (х,у), симметричную и положи- тельно определенную. Назовем ее «скалярным произведением» векторов х и у. После этого определим длину каждого век- тора и угол между каждыми двумя векторами по тем же правилам, по которым длина вектора и угол между векто- рами вычислялись через скалярные произведения в прост- ранстве V3. Разумеется, только дальнейшее исследование может показать, насколько удачно это определение; и мы увидим на протяжении этой и следующих глав, что при- веденное определение на самом деле позволит распростра- нить на общие линейные пространства методы метрической геометрии и тем самым значительно усилить средства иссле- дования математических объектов, встречающихся в алгебре и анализе. Отметим здесь одно существенное обстоятельство. Исход- ную билинейную и положительно определенную форму можно выбрать в данном линейном пространстве многими различ- ными способами. Длина некоторого вектора х, вычисленная с помощью одной такой формы, будет отличаться от дли- ны этого же вектора х, вычисленной с помощью другой формы; то же относится и к углу между двумя данными векторами. Таким образом, длина вектора и угол между векторами не определяются однозначно. Но эта неоднознач- ность не должна нас смущать; ведь ничего нет удивитель- ного в том, что одному и тому же отрезку на прямой, измеренному различными масштабами, приписываются в ре- зультате этих измерений в качестве его длины различные числа. Можно сказать, что выбор исходной билинейной симметричной и положительной формы аналогичен выбору
248 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.21 такого «масштаба» для измерения длин векторов и углов между ними. Вещественное линейное пространство с выбранной в нем «масштабной» билинейной симметричной положительно опре- деленной формой будем в дальнейшем называть евклидовым. Линейное пространство без заданной «масштабной» формы будем называть аффинным. Случай комплексного прост- ранства мы рассмотрим в гл. 9. § 8.2. Определение евклидова пространства 8.21. Вещественное линейное пространство R называется евклидовым, если 1) имеется правило, которое позволяет построить для каждых двух векторов х и у из R веществен- ное число, называемое скалярным произведением векторов х и у и обозначаемое (х, у); 2) это правило удовлетво- ряет следующим требованиям: а) (х> У) = (j, х) (переместительный закон), б) (х, у + z) = (х, у) + (х, z) (распределительный закон), в) (Хх, у) = X (х, у) для любого вещественного числа %, г) (х, х)>0 при х=/=0 и (х, х) = 0 при х = 0. Аксиомы а) — г) утверждают в совокупности, что ска- лярное произведение векторов х и у есть билинейная форма (б — в), симметричная (а) и положительно определен- ная (г). И обратно, всякая форма, обладающая этими свойствами, может быть принята за скалярное произведение. Поскольку скалярное произведение векторов х иу является билинейной формой, для него имеет место формула 7.11(2). В данном случае эта формула принимает следующий вид: k m \ k tn H^Xi, Saz₽/(Xp У,)- (1) i=l j=l J i=lj=l Здесь xx, x3, ... , xk, yx, y2, ... , ym—произвольные векторы евклидова пространства R, ax, a2, • • • > a*» Px, 02, .. . , 0И—любые вещественные числа. 8.22. Примеры. а. В пространстве V3 свободных векторов (2.15а) скалярное произведение вводится по правилам аналитической геометрии. Условия а) — г) выражают собой основные
8.31J § 8.3. ОСНОВНЫЕ МЕТРИЧЕСКИЕ понятия 249 свойства скалярного произведения; они доказываются в векторной алгебре. б. В пространстве Rn (2.156) мы введем скалярное про- изведение векторов х= (^, Ц, , %„) и у = (4, • • • , 40 так: (х, у) = 5i1li + • • + (2) (Это определение обобщает известную формулу выражения скалярного произведения векторов в трехмерном пространстве через координаты сомножителей в ортогональной системе координат.) Легко проверить, что требования а) — г) удов- летворяются. Заметим, что формула (2) — не единственный способ введения скалярного произведения в Rn. Все возможные способы введения скалярного произведения (т. е. симмет- ричной билинейной положительно определенной формы) в пространстве /?„ мы описали фактически в 7.96. в. В пространстве /?(а, Ь) вещественных непрерывных функций на отрезке асС/сСй (2.15в) мы можем ввести ска- лярное произведение функций х (/) и у (1} по формуле ь (х, у) = J х (t) у (if) dt. (3) а Легко проверить, применяя основные правила интегри- рования, что требования а) — г) удовлетворяются. В дальнейшем будем обозначать пространство R (а, Ь) со скалярным произведением по формуле (2) через R2(a, b). § 8.3. Основные метрические понятия Имея скалярное произведение, мы можем дать определе- ние и основных метрических понятий — длины вектора и угла между двумя векторами. 8.31. Длина вектора. Длиной вектора х в евкли- довом пространстве R мы будем называть величину |х| = -)~У(Х, х). (4>
250 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.32 Примеры. а. В пространстве Vs наше определение длины вектора приводит к обычному значению длины вектора. б. В пространстве Rn для вектора х = (^, £2, •••> £п) получается выражение длины в виде И= в. В пространстве /?2 (а> Длина вектора х = х (t) ока- зывается равной |х| = + ]/\х, х) ~ |/ jx2(/)<//. а Эту величину обозначают иногда || х (/) || и называют нор- мой функции х (/) (чтобы избежать ложных ассоциаций, свя- занных со словами «длина функции»), 8.32. Из аксиомы г) вытекает, что у каждого вектора х евклидова пространства R существует длина; у всякого вектора х=/>0 длина положительна, у нуль-вектора длина равна нулю. Равенство |ах | = V(ах, ах) = J/а2 (х, х) = |а||/ (х, х) = |а| | х | (5) показывает, что абсолютную величину числового мно- жителя можно выносить за знак длины вектора. Вектор х, имеющий длину 1, называется нормированным. Всякий ненулевой вектор у можно нормировать, т. е. умно- жить на такое число X, чтобы в результате получился нор- мированный вектор. Действительно, уравнение |Ху [== 1 отно- сительно А имеет решение, например, Множество FcR называется ограниченным, если длины всех векторов x£F ограничены фиксированной константой. При- мерами ограниченных множеств являются единичный шар пространства R — совокупность всех векторов xgR с дли- ной, не превышающей единицы, а также единичная сфера — совокупность всех векторов x£R с длиной, равной 1.
8.34] § 8.3. основные метрические понятия 251 8.33. Угол между векторами. Углом между парой векторов х и у мы будем называть тот угол (в пределах от 0 до 180°), косинус которого равен отношению .i • I х 11 УI Для обычных векторов (в пространстве И3) наше опре- деление согласуется с обычным выражением угла между векторами через скалярное произведение. Чтобы это определение можно было применить в общем евклидовом пространстве, необходимо доказать, что указан- ное отношение по абсолютной величине не превосходит единицы, каковы бы ни были векторы х и у. Для доказательства этого утверждения рассмотрим век- тор Хх—у, где X — вещественное число. В силу аксиомы г) при любом X (Хх—у, Хх—у)^0. (6) Используя формулу (1), мы можем написать это неравенство в виде Х2(х, х) — 2Х(х,у) + (у,у) >0. (7) В левой части неравенства стоит квадратный трехчлен относительно X с постоянными коэффициентами. Трехчлен этот не может иметь различных вещественных корней, так как тогда он не мог бы сохранять знака для всех значений X. Поэтому дискриминант (х,у)2—(х, х)(у,у) этого трех- члена не может быть положительным. Следовательно, (х,у)2^(х, х) (у, у), откуда, извлекая квадратный корень, получаем |(х, у)К|х||у|, (8) что и требовалось. Неравенство (8) называют неравенством Коши —Бу ня- ковского. 8.34. Выясним, когда в неравенстве (8) возможен знак равенства. Если векторы х и у коллинеарны, т. е., например, у = Хх, Х^/?, то, очевидно, |(х,у)| = |(х, Хх) I = IXI (х, х) = | X11 х |2 = | х | |у |.
252 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.38 Покажем, что и обратно, если неравенство (8) для неко- торой пары векторов х, и у обратилось в равенство, то эти векторы х и у коллинеарны. Если имеет место равенство |(х,у)| = |х||у|, то дискриминант квадратного трехчлена (7) равен нулю и, следовательно, трехчлен имеет один вещественный корень %0. Мы получаем, таким образом, (х, х) —2Х0 (х, у) + (у, у) = (Хох — у, Кох—у) = О, откуда в силу аксиомы г) находим, что Хох—у = 0, или у = Хох. Итак, абсолютная величина скалярного произведе- ния двух векторов тогда и только тогда равна произведе-. нию их длин, когда эти векторы коллинеарны. Примеры. а. В пространстве V3 неравенство Коши — Буняковского, очевидно, вытекает из самого определения скалярного произ- ведения как произведения длин векторов и косинуса угла между ними. б. В пространстве Rn неравенство Коши — Буняковского имеет вид п Г п Г п 2^- <1/ 2^1/ 2nJ; (9) /=1 Г j=l Г 1=1 оно справедливо для любой пары векторов х = (£г, |2, £п) и у = (Л1, Лг, --мЛи) или, чт0 то же самое, для любых двух систем вещественных чисел £х, £2, ..., и т]г, т]2, ..., т]„. в. В пространстве R2(a,b) неравенство Коши — Буня- ковского имеет вид ь J х {t)y (/) dt а $*2(0 dt]/ Jy2 (t) dt . (Ю) 8.-35. Ортогональность. Векторы х и у назы- ваются ортогональными, если (х, у) = 0. Таким образом, понятие ортогональности векторов х и у совпадает с поня- тием сопряженности {7.41а) этих векторов относительно билинейной формы (х,у). Если х 0 иу^=0, то это опре- деление в соответствии с общим определением угла между
8.36] § 8.3. ОСНОВНЫЕ МЕТРИЧЕСКИЕ понятия 253 двумя векторами (8.33) означает, что х и у образуют угол в 90°. Нулевой вектор оказывается ортогональным к любому вектору х g R. Примеры. а. В пространстве /?„ (8.22 б) условие ортогональности векторов х = (ti, g2,. . ., и у = (т]х, Па, • • > П«) имеет ВИД В1П1 + ^2Пг+ • • +^«Пп = 0- Например, векторы ех == (1,0, . . ., 0), е2 — (0, 1, 0, . .., 0), ... ..., еп — (0, 0, . .., 1) попарно взаимно ортогональны. б. В пространстве П2 (а, Ь) условие ортогональности векторов х — х (t) и у=у(/) имеет вид ь х (t)y (/) di = 0. а Читатель легко проверит, вычислив соответствующие интегралы, что в пространстве /?2 (—л, л) любые два век- тора «тригонометрической системы» 1, cos/, sin/, cos 2/, sin 2/, ..., cos nt, sin nt,.,. взаимно ортогональны. 8.36. Приведем несколько простых утверждений, связан- ных с понятием ортогональности. а. Лемма. Взаимно ортогональные ненулевые векторы х1г х2, ., хк линейно независимы. Доказательство. Допустим, что эти векторы ли- нейно зависимы; тогда имеет место равенство (-'1X1 4* (~'^х2 +... -|- = о, где, например, Сх=^=0. Умножим это равенство скалярно на хх; в силу предположения о взаимной ортогональности век- торов хх, х2, ..., хк мы получим Сх(хх, хх) = 0. Отсюда (хх хх) = 0 и, следовательно, хх есть нулевой вектор в про- тиворечие с предположением. Результат этой леммы мы будем тогда использовать в такой форме: если сумма взаимно ортогональных векто- ров равна нулю, то каждое из слагаемых равно нулю.
254 гл. 8. евклидовы пространства [8.37 б. Лемма. Если векторы yt, у2, ..., уk ортогональны к вектору х, то любая линейная комбинация <х1у1 а2_у2 + •.« ... + «аУь также ортогональна к вектору х. Действительно, («1^1+ • • • + акУк, *) = ai (Ji> *)+•• + «ft (Л, х) = 0; следовательно, вектор . А-а^Уь ортогонален к век- тору х, что и утверждалось (ср. 7.41в). Совокупность всех линейных комбинаций а1у1А-<х2у2А- . . . образует подпространство L = L (ух, у2, . . ., yk)— линейную оболочку векторов у1, у2, . .., yk (2.51). Следо- вательно, вектор х ортогонален к каждому вектору под- пространства L. В таких случаях мы будем говорить, что вектор х ортогонален к подпространству L. Вообще, если F с R—произвольное множество векторов в евклидовом пространстве R, то мы будем говорить, что вектор х орто- гонален к множеству F, если он ортогонален к любому век- тору из F. Совокупность G всех векторов х, ортогональных к мно- жеству F, в силу той же леммы б сама составляет под- пространство в пространстве R. Чаще всего такая ситуа- ция встречается в том случае, когда F есть подпростран- ство; тогда подпространство G называется ортогональным дополнением подпространства F. 8.37. Теорема Пифагора и ее обобщение. Пусть векторы х и у ортогональны; тогда по аналогии с элементарной геометрией вектор х можно называть гипотенузой прямоугольного треугольника, построенного на векторах х и у. Умножая хАу скалярно на себя и исполь- зуя ортогональность векторов х и у, мы получаем I х +У I2 = (х Ау, х -Ау) = (х, х) + 2 (х, у) + (у, у) = = (х, X) + (у, у) = | X I3 + \у I2. Мы доказали тем самым в общем евклидовом пространстве теорему Пифагора: квадрат гипотенузы равен сумме квад- ратов катетов. Нетрудно обобщить эту теорему на случай любого числа слагаемых. Именно, пусть векторы хь х2,. .. ..., хк взаимно ортогональны и г = х1-)-х2~)-...
8.39] § 8.3. ОСНОВНЫЕ МЕТРИЧЕСКИЕ ПОНЯТИЯ 255 тогда И2=(*1 + *2 + •••+**> *1 + *2 + ••• + **)== = |х1|2 + |х2|2+ • • • -гЮ2. (И) 8.38. Неравенства треугольника. Если х и у — произвольные векторы, то по аналогии с элементарной геометрией вектор х-(-_у естественно называть третьей сто- роной треугольника, построенного на векторах х и у. Ис- пользуя неравенство Коши — Буняковского, мы получаем |x+j|2=(x4-j, x+j) = (x, х)4-2(х, j) + (j,^), ^И2+2ИМ+1у12=(И + И)2> >l^|2-2|x|b| + b|2 = (|x|-b|)2, или |х+.у|5СИ + 1.У|, 02) 1*+.у|>1И—И- О3) Неравенства (12)—(13) называются неравенствами тре- угольника. Геометрически они означают, что длина любой стороны всякого треугольника не больше, чем. сумма длин двух других сторон, и не меньше, чем абсолютная величина разности длин этих сторон. 8.39. Мы могли бы, далее, последовательно переносить на евклидово пространство остальные теоремы элементарной геометрии. Но в этом нет нужды. Введем понятие евкли- дова изоморфизма между евклидовыми пространствами R' и R": именно, мы будем говорить, что R' и R" евклидово- изоморфны, если они изоморфны как вещественные, линейные пространства (2.71) и, кроме того, для любой пары соот- ветствующих векторов х', у' в R' и х", у" в R" выпол- няется равенство (х',/) = (х",у). Очевидно, что всякая геометрическая теорема, — так мы будем называть теорему, основанную на понятиях линей- ного пространства и скалярного произведения,—доказанная для пространства R', будет справедлива и для изоморфного ему пространства R". Теперь заметим, что в силу теоремы 7.97 всякие два евклидова пространства равной размерности
256 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА 18.41 п евклидово-изоморфны. Следовательно, всякая геометри- ческая теорема, справедливая в «-мерном евклидовом про- странстве R„ будет справедливой и в любом другом «-мер- ном евклидовом пространстве R„. Геометрические теоремы элементарной геометрии, т. е. геометрические теоремы в пространстве R3, по доказанному, остаются справедливыми в любом трехмерном подпространстве любого евклидова пространства. Таким образом, все геометрические теоремы элементарной геометрии справедливы в любом евклидовом пространстве. § 8.4. Ортогональный базис 8.41. Теорема. В п-мерном евклидовом пространстве Rn существует базис из п ненулевых взаимно ортогональных векторов. Доказательство. Для билинейной формы (х, у), как и для всякой симметричной билинейной формы в «-мер- ном пространстве, существует канонический базис (7.43) Уъ Уг, •, уп- Условие (у,-, yk) = 0 каноничности базиса при i^k есть в данном случае условие ортогональности векторов yi и у„; таким образом, канонический базис У1> У%< • • •, уп образуется в данном случае из п взаимно ортогональных векторов. Это и доказывает теорему. В § 8.6 мы рассмотрим способы эффективного построе- ния ортогонального базиса. 8.42. Векторы, jj, у2, ...,.уп ортогонального базиса удобно нормировать, разделив каждый из них на его длину. Мы получаем после этого в пространстве R ортогональный и нормированный базис (иногда говорят «ортонормирован- ный» или «ортонормальный» базис). Пусть е2, . . ., еп — произвольный ортогональный нор- мированный базис в евклидовом пространстве Rn. Каждый вектор х С R„ можно представить в виде * = £1<Д+^2+ • • • +ВЛ, (14) где Ij, |2, ..., — координаты вектора х. Мы будем также называть эти координаты коэффициентами Фурье век- тора х относительно ортогональной и нормированной сис- темы е2, ..., еп. Умножая- равенство (14) скалярно на
8.51] § 8.5. ЗАДАЧА О ПЕРПЕНДИКУЛЯРЕ 257 находим выражение коэффициента li = (x,ei) (г = 1, 2, ..., л). (15) Если у = T]iei + 1Ъе2 + • • • +11лел—любой другой вектор про- странства Rn, то по формуле (1) мы получаем (*,j) = Bini+^n2+---+Uv G6) Итак, в нормированном ортогональном базисе скалярное произведение двух векторов равно сумме произведений их соответствующих координат — коэффициентов Фурье. В частности, полагая у — х, получим |x]2 = (x, x) = ^ + ll+---+Vn- (17) § 8.5. Задача о перпендикуляре 8.51. Рассмотрим в евклидовом пространстве R некото- рое конечномерное подпространство R' и вектор /, вообще говоря, не входящий в подпространство R'. Поставим задачу найти разложение f=g+h, (18) где вектор g принадлежит подпространству R', а вектор h ортогонален к этому подпространству. Вектор g, участвую- щий в разложении (18), называется проекцией вектора f на подпространство R', а вектор h—перпендикуляром, опущен- ным из конца вектора f на подпространство R'. Такие на- звания связаны с привычными нам геометрическими ассоциа- циями *). Решение этой задачи фактически было дано еще в 7.54, для любой симметричной билинейной формы, невырожденной на подпространстве R'. Так как положительно определенная форма (х,у) невырождена на любом подпространстве R'czR (7.94), то существование решения нашей задачи, вместе с единственностью, следует из 7.54. Как мы видели в 7.55, наличие разложения (18) пока- зывает, что все пространство R есть прямая сумма под- пространства R' и его ортогонального дополнения R". *) И предназначены только для того, чтобы вызывать такие ассо- циации. Поскольку понятие «конец вектора» не фигурирует в нашей аксиоматике, не следует искать в этом названии логического смысла.
258 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.52 Прямая сумма, слагаемые которой ортогональны, назы- вается ортогональной прямой суммой; мы построили, таким образом, разложение R в ортогональную прямую сумму R' и R". Если размерность пространства R равна п, а раз- мерность R' равна k, то размерность R" равна п — k, по- скольку размерность прямой суммы есть сумма размерностей слагаемых (2.47а). Заметим, что задача решается и в том случае, когда вектор f лежит в подпространстве R'. В этом случае реше- ние имеет вид /==/+0. Другого решения, очевидно, нет: если бы мы имели f=g-}-h, g^R', A^R", то было бы также h~f—g'gR', откуда Л = 0, g=f. 8.52. Применяя к разложению (18) теорему Пифагора (8.37), получаем 1Л2=к12+1М2. (19) откуда вытекает, что справедливо неравенство (20) геометрически выражающее тот факт, что длина перпенди- куляра не превосходит длины наклонной. Отметим те случаи, когда в одном из неравенств (20) имеет место знак равенства. Условие 0 -- |/г| равносильно усло- вию /= £•-]- 0 = g, которое означает, что/ входит в подпро- странство R'. Условие | h | = |/|, согласно теореме Пифа- гора, показывает, что g = 0 и, следовательно, /=О + Л = Л; таким образом, / ортогонален к подпространству R'. Итак, равенство | h | = 0 означает, что вектор f входит в подпро- странство R'; равенство |/г| = |/| означает, что вектор / ортогонален к этому подпространству. При всяком ином располо- жении вектора / длина вектора h будет положительной величиной, меньшей чем длина вектора /.
8.53] § 8.5. ЗАДАЧА О ПЕРПЕНДИКУЛЯРЕ 259 Пусть теперь ег, ..., ек— ортонормальный базис в под- k пространстве R' и пусть g= ^ajgj- Тогда по 8.42 (17) /=1 k И2=1Ч /=1 Подставляя это значение |^|2 в равенство (19), получаем k |/1Мл|г+2Х /=1 В частности, для любой (конечной) ортогональной нор- мированной системы е1, е2, • • • > ek и любого вектора f мы получаем неравенство ь 2«/^1/12- /=х которое называется неравенством Бесселя. Геометрический смысл его очевиден: квадрат длины вектора f не меньше, чем сумма квадратов его проекций на любые k взаимно ортогональных направлений. 8.53. В приложениях требуется иногда дать эффектив- ное решение задачи о перпендикуляре, когда в подпрост- ранстве R' дан некоторый (вообще говоря, не ортогональ- ный и не нормированный) базис {blt b2, ..., bk} = {b}. Чтобы получить это решение, разложим искомый вектор g по базису {#}, £= Pi^i + + • • • + Р/А> и подчиним вектор h—f—g условию ортогональности со всеми векторами Ьк, Ь2, .. ., Ьк. Мы получим следующую систему уравнений: (h, b1) = (f-g,b1) = = (/, *i) - Pl (*1, М - р2 *1) - • • • - рй (Ью = О, (Л, b2) = (f-g, b2) = = (/, ь2) - рх (^, ь2) - р2 {Ь2, Ь2) - .. . - ₽* (Ьк, Ь2) = о, (h,bk) = (f-g,bk) = = (/> ьк) - Рх (bt, bk) - р2 (Ь2, Ьк) - ... - (Ьк, Ьк) = о
260 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.54 с определителем D = (*х, &х) (&2, by) (Ь1, Ь2) (Ь2, Ь2) (bk, by) (bk, Ь2) 0!, ьк) (ь2, ьк) ... (Ьк, Ьк) Определитель D, как определитель матрицы положительно определенной формы (х, у) в базисе by, ..., Ьк, отличен от нуля (7.96). Разрешая систему по правилу Крамера, по- лучаем выражения для коэффициентов Ру(/==1, 2, ..., л): 1 D ₽/ (*1, ьг) ... (b,_y, by) (/, by) (b/+1, by) ... (Ьк, by) (by, b2) ... (bj-y, b2) (/, b2) (b/+y, b2) ... (bk, b2) (by, bk) ... (bj.y, bk) (f, bk) (bJ+1, bk) ... (bk, bk) 8.54. Задачу о перпендикуляре можно поставить не только для подпространства, но и для гиперплоскости. В этом случае она формулируется так: в евклидовом про- странстве R даны гиперплоскость R", полученная параллель- ным сдвигом некоторого подпространства R', и вектор /; требуется доказать, что существует и единственно разло- жение f=g+h, (21) где g принадлежит гиперплоскости R"*), а вектор h орто- гонален подпространству R'. Геометрический смысл этого разложения ясен из рис. 1, а. В разложении (21) слагаемые, вообще говоря, уже не ортогональны. Эту задачу легко свести к задаче 8.51. Действительно, если в гиперплоскости R" фиксировать любой вектор /0 и вычесть его из обеих частей равенства (21), то мы получим задачу о разложении вектора f—f0 на слагаемые g—f0 и h, первое из которых принадлежит подпространству R', а вто- рое ортогонально к этому подпространству (см. рис. 1, б). В силу результата 8.51 такое разложение существует; *) Геометрически это означает, что конец вектора g лежит в ги- перплоскости R" (а его начало, как всегда,— в начале координат). Не следует представлять себе весь вектор g лежащим в гиперплоско- сти R"!
8.61] § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 261 следовательно, существует и разложение (21). Остается уста- новить единственность разложения (21). В случае наличия двух разложений указанного вида ^1 = £2 + ^2 мы имели бы 0 = (gi—g2) + Uh~h2). Здесь g±—g2 принадлежит подпространству R', a hx—h2 ортогонально этому подпространству. Отсюда gt—g2= —hk—h2 = 0, что и требуется. § 8.6. Общая теорема об ортогонализации 8.61. Для построения ортогональных систем в евклидо- вом пространстве основное значение имеет следующая общая теорема: Теорема. (Теорема об ортогонализации.) Пусть х2, ..., хк, ...—некоторая последовательность
262 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.61 векторов евклидова пространства R (конечная или бесконеч- ная). Обозначим через Lft = L (х1; х2, xk) линейную обо- лочку первых k векторов этой системы. Утверждается, что существует система векторов ух, у2, .. ., yk, ..., обладаю- щая следующими свойствами-. 1) Для любого натурального k линейная оболочка L'k векторов уг, у2, ..., уk совпадает с подпространством Lft. 2) Для любого натурального k вектор yk + 1 ортогонален к подпространству Lft. Доказательство. Положим ,у1 = х1. Очевидно, что при этом выполнено условие Lx = Lx. Далее будем доказывать теорему по индукции: предпо- ложим, что уже построено k векторов _ух, у2, .. ., yk, удов- летворяющих поставленным условиям, и построим вектор yk+1 так, чтобы он также обладал требуемыми свой- ствами. Пространство Lft конечномерно, и поэтому в силу 8.51 существует разложение xk+i = £* + (22) где вектор gk входит в подпространство Lft, а вектор hk ортогонален к этому подпространству. Мы положим уА + 1 = ЛА. Проверим выполнение условий теоремы ортогонализации для определенного таким образом вектора yk+1. Подпространство Lk, по предположению индукции, содер- жит векторы уъ у2, . . ., yk; поэтому и более широкое под- пространство Lft + 1 содержит эти векторы; кроме того, из формулы (22) вытекает, что Lft + 1 содержит вектор ЛА=уА+1. Таким образом, подпространство Lfe+1 содержит все векторы ух, • • J'a + i, а вместе с ними и всю их линейную оболочку Ц+1- Но и обратно, подпространство Ц+1 содержит векторы хх, х2, . .., xk и, как показывает равенство (22), содержит и вектор хк + 1; отсюда вытекает, что L*+x содержит все подпространство ЬА+1. Следовательно, L^,+1 = Lft+1, и первое условие теоремы ортогонализации выполнено. Выполнение же второго условия очевидно по самому построению век- тора ^+i = Aft- Индукция, таким образом, проведена, и тем самым тео- рема полностью доказана.
8-64] § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 263 с линейной оболочкой ...,/") и, следовательно, совпадает с совокупностью Ln, что и требовалось. б. Вектор pn(t) ортогонален к подпространству Ln_1. Достаточно проверить, что многочлен pn(t) ортогонален в (—1, 1) к функциям 1, t, При доказательстве мы будем использовать формулу интегрирования по частям в определенном интеграле, пред- полагаемую известной из анализа. Производные, входящие в эту формулу, для многочленов суть те же самые произ- водные, которые мы рассматривали в 6.73а с чисто алге- браической точки зрения. В частности, многочлен [(/а-1)"] = (t-1)" (/+ 1)" в силу6.73в при ^ = ±1 имеет равные 0 производные поряд- ков 0, 1, . .., п— 1. Итак, будем вычислять скалярное произведение tk и рп (/). Интегрируя по частям, мы получаем + 1 (tk, Рп(Р))= $ l)"](n,^=> -i Hl = /ft[(Z2—l)n](n-1)|*J—A J Внеинтегральный член полученного выражения в силу ска- занного выше обращается в нуль. Оставшийся интеграл снова берем по частям, и продолжаем этот процесс, пока показатель при t не снизится до нуля: и*, Рп ю)=и*2-1 )«]<"-2> |*;+ +i Н-А(А—1) J =1 -1 + 1 = ±£! $ [(/2— 1)П](П-ЙМ/ = ±А![(^— = 0, -1 что и требуется.
264 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.64 теоремы ортогонализации дает = = ys(t) = t3 — ^t ит. а. Эти многочлены были введены в 1785 г. французским мате- матиком Лежандром в связи с задачами теории потенциала. Общая формула для многочленов Лежандра была найдена Родригом в 1814 г. Именно, оказалось, что многочлен уп (t) с точностью до числового множителя равен многочлену = (« = 0, 1,2, ...). (24) Мы воспользуемся для доказательства этого предложе- ния замечанием 8.63. Именно, мы покажем, что многочлен рп(i) удовлетворяет условиям теоремы ортогонализации; в силу указанного замечания мы будем для каждого п иметь равенство рп (t) = спуп (/), что нам и нужно. а. Линейная оболочка векторов p0(t), Pi(t), • ••, рп (t) совпадает с совокупностью всех многочленов до п-й степени. В самом деле, как видно из формулы (24), многочлен pk (/) есть, очевидно, многочлен точно Л-й степени от t; в част- ности, Ро (0 = аоо. Р1 (О = «1о + «11Л Pi Ю = «2о + «21^+й22^> Pk (0 = ak0 + ам! + • • • + akk^y (25) Рп (0 — «ПО + «п1* + • • • + апк^к + • • • + «пп^"> ' причем старшие коэффициенты а00, йХ1, ..., апп отличны от нуля. Таким образом, все многочлены р0 (t), pr (t), ...,pn(t) входят в линейную оболочку функций 1, t, . . ., tn, кото- рая, очевидно, есть совокупность Ln всех многочленов от t не выше /z-й степени. Так как матрица линейных соотноше- ний (25) имеет определитель а00а11.. . апп, отличный от нуля, то и, обратно, функции 1, t, t2, ..., tn могут быть линейно выражены через р0(/), рх(/), , Pn(t)\ поэтому линейная оболочка L[p0(/), px{t), ..., рп (/)] совпадает
8-64] § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 263 с линейной оболочкой ...,/") и, следовательно, совпадает с совокупностью Ln, что и требовалось. б. Вектор pn(t) ортогонален к подпространству Ln_1. Достаточно проверить, что многочлен pn(t) ортогонален в (—1, 1) к функциям 1, t, При доказательстве мы будем использовать формулу интегрирования по частям в определенном интеграле, пред- полагаемую известной из анализа. Производные, входящие в эту формулу, для многочленов суть те же самые произ- водные, которые мы рассматривали в 6.73а с чисто алге- браической точки зрения. В частности, многочлен [(/а-1)"] = (t-1)" (/+ 1)" в силу6.73в при ^ = ±1 имеет равные 0 производные поряд- ков 0, 1, . .., п— 1. Итак, будем вычислять скалярное произведение tk и рп (/). Интегрируя по частям, мы получаем + 1 (tk, Рп(Р))= $ l)"](n,^=> -i Hl = /ft[(Z2—l)n](n-1)|*J—A J Внеинтегральный член полученного выражения в силу ска- занного выше обращается в нуль. Оставшийся интеграл снова берем по частям, и продолжаем этот процесс, пока показатель при t не снизится до нуля: и*, Рп ю)=и*2-1 )«]<"-2> |*;+ +i Н-А(А—1) J =1 -1 + 1 = ±£! $ [(/2— 1)П](П-ЙМ/ = ±А![(^— = 0, -1 что и требуется.
266 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.71 Итак, мы доказали, что для каждого п многочлен уп (t) с точностью до числового множителя совпадает с много- членом рп (/) = [(/2— Вычислим значение р„(1). Для этого применим к функ- ции (t2—l = l —1)" правило л-кратного дифферен- цирования произведения: [(/+1)”(/-1 )"]<«> = - (/+1)" [(^- 1)Т’ + Сп [(*+1)"]' [(*- •••=* = (/+1)«л! + С1л (/ + I)"’1 л (л- 1).. .2 (/- 1) + ... При подстановке /=1 все члены этой суммы, начиная со второго, обращаются в нуль. Мы получаем, следова- тельно, р,;(1) = 2"л!. Для вычислительных целей удобнее иметь значения наших ортогональных функций равными 1 при t = 1. Чтобы достичь этого, мы должны ввести числовой множитель ^4— . Именно 2"п! полученные после этого многочлены и называются много- членами Лежандра-, многочлен Лежандра степени л обозна- чается символом Рп (/), так что § 8.7. Определитель Грама 8.71. Определителем Грама называется определитель вида G(xx, х2, .. (%1, Хх) (хх, х2) ... (хх, хк) (х2, Хх) (Х2, Х2) • • • (^2, (Xk< (Xk’ Х2^ • • • (Xk’ Xk) где хх, х2, ..., xk — произвольные векторы евклидова про- странства R. Мы знаем, что в случае линейно независимых векторов хх, х2, . .., хп этот определитель положителен (7.96). Для вычисления определителя Грама применим к векто- рам хх, х2, ..., хк процесс ортогонализации. Пусть, на-
8.71J § 8.7. ОПРЕДЕЛИТЕЛЬ ГРАМА 267 пример, уу = хг и вектор J2 = ai3’i + X2 ортогонален к ук. Заменим на всех местах определителя вектор на ук. Далее прибавим ко второму столбцу первый столбец опре- делителя Грама, умноженный на (отнеся 04 ко второму множителю скалярных произведений), и затем прибавим ко второй строке первую строку определителя, умноженную на 04 (отнеся 04 к первому множителю скалярных произведе- ний). В результате на всех тех местах определителя, где был вектор х2, будет находиться вектор у2. Далее, пусть уъ = Р2У2+ хз ортогонален к у^иу^; прибавим к третьему столбцу первый, умноженный на Р1; и второй, умноженный на Р2; ту же операцию произведем со строками. В результате х3 на всех местах будет заме- нен на уа. Мы можем продолжать этот процесс далее, пока не дойдем до последнего столбца. Так как наши операции не изменяют величины определителя, то в результате мы получим G(xv х2, ..хк) = (Ji, Ji) о о (у2> yj о о О 0 ••• Уь) = (ji> У1) (л, У к)- (26) В силу результата 8.62 мы получаем следующее нера- венство: OsCG(x1, х2, .... хк)^(хк, хк)(х2, х2)...(хк, хк). (27) Выясним, в каких случаях величина G(x1, х2, ...,хк) может принимать крайние значения 0 или (хг, хг) . . . (хк, хк). Из выражения определителя Грама (26) выте- кает, что он равен нулю в том и только в том случае, когда один из векторов уг, у2, . .., ук равен нулю. Но в силу 8.62 это эквивалентно линейной зависимости векто- ров хк, х2, ..., хк. С другой стороны, равенство определителя Грама правой части неравенства (27) возможно в силу формулы (26) и 8.62 только в том случае, когда векторы хх, х2, ..., хк взаимно ортогональны. Итак, мы доказали следующую теорему: Теорема. (Теорема об определителе Грама.) Определитель Грама векторов х1, х2, ..., хк равен нулю
268 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.72 если эти векторы линейно зависимы, и положителен, если они линейно независимы-, он равен произведению квадратов длин векторов xlt х2, . .., xk, если они взаимно ортого- нальны, в противном случае он меньше этой величины. 8.72. Объем k-м ерного гиперпараллелепи- педа. Площадь параллелограмма, как известно из плани- метрии, равна произведению его основания на высоту. Если параллелограмм построен на двух векторах хк, х2, то можно принять за основание длину вектора xlt за высоту — длину перпендикуляра, опущенного из конца вектора х2 на ось вектора хг. Аналогично объем параллелепипеда, построенного на векторах х1; х2, х3, равен произведению площади основа- ния на высоту; площадь основания есть площадь паралле- лограмма, построенного на векторах х1г х2, а высота есть длина перпендикуляра, опущенного из конца вектора х3 на плоскость векторов хг, х2. Эти соображения делают естественным следующее индук- тивное определение объема A-мерного гиперпараллелепипеда в евклидовом пространстве. Пусть дана система векторов х1г х2, . .., xk в евкли- довом пространстве R. Обозначим через hj перпендикуляр, опущенный из конца вектора ху-+1 на подпространство L (лгх, х2, ..., ху) (j=l, 2, ...,k—1). Введем, далее, сле- дующие обозначения: Vi= | хг | (одномерный объем—,длина вектора хг), V2 = Vi -|Л1| (двумерный объем — площадь параллелограм- ма, построенного на векторах xlt х2), V8 = V2 • | h21 (трехмерный объем — объем параллелепипеда, построенного на векторах xlt х2, х3), Vk — (Л-мерный объем — объем гиперпараллеле- пипеда, построенного на векторах хх, х2, ... ..., хк). Очевидно, что объем Vk может быть вычислен по фор- муле Vk = V[xi, х2, .... х*] = |*iH Л11 - •
8-73] § 8.7. определитель грама 269 Используя формулу (26), мы можем выразить величину Vk через векторы хк, х2, ..., хк: (хг, хх) (хх, ха) ... (хх, хк) 1/2 _ (Х2, X]) (х2, х2) ... (х2, Xк) * К • (Xft, Хх) (хк, х2) ... (хк, хк) Таким образом, определитель Грама от k векторов хх, х2, ...,хк равен квадрату объема k-мерного гиперпа-. раллелепипеда, построенного на этих векторах. 8.73. Пусть 1^’—координаты вектора ху- относительно ортогонального и нормированного базиса «1. е2, ..., гп(/=1, 2, .... k; i = l, 2, . ..,л). Выражая скалярные произведения векторов через коор- динаты, мы получим следующую формулу: вг’вг’ + • • •+вда •. • вда> + • • •+в» B^’Bl1’ + • • • + Bn’В»’ • • • ВП^ + • • • + № + • • +W + • • • + Матрица < произведение хх, х2, ..., хк определителя как легко убедиться, есть Ах «-матрицы А из координат векторов в?> 't(l) • • • Sn Л = Bi2) е(2) Ъ2 £(2) • • • gn (28) lik} Ь2 • • • ЪП и транспонированной к ней лхА-матрицы ?(1) t <2) f (ft) Si Si • Si £(1) t(2) t(ft) А' = ^з2 Ъ2 • to2 Е<1> t(2) £(ft> Sn Ьп • • • Sn
270 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.74 Применяя формулу 4.54 (14) к определителю V|, находим vl = M\'l:-kk(AA')= 2 <:IИ)И'), о.....................</. где суммирование распространяется на все наборы номеров »!<... < ik, принимающих значения от 1 до п. Так как м1?;::;;? (А') = 1 (А), то О, .... ik Итак, квадрат объема k-мерного гиперпараллелепипеда, построенного на векторах Xj (j = 1, 2, . . k), равен сумме квадратов всех миноров k-го порядка в матрице из коор- динат векторов Xj относительно (любого) ортогонального и нормированного базиса elt е2, . . еп. 8.74. В случае k = n матрица |||/’|| имеет только один минор k-ro порядка, равный определителю матрицы || Ip ||. Поэтому объем п-мерного гиперпараллелепипеда, постро- енного на векторах xlt х2, . . ., хп, равен (по абсолютной вели- чине) определителю из координат векторов x( (z=l,2, . . ., л) относительно (любого) ортогонального и нормированного базиса. 8.75. Н е р а в е н с т в о Адама ра. Из результата 8.74 можно получить одну важную оценку абсолютной величины произвольного определителя й-го порядка £11 £12 • • • £lft £21 £22 • • £гй £&i £&2 • • • £as Будем рассматривать числа |г1, |/2, . . ., |м (г = 1, 2,..., k) как координаты вектора в ортогональном нормированном
8.81] § 8.8. НЕСОВМЕСТНЫЕ СИСТЕМЫ 271 базисе ^-мерного евклидова пространства. Результат 8.74 дает нам возможность истолковать абсолютную величину определителя D как объем ^-мерного гиперпараллелепипеда, построенного на векторах х1, х2, ..., хк, и использовать выражение объема через определитель Грама D2 = = G{x1, х2, ..., хк). Применяя теорему 8.71, получаем k k D2 < (х1; jq) (х2, х2) ... (хк, хк)= П 2 lip i= 1 i= i Это неравенство носит название неравенства Адамара. Отметим, что оно обращается в равенство в силу тео- ремы 8.71 в том и только в том случае, когда векторы л1, х2, . .., хк взаимно ортогональны. Неравенство Адамара имеет прозрачный геометрический смысл: объем гиперпараллелепипеда не превосходит произ- ведения длин его ребер-, он равен этому произведению в том и только в том случае, когда его ребра взаимно ортого- нальны. § 8.8. Несовместные системы линейных уравнений и метод наименьших квадратов 8.81. Пусть дана несовместная система линейных урав- нений аих1 "г ацХ2 -j- . . . -j- almxm — blt > a21Xl 4" a22X1 + • • + a2mXm = I (29) anlxl ~t“ an2x2 ~t“ • • • “Г anmxm = ^n- ) Поскольку она несовместна, ее нельзя решить, т. е. нельзя найти такие числа с1, с2, ..., ст, чтобы при под- становке этих чисел вместо неизвестных xlt х2, ..., хт удовлетворялись бы все уравнения системы (29). Если подставить какие-нибудь числа £1; £2, ..., вместо неизвестных х1, х2, . . ., хт в левые части уравне- ний (29), то мы получим результаты у15 у2, ..., у„, отлич- ные от чисел />!, Ь2, ..., Ьп. Поставим себе задачу: при известных значениях чисел ajk и bk(k=\, ..., п; _/=!, ...,/») определить числа £2, . .., так, чтобы
272 гл. 8. евклидовы пространства [8.82 квадратичное уклонение результатов *у1, у2, ..., уп от дан- ных величин Ь1г Ь2, ..., Ьп, определяемое выражением п S2=S(Y,—(30) /=1 оказалось наименьшим из возможных, а также найти это минимальное уклонение. Такая задача возникает на практике, когда, например, коэффи- циенты Еу линейной зависимости величины b от величин аг, а2, ..ат Ь ~ ?1а1 + ?2°2 + • • • + Zmam должны быть найдены из результатов измерений величин ау(/=1, 2...т) и соответствующих значений Ь. Если при i-м измерении получены значения а(у для величины а/ и Ь, для вели- чины Ь, то мы должны составить уравнение ?1а/1 + ^2а12+ • +5та/и = Ь|’> (31) п измерений приводят к системе п уравнений (31), т. е. к системе вида (29). Эта система вследствие неизбежных ошибок измерений будет, вообще говоря, несовместной, и задача определения коэффи- циентов ..., таким образом, не сводится к задаче реше- ния системы уравнений (29). Возникает задача определить коэффи- циенты так, чтобы каждое уравнение удовлетворялось, хотя бы и приблизительно, но с общей наименьшей погрешностью. Если за меру погрешности взять среднее квадратичное из уклонений величин Y/= 2 aifii i = 1 от известных bj, определяемое формулой (30), то мы и придем к сформулированной выше задаче. Знание величины 62 в этом случае также полезно: оно помогает оценить надежность измерений. 8.82. Решение получается немедленно, если истол-, ковать задачу геометрически в вещественном простран- стве Rn. Рассмотрим т векторов аг, а2, ..., ат, компо- ненты которых выписаны в столбцах системы (29) а1 = {ац, а21> •••> ап1}> •••> ат={а1т> а2т’ •••> аяи»}« Составляя линейную комбинацию + ... + %тат, мы получим вектор у = {у1, ут}. Нужно определить числа .. ., так, чтобы вектор у по норме имел наименьшее возможное отклонение от заданного вектора b=[bl, Ь2, • • •,
8.84] § 8.8. НЕСОВМЕСТНЫЕ СИСТЕМЫ 273 Совокупность всех линейных комбинаций векторов а1, .. ат образует подпространство L = L (ах, а2, . .., ат). В этом подпространстве наименьшее расстояние до вектора b имеет проекция вектора b на подпространство L. Числа |х, •••> следовательно, должны быть выбраны так, чтобы линейная комбинация Е1ДХ4- .. . + ЕтДт привела к про- екции вектора Ъ на подпространство L. Но решение этой задачи нам известно; оно дается формулами 8.53, именно, мы имеем Е — — D («1, aj ... ai)(b, ax) (ay+1, ax)...(am, bj (alt am) ... (ay.!, am) (b, am) (aJ+v am)...(am, bm) где D—определитель Грама G(ax, a2, ..., am). 8.83. Результаты 8.72 дают нам возможность оценить и само уклонение б. Действительно, величина б есть вы- сота (/»+ 1)-мерного параллелепипеда, построенного на век- торах ах, ..., ат, Ь, и равна поэтому отношению объемов V(alt а2, .... ат, Ь) V (Др «г...ат) Записывая каждый из объемов с помощью определителя Грама, находим окончательно g2 = G(gi. Д«. •••. Ди. Ь) G (Д1, Дг..Ди) Тем самым поставленная нами задача полностью решена. 8.84. В вычислительной практике часто встречается следующая задача (интерполирование с наименьшей квадратич- ной погрешностью): на отрезке ae^tsszb дана функция указать многочлен Р (t) степени k, k < п, для которого квад- ратичное уклонение от функции f0 (<). измеряемое величиной п p)=s [w-p(*/)p« / = 0 становится наименьшим. Здесь t0, ..., tn—некоторые фиксиро- ванные точки отрезка а < t < Ь. Простое решение этой задачи на основании геометрических сооб- ражений было предложено М. А. Красносельским.
274 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.91 Введем евклидово пространство R, образованное из функций f (f), рассматриваемых только в точках ta, tlt .... tn, со скалярным произведением п (h g)= 2 /=0 Тогда наша задача сводится к определению проекции вектора f0 (?) на подпространство всех многочленов степени, не превосходя- щей k. Коэффициенты искомого полинома W = £o + £i^+• • • + даются теми же формулами, что и в разобранной выше задаче: 1 (1, 1) (/, 1) ... (/>-1, 1) (/0, 1) (/'+1, 1) ... (t\ 1) (1, t) (t, t) ... (f'-i, t) (f0, t) (f'+1, t) ... (i\ 0 (1, tk) (t, tk) ... (t-'-1, tk) (f0, tk) (/'+1, tk). .. (/", /*) где D определитель Грама D (1, t, .... tk). Само наименьшее квадратичное уклонение б2 можно вычислить по формуле D(l, t.....fk, f) ~ 0(1, t, ..., tk) • б2 (fo. § 8.9. Сопряженные операторы и изометрия 8.91. Операторы, сопряженные относительно формы (х, у). Сформулируем здесь результаты § 7.6 о связи между линейными операторами и билинейными формами в примене- нии к случаю, когда фиксирована форма (х, у) — скалярное произведение векторов х и у. Пусть А и В — линейные опе- раторы в евклидовом пространстве R„. Образуем билиней- ные формы А (х, у) и В (х, у) по формулам А(х, у) = (Ах, у), В(х, у) — (х, By). (32) Так как каноническим базисом формы (х, у) является любой ортонормальный базис пространства и канонические коэффициенты формы (х, у) в любом таком базисе все равны 1, то в силу 7.61 матрица формы А (х, у) в любом ортонормальном базисе совпадает с матрицей || а]/’ оператора А, а матрица || bjk || формы В (х, у) транспониро- вана по отношению к матрице || b‘jk'> || оператора В. Обратно (7.62), если в пространстве R„ заданы билинейные формы А (х, у) и В (х, у), то существуют и единственны такие
8.93] § 8.9. СОПРЯЖЕННЫЕ ОПЕРАТОРЫ И ИЗОМЕТРИЯ 275 линейные операторы А и В, что выполнены равенства (32). Далее, применяя результаты 7.63 к форме (х, .у), получаем следующий результат: Т е о р е м а. Для каждого линейного оператора А в евкли- довом п-мерном пространстве Rn существует и единствен сопряженный оператор — линейный оператор А', удовлетво- ряющий уравнению (Ах, у) = (х, А'у) при любых х и у из R„. Матрица оператора А' в любом ортогональном и нормированном базисе пространства Rn транспонирована по отношению к матрице оператора А. 8.92. С помощью операции сопряжения в евклидовом пространстве вводятся следующие классы операторов. а. Симметричные операторы, определяемые равенством А' =А. Симметричный оператор характеризуется тем, что в орто- нормальном базисе его матрица не меняется при транспони- ровании. б. Антисимметричные операторы, определяемые равенством А' = —А. Антисимметричный оператор характеризуется тем, что в ортонормальном базисе его матрица после транспониро- вания изменяет знак. в. Нормальные операторы, определяемые равенством А'А = АА'. Очевидно, нормальные операторы включают в себя и симметричные и антисимметричные. Изучение введенных классов операторов будет произведено в § 9.4. 8.93. Теперь сформулируем для евклидова пространства R„ результаты 7.73—7.76 относительно инвариантных опера- торов. Рассматриваются линейные обратимые отображения Q пространства Rn в себя, не изменяющие скалярного произ- ведения: (Qx, Qy) = (x, у).
276 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА [8.94 Эти отображения, названные в 7.73 инвариантными относи- тельно формы (х, у), здесь будем называть изометрическими. Изометрический оператор Q характеризуется равенством 7.75(33) Q'Q = E, где Q' — оператор, сопряженный к Q относительно формы (х, у), т. е. оператор, сопряженный к Q в смысле 8.91. Обратный оператор Q-1 = Q' к изометрическому оператору Q также изометричен. Произведение двух изометрических опе- раторов является изометрическим оператором (7.74). Согласно 7.75 изометрический оператор Q характери- зуется тем, что любой ортонормированный базис elt ..., еп переводится этим оператором снова в ортонормированный базис /1=Qe1, .... /„ = Qen. Матрица Q = ||?/’|] изомет- рического оператора Q в любом ортонормированием базисе называется ортогональной матрицей. Ортогональная матрица характеризуется условиями 7.76(35), имеющими в данном случае вид " . . f 1 при j=k, V /7<г>п<г> _ / i = i \ 0 при /=/=£, или же условиями 7.76(35'), имеющими вид m ( 1 при j=m, О при j^m, т. е. сумма квадратов элементов любой строки (любого столбца) равна 1, сумма произведений соответствующих элементов двух разных строк (столбцов) равна 0. 8.94. В силу равенства Q-1 = Q', обращением формул перехода от ортонормального базиса е1( ..., еп к другому ортонормальному базису Д, ..., fn /х^Ч+.-.+Л, ] ................f (33) /в=91пЧ+...+ЧпЧ J
8.95] § 8.9. СОПРЯЖЕННЫЕ ОПЕРАТОРЫ и изометрия 277 служат формулы =?11>Л+ • • • +#7Я, (34) en=^l7i В силу 5.31 координаты rjfc вектора х в базисе /j, ..., fn выражаются через координаты £у- этого же вектора в ба- зисе plt ..., е„ по формулам г1х=^1+..-+Л, ' •........ Пп = Л+.--+« . с обратными формулами &1 = 711>'П1+ ...-НхЧр U=?n’ni+ • • • -Wn4- (35) (36) 8.95. Рассмотрим здесь еще следующую задачу. Пусть заданы т < п числовых строк q)!> (i=l, ..., л; j= 1, ..., т), удовлетворяющих условиям п 2?^’= «=1 1 при j=k, О при j=/=k. Требуется найти еще л—т числовых строк s=«+l, ..., л, так, чтобы л Хл-матрица |[?/’|| (i, /=1, .. •, л) была ортогональной. Решение получается просто из геометрических сообра- жений. Интерпретируя заданные строки qp как координаты т векторов в евклидовом пространстве Rn со скалярным произведением (8.226) п ((Si. £„), Oh. •••, т]п))= мы видим, что нам заданы т ортогональных и нормирован- ных векторов qx, qm и задача состоит в том, чтобы дополнить их до ортонормального базиса в пространстве /?„. В этой геометрической формулировке задача становится очевидно разрешимой: например, можно дополнить векторы
278 ГЛ. 8. ЕВКЛЙДОВЫ ПРОСТРАНСТВА [8.96 Хо • ••, Чт произвольно до системы п линейно независимых векторов и далее провести ортонормализацию. 8.96. Рассмотрим еще некоторые свойства симметрич- ных операторов. а. Если подпространство R'cR инвариантно относитель- но оператора А, то ортогональное дополнение подпрост- ранства R', на основании 7.65, инвариантно относительно сопряженного оператора А'. Поэтому, если А — симметричный оператор, то из инвари- антности относительно А подпространства R' следует ин- вариантность относительно А и ортогонального дополнения к подпространству R'. б. Покажем, что на плоскости (п = 2) всякий симметрич- ный оператор имеет собственный вектор. Действительно, в данном случае уравнение для собст- венных значений flll Я12 Я21 Я22 ’ есть квадратное уравнение с дискриминантом (аи + а22)2 —4 (ап°22 —а21а12) = (“и —а22)2 + о, поэтому его корни вещественны. в. Пользуясь я и б и существованием инвариантной пло- скости у всякого оператора в вещественном пространстве (вы- текающим из выражения вещественной жордановой формы 6.63 (18)), можно доказать, что в пространстве R(i всякий сим- метричный оператор имеет ортогональный базис из собственных векторов. Мы в дальнейшем получим этот результат из общих соображений, не опираясь на вещественную жорданову форму (9.45). ЗАДАЧИ 1. Назовем скалярным произведением двух векторов простран- ства V3 произведение их длин. Будет ли пространство евклидовым? 2. А если назвать скалярным произведением двух векторов того же пространства произведение их длин на куб косинуса угла между ними? 3. А если назвать скалярным произведением удвоенное обычное скалярное произведение этих векторов? 4. Найти угол между противоположными ребрами правильного тетраэдра.
ЗАДАЧИ 279 5. Найти углы в треугольнике, образованном в пространстве (—1, 1) векторами x2(t) = t и х3(£)=1 — t. 6. Написать неравенства треугольника в пространстве С2 (а, Ь). 7. Определить косинусы углов между прямой ^1 = ^г= •••=!« и осями координат в пространстве 8. В пространстве R4 разложить вектор f на сумму двух векто- ров, один из которых лежит в линейной оболочке векторов &(-, а дру- гой ортогонален к этому подпространству: a) f = (5, 2, —2, 2), 61 = (2, 1, 1, —1), ft2 = (l, 1, 3, 0); б) / = (—3, 5, 9, 3), &i = (l, 1, 1, 1), Ь2 = (2, —1, 1, 1), Ь3 = (2, —7, -1, -1). 9. Доказать, что из всех векторов подпространства R (8.51) наимень- ший угол с вектором I образует вектор g. 10. Доказать, что если вектор g0 в подпространстве R' ортого- нален к проекции g вектора / на это подпространство, то gQ ортого- нален и к самому f. 11. Показать, что перпендикуляр, опущенный из начала коорди- нат на гиперплоскость Н, имеет наименьшую длину из всех векторов, соединяющих начало координат с этой гиперплоскостью. 12. В пространстве V3 с базисом i, J, k задана система векторов xt = i, хг = 21, х3 — 31, x4 = 4i — 2J, х6 = — х6=/+/+5Л. Построить ортогональные векторы у4, у2, (8.61). 13. В трехмерном подпространстве пространства Д4, порожденном векторами (1, 2, 1, 3), (4, 1, 1, 1), (3, 1, 1,0), построить ортогональ- ный базис, используя метод теоремы ортогонализации. 14. Пусть даны подпространства R' и R" евклидова пространст- ва R. Рассмотрим перпендикуляры, опущенные из концов единичных векторов e'£R' на R", и пусть m(R', R") — максимум из их длин; аналогично определяем величину т (R", R'). Неотрицательная величина 0 = max (и (R', R"), tn (R", R')} называется раствором подпространств R' и R". Показать, что при 0 < 1 размерности подпространств R' и R" равны (М. А. Красносельский и М. Г. Крейн). 15. Найти старший коэффициент А„ многочлена Лежандра Р„ (t). 16. Показать, что многочлен Лежандра Рп (t) есть четная функция при четном п и нечетная функция при нечетном п. Найти, в частности, Рп (-1). 17. Доказать, что в разложении многочлена tPn-x(t) по много- членам Лежандра IPп -1 (0 = аоРо (0 + aiP 1 (0 4- •.. + апРп (t) коэффициенты аа, alf ..., а„_3 и ап_1 равны нулю. 18. Найдя коэффициенты а(1_2 и ап в разложении многочлена /Дл_1(0 из задачи 17, получить рекуррентную формулу п?„(0 = (2п-1)^„_1(0-(п-1)Р„_г(0.
280 ГЛ. 8. ЕВКЛИДОВЫ ПРОСТРАНСТВА 19. Найти многочлен Q(0 = ^” + ^л-1+• • •+^л-х^+&п. Для которого интеграл + 1 -1 достигает наименьшего значения. 20. Найти норму многочлена Лежандра Р„(/). 21. Показать, что для любого линейного оператора А, действую- щего в «-мерном евклидовом пространстве R„, отношение Ь/А\— V lAxl> А*2' А*Л () V [xlt хг.........хп] постоянно (т. е. не зависит от выбора векторов xt, х2, ..., х„), и найти его величину («коэффициент искажения»), 22. Показать, что для любых двух линейных операторов А и В имеет место равенство k (АВ) = k (A) k (В). 23. Пусть х1( х2, ..., xk, у, г —векторы евклидова пространства R. Доказать неравенство V[xlt х2, xk, у, г] V[xv х2, ..., xk, г] V [хь х,, ..., xk, у] V[xlt х2, .... xk] 24. Пусть хь х2, ...,хт—векторы евклидова пространства R. Доказать неравенство 1 m ——р V[яр • • •» хт]< JJ {V[Xj, ..., x^-i, х^+1, ..., хт]} . й=1 Каков его геометрический смысл? 25. (Продолжение.) Доказать неравенства, уточняющие неравен- ство Адамара: 1 т V [Xi, х2, ..., хт] JJ {V [хь ..., х*_ 1, Xfe+i, ..., Хд,]} 1-2 JJ {V [Х1, ... , Х/;-!, X/g + 1, ... , Х;_п X[+lt ... , Xm]pm 1-2.. .(n-r) < П ....xir]}<m-i,('n-2)--- l<St<s2<. .. <sr<m 1 . m < Ц {V[XS1, x^]}m-I< JJ|x5| 1 < Sj fH 8—1 (M. К. Фаге).
ЗАДАЧИ 281 26. Если то по неравенству Адамара det||a(j||< ^,Мп пп/2. Показать, что эта оценка не может быть улучшена для п = 2т. 27. Если N (А) и Т (А)—соответственно нуль-многообразие и об- ласть значений оператора А, то ортогональные дополнения этих под- пространств суть соответственно область значений и нуль-многообра- зие оператора А. 28. Показать, что для каждого элемента а;к ортогональной мат- рицы А соответствующее алгебраическое дополнение Ац1 = ац1 det А. 29. Показать, что сумма квадратов всех миноров fe-го порядка, расположенных в k фиксированных строках ортогональной матрицы, равна 1; сумма произведений всех миноров k-ro порядка в одной группе строк на соответствующие миноры й-го порядка другой группы строк равна 0. 30. Некоторый линейный оператор Q сохраняет длину каждого вектора; показать, что он является изометрическим. 31. Оператор А, сохраняющий ортогональность любых двух век- торов х, у (так что из (х, у) = 0 вытекает (Ах, Ау) = 0), называется равноугольным оператором. Всякий изометрический оператор является равноугольным. Кроме того, равноугольными являются оператор по- добия (Ах = Хх для любого х) и произведение оператора подобия на изометрический оператор. Доказать, что всякий равноугольный опе- ратор есть произведение оператора подобия и изометрического опера- тора. 32. Показать, что при п^З всякий линейный оператор Q, дей- ствующий в n-мерном пространстве R„ и не изменяющий площади любого параллелограмма, так что V[x, y]=V[Qx, Qy], есть изометрический оператор. 33. Показать, что при k < п всякий линейный оператор Q, дей- ствующий в n-мерном пространстве R„ и не изменяющий объема лю- места, так как в этом случае всякий оператор Q с detQ=± 1 будет удовлетворять условию задачи. 34. В евклидовом пространстве R„ заданы конечные множества E = {xi, х2, ..., xft} и G = {ylt уг, ..., уь}. Для того чтобы сущест- вовал изометрический оператор Q, переводящий одновременно каждый вектор X; в соответствующий вектор у((/ = 1, 2.й), необходимой достаточно, чтобы имели место равенства (х/, Xj) = (yh yj) (i, / = 1, 2.k). 35. Углы между двумя подпространства-ми. В евклидовом пространстве R заданы два подпространства R' и R". Пусть нормированный вектор е' пробегает единичную сферу подпро- странства R', а нормированный вектор е" независимо от е' пробегает единичную сферу подпространства R". Угол между е' и е" на неко- торой паре е' =e'v е" = е" достигает минимума, который мы обозначим
282 гл. 8. евклидовы пространства через фх. Пусть, далее, е' меняется по своей единичной сфере, оста- ваясь ортогональным к е', и е" меняется по своей единичной сфере, оставаясь ортогональным к е". Угол между е' и е" при этих условиях достигнет минимума ф2 5= <Pi на некоторой паре е'= е'2, е" = е". Пусть, далее, е' меняется по своей единичной сфере, оставаясь ортогональ- ным к е'г и е', и е" меняется по своей единичной сфере, оставаясь ортогональным к е" и е"; мы получим новый минимум угла ф3йгф2 и новую пару е'3 и е". Продолжая этот процесс далее, мы получим некоторую совокупность углов фх, <р2, ..., число которых равно наименьшей из размерностей подпространств R' и R". Углы фг, ф2,... .... фА называются углами между подпространствами R' и R". По- казать, что: а) углы фх, <р2, ..., <р^ определены однозначно и не зависят от выбора векторов e'lt е", е'2, е", ..., если по построению эти векторы не определены однозначно; б) углы фх, <р2, ..., фд, опре- деляют подпространства R' и R" с точностью до положения в прост- ранстве; иными словами, если имеются две пары подпространств R', R" и S', S" и углы между подпространствами R' и R" такие же, как между подпространствами S' и S", то существует изометрический опе- ратор, переводящий одновременно S' в R' и S" в R"; в) для любых наперед заданных углов 0< срг < <р2 <...«£ л/2 можно построить пару подпространств R' и R", углы между которыми совпадают со- ответственно с числами фх, ф2, •••> Фл- 36. Пусть yi, у-2, ,у„1 — ортогональные проекции соответственно векторов хх, х2, ..., хт на некоторое подпространство. Доказать, что объем параллелепипеда, построенного на векторах ylt уг.....1/т,не превосходит объема параллелепипеда, построенного на векторах Xi, х2, ..., хт. 37. (Продолжение.) Предположим, что в задаче 36 как векторы хх, х2, ..., хт, так и векторы уъ у2, ..., ут линейно независимы. Показать, что справедлива формула V [!/1, 1/2- •••. i/M] = V[Xi, х2, ..., х,л] cos cq cos а2... cosaffl, где ах, сс2» •••* — углы между подпространствами L |хх, х2, • • - хиJ = Lx и L |l/i, </2, • • • - Ут} ^-з (задача 35). 38. Будем называть k-вектором совокупность k векторов евкли- дова пространства R. Два й-вектора {хг, х2, .... xk} и {//х, у2, ..., у^} называются равными, если: 1) объем V {хх, х2, ..., xk] равен объему V {i/i, 1/2, • ••, 2) линейная оболочка L (хх, х2....xk) совпадает с линейной оболочкой L (z/x, у2, ..., ук)-, 3) системы хх, х2, ..., хк и i/i, у2, ..., у k имеют одинаковую ориентацию (т. е. оператор в про- странстве L (хх, х2, ...,xk), переводящий систему {хх, х2, ..., xft} в систему {г/i, у2, ..., yk\ имеет положительный определитель). Показать, что fc-вектор |хх, х2....xk} в п-мерном пространст- ве R„ определяется однозначно, если известны величины всех мино-
ЗАДАЧИ 283 ров fe-ro порядка матрицы (( (г = 1, 2, п; /=1, 2, ...,k), составленной из координат векторов х1( х2, xk в произвольном ортогональном и нормированном базисе е1,е2, .еп пространства R„. 39. Если й-вектор |х1т х2, ..., xk} равен fe-вектору у2, ..., ук} (см. задачу 38), то миноры k-ro порядка матрицы из координат век- торов xlt х2....xk равны соответствующим минорам матрицы из координат векторов ylt у2, ..., yk. 40. Назовем углами между двумя fe-векторами {%, х2, ..., хк} и {</1> Уг< ..., Ук} набор углов между данными подпространствами Lt = = L{xj, х2, .... хА} и L2 = L {t/i, у2, • • > Ук} (задача 35), выбираемых, однако, с тем дополнительным условием, чтобы векторы elt е2.ек, взятые в подпространстве Ц для построения этих углов, имели бы ту же ориентацию, что и векторы Xj, х2, ..., хк (это условие играет роль лишь .при построении последнего вектора еА); аналогично и в подпро- странстве L2. Показать, что углы Pj , р2, ..., рА между ^-векторами и углы ах, «2, ..., ак между соответствующими подпространствами связаны следующими соотношениями: а/ = ₽/ (/<*). Як = $к или аА = л —pft. 41. Назовем скалярным произведением двух /г-векторов Х = = {хг, х2, ..., xft} и Y = {(/!, у2, .Ук}> заданных матрицами X и У из координат векторов х/, у, в некотором ортогональном и нормиро- ванном базисе пространства R„, сумму всех произведений миноров fe-ro порядка матрицы X на соответствующие миноры матрицы У. Показать, что это скалярное произведение равно V[хь х2.....xft] V [j/j, у2.ук] cos Pj cos р2 ... cos pfe, где pp P2, ..., Pfe — углы между fe-векторами X и У. 42. Показать, чго скалярное произведение двух ^-векторов Х — (Х1 хк) и У = ((/1, ..., Ук) может быть записано в форме (*1, У1) (*1. Уъ) ••• (*i. Ук) {х, у}= (Х2’ У1) (А'2’^2’ Ук) (хк, У1) {хк, У2) (хк, У к) 43. Если многочлен [Р (/)]* является аннулирующим для симме- тричного оператора А, то многочлен Р (t) также является аннули- рующим для этого оператора.
ГЛАВА 9 КОМПЛЕКСНЫЕ ПРОСТРАНСТВА СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ §9.1. Эрмитовы формы 9.11. Числовая функция A(x,j) от двух аргументов х, у в комплексном пространстве С называется эрмитово-билиней- ной, или, короче, эрмитовой формой, если она является ли- нейной формой 1-го рода от х при каждом фиксированном значении у и линейной формой 2-го рода от у (4.14) при каждом фиксированном значении х. Иными словами, А (х, _у) есть эрмитова форма от х и у, если для любых х, у, z из С и любых комплексных а удов- летворяются следующие условия: А (х -\-z, у) = А (х, у) 4- A (z, у), \ А (ах, у) =аА(х,у), I А (х, у + z) == А (х, у) + А (х, z), А(х, ау) = аА(х, j). Из этого определения легко получается и общая формула (k m \ k m _ 2 <№, 2 2 2 а^А(хьу}), (2) i=l j=l / i=lj=l где xx, ..., xk, ylt ..., ym—векторы пространства С, ax, ...,aft, px, ..., —любые комплексные числа. 9.12. Примеры. а. Если Д (х)—линейная форма 1-го рода, а /2 (х) — линейная форма 2-го рода (4.14), то A(x,y)=fx(x) /г(у)— эрмитова форма.
9.14] §9.1. ЭРМИТОВЫ ФОРМЫ 285 б. В л-мерном пространстве Сп с базисом elt ..., еп п п функция от векторов х = %kek и у = п А (X, у) = S (3) i, >=1 является эрмитовой формой при любых комплексных аг7(1,;=1, п). В действительности выражение (3) дает общий вид эрми- товой формы в л-мерном комплексном пространстве. Это доказывается так же, как в 7.13 доказывалось аналогичное предложение для билинейных форм в пространстве К„. 9.13. Эрмитова форма А (х, у) называется - симметричной эрмитовой формой, если для любых векторов х и у к {у, х) = А(х, у). (4) Если эрмитова форма А (х, у) в комплексном пространстве С„ записана через координаты формулой (3) и симметрична, то а1к = А (е,-, ек) = А (ек, = ам, (5) т. е. матрица ||<zife|| формы А в базисе ех, .-.,еп после транспонирования и замены элементов на комплексно сопря- женные переходит в себя. Обратно, если в некотором базисе ех, .. ., еп коэффициенты эрмитовой формы А (х, у) удовлет- воряют условиям (5), то форма А (х, у) симметрична. В самом деле, А (у, х) = 2 aikr\i Ik = i, k = l = S = S дм^П< = А(х,.у). i, k= 1 i, k = l Матрицу || aik ||, для которой aik = akl ..., л), бу- дем называть в дальнейшем эрмитово-симметричной. 9.14а. Пусть эрмитова форма A(x, j) в базисе ev ..еп пространства С„ имеет матрицу А(е) = || а[к ||, а в базисе /1, • • •> fn~матРВДУ А(/) = ||6jft|], причем векторы/у и бу
286 ГЛ, 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.15 связаны соотношениями J=i Рассуждая также, как в7.15а, приходим к следующему ре- зультату: между матрицами и Л(е) имеет место соотно- шение л(/,=р*д(е)р, (6) где Р = Ир)0 || — матрица перехода от базиса elt .. еп к ба- зису flt . . а Р*—матрица, получающаяся из матрицы Р транспонированием и переходом к комплексно сопряженным величинам. Обозначая Р*= ||/?)й ||, имеем Р^ = Р1Г (£,/= 1, .. ., л). б. Из равенства (6), как и в 7.23, вытекает, что ранг матрицы Ам эрмитовой формы А(х,у) не зависит от выбора базиса {е}. Форма А (х, у) называется невырожденной, если ее ранг (т. е. ранг матрицы Д(е) в любом базисе {е}) равен числу л—размерности пространства С„. Если форма А (х, у) невырождена, то для любого х0 0 найдется вектор у0 € С„ такой, что А (х0, у0) =/= 0 (ср. 7.15в). 9.15а. Эрмитово-квадратичной формой в комплексном про- странстве С называется функция от одного аргумента х £ С, которая получается из эрмитово-билинейной формы А (х, у) заменой у на х. В л-мерном комплексном пространстве С„ с базисом е1, ...,еп эрмитово-квадратичная форма через координаты вектора х, в силу 9.126, записывается в виде А(х, х) = 2 aikllk (7) i, k=i с некоторыми комплексными коэффициентами aik. И обратно, функция А (х, х) вида (7) есть эрмитово-квадратичная форма, которая получается заменой у на х в эрмитово-билинейной форме A(x,j)= 2 aikli^k- (, k=i
9.16] § 9.1. эрмитовы формы 287 б. Если эрмитово-билинейная форма А (х, у) симметрична, так что aik = ак!, то соответствующая эрмитово-квадратич- ная форма также называется симметричной. Симметричная эрмитово-квадратичная форма А (х, х) при- нимает лишь вещественные значения, поскольку из (4) сле- дует, что А (х, х) = А (х, х). В отличие от случая 7.22, эрмитово-билинейная форма уже определяется однозначно по соответствующей ей эрми- тово-квадратичной форме. Действительно, мы имеем А (х -фу, х-}-у) = А (х, х)+ А (х, у) А (х, у) 4- А (у, у), А(х~Ну, х-Ну) = А(х, х) — /А (х, у) -ф ZA (х, у) -ф А (у, у). Из первого уравнения мы можем найти А (х, у)4-А(х,у) = = 2ReA(x, у) через значения квадратичных форм А (х, х), А (у, у) и А(х+у, х-фу). Из второго уравнения аналогично можнонайти—i'A(x,y)+ /А (х, у)= 2 Im А (х, у). Это дока- зывает наше утверждение. Если в некотором базисе е1, ...,еп квадратичная форма А (х, х) записана в виде А (х, х) = 2 «лЛ/Г*» Л k — 1 то эрмитово-билинейная форма п А(х,у)= 2 МЛ» з, k=l очевидно, приводится к форме А(х, х) при подстановке у — х. По доказанному, выписанная форма А (х, у) является един- ственной эрмитово-билинейной симметричной формой, при- водящей к данной форме А (х, х) при подстановке у = х. 9.16а. В п-мерном пространстве Сп существует базис, в котором эрмитово-квадратичная симметричная форма запи-
288 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.16 сывается в каноническом виде А (х, х) = 2 Мл = 2 М ns Г (8) s=i &=i с вещественными коэффициентами , Ап. Доказательство проводится аналогично доказательству теоремы 7.31. Вместо равенства 7.31 (12) используется ра- венство (Z>OTW=/=0) Вда 4“ • • • 4~ ^zn —1, m^>m— 1 S/я + ^>ra “I7" 4“ ^lm SlS/я 4“ • • • 4“ 1, m Szn-1 S/n ^^I^Bi+.-.+^f^U-i + ^r + AUx, x), I uaim umm I где A1(x, x) — эрмитово-квадратичная симметричная форма от аргументов £х, |m_x. Вместо преобразования 7.31 (14) используется преобразование ^=1'1+1;, 5з = 5з I Сумму (а12=7^°) оно приводит к виду (а12 ~Ь аи) £151 г (а12 ali) 5г5а ~Ь • • » причем хотя бы один из двух коэффициентов аХ2 + а12 и г (а12— а1г) заведомо отличен от 0. б. Теорема инерции 7.91 сохраняется (для эрмитово- квадратичных симметричных форм) и в комплексной области: число р положительных и число q отрицательных коэффициен- тов в наборе Хх, (8) не зависит от выбора каноничес- кого базиса формы А(х, х). Эти числа р и q называются индексами инерции формы А(х, х); первый — положительным индексом инерции, второй — отрицательным. Доказательство полностью повторяет доказательство теоремы 7.91. Заметим, что для квадратичных (не эрмитово-квадра- тичных) форм в комплексном пространстве С„ закон инерций
9.17] § 9.1. эрмитовы формы 289 не имеет места. Например, квадратичная форма А(х, Х) = ^-На преобразованием координат = ?2 == ZT12 приводится к виду А (х, х) = т]? — Til- в. Для данной эрмитово-квадратичной симметричной формы А (х, х) в пространстве С„ можно всегда найти каноничес- кий базис так, что соответствующие канонические коэф- фициенты будут равны или —1. Для этого, приведя форму А(х, х) к виду А (х, х) = Х1|т]1|24- ... 4-^|^l2-MihF+i!2- • • • где . . ., % положительны, совершаем даль- нейшее преобразование координат по формулам V И1 Др + 1 = Тр + 1> •••> V<!x91lj0 + 9 = Xp + q' после чего форма А (х, х) принимает вид А (х, x) = |tJ24- .. -4-|^|a-|Tf+1|2-.. ,-Itp+Js. 9.17а. Вектор х, называется сопряженным к вектору уг относительно эрмитово-билинейной формы А (х, у), если А(хъ у1) = 0. Если векторы хь . . ., xk сопряжены с вектором уъ то также сопряжен с вектором^ любой вектор подпространства L (х1; ..., xk) — линейной оболочки векторов xlt ..., хк. Вообще, если вектор у сопряжен с каждым вектором некото- рого подпространства С'с С, мы будем называть этот вектор сопряженным к подпространству С'. Совокупность С" всех векторов х £С, сопряженных к подпространству С', очевидно, и сама является подпространством в С; это подпространство С" мы будем называть сопряженным к С'. Базис е1, ...,еп пространства С„ называется канони- ческим базисом формы А (х, у), если А (е;, еу-) = 0 при Всякая симметричная эрмитово-билинейная форма А (х, у)
290 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА (9.18 имеет канонический базис: это базис, в котором соответст- вующая квадратичная форма А(х, х) записывается в кано- ническом виде (8). Действительно, по 9.156 в этом базисе п п форма А (х, у) при х = JP,i]kek, J = 2 принимает вид 4=1 4=1 п _ А j) = 2 4=1 так что Х(- при J= i, О при /=£ /. б. Если угловые миноры матрицы эрмитово-квадратичной симметричной формы А (х, х) отличны от нуля, то канонический базис формы А (х, х) может быть построен по методу Якоби, как в 7.52. При этом сохра- няются и формулы (24) для канонических коэффициентов формы А (х, х): ^1 — ^1, ^2~ т _ А °п-1 в. Эрмитово-билинейная симметричная форма А (х, у) на- зывается положительно определенной, если при любом х =/= О А (х, х) > 0. Так же как и в вещественном случае (7.94), эквивалентным условием является положительность всех канонических коэффициентов формы А (х, х), или, что то же, равенство р = п, гдер—-положительный индекс инерции формы А (х, х). Необходимым и достаточным условием положительной определенности формы А (х, у), как и в 7.96, является выпол- нение условий Сильвестра > 0, 62 > 0, . . ., д„ > 0. Доказательство, приведенное в 7.96, проходит в комплексном случае без изменений. 9.18а. Имея эрмитово-билинейную невырожденную сим- метричную форму (х, у), можно, аналогично тому как это было сделано в 7.61, ввести понятия сопряженных опера-
0.10) § 9.1. эрмитовы формы 291 торов (относительно формы (х, у)). Прежде всего, если А и В — линейные операторы в пространстве С„, то функции А(х, у) = (Ах, у), В (х, у) = (х, By) являются эрмитово- билинейными формами, матрицы которых связаны с мат- рицами операторов А и В (в любом каноническом базисе формы (х, у) с каноническими коэффициентами еу) формулами ®/m &jb j . Обратно, по заданным эрмитово-билинейным формам А (х, у) и В(х, у), как в 7.62, можно указать, причем единственным образом, операторы А и В так, что А (х,у) = (Ах, у), В (х, у) = (х, By). б. Отсюда, как в 7.63, следует существование для любого оператора А такого оператора А*, что при любых х и у из Сп (Ах, у) = (х, А*у). Оператор А* определен единственным образом; в канони- ческом базисе формы (х, у) с каноническими коэффициен- тами 8у матрицы Цй^’11 и операторов А и А* связаны соотношениями Оператор А* называется эрмитово-сопряженным к опера- тору А относительно формы (х, у). в. Имеют место следующие формулы (ср. 7.64)\ а) (А*)*=А для любого оператора А; б) (А-ф В)* = А* + В* для любых А и В; в) (А,А)* = А,А* для любого оператора А и любого г) (АВ)* = В*А*. 9.19а. Назовем два комплексных пространства С' и С" с выделенными в них эрмитово-билинейными симметричными формами А (х', у') и А (х", у") k-изоморфными, если прост- ранства С' и С" изоморфны как комплексные пространства (2.71) и если для соответствующих друг другу пар элемен- тов х', у' из С' и х", у" из С" справедливо равенство А (х', у') = А (х", у").
292 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.21 б. Теорема. Два конечномерных комплексных прост- ранства С' и С" с выделенными в них эрмитово-билинейными симметричными формами А(х', у') и А (х", у") являются А-изоморфными тогда и только тогда, когда размерности С' и С" одинаковы и индексы инерциир' и фформы А )х', у') совпадают с индексами инерции р" и q" формы А (х", у"). Доказательство проводится точно так же, как доказательство аналогичного предложения для вещественных пространств (7.93). в. В частности, два пространства С„ и С'„ одинаковой размерности п с выделенными в них положительно опреде- ленными формами А(х', у') и А(х”,у") всегда А-изоморфны. § 9.2. Скалярное произведение в комплексном пространстве 9.21. В вещественном пространстве в качестве скаляр- ного произведения двух векторов мы брали фиксированную симметричную положительно определенную билинейную фор- му. Соответствующая квадратичная форма положительна на каждом ненулевом векторе и позволяет тем самым определить его длину. В комплексном пространстве аналогичным свой- ством обладает положительно определенная эрмитово-били- нейная форма (9.17в). В связи с этим мы принимаем сле- дующее определение: Комплексное линейное пространство С называется уни- тарным пространством, если в нем фиксирована некоторая положительно определенная эрмитово-билинейная форма, называемая (комплексным) скалярным произведением- иными словами, если каждой паре векторов х, у из С поставлено в соответствие комплексное число (х, у), удовлетворяющее условиям: а) (у, х) = (х, у) для любых х, у из С; б) (х, уz) = (х, у) + (х, z) для любых х, у, z из С; в) (Хх, у) = X (х, у) для любых х, у из С и любого комплексного числа X; г) (х, х) > 0 для любого х#=0; (0, 0) = 0. Из аксиом а) — в) следует общая формула / р я \ р я ( 2 aJxJ' 2 Ms ) = 2 2а/МЗД) \/ = i k-i J i=\k=\
9.23] § 9.2. скалярное произведение 293 для любых хг, . . ., Хр, yv , Уд из С и любых комп- лексных ах, . . ., ар, рх, . . ., 9.22. Примеры. а. В «-мерном пространстве С,г (2.156) введем скалярное произведение векторов х = (^ь ..., g„), _y=(r|i, •••> Лп) по формуле (х, у) = ^Л1 + • • • + ^«Ли- Выполнение свойств а) — г) легко проверяется. б. В пространстве С (а, Ь) комплексных непрерывных функций на отрезке [а, /?] (2.15г) скалярное произведение функций х = х (t) и y—y (t) введем по формуле ь (х, у) = Jx (t)y (t) dt. a Выполнение аксиом a) — г) следует из основных свойств интеграла. 9.23. Основные метрические понятия В уни- тарном пространстве С можно ввести некоторые метрические понятия аналогично тому, как это делалось в вещественном евклидовом пространстве (§ 8.3). а. Длина вектора. Как и в вещественном случае, длиной (или нормой) вектора х называют величину |х| = +У(Х, X)'. У всякого ненулевого вектора длина положительна, длина нулевого вектора равна 0. При любом комплексном а имеет место равенство |ах ' = (ах, ах) = аа (х, х) = I а (х, х) = |а| |х|, показывающее, что модуль числового множителя можно выносить за знак длины вектора. Вектор х длины 1 называется нормированным. Каждый вектор х можно нормировать — разделив его на его длину, получить вектор того же направле- ния (т. е. лежащий в том же одномерном подпространстве)
294 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.23 и единичной длины. Совокупность всех х£С с | х | 1 называется единичным шаром пространства С. б. Неравенство Коши — Буняковского. Для любых двух векторов х, у из С имеет место неравенство _у);<И>1- (9) Доказательство проводится по той же схеме, что и в вещественном случае (8.33), но с некоторой осторож- ностью обращения с комплексными числами. Если (х,у) = 0, неравенство (9) очевидно. При (х,у)=^() замечаем, что (Zx—у, Кх—у)^0 при любом комплексном X. Раскрывая скобки, находим | X |2 (х, х) — % (х, у) — % (х, у) + (у, J) > 0. (10) Будем считать, что X изменяется по прямой у, симметрич- ной относительно вещественной оси с прямой, определяемой комплексным числом (х,у), так что X = te0, где t веще- ственно, a z0— единичный вектор, определяющий направле- ние прямой у, 20 = । । • Тогда X (х, у) = 11 (х, у) | есть вещественное число, так что % (х, у) = X (х, у). Нера- венство (10) преобразуется к виду Р (х, х) — 2/1 (х, у) | + (у, у) 0. (11) Теперь та же аргументация, что и в 8.33, приводит нас к искомому неравенству (9). Если в неравенстве (9) стоит знак равенства, то трех- член в левой части (11) имеет один вещественный корень /0. Заменяя tz0 на %, мы получаем, что трехчлен в левой части (10) имеет корень А,0 = /0г0, откуда (Хох —у, Хох —у) = 0 и у = ‘кох, так что векторы х и у отличаются лишь (ком- плексным) множителем. в. Ортогональность. В унитарном пространстве не вводят понятия угла между векторами. Рассматривают лишь случай, когда векторы х и у ортогональны; под этим, как
9.24] § 9.2. СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ 295 и в вещественном случае, понимают выполнение равенства (х,у) = 0. При этом, очевидно, и (у, х) = (х, у) = 0. Для ортогональных векторов, как легко проверить, ос- таются справедливыми аналоги лемм 8.36а—б и теорема Пифагора 8.37. Далее, справедлива теорема о разложении 8.5Г. для конечномерного подпространства С'с С и любого вектора f £ С существует (и единственно) разложение f=g+h, где g£C', h ортогонален к С'. Совокупность всех векто- ров h, ортогональных к подпространству С', снова обра- зует подпространство, которое называется ортогональным дополнением к подпространству С'. Обозначая его через С", выводим, как в 8.51, существование разложения С = С'4~С" в прямую сумму ортогональных слагаемых. г. Неравенства треугольника. Если х и у—• два вектора в унитарном пространстве С, то по неравен- ству Коши — Буняковского (б) |х+у |2 = (х+у, х+у) = (х, х) + (х,у) + (х,у) + (у,у) ( < (х, х) + 21 (X, У) I + (у, у)< (I X I + |у |)2, I Хх, х) — 2|(х,у)| + (у,у)Х|х| — | у |)2, откуда |х+у | I ХИ-И1- (12) Неравенства (12), как и в вещественном случае, называются неравенствами треугольника. 9.24. Ортогональный базис в л-мерном уни- тарном пространстве Сл. В л-мерном пространстве (симметричная) эрмитово-билинейная форма (х,у) обладает каноническим базисом elt ..., еп (9.16а). Условие ка- ноничности (е;, ej) =0 (i=^j) в данном случае есть условие ортогональности. Ортогональные базисные векторы ег, ..., еп можно далее считать нормированными, так что
296 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.25 К|= • • • =|е„| = 1. Если при этом х = '£11кек, у = ^Цкек — 1 1 любые два вектора из Сп, мы получаем формулу для ска- лярного произведения / п п \ п _ (х, 2 НА } = 2 S/А- (13) \ 1 1 /1 9.25а . В соответствии с 9.18а устанавливается взаимно однозначное соответствие между эрмитово-билинейными фор- мами А(х,у) и линейными операторами А, действующими в пространстве Сп, по формуле А (х, у) = (Ах, у). В любом ортонормированном базисе ev ..., е„ простран- ства С„ матрица || ajk || формы А (х, у) (а/к = А (е/у ек)) и матрица || aj*11| оператора А (Аел = связаны соотно- 1 шениями п __________________________ ~ aik — а/ • б. В соответствии с 9.186 вводится понятие сопря- женности операторов А и А* относительно скалярного произведения (х, у). Именно, для любого линейного опера- тора А, действующего в пространстве Сп, существует и единствен эрмитово-сопряженный оператор — оператор А*, удовлетворяющий уравнению (Ах, у) = (х, А*у) для любых х и у из С„. Поскольку ортогональный и нормированный базис есть канонический базис формы (х,у) с каноническими коэффи- циентами еу= 1, в любом ортогональном и нормированном базисе пространства Сп матрицы || а,^’ || и || а$* || операто- ров А и А* связаны соотношениями а*<т> __ Тф в. Как и в 8.95а, ортогональное дополнение С" к под- пространству С'с:С, инвариантному относительно операто- ра к, инвариантно относительно сопряженного операто- ра А*.
9.26] § 9.2. СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ 297 9.26. Линейное преобразование в л-мерном комплексном пространстве, соответствующее переходу от одного орто- нормированного базиса к другому такому же, называется унитарным преобразованием. Унитарные преобразования ана- логичны ортогональным преобразованиям вещественного пространства (8.93). Если е1г . . ., еп и /х, ..., /„ — орто- нормированные базисы и есть матрица соответ- ствующего унитарного преобразования, так что п ft = 2 “*Ч> k=l то, очевидно, " .—г (0 при . . (U) 7 &=! (1 при l=J. Обратно, если числа и)р удовлетворяют соотношениям (14), то матрица есть матрица унитарного преобразования, или, короче, унитарная матрица. Линейный оператор U, соответствующий унитарной мат- рице, называется унитарным оператором. Так же как изо- метрический оператор в вещественном пространстве, унитар- ный оператор в комплексном пространстве не изменяет п п метрики: если х = У, у = У, то z=l ?=1 (Ux, Uy)= 2 (Ue<’ Uey) = i, 3 = 1 = 2 (/<’ = 2 ^т1< = (*’ уУ i,J=l 1=1 Матрица V обратного перехода от базиса к базису {е(} обратна матрице U и также унитарна; далее, если V = ||, мы имеем «£’ = (Л> ekh = («/, fk> = «?’; таким образом, матрица, обратная к унитарной, получается путем транспонирования и перехода к комплексно сопряжен- ным элементам. Итак, для унитарного оператора U U'^U* или U*U = UU*=E.
298 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.31 § 9.3. Нормальные операторы 9.31. Опр еделение. Оператор А, действующий в л-мерном унитарном пространстве С„, называется нормаль- ным, если он коммутирует со своим сопряженным: А* А = АА*. (15) Примером служит оператор А, обладающий ортогональ- ным базисом из собственных векторов . . ., еп, так что Ае/ = Ъе/ (7= 1> • • •, «)• Действительно, матрица этого оператора А в базисе ev ..., еп имеет вид (16) Согласно 9.256 матрица оператора А* в том же базисе elt еп имеет вид Xi (17) отсюда очевидно, что операторы А и А* коммутируют. 9.32. Теорема. Каждый собственный вектор х0 нор- мального оператора А с собственным значением Хо является собственным вектором оператора А* с собственным значе- нием Хо. Доказательство. Пусть РсС„— подпространство, состоящее из всех собственных векторов оператора А с соб- ственным значением Хо. Покажем, что Р инвариантно отно- сительно оператора А*. Для х £ Р мы имеем АА*х = А* Ах = А* (Хх) = ХА*х, откуда следует, что А*х£Р, что и требовалось. Далее, для любых х и у из Р мы имеем (А*х, у) — (х, Ау) = (х, Ху) = (Хх, у),
9.33] § 9.3. НОРМАЛЬНЫЕ ОПЕРАТОРЫ 299 откуда для любого х С Р А*х = Хх. Теорема доказана. 9.33а . Теорема. Для всякого нормального оператора А существует ортогональный и нормированный базис ег, . . ., еп из собственных векторов оператора А. Доказательство. Нормальный оператор А, как и всякий линейный оператор в пространстве С„, имеет соб- ственный вектор (4.956). Пусть е— собственный вектор оператора А с собственным значением X. Пусть РсС„— подпространство, состоящее из всех собственных векторов оператора А с этим собственным значением X. Если Р есть все пространство Сп, то, произвольно дополняя в Сп век- тор ег векторами е2, . . ., еп до ортогонального и нормиро- ванного базиса, получаем, что теорема доказана. Если Ру=Сп, то пусть Q — ортогональное дополнение подпростран- ства Р в Сп. Так как в силу 9.32 каждый вектор простран- ства Р оператором А* переводится снова в вектор простран- ства Р (даже в себя самого с коэффициентом X), то под- пространство Р инвариантно относительно оператора А*. В силу равенства А** = А (9.18в)) и теоремы 9.25в, подпро- странство Q инвариантно относительно оператора А. Теперь воспользуемся принципом индукции, считая, что теорема справедлива для пространств меньшей размерности; тогда в подпространстве Q можно выбрать ортогональный базис, удовлетворяющий требуемому условию; присоединяя любой ортогональный базис подпространства Р, мы получим пол- ный ортогональный базис в пространстве Сп, удовлетворяю- щий условию теоремы. б. В силу а, всякий нормальный оператор А оказывается диагонализируемым (4.72е)-, в базисе из его собственных векторов, построенном в а, этот оператор имеет диагональ- ную матрицу
300 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9-34 На главной диагонали матрицы стоят собственные зна- чения оператора А; каждое из них повторяется столько раз, какова размерность соответствующего собственного подпространства. Поэтому характеристический многочлен det ||А — ХЕ|| опе- ратора А (который, как мы знаем, не зависит от выбора базиса) имеет вид det||A —ХЕ||=Ц (%,- —(18) 7=1 7=1 где Xj, — различные собственные значения опера- тора А, а ..., km — размерности соответствующих соб- ственных подпространств. в. С другой стороны, пусть известно, что у некоторого нормального оператора А характеристический многочлен имеет вид det||A-XE|| = n<E(— VPl, (19) < = i где щ, ..., р,— различные числа, ..., ps—некоторые кратности. Тогда можно утверждать, что оператор А имеет ортонормальный базис из собственных векторов с собствен- ными значениями рг, ..., ps, причем размерность собствен- ного подпространства, отвечающего значению ру-, равна числу Pj. В самом деле, в силу единственности характери- стического многочлена имеет место равенство многочленов (18) и (19), откуда, применяя теорему о единственности разложения многочлена на множители, получаем нужное. 9.34. Самосопряженные операторы. Если А* = А, то оператор А называется самосопряженным. Иными сло- вами, оператор А самосопряжен, если соответствующая оператору А билинейная форма (х, Ау) эрмитово-симме- трична: (Ах, у) = (х, Ау). (20) Оператор А, удовлетворяющий уравнению (20) для любых двух векторов х и у, называют поэтому также эрмитово- симметричным или эрмитовым оператором.
9-35] § 9.3. нормальные операторы 301 В силу теоремы 9.256 матрица самосопряженного опера- тора в любом ортогональном и нормированном базисе совпа- дает со своей эрмитово-транспонированной матрицей, иными словами, есть эрмитово-симметричная матрица. И обратно, каждый оператор А, имеющий в некотором ортогональном и нормированном базисе эрмитово-симметричную матрицу, является самосопряженным оператором. Так как самосопряженный оператор, очевидно, нормален, то можно применить 9.32; мы получаем в данном случае, что ?с0 = ?с0, откуда следует, что каждое собственное зна- чение сопряженного оператора вещественно. Далее, приме- няя 9.33а, получаем следующую основную теорему: Теорема. Для всякого самосопряженного оператора А в унитарном пространстве Сп существует ортонормальный базис из собственных векторов оператора А с веществен- ными собственными значениями. Обратно, всякий линейный оператор А в пространстве С„, обладающий указанным свойством, является самосопряжен- ным'. действительно, по 9.31 он нормален, и, сравнивая (16) с (17), в силу вещественности чисел X- заключаем, что А*= А. 9.35. А н ти само сопряж е нны е операторы. Если А* = — А, то оператор А называется антисамосопряжен- ным. Матрица антисамосопряженного оператора в любом ортонормальном базисе е1, ..., еп обладает характеристи- ческим признаком: ajk = (АО’ О) = (*> АЧ) = (О’ ~АО) = — (АО> ej\ = — «V (У, k = 1, ..., п). Антисамосопряженный оператор А, очевидно, нормален. Применяя 9.32, мы получаем, что в данном случае %0 = —Хо, откуда следует, что каждое собственное значение антиса- мосопряженного оператора чисто мнимо. Далее, применяя 9.33а, получаем следующую основную теорему: Теорема. Для всякого антисамосопряженного опера- тора А в унитарном пространстве С„ существует ортонор- мальный базис из собственных векторов оператора А с чисто мнимыми собственными значениями.
302 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА (9.36 Обратно, всякий линейный оператор А в пространстве С„, обладающий указанным свойством, является антисамосопря- женным. 9.36. Унитарные операторы. Оператор U, дей- ствующий в пространстве С„, называется унитарным, если U*U=UU*=E (9.26). В частности, унитарный оператор нормален. Применяя 9.32, находим, что в данном случае Хо Хо = 1, или, что то же, |Х0| = 1; таким образом, каждое собственное значение унитарного оператора по модулю рав- но 1. Далее, применяя 9.55а, получаем следующую теорему: Теорема. Для всякого унитарного оператора U в про- странстве С„ существует ортонормальный базис из собствен- ных векторов оператора U с собственными значениями, по модулю равными 1. Обратно, всякий линейный оператор U в пространстве Сга, обладающий указанным свойством, унитарен. § 9.4. Применение унитарного пространства к теории операторов в евклидовом пространстве 9.41. Включение вещественного евклидова пространства в унитарное пространство. Пусть R— вещественное евклидово пространство (8.21) со скалярным произведением (х,у). Рассмотрим комплексное пространство С, составленное из формальных сумм x--iy, где х £ R, у £ R, с естественными операциями сложения и умножения на произвольные комплексные числа: (хх -' - iyr) + (х2 + iy2) = + х2) + i (уг +у2): (а4- if}) (х -j- iy) = (ах — Ру) 4- i (ау + Рх). Легко проверить, что здесь выполняются все аксиомы ли- нейного комплексного пространства. Векторы мы будем отождествлять с векторами х £ R и называть вещественными векторами пространства С. Векторы 0-</у мы будем обозначать iy и называть чисто мнимыми векторами. Вектор х — iy будем записывать также в виде х 4- iy и называть комплексно сопряженным к век- тору х 4- iy-
9.42] § 9.4. ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 303 Введем в пространство С скалярное произведение по формуле (Ху+iy^ х2+(у2) = = [(*!, хг) + (ylt >2)] + г[(_ур х2) — (хр^2)]. Легко проверить, что это скалярное произведение удовле- творяет условиям 9.21а—г. В частности, (x-\-iy, x + iy) = (x, х) + (у,у). Пространство С содержит пространство R в качестве подмножества, допускающего операции сложения и умноже- ния на вещественные числа и с тем же скалярным произве- дением. Всякая ортогональная нормированная система ev ..., еп в пространстве R будет ортогональной нормированной си- стемой и в пространстве С. Если ег, ..., еп есть ортонор- мальный базис в пространстве R, то эти же векторы обра- зуют и ортонормальный базис в пространстве С. 9.42. Всякий линейный оператор А, заданный в про- странстве R продолжается на пространство С по фор- муле А (х Ц- iy) = Ах + iky, (21) причем оператор А оказывается, очевидно, линейным опера- тором на пространстве С. Матрица оператора А в пространстве С в базисе ег, ..., e„€R совпадает с матрицей оператора А в прост- ранстве R в том же базисе, поскольку по (21) ке~кеу- (7=1, •••, п). При продолжении сохраняются алгебраические соотно- шения между линейными операторами: если A-(-B = S в про- странстве R, то А-|-В = § в пространстве С; если AB = D в пространстве R, то АВ = D в пространстве С. Это сле- дует, например, из сохранения матриц при продолжении.
304 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.43 9.43. Пусть А' — сопряженный оператор к оператору А в вещественном пространстве R (8.91). Покажем, что про- должением А' оператора А' на пространство С служит опера- тор А*, сопряженный к продолжению А оператора А. Действительно, для любых z = x-]-iy, и--iv мы имеем (k'^x-^iy), u-\-iv) — = (А'х, u)-\-i(A’y, и) — i(A'x, г») + (А'_у, v) = = (х, Au) + i (у, Au) — i (x, Av)-]-(у, Av) = — (x+ iy, A (u+ iv)), что и требуется. В частности, продолжением симметричного оператора (А' = А) является самосопряженный оператор (А*=А), продолжением антисимметричного оператора (А'= —А) яв- ляется антисамосопряженный оператор (А*=—А) и продол- жением изометрического оператора (U' = U-1) является унитарный оператор (U*=U-1). Наконец, продолжением нормального оператора (А'А — АА') является нормальный оператор (А*А — АА*). 9.44. Структура вещественного нормально- го оператора. Пусть о и т — вещественные числа. Легко проверяемое матричное равенство о т —т о ст —т т о а —т т ст —т ст ст2 + т2 0 0 ст2 -j- та (22) о т показывает, что матрица ст т —т ст перестановочна со своей сопряженной. Более общим образом, перестановочна со своей сопряженной и квазидиагональная
9.44] § 9.4. ОПЕРАТОРЫ В ЕВКЛИДОВОМ пространстве 305 (вещественная) матрица Xi —<т1 <т2 та Т2 *^2 (23) порядка л = 2т ~ г — т — т--г. Теорема. Пусть А — нормальный оператор в вещест- венном евклидовом пространстве R„. Тогда в этом прост- ранстве существует ортогональный базис ег, . . ., еп, в ко- тором матрица оператора А принимает вид (23). При этом числа Д = 0у4- iTj(j= 1, ..., m) и Xw+1, ..., Тг опреде- ляются однозначно оператором А. Именно, они являются комплексными (Д, . . ., Д,) или вещественными (Дл+1, . . ., Д) корнями характеристического уравнения det||A—А.ЕЦ = О и повторяются в матрице (23) столько раз, какова кратность соответствующего корня. Доказательство. Построим унитарное пространство С„ со скалярным произведением, продолжающим скалярное произведение (х, у) на пространство R„. Продолжим операторы А и А' на пространство С„ по правилу 9.42-, как мы видели в 9.43, они продолжаются до нормального оператора А и его сопряженного А*. Выберем в пространстве R„, пока произвольно, ортонор- мальный базис Д, . . мы видели, что векторы Д, образуют ортонормальный базис и в пространстве С„. Мат- рицу оператора А в базисе Д, . . . ,Д обозначим числа aJk вещественны. Эта же матрица представляет оператор А в базисе Д, во всем пространстве Сц.
306 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА I9-44 Так как характеристическое уравнение det ||А—АЕ|| = 0 имеет вещественные коэффициенты, то вместе с каждым невещественным корнем Ау является корнем также сопряжен- ная величина Ау. С учетом этого последовательность раз- личных корней запишем в следующей форме: ^1, ^2, ^2> • • > ^р> ^р+1’ • • • > где корни Ах, ..., А невещественны, а корни Ар+1, . . ., А? вещественны. В силу 9.336, пространство С„ распадается в ортогональную сумму подпространств Ах, Лх, . . - ,Ар, Ap; Лр+1, .. ., Л?, где Лу состоит из собственных векторов опе- ратора А с собственным значением Ау, а Лу—из собственных векторов оператора А с собственным значением Ау-; Лр+1 = = Лр + Х, •, Ag, A.q. Пусть z = х 4~/у € Лу. Уравнение Аг = Ауг в координатах (относительно исходного базиса /х, ...,/„) записывается в форме к— 1 где г=$л, •••Х) = (В1 + *П1, • • • ,L + z'nJ- Применяя опе- рацию комплексного сопряжения и учитывая вещественность чисел a]k, получаем 2 aj^k~ k— 1 Это означает, что вектор z— (£х, . . ., £л) также является собственным вектором оператора А с собственным значением А. Отсюда следует, что операция комплексного сопряжения переводит подпространство Лу в Лу. Пусть А1=5^А1, так что А1 = о14-гт1, тх^=0. Возьмем произвольно нормированный вектор gx £ Лх и найдем £ Лх. Положим, далее, ei + ii), так что ^1=e1+ze2, £1 = ^ —ie3.
9.44} § 9.4. операторы в евклидовом пространстве 307 Векторы ех и е2, очевидно, вещественны. Так как векторы Si и ортогональны, то векторы ег и е2 имеют длину 1. При этом (е1, е2) = 0; действительно, (Bi, е2) = — 1 (^ + ii, Fi) = = Si) — Qi, Si)] = °. поскольку (glt gj) = 0, (glt gj) = gi) = 1. Далее, мы имеем Ар! = Aet = 1 (A^j + Agt) = j + = = 4'^°1+ Z’T1) + + —/T1) (*1~ *>2)] =01*! — Tl*2. Ae2 = Ae2 = A (Ag-j — A^2) = i (^£1 — AjJi) = o-^a + Vi- Таким образом, оператор А преобразует плоскость векторов е1г е2 в себя с матрицей (в базисе elt е2) Если Ах имеет более одного измерения, возьмем вектор g^A^ ортогонально к gr и сопряженный вектор g^CAp последний уже автоматически будет ортогональным к g2. Повторим для g2 и g2 предыдущее построение; мы получим новую пару вещественных векторов е3, е4, линейно выражаю- щихся через g2 и g2 и поэтому ортогональных к векторам elt е2 (которые линейно выражались через gx и ^2); плос- кость, определяемая парой е3, е4, преобразуется оператором А в себя с той же матрицей (24). Продолжая построение, мы построим взаимно ортогональные вещественные векторы е2, . . ., е2р_1, е2р, каждую пару e2k_lt е2к оператор А преобразует в их плоскости с помощью матрицы, анало- гичной (24). Пусть теперь ^F+i = ^F+i вещественно. Операция пере- хода к сопряженным векторам переводит подпространство Aj,+1 в себя. Пусть ^А^х—любой вектор и g—ему сопряженный.
308 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА (9.44 Возможно одно из двух: либо векторы g и g линейно независимы (в С„), либо линейно зависимы. Если g и g линейно независимы, то и векторы e=^(g+g), f=fi(g—g) линейно независимы. Векторы ей/ вещественны, и по- скольку они лежат в A^+1 вместе с g и g, они являются собственными векторами оператора А с тем же собственным значением ^+1. Если g и g линейно зависимы, то, так как они равны по норме, можно написать g = eii?g, 0 ф < л, или ev-g= e~v-g= ei?g, так что вектор e^g уже вещественный. При этом, поскольку он лежит в Лр + 1 вместе с g, он является собственным для оператора А с тем же собственным значением Х?+1. Таким образом, в подпространстве Ар+1 можно указать базис из вещественных векторов. Применяя к ним процесс ортогонализации (8.61), мы получим в A^j уже ортого- нальный и, далее, ортонормальный базис. Произведя анало- гичную процедуру в Ар+2, . .., А?, завершаем доказательство теоремы. Представление нормального оператора в форме (23) дает возможность выяснить его геометрический смысл. Оператор с матрицей (24) в плоскости векторов е1У еа можно истолковать как оператор поворота с растяжением. Действительно, мы имеем о а т /о2 + т2 /о2’-//2 т о ]/ <j’ + t2 + cos a sin а — sin a cos а где М — ]/о2 т2, cos а ~ --> ]/а2-1-т2 sin а-= . ]/ а2-н2
9.46] § 9.4. ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 309 Матрица I cos a sin а |— sin а cos а определяет в плоскости е1г е2 поворот всех векторов на угол а, а коэффициент М есть коэффициент растяжения. В целом нормальный оператор, как видно из представления (23), в т взаимно ортогональных плоскостях осуществляет повороты с растяжениями и в г — т направлениях, ортого- нальных друг к другу и к указанным плоскостям, только растяжения (в Хт+1, . . ., раз)*). 9.45. Структура вещественного симметрич- ного оператора. Если оператор А в пространстве R„ симметричен, А'= А, то продолжение А оператора А в про- странство С„ есть самосопряженный оператор, А*=А. Все собственные значения ..., самосопряженного оператора вещественны (9.34), поэтому в представлении (23) клетки вида (24) отсутствуют и остаются лишь диагональные эле- менты. Мы получаем теорему: Теорема. Для всякого симметричного оператора А в пространстве Rn существует ортонормальный базис из соб- ственных векторов. Геометрически симметричный оператор осуществляет по каждому из п ортогональных направлений е1; ,еп растяже- ние (соответственно в Х1, .. ., раз). Так как числа . . ., суть корни уравнения det ||А—Х£||=0, то, в частности, для симметричной матрицы А = характеристическое урав- нение det ||А — ZEi| = 0 всегда имеет л вещественных корней (не обязательно различных) и вовсе не имеет невещественных корней. 9.46. Структура вещественного антисим- метричного оператора. Если оператор А в простран- стве R„ антисимметричен, А' —— А, то продолжение А опе- ратора А в пространство С„ есть антисамосопряженный *) При 0 < < 1 растяжение в Z*. раз на самом деле есть сжа- тие. При Xjj, < 0 растяжение в /.^ раз на самом деле есть растяжение, соединенное с отражением.
310 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА [9.47 оператор, А* = — А. Все собственные значения Хх, ..., антисамосопряженного оператора чисто мнимы (9.35). Поэтому в представлении (23) клетки вида (24) имеют специальный вид 0 т — т 0 ’ а числа %и+1, . . ., могут быть лишь равными 0. Мы по- лучаем теорему. Теорема. Для всякого антисимметричного оператора А в пространстве Rn существует ортонормальный базис, в кото- ром матрица оператора А записывается в виде 0 тх — тх 0 0 т, —т2 0 0 — 0 0 Обратно, если матрица некоторого оператора А в про- странстве Rn в некотором ортогональном базисе имеет вид (25), то оператор А антисимметричен (8.926). Геометрически антисимметричный оператор осуществляет в каждой из m взаимно ортогональных плоскостей поворот на 90° с последующим растяжением (соответственно в тх, ...,тот раз), а все векторы, ортогональные к указанным плоскостям, переводит в 0. 9.47. Структура вещественного изометрич- ного оператора. Если оператор А в пространстве R„ изометричен, А' = А-1, то продолжение А оператора А в про- странство Сл есть унитарный оператор, А*= А-1. Все соб-
9.47] § 9.4. операторы в евклидовом пространстве 311 ственные значения %х, унитарного оператора по модулю равны 1 (9.36). Можно написать Xy = cosay.— — i sin ссу(у = 1, . . ., m). Поэтому в представлении (23) клетки вида (24) имеют специальный вид cos «у sin а,- — sin «у cos ay (26) а числа Хя+1, . . ., могут быть равными лишь ±1. Мы по- лучаем теорему: Теорема. Для всякого изометричного оператора А в про- странстве R„ существует ортонормальный базис, в котором матрица оператора А записывается в виде cos ах sin — sin ах cos ах cos sina„ sinaffl cosam (27) ±1 ±1 Геометрически изометричный оператор А в каждой из m взаимно ортогональных плоскостей осуществляет поворот на некоторый угол (без растяжений) и в г — m направлениях, ортогональных к этим плоскостям и друг к другу, действует как оператор Е или — Е. Впрочем, каждые два из таких направлений с одинаковыми коэффициентами растяжения (оба или оба —1) можно объединить в плоскость, на которой оператор А также осуществляет поворот (на 0° или на 180°). Произведя все такие возможные объединения, мы получим, при п нечетном, последнее направление с коэф- фициентом 4-1 или —1; при п четном, возможно, два по- следних направления с коэффициентами 4-1 или —1. Наличие среди оставшихся коэффициентов —1 показывает, что к имеющимся поворотам присоединено отражение относительно некоторой координатной плоскости, например ортогональной к вектору еп. В этом случае мы имеем det А =— 1; в случае, когда отражения нет, имеем det А =4-1.
312 ГЛ. 9. КОМПЛЕКСНЫЕ ПРОСТРАНСТВА ЗАДАЧИ 1. Самосопряженный оператор, действующий в унитарном про- странстве Сп, называется неотрицательным (положительным), если все его собственные значения Хц ..., Л;1 неотрицательны (положи- тельны). Показать, что квадрат всякого самосопряженного оператора неотрицателен. 2. Показать, что для всякого самосопряженного неотрицательного (положительного) оператора А можно найти, причем единственным образом, такой неотрицательный (положительный) оператор В, что В2==А («квадратный корень из оператора А»). 3. Извлечь квадратный корень из оператора А, заданного в орто- гональном и нормированном базисе еь е2, е3 матрицей А = 13 14 4 14 24 18 4 18 29 4. Если А—произвольный линейный оператор, действующий в унитарном пространстве С„, А*—ему сопряженный, то А*А есть неотрицательный оператор. Если А невырожден, то А*А — положи- тельный оператор. 5. Известно, что некоторый линейный оператор А есть произве- дение самосопряженного оператора S и унитарного Q: A = SQ. Пока- зать, что S2 = AA*. 6. Показать, что всякий линейный оператор А с det А ?= О может быть представлен как произведение самосопряженного и унитарного операторов. 7. Доказать единственность представления оператора А в виде произведения SQ в условиях задачи 6. 8. Линейный оператор V, действующий в С„, называется нерас- тягивающим, если | Vx | < | х | для любого х. Показать, что любой линейный оператор А может быть представлен как произведение само- сопряженного и нерастягивающего. 9. Показать, что самосопряженные операторы А и В перестано- вочны тогда и только тогда, когда они имеют общую систему из п взаимно ортогональных собственных векторов. 10. Для каждого линейного оператора А, действующего в про- странстве С„, указать ортонормальный базис, в котором матрица оператора А имеет треугольный вид: А = _<» <Л) „ш ui а2 ... ап О а2 ... ап
ГЛАВА 10 КВАДРАТИЧНЫЕ ФОРМЫ В ЕВКЛИДОВОМ И УНИТАРНОМ ПРОСТРАНСТВАХ § 10.1. Основная теорема о квадратичных формах в евклидовом пространстве 10.11. Начнем со следующего предложения, касающегося симметричной билинейной формы в евклидовом пространстве: Теорема. В n-мерном евклидовом пространстве всякая симметричная билинейная форма имеет канонический базис из взаимно ортогональных векторов. Доказательство. Рассмотрим линейный оператор А, отвечающий данной симметричной билинейной форме А (х, у) (8.91). Этот оператор также симметричен. Согласно теореме о симметричном операторе (9.45) в пространстве R имеется ортогональный и нормированный базис из собственных векто- ров оператора А. В этом базисе матрица оператора А диа- гональна. Поскольку эта же матрица является и матрицей билинейной формы А(х,у), построенный базис есть канони- ческий базис формы А(х,у), что и требовалось. 10.12. Этот результат мы применим теперь для изучения квадратичных форм. Пусть дана квадратичная форма п А (х, х) = (а^ = ал). (1) Z j / — 1 Будем считать числа £2, координатами вектора х в евклидовом пространстве Rn со скалярным произведением, определенным по формуле /=1 где у = (т]1, т]2, .. ., т]„). Базис = {1, 0, ..., 0}, е2 = {0, 1, .... 0}, ..., е„ = {0, 0, ..., 1}
314 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.12 является ортогональным и нормированным базисом в Rn, причем х=2^/> ;=2v>- 1 =1 1=1 Рассмотрим билинейную форму п А(х,у) = 2 «, /= 1 соответствующую квадратичной форме (1). В силу теоремы 10.11 у этой формы существует ортогональный и нормиро- ванный канонический базис Д, Д, ..., Д. Если относительно этого базиса векторы х и у имеют соответственно коорди- наты Tj, т2,..т„ и 01, 02,. .., 0„, то форма А(х, у) будет иметь вид А(х,у) = 2 МД, /=1 а квадратичная форма А (х, х) примет вид А (х, х) = 2 • (2) <=i Переход от базиса ev е2, . , еп к базису Д, Д, . . ., Д осуществляется с помощью некоторой ортогональной мат- рицы (8.93) Q — || qOy || по формулам п fj = S Q^ei (7=1, 2, ..., п). J i=l Связь между координатами тх, т2, .. ., хп и g2, . .., может быть записана в силу формул (36) из 8.94 системой равенств п В/=2^\ (1 = 1, 2, .... п) (3) j=i с использованием транспонированной матрицы Q'. Мы полу- чили тем самым следующую важную теорему: Теорема. (Теорема о квадратичной форме в евклидовом пространстве.) Всякая квадратичная форма (1) может быть приведена к каноническому виду (2) с помощью изометрического преобразования координат (3).
10.13] § 10.1. ОСНОВНАЯ ТЕОРЕМА О КВАДРАТИЧНЫХ ФОРМАХ 315 10.13. Последовательность действий, которые нужно произвести для построения формул перехода (3) и канони- ческого вида (2) квадратичной формы (1), вытекает из ре- зультатов 4.94 и 9.45', мы приведем ее здесь в окончатель- ном виде. а) По квадратичной форме (1) строим симметричную матрицу А = || а,-у||. б) Составляем характеристический многочлен Д (X) = — det (А — ХЕ) и находим его корни. В силу 9.45 этот мно- гочлен имеет п вещественных корней (не обязательно раз- личных). в) Зная корни многочлена Д(Х), можно написать уже квадратичную форму в каноническом виде (2), в частности, можно сказать, каковы ее положительный и отрицательный индексы инерции. г) Корень подставим в систему (23) из 4.94. Для данного корня Лх эта система имеет ровно столько линейно независимых решений, какова кратность корня Найдем эти линейно независимые решения, пользуясь правилами ре- шения однородных систем линейных уравнений. д) Если кратность корня Хх больше единицы, ортогона- лизируем полученные линейно независимые решения по ме- тоду 8.61. е) Проделав указанные операции с каждым корнем, мы получим систему из п взаимно ортогональных векторов. Про- нормируем ее, разделив каждый вектор на его длину. Полу- ченные векторы /2=Мг>, •••, Л /„ = {№, чГ, • <№} образуют уже ортогональную и нормированную систему. ж) Используя числа можно написать формулы пере- хода (3). з) Если требуется дать выражения новых координат {т} через старые координаты {£}, то, поскольку матрица, обрат- ная к ортогональной, получается транспонированием, мы
316 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.14 можем написать искомые выражения в виде (/=1, 2, ..., я). j= 1 10.14. Мы видели в 7,33а , что в аффинном простран- стве ни канонический базис, ни канонический вид квадра- тичной формы не определены однозначно; вообще говоря, можно было включить в канонический базис формы любой наперед заданный вектор. В евклидовом пространстве и при условии, что рассматриваются только ортогональные и нор- мированные базисы, положение иное. Дело в том, что вместе с матрицей квадратичной формы, как мы видели, преобра- зуется и матрица соответствующего симметричного линей- ного оператора; если найден канонический базис квадратич- ной формы, то одновременно найден базис из собственных векторов симметричного оператора. При этом коэффициенты квадратичной формы в каноническом базисе («канонические коэффициенты») совпадают с соответствующими собствен- ными значениями оператора. Но собственные значения опе- ратора А суть корни уравнения det (А — А.Е) = 0, которое не зависит от выбора базиса и инвариантно связано с опе- ратором А. Следовательно, совокупность канонических коэф- фициентов формы (Ах, х) определена однозначно. Что же касается канонического базиса квадратичной формы (Ах, х), то он определен с той же степенью произвола, с какой определена полная ортогональная и нормированная система собственных векторов оператора А: не считая взаимных перестановок этих векторов, можно любой из них умножить на —1; более общим является любое изометрическое пре- образование в собственном подпространстве, отвечающем фиксированному собственному значению К. § 10.2. Экстремальные свойства квадратичной формы 10.21. Пусть в евклидовом пространстве R,, задана квадратичная форма А(х, х). Будем рассматривать ее зна- чения на единичной сфере пространства R„, т. е. при (х, х) = 1, и поставим следующий вопрос: в каких точках единичной сферы значения формы стационарны? Напомним, что диффе-
10.21] § 10.2. ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 317 ренцируемая числовая функция /(х), определенная для точек некоторой поверхности U, принимает по определению в точке х0 g U стационарное значение, если в точке хп производная функции f(x) по любому направлению на поверхности U равна нулю. В частности, функция fix) стационарна в тех точках, где она достигает максимума или минимума. Задача об определении стационарных значений есть за- дача на условный экстремум; одним из методов ее решения является метод Лагранжа, который мы сейчас и используем*). Возьмем в пространстве R„ ортогональный и нормированный базис и обозначим через £х, |2, ...,£„ координаты вектора х в этом базисе. В этих координатах квадратичная форма п. будет иметь вид А (х, х) = 2 а условие (х, х) = 1 «, j= 1 п запишется равенством 2 £i?==l- Следуя методу Лагранжа, !=1 построим функцию п п U • ••,&„) = 2 МЛ,—*2 i, j = l /=•! и приравняем нулю ее первую частную производную по ^(/=1, 2, ..., /г): п 2 2 2^,. = 0 (г=1, 2, ..., л). ;= 1 После сокращения на 2 мы получаем уже знакомую нам систему**) (23) из 4.94'. L + «Т-Л+• • • + = 0, °21»1 + (Д22-М »2 Т ' • ' "Т а2лВя ;= 0, a„i^i + an2g2+... + (a„„-M |„ = 0, которая служила для определения собственных векторов симметричного оператора, отвечающего квадратичной форме А (х, х). Отсюда вытекает следующее предложение: *) См., например, В. И. Смирнов, Курс высшей математики, т. 1, стр. 392, Гостехиздат, 1951. **) Напомним, что (i, / = 1, 2, . ., п).
318 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.22 Квадратичная форма А (х, х) принимает стационарные значения на тех. векторах единичной сферы, которые явля- ются собственными векторами симметричного оператора А, соответствующего форме А (х, х), 10.22. Вычислим значения, которые принимает форма в стационарных точках. Для этого введем соответствующий симметричный оператор А и представим квадратичную форму в виде А (х, х) — (Ах, х). Так как, по доказанному, форма А (х, х) принимает стационарное значение на собственном векторе е(- оператора А, то мы имеем Ае^к^ер, отсюда А(е;, е,.) = (Ае/, ez) = Л,- (е,-, e^kf. Итак, стационарное значение формы А (х, х) при х = е: равно соответствующему собственному значению оператора А. Так как собственные значения оператора А совпадают с ка- ноническими коэффициентами формы А (х, х), то мы можем, далее, заключить, что стационарные значения формы А (х, х) совпадают с ее каноническими коэффициентами. В частности, максимум формы А (х, х) на единичной сфере равен наибольшему из ее канонических коэффициен- тов, минимум — наименьшему. 10.23. Как билинейную, так и квадратичную форму А (х, х) можно рассматривать не во всем n-мерном про- странстве Rn, а в некотором A-мерном подпространстве RfccR„, и разыскивать в этом подпространстве ортогональ- ный и нормированный канонический базис. Пусть форма А (х, х) во всем пространстве R„ имеет канонический вид А (х, х) = 2^14- k£l + . . . + ХЛЦ, (4) а в подпространстве R/;— канонический вид А (х, х) = руг* + ц,т! + • • + Выясним, как связаны коэффициенты рх, ц2, ..., с ко- эффициентами Х2, ..., кп. Для удобства предположим, что нумерация канонических коэффициентов произведена в порядке их убывания, так что Zj к% 4^ Их Иг Ий-
10.24] § 10.2. ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 319 Величина как мы уже знаем, есть максимальное значение квадратичной формы А(х, х) на единичной сфере простран- ства Rn; аналогично есть максимальное значение квад- ратичной формы А (х, х) на единичной сфере подпростран- ства Rft, и потому Покажем, что Пусть ег, е2, . . ., еп — канонический базис формы А (х, х), в котором она записывается в виде (4). Рассмотрим (п— А4-1)-мерное подпространство R', порожденное векто- рами eL, е2, ..., Так как k-\-(n— &4-l)>«, то подпространства R' и Rfc в силу 2.47в имеют хотя бы один общий ненулевой вектор. Пусть это вектор x0 = {li0>, ••• ..., 0, •••, 0}; предположим, что х0 нормирован, т. е. что | х01 = 1. Для вектора х0 по формуле (4) имеем Д г\_ГЕ<О>2_ц_ гн»2, п л0/ — Л1Ы I i лл-Л-Цбл-А+1 '-„-/г ;-1 । • • • I Чп-k+i/— '•'n-k + l- Отсюда вытекает, что как максимальное значение квадратичной формы А (х, х) на единичной сфере подпро- странства R/; не может быть меньше, чем Л„_А,+1, что и требуется. Таким образом, величина Р4 заключена в следующих границах: ^•i Pi ^п-к+i- (5) 10.24. Для различных й-мерных подпространств величина р.1 принимает, естественно, различные значения. Покажем, что существуют такие k-мерные подпространства, для кото- рых рц принимает крайние значения, указанные в неравен- стве (5). Рассмотрим подпространство R', порожденное первыми k векторами ех, е„, ..., ek канонического базиса формы А (х, х). В подпространстве R' в базисе ех, е2, ..., ек форма А(х, х) имеет вид А(х, х) = Х1^12 + Х2Ц+ . . . В частности, А («1, е1) = Х1 = тах А(х, х) (| х ] = 1, x£R').
320 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.25 Таким образом, на подпространстве R' величина |л1 = тахА(х, х) (|х| = 1, xgR') достигает наибольшего возможного значения Рассмотрим теперь подпространство R", порожденное последними k векторами еп_к+к, еп_к + 2, ..., еп канониче- ского базиса формы А (х, х). В подпространстве R" в ба- зисе е„_к+1, еп форма А (х, х) имеет вид А(х, х) = Л„_*+1^и+1+-.-+Ш В частности, = Хп_к+1 = так А (х, х) (|х| = 1, x£R"). Поскольку теперь jn1 = maxA(x, х) (|х|=1, xgR"), мы заключаем, так же как и выше, что (11 = Х„_А + 1. Следова- тельно, на подпространстве R" величина достигает своего наименьшего значения X„_t+1. Мы получаем, таким образом, новое определение коэф- фициента Кп_к+1; коэффициент Кп_к+1 в канонической записи формы А (х, х) равен наименьшему значению максимума квадратичной формы А (х, х) на единичных сферах всех возможных k-мерных подпространств пространства Rn. 10.25. Используя этот результат, мы можем дать оценки для остальных канонических коэффициентов формы А (х, х) на подпространстве RA. Например, если фиксировано под- пространство Ra, то |Л2 есть наименьший из максимумов квадратичной формы А (х, х) на единичных сферах (А—1)- мерных подпространств пространства R*. В то же время ^n-fc+2 есть наименьший из максимумов квадратичной формы А (х, х) на единичных сферах всех (k—1)-мерных подпро- странств пространства R„; поэтому Аналогично Нз>^п-й+з, с ДРУГОЙ стороны, Х2 есть наименьший из максимумов квадратичной формы А (х, х) на единичных сферах (п—1)-мерных подпространств пространства R„; но каждое (л — 1)-мерное подпространство пересекается с подпространством Rs согласно нашей лемме по подпространству, имеющему не менее (п—l) + fe — n=k—1 измерений; поэтому число /..2 не менее чем наименьший из максимумов формы А (х, х) на единичных сферах этих под- пространств и, в частности, не менее чем число |Л2— наи-
10.26] § 10.2. ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 321 меньший из максимумов формы А (х, х) на единичных сфе- рах (k—1)-мерных подпространств пространства Rft. Следо- вательно, Х2^|т2. Аналогично Х3 |т3, ..., Итак, канонические коэффициенты р1, ц2, ..., удовлетворяют неравенствам 2s Hi 2s ^-n-fe+i> ^2 Нг ^n-ft+2’ Ш =5’ Кг- (6) При k — n— 1 неравенства (6) приобретают следующий вид: (7) 10.26* . Если (л — 1)-мерное подпространство R„_1, на котором рассматривается квадратичная форма А(х, х), за- дано уравнением 04^4-0^2+...+аД„ = 0 (а? + а|+...+а® = 1), (8) то коэффициенты |т1, Ц2, ..., р„_1 можно вычислить эф- фективно. В предположении, что все числа А1; Х2, . .., различ- ны, приведем метод вычисления этих коэффициентов, пред- ложенный М. Г. Крейном. Из коэффициентов ах, а2, . . ., ап по крайней мере один отличен от нуля. Пусть, например, а„=^0. Тогда из урав- нения (8) мы получаем п- 1 ^п = —'s; 1 Подставляя в выражение квадратичной формы п А (х, х) = 2 k— 1
322 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ (10.26 мы получаем, что в подпространстве R„_x в координатах Si, •••, Вп-1 форма А(х, х) имеет вид . /л-1 \а а(х, xw^+^+...+Wn-t+Ч 2 «А • «л V=1 / Канонические коэффициенты этой квадратичной формы опре- деляются как ее стационарные значения на единичной сфере подпространства Rn_1 (10.22}; эта последняя в координатах 11, ^2, •••, £B-i имеет уравнение fn—\ \ 2 В(х, х) = В? + ^+...+^_1 + ± 2 =1- а„ \з= 1 / Для определения стационарных значений действуем, как и ранее, по методу Лагранжа: составляем функцию п-1 /п-1 \ 2 А(х, х)-АВ(х, х)-£ (S— + «А) i=i а« / и приравниваем нулю ее частные производные по (А = 1, 2, ..., л—1): /"“1 \ I* (**-*) + «*=°- “л \;=1 / Искомые коэффициенты jiv ji2, ..., jin_j являются корнями того уравнения, которое получается, когда мы приравняем нулю определитель D (X) системы линейных уравнений (9). Матрица из коэффициентов этой системы есть, очевидно, сумма двух матриц, первая из которых диагональна, с чис- лами —X по диагонали (Л=1, 2, ..., п—1), а вторая имеет вид a2aj ... «„.л ^•п — «г®2 • • а«-1^2 • • .................... «1«»-1 а2ал-1 • «л-Л-1 В силу линейного свойства определителей (1.44) искомый определитель равен сумме определителя первой матрицы и всех определителей, полученных заменой некоторых столбцов определителя первой матрицы на соответствующие столбцы
10.26] § 10.2. ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА КВАДРАТИЧНОЙ ФОРМЫ 323 второй матрицы [с учетом множителя ) . Поскольку \ / всякие два столбца второй матрицы пропорциональны, доста- точно рассматривать только те случаи, когда один из столб- цов определителя первой матрицы заменен на соответствующий столбец второй матрицы. Если, в частности, fe-й столбец первой матрицы заменен на fe-й столбец второй матрицы, то соответствующий опре- делитель имеет следующее выражение: Х^—-X 0 .... 0 0 ... 0 0 Х*2—X 0 0 ... 0 —X 0 0 • • • Ч-i- -X акак_г 0 .. . 0 ап 0 0 0 <Wk 0 0 0 0 0 «Л+1 ^7t + l 0 0 0 ... 0 «А-i 0 • • • ^п-1 а„ Введем обозначения <7—- 1 F(X)=H(XA— М (определитель первой матрицы), *=1 п ОМ = П(^-М- k=l Тогда искомый определитель D (X) примет вид 1 л— 1 г/? D(X) = F(^)+4G(X)2 (10) Решая уравнение Z)(X) = O, мы и найдем интересующие нас величины ц2, ..., Ц„_г Заметим, что они зависят не от самих чисел ау-, а от квадратов этих чисел; таким образом, если у одного или нескольких коэффициентов урав- нения (8) изменить знак, то искомые канонические коэффи- циенты формы А (х, х) на подпространстве Rn_1 не изме- няются.
324 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.27 10.27*. Формула (10) интересна еще и тем, что она позволяет построить по данным числам р.х, р.2, ..., удовлетворяющим неравенствам (8), подпространство R„_!, на котором форма А (X, х) имеет канонические коэффициенты ц2, .. ., (в предположении, что числа Aj, А2, . . ., различны). Покажем, как решается эта задача. Заметим, что формулу (10) мы можем записать в виде 2 Р(Х) __ 2 £(Х) , V п G(A) G(X) ’ (П) таким образом, числа af, сс2, ..., а„ пропорциональны коэффи- „ . D (А) циентам разложения рациональной функции на про- и (.л) стейшйе дроби. Пусть заданы числа pi2, ..., ц„_1, удовлетворяющие неравенствам Aj > Н1 > ^2’ I ^2 > Нг > ^з> I (12) ^л-1 > Нл-1 > К- I a=i на простейшие дроби: __ С1 I С2 ! I СП —х а2—X Ал—X п—1 Положим Z>1 (А.) = П (И* — и разложим рациональную Ж Di (А) функцию -Ш D1 W G(A) (13) Покажем, что коэффициенты сх, с2, . . ., сп — одного знака. Известно, что эти коэффициенты вычисляются по формулам *) г___________________Ох М________________= D1M k - (Aft — А2)... (Aft — Aft_x) (Aft-Aft+1).. .(А*-А„) G' (Aft) • Числа Dx (Ax), Z)j (A2), ..., (Ая) имеют попеременно противоположные знаки, поскольку корни многочлена Dx (%) по условию перемежаются с корнями многочлена О(Х). Числа Q' (Хх), G' (Х2), ..., G' (%п) также имеют попеременно про- тивоположные знаки, поскольку Х2, ..., —простые *) См., например, М. Гребенча, С. Новоселов, Курс ма- тематического анализа, стр. 405, Учпедгиз, 1951.
10.31] § 10.3. ЗАДАЧА О ПАРЕ КВАДРАТИЧНЫХ ФОРМ 325 корни ними и многочлена G(X). Поэтому отношения , а с коэффициенты ск имеют одинаковые знаки. С точностью до множителя можно все коэффициенты ск считать положи- тельными, а их сумму — равной единице, и тогда можно оп- ределить числа а1; а2, . . ап из условий ai = ci> а% = с2, ..., а* = с„. (14) Числа (%!, а2, . .., ап можно взять любого знака. Покажем, что подпространство Rn-1, определяемое уравнением а1£1 + а2?2 + • • • + ал£л = 0, и будет искомым. Действительно, многочлен D(h), корни которого суть канонические коэффициенты формы А (х, х) на подпростран- стве R„_x, по доказанному, выражается с помощью формулы (10) или эквивалентной ей (11). Сравнивая (11) и (12) и учитывая (14), мы получаем, что многочлен D (X) отличается только числовым множителем от построенного нами много- члена Z?1(X). Но тогда корни многочлена £)(Х) совпадают с числами р,1; |Х2, ..., что и утверждалось. Замечание. Можно показать, что полученные числа a2, ..ап зависят непрерывно от величин Хх, ..., Х„, Цх> ..., p.n_j. Используя этот факт, можно проверить, что задача имеет решение и для чисел Рх, ..., ц„~х, удовлетворяющих неравенствам (7), а также и без предположения, что числа Хх..Хп различны. § 10.3. Задача о паре квадратичных форм 10.31. В некоторых вопросах математики и физики су- щественную роль играет решение следующей задачи: для двух квадратичных форм А (х, х) и В(х, х), заданных в п-мерном аффинном пространстве Rn, указать базис, в ко- тором обе эти формы записываются в каноническом виде (т. е. в виде суммы квадратов координат с некоторыми ко- эффициентами). Следующий пример на плоскости (л = 2) показывает, что эта за- дача не всегда допускает решение. Рассмотрим следующие две формы от двух переменных £1( £2: А (х, х) = ^-& В(х, x) = gxg2.
326 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.32 Найти общий канонический базис для этих форм означает найти общую пару взаимно сопряженных векторов для гипербол А(х, х)—1 и В (х, х)=1 (см. 7.44). Эти гиперболы равносторонние; из аналити- ческой геометрии известно, что сопряженные направления таких ги- пербол симметричны относительно их асимптот. Поэтому полярные углы и ф2, отвечающие паре сопряженных направлений, для пер- вой гиперболы связаны равенством <Р1 + ф2 = л/2> а для второй гиперболы — равенством Ф1 + фг = 0 (оба равенства с точностью до слагаемого, кратного л). Так как эти равенства исключают одно другое, то в данном случае общих взаимно сопряженных направлений не существует. Оказывается, что задача имеет решение, если дополни- тельно допустить, что одна из этих форм, например В(х, х), положительно определенная (т. е. В(х, х) >0 при х#=0). Существование решения легко установить следующим путем. Пусть В(х, у) — симметричная билинейная форма, соответствующая квадратичной форме В(х, х). Введем в аффинном пространстве R„ евклидову метрику, полагая (х, у) = В{х, у). Выполнение аксиом скалярного произведения обеспечи- вается симметричностью и положительной определенностью формы В(х, х). В силу 10.11 существует ортогональный и нормирован- ный (относительно введенной нами метрики) базис е1; . . ., еп, в котором форма А(х, х) принимает канонический вид А(х, Х) = %1Т]? + %2Т)|+ • • •+Мл U5) (т|т> Л2> •••> Ли — координаты вектора х в построенном ба- зисе). В этом же базисе вторая квадратичная форма В (х, х) в силу формулы 8.42 (17) имеет вид В(х, х) = (х, х) = т]? + т)|+ . .. +т]«- Итак, базис, в котором обе формы имеют канонический вид, существует. 10.32. Используем для вычисления координат векторов ет, ..., еп искомого базиса экстремальные свойства квад- ратичных форм. Как было показано в 10.21, векторы ev .. еп
10.32] § Ю.З. ЗАДАЧА О ПАРЕ КВАДРАТИЧНЫХ ФОРМ 327 суть те векторы, которые подчинены условию (х, х) = В (х, х) = 1 и для которых форма А (х, х) принимает стационарные значения. Предположим, что в исходном базисе формы А (х, х) и В (х, х) имели следующие выражения: А(х, х) — У aih^k, В(х, х)= У /.“1 /,“1 Действуя по методу Лагранжа, мы должны составить функцию п п • •, U = . а.&Ъ-И. и приравнять нулю ее частные производные по всем коорди- натам: п п «/*£*—pj>) Ыа==° (г=1, 2, ..., л). (16) Полученная система однородных уравнений (°11— Н&11) В1 + (а12 —Р-^гз) Вг + • • • +(°1и —P^ln) (а21—p62i) Е! + (а22—р62;) S2+...+(а2„—S„ = °- (17) (a„i—рАл) 5i + (an«—Н*в2) 5а + • • • +(апл—Р*пп) = 0 , допускает ненулевые решения тогда и только тогда, когда ее определитель обращается в нуль: а11 М^П fl12 М^12 • • • а1п M^ln Д21 М^21 °22 М^22 • • • а2п ^2п = 0. (18) anl ап2 ^п2 • • • апп ^пп Решая уравнение (18), мы находим л возможных значений ц = цй (&=1, 2, ..., л); подставляя в систему (17), мы сможем найти координаты ..., g)*’ соответ- ствующего искомого базисного вектора. Теорема, доказанная в 10.31, обеспечивает существование вещественных корней определителя системы (17) и для каждого кратного корня наличие соответствующего числа линейно независимых реше- ний этой системы.
328 гл. 10. формы в евклидовом пространстве [10.33 10.33. Переходим к вычислению канонических коэффици- ентов. Покажем, что коэффициенты %1, Л2, . .., в кано- нической записи (15) формы А (х, х) совпадают с соответствую- щими корнями (Xj, |х2, ..., определителя системы (17). Здесь можно было бы использовать рассуждение, аналогич- ное проведенному в 10.22; мы теперь предпочитаем провести непосредственное вычисление. Если для заданного корня умножить i-е уравнение системы (16) на г-ю координату решения ^m> (i = 1, 2, . .., п) и все эти уравнения сложить, то получим равенство п I, k=l п = = М(^> еи) = так как В(ет, еа)=1. С другой стороны, канонические координаты т|г, т,2, . . ., т]т для вектора ет имеют, очевидно, значения т]; = 0 при i т, п i]m = 1, и форма А (х, х) = ПРИ х==ет становится 1= 1 равной ‘кт. Отсюда что и утверждалось. Этот результат дает возможность написать форму А (х, х) в искомом каноническом виде, минуя вычисление канониче- ского базиса. 10.34. Поставленная в 10.31 задача об одновременном приведении к каноническому виду двух квадратичных форм А (х, х) и В (х, х), из которых, например, В (х, х) поло- жительно определена, решена нами в несколько усиленной форме; именно, форма В (х, х) приведена к виду суммы квадратов координат с коэффициентами, равными 1. Вообще говоря, это не требуется, и поэтому коэффициенты преоб- разованных форм заведомо не определяются однозначно. Мы покажем все же, что отношения соответствующих канониче- ских коэффициентов не зависят от способа одновременного приведения форм А(х, х) и В (х, х) к каноническому виду. Пусть формы А (х, х) и В(х, х) двумя способами приведены к каноническому виду: в координатах g2, •••,£» п п А(х, х) = 2л;у, В(х, x) = 2v,^, i = l 1=1
10.41] § 10.4. ПРИВЕДЕНИЕ УРАВНЕНИЯ К КАНОНИЧЕСКОМУ ВИДУ 329 а в координатах т)2, . .., т|„ п п &(х, х) = в(*> х)=^тл?- Так как форма В(х, х) положительно определенная, числа vz и т; (i=l, 2, . .., п) все положительны. Рассмотрим новое преобразование координат Тогда формы А (х, х) и В (х, х) преобразуются к виду а) в координатах gz: Я Т _ п __ А<*, = В(х, х) = £^; i = 1 v‘ i = 1 б) в координатах t]z: А (х, х) = 2 J- Л/, В(*, = i=l ч 1=1 Пусть е1, е2, ..., еп — базис, отвечающий координатам gz, и /1; /2, ..., /„—базис, отвечающий координатам гр. В метрике, определяемой формой В (х, х), оба эти базиса ор- тогональны и нормированы. Но тогда (10.14) совокупность канонических коэффициентов формы А (х, х) определена однозначно; таким образом, последовательность чисел XX X — — должна совпадать с последовательностью Vi v2 ’ v„ —, —, ..., — с точностью до порядка. Т1 Т2 Т/г Теорема доказана. § 10.4. Приведение общего уравнения поверхности 2-го порядка к каноническому виду 10.41. В этом и следующих пунктах мы будем называть элементы линейного пространства не векторами, а точками (2.17), что будет более соответствовать геометрическому представлению. Поверхностью 2-го порядка в п-мерном пространстве мы будем называть геометрическое место точек
330 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.42 х — (Bi, Вг> • • •, £м)> удовлетворяющих уравнению вида п п + + с = Ь (19) или А (х, х) 2L (х) + с = о, л где А (х, х) = 2 aikli^k—квадратичная форма от радиуса- », «51 л вектора точки х, А (х) = — линейная форма, с—по- стоянная*). Пространство R„ будем считать евклидовым и числа £1> •••, £л — координатами вектора х в ортогональном и нормированном базисе. Задачей настоящего пункта явля- ется выбор в пространстве R„ нового ортогонального и нормированного базиса и нового начала координат так, чтобы наша поверхность 2-го порядка определялась некоторым специальным и особенно простым уравнением, которое на- зывается каноническим. В дальнейшем по каноническому уравнению мы изучим свойства поверхности. 10.42. Совершим прежде всего в пространстве R„ ор- тогональное преобразование координат = (г = 1, 2, ..., л), (20) как указано в 10.12, с тем чтобы в новых переменных квадратичная форма А(х, х) приняла канонический вид п А(х, х)= 2 М/- 1 = 1 Уравнение (19) будет после подстановки (20) иметь вид п п W + 22 1^1 + с = 0, (21) *) В случае п = 2 геометрический образ, определяемый уравне- нием (19), называется кривой 2-го порядка. Однако в дальнейшем мы всюду употребляем слово «поверхность», не оговаривая каждый раз, что при п = 2 его нужно заменить словом «кривая»,
10.42] § 10.4. ПРИВЕДЕНИЕ УРАВНЕНИЯ К КАНОНИЧЕСКОМУ ВИДУ 331 где /,(/=1,2, . . ., п)— новые коэффициенты линейной формы L(x). Если в полученном уравнении Л,^0 для некоторого I, то переносом начала координат можно добиться исчезнове- ния соответствующего члена первого измерения. Пусть, на- пример, Z1^0; тогда, очевидно, Х^ + 2/jTi^^i (Пг + х;) — Положим t]j = т]г 4- ±; это равносильно переносу начала координат в точку , 0, 0, ..., 0^ . В результате под- становки группа членов Х1т]|4-2/1т]1 заменится на Хугц2— — у; таким образом, член второго измерения останется с тем же самым коэффициентом член первого измерения /2 пропадает, свободный член получит добавок------------. После А-1 всех таких преобразований уравнение поверхности примет вид М1+М1+ • • • +Mr + 2/r + lTlr + l+ • • +2/„т]„4-с = 0. Здесь опущ-ены для простоты записи штрихи у координат, а сами координаты заново перенумерованы так, чтобы вна- чале шли координаты, участвующие в квадратичной форме, так что Хь Х2, . . ., Хг отличны от нуля, ХЛ = 0 при k > г. Если при этом г = п или же г < п, но числа Zr+1, lr+i,. . ., ln оказались равными нулю, то мы получаем каноническое урав- нение центральной поверхности ^ + М1+---+М? + с = 0- (22) Если г = л, то эта поверхность при с=/=0 называется истин- ной, а при с = 0—конической. Допустим, что среди чисел /г+1, ..., 1п имеется хотя бы одно отличное от нуля. Тогда мы совершим новое
332 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.42 ортогональное преобразование координат по формулам ^2 ~ Лг» тг = Лг- Т/Ч-1 = (^г + 1 Л/ч-1 + • • • + АгЛп) > где М—положительный множитель, обеспечивающий орто- гональность матрицы преобразования: так как у ортогональ- ной матрицы сумма квадратов элементов каждой строки должна быть равна 1, то М2 = /,2+1 + /?+2+ Остальные строки (следующие за (г-|-1)-й) могут быть произвольными, лишь бы полученная матрица была ортого- нальной {8.95). В результате этого преобразования уравнение поверхно- сти приобретает вид • • • +Мг = 2Л4т7ч-1—с- Если с 0, еще один перенос начала координат по фор- муле , с Vn~T,+i 2М- позволяет освободиться от свободного члена; уравнение (опять с опущенным штрихом у последней координаты) получает вид ^+...+^=24^; (23) это — каноническое уравнение нецентральной поверхности. Всякую поверхность 2-го порядка будем называть не- вырожденной, если в ее каноническом уравнении участвуют все п координат, и вырожденной, если в ее каноническом уравнении участвует менее чем п координат. Все введенные названия будут разъяснены в дальнейшем.
10.52] § 10.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 333 § 10.5. Геометрические свойства поверхностей 2-го порядка 10.51. Центр поверхности. Центром, поверхности называется точка х0=(£?, • ,!“), обладающая следую- щим свойством: если точка (Bi + ti. £° + £2, • • •. 1Я + Ы лежит на поверхности, то симметричная с ней относительно х0 точка (|J— |lf —|2, . — |п) также лежит на поверх- ности. У поверхности с каноническим уравнением (22) суще- ствуют центры; всякая точка, для которой т]г — Т]2 = - • • = = т]г = 0, является, очевидно, центром. Этим объясняется название этого класса: центральные поверхности. Покажем (это будет использовано в дальнейшем), что никаких других центров у поверхности с уравнением. (22) не существует. Действительно, пусть (|?, ...,!„)—центр этой поверхности. Тогда из условия (£?+Вт)2+К +£2)2 +... + Ч (|«+|Л)2 + с = о вытекает Xi (I? - ^)2+К & - ?2)2 + • • • + Ч (|«- |г)2 + с=о. Вычитая второе равенство из первого, мы получаем Возьмем на поверхности точку, в которой |2 = |3 = .. .= = |г = О, 1x7^0. (Очевидно, что уравнению (22) можно удов- летворить такими значениями.) Тогда мы получим х1|?|1=о, откуда 11 = 0. Аналогично показываем, что £° = ... = £’ = 0, что нам и требуется. 10.52. Истинные центральные поверхности. Рассмотрим сначала истинную центральную поверхность, т. е. предположим, что г — п и c=j^O. Тогда уравнение (22) легко преобразовать к виду + Л1+’|’+ ±-5±-5±-• -±-5=1, 01 аг ап
334 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.52 где числа ак определяются формулами они называются полуосями поверхности. Перенумеруем координаты заново так, чтобы сначала шли слагаемые с положительными знаками: 2 2 2 2 2Н12114- । ^+1 2 ‘ 2 Т • • • Т 2 2 01 о2 ak Ofc+i -4=1- (24) ап Случай k = 0 естественно исключить из рассмотрения, так как при k = 0 никакие вещественные значения т^, ц3,... ...,т]п не могут удовлетворить уравнению (24); в этом слу- чае говорят иногда, что уравнение (24) определяет «мни- мую» поверхность. Остаются п различных типов истинных центральных по- верхностей, отвечающих значениям й= 1, 2, . . ., п. а. В двумерном случае (л = 2) уравнение (24) определяет при k = 1 и k = 2 две известные из аналитической геометрии кривые: k—1: —-^=1 (гипербола), 01 О2 k = 2: + (эллипс). 01 02 б. При л = 3 имеем k—\, k — 2, k = 3 и соответственно три невырожденные центральные поверхности в трехмерном пространстве, определяемые следующими уравнениями: 2 2 2 Л=1: — ~=1 (двуполостный гиперболоид), 01 02 О3 2 2 2 А = 2: + —-v=l (однополостный гиперболоид), щ аг аз 2 2 2 & = 3: ~ = 1 (эллипсоид). Щ а2 а3 Напомним читателю построение каждой из этих поверхно- стей. Рассмотрим сечения каждой из них горизонтальными пло- скостями r|s = cas( — 00 < с < 00). Эти сечения представ- ляют собой соответственно: гиперболы с вещественной
10.52] § 10.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 335 осью %: 2 2 Л=1: ^--1+с2; ач эллипсы, определенные для всех значений е: А = 2: 4 + 4 = 1+са; at эллипсы, определенные только для |с|^1: 2 2 А-3: 2k4-2k = i_c2. at аг Чтобы определить положения вершин этих сечений, построим сечения поверхности координатными плоскостями т)х — 0, Рис. 2. т)а == 0. Для случая £=1 мы получаем при этом действи- тельное сечение только координатной плоскостью т|2 = 0, которое будет представлять собой гиперболу: 1 a? al Вершины гипербол горизонтальных сечений будут распола- гаться на этой кривой; в результате построения получаем двуполостный гиперболоид (рис. 2).
336 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.52 Рис. 4.
10.52] § 10.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА "ПОВЕРХНОСТЕЙ 337 Для случая k = 2 сечения обеими координатными плоско- стями т]1 = 0, т]2 = 0 представляют собой гиперболы с мни- мой осью т]3: 2 2 2 2 2 2 1 ’ 2 2 1 * а2 а3 Я! а3 Совокупность эллипсов горизонтальных сечений с верши- нами на этих гиперболах и составляет однополостный гипер- болоид (рис. 3). Наконец, в случае А=3 сечения коорди- натными плоскостями т]1 = 0, т|3 = 0 — эллипсы; проводя эл- липсы горизонтальных сечений, получаем эллипсоид (рис. 4). в. Поверхности 2-го порядка в пространстве более чем трех изме- рений у.ке не поддаются наглядному геометрическому представлению. Тём не менее мы можем указать и в многомерном случае существен- ные различия между типами истинных поверхностей, отвечающих различным значениям А=1, 2, ..., п. Будем исходить из геометри- чески очевидных различий в трехмерном пространстве. На двуполост- ном гиперболоиде (й = 1) существует пара точек, которые нельзя путем непрерывного передвижения по поверхности привести к совпа- дению: достаточно взять одну из точек пары на одной полости, а вторую точку—на другой полости, чтобы получить такую пару. На одно- полостном гиперболоиде (fe = 2) уже всякие две точки можно привести к совпадению с помощью непрерывного передвижения по поверхности; но есть замкнутая линия (например, горловая линия гиперболоида), которую нельзя непрерывной деформацией свести в одну точку. На эллипсоиде (й = 2) уже всякая замкнутая линия может быть сведена в одну точку. Эти факты могут служить исходным пунктом при фор- мулировке геометрических различий между центральными поверхно- стями в n-мерном пространстве. Введем следующие определения. Фигура А называется гомеоморф- ной фигуре В, если существует взаимно однозначное и взаимно не- прерывное отображение множества точек фигуры А на множество точек фигуры В. Фигура А, расположенная на поверхности S, назы- вается гомотопной фигуре В, расположенной на этой же поверхно- сти, если фигура А может быть переведена в фигуру В с помощью непрерывной деформации, з процессе которой фигура А остается все время на поверхности S. Геометрические различия между центральными поверхностями с помощью этих определений формулируются следующим образом. Для /г=1 можно указать на поверхности пару точек, не гомотопных друг другу. Для й = 2 всякая точка на поверхности гомотопна всякой другой точке; но существует линия, гомеоморфная окружности, кото- рая не гомотопна точке. Для k — З всякая линия, гомеоморфная окружности, гомотопна точке; но существует не гомотопная точке часть поверхности, гомеоморфная сфере (точнее, двумерной сфере, т. е. сфере в трехмерном пространстве). Продолжая таким образом, мы сможем сформулировать для каждого k отличительное свойство соответствующей центральной поверхности: всякая ее часть, гомео-
338 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ (10.63 морфная (k—1)-мерной сфере, гомотопна точке, но существует часть, гомеоморфная ^-мерной сфере, которая не гомотопна точке. Из этого результата, в частности, вытекает, что центральные поверхности в n-мерном пространстве, очевидно, гомеоморфные друг другу при равных значениях k, не гомеоморфны друг другу при различных k. На доказательствах этих интересных предложений мы останавли- ваться не можем *). 10.53. Конические поверхности. Рассмотрим теперь случай конической поверхности: в уравнении (22) с = 0. Уравнение (22) становится однородным: вместе сточ- кой (т)г, Ла, • • , Лп) емУ удовлетворяет и точка (/t]v ^Лг- • • • . . ., /т|и) ПРИ любом t. Это означает, что поверхность обра- зована из прямых линий, проходящих через начало коорди- нат**). Аналогично предыдущему каноническое уравнение конической поверхности мы сможем записать в виде 2 2 2 2 Л1 I I Л* ЛА+1 Ли _ 2 ~г • • • ~1 2 2 2 01 Ofe+i Оценим число различных типов конических поверхностей при заданном п. Если число т — п — k отрицательных коэф- фициентов в каноническом уравнении (22) больше л/2, то, умножая уравнение на —1, мы получаем уравнение той же поверхности, но с числом отрицательных коэффициентов, уже меньшим л/2. Следовательно, достаточно рассмотреть случаи, отвечающие значениям т^л/2. Если п четное, то, исключая случай точки (А = 0), получаем л/2 различных типов конических поверхностей, отвечающих значениям т=1, 2, ...,л/2; если л нечетное, то различных типов оказывается (л—1)/2, именно, они отвечают значениям Л1= 1, 2, .. ., (л—1)/2. а. На плоскости (л = 2), кроме точки, имеется один такой тип (/и = 1) с каноническим уравнением 2 2 Л1_21£=:П 2 2 щ а2 Соответствующий геометрический образ — пара пересе- Л1 . Лг кающихся прямых с уравнениями = ± . *) См. Зейферт и Трелфал, Топология, ГОНТИ, 1938. **) За единственным исключением, когда все слагаемые в сум- ме (22) одного знака и уравнение определяет одну точку—начало координат.
10.53] § 10.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 339 б. В трехмерном пространстве (л = 3), кроме точки, имеется также только один тип конической поверхности (п— 1 3—1 (—= —2~=11 с каноническим уравнением 2 2 2 П1 I Лг Пз _п 01 а2 а3 Соответствующий геометрический образ — конус (рис. 5; в частном случае, при а1 = а2, прямой круговой конус). в. Чтобы представить себе форму конической поверхно- сти в общем случае, рассмотрим ее сечение гиперплоскостью г]„ = са (— 00 < с < оо) 2 2 01 ак 'nl+i Лл-1 _а 2 • • • g v • Щ+1 Ял-1
340 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.54 Это уравнение соответствует центральной поверхности в (л—1)-мерном пространстве. Все эти поверхности (при различных значениях с) геометрически подобны друг другу, соответствующие размеры полуосей пропорциональны вели- чине с. Таким образом, каждая коническая поверхность в л-мер- ном пространстве может быть получена из некоторой цент- ральной поверхности в (л—1)-мерном пространстве R„_t при помощи перемещения этой центральной поверхности вдоль оси, перпендикулярной к R„_t, с одновременным про- порциональным растяжением во всех направлениях. Чтобы получить при этом все возможные типы конических поверх- ностей, достаточно использовать лишь те центральные по- верхности в (л — 1)-мерном пространстве, для которых число отрицательных слагаемых в каноническом уравнении не пре^ восходит (л —1)/2. 10.54. Невырожденные нецентральные по- верхности (параболоиды). Тем же путем, как и в 10.52, мы можем привести каноническое уравнение нецентральной невырожденной поверхности к виду 2 2 2 Ц1 , , life Пы 2 “Г • • • “Т“ 2 2 аг а^+1 4^ = 2^. (25) an-i Оценим число различных типов невырожденных нецент- ральных поверхностей. Если число отрицательных слагаемых в левой части уравнения (25) больше (л—1)/2, то, умно- жая уравнение (25) на —1, мы получаем уравнение той же поверхности, но с числом отрицательных слагаемых в левой части, меньшим (л—1)/2, и с измененным знаком правой части. После зеркального отражения т]„ = —т]п знак у пра- вой части восстанавливается. Таким образом, число различ- ных типов невырожденных нецентральных поверхностей (если не причислять к различным типам поверхности, получаю- щиеся друг из друга зеркальным отражением) определяется количеством целых чисел т, удовлетворяющих неравенству 0^/я^(л—1)/2; это количество равно л/2 при четном л и (л4~1)/2 при нечетном л. а. На плоскости (л = 2) существует единственная невы- рожденная нецентральная кривая (парабола) с каноническим
10.54] § 10.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 341 уравнением т)? = 2а?1]2 (т = 0). б. В трехмерном пространстве имеются две невырожден- / „ п-4-1 ные нецентральные поверхности ( п — 3; • 2 2 1) — 2г]3 (т — 0) (эллиптический параболоид), 01 о2 2 2 2) = 2т)з (/»=1) (гиперболический параболоид). (Jl Gg В первом случае сечение поверхности плоскостью т]3= — С>0 представляет собой эллипс; чтобы определить по- ложение вершин эллипса, построим сечения поверхности координатными плоскостями т]1 = 0 и т]2 = 0. В каждом из этих сечений мы получим параболу; следы этих парабол на плоскости т]3 = С укажут положение вершин эллипса. Получающаяся поверхность (рис. 6) и есть эллиптический параболоид (в частном случае, при а1 = а2, круговой пара- болоид). Во втором случае сечение поверхности плоскостью т]3= = С>0 представляет собой гиперболу с вещественной осью т]1. Чтобы определить положение вершин, рассмотрим сечение поверхности координатной плоскостью т]2 = 0; в се- чении получится парабола т]^ = 2а?г]3, след которой на плос- кости т]3 = С укажет положение вершин гиперболы. Сечение плоскостью т]3 = С < 0 представляет собой гиперболу с ве- щественной осью т]2; вершины этой гиперболы лежат на параболе г]2=— 2а|т]3 в плоскости г]1 = 0. В сечении т]3 = 0 получаем пару прямых, которые служат асимптотами для проекций на плоскость т,3 = 0 всех рас- смотренных нами гипербол в горизонтальных сечениях по- верхности. Сама поверхность и есть гиперболический пара- болоид (рис. 7). в. Чтобы представить себе форму поверхности (25) в общем случае, будем следить за изменением формы ее се- чения гиперплоскостью Т]П = С при изменении С от 0 до +оо. В каждом таком сечении получается центральная по- верхность в (п — 1)-мерном пространстве. Все эти поверх- ности подобны друг другу; соответствующие размеры полу- осей (в отличие от конической поверхности) изменяются по
342 гл. 10. формы в евклидовом пространстве [10.54 параболическому закону (пропорционально корню квадрат- ному из С). При С = 0 центральная поверхность становится конической. При С < 0 центральная поверхность переходит в сопряженную поверхность (т. е. коэффициенты канони- ческого уравнения с отрицательными и положительными знаками меняются ролями). В частном случае, когда все коэффициенты уравнения (25) одного знака, — для опреде- ленности положительного,—поверхность существует только в полупространстве г|пЭэО. Название класса рассматриваемых невырожденных поверх- ностей объясняется тем, что они действительно не обла- дают центром. При л = 3 это очевидно из рис. 6 и 7. В общем случае для доказательства допустим противное: пусть поверхность (25) имеет центр (г|?, т)“, . .., т]“). Так как этот центр должен быть, в частности, центром симмет- рии сечения г|„ = т]’, представляющего собой невырожден- ную центральную поверхность в (п — 1)-мерном простран- стве, то необходимо П? = 11? = • • • = П®-1 = °- Таким образом, центр должен находиться на оси Перей- дем ИЗ произвольной ТОЧКИ (т]1, Т]2, .... т|“ + б), ле-
10.55] § Ю.5. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА ПОВЕРХНОСТЕЙ 343 жащей на поверхности, в симметричную точку (— т]1, ... ..., —Ли-i, Ли — б)- При этом уравнение (25) не должно нарушиться. Но левая его часть остается неизменной при указанном переходе; следовательно, не меняется и правая часть, откуда вытекает, что 6 = 0. Мы получаем, что на поверхности вовсе нет точек с Ли =/= Ли- По, очевидно, уравнение (25) допускает решение (Лх, Лг, • • •, Ли) с Лп^= Ли- Полученное противоречие показывает, что наша поверхность не может иметь центра. 10.55. Вырожденные поверхности. Вырожден- ными мы назвали те поверхности, в канонических уравне- ниях которых участвует меньше чем п координат. Пусть, например, в каноническом уравнении отсутствует коорди- ната Ли- Тогда все сечения поверхности (л—1)-мерными гиперплоскостями л„ = С(— оо < С < оо) представляют собой одну и ту же поверхность в (л— 1)-мерном пространстве. Следовательно, всякая вырожденная поверхность образуется
344 гл. 10. формы в евклидовом пространстве [10.55 параллельным переносом некоторой поверхности 2-го поряд- ка в (п — Vj-мерном пространстве R„_1 вдоль перпендикуляра к этому (п—Химерному пространству. а. Найдем соответствующие линии на плоскости (п = 2); так как в каноническом уравнении в данном случае может Рис. 8. участвовать только одна координата, то это уравнение имеет вид 4-с. При С > 0 мы получаем пару параллельных прямых, при С=0—пару слившихся прямых, при С<0 — мнимую линию. б. Чтобы построить вырожденные поверхности в трех- мерном пространстве (п — 3), нужно подвергнуть параллель- ному переносу вдоль оси т]3 все кривые 2-го порядка на плоскости (т)х, т]2). При этом эллипс, гипербола, парабола соответственно дают эллиптический, гиперболический, пара-
10.61] § 10.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 345 болический цилиндры (рис. 8). Пара прямых, пересекающихся, параллельных или слившихся, приводит соответственно Рис. 9. к паре плоскостей —пересекающихся, параллельных или слившихся (рис. 9). § 10.6. Анализ поверхности по ее общему уравнению 10.61. Мы описали все возможные типы поверхностей 2-гр порядка в л-мерном евклидовом пространстве. Тип по- верхности определяется по ее каноническому уравнению. Но часто поверхность задается не каноническим, а общим урав- нением (19) и бывает существенно определить тип поверх- ности, иными словами, построить ее каноническое уравнение, не производя всех преобразований, описанных в 10.42. Оказывается, чтобы написать каноническое уравнение поверхности, заданной уравнением (19), достаточно знать следующие величины: а. Корни многочлена л-й степени &Ц ^12 Д(М = сч с» Q С-1 <3 • а2п = 0. ani а„2 . • апп
346 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ (10.61 б. Коэффициенты многочлена n-й степени • • К &21 ^22 • • й2п th ДХ(А) = ап1 ап2 • • апп — t)n ^1 ^2 ... bn С Чтобы получить явные выражения для коэффициентов этого многочлена, используем линейное свойство определи- теля (1.44). Каждый столбец определителя Ai (X) (кроме последнего) можно представить в виде суммы двух столбцов, первый из которых состоит из числа (1 = 1, 2, ..., п; j фиксировано) и числа Ь}-, а второй — из п нулей и числа — X. Соответственно определитель Дх(Х) представляется в виде суммы некоторого числа определителей, каждый из которых получается заменой некоторых столбцов (кроме последнего) в матрице й а to W а а ЬЭ tO ГО й & te М а а th ^2 * о • я ta • с с Ьп th . • Ьп С (26) на столбцы, состоящие из п нулей и одного элемента —X, причем так, что число —X оказывается на главной диаго- нали матрицы. Каждый из этих определителей после разло- жения по тем столбцам, в которых стоят числа —X, при- водится к виду (-Ъкмп+1_к, где k—число столбцов, содержащих элементы —X, а Мп+1_к— некоторый минор (л-и1—Л)-го порядка матрицы Д1. Этот минор характерен тем, что в нем вместе с каждой строкой матрицы Лх используется столбец этой матрицы с таким же номером и заведомо используются последняя строка и последний столбец этой матрицы. Миноры, обла- дающие этим свойством, мы будем называть окаймляющими. Очевидно, что каждый окаймляющий минор матрицы Аг появится в разложении определителя Дх(Х). Отсюда мы не-
10.62] § 10.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 347 посредственно получаем, что коэффициент при (— X)ft в раз- ложении определителя Дх(Х) по степеням —К равен сумме всех окаймляющих миноров порядка лЦ-1—k. Разложение определителя Дх(X) удобно записать в виде Д1(Х) = ал+1—+ • • • + «i( —Мп; при такой записи коэффициент aft будет равен сумме всех окаймляющих миноров матрицы Alt имеющих порядок k. 10.62. Корни характеристического многочлена A(X), как мы уже знаем, дают нам коэффициенты при квадратах пере- менных в каноническом уравнении. Чтобы найти оставшийся член (нулевой степени, если каноническое уравнение имеет вид (22), или первой степени, если оно имеет вид (23)), необходимо выяснить поведение коэффициентов многочлена Дх(Х) при преобразованиях координат. Рассмотрим в (л1 )-мерном евклидовом пространстве Rn+1 квадратичную форму АХ(Х, х)= 2 «,-Л^ + 2 2^л+1 + Сь (27) i, 6=1 /= 1 ♦ где Bi, В2, •••> В,i + i —координаты вектора x£R„+i в некотором ортогональном нормированном базисе ех, е2, ... ..., еп, еп+1. Этой квадратичной форме отвечает симмет- ричный оператор Ар имеющий в базисе {е) матрицу (26); мы будем обозначать эту матрицу также через А(е). Наряду с этим оператором рассмотрим оператор Ех, оп- ределяемый равенствами E1ek — ek при E1en + i = 0. Ему отвечает следующая матрица (в том же базисе е2, еп + 1): (28) 1 0
348 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.62 Обозначим через R„ подпространство с базисом из век- торов elt е2, ..., еп; оператор Ег в этом подпространстве, очевидно, является тождественным оператором. Пусть дано некоторое изометрическое преобразование Q в пространстве R„; оно переводит ортогональный нормиро- ванный базис elt е2, •, еп в некоторый базис Д, Д, ..., Д, также ортогональный и нормированный. Построим изометри- ческое преобразование Qx в пространстве Rn+1, полагая Qlel=/1> Qle2 =/2> •••> Qle» + 1 ~ еп + 1 ~fn+l' Если матрица оператора Q в пространстве R„ имела вид Q= 4п 412 • • • 421 422 • • • 42п 4п1 4п2 • • 4пп то в пространстве R„+1 матрица построенного оператора Qx будет иметь вид 4ц 412 • 41п 0 ?21 422 • • • 42п 0 Qi = 4п1 4п2 4пп 0 0 0 ... 0 1 Эта матрица отвечает следующим формулам преобразования координат (8.94): £1 = ?цП1 + ада + • • • + Л» — 412Г11 + 422^2 + • • • + (29) = 41пХ\1 + ?2„П2 + • • • + 4ПгМп, Оператор Ах в новом базисе Д, Д, ..., Д+1 имеет матрицу = Q-1A(e)Q (5.5/); оператор Ет — ту же матри- цу (28), что и раньше. Согласно 5.52 справедливо равенство det (А(/)—hE-i) = det (А(е)—ХЕ^). Допустим теперь, что в качестве преобразования Q было выбрано то самое, которое в 10.42 приводило квадратичную
10.62] § 10.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 349 п форму А (х, х)= У к каноническому виду i, k= 1 п А (х, х) = 2 М4 /=1 Из формул (29) вытекает, что преобразование Q пере- водит квадратичную форму (27) от п-\-1 переменного в форму п п S М?+22 +спп+1- z=l /=1 Матрица оператора Аъ которая, как мы знаем, преобразу- ется одинаково с матрицей квадратичной формы, приобретает после этого преобразования следующий вид: Xi /х Х2 0 /2 ’ о /„ 4 А • • lr lr + l • • Аг С Многочлен (X) = det (Л(/) — Х£х) будет равен определителю Х^—X 0 0 0 . . 0 4 0 Х2—X 0 0 . . 0 4 0 0 ... Xr—X 0 . . 0 1г 0 0 0 —X . 0 /г+1 0 0 0 0 . . -X - 4 4 ... 1г 4+1 • • • 4 с Коэффициенты этого многочлена можно вычислить с по- мощью окаймляющих миноров матрицы так же, как они
350 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ (10.63 вычислялись раньше через окаймляющие миноры матрицы Ае) = А- Заметим, что при г < п все окаймляющие миноры мат- рицы А(/) выше (г-4-2)-го порядка заведомо обращаются в нуль, так как содержат два пропорциональных столбца. Таким образом, при г < п коэффициенты аг+3, ссг+4, • •. равны нулю. Кроме того, при г < п в окаймляющих минорах (г-4-2)-го порядка, кроме заведомо равных нулю, необходимо исполь- зуются первые г строк и г столбцов матрицы A(f). В окаймляющих минорах (/•-Ь1)-го порядка могут и не использоваться эти г строк и столбцов; отметим все же два случая, когда это использование заведомо имеет место: 1) г = п; очевидно, что у матрицы имеется един- ственный минор (r-f- 1)-го, т. е. (л-[-1)-го порядка, совпа- дающий с ее определителем; он содержит все строки и столбцы матрицы Л(/). 2) г < п, Zr+1 = Zr+2= . .. =Z„ = 0; кроме заведомо рав- ных нулю, имеется один окаймляющий минор (г-|- 1)-го по- рядка; он лежит в строках и столбцах с номерами 1,2, ... ..., г, л + 1. 10.63. Посмотрим, далее, как отразится на матрице оператора Aj следующий этап преобразований уравнения (19) § 10.4, имеющий целью аннулирование величин 1г, 1а, ..., Zr. После преобразования 1li = Tli + l7T>n+i. = (А = 2, 3, . .., «+0 матрица А(^ переходит в матрицу 0 ... 0 0 ... 0 0 о х2 ... о о ... о z2 0 0 ... Л, 0 ... 0 1Г 0 0 ... о о ... о zr+1 о о ... о о ... о z„ о zx ... ir ir+1 ... in с
10.63] § 10.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 351 Операция, произведенная с матрицей A{f}, может быть описана еще так: из последнего столбца вычтен первый столбец, умноженный на , а затем из последней строки Z1 А вычтена первая строка, также умноженная на . Аналогично можно описать дальнейшие преобразования, имеющие целью аннулировать величины /2, /3, ..., в результате всех этих преобразований матрица А{Г) переходит в матрицу 4 0 . . 0 0 . .. 0 0 0 .. 0 0 . . 0 0 0 0 0 0 . .. 4 . . 0 0 . 0 . .. 0 . 0 0 41 0 0 . . 0 0 . . 0 In 0 0 .. 0 41 • In с' При этих преобразованиях заведомо не изменяют свою величину те окаймляющие миноры матрицы Л(/), в которых участвуют первые г строк и г столбцов этой матрицы. Рассмотрим многочлен Aq А- 0 0 0 .. . 0 0 0 Xg—X . 0 0 .. . 0 0 0 0 0 0 . Xr—X 0 0 .. —X .. . 0 . 0 0 41 0 0 0 0 .. . —X In 0 0 0 41 • • • In с = 41-4Л+ ... + ®И—Мп- Коэффициенты этого многочлена вычисляются через окай- мляющие миноры матрицы Л$ по тем же правилам, что и коэффициенты многочлена (i) через окаймляющие миноры матрицы Л(/). В силу доказанного выше свойства неизмен- ности миноров (г + ‘2)-го порядка (при г < п) мы получаем,
352 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.64 что а'+2 = аг+2; так же в двух указанных особых случаях мы будем иметь а'+1 = аг+1. 10.64. Рассмотрим сначала особый случай г = п. Тогда коэффициент а„+1 многочлена А)г) (X) равен, очевидно, произве- дению с; тем самым величина с в каноническом уравнении (22) оказывается равной ___ «П+1 ___ «п+1 A-iZg ... Ап ХуА-з • Ад 10.65. Пусть теперь г <_п. Определим нужный для даль- нейшего коэффициент аг+1 у многочлена Д^’ (А)*). Окайм- ляющие миноры матрицы порядка г+ 2, за исключением заведомо равных нулю, имеют вид Xi 0 . . 0 0 0 0 . 0 0 0 0 0 . . 0 0 — ^1^2 • • • 0 0 . . 0 0 1т 0 0 . . 0 1т с = ..., п), и их сумма, равная коэффициенту 0^+2 = аг+2, выражается в виде — А.^2 . . . (/£+1 + ... 4~ 1%). Вспомним, что условием приводимости уравнения (19) к канонической форме (23) было наличие среди коэффициентов /й+1, ...,/„ хотя бы одного отличного от нуля. Теперь мы можем эквивалентное условие сформулировать в виде нера- венства 0Сг + 2 =7^ О и одновременно указать формулу для вычисления коэффи- циента М канонической формы (23) = 42+1 + • • • + Zn2 = - г/г+\ • Лу/\<2 • • • /*/• *) Нетрудно проверить, что и у многочлена Д«> (X) все коэффи- циенты ат при m>r-f-2 в этом случае заведомо обращаются в нуль.
lO.eej § 10.6. АНАЛИЗ ПОВЕРХНОСТИ ПО ЕЕ УРАВНЕНИЮ 353 Если же аг+2 = 0, то 1Г Ь1 = 1г+г = ...=/„ = 0 и уравне- ние приводится к канонической -форме (22). Мы приходим здесь ко второму особому случаю. Коэффициент a'r+l = ar+l в этом случае равен, очевидно, произведению . . . Лгс, откуда коэффициент с канонической формы (22) получается равным в-Г+1 _ ftf + l Xi%2 • - • AjAg ‘ * • А/- 10.66. Приведем сводку полученных результатов. При этом корни Ар Л2, ...,Ха характеристического многочлена А(Л) условимся, как и ранее, выписывать в таком порядке, чтобы сначала шли корни, отличные от нуля. Произведение ... кг обозначим через Лг. Данные Каноническое уравнение Ч £ 0 >•141 + А2г]2 + • • • + >-л4» = 0 Ал = 0 +1 0 >141 4" A.2T]2 + • • • + >я-14л-1 + 4~ ьс 1 >|Я 1 li а II Ф _ 1 0 j ап +! = 0 >i4i Ч->з4з 4~ • • + >«-i4n-i + - —0 — 1 ” 0 1 Т2 0 + • . + A.n_a»)n-i + + 2 V Ц„_1 = 0 г лн-« Х„_2 #0 ) а„ —0 ^iYli + ^2rl2+ • . + л" - =0 Ла = 0 1 а3 0 М1+2 1/--^ ти=0 * Л-j ; «з = ° д 2 I гх >-141 + ;;‘г:°
354 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [10.71 § 10.7. Эрмитово-квадратичные формы 10.71. Многие из теорем предыдущих параграфов пере- носятся на квадратичные формы в комплексном пространстве. Начнем со следующей основной теоремы: Теорема. В п-мерном унитарном пространстве Сп всякая эрмитово-билинейная симметричная форма имеет канонический базис из п взаимно ортогональных векторов. Доказательство. Линейный оператор А, отвечающий данной эрмитово-билинейной симметричной форме А (х, у) (9.18 а) по формуле A(x,j)s(Ax, у), имеет в любом ортонормированном базисе пространства Сп ту же матрицу, что и форма А(х,у), и, следовательно, эрмитово-симметричен (а^’ = а^'), j, k=\, ..., п). В силу теоремы 9.34 в пространстве Сп имеется ортонормированный базис et, ...,еп из собственных векторов оператора А. В этом базисе матрица оператора А диагональна; следова- тельно, в этом базисе диагональна и матрица формы А(х,_у); таким образом, базис е1, ...,еп есть канонический базис формы А (х, j). Теорема доказана. 10.72. Из теоремы 10.71. следует, что всякая симмет- ричная эрмитово-квадратичная форма А (х, х) может быть приведена к каноническому виду А(х, х)=Ь7|£у|2 /=i унитарным преобразованием. Последовательность действий, которые приводят к опре- делению координат векторов искомого канонического базиса и чисел Ху, такова же, что в вещественном случае (10.13). 10.73. Найдем стационарные значения на единичной сфере п У | g- |2 = 1 эрмитово-квадратичной симметричной формы А (х, х). Как мы помним из 9,156, форма А(х, х) принимает лишь вещественные значения. Пусть ег, ...,еп — ортонор- мальный канонический базис формы А(х, х). В этом базисе
10.74] § 10.7. ЭРМИТОВО-КВАДРАТИЧНЫЕ ФОРМЫ 355 мы имеем А (х, х) = 2 1 I2 = 2 (О/ + т/); = оу- + it-, i=i j=i (X, x)= 2 | gy I2 = 2 W + xf)- i=i i=i Действуя по методу Лагранжа, приравниваем нулю частные производные функции А(х, х) — к(х, х) по каждой из 2п вещественных координат оу и ту- (/=1, •••, л). При этом получаются уравнения 2Х,о,—22.0, = 0, 1 ’ 1 Ч /=1, . ..,л. 2Ху.ту—22,ту. = 0, J Эти уравнения удовлетворяются на векторе х с |х| = 1, лишь если X совпадает с одним из значений 2.1, А„. Пусть X = %ft; тогда решением служит вектор х с коорди- натами £у- = Оу+ iXj— 0 при j=7=k и |[ = 1. Следовательно, как и в вещественном случае (10.21), эрмитово-квадратичная форма А (х, х) принимает стационарные значения на векторах ее ортонормального канонического базиса еу, иными словами, на собственных векторах соответствующего эрмитово-сим- метричного оператора А. Сами значения формы в этих точках совпадают с соответствующими каноническими коэффициен- тами; в частности, максимум формы А (х, х) есть наиболь- ший из коэффициентов Zy., а минимум — наименьший из этих коэффициентов. 10.74. К теореме 10.72 сводится и проблема об одно- временном приведении к каноническому виду двух симмет- ричных эрмитово-квадратичных форм А (х, х) и В(х, х), из которых одна, например В(х, х), положительно определена. Именно, мы можем принять за скалярное произведение эрмитово-билинейную форму В (х, у). По теореме 10.72 существует ортонормированный (в смысле введенного ска- лярного произведения) канонический базис формы А (х, х). В этом базисе мы имеем А(х, х)=2ШТ- В(*-*)=21^Т> /=1 ;=1 что и требуется.
356 ГЛ. 10. ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ Вычисление координат векторов искомого базиса (относи- тельно произвольного исходного базиса) и коэффициентов производится по тем же правилам, что и в ве- щественном случае (10.32). Для обоснования их следует, введя выражения В/=0’/+хт/, записать формы А (х, х) и В(х, х) в виде вещественных функций от вещественных переменных оу и ту(/=1, ...,п). Мы можем предоставить читателю детали этого вывода. ЗАДАЧИ 1. Привести ортогональным преобразованием к каноническому виду следующие квадратичные формы: а) 2g?+g?-4g1g2-4g2g3; б) Ш + 5g?+5g? + 4g4g2-4gtg3- 8g2g3; в) 2g? + 2g? + 2g? - 4g4g2 + 2g4g4 + 2g2g3 - 4gag4; r) 2gtg2 + 2g4g3 - 2g4g4 - 2gsg3 + 2g2g4 + 2g3g4. 2. Где располагаются при | х | = 1 стационарные значения квад- ратичной формы А (х, x)=xi-\-~ + ~ (x = (xlt хг, х3)) и каковы они (минимум, максимум)? 3. Показать, что каждая из величин щ, ц2, ..., щ может дости- гать крайних границ, указанных в неравенствах 10.25 (6). 4. Квадратичные формы А (х, х) и В (х, х) называются сравнимыми, если для любого x£R выполняется неравенство А (х, х) < В (х, х). Пусть ^ ... — канонические коэффициенты формы А (х, х), щ 5а р 2 5а ... 2s р п—канонические коэффициенты формы В (х, х). Показать, что для любого k (1 < k < п) имеет место неравенство 5. Найти общую пару сопряженных направлений у кривых у2 «/2 j+^ = i; 2xj/=i. 6. Построить линейное преобразование, переводящее две квадра- тичные формы А (х, x) = g? + 2g1g1! + 2g|-2g1g3 + 3g5, В (х, х) = gi-j-2g]g2-|-3g2g3—2j1g3-|-6g3 к каноническому виду; указать канонический вид. *) Очевидное в случае, когда формы А (х, х) и В (х, х) имеют общий канонический базис.
ЗАДАЧИ 357 7. Показать, что базис, в котором формы А (х, х) и В(х, х) записываются в каноническом виде с каноническими коэффициентами соответственно и Vj, .... vn, определен однозначно с точ- ностью до числовых коэффициентов, если все отношения Xi Л2 V1 ’ V2 ’ ' ’ ’ ’ v„ попарно различны. 8. Доказать, что середины хорд поверхности 2-го порядка, парал- лельных вектору ^={51, Ь, ..., расположены на (п — 1)-мерной гиперплоскости (диаметральной гиперплоскости, сопряженной с век- тором у). 9. Какие поверхности 2-го порядка в трехмерном пространстве (х, у, г) задаются уравнениями у2 »j2 <г2 у2 хЛ а)у-т+т=1; 6)--T-V—1: в) х = г/2 + г2; г) i/ = x2 + z2+l; д) t/ = xz? 10. Упростить уравнения поверхностей 2-го порядка в трехмерном пространстве (х, у, z) и указать соответствующие формулы преобра- зования координат: а) 5х2-(-бу2-f-7z2—4xi/ + 4{/z— 10х + 8</+ 14z—6 = 0; б) х2 + 2р2 — z2+ 12ху—4xz—8(/z+ 14x+ I64/—12z — 3 = 0; в) 4x2-f-y2 + 4z2—4xy + 8xz—4yz — 12x — 12y -j- 6z = 0. 11. Показать, что в пересечении эллипсоида с полуосями 2s а2 2а ... 2г ап и fe-мерной гиперплоскости, проходящей через центр этого эллипсоида, получается эллипсоид с полуосями .. .^Ьк, где a1^b1^an_ll+1, c22sb222 ап- х+2> ak bk ап-
ГЛАВА 11 КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ § 11.1. Еще об алгебрах 11.11. Мы ввели понятие алгебры в 6.21\ такое название было присвоено линейному пространству над некоторым полем К с введенной в нем операцией умножения элементов (подчиненной аксиомам 6.21, 1)—<?)), коммутативной или некоммутативной. Алгебры, которые мы рассматривали в гл. 6, были в ос- новном коммутативными. Важный пример конечномерной не- коммутативной алгебры — алгебры В(К„) всех линейных опе- раторов в пространстве К„ — мы там оставили в стороне. В этой главе мы ставим своей целью изучение алгебры В(К„) и ее подалгебр. Но будет удобнее рассмотреть вначале абстрактные конечномерные алгебры. 11.12. Не всякая алгебра обладает единицей (примером чему служит любая тривиальная алгебра, т. е. алгебра с ну- левым умножением, 6.22 а). Тем не менее каждую алгебру можно дополнить до алгебры с единицей следующим стан- дартным образом. Пусть А — произвольная алгебра. Рассмотрим множество А + , состоящее из формальных сумм вида а-{-'к, где п£А, а X— число из поля К. Очевидно, А+ является линейным пространством с операциями (а -р X) -р (Ь -р р) = (a -р b) -р (X -р р) и р (а-рХ) = ра~рХр, и, более того, алгеброй относительно умножения (а -р X) (ft ~р р) — (ab -р l.b -р рп) -р Хр
11.21) § 11.2. ПРЕДСТАВЛЕНИЯ АБСТРАКТНЫХ АЛГЕБР 359 (а, А;Х, Алгебра А+ заведомо обладает единицей: ею является формальная сумма нулевого элемента в А и числа 1. При этом исходную алгебру А можно рассматривать как лежащую в А + , если каждый элемент а £ А отождествить с формальной суммой а + 0£А+. § 11.2. Представления абстрактных алгебр 11.21. Пусть А—абстрактная алгебра над полем К и В (К) — алгебра всех линейных операторов, действующих в линейном пространстве К над тем же полем К- Будем рас- сматривать морфизмы алгебры А в алгебру В (К), которые в дальнейшем будем обозначать символом вида Т: А —> В (К). а. Определение. Морфизм Т:А—► В (К) называется представлением, алгебры А в пространстве К. Представление называется тривиальным, если Та —0 для каждого а £ А, и точным, если морфизм Т есть мономорфизм, т. е. для раз- личных элементов а и b алгебры А соответствующие опе- раторы Тй и Т6 различны в алгебре В (К). Совокупность всех элементов а £ А, которые представле- нием Т переводятся в нулевой оператор, называется ядром представления Т. Ядро тривиального представления совпа- дает со всей алгеброй А, ядро точного представления состоит из одного нулевого элемента алгебры. В общем случае ядро любого представления есть двусторонний идеал алгебры А (6.25 г). б. Определение. Два представления Т': А —В (К') и Т": А —> В (К") алгебры А называются эквивалентными, если между линейными пространствами К' и К" можно установить изоморфизм U: К' —* К" такой, что для любого а С А ит;=гои. Очевидно, в случае конечномерных пространств К' и К" эквивалентность представлений Т' и Т" означает, что в не- которых базисах пространств К' и К" операторы Т„ и Тй (a g А) записываются одинаковыми матрицами. в. Пусть Т: А—>В(К) — представление алгебры А. Под- пространство К' в К мы будем называть инвариантным подпространством представления Т, если оно инвариантно относительно всех операторов То, a £ А. Рассматривая опе- раторы Та лишь на К', мы, очевидно, получим некоторое
360 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (11-22 новое представление Тк': А —*В(К'), которое будем называть сужением представления Т на К'- г. Пусть Т: А—>В(К) — представление алгебры А та- кое, что К разлагается в прямую сумму подпространств Kk(l SC k п), инвариантных относительно представления Т. Обозначим через Т* сужение представления Т на В такой ситуации мы будем говорить, что представление Т разлагается в прямую сумму представлений Т* (1 /г л). 11.22. С каждой алгеброй А естественным образом свя- зано ее некоторое представление Т: А —В (А) в самом ли- нейном пространстве А, которое ставит в соответствие каж- дому элементу а £ А оператор левого умножения на а, т. е. оператор Тв, определенный равенством Та& = ab для любого Ь£А. Такое представление называется левым регулярным представлением алгебры А. Очевидно, инвариантные подпро- странства левого регулярного представления являются левыми идеалами в А (6.23 а}. С помощью этого понятия установим следующий важный результат: Теорема. Любая алгебра изоморфна некоторой подал- гебре алгебры В (К) (при надлежащем выборе К). Доказательство. Как легко видеть, утверждение теоремы равносильно следующему: каждая алгебра обладает точным представлением. Пусть А — заданная алгебра. Как показано в 11.12, су- ществует алгебра А+, обладающая единицей е и содержащая А в качестве подалгебры. Рассмотрим ее левое регулярное представление t ;А+ —> В (А + ). Поскольку для любого а £ А+, а 0, Тое = ае = а 0, это представление является точным. Следовательно, сужение морфизма Т на подалгебру А в А + является точным представлением алгебры А в пространстве К = А+. Тем самым теорема доказана. § 11.3. Неприводимые представления и лемма Шура 11.31. Среди всех представлений заданной алгебры можно выделить некоторые, устроенные в определенном смысле наиболее просто. Каждое представление Т: А —+ В (К) некоторой алгебры А обладает по крайней мере двумя инвариантными подпрост-
11.33J § 11.3. НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ И ЛЕММА ШУРА 361 ранствами: самим К и его нулевым подпространством. Осталь- ные инвариантные подпространства мы будем называть соб- ственными. Те из них, которые не содержат ни одного другого подпространства того же вида, будем называть минимальными инвариантными подпространствами представления Т. Определение. Нетривиальное представление Т: А —► —+ В (К) называется неприводимым, если у него отсутствуют собственные инвариантные подпространства. 11.32. Пусть — некоторый вектор; тогда, как легко видеть, множество Кг= {Taz g К: я £ А} является инвариант- ным подпространством представления Т. Будем называть вектор z £ К циклическим (относительно представления Т), если Кг=К. Из этого определения и определения неприво- димости немедленно вытекает следующая теорема: Теорема. Представление, действующее в пространстве К, неприводимо тогда и только тогда, когда каждый отличный от нуля вектор пространства К является циклическим. Несмотря на свою простоту, этот результат окажется весьма полезным в дальнейшем. 11.33. Неприводимые представления алгебр над полем С комплексных чисел обладают следующим важным свойством: Теорема (лемма Шура). Пусть Т: А —> В (С) — непри- водимое представление алгебры А над полем С. Тогда любой оператор в пространстве С, перестановочный со всеми опе- раторами Та, а£А, кратен тождественному оператору Е. Доказательство. Пусть S—оператор, перестано- вочный со всеми Та, п^А, и х— его собственный вектор (4.956). Тогда Sx — kx для некоторого комплексного % и, следовательно, STax = TaSx = ХТах для любого а £ А. Но представление Т неприводимо, а значит, по теореме 11.32, любой вектор у£С представим в виде у = Твх, а£А. От- сюда Sy = Ху для любого у £ С, что и требовалось дока- зать. Заметим, что при доказательстве существенно использо- ван тот факт, что каждый линейный оператор в комплексном линейном пространстве обладает собственным вектором. В силу решающей роли леммы Шура, в дальнейшем мы ограничи- ваемся рассмотрением линейных пространств и алгебр только над полем комплексных чисел.
362 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (11.41 § 11.4. Основные типы конечномерных алгебр Начиная с этого параграфа, если специально не огово- рено обратное, будут рассматриваться исключительно конеч- номерные алгебры (т. е. алгебры, имеющие как линейные про- странства конечную размерность) над полем С комплексных чисел. Как устроены конечномерные алгебры и их представления? Основная часть настоящей главы будет посвящена резуль- татам именно в этом направлении. В частности, будут вы- делены некоторые классы алгебр, строение которых удается изучить полностью, т. е. удается описать все такие алгебры с точностью до изоморфизма, а все их представления —с точ- ностью до эквивалентности; именно, речь будет идти о клас- сах простых и полупростых алгебр. Различные классы алгебр возникают при рассмотрении специфических свойств их идеалов и- представлений. 11.41. Определение. Нетривиальная алгебра (6.22а) называется простой, если она не содержит собственных дву- сторонних идеалов. Примером простой алгебры является алгебра В(С„) всех линейных операторов в конечномерном пространстве. Действительно, пусть J—двусторонний идеал в алгебре В (К„) и пусть Ад = \\a/k\\ £ J — ненулевая матрица, так что, например, а5?#=0. Тогда, как было показано в 4.44в, операциями умножения матрицы А справа и слева на некото- рые матрицы, т. е. операциями, не выводящими за пределы идеала J, можно получить матрицу Ert с единственным не- нулевым элементом 1 в пересечении r-й строки и /-го столб- ца при любых г и t от 1 до п. Линейные комбинации мат- риц Ert дают любую матрицу Л£В(К„), откуда и следует, что J = B(K„). Как мы увидим далее, этот пример в классе всех конечномерных алгебр над полем комплексных чисел — единственный (11.64'). Теорема. Простая алгебра обладает точным неприво- димым представлением. Доказательство. Пусть А — простая алгебра. Рас- смотрим ее левое регулярное представление Т: А^В(А).Из конечномерности А немедленно вытекает, что среди инвари- антных подпространств представления Т имеется минималь- ное подпространство А'. Сужение Т представления Т на А'
11.42] § 11.4. ОСНОВНЫЕ ТИПЫ КОНЕЧНОМЕРНЫХ АЛГЕБР 363 не является тривиальным представлением; покажем это. Для этого достаточно показать, что для любого Ь£А' множе- ство Ab = ^ab: а £ А} #= {0} *). Пусть, напротив, А& = 0. Тогда, как легко видеть, мно- жество bA = {ba-. а С А} — двусторонний идеал в А и ввиду простоты А либо ЬА = А, либо ЬА — {0}. Но в случае ЬА = А из АЬ = 0 вытекает, что любое произведение в А равно ну- лю. В случае же ЬА={0} множество {AA:Z£C} является ввиду Аб={0} двусторонним идеалом в А и вследствие простоты А должно совпадать со всей алгеброй. Таким образом, в обоих случаях алгебра А оказывается тривиаль- ной, а значит, не может быть простой. Итак, представление Т: А -» В(А') не является тривиаль- ным. Но тогда, во-первых, оно ввиду минимальности непри- водимо, а во-вторых, его ядро, будучи отличным от всей простой алгебры ее двусторонним идеалом, состоит из од- ного нуля. Поэтому всякое неприводимое представление является одновременно и точным, что и доказывает тео- рему. На самом деле имеет место и обратная теорема, т. е. конечномерная алгебра, имеющая точное неприводимое пред- ставление, проста. Это будет показано в конце 11.64. 11.42. Произвольная алгебра может и не иметь точных неприводимых представлений. Однако естественно выделить те алгебры, свойства которых могут быть описаны в тер- минах их неприводимых представлений. Мы приходим к сле- дующему классу алгебр, более широкому чем класс простых алгебр: Определение. Алгебра называется полупростой, если для каждого ее элемента, отличного от нуля, существует неприводимое представление, отображающее этот элемент в отличный от нуля оператор. Иными словами, в полупростой алгебре пересечение всех ядер ее неприводимых представлений состоит из одного нуля. В силу теоремы 11.41 всякая простая алгебра является и полупростой. С другой стороны, рассмотрим коммута- *) Следующее ниже простое доказательство этого факта предложено А. С. Немировским.
864 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [11-43 тивную /i-мерную (я > 1) алгебру Сп из элементов a-=(alt . . . , а„), где с покоординатным умножением. Эта алгебра коммутативна; множество тех a=(alt ... , а„), для которых, например, аг = 0, представляет ее (двусторон- ний) идеал, так что алгебра Сп не простая. Приводя в со- ответствие элементу а = (а1, ..., а„)" комплексное число аА(1 (или, что то же, оператор умножения на чис- ло ак в одномерном пространстве Cj), мы получаем непри- водимое представление алгебры Сп, которое переводит не в нуль любой элемент алгебры Сп с ak^=0. Так как у лю- бого элемента алгебры Сп имеется хотя бы одна ненулевая координата, то для любого элемента алгебры Сп имеется и неприводимое представление, переводящее этот элемент в ненулевой оператор. Таким образом, алгебра Сп полу- простая. В этом примере алгебра Сп есть прямая сумма простых (одномерных) коммутативных алгебр. Легко можно его обоб- щить, рассмотрев прямую сумму простых некоммутативных алгебр; и тогда, как мы покажем ниже (77.77), мы получим общий вид полупростой конечномерной алгебры над полем комплексных чисел. 11.43. Алгебры, в определенном смысле противоположные по своим свойствам полупростым алгебрам, выделяются сле- дующим образом. Определение. Алгебра называется радикальной, если каждое ее нетривиальное представление обладает собствен- ным инвариантным подпространством. Иными словами, у радикальных алгебр вообще отсут- ствуют неприводимые представления. В качестве примера рассмотрим алгебру А из многочле- нов р (z) = ... dnzn с обычными операциями, но с условием zn+1 = 0. Тогда и каждый элемент алгебры А, возведенный в (л-|-1)-ую степень, равен 0, так что все ее элементы необратимы. Алгебра А не имеет нетривиального одномерного представления, поскольку всякий ненулевой ли- нейный оператор в одномерном пространстве обратим. Пусть Т—нетривиальное (следовательно, неодномерное)пред- ставление алгебры А и Z — оператор, соответствующий элементу г. Так как Z (вместе с z) необратим, то имеется вектор е, для которого Ze = 0. Но тогда и p(Z)e = 0 при
ИЛЯ § 11.5» ЛЕВОЕ РЕГУЛЯРНОЕ ПРЕДСТЭВЛЕНИЕ 365 любом p(z) £ А. Таким образом, у представления Т нашлось нетривиальное инвариантное подпространство (прямая, опре- деляемая вектором е). Мы видим, что алгебра А радикальная. 11.44. Определение. Пусть А — произвольная алгебра. Тогда радикалом алгебры А называется пересечение всех ядер неприводимых представлений алгебры А, если послед- ние имеются, или вся алгебра А, если они отсутствуют. Так как ядро каждого представления есть двусторонний идеал алгебры А (11.21а), то и радикал, как пересечение некоторых двусторонних идеалов, также, очевидно, является двусторонним идеалом алгебры А. Изучение алгебр с нетривиальным радикалом (в частности, радикальных) вызывает существенные трудности, и резуль- таты, как правило, не носят окончательного характера; не- которые из них мы приведем в конце главы. Напротив, полупростые алгебры и их представления удается исследо- вать полностью; их изучение, как мы увидим в дальнейшем, сводится к изучению простых алгебр. К подробному рассмотрению простых алгебр, а также их представлений мы сейчас и переходим. § 11.5. Строение левого регулярного представления простой алгебры 11.51. Итак, пусть А — простая алгебра. Зафиксируем ее некоторое точное неприводимое представление Т: А —► В(Х) (оно существует согласно теореме 11.41). В дальнейшем это представление мы будем называть стандартным. Теорема. Пусть f: А -* В(А) — левое регулярное пред- ставление простой алгебры А, I — минимальное инвариантное подпространство представления Т. Тогда а) сужение Т* представления Т на I эквивалентно Т, б) подпространство I, рассматриваемое как подалгебра в А, обладает правой единицей. Зафиксируем некоторый элемент а £ I, а 0. Поскольку представление Т точно, Tdx^=0 для некоторого х £ X. Рассмотрим линейный оператор U: IX, определенный ра- венством 1Л> = Тьх для любого Ь£1.
366 ГЛ. 1 1. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (11.52 Ядро оператора U является, как легко видеть, левым идеалом в А или, что то же самое, инвариантным подпро- странством представления Т, содержащимся в I и не совпа- дающим с ним. Следовательно, ядро U состоит лишь из нулевого элемента. С другой стороны, образ U является, очевидно, отличным от нуля инвариантным подпространством неприводимого представления Т и поэтому совпадает, со всем X. Итак, U — изоморфизм I на X. Кроме того, для любых b С I и с £ А UT= и (cb) = ТсЬх = Д. (1» = Тсиь; следовательно, UT' = TCU. Тем самым доказано, что пред- ставления Т1 и Т эквивалентны. Далее, поскольку U отображает I на все X, существует е£1 такой, что Ue — Tex — x. Отсюда для любого 6£1 \J (be) = Tbex = Tb(Tex)Tbx = UA Но U — взаимно однозначное отображение; следовательно, be~b. Таким образом, е — правая единица в алгебре I, что и завершает доказательство теоремы. Заметим, что в качестве стандартного представления мы могли бы взять любое неприводимое представление простой алгебры. Поэтому автоматическим следствием доказанной теоремы является тот факт, что все неприводимые пред- ставления простой алгебры эквивалентны. 11.52. Лемма. Пусть А-—произвольная алгебра, и 12 — ее левые идеалы, обладающие правыми единицами со- ответственно ех и е'2, приче-м ae1=Q для любого а £ 13. Тогда в 12 существует правая единица е2 такая, что Ье2=0 для любого b £ Д. Положим е2=е2— Тогда для любого а £ 12 мы бу- дем иметь ае2==ае2—ае1е'2=а ввиду соотношений ае2 = « и аех = 0. Далее, для любого b £ Д имеют место равенства Ье2 = Ье'г — beYe’2^be'2—Ье'2 = 0, что и доказывает лемму. 11.53. Теорема. Левое регулярное представление про- стой алгебры разлагается в прямую сумму ее неприводимых представлений.
11.54] § 11.5. ЛЕВОЕ РЕГУЛЯРНОЕ ПРЕДСТАВЛЕНИЕ 367 Искомый набор минимальных инвариантных подпрост- ранств представления Т: А—>В(А) будем строить индук- тивно, доказывая на каждом шаге, что прямая сумма уже найденных подпространств обладает, как алгебра, правой единицей. В качестве первого подпространства зафиксируем любое минимальное инвариантное подпространство 1Х представления Т. Согласно теореме 11.52 обладает правой единицей ех. Пусть теперь найдены минимальные инвариантные под- пространства Jx, ..., такие, что левый идеал J'k = 1Х ф- +... + обладает правой единицей ек. В случае J^=A искомые инвариантные подпространства уже построены. В противном случае положим 5"к — {а£А: аек = 0\. Как легко видеть, J"k-—инвариантное подпространство представления Т, имеющее нулевое пересечение с J’k. Более того, поскольку любой элемент а£А представим в виде а — аек Ц- (а — аек), где aek£J'k и (а — аек)£3"к, алгебра А разлагается в пря- мую сумму J’k и Jk. Конечномерное инвариантное подпространство содер- жит некоторое минимальное инвариантное подпространство; обозначим его Идеал 1А+1 обладает согласно теореме 11.52 правой единицей e'k+1-, при этом, поскольку Ife+1sJ*, аек = 0 для любого a£Ift+1. Следовательно, по лемме 11.52 в Is+1 существует такая правая единица е'к, что Ье"к = О для любого a £ Jk. Положим ек+1 = ек Ц- е"к, тогда, как легко видеть, eft+1 — правая единица в идеале J^+1 = Ij + - - • + Ifc + Тем самым доказана законность индуктивного перехода от k к А+ 1. Алгебра А конечномерна, поэтому на некотором шаге мы получим набор минимальных инвариантных подпространств 1Ь . . ., 1т представления Т, дающих в прямой сумме всю алгебру А. Следовательно, левое регулярное представление алгебры А разлагается в прямую сумму ее неприводимых представлений, что и требовалось доказать. 11.54. Заметим, что попутно нами установлено наличие в простой алгебре правой единицы. В действительности имеет место более сильная теорема: Теорема. Простая алгебра обладает единицей,
368 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (Н.®1 Пусть А—простая алгебра н е —ее правая единица. Рассмотрим оператор Те в стандартном представлении Т: А —> В (X). Для любых х G X и а £ А Та (Тех -х) = Таех—Тах = 0. Следовательно, поскольку Т неприводимо и каждый нену- левой вектор обязан быть циклическим, мы получаем, что TgX — х = 0 для любого х£Х; иначе говоря, Та— тождест- венный оператор в пространстве X. Но тогда ТвТ(, = ТеТа = — Та для любого а£А, а значит, ввиду точности представ- ления Т и ае = еа = а. Отсюда е—единица в А, и теорема доказана. § 11.6. Структура простых алгебр В этом параграфе до конца будет решен вопрос о строе- нии простых алгебр. Для этого окажется весьма полезным следующее понятие. 11.61. Пусть X — линейное пространство, Ао—некото- рая подалгебра в В (X). Подмножество в В (X), состоящее из операторов, перестановочных со всеми операторами из- Ао, мы будем называть коммутатором алгебры Ао и обо- значать через Ао. Как легко видеть, множество Ао само образует подал- гебру в В(Х). Коммутатор этой новой подалгебры мы будем обозначать через Ао и называть вторым коммутатором ал- гебры Ао. Очевидно, Ао S Ао. 11.62. В произвольной алгебре А каждый элемент а£А определяет два оператора из В(А): оператор левого умно- жения Та, действующий по формуле Tab = ab, и оператор правого умножения Ra, задаваемый равенством Rab = ba. Операторы левого умножения, равно как и операторы пра- вого умножения, образуют, как легко видеть, две подал- гебры в В (А); обозначим их соответственно через A# и Ад. Лемма. Пусть алгебра А обладает единицей. Тогда А^ = Ag U Ад — Ад.
il.eaj § 11.6. СТРУКТУРА ПРОСТЫХ ЛЛГВВР 369 Возьмем S£A£, тогда для любых а, Ь(~А имеет место равенство S (ab) = STab = TaSb = a (Sb). Положив b=e, где е—единица в А, получим Se = aS(e). Следовательно, оператор S является оператором умножения справа на элемент Se£A, т. е. S£AJ. Таким образом, Al0 s AJ и, поскольку обратное включе- ние очевидно, А£ = А(. Равенство Azo = Ao доказывается совершенно аналогично. 11.63. Теорема. Пусть А — простая алгебра, Ао — алгебра операторов ее стандартного представления Т: А —> В (X). Тогда А0 = А0. Определенную выше алгебру AJ можно, очевидно, рас- сматривать как алгебру операторов левого регулярного пред- ставления Т: А—>В(А) алгебры А. Согласно теореме 11.53 это представление разлагается в прямую сумму некоторых неприводимых представлений ТЬ; А —► В (I,) (1 г m), причем, по теореме 11.51, каждое из этих представлений эквивалентно стандартному. Сказанное означает следующее: можно найти такой базис хг, ..., хп в пространстве X и такой базис /£й, . . ., в каждом из пространств 1,(1 ^CZ^C/я), что для любого а£А матрица оператора Та в базисе /’j1’, /»п, •••> /пт) всего пространства А имеет вид где в блоках по диагонали стоит матрица оператора Тв в базисе хь . . ., хп, а в остальных местах — нули. Из правила перемножения матриц вытекает, что матрицы, перестановочное со всеми матрицами вида (1), суть матрицы
370 ГЛ. И. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [Н.64 вида 5 = ^11 • • • $1т Sml • $тт (2) где в блоках (размера пхп) расположены матрицы, переста- новочные со всеми матрицами Та, agA. Рассмотрим теперь оператор Р £ Ао и его матрицу Р в базисе ,г1, хп. Тогда, очевидно, матрица Р Р перестановочна со всеми матрицами вида (2) и, следова- тельно, задает в базисе Д1’, Д1’, ..., /У пространства А оператор, принадлежащий второму коммутатору алгебры А^. Простая алгебра по теореме 11.54 обладает единицей. Следовательно, согласно лемме 11.62 А10 = Аг0 = А1о, а зна- чит, матрица Р задает в базисе Д1’, Уз1’, ..., /„т) опера- тор Р, равный Ть для некоторого Ь£А. Но тогда для того же b Р = Ть, и поэтому Р принадлежит алгебре Ао. По- скольку Р—произвольный элемент из Ао, теорема доказана. 11.64. Теперь мы в состоянии получить основную теорему о простых алгебрах. Теорема. (Первая структурная теорема.) Всякая простая алгебра изоморфна алгебре всех линейных операторов, действующих в некотором конечномерном прост- ранстве. Пусть А—простая алгебра, Т: А—>В(Х)— ее стандарт- ное представление. Достаточно показать, что алгебра Ао операторов представления Т совпадает с В(Х). Поскольку представление Т неприводимо, из леммы Шура немедленно следует, что коммутатор Ао алгебры Ао состоит из операторов, кратных тождественному. Но тогда второй коммутатор Ао совпадает со всей алгеброй В(Х). В то же
11-71] § Ц.7. СТРУКТУРА ПОЛУПРОСТЫХ АЛГЕБР 371 время по теореме 11.63 А0 = А0. Следовательно, А0=В(Х), что и требовалось доказать. Обратим внимание на следующее обстоятельство: в ос- нове всех рассуждений, которые привели к первой струк- турной теореме, лежит лишь тот факт, что всякая простая алгебра обладает точным неприводимым представлением. Следовательно, мы одновременно доказали и то, что любая алгебра, обладающая точным неприводимым представлением, изоморфна алгебре В(Х). Отсюда уже немедленно вытекает, что имеет место теорема, .обратная к теореме 11.41: всякая алгебра, обладающая точным представлением, является про- стой. § 11.7. Структура полупростых алгебр 11.71. В этом параграфе будет показано, что вопрос о строении полупростых алгебр полностью сводится к уже изученному вопросу о строении простых алгебр. Для этого окажется полезным ввести несколько новых понятий. Определение. Нормальным рядом алгебры А назы- вается цепочка алгебр А = 10 э 1Х э . . . э 1П 1„+1= (0), в которой каждая из алгебр является двусторонним идеалом предыдущей. Композиционным рядом алгебры называется такой ее нормальный ряд, в котором каждый из этих идеа- лов является максимальным (т. е. не содержащимся ни в каком более широком двустороннем идеале), а алгебра 1„ не содержит собственных двусторонних идеалов. Легко показать, что каждая конечномерная алгебра обла- дает композиционным рядом. Действительно, среди двусто- ронних идеалов конечномерной алгебры А существует мак- симальный; обозначим его 1Х. По тем же причинам алгебра 1Х содержит максимальный двусторонний идеал 12, 12 — идеал 13 с теми же свойствами и т. д. Поскольку исходная алгебра А конечномерна, через конеч- ное число шагов мы придем к некоторой алгебре 1„, уже не имеющей собственных идеалов. Таким образом, получен- ная цепочка A = IozdI1z> ... => 1пгэ 1„+1 = (0) является, очевидно, композиционным рядом алгебры А.
372 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ (11.72 11.72. Прежде чем перейти к специальным свойствам нормальных и композиционных рядов полупростых алгебр, докажем вспомогательное утверждение. Лемма. Для любого элемента а полупростой алгебры А существует элемент Ь£А такой, что любая степень эле- мента Ьа отлична от нуля. Доказательство. Согласно определению полупро- стой алгебры существует неприводимое представление Т: А—>В(Х) такое, что Тв^=0. Тогда для некоторого х 6 X, х=/=0, вектор _у = Тох отличен от нуля и, следовательно, является циклическим вектором неприводимого представле- ния Т (11.32). Поэтому найдется элемент Ь£А такой, что Ть^ = х, а значит, Tbax = Tb(Tax) = Tby = x. Это означает, что никакая степень оператора ТЬа, а следовательно, и эле- мента Ьа £ А не может равняться нулю, что и доказывает лемму. 11.73. Теор е м а. Нормальный ряд полупростой алгебры не содержит отличных от нуля тривиальных алгебр. Доказательство. Пусть А — полупростая алгебра; А = 10 = => ... => 1„ э 1л+1 = (0) — ее нормальный ряд. Не теряя общности, можно предположить, что алгебра !„ содер- жит элемент а, отличный от нуля. Для доказательства тео- ремы, очевидно, достаточно найти с g 1„ такой, что са^=0. По лемме 11.72 существует 6 g А такой, что любая сте- пень элемента Ьа отлична от нуля. Положим сл = (6а)2 -16 (k — 0, 1, . . ., п— 1). Индукцией по k доказать, что ск g 1л_х. Действительно, для А = 0 c0 = bab g ввиду того, что agl^ а возможность индуктивного перехода немедленно вытекает из очевидного соотношения ск+1 = скаск и того факта, что а€К+2- Таким образом, доказано, что элемент с = сп_1 принад- лежит алгебре 1„. Но са = (ба)2""1-1 Ьа = (Ьа)*п~' =/= 0. Тем самым теорема доказана. 11.74. Докажем еще несколько простых утверждений. Лемма. Пусть —нормальны ряд ал- гебры А, причем алгебра 12 проста. Тогда 12 является дву- сторонним идеалом в А. Доказательство. По теореме 11.54. алгебра 1г обладает единицей е. Поскольку е g Ir, для любого a g А
ii.7?j § 11.7. структура полупростых Алгебр 373 элементы ае и еа принадлежат 1Р Но тогда для любого ab = a (eb) = (ае) b С 12 и ba = (be) a = b (еа) £ 12, что и доказывает лемму. 11.75. Лемма. Пусть А—произвольная алгебра, I—ее двусторонний идеал, обладающий единицей. Тогда в А есть двусторонний идеал J такой, что А разлагается в прямую сумму I и J. Положим J = {a£A; ae — Q}, где е — единица алгебры I. Очевидно, J—левый идеал в А, причем, поскольку b = be-[- + (Ь— be) и b — be£J для любого Ь£А, имеет место раз- ложение A = I4~J. Осталось доказать, что J — правый идеал в А. Для любых а $ J и Ь £ А ab = abe-\-a (Ь — be). Поскольку be£\, be=.ebe, а значит, поскольку се = 0, abe — (ае) be = 0. Таким образом, ab = a(b — be), а следовательно, ab является произведением двух элементов из J. Тем самым ab£J, и лемма доказана. 11.76. Лемма. Пусть алгебра А разлагается в прямую сумму своих двусторонних идеалов 1 и J, причем I — макси- мальный двусторонний идеал в А. Тогда алгебра J не содер- жит собственных двусторонних идеалов. Пусть J' — двусторонний идеал в J, не совпадающий с J. Тогда алгебра J* = 14~ J' является двусторонним идеалом в А. Но I максимален; следовательно, J" = I. Отсюда J' = (0), и лемма доказана. 11.77. Сформулируем, наконец, основную теорему о строе- нии полупростых алгебр. Теорема. (Вторая структурная теорема.) Всякая полупростая алгебра разлагается в прямую сумму своих двусторонних идеалов, каждый из которых является простой алгеброй.
374 ГЛ. 1 1 . КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [11.77 Доказательство. Пусть А — полупростая алгебра. Как показано в 11.71, для нее можно построить компози- ционный ряд А=10 1Х = . . . 1„ => 1п+х = (0). Наша теорема, очевидно, содержится как частный слу- чай в следующем утверждении: (*) Для любого k, 0 k п, алгебра 1п_к разлагается в прямую сумму своих двусторонних идеалов, являющихся простыми алгебрами, и, кроме того, обладает единицей. Утверждение (*) мы будем доказывать индукцией по k. Алгебра 1„ не содержит собственных двусторонних идеа- лов и, согласно теореме 11.73, отлична от тривиальной. Следовательно, алгебра 1п проста и, в частности, обладает единицей. Это доказывает утверждение (*) для А = 0. Пусть теперь наше утверждение справедливо для неко- торого k, —1. Это означает, в частности, что алгебра \п_к содержит единицу, а следовательно, по лемме 11.75, I„_ft_x = + J Для некоторого двустороннего идеала J в In-fe-l- Поскольку ln_k — максимальный двусторонний идеал в In_ft_x алгебра J согласно лемме 11.76 не содержит собст- венных двусторонних идеалов. В то же время, применив теорему 11.73 к нормальному ряду А = 10 1Х гэ . . . =) I„_ft_x Э J D (0), мы получим, что эта алгебра не является тривиальной. Следовательно, она проста. По индуктивному предположению, алгебра l„_ft разла- гается в прямую сумму своих простых подалгебр, являю- щихся в ней двусторонними идеалами. Обладая единицей, эти же подалгебры согласно лемме 11.74 являются двусто- ронними идеалами также и в 1„_А._Х. Из этого факта и равенства + J немедленно следует, что требуе- мое разложение в прямую сумму простых подалгебр имеет место и для алгебры I„_ft_x. Осталось доказать существование единицы у алгебры I„_ft_x. Пусть <?х— единица алгебры 1п_к (она существует согласно индуктивному предположению), а еа — единица про- стой алгебры J. Поскольку ab=ba = 0 для любых а £
I1.78J § 11.7. СТРУКТУРА ПОЛУПРОСТЫХ АЛГЕБР 375 b = J, элемент е = е1-^е2 является, как легко видеть, еди- ницей во всей алгебре Таким образом, доказана законность индуктивного пере- хода, а с ней и все утверждение (*). Как уже отмечалось, наша теорема является частным случаем этого утверждения, именно, при k = n. Тем самым она доказана. Заметим, что мы одновременно установили тот факт, что всякая полупростая алгебра обладает единицей. Найденные в теореме двусторонние идеалы, дающие в пря- мой сумме заданную полупростую алгебру А, мы будем в дальнейшем называть простыми составляющими алгебры А. 11.78. В 11.64 было выяснено, что всякая простая ал- гебра изоморфна алгебре В(Х) для некоторого конечномер- ного пространства X, или, что то же самое, алгебре всех квадратных матриц некоторого размера. Пусть теперь X., . . , , Х„—некоторый набор конечно- мерных пространств. Обозначим через В(Х1, ..., Х„) мно- жество всех строк вида « = • • • , ап), где ak — оператор из алгебры В(Х^) (или, если угодно, ма- трица соответствующего размера). Очевидно, В(Х1; . . ., Хп) является алгеброй относительно «покоординатных» операций, определяемых равенствами Ха = (Xhj, . . ., Ха„), ab = (arbx, . . ., anbn), где а, b £ В (Хх, . . ., Х„), а = (а1; . . ., а„), b = (Ьу, ..., Ь„), К-—комплексное число. С учетом сказанного теорема 11.77 допускает следую- щую эквивалентную формулировку: Всякая полупростая алгебра изоморфна алгебре В (Xj,. .., Хн) для некоторого набора пространств Хх, . . ., Хп. Заметим еще, что простые составляющие алгебры В (Xi.....Хп) состоят, очевидно, из строк вида (0, ..., О, ай, 0, ..., 0), где k-я координата пробегает всю-алгебру В (ХА), а на остальных местах—-нули; мы будем каждую та- кую составляющую отождествлять с соответствующей ал- геброй B(Xft).
376 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ |П-79 11.79. В заключение этого параграфа мы найдем все дву- сторонние идеалы полупростой алгебры. Теорема. Всякий двусторонний идеал пол у прост ой ал- гебры представляет собой прямую сумму некоторого числа ее простых составляющих. Пусть А—полупростая алгебра; тогда согласно JJ.78 она изоморфна некоторой алгебре вида B(Xn .. ., Хл) с про- стыми составляющими В (Хй), 1 k п. Пусть теперь I — двусторонний идеал в В(Х1, ...,Х„). Обозначим через I* пересечение 1 с В(ХД Поскольку вме- сте с каждым элементом а=(аг, . . ак_1У ак, ак+1, .. .,ап), а£1, идеал I содержит и строку аек = (О, . . ., 0, ak, 0,. . ., 0), где et—единица вВ(ХА имеет место разложение в прямую сумму: 1= 1г + .. . Но для любого k, Ift как легко видеть, есть двусторонний идеал в простой алгебре В (Xft); следовательно, либо Ift = (0), либо Ift совпадает со всей B(Xft). Отсюда не- посредственно вытекает наше утверждение. § 11.8. Строение представлений простых и полупростых алгебр Знание структуры изученных типов алгебр позволяет без особого труда найти все их представления с точностью до эквивалентности. 11.81. Пусть А — полупростая алгебра; ввиду доказанного в предыдущем параграфе ее можно отождествить с алгеброй В (Хх, ..., Х„) для некоторого набора пространств Xft, 1^2 ^/г^л. Поэтому вместе с заданной алгеброй А естествен- ным образом возникают л ее представлений Т*: А —► В (Xft), 1^А^л, действующих по формуле Т^ = ак£В(Хк) для любого а С A, а = {а1, ...,ак, ...,ап). Поскольку образом представления Т* является вся алгебра B(Xft), все эти пред- ставления неприводимы. Т е о р е м а. Всякое неприводимое представление полу про- стой алгебры А эквивалентно одному из представлений Т* (1 л). Доказательство. Пусть А = В(Х1, ..., Х„) — полу- простая алгебра; Т: А —* В (X) — ее неприводимое представ- ление. Рассмотрим ядро Z (Т) представления Т. Будучи дву-
11.82] § 11.8. ПРОСТЫЕ И ЙОЛУПРОСТЫЕ алгебры 377 сторонним идеалом в А, это ядро по теореме 11.79 является прямой суммой нескольких простых составляющих алгебры А. Обозначим через Аг прямую сумму остальных, не вошед- ших в Z (Т) простых составляющих алгебры А, через Тш: А1—+ В(Х)— сужение на Aj исходного представления Т. Новое представление Тш уже является точным и, поскольку образы представлений Т(П и Т, очевидно, совпадают, является неприводимым. Алгебра А1, имея представление такого вида, должна быть простой (11.64). Следовательно, она сводится к одному лишь прямому слагаемому, т. е. совпадает с В(ХЛ) для некоторого k, Отсюда, как легко видеть, для любого а £ A, a — (ль . . ., ak, . . ., а„), та = т^, «*ёВ(ХА). Согласно теореме 11.51 все неприводимые представления простой алгебры эквивалентны; в частности, эквивалентны Ти>: В (Хл) —► В (X) и тождественное представление Т(2): В (Xfc) —В (X*). Это означает существование изо- морфизма U: X —> Xft такого, что UT<^ = T<2)U для любого aA£B(Xfc). Но по доказанному ТО = Т<А для любого а£А; с другой стороны, из определения представления Тк следует, что Т* = Т<2> Отсюда UT ==ТЮ для любого afA, что и доказывает эквивалентность представлений Т и Т*. 11.82. Перейдем к произвольным представлениям простых и полупростых алгебр. Окажется полезным следующее утвер- ждение общего характера. Лемма. Пусть А — произвольная алгебра, Т: А —► В (X) — ее представление, ХА, 1^&^л, — минимальные инвари- антные подпространства представления Т такие, что их ли- нейная оболочка совпадает с X. Тогда X является прямой суммой нескольких подпространств из этого набора. Пересечение инвариантных подпространств представления само является инвариантным подпространством. Поэтому из минимальности заданных подпространств следует, что для любого k пересечение подпространства Xft+1 с линейной обо- лочкой предшествующих подпространств Х^Х^есть либо са- мо Хй+1, либо нуль. Таким образом, последовательно выбирая из подпространств ХА те, которые не содержатся в линей- ной оболочке предыдущих, мы получим подпространства,
378 ГЛ. 11. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [11.83 дающие в прямой сумме всю линейную оболочку подпрост- ранств Xft, 1 т. е. все X. Тем самым лемма доказана. 11.83. Согласно второй структурной теореме всякая по- лупростая алгебра А изоморфна некоторой алгебре вида В (Хь . ..,ХП). В дальнейшем нам будет удобно рассматри- вать реализацию алгебры В (Х1; . . ., Хп) в виде алгебры строк из п матриц соответствующей размерности. Для элемента а С А число, стоящее на «/, /-м» месте в Л-й матрице соот- ветствующей строки, мы будем обозначать через А)*’ (а). Через будем обозначать тот элемент алгебры А, для которого X**’(е‘у’) = 1, а все остальные места в матрицах соответствующей строки заполнены нулями. Заметим, что 2^> = е, где е — единица алгебры А. i, k Лемма. Пусть Т: А—> В (X)—представление полу про- стой алгебры А. Пусть, далее, для некоторого х £Х и не- которых индексов i и k вектор у = Те^х отличен от нуля. Тогда у принадлежит некоторому минимальному инвариант- ному подпространству представления Т. Доказательство. Положим Y = {Та_у: а£А}. По- скольку v = Т (*) х, из правила перемножения матриц следует, и что любой элемент имеет вид г1 = Т6х, где b — неко- торая линейная комбинация элементов (г и k фиксиро- ваны). Достаточно показать, что в случае вектор zr-—циклический вектор в сужении представления Т на Y. Пусть £2£Y: аг2 = Тсх, где с—другая линейная комби- нация тех же элементов. Используя реализацию алгебры А в виде алгебры строк матриц, найдем элемент а £ А такой, что c = ab. Но тогда z2 = Tcx = Та (Tbx) = Taz1. Таким об- разом, вектор zr циклический, и лемма доказана. 11.84. Теорема. Всякое представление полупростой алгебры разлагается в прямую сумму неприводимых пред- ставлений и тривиального представления. Пусть А — полупростая алгебра, Т°: А—>• В (Х°) — ее представление. Рассмотрим оператор Т°, где е — единица в А. Для любого х 6 Х° равенство х = Тёх-р (х — Т°ех)
11.85] § 11.8. ПРОСТЫЕ И ПОЛУПРОСТЫЕ АЛГЕБРЫ 379 определяет, очевидно, разложение Х° в прямую сумму под- пространств X и Хо, инвариантных относительно Т°, причем сужение представления Т° на Хо является тривиальным пред- ставлением. Нам осталось доказать, что представление Т: А—► В (X) — сужение представления Т° на X — разлагает- ся в прямую сумму неприводимых. Выберем в X базис хх, ...,хт. Оператор Те — тождест- венный оператор в X, поэтому ввиду равенства е = ^е^’ линейная оболочка векторов вида Т <*> х, (по всем возмож- и 7 ным индексам i, j, k) совпадает со всем X. По лемме 11.83 каждый отличный от нуля вектор такого вида лежит в не- котором минимальном инвариантном подпространстве пред- ставления Т. Итак, мы находимся в условиях леммы 11.82. Но тогда пространство X разлагается в прямую сумму минимальных инвариантных подпространств представления Т, и, следова- тельно, само Т разлагается в прямую сумму неприводимых представлений. Тем самым доказательство теоремы закончено. 11.85. Теоремы 11.81 и 11.84 вместе описывают с точ- ностью до эквивалентности все представления полупростых (в том числе и простых) алгебр. Полученный результат показывает, в частности, что опе- раторы заданного представления простой алгебры (этот слу- чай мы выделяем для большей наглядности), записываются в некотором базисе матрицами вида М О О М (3) О где М пробегает всю совокупность матриц соответствую- щего размера. В более общем случае полупростой алгебры
380 ГЛ. И. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ Ц1.86 соответствующие матрицы суть матрицы вида М. 0 м, О (4) Мь о где стоящие в блоках матрицы , Мк, ... пробегают независимо друг от друга всю совокупность матриц соот- ветствующего размера (вообще говоря, разного для разных матриц). 11.86. Попутно нами получено описание всех простых и полупростых матричных алгебр, т. е. алгебр, которые сами состоят из матриц. Действительно, поставив в соответствие каждой матрице из такой алгебры задаваемый ею оператор (в любом базисе), мы получим тем самым точное представ- ление этой алгебры. Отсюда с учетом предыдущих рассуж- дений немедленно вытекает следующее утверждение: Всякая простая {соответственно полупростая) матричная алгебра состоит из матриц вида Р~х LP, где Р—некоторая фиксированная невырожденная матрица, a L пробегает сово- купность матриц вида (3) (соответственно вида (4)). Для алгебр с единицей результат получается еще более точным: Всякая простая матричная алгебра с единицей состоит из матриц вида P~lLP, где Р—фиксированная невырожденная
11.91] § 11.9. НЕКОТОРЫЕ ДАЛЬНЕЙШИЕ РЕЗУЛЬТАТЫ 381 матрица, a L — пробегает совокупность всех матриц вида МО ... О О /И ... О * О 0 ... /И где М пробегает всю совокупность матриц соответствующего размера. Всякая полупростая матричная алгебра с единицей состоит из матриц вида P~rLP, где Р—фиксированная не- вырожденная матрица, a L пробегает совокупность всех мат- риц вида Мг 0 ... О 0 0 мг м„ о ... о о о ... мк где матрицы ..., Мк пробегают независимо друг от друга всю совокупность матриц соответствующих размеров. § 11.9. Некоторые дальнейшие результаты Итак, мы закончили описание простых и полупростых конечномерных алгебр, а также их представлений. Дальней- шее исследование конечномерных алгебр уже выходит за рамки настоящей главы. Тем не менее полезно для перспек- тивы привести некоторые известные факты в этом направлении. 11.91. Теорема Веддерберна. Всякая конечномер- ная алгебра разлагается, как линейное пространство, в пря- мую сумму своего радикала и некоторой полупростой под- алгебры (см., например, Н. Джекобсон, Теория колец, ИЛ, 1947, стр. 220),
382 ГЛ. И. КОНЕЧНОМЕРНЫЕ АЛГЕБРЫ И АЛГЕБРЫ МАТРИЦ [11-92 11.92. Радикал конечномерной алгебры состоит только из нильпотентных элементов. Более того, для каждой такой алгебры существует натуральное п такое, что произведение любых п элементов ее радикала равно нулю (см., например, Н. Г. Чеботарев, Введение в теорию алгебр, Гостех- издат, 1949, § 8). 11.93. Всякое представление радикальной алгебры запи- сывается в некотором базисе матрицами с нулями на главной диагонали и ниже ее. (При этом, конечно, не утверждается, что матрицы операторов представления пробегают всю сово- купность матриц такого вида; см., например, А. Я. X е- лемс к ий, Об алгебрах нильпотентных операторов и свя- занных с ними категориях, Вестник МГУ, 1963, № 4, стр. 49—55.) ЗАДАЧИ 1. Доказать, что всякий левый идеал алгебры В (Ки) есть сово- купность всех операторов, нуль-многообразие которых содержит не- которое подпространство К' CZ К„. 2. Доказать, что всякий правый идеал 1 алгебры В (К„) есть со- вокупность всех операторов, область значений которых лежит в неко- тором подпространстве К'с?К„. 3. Указать все максимальные и минимальные левые и правые идеалы алгебры В (К„). 4. Для всякой полупростой алгебры В линейных операторов над пространством С„ ввести в С„ скалярное произведение так, чтобы из А£В следовало А*£В. 5. (Обращение задачи 4.) Если для некоторой алгебры В линейных операторов над пространством С„ существует такое скалярное произ- ведение (х, у) в Сп, что из А£В следует А*£В, то алгебра В полу- простая. 6. Если, при выполнении условий задачи 5, коммутатор В (11.61) пересекается с самой алгеброй В лишь по операторам, кратным еди- ничному, то В — простая алгебра. 7. Доказать, что коммутатор простой алгебры В, состоящей из матриц вида 11.85, распадающихся на т2 блоков АО ... О О А ... О 00 ... А
ЗАДАЧИ 383 представляется (в том же базисе) всеми матрицами вида Л-izE ... )чтЕ Х21£ . • к2тЕ ^miE km2E... hmmE где (j, k=l, — произвольные комплексные числа. В част- ности, пересечение В с В состоит лишь из матриц, кратных единичной. 8. У какой полуйростой матричной алгебры В ее коммутатор В совпадает с самой В? 9. Описать все коммутативные полупростые алгебры (В с: В). 10. Описать все полупростые матричные алгебры В, для которых В с: В. 11. Доказать, что для полупростой алгебры всегда В = В. 12. Алгебра В состоит из всех многочленов от одного оператора А (и, следовательно, коммутативна, так что В 3 В). Дать критерий ра- венства В = В. 13. Если алгебра В 0 состоит из нильпотентных элементов (т. е. для каждого AgB имеем Afe = 0 при некотором & = &(А)), то равен- ство сВ = В невозможно ни при каком eg В. 14. Алгебра В называется нильпотентной, если существует число р такое, что произведение любых р ее элементов равно 0. Показать, что алгебра В, являющаяся суммой своих правых идеалов Bj^ + .-. + B^,, нильпотентна, если нильпотентен каждый идеал Ву(/ = 1, ..., т). 15. Если конечномерная алгебра В состоит из нильпотентных элементов, то она сама нильпотентна. 16. Пусть В — нильпотентная алгебра операторов в пространст- ве К„. Пусть MjcK,i есть пересечение всех нуль-многообразий всех операторов AgB, далее, МгсК„ — пересечение всех подпространств, которые операторами AgB переводятся в Мп М3 tz К„ — пересечение всех подпространств, которые операторами AgB переводятся в М2, и т. д. Показать, что имеют место строгие включения 0 с Мх С М2 С ... С Мр = Кп, где р — индекс нильпотентности алгебры В, т. е. наименьшее число р такое, что произведение любых р операторов из В равно 0. 17. Для всякой нильпотентной алгебры В операторов в простран- стве К„ существует базис, в котором все операторы AgB записыва- ются матрицами вида А = 0 А12 А13 0 0 А»3 ООО ООО где р —индекс нильпотентности алгебры В (А. Я. Хелемский).
ГЛАВА 12 КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ § 12.1. Введение 12.11. В последнее время в различных областях матема- тики стали играть большую роль понятие категории и свя- занные с ним понятия*). Некоторая совокупность множеств с их отображениями друг в друга, некоторая совокупность линейных пространств или алгебр с их морфизмами — все это примеры категорий. Точное определение категории следующее. Пусть имеется некоторое множество 21 индексов а. Пусть, далее, имеется некоторая совокупность Я1 элементов Ха, называемых объ- ектами категории и для каждой пары объектов Х?, X, указано множество 23^ других элементов А?а, называемых отображениями объекта Ха в объект Х^. Предполагается, что при любых а, 0, у определено произведение имеющихся ото- бражений Aafj и А^2, которое является отображением Ха в Х7; при этом требуется, чтобы умножение отображений было ассоциативным, т. е. для любых а, 0, у, 6 А^ (А7?А?,) = (ASlAT?) А₽а. В частности, определено и множество 23aa отображений объ- екта Ха в себя самого. В этом множестве, следовательно, определено (ассоциативное) умножение отображений. Кроме того, требуется, чтобы множество 23aa содержало единичный элемент 1,, который обладает тем свойством, что 1 а Аар Аар, Ат, 1 a А7, *) См., например, А. Картан и С. Эйленберг. Гомоло- гическая алгебра, ИЛ, М., 1960; А. Гротендик. О некоторых вопросах гомологической алгебры, ИЛ, М., 1961; А. Г. Курош и др. Основы теории категорий, УМН, № 6, 3—52, 1960.
12.12] § 12.1. ВВЕДЕНИЕ 385 при любых а, Р и у. Будем далее вместо 23яя писать ко- роче 23я. Совокупность объектов Ха и отображений А , обладаю- щих перечисленными свойствами, и образует, по определе- нию, категорию. Категория й называется линейной, если в совокупно- сти отображений А^я (с любыми фиксированными а и Р) определены операции сложения отображений и умножения их на числа (из поля К), превращающие совокупность 23^, в линейное пространство над полем К. В линейной категории совокупность 23я представляет собой алгебру с единицей (над полем К). 12.12. Мы рассмотрим в этой главе линейные категории, элементами которых являются линейные конечномерные про- странства над полем С комплексных чисел, а отображе- ниями— линейные отображения (морфизмы) одного такого про- странства в другое. Итак, мы исходим из следующего определения. Имеется некоторое множество линейных конечномерных комплексных пространств Хя(а£21). При каждом а в про- странстве Ха задана алгебра 23я линейных операторов, пере? водящих Хя в себя. Для каждой пары индексов 0, а задано семейство 23?я линейных операторов А?я, переводящих X, в Хр, содержащее вместе с каждыми двумя операторами А^я и ВрЯ их сумму АрЯ 4- Вря и вместе со всяким оператором А^я его произведение ЛАрЯ на любое комплексное число Л; такое семейство линейных операторов будем в дальнейшем называть линейным, семейством. В частности, линейное семейство 25яя совпадает с алгеброй ®я. Предполагается, что для любых а, Р, у выполнено условие 23тДяа2\я, (1) т. е. любое произведение А^А^ (Атр £ 2?т?, Ара^23ря) лежит в Совокупность пространств Ха с алгебрами 23я и семей- ствами 23₽я будем называть категорией конечномерных про- странств, или просто категорией, и обозначать через Я1. Если в каждом пространстве Хя выбран как-нибудь базис, то алгебры 23я и линейные семейства можно отождест- вить соответственно с алгебрами и линейными семействами
386 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.13 соответствующих матриц, что мы в дальнейшем будем систе- матически использовать. В этой главе мы выясняем, какими могут быть категории линейных пространств при заданных алгебрах Мы огра- ничиваемся полупростыми алгебрами 95а. В силу 11.86 для полупростой алгебры пространство Ха может быть разбито в прямую сумму подпространств Ха/-, инвариантных относи- тельно всех операторов А причем в каждом подпрост- ранстве X алгебра есть простая алгебра с едини- цей, т. е. в некотором базисе она записывается матрицами вида С С • > с где С пробегает всю совокупность матриц соответствующего размера. Мы начинаем с разбора нескольких частных случаев, которые позволят затем сформулировать и общие резуль- таты. В § 12.2 рассматривается случай, когда каждая алгебра есть полная алгебра, т. е. алгебра всех линей- ных операторов, действующих в Х„. Противоположный слу- чай, когда каждая из этих алгебр есть алгебра операторов {ЛХ}, кратных единичному, разобран в § 12.3. Результаты § 12.4 относятся к случаю простых алгебр 23а, который является естественным обобщением случая алгебр {XX}. В § 12.5 речь идет о случае, когда каждая алгебра есть алгебра всех диагональных матриц. В § 12.6 общая катего- рия приводится к разобранным в предыдущих параграфах. 12.13. Напомним обозначения и правила действий с мат- рицами линейных операторов, отображающих линейное про- странство X в линейное пространство Y {4.41—4.43). Пусть имеется л-мерное пространство X с базисом ех, ...,еп и /м-мерное пространство Y с базисом /1Т Линей- ному оператору А, действующему из X в Y, мы ставим в соответствие тх«-матрицу (т. е. матрицу из т строки
12.14] § 12.1. ВВЕДЕНИЕ 387 п столбцов) а11 а12 • • а1п ^21 ^22 • • • @2ri &ml «m2 • • • где в k-м столбце стоят числа а1к, а2к, .. ., атк, представ- ляющие собой коэффициенты разложения вектора Aeft£Y по базису Д, . . ., fm. Пусть, далее, имеется A-мерное пространство Z с бази- сом gr, ...,gk. Оператору В, действующему из простран- ства Y в пространство Z, ставится в соответствие Ах/»-мат- рица ^11 ^12 • • • Ь1т g __ ^21 ^22 • • • Ь2т bkl ^2 • • ^km Оператор С = ВА действует из X в Z. Ему отвечает А X «-матрица С11 С12 • • • С1и С21 С22 • • • С2п Ckl ck2 Ckn Эта матрица получается из матриц# и А с помощью опера- ции умножения: cpg = ^bpJaJq, р=Х, </=1, ..., п. 12.14. Напомним следующий факт, который будет часто полезным (4.44). Лемма. Пусть дана прямоугольная пхт-матрица А = || apq || (л строк, т столбцов; р = 1, . . ., л; q = 1, . . ., т). Если умножить матрицу А справа на прямоугольную m Xk-матрицу В=||А„||, где все элементы brs, кроме ЬГо$а, равны 0, a broSo=l, то получится прямоугольная nxk-мат- рица F, в которой все столбцы, кроме s0-eo, будут равны
388 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ пространств [12.15 нулю, а в s0-m будут стоять элементы г0-го столбца матри- цы А. Если матрицу А умножить слева на прямоугольную lXn-матрицу С=||с„||, где все элементы crs, кроме criSi, равны нулю, a criSl = \, то получится прямоугольная lxm-матрица, все строки которой, кроме r-й, будут равны 0, тогда как в гх-й строке будут стоять элементы s^-й строки матрицы А. 12.15. Как следствие получаем: если прямоугольную n X да-матрицу А умножить справа на да X ^-матрицу В, а слева на /X «-матрицу С с указанными свойствами, то в получен- ной IX Zs-матрице D будет отличен от нуля (возможно) только один элемент, именно, стоящий на скрещении гх-й строки и а0-го столбца, а этим элементом будет элемент aSira исходной матрицы А (т. е. находившийся в ней на скреще- нии Sj-й строки и г0-го столбца). § 12.2. Случай, когда все данные алгебры 99а—полные 12.21. Пусть категория Я состоит из конечномерных линейных пространств Хя, причем алгебра операторов, дей- ствующих в Ха, при любом а есть полная алгебра, т. е. алгебра всех линейных операторов в Ха. Фиксируя произвольно базис ег, .. ., еп в пространстве Хх и Д, ..., f„ в пространстве Х2, мы можем отождествить операторы из совокупностей 33и, Э312, 3321, ЗВ22 с соответствующими им матрицами. Пусть размерность пространства XL равна да и размер- ность пространства Х2 равна п. Предположим, что в сово- купности 5321 имеется ненулевой оператор А и ему соответ- ствует прямоугольная лXда-матрица А=|| apq\\, в которой по крайней мере один элемент, например лРо9о, отличен от нуля. В этом случае можно считать aPa4is = 1. По условию (1) и нашему предположению и 23а суть полные алгебры матриц), произведение матрицы А справа на любую квадрат- ную да X да-матрицу и слева на любую квадратную л X «-ма- трицу снова принадлежит семейству 3321. Однако в силу леммы 12.14 в результате такой операции мы всегда можем получить л X да-матрицу с единственным отличным от нуля элементом 1 в любом наперед заданном месте. Так как линей-
12.22] § 12.2. ВСЕ ДАННЫЕ АЛГЕБРЫ полные 389 ная комбинация таких матриц дает любую п X /«-матрицу, то Э321 содержит все эти матрицы, т. е. представляет собой полную совокупность операторов, действующих из Хх в Х2. 12.22. Мы свяжем сейчас рассматриваемую категорию с некоторым частично упорядоченным, множеством. Введем соответствующее определение: множество 5" называется час- тично упорядоченным, если для некоторых пар А, В его эле- ментов установлено соотношение, обозначаемое знаком (меньше или равно), причем выполнены следующие ак- сиомы: а) Если А^.В и В^.А, то А = В. б) Если А^В, В^С, то А^С. в) Всякое А^.А. Несколько более обшим понятием является понятие пред- частично упорядоченного множества. Мы будем так называть множество с отношением удовлетворяющим лишь аксио- мам б) и в). Если при этом А^.В и В^.А, то А к В называются эквивалентными, что обозначается знаком А~В. Проверим, что из А~ В и В ~ С следует А ~ С. Действи- тельно, из А^.В, В^С следует, по б), также А^.С и из С^В, В^А следует СА,.так что А~С. Поэтому отно- шение ~ позволяет разбить все множество 5 на классы 31, 33, ... ; каждый класс содержит вместе с элементом А все ему эквивалентные, и элементы А, В, принадлежащие к разным классам, не эквивалентны. Теперь введем отношение уже для классов 31, 53. Именно, будем считать, что 31 53, если существуют A^^l, Bg33 такие, что Л^В. Это определение не зависит от выбора элементов Л £81 и В £33; действительно, пусть, кроме того, Л3 £ 31, В3£33, так что A~Alt В ~ Bv Тогда мы имеем Л1^Л^В^В1, откуда Л1^В1, что и требуется. Выполнение свойств б) и в) частично упорядоченного множе- ства для классов 3(, 33, ... теперь следует из выполнения этих свойств для элементов А, В, .. . Покажем, что для классов 31, S3, . .. выполнено и свойство а). Пусть 51 33 и 33 31; выберем произвольно Л £31 и В £33. Мы имеем Л^В и В^Л, так что Л и В эквивалентны. Но тогда классы 31 и 33 совпадают, 31 = 33, что и требовалось. Итак, введя в пред-частично упорядоченное множество 5, как указано, отношение эквивалентности, мы -приходим к
390 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.23 частично упорядоченному множеству классов эквивалентных элементов. 12.23. Возвращаемся к рассмотрению нашей категории. Из 12.21 следует, что для пары пространств Xt и Хг мы имеем четыре возможности: а) 5В12 и 3321— обе суть полные совокупности операторов; б) 3312 есть полная совокупность, Э321 состоит только из нуля; в) 3321 есть полная совокуп- ность, Э312 состоит только из нуля; г) -В12 и 3?21 состоят только из нуля. Если Э312 есть полная совокупность, а относительно ®21 не делается никаких предположений, будем писать Хх Х2. Аналогичный смысл имеет запись Х2^.Х1. Покажем, что введенное таким образом отношение превращает категорию Я в пред-частично упорядоченное мно- жество. Действительно, для данного Хх мы имеем по усло- вию, что 33п — полная совокупность операторов, поэтому Х1<2Х1. Далее, если ХГ^Х2 и Х.г^Х.Л, то ®12 и -Б23 являются полными совокупностями линейных операторов, дей- ствующих из Xi в Х2 и соответственно из Х2 в Х3. Так как все наши пространства имеют размерность 1, то в совокуп- ности -В13 имеется оператор, отличный от нулевого. Такой опе- ратор можно получить, фиксируя ненулевые векторы el g Х1( е2 £ Х2, е3 g Х3, как произведение операторов АВ, где А £ Э312 переводит е2 в ех, а В^®23 переводит е3 в е2. По 12.21 совокупность 2313 есть полная совокупность операторов, переводящих Х3 в Хх, так что Х!^Х3. Итак, аксиомы б) и в) выполнены, категория Я1 превращена в пред-частично упорядоченное множество. 12.24. В соответствии с 12.22 введем отношение экви- валентности, считая, что Xt-~X2, если Х2^Хх, Хх^Х2, т. е. если обе совокупности Я\2 и £>21— полные совокуп- ности соответствующих линейных операторов. Тогда сово- купность пространств Ха разбивается на классы взаимно эквивалентных пространств, и совокупность этих классов, с указанным в 12.22 отношением становится частично упорядоченным множеством. Обратно, любое частично упорядоченное множество классов конечномерных пространств определяет категорию рассматриваемого типа. Именно, для пространств Хх и Х2,
12.32] § 12.3. ВСЕ ДАННЫЕ АЛГЕБРЫ ОДНОМЕРНЫЕ 391 входящих в один и тот же класс, мы задаем совокуп- ности 3312 и Э321, как полные совокупности операторов; для пространств Х4 и Х3, входящих в классы и Л'3, связан- ные отношением <-¥3 (т. е. но .^=/=^3), мы задаем З513, как полную совокупность, и 3381, как состоящую только из нуля. Если же Х4 и Х4 входят в несравнимые классы и Л'4, то мы задаем 3314 и 2341, как состоящие только из нуля. Этим описание категорий рассматриваемого типа закон- чено. § 12.3. Все данные алгебры 58а—одномерные 12.31. Рассмотрим вначале два простых примера. а. Категория состоит из двух пространств Х4 и Х2 одинаковой размерности. Система 3521 представляет собой один оператор А, отображающий взаимно однозначно Х4 на Х2, со всеми его кратными ХА, Х£С. Система ^12 пред- ставляет собой один оператор В, обратный к А, со всеми его кратными цВ, р € С. Очевидно, что ад21 = (ХХ), ®21Э312 = (ХХ). б. Категория Я2 состоит из двух произвольных про- странств Х4 и Х2, в которых фиксированы подпространства Х[ G Х4 и Х'2 G Х2. Система '3321 состоит из всех операто- ров, переводящих Х4 в Х2 и при этом XJ в (0). Система 2312 состоит из всех операторов, переводящих Х2 в Х[ и одно- временно Х2 в (0). Очевидно, что 93125В21 = 0, 23213312 = О. Мы покажем, что категориями Я4 и в основном исчер- пываются все категории из двух пространств с JJ3Z = (XE) (/== 1, 2), а именно, для любой категории Я1 имеет место альтернатива: или 23123321 = 0 — в этом случае и ^21^12 — = 0, и категория Й содержится в некоторой категории типа Я2, или размерности пространств Х4 и Х2 равны и кате- гория Я есть категория типа Я4. 12.32. Пусть дана некоторая категория Й из двух про- странств Х4 и Х2 с условиями 234=(ХХ), 932 = (ХХ). Обозначим через N4 с Xt пересечение нуль-многообра- зий (4.62) всех операторов А12£9312 и через N2 а Х2 пере- сечение нуль-многообразий всех операторов A21g332]. Если
392 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ пространств [12.32 Я5а1Хх <z N2 и Э512Х2.с Nx, то мы имеем дело с подкатегорией категории типа Я'2, в которой Xx = Nx, X2 = N2. Поэтому предположим, что, например, $В21Хх не содержится в N2 и, следовательно, есть вектор хх^Хх и оператор А2ХС552Х, для которого А2Хх = х2 не принадлежит N2. Покажем, что все операторы В21 £ Й?21 переводят век- тор хг в вектор, коллинеарный х2, и все операторы С12 £ 2512 переводят х2 в вектор, коллинеарный хх. Действительно, пусть А21хх = х2, В21хх=у2. Рас- смотрим оператор С{2£-©12,для которого С?2х2^=0. Тогда в силу основного условия С?2х2 = С?2А21хх = %хх, причем Х=/=0. Заменяя CJ2 его кратным, можем считать, что Х=1. Далее, B21CJ2x2 = B21xx=y2, и в то же время В2ХС?2х2 = цх2; таким образом, у2 = цх2. Так как, обратно, х1 — С12х2 и, по определению вектора хх, он не содержится в Nx, мы имеем аналогично C12x2 = |ixx при любом СХ2€25Х2. Покажем, что в данном случае Nx и N2 сводятся к нуль- вектору. Пусть zx£N.x; тогда А21(хх4-гх) = А21хх = х2, т. е. вектор хх в предыдущем построении может быть заменен на х14-д1. В таком случае С?2х2 есть кратное и хх и хх + гх, так что хх и дх коллинеарны. Так как xx^Nx, то д1 = 0. Итак, Nx=(0). Аналогично, начиная с х2, получаем, что и N2 = (0). Теперь мы видим, что в качестве хх можно было взять любой ненулевой вектор пространства Хх, поскольку всегда имеется оператор А2Х^Э52Х, переводящий хх не в нуль. Следовательно, операторы семейства 3?2Х устанавливают взаимно однозначное соответствие между всеми прямыми про- странства Хх и некоторой совокупностью прямых простран- ства Х2; более того, даже с совокупностью всех прямых пространства Х2 в силу симметрии нашего построения. Теперь покажем, что вся совокупность ^2Х сводится к се- мейству кратных одного оператора. Пусть хх=/=0 есть произ- вольный вектор в пространстве Хх и х2—ненулевой вектор, определяющий соответствующую хх прямую в пространстве Х2. Мы знаем, что имеется оператор А21, переводящий хх точно в х2. Всякий другой оператор А2Х С ®2i переводит хх в Хх2. Пусть сначала А21хх=Хх2 и X 0. Тогда оператор В2Х = у- А2Х переводит хх точно в х2. Покажем, что В2Х совпадает с А^х всюду. Пусть А21ух=у2, В21ух = г2 ^=у2; это возможно или
12.33] § 12.3. ВСЕ ДАННЫЕ АЛГЕБРЫ ОДНОМЕРНЫЕ 393 при у2 0, z2 = цу2, |i 1, или при у2 = 0, z2^= 0. Рас- смотрим ненулевой вектор гх = ахх + рух, а =/=(), Р#=0. Векторы и B21zlt по доказанному, коллинеарны; но в дан- ном случае это не может иметь места, поскольку при У г 0 А“1 (ахх + ₽ух) = ах2 + Р_у2, В21 (ахх + ₽ух) = ах2+ p|iy2, а при у2 = 0 А®! (ахх + Рл) = «А, B2i (ах1 + Ра) = а*2 + Р^г- Таким образом, если А21хх = Хх2, X =/=(), то А21 = ХА^х. Пусть теперь А21хх = 0; тогда, по доказанному, А^-|-А2Х== =А21и, следовательно, А2Х = 0. Итак, семейство Я32Х сводится к семейству кратных оператора А21. Аналогично и семей- ство $В12 сводится к семейству кратных фиксированного опе- ратора ВХ2. Произведения А^ В?2 и В?2 А^ отличны от нуля и, по основному предположению, дают операторы, крат- ные Е. Поэтому А21 и В?2 можно считать взаимно обратными операторами; но это возможно, лишь если пространства Хх и Х2 имеют одинаковую размерность. Мы пришли к выводу: всякая категория, не являющаяся подкатегорией категории типа Я2, есть категория типа йх. 12.33. Категориями типа $х и не исчерпываются воз- можные категории с двумя пространствами и 93х = (ХЕ), 352 = (ХЕ). Действительно, если из совокупности S32X катего- рии $ типа й2 мы выберем линейную подсовокупность, не увеличивая Nx и не уменьшая N2 (например, наложив на элементы матриц операторов А2Х подходящее дополнитель- ное линейное однородное условие), то получим категорию й', удовлетворяющую поставленным условиям, но не совпадаю- щую с й1. В частично упорядоченном по включению множестве всех категорий с 2^-= (ХЕ) (/=1,2) категории типа Я2 характеризуются тем, что они максимальны; иными словами, каждая категория типа $2, за исключением вырожденных случаев, когда Х2 = (0) или Х[ = (0), не может быть рас- ширена с сохранением свойств категории и условий SBy- = (XE). Действительно, допустим, что категорию Я' типа Й2 можно расширить добавлением оператора А21, принимающего на некотором хх£Хх—Х[ значение у2(£Х2. Допустим, что Хх =/= 0. Возьмем оператор В?2 £ 23Х2, переводящий у2 в
394 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ пространств [12.34 ненулевой вектор х( £ X). Тогда В?2А^ х1 = х'1, что противо- речит условию. Далее, пусть к категории Я добавлен оператор А21, пере- водящий вектор хг^Х( не в нуль, а, например, в вектор j2gX2. Ясно, что Х2=/=Х2, иначе было бы Xj = 3312 Х2 = = )В12 Х2 = (0) и указанного вектора х1г переводящегося не в нуль, не могло бы существовать. Поэтому в Э312 имеется оператор В12, переводящий вектор j2$X2— Х2 в xt. Тогда А21В12у2 =у2, чт0 противоречит условию. Аналогично, предполагая Х2 = 0, получаем, что нельзя добавить ни одного оператора к совокупности $В12. Итак, рассматриваемая категория Я' типа Я2 максимальна в пред- положении, что Х2=/=0 и Х2 0. 12.34. Случаи вырождения нужно рассмотреть отдельно. Пусть, например, Х( = 0, так что 3312 состоит только из нулевого оператора. Если теперь Х2^=Х2, то категория не максимальна и в совокупность 3321 можно добавить без на- рушения условий ЭЗу-=(2сЕ) все операторы, действующие из Xj в Х2. Таким образом, получается «тривиальная» макси- мальная категория, где 3312 = (0), а 3321 — полная система операторов, действующих из в !й2. Аналогичная макси- мальная категория получается с 3321 = (0) и 3312—полной системой. В результате мы получаем, что общая категория типа Я2 максимальна при условиях: 1) Х2 =/=(), Х2 =/=(), 2) х;=о, х; = х2; з) х;=хъ х'=о. 12.35. Мы переходим теперь к общему случаю категории из любого числа пространств {Х„}, Здесь имеет место утверждение, аналогичное доказанной нами альтернативе (12.32). Альтернатива. Если = . . . = ^ = (ХЕ), то или произведение к_г ... ®323321 = 0, или пространства Х1; ...,Хк имеют одинаковую размерность и ЭЗ,-у- = {ХА/у}, где Njj—фиксированный обратимый оператор, причем k-i • А32А21 = Е. Доказательство. Допустим, что произведение 93lft ft-1. . .2321 содержит ненулевой оператор, равный, сле- довательно, ХЕ с X =/=(). Пусть размерность пространства Ху. есть гу; тогда матрицы А1(5 £ ..., А21 £ $21, дающие
12.36] § 12.3. ВСЕ ДАННЫЕ АЛГЕБРЫ ОДНОМЕРНЫЕ 395 в произведении ХЕ, имеют размеры 'ЧХ'к, гкхгк_!......Г3ХГ2, г2Х1\. Рассмотрим произведение матриц -Аза- Эта мат- рица, имеющая размеры гххг2, действующая, следовательно, из Х2 в Хх. Рассмотрим категорию из двух пространств Хх, Х2, где совокупности операторов 33и Й2°1 следующие: ^л = ^21, = (3?х* —линейная оболочка соответствующих произведений). Так как, по условию, Аг/Лл,*-!- -А21 = ХЕ, то, по доказанному, Хх и Х2 имеют одинаковую размерность гг = г.2, ОЗ,0, = 332Х = (ХА^), где А2’х—обратимая матрица £)12= =(ЦА?Г1)- Далее, мы имеем А?1 ^Ik^k, &-!••• ^32 ~ а рассуждая, как и раньше, получаем, что г2 = г8, *В33 = ХА£2, где А!|а — обратимая матрица. После k шагов приходим к требуемому утверждению. 12.36. В дальнейшем, рассматривая категорию из N про- странств, мы можем предполагать, что все циклические произведения ЗВ равны нулю; в противном случае мы просто отождествили бы соответствующие пространства одинаковой размерности. Рассмотрим вначале следующую конкретную категорию, которую будем обозначать Выберем в Хх произвольно Af—1 подпространств, которые обозначим Хх2, ..., Ххлг. При попарно различных /, k, I, ... положим ^1/* — п кхк, —^1/ п х1к л и т. д., образуя последовательно пересечения пространств Хху по два, по три и т. д. Если N конечно, последним пере- сечением будет Х12 _N—пересечение всех N—1 выделенных подпространств, если N бесконечно, последнего пересечения не будет. Такое же построение проведем во всех остальных пространствах Х2, . . . , причем индекс всего пространства будет первым индексом в обозначении всех его подпространств.
396 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.37 Каждой системе попарно различных индексов /,..., k теперь отвечает однозначно некоторое из выделенных подпро- странств. Построим совокупность 332Х. По определению она состоит из всех операторов, переводящих Хх в Х2 так, что каждое из подпространств ХХу. к переходит в Х21у. ft, если в последовательности нет индекса 2, или в (0), если в ней индекс 2 имеется. Аналогично построим все со- вокупности Докажем, что мы получили категорию. Пусть имеются некоторые операторы А21 £ 3521 и В32 £ Э332. Рассмотрим оператор В32А21. Он переводит пространство Хх в Х3. Подпространство Х1у- к оператор А2Х переводит в X2Xy...ft, а полученное подпространство оператор В32 пере- водит в Х321у-...ftcX3Xy ь. Таким образом, оператор В32А2Х входит в ®зх, что и требуется. Если имеется цепь операторов Ах/ AftX, переводящая пространство Хх в себя, то результирующий оператор пере- водит Хх в Хх- ftX== 0, что и согласуется с требованием 2Jx = (XE). 12.37. Покажем теперь, что любая категория из оо пространств Хх> . с 53у=(%Е) содержится в некоторой ка- тегории типа ^2- Обозначим через ХуА. полный образ про- странства Xft в пространстве Ху под воздействием всех опе- раторов 2Jyft и далее через \jkl sm полный образ в про- странстве Ху пространства Хот под воздействием всех опе- раторов вида XJkkhi ^Xsm (порядок индексов существен!). Покажем, что Xy-ftZ.содержится в пересечении Xy-ft, Xyi, ‘ .. ...,Хуи. Действительно, если z£Kjkl ^Sm, то гб2А/“Ам-..А^...АМ, а где Zm^m, или д = 2а^...а“^“, а где ,у“ = 2-•-AsmZmEX", а так как A“ft . ..А“? С 2К, то a J4 z^Xj-g, что и требуется. Заметим, далее, что А,-у- переводит Ху- m в Х,-у- т. Те- перь ясно, что наща категория содержится в категории типа
12.41] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 397 $2 с определяющими подпространствами Xy.fc; в частности, все максимальные категории должны иметь тип Неясно, однако, при каких условиях на подпространства X/ft категория типа является максимальной. (Напомним, что в случае двух пространств Хг и Х2 необходимые и доста- точные условия максимальности категории й2 состояли в том, что пространства Х12 и Х21 либо оба отличны от нуля, либо одно есть нуль, а другое—все пространство.) § 12.4. Все данные алгебры Я9а — простые В этом случае каждая алгебра 35а в некотором базисе записывается матрицами вида (2) где С—одна и та же матрица фиксированного размера гл, причем во всем она пробегает всю совокупность квадрат- ных матриц с га строками и столбцами (11.86). 12.41. Рассмотрим вначале категорию Я" из двух про- странств Хх и Х2 размерностей пх и л2 с размерами квадра- тов т1 и т2 и числом их kl и k2 (так что nl — п2 = k2m2). Матрица Л21 категории может быть разбита на блоки сле- дующим образом: А
398 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ 112.41 Аналогично можно представить матрицу ^312: Мы утверждаем: или произведение Л215912 = 0 (при любых ^2i€^2i и ^12 €^12), или ^1 = ^2 и все матрицы Ajk явля- ются кратными одной (произвольной) фиксированной матри- цы А, равно как и все матрицы Bjk являются кратными од- ной (произвольной) фиксированной матрицы В; при этом коэф- фициенты кратностей образуют взаимно обратные матрицы порядка k1 = k2. Категорию второго типа будем обозначать в дальнейшем через ^3. Для доказательства заметим, что в категорию Я" вместе с матрицами Л2т и ^12 входят их произведения (с соответ- ствующей стороны) на матрицы Сг и С2 вида (2), поэтому наряду с равенством ^215912 = ^-2 имеет место и равенство ^21^-1^12 — (-2 с произвольной матрицей Сг вида (2). Вспоминая правило умножения блочных матриц (4.51), мы можем написать урав- нения (в блоках): АцСВц Д12СВ21 AikCBk j — = Д21СТ?12 А22С7?22-j- . . . А2кСВк^ — = 4tlCBWi + AMCB2A>+ . . . +AkikCBw > AnCB12 + A12CB22 + .. . + AuCBk2 = 0 (3) Возьмем в качестве матрицы С матрицу, имеющую един- ственный ненулевой элемент 1 на скрещении r-й строки и s-го столбца (г^тк, Вообще, если А — любая /»2Х /^-матрица, а В — любая т1 X /м2-матрица, то произве- дение АСВ есть тп2х/я2-матрица первого ранга, у которой
12.41] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 399 на скрещении р-й строки и q-ro столбца стоит элемент aprbsq. Поэтому равенства (3) можно переписать в форме /у11/)11 Д-«12/)21 1 _1_ — UprOsq Т U-prO sq T • • • "Г apr ^sq — ___ 21,12 , 22.22 i । ^2fe,.*i2 — u-prUsq । ^pr^sq —h <*рг ™sq — .................................................... (4) ___ *2! tl*2 I „*22<2*2 , I „*2*1A*X*2 — 4pr Osq "T apr Osq T • • • “Г apr Vsq > „11lI2 l „12.22 i , l*1A*i2 n Aprbsq 4“ G-prbsq “r • • • ~t~ ®pr — O, где индексы наверху означают номера соответствующих матриц. Уравнения (4) можно трактовать как матричное равенство Aprbsq а11 а12 ирг ирг 21 22 арг арг „i*t * • О'рг а2к' ирг ,11 Ь12 Ь1*' "sq Osq • • "sq <21 ,22 а2*; bsq bSq . . . b^q ak^ akl2 ak‘kl Upr Upr • • . Upr X I /Л» </S(? usq L kfk’ ... b^ Г’ Л k, Аналогично имеет место и равенство & sq Apr fcH Al2 ^sq bSq . . . Usq .21 »22 ,2k3 bsq bSq . . . bSq Upr a^r .12 &pr л22 &pr „1*1 • • ^-pr • • &pr д/12 Usq "sq •. • • "sty kii apr apr Apr Мы видим, что матрицы Apr метры этих матриц) образуют и Bsq (р, г, s, <7—пара- категорию, связывающую
400 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.42 пространство Ег размерности kr с пространством Е2 размер- ности k2 при условиях /?!= (ХК), /?2= (рК). Мы можем теперь применить альтернативу, установленную в 12.32. Именно, если то на самом деле всегда Х = 0, р = 0; если же мы допускаем, что хотя бы при одной системе индексов р, q, г, s получается Х=/=0 (или р #= 0), то kr — k2 и все матрицы Арг представляют собой кратные одной обратимой матрицы, а все матрицы J3sq—кратные обратной матрицы: Apr ~ = ]lsqB. Матрица Арг состоит из элементов матриц Ац, находящихся на скрещении р-й строки и г-го столбца. Мы видим, что выполняется условие а%г = где aij — элементы мадрицы А. Поэтому мы приходим к вы- воду, что все матрицы А^ являются кратными фиксирован- ной матрицы А — || Крг || с коэффициентами аи. Аналогичный вид имеют матрицы чем и завершается доказательство нашего утверждения. 12.42. Итак, если </Z135921 =5^ 0, то kv = k2 и категория SS имеет вид а12Л| . Л21 — а21Л ... а*11 Л ... • |а*ЛЛ 6127И| . . . jb^M ^12 ~ bzlM bk^M . . \bk‘k>M Матрицы Л =11X^11 и М прямоугольные: 1^р^/»2, 1 q mr. Среди матриц Л, участвующих в данной кате- гории, имеется ненулевая Ло (поскольку 332rBi2 =И= 0), и поэтому среди них должна быть и любая m2 X /»гматрица, поскольку из ненулевой матрицы умножением справа на С2 и слева на можно получить любую такую матрицу. Итак,
12.43] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 401 если Й32Х33Х2 семейство /?2Х состоит из матриц вида а11 А | ... | а1А1Д afeilA| | ак'к‘А (5) где Л =|| а'71| — фиксированная обратимая матрица, а А пробегает всю совокупность т^Хт^-матриц. Аналогичная картина будет иметь место, если 93Х2232Х=^О. Теперь ясно, что неравенства Э3129521 =И= 0 и 232Х33Х2 О имеют место или не имеют места одновременно. 12.43. Полученный результат может быть сформулирован в терминах тензорных произведений. Эта точка зрения поз- воляет, кроме того, выяснить и некоторые дополнительные обстоятельства. Приведем необходимые нам определения. Пусть даны A-мерное пространство X с базисом ех, . .., ek и /«-мерное пространство Y с базисом /х, . . -,fm. Тензорным произведением XxY = Z пространств X и Y на- зывается совокупность всех конечных формальных сумм вида £*vXyv, V=1 где xv£X, При этом предполагается, что [хх х.у] + [х2 х.у] = [(Хх + Х2) X j], [х X л] + [х X ь] = [хХ (я + j2)]. ppp 2м,х2 V=1 v=1 v=1 Отсюда следует, что XxY — линейное пространство, оно имеет размерность km, и его базисом могут служить век- торы вида е,-xfj (i = 1, . . ., k; j= 1, .. ., m). Таким образом, векторы пространства Z имеют вид k т ^=.2 SQ/hx/j. i=i i=i Мы можем преобразовать эту запись, выполнив суммирова- т k tn ние по индексу г; получим g= 2 (25/ei Х/у] = У Xj Xfj,
402 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ пространств [12.44 k где = cij-ei — произвольные (уже не обязательно базис- ные) векторы пространства X. 12.44. Пусть даны оператор А, действующий из про- странства Хх в пространство Х2, и оператор В, действую- щий из пространства Y, в пространство Y2. Определим тензорное произведение С = АхВ как оператор, действую- щий из пространства Zx = Хх х Yx в пространство Z2 = Х2 х Y2 по формуле (дополнительный индекс — номер пространства) С [el X//] = Ае/ X В//. (6) Если Ael = 2Ja<xeI и т0 Ф°РмУла (6) пре- образуется к виду kt tn 2 с [el Xf?] = 2 S ai^j> Iе* X=1U=1 Выясним структуру матрицы оператора С относительно базисов е-Х и е|х/Д упорядоченных в XxxYx по правилу 4ХЛ1; е}хП ,е^ X//; е • • • > [Xfl, e\xf}, ..., e\Xf^, e\xf^, . 4.ХЛ1, ... • d,x/^, и аналогично определениям в пространстве X2xY2. Матрица 12.13 имеет вид С согласно й11*11 й12*11 в21*11 °22*11 • • • Й1Л2*11 • • • й2/е2*11 a2.2blmt •• alk-plm2 akilbU ak 12*11 ••• Щ,•• aki^lm2 • aklk,bimi й11*»>11 Й12*/Л11 • • • а12^/Л]Ш2 ’ • • ak2k-fimim2 йЛ11*»л1 akl2^,ml 1 • • akiki^mil • • или (используем блок-запись) С = ^*11 • • • АЬтЛ ••• Abmirr. 12.45. Применяя 12.44 и 12.41, мы видим: операторы алгебры рассмотренной выше, суть операторы в тен- зорном произведении /ях-мерного пространства Хх и Ах-мер-
12.47] § 12.4. ВСЕ ДАННЫЕ АЛГЕБРЫ ПРОСТЫЕ 403 ного пространства Yx, которые являются тензорными про- изведениями любого оператора С g 23(Хх) на единичный оператор Eg 23 (Yx). Операторы системы 3321, рассмотренной выше, являются тензорными произведениями любых операторов Л21 g 53 (Х2, Хх) на фиксированный обратимый оператор A2Xg23(Y2, Yx) и аналогично операторы системы 2312 являются тензорными произведениями любых операторов A4X2g25(Xx, Х2) на А-1. 12.46. Для произведения тензорных произведений опера- торов справедлива очевидная формула (А X В) (С х D) = (AC) X (BD). Поэтому, перемножая операторы категории Л21 и В12, мы находим, в частности, (Л х А) (М х А"1) = (AM) X (АА-1) = (AM) X Е g 23х, откуда следует выполнение свойства категории. 12.47. Найдем инвариантные пространства алгебры опе- раторов 23 = {С X Е}, действующих в пространстве Z = X х Y. Таким инвариантным подпространством является тензорное произведение XxY0, где Yo g Y есть любое подпространство, поскольку (С X Е) (X х Yo) = СХ X EY0 (X х Yo). Покажем, что никаких иных инвариантных подпространств в пространстве Z нет. Действительно, пусть z = 2х/^У(— любой вектор пространства Z. Можно считать, что х}- ли- нейно независимы. Рассмотрим оператор С, переводящий векторы Xj в заданные векторы xy-gX. Тогда (С X Е) 2 Xj = 2 xj X У]- Таким образом, во всякое подпространство, инвариантное относительно всех операторов СхЕ, вместе с каждым век- тором 2Х/Х3'/ попаДает любой вектор 2X/XZ/, откуда и вытекает требуемое. Если мы применим к инвариантному подпространству XxxY10 в Z1 = X1xY1 оператор категории ЛхА, то в силу произвольности матрицы Л получим в пространстве
404 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ пространств [12.48 Z2 = Х2 х Y2 в качестве образа подпространство ЛХгхАУ10= = X2xY20. Таким образом, операторы категории устанавли- вают взаимно однозначное соответствие между инвариант- ными подпространствами в пространствах Zx и Z2 и одно- временно между обычными подпространствами пространств Yx и Y2. 12.48. Все изложенное справедливо при условии =®2i^i2 0 (или, что то же самое, при 93123321 =£ 0). Если ®12^21 = ®21^12 = 0, то изложенная схема уже не работает и матрица категории вообще не состоит из блоков, кратных фиксированной матрице Л. Мы находимся в условиях 12.32 и можем применить соответствующий результат: категория есть часть некоторой категории типа К2', какая именно, уточ- ним дальше. 12.49. Переходим к случаю категории из любого числа пространств Ха с алгебрами 3% рассматриваемого типа. На- зовем пространства Zx и Z2 родственными, если 2312S32i ® и, следовательно, матрицы 3312 имеют вид (5). Ясно,, что соотношение родства транзитивно: если Zx родственно с Z2, a Z2 родственно с Z3, то Zx родственно с Z3, так как в силу произвольности. матриц Л в произведении 95329321 имеются ненулевые матрицы. Поэтому всю совокупность пространств Ха можно раз- бить на непересекающиеся классы взаимно родственных пространств. Если Хх и Х2 входят в разные классы, то ад21=эз2А2 = о. Теперь мы можем с некоторыми изменениями повторить схему 12.36. Допустим, что наши пространства разбиты на некоторое число классов Ох, .. ., Gr, ... взаимно родствен- ных пространств. Пространства, входящие в класс Gr, имеют вид XryXYr, где Yr означает фактически одно пространство, в котором действуют обратимые операторы. Рассмотрим лишь пространства Yr и построим из них категорию как было указано в 12.36, с тем, чтобы выполнялось условие (произвольно выбираем подпространства Yrv и строим пересечения Yrvp., Yrv|l1., ...). Эта категория состоит из операторов Als, отображающих Ys в Y(- и при этом пере- водящих подпространства YJV(l, ... cY^ в подпространства
12.51] § 12.5. ПОЛНЫЕ АЛГЕБРЫ ДИАГОНАЛЬНЫХ МАТРИЦ 405 Y;jvp., ... сУг. Категория, которую мы обозначим через для пространства Zy строится так: если Zy и Zft родственны, то операторы kjk£$8-k описаны выше; если же Z — XxYj X Yft принадлежат к разным классам, то операторы Aj-k—любые операторы, переводящие Zft в Zy и при этом переводящие инвариантное подпространство Хк в инвариантное подпространство ХуХ Yyftv|1_ Проверим, что любая категория Si с простыми коль- цами ЗЗу содержится в категории типа Пусть Zfc = XftxYk и Zy = XyXYy принадлежат к различным классам родствен- ных пространств. Пусть Zy*—полный образ пространства Zk в пространстве Zy под воздействием всех операторов се- мейства 23у*. Очевидно, что Zjk есть инвариантное подпро- странство в Zy и, следовательно, имеет вид Xy xY}к, где Yyft—некоторое подпространство в Yy. Обозначим через Z7-fez...sm полный образ в Zy пространства Zm под воздей- ствием всех операторов вида Ay*Akl... AJm. Это—также инвариантное подпространство, и легко установить, действуя, как и в 12.36, что оно содержится в пересечении Zfk, ... ..., Z]m. Отсюда видно, что наша категория является частью категории вида что мы и утверждали. § 12.5. Все данные алгебры 33а— полные алгебры диагональных матриц В этом случае в каждом из рассматриваемых пространств Ха выделяется фиксированный базис, относительно которого все матрицы операторов Аа £ диагональны. С помощью таких базисов операторы А^а £ также записываются опре- деленными матрицами (прямоугольными), так что наша задача может быть поставлена как задача из теории матриц. 12.51. Рассмотрим вначале категорию й из двух про- странств Хх и Х2. Пусть А12£®12—любой оператор; со- гласно определению категории произведение В12 = АхА12В2 (7) также принадлежит 3312, если Ах и В2 суть соответствую- щие диагональные матрицы. Возьмем в качестве Ах матрицу с единственным ненуле- вым элементом 1 на скрещении /-й строки и /-го столбца,
406 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.52 а в качестве В2 матрицу с единственным ненулевым элемен- том 1 на скрещении А-й строки и /г-го столбца. Тогда согласно 12.14 в матрице ВХ2 будет (возможно) отличен от нуля только один элемент, стоящий на скрещении у-й строки и fe-ro столбца, и этим элементом будет элемент a]k ма- трицы Л12. Таким образом, операция (7) заменяет в матрице А12 все элементы нулями, кроме элемента который она оставляет неизменным. Отсюда можно сделать вывод о структуре системы ®Х2: система 33Х2 представляет собой совокупность всех матриц, элементы которых на фиксированном множестве мест произ- вольны, в то время как остальные равны нулю. 12.52. Будем обозначать в матрицах системы Э312 фикси- рованное множество мест, на котором разрешаются любые элементы, через 5Х2. Мы должны выяснить теперь, как связаны множества SX2 и S2X. Возьмем матрицу А12 £ $ВХ2 с единственным отличным от нуля элементом, равным 1, на скрещении ух-й строки и й1-го столбца, (j\, Ах) € ^i2> и любую матрицу B2l £ 3J2X со всеми возможными отличными от нуля элементами на местах 52Х. Произведения Сх,= ИХ2В2Х и О2 = В2ХЛХ2 согласно условию представляют собой диагональные матрицы. С дру- гой стороны, согласно 12.13 мы имеем: в Сг все строки равны 0, кроме а в ух-й строке стоят элементы А1-й строки матрицы В21. Так как должна получиться диагональ- ная матрица, то мы делаем вывод, что в ^х-й строке ма- трицы В21 все элементы, кроме стоящего в ух-м столбце, равны нулю. В О2 все столбцы равны нулю, кроме Ах-го, а в Ах-м столбце стоят элементы ух-го столбца матрицы ЛХ2; опять-таки, поскольку должна получиться диагональная матрица, то в ух-м столбце матрицы ЛХ2 все элементы равны 0, кроме стоящего в А-й строке. Итак, если (ух, Ах) £ 5Х2, то в матрицах класса )В12 все элементы jy-го столбца и kx-u строки, кроме их пересечения, равны 0. Этого достаточно, чтобы мы, зная множество 512, могли сделать вывод о строе- нии множества 52Х. Переставляя строки и столбцы матриц Э312 (что равносильно перестановке элементов в базисах пространств Хх и Х2), мы можем добиться, чтобы вначале шли строки и столбцы, в которых нет представителей мно- жества 5Х2; далее — строки и столбцы, в которых только
•2.52] § 12.5. ПОЛНЫЕ АЛГЕБРЫ ДИАГОНАЛЬНЫХ МАТРИЦ 407 по одному представителю этого множества, и, наконец,— строки и столбцы, в которых не менее чем по два его представителя: 1 Y б п 1 0 . . . 0 . . . 0 . . . 0 ... 0 . . . . . 0 .. . ₽ 1 ... ... 1 0 ... 0 ... (8) 0 ... 0 . . . т 0 . . . 11... 1 .... 1 .... На этой схеме места, занятые множеством 512, отмечены единицами, остальные — нулями. Построим теперь матрицу В21 £ 2521; в ней п строк и т столбцов: 1а 3 т 1 v ^21 ~ б (9) п Поскольку в матрице Л12 на скрещении строки с номером «4-1 и столбца с номером 7 4-1 стоит 1, в матрице В21 на скрещении столбца с номером а 4-1 и строки с номером у4~ 1 может стоять 1, и во всяком случае остальные элементы этой строки и этого столбца равны 0. То же относится ко всем
408 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫЕ пространств [12.52 строкам с номерами от y-f- 1 до 6 и столбцам с номерами от а+ 1 до р. Если в столбце матрицы Д12 с номером 6-|- 1 име- ются две единицы, все элементы соответствующей строки ма- трицы В21 равны 0. То же относится ко всем тем столбцам, идущим за 6-м, в которых имеется по две единицы. Если же в столбце матрицы Д12 оказывается только одна единица, то имеются две единицы в соответствующей строке с номером >Р, что приводит к равенству нулю столбца матрицы В21 с тем же номером. В результате весь правый нижний угол матрицы В21 заполняется нулями. Действительно, если взять место (/, k) в этом углу и рассмотреть соответствующее место (k, J) в матрице Д12, то k-я строка или j-й столбец имеет в матрице Л12 по крайней мере две единицы (иначе мы по- местили бы эти строку и столбец раньше). Значит, k-й стол- бец или /-я строка в В21 состоит сплошь из нулей; следо- вательно, на месте (/, k) должен быть-нуль. Левый нижний и правый верхний углы в матрице В21 также сплошь состоят из нулей; действительно, если бы в матрице В21 оказалась 1 где-нибудь в левом нижнем углу, например на месте (/, k), то, по симметрии построения, в матрице Л12 все элементы /-го столбца, кроме того, который стоит в /г-й строке (т. е. в правом верхнем углу матрицы Д12!), должны были бы быть равными нулю. В этом столбце обязательно есть единицы в правом нижнем углу. Что же касается элементов левого верхнего угла матрицы В21, то они могут быть произволь- ными. Ясно, что нашу категорию можно расширить, присое- динив к множеству 512 все элементы нижнего правого угла матрицы (8) (если S12 еще содержит не все эти элементы) и к множеству 521 все элементы левого верхнего угла ма- трицы (9). После этого категория К станет максимальной, так как уже нельзя будет расширить £12 без уменьшения S21. На языке геометрии, максимальная категория из двух про- странств устроена так: пространство Х1 разбито в прямую сумму трех подпространств, положим XJ, XJ, X?, и простран- ство Х2 разбито в прямую сумму трех подпространств Х°, XJ, XJ, причем dim XJ = dim XJ; действие оператора А12 состоит в том, что Х$ переходит в 0, XJ отображается диа- гональной матрицей в XJ, X? любым образом отображается в Х|, а действие оператора В21 состоит в том, что Х2 любым образом отображается в X?, XJ — диагональной матрицей в X} и Х| — в нуль. Произвольная (не максимальная) кате-
12.53) § 12.5. ПОЛНЫЕ АЛГЕБРЫ диагональных матриц 409 гория отличается от максимальной тем, что операторы, пере- водящие XJ в XI, не произвольны, а соответствуют матрицам с некоторыми закрепленными местами для нулей. То же можно сказать об операторах, переводящих Х° в X?; при этом между местами этих нулей может не быть уже никакой связи. 12.53. Теперь займемся описанием категории й с любым числом пространств Ха. Прежде всего ясно, что каждая подкатегория категории 5?, образованная парой пространств Ха, Х? и соответствующими системами и устроена так, как было описано выше: в матрицах этих систем выделены множества и и состоит из всех матриц, у которых на множестве S*a стоят любые числа, а вне этого множества—нули, и анало- гично устроена система Мы будем обозначать через 5 любое подмножество мест в совокупности матриц фиксиро- ванного размера тхп. Множество элементов главной диаго- нали квадратных матриц будем обозначать D. Совокупность всех /яхл-матриц, имеющих на местах 5 произвольные элементы, а вне S — нули, обозначим через %}тп (S). Пусть имеется множество 5Х, определенное на т X л-матрицах, и множество S2, определенное на л Хр-матрицах. Определим на т Хр-матрицах множество 5 (будем назы- вать его произведением SjS2), которое состоит из всех тех мест в /вхр-матрицах, на которых могут получаться нену- левые элементы в произведении 33mn (SJ ®np (S2). Иначе говоря, место (/, fe) принадлежит совокупности SXS2 тогда и только тогда, когда существует номер j такой, что (/, /) принадлежит 5Х, а (/, k) принадлежит S2. Пусть 51Х, ..., Slr—совокупность множеств на т х л-матрицах и S21, ..., S2g— совокупность множеств на лХр-матрицах. Из определения произведения легко вытекает общая формула г Я г Я U U $2/ = U U SVS2Z. (10) i = 1 i = 1 / = 1 i = 1 С помощью операции произведения S-множеств условия категории этого параграфа можно записать так: (11)
410 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.54 12.54. Теперь мы построим семейство некоторых кон- кретных категорий. Задать категорию Я— значит задать все семейства R,^ или, что в данном случае то же, задать все множества 5^. Выберем произвольно 521 и затем подберем такое S12, чтобы выполнялись условия S21S12cD, S12S21cD; как это сделать, описано выше. Допустим, что уже построены Sjk для всех j и k, меньших п, с выполнением свойств категории (И). Покажем, как построить Sjn и Snj- при j < п. Выберем Уп1 произвольно, a Sltl с выполнением условия SlnSnla:D, SnlSlncD. Пусть уже выбраны Sjn и Snj- для всех j < k с выполнением условий (11) и нам остается вы- брать S„k и Skn. Для искомых множеств Snk*H Skn должны быть выполнены условия, вытекающие из (11): а) SnkSknC:D, ^кп^пк1-2®’ SjkSknCzSJn, Skn^nj^Skp SinSnkcSik, S„kSkiCZSn{; B) Skn^SkiSin, $nk^SnjSjk- Условия а), б) ограничивают множества Snk и Skn сверху, условия в) — снизу. Покажем, что все эти условия совместны. Положим, например, л-1 п-I $кп~ U kitin' $пк~ U SnjSjft. i=l j=t Тогда, по предположению индукции и в силу формулы (10), л— 1 п —1 п —1п-1 $пк$кп — U SnjSjk U SkiSin = (J (J SnJSjkSkiSind /=1 /=1 /=1 /=1 п-1п-1 п-1 сии и SniSin<=D, ;=1 /=1 /=1 Л— 1 П-1 Л— 1 Sjk$kn~ Sjk U SkiSin= (J SjkSkiSjnc (J SjiSi„c:Sj„. i-1 i= 1 i = l Мы проверили первое из соотношений а) и первое из соотношений б). Ясно, что остальные справедливы по тем же соображениям. Итак, индукция оправдана и наше построение корректно. Можно, разумеется, строить категорию с помощью любых Skn и Snk, удовлетворяющих условиям а) — в), а не только того специального вида, который мы использовали при до- казательстве совместности этих условий. Таким образом, мы получаем широкое семейство конкретных категорий,
12.61] § 12.6. КАТЕГОРИИ И ПРЯМЫЕ СуММЫ 411 в каждой из которых полностью произвольными являются лишь множества Snl, все же остальные множества В под- чинены дополнительным условиям а) — в). 12.55. Покажем, что любая категория $ с условиями 23^33^ с 23 (D) принадлежит к этому семейству. Действи- тельно, в категории определены множества Snl и Sln для всех л; все остальные множества Snk и Skn должны удов- летворять условиям а) — в), а это и значит, что категория принадлежит к числу описанных. Было бы интересно выяснить, какой вид имеют макси- мальные категории описанного семейства. § 12.6. Категории и прямые суммы 12.61. Пусть имеется категория $ с основными про- странствами Ху, алгебрами 23у- и системами 23 у7,. Мы укажем, как построить категорию, в которой основными простран- ствами являются прямые суммы пространств Ху- (в произ- вольных комбинациях) и основными алгебрами — соответствую- щие прямые суммы алгебр 23у.. Пусть Ху-— прямая сумма пространств X), ..., X*’-', 23у-— прямая сумма соответствую- щих алгебр 23/, ..., 23/? (т. е. оператор А £ 23у в прост- ранстве XJ действует, как любой из операторов алгебры 23)). Нужно определить оператор Ду7с:23у7. Мы задаем Ду7 с по- мощью блок-матрицы 1 All .. < ^ji ~ Д?1 ii № .. Ak.A . (12) где блок A'ji1 отвечает произвольному оператору категории, который действует из пространства X)? в X?, р=1, ..., Ау-; <7=1, Покажем, что при этом получается категория. Действительно, если вц вц ... в,'Л вц ВЦ ... в^ B%1 В%2 ... в^1
412 ГЛ. 12. КАТЕГОРИИ КОНЕЧНОМЕРНЫХ ПРОСТРАНСТВ [12.62 то • • + A/W/1 и все получающиеся суммы произведений принадлежат снова к соответствующим системам согласно определению кате- гории Д'. Итак, наше правило приводит к новой катего- рии Я', которую будем называть расширением категории Я. 12.62. Оказывается, что верно и обратное: если основ-, ные пространства Ху-, фигурирующие в некоторой категории, суть прямые суммы некоторых пространств X), i — 1, ..., Ау-, и соответствующие алгебры 5Ву-— прямые суммы алгебр 58), i=l, ..., kj, операторов, действующих в X), то вся категория есть расширение Я в указанном смысле неко- торой категории Я, построенной по пространству X) и ал- гебрам &j. Действительно, пусть имеется категория $ указанного вида. В базисе, выбранном в подпространствах X), матрица Aj алгебры 58у имеет квазидиагональный вид причем квадратная матрица А) имеет г) строк и столбцов. Матрицу Ад категории Я можно представить в форме блок-матрицы А“ А“ ... А* Af ... А/*‘ д^.А дЬ.А Ak.iki-
12.63] § 12.6. КАТЕГОРИИ И ПРЯМЫЕ СУММЫ 413 при этом блок АрЧ имеет гр. строк и гЧ столбцов. С блоком A’ji естественно можно связать оператор, переводящий про- странство X’ в пространство X/. Используя все такие операторы, мы построим новую ка- тегорию Й/Д для которой основными пространствами будут пространства X’, основными алгебрами — алгебры 35/ и основ- ными системами — системы 33/’ операторов, определенных матрицами Л/Д Докажем, что указанный набор объектов определяет категорию. Пусть имеются оператор Л/Д действующий из X’ в X/, и оператор А£Д действующий из X7- в Х£; покажем, что их произведение Л^- принадлежит классу 33£J-. Действительно, в категории й имеется матрица, в которой все блоки, кроме (р, <?)-го, равны нулю, а блок с индексами (р, q) занимает матрица Л/Д и есть другая матрица с единственным отлич- ным от нуля блоком Arkpj. Произведение этих матриц принад- лежит категории R, и в нем имеется единственный ненулевой блок Л*/Л/Д что и требуется. Итак, все условия категории выполнены; правда, не опре- делены еще операторы, действующие из пространства Х< в X/ с тем же нижним индексом. Однако можно положить все такие операторы равными нулю, что не нарушит требо- ваний категории. 12.63. Так как каждая полупростая алгебра операторов, действующих в пространстве Ху-, позволяет разбить прост- ранство Ху- в прямую сумму пространств X/, в которых дей- ствует уже простая алгебра, мы видим, что структура общей категории с полупростыми алгебрами приводится к структуре категории с простыми алгебрами. (Этот вопрос мы рассмот- рели в § 12.4.) В соответствующем базисе матрица каждого оператора 21у|- категории Й имеет вид (11), причем каждый из блоков А^ есть оператор семейства 23/’ некоторой ка- тегории й/’ С основными пространствами X/ и X’ и простыми алгебрами 33^ и ЗЗД Некоторые блоки матрицы ЗД,£ 33у7 могут быть тождественно (для всех 21^) равными нулю. Если обозначить их множество через Sjit то возникает во- прос, как связаны между собой эти множества при разных
414 гл. 12. категории конечномерных пространств [12.63 индексах j и I. Подобный вопрос для случая одномерных блоков мы рассматривали в § 12.5. Метод, использованный там, применим и в данном случае и приводит к следующему результату. Если категория, определяемая скрещением J-8. блок-строки и i-го блок-столбца матрицы §[21 £ ®21 типа Ях (12.31) или Я3 (12.41}, т. е. связана с обратимыми матри- цами, то в i-й блок-строке и в j-м блок-столбце матрицы §113 все блоки, кроме находящегося в их скрещении, определяют нулевые категории. Если указанная категория типа Я2 (12.31), то в указанных блоках находятся матрицы категории типа Я3, дающие в произведении с данной нуль. Это позволяет судить и об устройстве общей категории, как в § 12.5. Замечание. А. Я. Хелемский (Вестник МГУ, серия Математика и механика, 1963, № 4, стр. 49—55) нашел категории, соответствующие нильпотентным алгебрам
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ К главе 1 1. Ответ, а) + , б) + - 2. Ответ. $11$з2й2з$44» ^41$12^23$34» $31^42$Э3^44* 3. Ответ. (—1)” 1)/2. 4. Указание. Рассмотреть определитель, все элементы которого равны единице. 5. Ответ. — np)(ad — be). 6. Указание. Умножить первый столбец на 104, второй — на 103, третий — на 102, четвертый — на 101 и прибавить к последнему столбцу; использовать, далее, следствие 1.45. 7. Ответ. At=—29 400 000, Д2 = 394. 8. Указание. Очевидно, Р (х) есть многочлен 4-й степени. Можно подсчитать его старший коэффициент, а затем определить его корни из условия совпадения строк определителя. Ответ. Р(х) ——3 (х2—1) (№—4). 9. Указание. Прибавить все столбцы к первому. Ответ. Д = [х-(-(п— 1)$](х—а)"-1. 10. Указание. Заменив х„ на х и использовав идею решения задачи 8, получить соотношение Д (Хр х2, . . . x„_i, х) = Д (х, . . . , хп_1)-(х — *1). . . (х — %„_!). Ответ. Д (хц х2, ..., хп) = (х2—xt) (х3—Xj)(x3—х2)...Х X(хп х„-1) ... (хп xn~i). 11. Ответ. Cj = O, С, = 2, С3=—2, С4=0, С5 = 3. 12. Ответ. О....ik . л‘г '2....'* — о, 11 ..111 h. it....... ik где z’i < i2 < ... < ik и ii < i2 < ... < ik фиксированы, причем хотя бы одно из ia не совпадает с соответствующим 1а. 13. Указание. Достаточно, чтобы соответствующий определитель 4-го порядка был отличен от нуля. 14. Указание. Использовать результаты 1.96—1.97. К главе 2 1. Ответ. Нет, ибо в пределах этой совокупности нельзя умно- жить на — 1. 2. Ответ. Нет, ибо в пределах этой совокупности нельзя сло- жить два вектора, симметричных относительно заданной прямой.
416 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 3. Ответ. Да. В частности, «нулем» пространства Р служит число 1 £Р. 4. Указание. Использовать 1.96. 5. Указание. Предполагая наличие зависимости С4Г> + С2Г. + ... + Ckt*i' = О, разделить на tai‘ и продифференцировать, далее использовать индук- цию по k. 6. Указание. Показать, что нуль-вектор также допускает един- ственное разложение по системе elt е2, ... , еп. Отсюда вывести ли- нейную независимость векторов этой системы. 7. Ответ. Да, из одного вектора—любого элемента х£Р, отлич- ного от 1. 8. Ответ. 1. 9. Ответ. Пересечение—прямая пересечения двух плоскостей в обычном смысле. Сумма—все пространство. 10. Использовать 2.34. 11. Ответ. Нет. Его можно заменить на любой другой вектор этой гиперплоскости. 12. Ответ. В «точечной» интерпретации: каждая гиперплоскость вместе с любыми двумя своими точками содержит проходящую через них прямую. 13. Ответ. В общем случае p-[-q-\-l, если это число не превос- ходит размерности всего пространства. 14. Ответ. p-\-q + r-[-2, если это число не превосходит размер- ности всего пространства. 15. Ответ. Поставить в соответствие каждому положительному числу его логарифм. К главе 3 1. Указание. В матрице ранга 1 столбцы пропорциональны. 2. Указание. Нужно так написать условия принадлежности век- тора у подпространству L, чтобы в них участвовали только миноры й-го порядка матрицы A. Ho j/£L тогда и только тогда, когда матри- ца В, полученная присоединением к матрице А столбца из координат вектора у, имеет ранг k, или, что то же самое, каждый ее минор (А4- 1)-го порядка равен нулю. Разлагая каждый минор (й-|-1)-го порядка матри- цы В по последнему столбцу, можно получить некоторую систему уравнений относительно координат вектора у с коэффициентами—ми- норами fe-го порядка матрицы А. 3. Указание. Использовать 1.51—1.52. 4. Ответ, х = (сх, с2, с3, с4, с5), где с4 =— 164-с3+с4 + 5с5, с2 = 23—2с3—2с4—6с5. 5. Ответ. Если (X—1)(Х + 2) 0, то х=-1+1 - <Х + 1)2 А. + 2 ’ У Х + 2 ’ Л + 2 ’ Если Х=1, система имеет решения, зависящие от двух параметров. Если Х=—2, система несовместна.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 417 6. Ответ. Если матрицы ai II II ai ci II а2 Ь2 и а2 Ь2 с2 имеют одинаковый а3 Ь3 II II а3 ^3 с3 II ранг. 7. Ответ. ранг. 8. Ответ. Матрицы ai о2 Ь2 ai b2 Ci а2 Ь2 с2 ап сп имеют одинаковый х<1> = (1,—2, 1, О, 0), и Здесь в первом столбце выписаны координаты вектора х0—частно- го решения неоднородной системы; в остальных столбцах—коорди- наты векторов у{1>, у(2), t/(3), образующих нормальную фундаменталь- ную систему решений соответствующей однородной системы. 10. Ответ. Ранг А2 равен 3; базисный минор, например, в левом верхнем углу. Ранг А2 равен пяти, базисный минор совпадает с опре- делителем матрицы. 11. Указание. Перевести минор М в левый верхний угол и затем, применив процедуру 3.62, показать, что столбцы матрицы А, начиная с (г + 1)-го, можно сделать нулевыми. 12. Указание. Если Р 0, искать матрицу А в виде |оР?Я- 13. Указание. Или ранг матрицы равен п, или он меньше п. 14. Указание. Использовать теорему Кронекера—Капелли. 15. Указание. Использовать результат задачи 14. 16. Указание. См. 6.63 (18). К г л а в е 4 1. Ответ. Также п. 2. Ответ, в) и ж). 3. Ответ. Да. 4. Ответ. II-1 а) Ав>= J —1 2 —3 3 —5 5 II2 0 — 2|| б)4и)=1-1 1. II2 1 о||
418 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 5. Ответ. АВ АВ Ф А2В2. 6. Ответ. АВ—ВА==Е. 7. Ответ. (А + В)2 = А2 + АВ + ВА + В2, (А + В)3 = А2 н- А2В + АВА + АВ2 + ВА2 + ВАВ + В2А + В8. 8. Указание. Применить метод индукции. 9. Ответ. Размерность пространства равна тп. В качестве ба- зисных операторов можно взять такие, которым соответствуют матри- цы A(j с единственным ненулевым элементом на пересечении i-и стро- ки и j-го столбца. ООО 10. Ответ. АВ = ООО ООО 11. Ответ. Ап= q । 12. Ответ. А= |“ пп _II cos п<р — sin «<р 1| ’ D || sin nep cos пф || ’ , где be —— а2. 13. Ответ. а) —9 — 2 —10 6 14 8 —7 5 —5 ЦО 0 0 б) О 0 0 ||0 0 0 15. Указание. Найти след обеих частей равенства. 16. Указание. Три уравнения для неизвестных элементов матриц А и В приводятся к уравнениям для трех миноров неизвестной матри- цы с двумя строками и тремя столбцами. Использовать задачу 12 к гл. 3. 17. Указание. Использовать 4.54. 18. Указание. Записать элементы минора М через элементы, на- ходящиеся в первых г строках, и применить теорему 4.54. 19. Указание. Использовать решение задачи 18. 20. Указание. См. 4.54. 21. Ответ. В-! = 1 —2 7 0 1 —2 ООО c-i = c. 23. Ответ. Если А — нулевая матрица, то X—любая. Если det А #0, то X—нулевая матрица. Если det А=0, но А — ненуле- вая матрица, то ее строки пропорциональны; пусть аф есть отноше- ние соответствующих элементов первой и второй строк матрицы А; тогда при любых р и q. 24. Указание. Использовать 1.51—1.52. 25. Ответ. Нет. 26. Указание. Например, Ах [а0 + а1 t Ч-]= А [а0 + ол t-\-]4- -f-A, а0. 27. Указание. Оператор А переводит линейно независимые векто- ры снова в линейно независимые.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 419 28. Указание. Применить равенство АВ = ВА к собственному вектору оператора В. 31. Указание. Использовать результат задачи 30. 32. Указание. Подбирая должным образом оператор В и исполь- зуя задачу 28, свести решение к задаче 31. 34. Указание. Использовать разложение оператора А2 — р.2Е на множители. 35. Ответ, а) Х1 = 2, f1 = (l, 0, 0); Х2 = 1, /2 = (1, 0, 1); Х3 = —1, /з = (0, 1, -1); б) ^ = -1; h = (l, 0, 0); Х2 = Х3=1, /2 = (1, 0, 1); Zs=(O, 1, 1); в) Х1=2, Л = (1, 0, 0); г) ^ = 1, А = (1, 0, 0,—1); Х2 = (0, 1, 0, 0). 36. Указание. Включение Т (A*) q N (А“) необходимо и до- статочно для равенства Ak+m = 0 37. Указание. Пусть /\, ... , fr—базис области значений опера- тора А, так что для любого х£Кп имеем г Ах= ^ajixjfj. I=i Положить AjX — aj(x)fj (/ = 1...п). К главе 5 1. Указание. Первый вектор нового базиса есть х. 2. Указание. Выбрать новый базис f2, ..., f„ так, чтобы первые k векторов составляли базис подпространства К'. Записать усло- вие х£К' системой координатных уравнений в новом базисе. Исполь- зуя формулы перехода, построить соответствующую систему коорди- натных уравнений в исходном базисе. 3. Указание. Использовать определение гиперплоскости и задачу 2. 4. Ответ. Матрица искомого преобразования С = ВА~1. 5. Указание. Пусть ег, ..., еп—произвольный базис в К„ и п f(x)= 2 ciAk’ гДе 5i> •••> 1п~координаты вектора х. Формулы *=1 преобразования координат начать с уравнения п П1= 2 Й=1 6. Указание. Использовать 4.83 и инвариантность характеристи- ческого многочлена (5.53). 7. Указание. Выбрать базис так, чтобы первые т его векторов лежали в подпространстве R(A»>. Показать, что для этого базиса много- член det || A{f\—ХЕ || имеет множителем (X—Использовать инва- риантность характеристического многочлена (5.53). К главе 6 1. Ответ. В базисе хп, ......х±. 2. Указание. См. 6.44.
420 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 3. Ответ.: —1 10 0 0 0—1000 0 0 2 1 0 О 0 0 2 0 О 0 0 0 2 4. Ответ. Нет: Ег (Л) = (Х—2) (Л— I)2, Е2(В) = (Х—1) (X2—5Х—2). 5. Ответ. Е„_1(А1) = Е„_1(А2) = (1-Х)», £„_2(А1) = Е„_2(А2)=1; En-i(A3) = (n-^t Е„_2(Д3)=1; Яя-1(Л) = П —^)> 2 (^4) — к=1 6. Указание. Еп-.1(А) = (а,—Х)п, Е„_2(Д)=1. 7. Ответ. Диагональная матрица, на диагонали которой стоят некоторые из корней многочлена Р(Х). 8. Ответ. На диагонали жордановых клеток стоят некоторые из корней многочлена Р (X), и размеры клеток не больше кратности соответствующего корня. 9. Указание. Векторы х, Ах, А2х линейно зависимы. 10. Ответ. Многочлены от Ат (а). 11. Ответ. Матрицы вида Втп = bi Ь3 Ь3 ... Ьп 0 bi bt ...bn—i 0 0 0 ... bi.. .bn-m+i (n^m) или 12. Ответ. Матрицы вида Я Я я D D D *** где блоки Вт.т. указаны в задачах 10 и 11. 13. Ответ. Матрицы вида Bm,mt 0 ... 0 о вт*тг... о °' ’°’ •••
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 421 14. Ответ. Для каждой группы жордановых блоков с одним и тем же характеристическим корнем—блок, указанный в задаче 12. Остальные элементы—нули. 15. Ответ. Если кратность каждого характеристического корня равна размеру соответствующей жордановой клетки (или: характери- стический многочлен совпадает с минимальным; или: все элементар- ные делители, кроме самого старшего, равны 1). 16. Указание. Использовать 6.63(18). К главе 7 1. Ответ. Тензор второго ранга, два раза ковариантный. 2. Ответ. Например, 2 2- 2 41—112—ПЗ. где 111 —"2" Si + 'у ^а+^з» т1г=='2‘?1—<7^2’ Из == ^з- 3. Указание. Использовать 7.93. 4. Указание. Использовать 4.54. и 7.15. 5. Ответ. Например, А(х, у) = OjTj + о2т2 а3т3, где а(- и Т; (i = l, 2, 3)—новые координаты векторов х и у. При этом формулы перехода к новому базису следующие: °1 = ^1 + ?2' 02 = ?2 + 21;3, о3 = В3. 6. Указание. Сначала изменить нумерацию координат таким обра- зом, чтобы матрица билинейной формы А (х, у) преобразовалась к виду, допускающему применение метода Якоби. 7. Указание. ||—aik |] есть матрица положительно определенной формы. Ответ. ап < 0, ...,(— 1)" det||aik || > 0. | «21 «22 ' 8. Указание. Использовать замечание к 7.96. 9. Указание. Рассмотреть эту форму на базисных векторах. 10. Указание. Последняя строка определителя состоит из эле- ментов а<«) = (—l)*-i А(ех, .... eft+1.........е„), й=1.......п. 11. Указание. Первую пару базисных векторов ех, е2 найти из уравнения А (ех, е2) = 1; построить подпространство L, определяемое уравнениями A (ex, х) = 0, А (е2, х) = 0, и, если форма А (х, у) в нем не равна тождественно нулю, определить векторы е3, e4£L так, чтобы А (е3, е4) = 1; и т. д. п 12. Указание. Рассмотреть форму А(х, х)-(-е 2 *7 <е > °) /=1 и применить критерий 7.96.
422 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 13. Указание. Пусть = •••> (/ = 1, •••, г)—базис подпространства К'. Тогда К" состоит из векторов р = {'П1, .... г].;}, удовлетворяющих системе п п А(х(А у)= 2 ( 5 aife^7>W = 0, /=1......г- k=\ v=i / Матрица коэффициентов системы есть произведение невырожденной матрицы || aik || формы А (х, у) и матрицы ранга г. Использо- вать 4.67. 14. Ответ. А' =А. 15. Указание. Если {/ = {1(1!, ..., т)л} есть решение системы (44), то (b, t/) = (Ax, g) = (x, A't/) = O. Обратно: система (44) есть условие сопряженности вектора у и векторов ау={а71, ..., аул}; если (b, р) = 0 для всех таких у, то х лежит в линейной оболочке векто- ров aj, ..., ап. 16. Указание. См. задачу 37 к гл. 4. 17. Указание. См. задачу 1 к гл. 3. 18. Указание. Сначала рассмотреть случай неотрицательных форм ранга 1, использовать задачу 17. Затем применить задачу 16. К главе 8 1. Ответ. Нет, ибо не выполняется аксиома 8.21 б) и аксиома 8.21 а) для 7 =—1. 2. Ответ. Нет, ибо не выполняется аксиома 8.21 б). 3. Ответ. Можно. Это равносильно изменению масштаба на осях. 4. Указание. Обозначить через elt ег, е3 векторы, идущие из фиксированной вершины тетраэдра по трем его ребрам, и найти век- торные выражения для остальных его ребер. Ответ. 90°. 5. Ответ. 90°, 60°, 30°. 6. Ответ. а а 1 7. Ответ. cos<p=—7= • V л 8. Ответ, a) g = (3, 1, —1, —2), /i = (2, 1, —1, 4), б) g = (l, 7, 3, 3), Л = (—4, —2, 6, 0). 9. Указание. Использовать определение угла 8.33 и ортогональ- ность вектора h ко всем векторам подпространства R'.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 423 10. Указание. Умножить скалярно равенство 8.51 (18) на век- тор £0. 11. Указание. Использовать 8.54 и 8.52. 12. Ответ. yr = i, Уг — Уз = ^ Уи = —У, Уз^О, ул = Ыг. 13. Ответ. (1, 2, 1, 3); (10, —1, 1, —3); (19, —87, —61, 71). 14. Указание. Предполагая, что размерность R" больше, чем размерность R', рассмотреть вектор e"£R", ортогональный к проек- ции подпространства R' на R"; использовать задачу 10. 15. Ответ. Ап = -^. 16. Ответ. Рп(—1) = (—1)"^ 17. Указание. Записать искомые коэффициенты через скалярные произведения. 18. Указание. Использовать решения задач 15 и 16. 19. Указание. Разложить Q (?) по многочленам Лежандра. Ответ. = Рп (f). 9 20. Ответ. || Рп (t) ||2 = . 21. Ответ, k (А) = | det А |. 22. Указание, Использовать 4.75. 23. Указание. Речь идет о том, чтобы сравнить высоты двух гиперпараллелепипедов. 24. Указание. Неравенства У[хп х2, .... хт] V[xlt .... xfc] V [Xi, ..., x^—i, X/f+j, ..., xm] V [Xj, ..., X£_jJ (fe = l, 2, .... m) получаются из неравенства задачи 23. Перемножить их для всех fe=l, 2, ..., т, произвести сокращения и извлечь корень (т—1)-й степени. Геометрический смысл: объем m-мерного гиперпараллелепи- педа не превосходит произведения корней (т—1)-й степени из объемов его (т—1)-мерных граней. 25. Указание. Написать неравенство задачи 24. для xs , x5j... ... , xsr и перемножить такие неравенства для всех допустимых значе- ний sn Sa, ... , sr. 26. Указание. Требуется построить в 2“-мерном пространстве ги- перпараллелепипед, у которого проекции ребер на каждую ось не превосходят по абсолютной величине числа М и объем которого в точности равен Мп пп/2. Для М = 1 матрица Ат координат искомых векторов в 2и-мер- ном пространстве может быть задана рекуррентной формулой Примечание. Для п 2т оценка Л1л пп'2 может быть улучшена.
424 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 27. Указание. Пусть G-1- означает ортогональное дополнение под- пространства G в R. Для каждого x£N(A) и для каждого z^R (А'г, х) = (г, Ах) = 0, откуда A'zgN1(A), т. е. Т (А') с 1Ч-*-(А), Т-^А') О N (А). Для каж- дого и дЛЯ каЖд0Г0 y£R (А'х, у) = (х, Ау) = 0, откуда А'х=0, т. е. x£N(A'); таким образом, Т-1-(А) с N (А'), Т-1-(А') С N (А). Отсюда N (А) = Т-*-(A'), N-1-(А) = Т (А'). Аналогично доказывается второе утверждение. 28. Указание. Сравнить 8.93 с 1.51—1.52. 29. Указание. Использовать 4.54. 30. Указание. Углы треугольника однозначно определяются по его сторонам. Другой метод: симметричная билинейная форма (Qx, Qy) однозначно восстанавливается по квадратичной (Qx, Qx). 31. Указание. Данный равноугольный оператор С преобразует ортогональный и нормированный базис еп а2, ... , еп в ортогональный базис/!=«!/!, /2 = 02/2.....fn = anfn, где flt f2, ... , f„ норми- рованы. Пусть Q—изометрический оператор, переводящий векторы /1> /г> • • • • /п в ei> е2> •••> еп>’ тогда матрица равноугольного опе- ратора QC диагональна. Показать, что условие а, = а, позволяет по- строить пару ортогональных векторов, которые переходят в неортого- нальные в результате применения оператора Q С. 32. Указание. Достаточно показать, что Q—равноугольный опера- тор (задача 31). В предположении, что имеется прямой угол, который переходит не в прямой, построить параллелограмм, площадь которого в результате применения оператора Q изменится. 33. Указание. Обобщить конструкцию задачи 32. 34. Указание. Применив к данным системам процесс ортогонали- зации, получить ортогональные и нормированные системы elt е2, ... и /п /2, ... Используя 8.53, показать, что векторы х2, х2, ... выража- ются через elt е2, ... по таким же формулам, по каким векторы уь у2, ... выражаются через /ь /2, ... Оператор Q задать путем отображения системы elt ег, ... на систему /2, /2, ... 35. Указание. Рассмотреть конечные системы а', е", е', е", ... ... , e'k, е'£ и /;, /'',/j, /", , ffc, /*'. полученные при определе- нии углов между подпространствами R' и R" и подпространствами S' и S". Согласно построению (<•. = //)=cos <р,•,(( = !, 2...k), (е-, /;.) = 0, (a?, e'/) = (f'', /?) = 0 (i&); далее показать, что (a'., ej') = (/,', /;-') = 0 (используя задачу 9). Затем применить результат задачи 34. 36. Указание. Использовать задачу И. 37. Указание. Выбрать в подпространствах Lj и L2 базисы elt ..., ет и /п /2....../т, полученные при построении углов cq.........а/л.
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 425 В пространстве R построить базис ех, е2, , ет, ет+г, ... , е„, первые векторы которого получены путем ортогонализации векторов «1. е2, . •. > ет, f2, , fim. Разложить векторы хп х2, ... , хт, уъ у2, • • > Ут п0 построенному базису. Показать, что матрицы этих разложений имеют только по одному минору т-го порядка, если не считать миноров, заведомо равных нулю. Использовать, далее, выраже- ние объема параллелепипеда через миноры соответствующей матрицы. 38. Указание. Использовать задачу 2 к гл. 3 и задачу 17 к гл. 4. 39. Указание. Проверить утверждение задачи в специальном ба- зисе, первые k векторов, которого принадлежат к подпространству L {х!, х2, ... , Хь}. Для перехода к общему случаю использовать за- дачу 17 к гл. 4, причем показать, что det || afr || =1. 40. Указание. Сначала рассмотреть случай fe = 2. 41. Указание. Выбрать в пространстве R базис, как указано в задаче 37, и проверить утверждение задачи в этом базисе. Для пере- хода к общему случаю действовать так же, как в задаче 39. 42. Указание. Использовать 4.54. 43. Указание. Рассмотреть ортогональное дополнение Z к инва- риантному (относительно А) подпространству Н всех векторов х, для которых Р(А)х = 0. Подпространство Z также инвариантно относительно оператора А, следовательно, и относительно [Р (А)]*-1. Но если z£Z, то [Р (A)]ft-1z g Н, откуда (Р (A) [ft- 1z = 0. Отсюда получить, что [Р(0]*-1 есть аннулирующий многочлен оператора А. К главе 9 1. Указание. Использовать 9.34. 2. Указание. Оператор В имеет базис из собственных векторов ej, ... , е„ с положительными собственными значениями щ, ... , р.п. Отсюда B2e1 = [rje1-, и если мы желаем удовлетворить равенству В2 = А, необходимо, чтобы е, были собственными векторами оператора А, а числа р? совпадали с Л/. Но этого и достаточно для В2 = А. 3. Указание. Предварительно преобразовать базис так, чтобы мат- рица данного оператора приняла диагональный вид. Ответ. у А = 3 2 0 2 4 2 0 2 5 4. Указание. Оператор А'А самосопряжен, и выражение (А'Ах, х)= = (Ах, Ах) неотрицательно при любом x£Rn. Если А невырожден, то это выражение положительно при любом x£R„. 5. Указание. Использовать равенство (АВ)*=В*А*. 6. Указание. Оператор АА* самосопряжен и положителен (за- дача 4), поэтому можно найти самосопряженный и положительный опе- ратор S так, чтобы иметь S3 = AA*'. Далее построить оператор Q по формуле Q = S-1A и показать, что Q—унитарный оператор. 7. Указание. Использовать задачи 5 и 2. 8. Указание. Пусть R' CZ R„—подпространство, порожденное соб- ственными векторами оператора А'А с ненулевыми собственными зна- чениями, и R"—ортогональное дополнение к R'. На R' положить V
426 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ равным унитарной составляющей А (так что J^A'A Vx = Ах), на R" положить Vx = 0. 9. Указание. Использовать задачи 28 и 29 к гл. 4. 10. Указание. Применить к векторам жорданова базиса опера- тора А (6.37) процесс ортогонализации. К главе 10 1. Ответ. а) 4т)®+п|—2П|: 2 Е 2 е 1 6 Л1 з 3^*3 _ 2 । 1 s 2 * 41 — у 51 "Г у 52 д' 5з> 1 Е . 2 . . 2 t Оз — у 51 + у 52 + у 5з> б) IOti’+’IHIb; 1 , 2 2 е 41~ у 51 + у 52—у бз> 2 . 1 6 2 « , 4 t , /3 . Пз 3r5?1WH2+ 3 Ъ’ в) 4Х2-Щ+Зп;-+5Т11; 4i = y 51+у 5а + у 5з + у 4г = у £1 Н—2" ?2—у ?з —2~ т1з = у 11—гуВг + у £з— 44= у51-4б8-у5з+4^: г) Эл®; /2, ]<2 41 — ~2~Siт—2~ б2> /2 t , /2 6 4з — '2 ^2Н—2~ 4з — у ?i—2” + —2^ 44 = у 51— у 6s—у £з + у ?4- 2. Ответ. Максимум при х = (±1, 0, 0), где А(х, х) = 1. Минимум при х = (0, 0, ±1), где А(х, Л) = у. При х = (0, ±1,0), где А (х, х) = уминимакс
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 427 (т. е. при движении по единичной сфере в одну сторону от точки х функция А (х, х) возрастает, а в другую—убывает). 3. Указание. А именно, на подпространствах, натянутых на соответ- ствующие канонические базисные векторы. 4. Указание. Коэффициент равен наименьшему из максимумов формы А (х, х) на некоторой системе подпространств, а коэффици- ент /ц равен наименьшему из максимумов формы В (х, х) на той же системе подпространств. 5. Ответ, -у = ± . 6. Ответ. А(х, х)=т)’+'П^+'П^, В (х, x) = 'qj-|-2'n|-|-3ir)|, = Hi—Нг’ЬЗНз! S2=Th—Лз> ^з^'Пз- 7. Указание. Вопрос сводится к единственности канонического базиса у симметричного оператора с попарно различными собствен- ными значениями. 8. Указание. Обобщить 7.44. 9. Ответ, а) Однополостный гиперболоид с осевой линией вдоль оси у; б) однополостный гиперболоид с осевой линией вдоль оси х; в) круговой параболоид с осевой линией вдоль оси х; г) круговой параболоид с осевой линией вдоль оси у, сдвинутый на 1 вдоль этой оси; д) гиперболический параболоид. 10. Ответ. a) xj + 2yf + За* = 6; 3 (х-1) = -хх + 2У1 + 2zlt 3// = 2х) — у j 2zj, 3 (?+1) = 2XJ4-21/1 — г,; б) х* + 2^-Зг* = 6; 3(x + l) = -x1 + 2i/1+2z1, 3 (//+1) =2xj—У14-221, 32 = 2X14-21/!—21! b)i/J = 2xi; 3(х—m) = 2x14-2i/14-z1, 3 (у 4- 2m) = 2xj—yt—2zv 3 (z -J- 2m) = —Xj -J- 2t/i—2гг (m произвольно). 11. Указание. Полуоси эллипсоида определяются по каноническим коэффициентам соответствующей квадратичной формы. Использовать результаты 10.25. К главе 11 1. Указание. Пусть К'—пересечение нуль-многообразий всех операторов, входящих в левый идеал J с L (Кп), и пусть г—размер- ность К'. Выберем базис в Кп так, чтобы первые г базисных векто- ров лежали в К'. Матрицы всех операторов AgJ имеют г первых столбцов из одних нулей. Пусть размерность J есть т и An • • , Ат — линейно независимые операторы в J. Рассмотрим матрицу из п—г столбцов и тп строк, полученную при записывании всех матриц
428 ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ Ai ... Ат одна над другой и отбрасывании г первых (нулевых) столбцов. Ее ранг равен п—г; следовательно, имеются п—г базис- ных строк. Их линейные комбинации дают всевозможные строки из п—г элементов. Использовать 4.44. 2. Указание. Введя невырожденную билинейную форму (х, у), рассмотреть совокупность J* всех операторов А*, сопряженных к опе- раторам AgJ. Зга совокупность есть левый идеал. Использовать за- дачу 1. 3. Ответ. Максимальный левый идеал алгебры В (Кл)—совокуп- ность всех операторов, переводящих в нуль некоторый фиксирован- ный вектор пространства Кл. Минимальный левый идеал—совокуп- ность всех операторов, переводящих в 0 некоторое фиксированное (п—1)-мерное подпространство пространства Кл. Максимальный пра- вый идеал—совокупность всех операторов, переводящих все про- странство Кл в фиксированное (п—1)-мерное подпространство. Мини- мальный правый идеал—совокупность всех операторов, переводящих все пространство Кл в фиксированную прямую. 4. Указание. В базисе ех, ... , еп, в котором матрицы операто- ров А£В записываются в форме 11.85, положить (х, </) = 2 Б/П/ (х= F=2vA 5. Указание. Вместе со всяким инвариантным (относительно ал- гебры В) подпространством С'£СЛ является инвариантным и его ортогональное дополнение. Разложить Сл в ортогональную прямую сумму неприводимых инвариантных подпространств. Каждый оператор А £ О (из алгебры В) хотя бы в одном из них действует как нену- левой оператор. 6. Указание. Получить из представления 11.85, что коммутатор полупростой, но не простой матричной алгебры В пересекается с са- мой В не только по матрицам, кратным единичной. 7. Указание. Записать искомую матрицу в виде блочной матрицы из ш2 блоков, выписать условие коммутируемости и использовать лемму Шура. 8. Ответ. У алгебры В всех диагональных матриц 11 А = п (ki, ... , 1л—произвольные комплексные числа). Всякая матричная алгебра В = В приводится к этому виду в некотором базисе. 9. Ответ. Алгебра В всех операторов, оставляющих собствен- ными данную систему подпространств, дающих в прямой сумме все Сл, удовлетворяет условию В с В. Всякая алгебра В с В с В приво- дится к этому виду. 10. Ответ. Пространство Сл разложено в прямую сумму подпро- странств Си), .... С(Л), и алгебра В состоит из всех операторов,
ОТВЕТЫ И УКАЗАНИЯ К ЗАДАЧАМ 429 инвариантных в каждом С(А /=1, ... , k. Коммутатор В состоит из операторов, кратных единичному в каждом С(7>(/ = 1, .... k). __ П. Указание^ Если В есть прямая сумма Вш+ ... +В(А), то B = ... + В‘Ч 12. Ответ. Кратность каждого характеристического корня опе- ратора А равна размеру соответствующей жордановой клетки (см. за- дачу 15 к гл. 6). 13. Указание. Если СВ = В, то для некоторого А £ В имеем СА=С. Отсюда С=СА = С(СА) = С2А = С3А =... 15. Указание. Пусть Ах, .... А,„—базис алгебры В. Тогда, если алгебра В не нильпотентна, один из правых идеалов АХВ....АтВ, например АХВ, не нильпотентен (задача 14). При этом АХВ В (за- дача 13) и проблема сведена к аналогичной для алгебры меньшей размерности. 16. Указание. Если М, = М, +Х, то для любого вектора х^М(- най- дется оператор АХ£В такой, что Ахх М(=М1 + Х; далее, найдется А2£Втакой, что А2АххgМ;и т. д. Если # Кп, тодлях^М^+j^—М.р найдется оператор А^^В такой, что Apx£Mp—Mj,_x, затем Aj,_xgB такой, что Aj,_x Apx^!Ap_1—Мр_2, и т. д.,так что АХА2 ... А^х # 0. 17. Указание. Использовать подпространства Мх, ... , за- дачи 16.
8-64] § 8.6. ОБЩАЯ ТЕОРЕМА ОБ ОРТОГОНАЛИЗАЦИИ 263 с линейной оболочкой ...,/") и, следовательно, совпадает с совокупностью Ln, что и требовалось. б. Вектор pn(t) ортогонален к подпространству Ln_1. Достаточно проверить, что многочлен pn(t) ортогонален в (—1, 1) к функциям 1, t, При доказательстве мы будем использовать формулу интегрирования по частям в определенном интеграле, пред- полагаемую известной из анализа. Производные, входящие в эту формулу, для многочленов суть те же самые произ- водные, которые мы рассматривали в 6.73а с чисто алге- браической точки зрения. В частности, многочлен [(/а-1)"] = (t-1)" (/+ 1)" в силу6.73в при ^ = ±1 имеет равные 0 производные поряд- ков 0, 1, . .., п— 1. Итак, будем вычислять скалярное произведение tk и рп (/). Интегрируя по частям, мы получаем + 1 (tk, Рп(Р))= $ l)"](n,^=> -i Hl = /ft[(Z2—l)n](n-1)|*J—A J Внеинтегральный член полученного выражения в силу ска- занного выше обращается в нуль. Оставшийся интеграл снова берем по частям, и продолжаем этот процесс, пока показатель при t не снизится до нуля: и*, Рп ю)=и*2-1 )«]<"-2> |*;+ +i Н-А(А—1) J =1 -1 + 1 = ±£! $ [(/2— 1)П](П-ЙМ/ = ±А![(^— = 0, -1 что и требуется.